同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3b0c2a2c38cc3abc2b0c2b6 | ð¢Ãë°¶ |
SJIS-WIN | c3b0c2a2c38cc3abc2b0c2b6 | テーツ「テ古ォツーツカ |
EUC-JP | c3b0c2a2c38cc3abc2b0c2b6 | 丹蔵?谷属其 |
UTF-8 | c3b0c2a2c38cc3abc2b0c2b6 | ð¢Ìë°¶ |
UHC | c3b0c2a2c38cc3abc2b0c2b6 | 챨짖횑챘째쨋 |