同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c2b8c3adc2a2c2abc2a1c2bf | ¸Ã¢«¡¿ |
SJIS-WIN | c2b8c3adc2a2c2abc2a1c2bf | ツクテュツ「ツォツ。ツソ |
EUC-JP | c2b8c3adc2a2c2abc2a1c2bf | 存鱈蔵束臓多 |
UTF-8 | c2b8c3adc2a2c2abc2a1c2bf | ¸í¢«¡¿ |
UHC | c2b8c3adc2a2c2abc2a1c2bf | 쨍챠짖짬징쩔 |