同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a9c2abc2a5c3aac2b7c2a2c3aac3ba | 髥귢êú |
SJIS-WIN | c3a9c2abc2a5c3aac2b7c2a2c3aac3ba | テゥツォツ・テェツキツ「テェテコ |
EUC-JP | c3a9c2abc2a5c3aac2b7c2a2c3aac3ba | 辿束促棚揃蔵棚炭 |
UTF-8 | c3a9c2abc2a5c3aac2b7c2a2c3aac3ba | 髥귢êú |
UHC | c3a9c2abc2a5c3aac2b7c2a2c3aac3ba | 챕짬짜챗쨌짖챗첬 |