同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a9c297c2a1c3afc2bdc2afc3a9c2 | é¡ッé |
SJIS-WIN | c3a9c297c2a1c3afc2bdc2afc3a9c2 | テゥツ猟。テッツスツッテゥツ |
EUC-JP | c3a9c297c2a1c3afc2bdc2afc3a9c2 | 辿?臓誰遜俗辿 |
UTF-8 | c3a9c297c2a1c3afc2bdc2afc3a9c2 | é¡ï½¯é? |
UHC | c3a9c297c2a1c3afc2bdc2afc3a9c2 | 챕혰징챦쩍짱챕 |