同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a4c3aec2bec3acc287c2a4c3acc2aa | äî¾ìÂ¤ìª |
SJIS-WIN | c3a4c3aec2bec3acc287c2a4c3acc2aa | テ、テョツセテャツ?、テャツェ |
EUC-JP | c3a4c3aec2bec3acc287c2a4c3acc2aa | 辰樽他狸?造狸捉 |
UTF-8 | c3a4c3aec2bec3acc287c2a4c3acc2aa | äî¾ì¤ìª |
UHC | c3a4c3aec2bec3acc287c2a4c3acc2aa | 채챤쩐챙혝짚챙짧 |