同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a4c3abc2bdc3aac2b2c2bc | äë½ê²¼ |
SJIS-WIN | c3a4c3abc2bdc3aac2b2c2bc | テ、テォツステェツイツシ |
EUC-JP | c3a4c3abc2bdc3aac2b2c2bc | 辰谷遜棚族村 |
UTF-8 | c3a4c3abc2bdc3aac2b2c2bc | äë½ê²¼ |
UHC | c3a4c3abc2bdc3aac2b2c2bc | 채챘쩍챗짼쩌 |