同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3abc3a3c295c3a4c2bac2ba | ëãÂ人 |
SJIS-WIN | c3abc3a3c295c3a4c2bac2ba | テォテ」ツ陛、ツコツコ |
EUC-JP | c3abc3a3c295c3a4c2bac2ba | 谷達?辰尊尊 |
UTF-8 | c3abc3a3c295c3a4c2bac2ba | ëã人 |
UHC | c3abc3a3c295c3a4c2bac2ba | 챘찾혮채쨘쨘 |