同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a461c3a46140c3a461c3a461534d | äaäa@äaäaSM |
SJIS-WIN | c3a461c3a46140c3a461c3a461534d | テ、aテ、a@テ、aテ、aSM |
EUC-JP | c3a461c3a46140c3a461c3a461534d | 辰a辰a@辰a辰aSM |
UTF-8 | c3a461c3a46140c3a461c3a461534d | äaäa@äaäaSM |
UHC | c3a461c3a46140c3a461c3a461534d | 채a채a@채a채aSM |