同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a0c2b1c28ec2b6c28ec2b6 | à ±Â¶Â¶ |
SJIS-WIN | c3a0c2b1c28ec2b6c28ec2b6 | テ?ツアツ篠カツ篠カ |
EUC-JP | c3a0c2b1c28ec2b6c28ec2b6 | ?賊?其?其 |
UTF-8 | c3a0c2b1c28ec2b6c28ec2b6 | ౶¶ |
UHC | c3a0c2b1c28ec2b6c28ec2b6 | 횪짹혦쨋혦쨋 |