同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3bbc38cc2bec3a9c28ec2a1c28ec2bc | ûþ顼 |
SJIS-WIN | c3bbc38cc2bec3a9c28ec2a1c28ec2bc | テサテ個セテゥツ篠。ツ篠シ |
EUC-JP | c3bbc38cc2bec3a9c28ec2a1c28ec2bc | 短?他辿?臓?村 |
UTF-8 | c3bbc38cc2bec3a9c28ec2a1c28ec2bc | û̾顼 |
UHC | c3bbc38cc2bec3a9c28ec2a1c28ec2bc | 청횑쩐챕혦징혦쩌 |