同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | bca4bcb0bcaabcafbca4bcb0bcaabcaf | ¼¤¼°¼ª¼¯¼¤¼°¼ª¼¯ |
SJIS-WIN | bca4bcb0bcaabcafbca4bcb0bcaabcaf | シ、シーシェシッシ、シーシェシッ |
EUC-JP | bca4bcb0bcaabcafbca4bcb0bcaabcaf | 爾式耳鹿爾式耳鹿 |
UTF-8 | bca4bcb0bcaabcafbca4bcb0bcaabcaf | ???????????????? |
UHC | bca4bcb0bcaabcafbca4bcb0bcaabcaf | 샴섟섈섞샴섟섈섞 |