同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a0c2b1c3a4c392c3a4c2a5c3a0c2b1c3a4c392 | à ±äÃä¥à ±äà |
SJIS-WIN | c3a0c2b1c3a4c392c3a4c2a5c3a0c2b1c3a4c392 | テ?ツアテ、テ津、ツ・テ?ツアテ、テ |
EUC-JP | c3a0c2b1c3a4c392c3a4c2a5c3a0c2b1c3a4c392 | ?賊辰?辰促?賊辰? |
UTF-8 | c3a0c2b1c3a4c392c3a4c2a5c3a0c2b1c3a4c392 | à±äÒä¥à±äÒ |
UHC | c3a0c2b1c3a4c392c3a4c2a5c3a0c2b1c3a4c392 | 횪짹채횘채짜횪짹채횘 |