同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a4c392c2bcc2a3c2bcc2be | äü£¼¾ |
SJIS-WIN | c3a4c392c2bcc2a3c2bcc2be | テ、テ陳シツ」ツシツセ |
EUC-JP | c3a4c392c2bcc2a3c2bcc2be | 辰?村贈村他 |
UTF-8 | c3a4c392c2bcc2a3c2bcc2be | äÒ¼£¼¾ |
UHC | c3a4c392c2bcc2a3c2bcc2be | 채횘쩌짙쩌쩐 |