同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a4c2bdc286c3a9c2b1c28857 | ä½Âé±ÂW |
SJIS-WIN | c3a4c2bdc286c3a9c2b1c28857 | テ、ツスツ?ゥツアツ? |
EUC-JP | c3a4c2bdc286c3a9c2b1c28857 | 辰遜?辿賊?W |
UTF-8 | c3a4c2bdc286c3a9c2b1c28857 | ä½é±W |
UHC | c3a4c2bdc286c3a9c2b1c28857 | 채쩍혛챕짹혞W |