同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 11101000100010101010111111100101101111011011100101000001 | è¯å½¹A |
SJIS-WIN | 11101000100010101010111111100101101111011011100101000001 | 闃ッ蠖ケA |
EUC-JP | 11101000100010101010111111100101101111011011100101000001 | ??醜A |
UTF-8 | 11101000100010101010111111100101101111011011100101000001 | 芯役A |
UHC | 11101000100010101010111111100101101111011011100101000001 | 預?슝A |