同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 1110100010101111101111001101010010111100101001101110000011000011 | 诼Լ¦àà |
SJIS-WIN | 1110100010101111101111001101010010111100101001101110000011000011 | 隸シヤシヲ狹 |
EUC-JP | 1110100010101111101111001101010010111100101001101110000011000011 | 莚者痔狠 |
UTF-8 | 1110100010101111101111001101010010111100101001101110000011000011 | 诼Լ??? |
UHC | 1110100010101111101111001101010010111100101001101110000011000011 | 瑥솎샷煽 |