同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 1110011010110100101110011100111010110110111011011001000010010111 | 洹ζí |
SJIS-WIN | 1110011010110100101110011100111010110110111011011001000010010111 | 豢ケホカ岦 |
EUC-JP | 1110011010110100101110011100111010110110111011011001000010010111 | 羇肯躯?? |
UTF-8 | 1110011010110100101110011100111010110110111011011001000010010111 | 洹ζ퐗 |
UHC | 1110011010110100101110011100111010110110111011011001000010010111 | 域민띤릹 |