同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 11100100101101010011111100111111110100011010011100111111001111111110010010110101 | äµ??ѧ??äµ |
SJIS-WIN | 11100100101101010011111100111111110100011010011100111111001111111110010010110101 | 莊??ムァ??莊 |
EUC-JP | 11100100101101010011111100111111110100011010011100111111001111111110010010110101 | 箋??僥??箋 |
UTF-8 | 11100100101101010011111100111111110100011010011100111111001111111110010010110101 | ???ѧ??? |
UHC | 11100100101101010011111100111111110100011010011100111111001111111110010010110101 | 莪??欺??莪 |