同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 101111011010010111010011111000101011110110100101110100111110001001001101 | ½¥Óâ½¥ÓâM |
SJIS-WIN | 101111011010010111010011111000101011110110100101110100111110001001001101 | ス・モ篆・モ祟 |
EUC-JP | 101111011010010111010011111000101011110110100101110100111110001001001101 | 愁嘯愁嘯M |
UTF-8 | 101111011010010111010011111000101011110110100101110100111110001001001101 | ???⽥??M |
UHC | 101111011010010111010011111000101011110110100101110100111110001001001101 | 쉈待쉈待M |