同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 11100101100110111001101011101001100000111011010101001101 | åéµM |
SJIS-WIN | 11100101100110111001101011101001100000111011010101001101 | 蝗夐ΨM |
EUC-JP | 11100101100110111001101011101001100000111011010101001101 | ???? |
UTF-8 | 11100101100110111001101011101001100000111011010101001101 | 囚郵M |
UHC | 11100101100110111001101011101001100000111011010101001101 | 扼싮꺏M |