同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 110000111010010101100100110000101001001101101101 | Ã¥dÂm |
SJIS-WIN | 110000111010010101100100110000101001001101101101 | テ・dツ杜 |
EUC-JP | 110000111010010101100100110000101001001101101101 | 奪d?m |
UTF-8 | 110000111010010101100100110000101001001101101101 | ådm |
UHC | 110000111010010101100100110000101001001101101101 | 책d혫m |