同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 111010111010110010100111111001101010010110101101 | ë¬§æ¥ |
SJIS-WIN | 111010111010110010100111111001101010010110101101 | ?ァ讌ュ |
EUC-JP | 111010111010110010100111111001101010010110101101 | 覓фキ |
UTF-8 | 111010111010110010100111111001101010010110101101 | 묧業 |
UHC | 111010111010110010100111111001101010010110101101 | 臾㎪? |