同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 1110100111110011100011101010110111110010101011011000111010110100 | éóò´ |
SJIS-WIN | 1110100111110011100011101010110111110010101011011000111010110100 | 鴣鹿雫 |
EUC-JP | 1110100111110011100011101010110111110010101011011000111010110100 | 蜩ュ鬮エ |
UTF-8 | 1110100111110011100011101010110111110010101011011000111010110100 | ?? |
UHC | 1110100111110011100011101010110111110010101011011000111010110100 | 稶렚止렣 |