同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 1110111010100111110100111101000011101110101001111101001111010000 | î§ÓÐî§ÓÐ |
SJIS-WIN | 1110111010100111110100111101000011101110101001111101001111010000 | 鈊モミ鈊モミ |
EUC-JP | 1110111010100111110100111101000011101110101001111101001111010000 | 逾嗤逾嗤 |
UTF-8 | 1110111010100111110100111101000011101110101001111101001111010000 | ?????? |
UHC | 1110111010100111110100111101000011101110101001111101001111010000 | 材唐材唐 |