同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 00111111100011101100001010111100110001001000111010101101 | ?Â¼Ä |
SJIS-WIN | 00111111100011101100001010111100110001001000111010101101 | ?篠シト鹿 |
EUC-JP | 00111111100011101100001010111100110001001000111010101101 | ?ツ篠ュ |
UTF-8 | 00111111100011101100001010111100110001001000111010101101 | ??¼Ď? |
UHC | 00111111100011101100001010111100110001001000111010101101 | ?렺셍렚 |