同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 10001111101010111110010010100001110111111010000111011110 | «ä¡ß¡Þ |
SJIS-WIN | 10001111101010111110010010100001110111111010000111011110 | 将茖゚。゙ |
EUC-JP | 10001111101010111110010010100001110111111010000111011110 | ü×± |
UTF-8 | 10001111101010111110010010100001110111111010000111011110 | ???ߡ? |
UHC | 10001111101010111110010010100001110111111010000111011110 | 룶沈傘 |