同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 11100111111110101000100011101100100110101000001111101011111100011010000111100110 | çúìëñ¡æ |
SJIS-WIN | 11100111111110101000100011101100100110101000001111101011111100011010000111100110 | 鋺溢噬?。 |
EUC-JP | 11100111111110101000100011101100100110101000001111101011111100011010000111100110 | 苞???鞫≧ |
UTF-8 | 11100111111110101000100011101100100110101000001111101011111100011010000111100110 | ???욃??? |
UHC | 11100111111110101000100011101100100110101000001111101011111100011010000111100110 | 旿덉쉩宜→ |