同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 101100011011111111110011110011011010010010111110 | ±¿óͤ¾ |
SJIS-WIN | 101100011011111111110011110011011010010010111110 | アソ、セ |
EUC-JP | 101100011011111111110011110011011010010010111110 | 運麝ぞ |
UTF-8 | 101100011011111111110011110011011010010010111110 | ???ͤ? |
UHC | 101100011011111111110011110011011010010010111110 | 굻擦ㅎ |