同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 110000111010001001111100011110101100001110100010011111000111101001001101 | â|zâ|zM |
SJIS-WIN | 110000111010001001111100011110101100001110100010011111000111101001001101 | テ「|zテ「|zM |
EUC-JP | 110000111010001001111100011110101100001110100010011111000111101001001101 | 但|z但|zM |
UTF-8 | 110000111010001001111100011110101100001110100010011111000111101001001101 | â|zâ|zM |
UHC | 110000111010001001111100011110101100001110100010011111000111101001001101 | 창|z창|zM |