同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 111011111010100010010001111001101001100110100010 | ï¨æ¢ |
SJIS-WIN | 111011111010100010010001111001101001100110100010 | ?第劼 |
EUC-JP | 111011111010100010010001111001101001100110100010 | 鍜?? |
UTF-8 | 111011111010100010010001111001101001100110100010 | 﨑晢 |
UHC | 111011111010100010010001111001101001100110100010 | 箋묉솫 |