同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 111010001001110110101000111011111011110110101000111010001001110110100000 | è¨ï½¨è |
SJIS-WIN | 111010001001110110101000111011111011110110101000111010001001110110100000 | 陜ィ?ィ陜? |
EUC-JP | 111010001001110110101000111011111011110110101000111010001001110110100000 | ??秀?? |
UTF-8 | 111010001001110110101000111011111011110110101000111010001001110110100000 | 蝨ィ蝠 |
UHC | 111010001001110110101000111011111011110110101000111010001001110110100000 | 晤⑨쉔晤 |