同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 00111111111010001011110010001110110101111000111011010001 | ?è¼×Ñ |
SJIS-WIN | 00111111111010001011110010001110110101111000111011010001 | ?霈邪紗 |
EUC-JP | 00111111111010001011110010001110110101111000111011010001 | ?莠ラム |
UTF-8 | 00111111111010001011110010001110110101111000111011010001 | ?輎? |
UHC | 00111111111010001011110010001110110101111000111011010001 | ?雍롒롋 |