同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 1110011001100001111010101001011011100101100101111110011001100001 | æaêåæa |
SJIS-WIN | 1110011001100001111010101001011011100101100101111110011001100001 | 訛齧蝸訛 |
EUC-JP | 1110011001100001111010101001011011100101100101111110011001100001 | ???? |
UTF-8 | 1110011001100001111010101001011011100101100101111110011001100001 | ?a???a |
UHC | 1110011001100001111010101001011011100101100101111110011001100001 | 恙郁艾恙 |