同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 111010001010010010100101111000111000001110101111111011011001001010001010 | 褥ã¯í |
SJIS-WIN | 111010001010010010100101111000111000001110101111111011011001001010001010 | 隍・繝ッ峵 |
EUC-JP | 111010001010010010100101111000111000001110101111111011011001001010001010 | 茲ャ???? |
UTF-8 | 111010001010010010100101111000111000001110101111111011011001001010001010 | 褥ワ풊 |
UHC | 111010001010010010100101111000111000001110101111111011011001001010001010 | 筽γ꺈鎰 |