同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c38ac3bbc3a5c2b0c3adc2b1 | Ãûå°Ã± |
SJIS-WIN | c38ac3bbc3a5c2b0c3adc2b1 | テ甘サテ・ツーテュツア |
EUC-JP | c38ac3bbc3a5c2b0c3adc2b1 | ?短奪属鱈賊 |
UTF-8 | c38ac3bbc3a5c2b0c3adc2b1 | Êûå°í± |
UHC | c38ac3bbc3a5c2b0c3adc2b1 | 횎청책째챠짹 |