同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a9c2a9c2a5c3a5c28cc2bac3a4c3bc | é©¥åºäü |
SJIS-WIN | c3a9c2a9c2a5c3a5c28cc2bac3a4c3bc | テゥツゥツ・テ・ツ個コテ、テシ |
EUC-JP | c3a9c2a9c2a5c3a5c28cc2bac3a4c3bc | 辿息促奪?尊辰端 |
UTF-8 | c3a9c2a9c2a5c3a5c28cc2bac3a4c3bc | é©¥åºäü |
UHC | c3a9c2a9c2a5c3a5c28cc2bac3a4c3bc | 챕짤짜책혣쨘채체 |