同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a4c3adc2a9c3a5c2adc298c3a4c3adc2a9c3a5c2adc2984d | äéåÂÂäéåÂÂM |
SJIS-WIN | c3a4c3adc2a9c3a5c2adc298c3a4c3adc2a9c3a5c2adc2984d | テ、テュツゥテ・ツュツ佚、テュツゥテ・ツュツ弄 |
EUC-JP | c3a4c3adc2a9c3a5c2adc298c3a4c3adc2a9c3a5c2adc2984d | 辰鱈息奪足?辰鱈息奪足?M |
UTF-8 | c3a4c3adc2a9c3a5c2adc298c3a4c3adc2a9c3a5c2adc2984d | äí©åäí©åM |
UHC | c3a4c3adc2a9c3a5c2adc298c3a4c3adc2a9c3a5c2adc2984d | 채챠짤책짯혱채챠짤책짯혱M |