同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a9c29ac2aac3a6c28ac2b5c3afc2bdc2bdc3afc2bdc2a4c3a9c2a8c2be | éªæµス、騾 |
SJIS-WIN | c3a9c29ac2aac3a6c28ac2b5c3afc2bdc2bdc3afc2bdc2a4c3a9c2a8c2be | テゥツ堋ェテヲツ環オテッツスツステッツスツ、テゥツィツセ |
EUC-JP | c3a9c29ac2aac3a6c28ac2b5c3afc2bdc2bdc3afc2bdc2a4c3a9c2a8c2be | 辿?捉脱?袖誰遜遜誰遜造辿即他 |
UTF-8 | c3a9c29ac2aac3a6c28ac2b5c3afc2bdc2bdc3afc2bdc2a4c3a9c2a8c2be | éªæµï½½ï½¤é¨¾ |
UHC | c3a9c29ac2aac3a6c28ac2b5c3afc2bdc2bdc3afc2bdc2a4c3a9c2a8c2be | 챕혳짧챈혡쨉챦쩍쩍챦쩍짚챕짢쩐 |