同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a468c3a17440c3a468c3a174534d | ähát@ähátSM |
SJIS-WIN | c3a468c3a17440c3a468c3a174534d | テ、hテ。t@テ、hテ。tSM |
EUC-JP | c3a468c3a17440c3a468c3a174534d | 辰h叩t@辰h叩tSM |
UTF-8 | c3a468c3a17440c3a468c3a174534d | ähát@ähátSM |
UHC | c3a468c3a17440c3a468c3a174534d | 채h찼t@채h찼tSM |