同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a4c3a05740c3a4c3a057534d | äà W@äà WSM |
SJIS-WIN | c3a4c3a05740c3a4c3a057534d | テ、テ?W@テ、テ?WSM |
EUC-JP | c3a4c3a05740c3a4c3a057534d | 辰?W@辰?WSM |
UTF-8 | c3a4c3a05740c3a4c3a057534d | äàW@äàWSM |
UHC | c3a4c3a05740c3a4c3a057534d | 채횪W@채횪WSM |