同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a0c2b55740c3a0c2b557534d | à µW@à µWSM |
SJIS-WIN | c3a0c2b55740c3a0c2b557534d | テ?ツオW@テ?ツオWSM |
EUC-JP | c3a0c2b55740c3a0c2b557534d | ?袖W@?袖WSM |
UTF-8 | c3a0c2b55740c3a0c2b557534d | àµW@àµWSM |
UHC | c3a0c2b55740c3a0c2b557534d | 횪쨉W@횪쨉WSM |