同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c383c29cc382c2abc383c29cc382c2ab | ÃÂëÃÂë |
SJIS-WIN | c383c29cc382c2abc383c29cc382c2ab | テδ愿つォテδ愿つォ |
EUC-JP | c383c29cc382c2abc383c29cc382c2ab | ???束???束 |
UTF-8 | c383c29cc382c2abc383c29cc382c2ab | ëë |
UHC | c383c29cc382c2abc383c29cc382c2ab | 횄혵횂짬횄혵횂짬 |