同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c383c2b1c383c2b9c382c2a4c383c2a7c383 | ñùäçà |
SJIS-WIN | c383c2b1c383c2b9c382c2a4c383c2a7c383 | テδアテδケテつ、テδァテ |
EUC-JP | c383c2b1c383c2b9c382c2a4c383c2a7c383 | ?賊?孫?造?則? |
UTF-8 | c383c2b1c383c2b9c382c2a4c383c2a7c383 | ñù¤çà |
UHC | c383c2b1c383c2b9c382c2a4c383c2a7c383 | 횄짹횄쨔횂짚횄짠횄 |