同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c382c28ec382c2bdc383c2a4c383c2b2 | ÃÂýäò |
SJIS-WIN | c382c28ec382c2bdc383c2a4c383c2b2 | テつ偲つステδ、テδイ |
EUC-JP | c382c28ec382c2bdc383c2a4c383c2b2 | ???遜?造?族 |
UTF-8 | c382c28ec382c2bdc383c2a4c383c2b2 | ½äò |
UHC | c382c28ec382c2bdc383c2a4c383c2b2 | 횂혦횂쩍횄짚횄짼 |