同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c382c291c382c2abc383c2a4c383c29e | ÃÂëäà|
SJIS-WIN | c382c291c382c2abc383c2a4c383c29e | テつ妥つォテδ、テδ |
EUC-JP | c382c291c382c2abc383c2a4c383c29e | ???束?造?? |
UTF-8 | c382c291c382c2abc383c2a4c383c29e | «äà |
UHC | c382c291c382c2abc383c2a4c383c29e | 횂혩횂짬횄짚횄혷 |