同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c383c2aac383c28bc382c28fc383 | êÃÂÃÂà |
SJIS-WIN | c383c2aac383c28bc382c28fc383 | テδェテδ凝つ湘 |
EUC-JP | c383c2aac383c28bc382c28fc383 | ?捉????? |
UTF-8 | c383c2aac383c28bc382c28fc383 | êÃÂà |
UHC | c383c2aac383c28bc382c28fc383 | 횄짧횄혢횂혧횄 |