同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a0c3a6c3a0c3afc39fc3bc | à æà ïÃü |
SJIS-WIN | c3a0c3a6c3a0c3afc39fc3bc | テ?テヲテ?テッテ淌シ |
EUC-JP | c3a0c3a6c3a0c3afc39fc3bc | ?脱?誰?端 |
UTF-8 | c3a0c3a6c3a0c3afc39fc3bc | àæàïßü |
UHC | c3a0c3a6c3a0c3afc39fc3bc | 횪챈횪챦횩체 |