同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a3c393c3b1c3bcc3a3c393c3b1c3bc | ãÃñüãÃñü |
SJIS-WIN | c3a3c393c3b1c3bcc3a3c393c3b1c3bc | テ」テ禿アテシテ」テ禿アテシ |
EUC-JP | c3a3c393c3b1c3bcc3a3c393c3b1c3bc | 達?単端達?単端 |
UTF-8 | c3a3c393c3b1c3bcc3a3c393c3b1c3bc | ãÓñüãÓñü |
UHC | c3a3c393c3b1c3bcc3a3c393c3b1c3bc | 찾횙챰체찾횙챰체 |