同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3bc42c396c3a8c393c3b1c3a8 | üBÃèÃñè |
SJIS-WIN | c3bc42c396c3a8c393c3b1c3a8 | テシBテ姪ィテ禿アティ |
EUC-JP | c3bc42c396c3a8c393c3b1c3a8 | 端B?竪?単竪 |
UTF-8 | c3bc42c396c3a8c393c3b1c3a8 | üBÖèÓñè |
UHC | c3bc42c396c3a8c393c3b1c3a8 | 체B횜챔횙챰챔 |