同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c29343c28b5cc29343c28b5c4d | ÂCÂ\ÂCÂ\M |
SJIS-WIN | c29343c28b5cc29343c28b5c4d | ツ鼎ツ欺ツ鼎ツ欺M |
EUC-JP | c29343c28b5cc29343c28b5c4d | ?C?\?C?\M |
UTF-8 | c29343c28b5cc29343c28b5c4d | C\C\M |
UHC | c29343c28b5cc29343c28b5c4d | 혫C혢\혫C혢\M |