同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c382c28dc382c296c382c282c382c285 | ÃÂÃÂÃÂÃÂ |
SJIS-WIN | c382c28dc382c296c382c282c382c285 | テつ催つ姪つづつ |
EUC-JP | c382c28dc382c296c382c282c382c285 | ???????? |
UTF-8 | c382c28dc382c296c382c282c382c285 | ÂÂÂÂ |
UHC | c382c28dc382c296c382c282c382c285 | 횂혥횂혯횂혗횂혚 |