同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c0d05cc0d05c40c0d05cc0d05c534d | ÀÐ\ÀÐ\@ÀÐ\ÀÐ\SM |
SJIS-WIN | c0d05cc0d05c40c0d05cc0d05c534d | タミ\タミ\@タミ\タミ\SM |
EUC-JP | c0d05cc0d05c40c0d05cc0d05c534d | 石\石\@石\石\SM |
UTF-8 | c0d05cc0d05c40c0d05cc0d05c534d | ??\??\@??\??\SM |
UHC | c0d05cc0d05c40c0d05cc0d05c534d | 읽\읽\@읽\읽\SM |