同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | e2865ce2865c40e2865ce2865c534d | â\â\@â\â\SM |
SJIS-WIN | e2865ce2865c40e2865ce2865c534d | 竊\竊\@竊\竊\SM |
EUC-JP | e2865ce2865c40e2865ce2865c534d | ?\?\@?\?\SM |
UTF-8 | e2865ce2865c40e2865ce2865c534d | ?\?\@?\?\SM |
UHC | e2865ce2865c40e2865ce2865c534d | 宋\宋\@宋\宋\SM |