同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3bcc382c3b3c384c3a3c2a2c3b3c384 | üÃóÃã¢óà |
SJIS-WIN | c3bcc382c3b3c384c3a3c2a2c3b3c384 | テシテづウテ?」ツ「テウテ |
EUC-JP | c3bcc382c3b3c384c3a3c2a2c3b3c384 | 端?坦?達蔵坦? |
UTF-8 | c3bcc382c3b3c384c3a3c2a2c3b3c384 | üÂóÄã¢óÄ |
UHC | c3bcc382c3b3c384c3a3c2a2c3b3c384 | 체횂처횆찾짖처횆 |