同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3abc3b3c28cc3afc2a5c2b4 | ëóÂ若 |
SJIS-WIN | c3abc3b3c28cc3afc2a5c2b4 | テォテウツ古ッツ・ツエ |
EUC-JP | c3abc3b3c28cc3afc2a5c2b4 | 谷坦?誰促卒 |
UTF-8 | c3abc3b3c28cc3afc2a5c2b4 | ëó若 |
UHC | c3abc3b3c28cc3afc2a5c2b4 | 챘처혣챦짜쨈 |