同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3abc2a4c297c3abc2b4c284 | ë¤Âë´ |
SJIS-WIN | c3abc2a4c297c3abc2b4c284 | テォツ、ツ療ォツエツ |
EUC-JP | c3abc2a4c297c3abc2b4c284 | 谷造?谷卒? |
UTF-8 | c3abc2a4c297c3abc2b4c284 | ë¤ë´ |
UHC | c3abc2a4c297c3abc2b4c284 | 챘짚혰챘쨈혙 |