同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3abc2a4c29ec3abc2b9c2a1c3abc3ab | ë¤Â빡ëë |
SJIS-WIN | c3abc2a4c29ec3abc2b9c2a1c3abc3ab | テォツ、ツ榲ォツケツ。テォテォ |
EUC-JP | c3abc2a4c29ec3abc2b9c2a1c3abc3ab | 谷造?谷孫臓谷谷 |
UTF-8 | c3abc2a4c29ec3abc2b9c2a1c3abc3ab | ë¤ë¹¡ëë |
UHC | c3abc2a4c29ec3abc2b9c2a1c3abc3ab | 챘짚혷챘쨔징챘챘 |