同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a0c2bdc3a1c3b3c3a0c2bdc3a0c2bc | à ½áóà ½à ¼ |
SJIS-WIN | c3a0c2bdc3a1c3b3c3a0c2bdc3a0c2bc | テ?ツステ。テウテ?ツステ?ツシ |
EUC-JP | c3a0c2bdc3a1c3b3c3a0c2bdc3a0c2bc | ?遜叩坦?遜?村 |
UTF-8 | c3a0c2bdc3a1c3b3c3a0c2bdc3a0c2bc | à½áóà½à¼ |
UHC | c3a0c2bdc3a1c3b3c3a0c2bdc3a0c2bc | 횪쩍찼처횪쩍횪쩌 |