同じビット列が文字コードによってどんな文字に解釈されるか
ビット列:
2進表現
16進表現
文字コード
ビット列
表示される文字
ISO-8859-1
c3a1c3a0c3a1c3a07c
áà áà |
SJIS-WIN
c3a1c3a0c3a1c3a07c
テ。テ?テ。テ?|
EUC-JP
c3a1c3a0c3a1c3a07c
叩?叩?|
UTF-8
c3a1c3a0c3a1c3a07c
áàáà|
UHC
c3a1c3a0c3a1c3a07c
찼횪찼횪|