同じビット列が文字コードによってどんな文字に解釈されるか
ビット列:
2進表現
16進表現
文字コード
ビット列
表示される文字
ISO-8859-1
11100111100101111001010011100110
çæ
SJIS-WIN
11100111100101111001010011100110
逞疲
EUC-JP
11100111100101111001010011100110
??
UTF-8
11100111100101111001010011100110
痔?
UHC
11100111100101111001010011100110
廉붹