同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c0e557c0e557c0e557c0e5574d | ÀåWÀåWÀåWÀåWM |
SJIS-WIN | c0e557c0e557c0e557c0e5574d | タ藐タ藐タ藐タ藐M |
EUC-JP | c0e557c0e557c0e557c0e5574d | 舌W舌W舌W舌WM |
UTF-8 | c0e557c0e557c0e557c0e5574d | ??W??W??W??WM |
UHC | c0e557c0e557c0e557c0e5574d | 장W장W장W장WM |