同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3bc42c38cc3a9c28ec2bdc28ec2b8 | üBÃ齸 |
SJIS-WIN | c3bc42c38cc3a9c28ec2bdc28ec2b8 | テシBテ古ゥツ篠スツ篠ク |
EUC-JP | c3bc42c38cc3a9c28ec2bdc28ec2b8 | 端B?辿?遜?存 |
UTF-8 | c3bc42c38cc3a9c28ec2bdc28ec2b8 | üBÌ齸 |
UHC | c3bc42c38cc3a9c28ec2bdc28ec2b8 | 체B횑챕혦쩍혦쨍 |