同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3bb42c2bec3bac2aac2afc28ec2a3 | ûB¾úª¯Â£ |
SJIS-WIN | c3bb42c2bec3bac2aac2afc28ec2a3 | テサBツセテコツェツッツ篠」 |
EUC-JP | c3bb42c2bec3bac2aac2afc28ec2a3 | 短B他炭捉俗?贈 |
UTF-8 | c3bb42c2bec3bac2aac2afc28ec2a3 | ûB¾úª¯£ |
UHC | c3bb42c2bec3bac2aac2afc28ec2a3 | 청B쩐첬짧짱혦짙 |