同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a8c392c28ec2bcc3a2c2bec28ec2bd | èüâ¾Â½ |
SJIS-WIN | c3a8c392c28ec2bcc3a2c2bec28ec2bd | ティテ陳篠シテ「ツセツ篠ス |
EUC-JP | c3a8c392c28ec2bcc3a2c2bec28ec2bd | 竪??村但他?遜 |
UTF-8 | c3a8c392c28ec2bcc3a2c2bec28ec2bd | èҼ⾽ |
UHC | c3a8c392c28ec2bcc3a2c2bec28ec2bd | 챔횘혦쩌창쩐혦쩍 |