同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3adc3a5c28ec2bdc3adc3a5c28ec2bd | Ãå½Ãå½ |
SJIS-WIN | c3adc3a5c28ec2bdc3adc3a5c28ec2bd | テュテ・ツ篠ステュテ・ツ篠ス |
EUC-JP | c3adc3a5c28ec2bdc3adc3a5c28ec2bd | 鱈奪?遜鱈奪?遜 |
UTF-8 | c3adc3a5c28ec2bdc3adc3a5c28ec2bd | íå½íå½ |
UHC | c3adc3a5c28ec2bdc3adc3a5c28ec2bd | 챠책혦쩍챠책혦쩍 |