同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3bb57c28ec2a4c3bb54c28ec2ad | ûW¤ûT |
SJIS-WIN | c3bb57c28ec2a4c3bb54c28ec2ad | テサWツ篠、テサTツ篠ュ |
EUC-JP | c3bb57c28ec2a4c3bb54c28ec2ad | 短W?造短T?足 |
UTF-8 | c3bb57c28ec2a4c3bb54c28ec2ad | ûW¤ûT |
UHC | c3bb57c28ec2a4c3bb54c28ec2ad | 청W혦짚청T혦짯 |