同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3bbc2a4c39ec3bac2aac2a2c28ec2aa | û¤Ãúª¢Âª |
SJIS-WIN | c3bbc2a4c39ec3bac2aac2a2c28ec2aa | テサツ、テ榲コツェツ「ツ篠ェ |
EUC-JP | c3bbc2a4c39ec3bac2aac2a2c28ec2aa | 短造?炭捉蔵?捉 |
UTF-8 | c3bbc2a4c39ec3bac2aac2a2c28ec2aa | û¤Þúª¢ª |
UHC | c3bbc2a4c39ec3bac2aac2a2c28ec2aa | 청짚횧첬짧짖혦짧 |