同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a2c2a2c282c285c282c2abc3a2c2a3 | â¢Â Â«â£ |
SJIS-WIN | c3a2c2a2c282c285c282c2abc3a2c2a3 | テ「ツ「ツつ?つォテ「ツ」 |
EUC-JP | c3a2c2a2c282c285c282c2abc3a2c2a3 | 但蔵???束但贈 |
UTF-8 | c3a2c2a2c282c285c282c2abc3a2c2a3 | ⢠«â£ |
UHC | c3a2c2a2c282c285c282c2abc3a2c2a3 | 창짖혗혚혗짬창짙 |