同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a2c2be5c5740c3a2c2be5c57534d | â¾\W@â¾\WSM |
SJIS-WIN | c3a2c2be5c5740c3a2c2be5c57534d | テ「ツセ\W@テ「ツセ\WSM |
EUC-JP | c3a2c2be5c5740c3a2c2be5c57534d | 但他\W@但他\WSM |
UTF-8 | c3a2c2be5c5740c3a2c2be5c57534d | â¾\W@â¾\WSM |
UHC | c3a2c2be5c5740c3a2c2be5c57534d | 창쩐\W@창쩐\WSM |