同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c2b1c2ab5c5740c2b1c2ab5c57534d | ±«\W@±«\WSM |
SJIS-WIN | c2b1c2ab5c5740c2b1c2ab5c57534d | ツアツォ\W@ツアツォ\WSM |
EUC-JP | c2b1c2ab5c5740c2b1c2ab5c57534d | 賊束\W@賊束\WSM |
UTF-8 | c2b1c2ab5c5740c2b1c2ab5c57534d | ±«\W@±«\WSM |
UHC | c2b1c2ab5c5740c2b1c2ab5c57534d | 짹짬\W@짹짬\WSM |