同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a4c3a95c5740c3a4c3a95c57534d | äé\W@äé\WSM |
SJIS-WIN | c3a4c3a95c5740c3a4c3a95c57534d | テ、テゥ\W@テ、テゥ\WSM |
EUC-JP | c3a4c3a95c5740c3a4c3a95c57534d | 辰辿\W@辰辿\WSM |
UTF-8 | c3a4c3a95c5740c3a4c3a95c57534d | äé\W@äé\WSM |
UHC | c3a4c3a95c5740c3a4c3a95c57534d | 채챕\W@채챕\WSM |