同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c4be5c5740c4be5c57534d | ľ\W@ľ\WSM |
SJIS-WIN | c4be5c5740c4be5c57534d | トセ\W@トセ\WSM |
EUC-JP | c4be5c5740c4be5c57534d | 直\W@直\WSM |
UTF-8 | c4be5c5740c4be5c57534d | ľ\W@ľ\WSM |
UHC | c4be5c5740c4be5c57534d | 컁\W@컁\WSM |