同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | e98085e8b3a4e98085e8b3a44d | é 賤é 賤M |
SJIS-WIN | e98085e8b3a4e98085e8b3a44d | 騾?ウ、騾?ウ、M |
EUC-JP | e98085e8b3a4e98085e8b3a44d | ??莖ら??莖? |
UTF-8 | e98085e8b3a4e98085e8b3a44d | 逅賤逅賤M |
UHC | e98085e8b3a4e98085e8b3a44d | 倭낁낀倭낁낀M |