同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c2a1c386c2a2c2a5c2a1c386c2a2c2a54d | ¡Ã¢¥¡Ã¢¥M |
SJIS-WIN | c2a1c386c2a2c2a5c2a1c386c2a2c2a54d | ツ。テ?「ツ・ツ。テ?「ツ・M |
EUC-JP | c2a1c386c2a2c2a5c2a1c386c2a2c2a54d | 臓?蔵促臓?蔵促M |
UTF-8 | c2a1c386c2a2c2a5c2a1c386c2a2c2a54d | ¡Æ¢¥¡Æ¢¥M |
UHC | c2a1c386c2a2c2a5c2a1c386c2a2c2a54d | 징횈짖짜징횈짖짜M |