同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | e4dfb2e6b2bb5ce4dfb2e6b2bb | ä߲治\ä߲治 |
SJIS-WIN | e4dfb2e6b2bb5ce4dfb2e6b2bb | 葹イ豐サ\葹イ豐サ |
EUC-JP | e4dfb2e6b2bb5ce4dfb2e6b2bb | 籖我音\籖我音 |
UTF-8 | e4dfb2e6b2bb5ce4dfb2e6b2bb | ?߲治\?߲治 |
UHC | e4dfb2e6b2bb5ce4dfb2e6b2bb | 癌꿩꼇\癌꿩꼇 |