同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | e581b2e6b2bb5ce581b2e6b2bb | å²æ²»\å²æ²» |
SJIS-WIN | e581b2e6b2bb5ce581b2e6b2bb | 蛛イ豐サ\蛛イ豐サ |
EUC-JP | e581b2e6b2bb5ce581b2e6b2bb | ?我音\?我音 |
UTF-8 | e581b2e6b2bb5ce581b2e6b2bb | 偲治\偲治 |
UHC | e581b2e6b2bb5ce581b2e6b2bb | 癌꿩꼇\癌꿩꼇 |