同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | e581b2e6b2bbe581b2e6b2bb | å²æ²»å²æ²» |
SJIS-WIN | e581b2e6b2bbe581b2e6b2bb | 蛛イ豐サ蛛イ豐サ |
EUC-JP | e581b2e6b2bbe581b2e6b2bb | ?我音?我音 |
UTF-8 | e581b2e6b2bbe581b2e6b2bb | 偲治偲治 |
UHC | e581b2e6b2bbe581b2e6b2bb | 癌꿩꼇癌꿩꼇 |