同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a0c3bec3a0c3bec3a0c3bec3acc381 | à þà þà þìà |
SJIS-WIN | c3a0c3bec3a0c3bec3a0c3bec3acc381 | テ?テセテ?テセテ?テセテャテ |
EUC-JP | c3a0c3bec3a0c3bec3a0c3bec3acc381 | ?綻?綻?綻狸? |
UTF-8 | c3a0c3bec3a0c3bec3a0c3bec3acc381 | àþàþàþìÁ |
UHC | c3a0c3bec3a0c3bec3a0c3bec3acc381 | 횪첸횪첸횪첸챙횁 |