同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c387c2a65cc387c2a65c40c387c2a65cc387c2a65c534d | æ\æ\@æ\æ\SM |
SJIS-WIN | c387c2a65cc387c2a65c40c387c2a65cc387c2a65c534d | テ?ヲ\テ?ヲ\@テ?ヲ\テ?ヲ\SM |
EUC-JP | c387c2a65cc387c2a65c40c387c2a65cc387c2a65c534d | ?側\?側\@?側\?側\SM |
UTF-8 | c387c2a65cc387c2a65c40c387c2a65cc387c2a65c534d | Ǧ\Ǧ\@Ǧ\Ǧ\SM |
UHC | c387c2a65cc387c2a65c40c387c2a65cc387c2a65c534d | 횉짝\횉짝\@횉짝\횉짝\SM |