同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c395c2be5cc395c2be5c40c395c2be5cc395c2be5c534d | þ\þ\@þ\þ\SM |
SJIS-WIN | c395c2be5cc395c2be5c40c395c2be5cc395c2be5c534d | テ閉セ\テ閉セ\@テ閉セ\テ閉セ\SM |
EUC-JP | c395c2be5cc395c2be5c40c395c2be5cc395c2be5c534d | ?他\?他\@?他\?他\SM |
UTF-8 | c395c2be5cc395c2be5c40c395c2be5cc395c2be5c534d | Õ¾\Õ¾\@Õ¾\Õ¾\SM |
UHC | c395c2be5cc395c2be5c40c395c2be5cc395c2be5c534d | 횛쩐\횛쩐\@횛쩐\횛쩐\SM |