同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a0c3bc5cc3a0c3bc5c40c3a0c3bc5cc3a0c3bc5c534d | à ü\à ü\@à ü\à ü\SM |
SJIS-WIN | c3a0c3bc5cc3a0c3bc5c40c3a0c3bc5cc3a0c3bc5c534d | テ?テシ\テ?テシ\@テ?テシ\テ?テシ\SM |
EUC-JP | c3a0c3bc5cc3a0c3bc5c40c3a0c3bc5cc3a0c3bc5c534d | ?端\?端\@?端\?端\SM |
UTF-8 | c3a0c3bc5cc3a0c3bc5c40c3a0c3bc5cc3a0c3bc5c534d | àü\àü\@àü\àü\SM |
UHC | c3a0c3bc5cc3a0c3bc5c40c3a0c3bc5cc3a0c3bc5c534d | 횪체\횪체\@횪체\횪체\SM |