同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | e0c35ce0c35c40e0c35ce0c35c534d | àÃ\àÃ\@àÃ\àÃ\SM |
SJIS-WIN | e0c35ce0c35c40e0c35ce0c35c534d | 狹\狹\@狹\狹\SM |
EUC-JP | e0c35ce0c35c40e0c35ce0c35c534d | 狠\狠\@狠\狠\SM |
UTF-8 | e0c35ce0c35c40e0c35ce0c35c534d | ??\??\@??\??\SM |
UHC | e0c35ce0c35c40e0c35ce0c35c534d | 煽\煽\@煽\煽\SM |