同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3b0c3a3c3a0c39dc3b0c3ae | ðãà Ãðî |
SJIS-WIN | c3b0c3a3c3a0c39dc3b0c3ae | テーテ」テ?テ敕ーテョ |
EUC-JP | c3b0c3a3c3a0c39dc3b0c3ae | 丹達??丹樽 |
UTF-8 | c3b0c3a3c3a0c39dc3b0c3ae | ðãàÝðî |
UHC | c3b0c3a3c3a0c39dc3b0c3ae | 챨찾횪횦챨챤 |