同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3bbc38cc2bec3b0c380c2a2c3bbc2bd | ûþðâû½ |
SJIS-WIN | c3bbc38cc2bec3b0c380c2a2c3bbc2bd | テサテ個セテーテ?ツ「テサツス |
EUC-JP | c3bbc38cc2bec3b0c380c2a2c3bbc2bd | 短?他丹?蔵短遜 |
UTF-8 | c3bbc38cc2bec3b0c380c2a2c3bbc2bd | û̾ðÀ¢û½ |
UHC | c3bbc38cc2bec3b0c380c2a2c3bbc2bd | 청횑쩐챨?짖청쩍 |