同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3b0c2bfc2a5c3a7c2a1c2bfc2b5c3bbc2a4c3a8 | ð¿¥ç¡¿µû¤è |
SJIS-WIN | c3b0c2bfc2a5c3a7c2a1c2bfc2b5c3bbc2a4c3a8 | テーツソツ・テァツ。ツソツオテサツ、ティ |
EUC-JP | c3b0c2bfc2a5c3a7c2a1c2bfc2b5c3bbc2a4c3a8 | 丹多促巽臓多袖短造竪 |
UTF-8 | c3b0c2bfc2a5c3a7c2a1c2bfc2b5c3bbc2a4c3a8 | ð¿¥ç¡¿µû¤è |
UHC | c3b0c2bfc2a5c3a7c2a1c2bfc2b5c3bbc2a4c3a8 | 챨쩔짜챌징쩔쨉청짚챔 |