同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c28fc38cc3a4c3bbc28fc38cc3a4c3bb | ÂÃäûÂÃäû |
SJIS-WIN | c28fc38cc3a4c3bbc28fc38cc3a4c3bb | ツ湘古、テサツ湘古、テサ |
EUC-JP | c28fc38cc3a4c3bbc28fc38cc3a4c3bb | ??辰短??辰短 |
UTF-8 | c28fc38cc3a4c3bbc28fc38cc3a4c3bb | ÌäûÌäû |
UHC | c28fc38cc3a4c3bbc28fc38cc3a4c3bb | 혧횑채청혧횑채청 |