同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c2bdc3a4c289c2bdc3a4c2894d | ½ä½äÂM |
SJIS-WIN | c2bdc3a4c289c2bdc3a4c2894d | ツステ、ツ可ステ、ツ窺 |
EUC-JP | c2bdc3a4c289c2bdc3a4c2894d | 遜辰?遜辰?M |
UTF-8 | c2bdc3a4c289c2bdc3a4c2894d | ½ä½äM |
UHC | c2bdc3a4c289c2bdc3a4c2894d | 쩍채혟쩍채혟M |