同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a7c3abc2b5c3a5c292c28fc3a5c2be | çëµåÂÂå¾ |
SJIS-WIN | c3a7c3abc2b5c3a5c292c28fc3a5c2be | テァテォツオテ・ツ陳湘・ツセ |
EUC-JP | c3a7c3abc2b5c3a5c292c28fc3a5c2be | 巽谷袖奪??奪他 |
UTF-8 | c3a7c3abc2b5c3a5c292c28fc3a5c2be | çëµåå¾ |
UHC | c3a7c3abc2b5c3a5c292c28fc3a5c2be | 챌챘쨉책혪혧책쩐 |