同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3b2c3a4c2bcc2b9c28fc3a4c3 | òä¼¹Âäà |
SJIS-WIN | c3b2c3a4c2bcc2b9c28fc3a4c3 | テイテ、ツシツケツ湘、テ |
EUC-JP | c3b2c3a4c2bcc2b9c28fc3a4c3 | 嘆辰村孫?辰 |
UTF-8 | c3b2c3a4c2bcc2b9c28fc3a4c3 | òä¼¹ä? |
UHC | c3b2c3a4c2bcc2b9c28fc3a4c3 | 챵채쩌쨔혧채 |