同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3adc2bec2a3c3a9c3bbc3b3c3adc2be | þ£éûóþ |
SJIS-WIN | c3adc2bec2a3c3a9c3bbc3b3c3adc2be | テュツセツ」テゥテサテウテュツセ |
EUC-JP | c3adc2bec2a3c3a9c3bbc3b3c3adc2be | 鱈他贈辿短坦鱈他 |
UTF-8 | c3adc2bec2a3c3a9c3bbc3b3c3adc2be | í¾£éûóí¾ |
UHC | c3adc2bec2a3c3a9c3bbc3b3c3adc2be | 챠쩐짙챕청처챠쩐 |