同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a55ec3a4c2afc3a55ec3a4c2af | å^ä¯å^ä¯ |
SJIS-WIN | c3a55ec3a4c2afc3a55ec3a4c2af | テ・^テ、ツッテ・^テ、ツッ |
EUC-JP | c3a55ec3a4c2afc3a55ec3a4c2af | 奪^辰俗奪^辰俗 |
UTF-8 | c3a55ec3a4c2afc3a55ec3a4c2af | å^ä¯å^ä¯ |
UHC | c3a55ec3a4c2afc3a55ec3a4c2af | 책^채짱책^채짱 |