同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | c3a4c2bdc2bec3abc2bac298c3a4c2bdc2bec3abc2bac2984d | ä½¾ëºÂä½¾ëºÂM |
SJIS-WIN | c3a4c2bdc2bec3abc2bac298c3a4c2bdc2bec3abc2bac2984d | テ、ツスツセテォツコツ佚、ツスツセテォツコツ弄 |
EUC-JP | c3a4c2bdc2bec3abc2bac298c3a4c2bdc2bec3abc2bac2984d | 辰遜他谷尊?辰遜他谷尊?M |
UTF-8 | c3a4c2bdc2bec3abc2bac298c3a4c2bdc2bec3abc2bac2984d | ä½¾ëºä½¾ëºM |
UHC | c3a4c2bdc2bec3abc2bac298c3a4c2bdc2bec3abc2bac2984d | 채쩍쩐챘쨘혱채쩍쩐챘쨘혱M |