同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | bcc4bca4bcc58ec48ec4bcabbcc4bcac | ¼Ä¼¤¼ÅÄļ«¼Ä¼¬ |
SJIS-WIN | bcc4bca4bcc58ec48ec4bcabbcc4bcac | シトシ、シナ柴柴シォシトシャ |
EUC-JP | bcc4bca4bcc58ec48ec4bcabbcc4bcac | 篠爾偲トト自篠蒔 |
UTF-8 | bcc4bca4bcc58ec48ec4bcabbcc4bcac | ?ļ??ŎĎļ??ļ? |
UHC | bcc4bca4bcc58ec48ec4bcabbcc4bcac | 셍샴셔렼렼섐셍섕 |