同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | bcc4bca5bcc4bcbebcc4bca5 | ¼Ä¼¥¼Ä¼¾¼Ä¼¥ |
SJIS-WIN | bcc4bca5bcc4bcbebcc4bca5 | シトシ・シトシセシトシ・ |
EUC-JP | bcc4bca5bcc4bcbebcc4bca5 | 篠璽篠湿篠璽 |
UTF-8 | bcc4bca5bcc4bcbebcc4bca5 | ?ļ??ļ??ļ? |
UHC | bcc4bca5bcc4bcbebcc4bca5 | 셍샵셍센셍샵 |