同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | bcc4bca4bcc4bcaebcc4bcaabcc4bc | ¼Ä¼¤¼Ä¼®¼Ä¼ª¼Ä¼ |
SJIS-WIN | bcc4bca4bcc4bcaebcc4bcaabcc4bc | シトシ、シトショシトシェシトシ |
EUC-JP | bcc4bca4bcc4bcaebcc4bcaabcc4bc | 篠爾篠汐篠耳篠 |
UTF-8 | bcc4bca4bcc4bcaebcc4bcaabcc4bc | ?ļ??ļ??ļ??ļ |
UHC | bcc4bca4bcc4bcaebcc4bcaabcc4bc | 셍샴셍석셍섈셍 |