同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 11101001101101001010011011101011101100111010011011101100101110101000000101111110 | 鴦볦ìº~ |
SJIS-WIN | 11101001101101001010011011101011101100111010011011101100101110101000000101111110 | 魘ヲ?ヲ?× |
EUC-JP | 11101001101101001010011011101011101100111010011011101100101110101000000101111110 | 藉?界貂?~ |
UTF-8 | 11101001101101001010011011101011101100111010011011101100101110101000000101111110 | 鴦볦캁~ |
UHC | 11101001101101001010011011101011101100111010011011101100101110101000000101111110 | 辱?낌罹? |