同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 1110100010110011101111010110100011101000101100111011110101110000 | è³½hè³½p |
SJIS-WIN | 1110100010110011101111010110100011101000101100111011110101110000 | 雉スh雉スp |
EUC-JP | 1110100010110011101111010110100011101000101100111011110101110000 | 莖?莖? |
UTF-8 | 1110100010110011101111010110100011101000101100111011110101110000 | 賽h賽p |
UHC | 1110100010110011101111010110100011101000101100111011110101110000 | 蘊퐃蘊퐌 |