同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 1110011111110010100110001110010110111011101111111110010011111010 | çò廿äú |
SJIS-WIN | 1110011111110010100110001110010110111011101111111110010011111010 | 銓伜サソ蕣 |
EUC-JP | 1110011111110010100110001110010110111011101111111110010011111010 | 苒?綮推 |
UTF-8 | 1110011111110010100110001110010110111011101111111110010011111010 | ??廿?? |
UHC | 1110011111110010100110001110010110111011101111111110010011111010 | 墺섇뼁掖 |