同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 1110011110011001101011000111011011100111100110011010110001110110 | ç¬vç¬v |
SJIS-WIN | 1110011110011001101011000111011011100111100110011010110001110110 | 逋ャv逋ャv |
EUC-JP | 1110011110011001101011000111011011100111100110011010110001110110 | ???? |
UTF-8 | 1110011110011001101011000111011011100111100110011010110001110110 | 癬v癬v |
UHC | 1110011110011001101011000111011011100111100110011010110001110110 | 捻촺捻촺 |