同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 111011111010011110111101111010111010000110001000111001101010001010010011 | 什ë¡æ¢ |
SJIS-WIN | 111011111010011110111101111010111010000110001000111001101010001010010011 | ?ス?域「 |
EUC-JP | 111011111010011110111101111010111010000110001000111001101010001010010011 | 錻暑?罌? |
UTF-8 | 111011111010011110111101111010111010000110001000111001101010001010010011 | 什롈梓 |
UHC | 111011111010011110111101111010111010000110001000111001101010001010010011 | 筌쎈죭歟 |