同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 111010001000101110010001111001111000100110100010111011001000010010011100 | èç¢ì |
SJIS-WIN | 111010001000101110010001111001111000100110100010111011001000010010011100 | 闍醍欧? |
EUC-JP | 111010001000101110010001111001111000100110100010111011001000010010011100 | ?????? |
UTF-8 | 111010001000101110010001111001111000100110100010111011001000010010011100 | 苑牢서 |
UHC | 111010001000101110010001111001111000100110100010111011001000010010011100 | 五묊돚淫 |