同じビット列が文字コードによってどんな文字に解釈されるか
文字コード | ビット列 | 表示される文字 |
---|---|---|
ISO-8859-1 | 11101100111100011000111010100100111100011111101110001110101010111000111111000111 | ìñ¤ñû«Ç |
SJIS-WIN | 11101100111100011000111010100100111100011111101110001110101010111000111111000111 | ?痔辞症 |
EUC-JP | 11101100111100011000111010100100111100011111101110001110101010111000111111000111 | 跣、髮ォ |
UTF-8 | 11101100111100011000111010100100111100011111101110001110101010111000111111000111 | ???????? |
UHC | 11101100111100011000111010100100111100011111101110001110101010111000111111000111 | 馹렎證렖뤗 |