Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	鄒晏玄菫ｺ闌	1110011110111110100111011110010110001100101110101110010010111111101110101110100010001100	e7be9de58cbae4bfbae88c
EUC-JP	鄒晏玄菫ｺ闌	111011101100000011011010111001111011100010111100111010001100000110001110101110101110111111101100	eec0dae7b8bce8c18ebaefec
UTF-8	鄒晏玄菫ｺ闌	111010011000010010010010111001101001100110001111111001111000111010000100111010001000111110101011111011111011110110111010111010011001011110001100	e98492e6998fe78e84e88fabefbdbae9978c
UHC	鄒晏玄菫??	11110101110110111110010011001111111110101101110011010000110010110011111100111111	f5dbe4cffadcd0cb3f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)