Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	鳰疾聶質昇	111010011110101010001110101111101110001111100001100011101011111110001111101110001111011011101100	e9ea8ebee3e18ebf8fb8f6ec
EUC-JP	鳰疾聶質昇?	1111001011101100101111001100000011100110111000111011110011000001101111101011101000111111	f2ecbcc0e6e3bcc1beba3f
UTF-8	鳰疾聶質昇	111010011011001110110000111001111001011010111110111010001000000110110110111010001011001110101010111001101001100010000111111011101001010010010011	e9b3b0e796bee881b6e8b3aae69887ee9493
UHC	?疾?質昇?	001111111111001011110000001111111111001011110101111000111011000000111111	3ff2f03ff2f5e3b03f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)