Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????h	0011111100111111001111110011111101101000	3f3f3f3f68
SJIS-WIN	襭苦捷造h	111001100100001010001011111010101000111110110111100100011010001001101000	e6428bea8fb791a268
EUC-JP	襭苦捷造h	111010111010001110110110111011001011111010111001110000101010010001101000	eba3b6ecbeb9c2a468
UTF-8	襭苦捷造h	11101000101001011010110111101000100010111010011011100110100011011011011111101001100000001010000001101000	e8a5ade88ba6e68db7e980a068
UHC	?苦捷造h	0011111111001101110010001111010011011111111100001110001101101000	3fcdc8f4dff0e368

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)