Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	霍帑ｹ溷悉霍	1110100010110111100110111110010010111001100111111110010110001110101110111110100010110111	e8b79be4b99fe58ebbe8b7
EUC-JP	霍帑ｹ溷悉霍	111100001011100111010110111001101000111010111001110111101110011110111100101111011111000010111001	f0b9d6e68eb9dee7bcbdf0b9
UTF-8	霍帑ｹ溷悉霍	111010011001110010001101111001011011100010010001111011111011110110111001111001101011101010110111111001101000001010001001111010011001110010001101	e99c8de5b891efbdb9e6bab7e68289e99c8d
UHC	?帑??悉?	0011111111110111101101100011111100111111111000111111101000111111	3ff7b63f3fe3fa3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)