Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????gB	0011111100111111001111110011111100111111001111110110011101000010	3f3f3f3f3f3f6742
SJIS-WIN	??????gB	0011111100111111001111110011111100111111001111110110011101000010	3f3f3f3f3f3f6742
EUC-JP	髥?????gB	10001111111010011111000000111111001111110011111100111111001111110110011101000010	8fe9f03f3f3f3f3f6742
UTF-8	髥묕숯寧놅쉘gB	1110100110101011101001011110101110101100100101011110110010001000101011111110111110100110101010101110101110000110100001011110110010001001100110000110011101000010	e9aba5ebac95ec88afefa6aaeb8685ec89986742
UHC	髥묕숯寧놅쉘gB	1110011110100011100100011110111110111101101000011110011110101100100001101110111110111101101010010110011101000010	e7a391efbda1e7ac86efbda96742

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)