Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	âH}iâH}iB	111000100100100001111101011010011110001001001000011111010110100101000010	e2487d69e2487d6942
SJIS-WIN	?H}i?H}iB	001111110100100001111101011010010011111101001000011111010110100101000010	3f487d693f487d6942
EUC-JP	âH}iâH}iB	10001111101010111010010001001000011111010110100110001111101010111010010001001000011111010110100101000010	8faba4487d698faba4487d6942
UTF-8	âH}iâH}iB	1100001110100010010010000111110101101001110000111010001001001000011111010110100101000010	c3a2487d69c3a2487d6942
UHC	?H}i?H}iB	001111110100100001111101011010010011111101001000011111010110100101000010	3f487d693f487d6942

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)