Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?`?OB	0011111101100000001111110100111101000010	3f603f4f42
SJIS-WIN	叩`叩OB	10010010010000000110000010010010010000000100111101000010	92406092404f42
EUC-JP	叩`叩OB	11000011101000010110000011000011101000010100111101000010	c3a160c3a14f42
UTF-8	叩`叩OB	111001011000111110101001011000001110010110001111101010010100111101000010	e58fa960e58fa94f42
UHC	叩`叩OB	11001101101100000110000011001101101100000100111101000010	cdb060cdb04f42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)