Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	CMHMBB	10010010010000110100110110010010010010001001001001001101100100100100001001000010	92434d9248924d924242
SJIS-WIN	?CM?H?M?BB	00111111010000110100110100111111010010000011111101001101001111110100001001000010	3f434d3f483f4d3f4242
EUC-JP	?CM?H?M?BB	00111111010000110100110100111111010010000011111101001101001111110100001001000010	3f434d3f483f4d3f4242
UTF-8	CMHMBB	1100001010010010010000110100110111000010100100100100100011000010100100100100110111000010100100100100001001000010	c292434dc29248c2924dc2924242
UHC	?CM?H?M?BB	00111111010000110100110100111111010010000011111101001101001111110100001001000010	3f434d3f483f4d3f4242

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)