Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	諱呟ｻ駕脅	111001101000000110011001111010101011101110001001111011011000101110111010	e68199eabb89ed8bba
EUC-JP	諱呟ｻ駕脅	11101011111000011101001011101100100011101011101110110010111011111011011010111100	ebe1d2ec8ebbb2efb6bc
UTF-8	諱呟ｻ駕脅	111010001010101110110001111001011001000110011111111011111011110110111011111010011010011110010101111010001000010010000101	e8abb1e5919fefbdbbe9a795e88485
UHC	諱??駕脅	1111110111001001001111110011111111001010101111011111101011110110	fdc93f3fcabdfaf6

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)