Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????H	001111110011111100111111001111110011111101001000	3f3f3f3f3f48
SJIS-WIN	症ﾇ爾炅漆H	10001111110001111100011110001110101000101111101101010001100011101011110101001000	8fc7c78ea2fb518ebd48
EUC-JP	症ﾇ爾炅漆H	101111101100100110001110110001111011110010100100100011111100100111001010101111001011111101001000	bec98ec7bca48fc9cabcbf48
UTF-8	症ﾇ爾炅漆H	11100111100101111000011111101111101111101000011111100111100010001011111011100111100000101000010111100110101111001000011001001000	e79787efbe87e788bee78285e6bc8648
UHC	症?爾炅漆H	11110001111110000011111111101100101100111100110011011101111101101101010001001000	f1f83fecb3ccddf6d448

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)