Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????B	001111110011111100111111001111110011111101000010	3f3f3f3f3f42
SJIS-WIN	逍第ｩ躯燈B	11100111100101101001000111100110101010011000101111101011100100111001010101000010	e79691e6a98beb939542
EUC-JP	逍第ｩ躯燈B	1110110111110110110000101110100010001110101010011011011011101101110001011111010101000010	edf6c2e88ea9b6edc5f542
UTF-8	逍第ｩ躯燈B	11101001100000001000110111100111101011001010110011101111101111011010100111101000101110101010111111100111100001111000100001000010	e9808de7acacefbda9e8baafe7878842
UHC	逍第??燈B	111000011100111011110000101011110011111100111111110101001111001101000010	e1cef0af3f3fd4f342

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)