Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	瞽霙ﾚﾜ	111000011101101011101000110000101101101011011100	e1dae8c2dadc
EUC-JP	瞽霙ﾚﾜ	1110001011011100111100001100010010001110110110101000111011011100	e2dcf0c48eda8edc
UTF-8	瞽霙ﾚﾜ	111001111001111010111101111010011001110010011001111011111011111010011010111011111011111010011100	e79ebde99c99efbe9aefbe9c
UHC	?霙??	0011111111100111110011100011111100111111	3fe7ce3f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)