Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	獻霙ﾚﾜ	111000001101100111101000110000101101101011011100	e0d9e8c2dadc
EUC-JP	獻霙ﾚﾜ	1110000011011011111100001100010010001110110110101000111011011100	e0dbf0c48eda8edc
UTF-8	獻霙ﾚﾜ	111001111000110110111011111010011001110010011001111011111011111010011010111011111011111010011100	e78dbbe99c99efbe9aefbe9c
UHC	獻霙??	111110101100110011100111110011100011111100111111	facce7ce3f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)