Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	ﾂ曠ﾂ猷ﾂ殕	110000101001111001000100110000101001011101010001110000101001111101101100	c29e44c29751c29f6c
EUC-JP	ﾂ曠ﾂ猷ﾂ殕	100011101100001011011011101001011000111011000010110011011011001010001110110000101101110111001101	8ec2dba58ec2cdb28ec2ddcd
UTF-8	ﾂ曠ﾂ猷ﾂ殕	111011111011111010000010111001101001101110100000111011111011111010000010111001111000110010110111111011111011111010000010111001101010111010010101	efbe82e69ba0efbe82e78cb7efbe82e6ae95
UHC	?曠?猷??	0011111111001110110001110011111111101011101000110011111100111111	3fcec73feba33f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)