Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	ﾂ督敬ﾂ督	1100001010010011110000101000110001101000110000101001001111000010	c293c28c68c293c2
EUC-JP	ﾂ督敬ﾂ督	10001110110000101100011011000100101101111100100110001110110000101100011011000100	8ec2c6c4b7c98ec2c6c4
UTF-8	ﾂ督敬ﾂ督	111011111011111010000010111001111001110110100011111001101001010110101100111011111011111010000010111001111001110110100011	efbe82e79da3e695acefbe82e79da3
UHC	?督敬?督	0011111111010100101111011100110011010111001111111101010010111101	3fd4bdccd73fd4bd

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)