Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	ﾂ青／ﾂ杞	1100001010010000110000101000000101011110110000101001111001011000	c290c2815ec29e58
EUC-JP	ﾂ青／ﾂ杞	10001110110000101100000011000100101000011011111110001110110000101101101110111001	8ec2c0c4a1bf8ec2dbb9
UTF-8	ﾂ青／ﾂ杞	111011111011111010000010111010011001110110010010111011111011110010001111111011111011111010000010111001101001110110011110	efbe82e99d92efbc8fefbe82e69d9e
UHC	??／?杞	00111111001111111010001110101111001111111101000110100011	3f3fa3af3fd1a3

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)