Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	ﾀﾏﾀ闖ｰ涇	1100000011001111110000001110100010001111101100001111101011111011	c0cfc0e88fb0fafb
EUC-JP	ﾀﾏﾀ闖ｰ涇	10001110110000001000111011001111100011101100000011101111111011111000111010110000100011111100011111000111	8ec08ecf8ec0efef8eb08fc7c7
UTF-8	ﾀﾏﾀ闖ｰ涇	111011111011111010000000111011111011111010001111111011111011111010000000111010011001011110010110111011111011110110110000111001101011011010000111	efbe80efbe8fefbe80e99796efbdb0e6b687
UHC	???闖?涇	0011111100111111001111111111011111100110001111111100110011011100	3f3f3ff7e63fccdc

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)