Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????E	0011111100111111001111110011111101000101	3f3f3f3f45
SJIS-WIN	担竪嘆棚E	100100100101001110010010010001111001001001010001100100100100100101000101	925392479251924945
EUC-JP	担竪嘆棚E	110000111011010011000011101010001100001110110010110000111010101001000101	c3b4c3a8c3b2c3aa45
UTF-8	担竪嘆棚E	11100110100010111000010111100111101010111010101011100101100110001000011011100110101000111001101001000101	e68b85e7abaae59886e6a39a45
UHC	?竪嘆棚E	0011111111100010101101011111011110100011110111011101110001000101	3fe2b5f7a3dddc45

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)