Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	ç¹zg	111001111011100110011010011110101000001101100111	e7b99a7a8367
SJIS-WIN	???z?g	001111110011111100111111011110100011111101100111	3f3f3f7a3f67
EUC-JP	ç??z?g	1000111110101011101011100011111100111111011110100011111101100111	8fabae3f3f7a3f67
UTF-8	ç¹zg	11000011101001111100001010111001110000101001101001111010110000101000001101100111	c3a7c2b9c29a7ac28367
UHC	?¹?z?g	00111111101010011111011000111111011110100011111101100111	3fa9f63f7a3f67

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)