Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	é§ì±YB	1110100110100111101011011110110010110001100011100101100101000010	e9a7adecb18e5942
SJIS-WIN	?§??±?YB	00111111100000011001100000111111001111111000000101111101001111110101100101000010	3f81983f3f817d3f5942
EUC-JP	é§?ì±?YB	1000111110101011101100011010000111111000001111111000111110101011110000001010000111011110001111110101100101000010	8fabb1a1f83f8fabc0a1de3f5942
UTF-8	é§ì±YB	1100001110101001110000101010011111000010101011011100001110101100110000101011000111000010100011100101100101000010	c3a9c2a7c2adc3acc2b1c28e5942
UHC	?§?±?YB	0011111110100001110101111010000110101001001111111010000110111110001111110101100101000010	3fa1d7a1a93fa1be3f5942

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)