Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	ç®´û¯§	111001111010111010110100111110111010111110100111	e7aeb4fbafa7
SJIS-WIN	??´??§	0011111100111111100000010100110000111111001111111000000110011000	3f3f814c3f3f8198
EUC-JP	ç®´û¯§	10001111101010111010111010001111101000101110111010100001101011011000111110101011111001011000111110100010101101001010000111111000	8fabae8fa2eea1ad8fabe58fa2b4a1f8
UTF-8	ç®´û¯§	110000111010011111000010101011101100001010110100110000111011101111000010101011111100001010100111	c3a7c2aec2b4c3bbc2afc2a7
UHC	?®´??§	001111111010001011100111101000101010010100111111001111111010000111010111	3fa2e7a2a53f3fa1d7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)