Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???^?	0011111100111111001111110101111000111111	3f3f3f5e3f
SJIS-WIN	貅先亜^踞	111001101011101010010000111001101000100010011111010111101110011011110101	e6ba90e6889f5ee6f5
EUC-JP	貅先亜^踞	111011001011110011000000111010001011000010100001010111101110110011110111	ecbcc0e8b0a15eecf7
UTF-8	貅先亜^踞	11101000101100101000010111100101100001011000100011100100101110101001110001011110111010001011100010011110	e8b285e58588e4ba9c5ee8b89e
UHC	?先?^踞	00111111111000001011101100111111010111101100101111100110	3fe0bb3f5ecbe6

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)