Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	æú¸û¯§\	11100110111110101011100011111011101011111010011101011100	e6fab8fbafa75c
SJIS-WIN	?????§\	0011111100111111001111110011111100111111100000011001100001011100	3f3f3f3f3f81985c
EUC-JP	æú¸û¯§\	100011111010100111000001100011111010101111100010100011111010001010110001100011111010101111100101100011111010001010110100101000011111100001011100	8fa9c18fabe28fa2b18fabe58fa2b4a1f85c
UTF-8	æú¸û¯§\	11000011101001101100001110111010110000101011100011000011101110111100001010101111110000101010011101011100	c3a6c3bac2b8c3bbc2afc2a75c
UHC	æ?¸??§\	10101001101000010011111110100010101011000011111100111111101000011101011101011100	a9a13fa2ac3f3fa1d75c

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)