Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	襪医珪糘	1110011001000011100010001110001110001100010111011110001011110010	e64388e38c5de2f2
EUC-JP	襪医珪糘	1110101110100100101100001110010110110111101111101110010011110100	eba4b0e5b7bee4f4
UTF-8	襪医珪糘	111010001010010110101010111001011000110010111011111001111000111110101010111001111011001110011000	e8a5aae58cbbe78faae7b398
UHC	襪?珪?	110110001100101000111111110100001010100000111111	d8ca3fd0a83f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)