Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	闢∝現ﾎ	11101000100100111000000111100101100011001011101111001110	e89381e58cbbce
EUC-JP	闢∝現ﾎ	1110111111110011101000101110011110111000101111011000111011001110	eff3a2e7b8bd8ece
UTF-8	闢∝現ﾎ	111010011001011110100010111000101000100010011101111001111000111110111110111011111011111010001110	e997a2e2889de78fbeefbe8e
UHC	闢∝現?	11011100101000111010000111110000111110101101111000111111	dca3a1f0fade3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)