Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	淨?低唐	10011111110001000011111110010010111000011001001110000010	9fc43f92e19382
EUC-JP	淨?低唐	11011110110001100011111111000100111000111100010111100010	dec63fc4e3c5e2
UTF-8	淨렠低唐	111001101011011110101000111010111010000010100000111001001011110110001110111001011001010010010000	e6b7a8eba0a0e4bd8ee59490
UHC	淨렠低唐	1110111111100100100011101011000111101110101110001101001111010000	efe48eb1eeb8d3d0

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)