Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	鬱蝎?竭	10011111010101001110010110011001001111111110001010010001	9f54e5993fe291
EUC-JP	鬱蝎?竭	11011101101101011110100111111001001111111110001111110001	ddb5e9f93fe3f1
UTF-8	鬱蝎렫竭	111010011010110010110001111010001001110110001110111010111010000010101011111001111010101110101101	e9acb1e89d8eeba0abe7abad
UHC	鬱蝎렫竭	1110101010100110110010101110100110001110101110011100101011100110	eaa6cae98eb9cae6

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)