Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??	0011111100111111	3f3f
SJIS-WIN	?∠	001111111000000111011010	3f81da
EUC-JP	荑∠	1000111111010111111110011010001011011100	8fd7f9a2dc
UTF-8	荑∠	111010001000110110010001111000101000100010100000	e88d91e288a0
UHC	荑∠	11101100101111111010000111010000	ecbfa1d0

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)