Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	猶?〃鷹	10010111010100000011111110000001010101101001000111101001	97503f815691e9
EUC-JP	猶?〃鷹	11001101101100010011111110100001101101111100001011101011	cdb13fa1b7c2eb
UTF-8	猶욌〃鷹	111001111000110010110110111011001001101010001100111000111000000010000011111010011011011110111001	e78cb6ec9a8ce38083e9b7b9
UHC	猶욌〃鷹	1110101110100010100111101110101110100001101010001110101111101101	eba29eeba1a8ebed

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)