Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	蝪九ｈ塚稗	11100101101000011000101111100011100000101000100011111010100111001001010101000010	e5a18be38288fa9c9542
EUC-JP	蝪九ｈ?稗	111010101010001110110110111001011010001111101000001111111100100110100011	eaa3b6e5a3e83fc9a3
UTF-8	蝪九ｈ塚稗	111010001001110110101010111001001011100110011101111011111011110110001000111011111010100010010000111001111010100010010111	e89daae4b99defbd88efa890e7a897
UHC	?九ｈ?稗	0011111111001110111110101010001111101000001111111111100010101101	3fcefaa3e83ff8ad

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)