Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	遮射ｾ､	1000111011010101111100001010100010001110110010111011111010100100	8ed5f0a88ecbbea4
EUC-JP	遮?射ｾ､	101111001101011100111111101111001100110110001110101111101000111010100100	bcd73fbccd8ebe8ea4
UTF-8	遮射ｾ､	111010011000000110101110111011101000000110100111111001011011000010000100111011111011110110111110111011111011110110100100	e981aeee81a7e5b084efbdbeefbda4
UHC	遮?射??	11110011101101000011111111011110110100100011111100111111	f3b43fded23f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)