Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????????????????	00111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f
SJIS-WIN	褥?∥意??儀??繹??異??受???	1110010111110001001111111000000101100001100010001101001100111111001111111000101101010110001111110011111111100011100010000011111100111111100010001101100100111111001111111000111011110011001111110011111100111111	e5f13f816188d33f3f8b563f3fe3883f3f88d93f3f8ef33f3f3f
EUC-JP	褥?‖意??儀??繹??異??受??獒	11101010111100110011111110100001110000101011000011010101001111110011111110110101101101110011111100111111111001011110100000111111001111111011000011011011001111110011111110111100111101010011111100111111100011111100101110111011	eaf33fa1c2b0d53f3fb5b73f3fe5e83f3fb0db3f3fbcf53f3f8fcbbb
UTF-8	褥띕∥意덌쭏儀숈춳繹먮씮異밭뮫受꿸데獒	111010001010010010100101111010111001110110010101111000101000100010100101111001101000010010001111111010111000110110001100111011001010110110001111111001011000010010000000111011001000100010001000111011001011011010110011111001111011100110111001111010111010100010101110111011001001010010101110111001111001010110110000111010111011000010101101111010111010111010101011111001011000111110010111111010101011111110111000111010111000110110110000111001111000110110010010	e8a4a5eb9d95e288a5e6848feb8d8cecad8fe58480ec8888ecb6b3e7b9b9eba8aeec94aee795b0ebb0adebaeabe58f97eabfb8eb8db0e78d92
UHC	褥띕∥意덌쭏儀숈춳繹먮씮異밭뮫受꿸데獒	1110100110110011101101101110101110100001101010111110101111110010100010001110111110100111100010001110101111110000100110011110110010101101100011111110011010111010100100001110101110011101101111111110110010110110101110011110011110010010101101011110000111110100101100101110101010110101101001011110100010100011	e9b3b6eba1abebf288efa788ebf099ecad8fe6ba90eb9dbfecb6b9e792b5e1f4b2eab5a5e8a3

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)