Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????????????????	00111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f
SJIS-WIN	褥?∥意??矣??獄??違??受??億	111001011111000100111111100000010110000110001000110100110011111100111111111000011110000100111111001111111000110110010110001111110011111110001000111000010011111100111111100011101111001100111111001111111000100110101101	e5f13f816188d33f3fe1e13f3f8d963f3f88e13f3f8ef33f3f89ad
EUC-JP	褥?‖意??矣??獄??違??受??億	111010101111001100111111101000011100001010110000110101010011111100111111111000101110001100111111001111111011100111110110001111110011111110110000111000110011111100111111101111001111010100111111001111111011001010101111	eaf33fa1c2b0d53f3fe2e33f3fb9f63f3fb0e33f3fbcf53f3fb2af
UTF-8	褥띕∥意덌쭏矣꾨쭔獄쎼렞違뗧뮫受꿸데億	111010001010010010100101111010111001110110010101111000101000100010100101111001101000010010001111111010111000110110001100111011001010110110001111111001111001111110100011111010101011111010101000111011001010110110010100111001111000110110000100111011001000111010111100111010111010000010011110111010011000000110010101111010111001011110100111111010111010111010101011111001011000111110010111111010101011111110111000111010111000110110110000111001011000010010000100	e8a4a5eb9d95e288a5e6848feb8d8cecad8fe79fa3eabea8ecad94e78d84ec8ebceba09ee98195eb97a7ebaeabe58f97eabfb8eb8db0e58484
UHC	褥띕∥意덌쭏矣꾨쭔獄쎼렞違뗧뮫受꿸데億	1110100110110011101101101110101110100001101010111110101111110010100010001110111110100111100010001110101111111000100001001110101110100111100011001110100010101011100110111110001110001110101011111110101011011110100010111110011110010010101101011110000111110100101100101110101010110101101001011110010111100010	e9b3b6eba1abebf288efa788ebf884eba78ce8ab9be38eafeade8be792b5e1f4b2eab5a5e5e2

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)