Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????????????????	00111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f
SJIS-WIN	褥?∥違??惟??閻??異??猷??猥	111001011111000100111111100000010110000110001000111000010011111100111111100010001101001000111111001111111110100010000101001111110011111110001000110110010011111100111111100101110101000100111111001111111110000011001110	e5f13f816188e13f3f88d23f3fe8853f3f88d93f3f97513f3fe0ce
EUC-JP	褥?‖違??惟??閻??異??猷??猥	111010101111001100111111101000011100001010110000111000110011111100111111101100001101010000111111001111111110111111100101001111110011111110110000110110110011111100111111110011011011001000111111001111111110000011010000	eaf33fa1c2b0e33f3fb0d43f3fefe53f3fb0db3f3fcdb23f3fe0d0
UTF-8	褥띕∥違얗윀惟㏓뎠閻롡뫁異듸쬅猷뱀삌猥	111010001010010010100101111010111001110110010101111000101000100010100101111010011000000110010101111011001001011010010111111011001001110010000000111001101000001110011111111000111000111110010011111010111000111010100000111010011001011010111011111010111010000110100001111010111010101110000001111001111001010110110000111010111001001110111000111011001010110010000101111001111000110010110111111010111011000110000000111011001000001010001100111001111000110010100101	e8a4a5eb9d95e288a5e98195ec9697ec9c80e6839fe38f93eb8ea0e996bbeba1a1ebab81e795b0eb93b8ecac85e78cb7ebb180ec828ce78ca5
UHC	褥띕∥違얗윀惟㏓뎠閻롡뫁異듸쬅猷뱀삌猥	1110100110110011101101101110101110100001101010111110101011011110101111101110100110011111100010111110101011101110101001111110101110110101101100011110011110100010100011101110001010010001101001011110110010110110101101011110111110100110100111001110101110100011101110011110110010011000100100111110100011100101	e9b3b6eba1abeadebee99f8beaeea7ebb5b1e7a28ee291a5ecb6b5efa69ceba3b9ec9893e8e5

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)