Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????????????B	001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111101000010	3f3f3f3f3f3f3f3f3f3f3f3f3f3f42
SJIS-WIN	瘟??押??秧??鵝??倭?B	1110000110001001001111110011111110001001100111110011111100111111111000100101111000111111001111111110101001000000001111110011111110011000011000000011111101000010	e1893f3f899f3f3fe25e3f3fea403f3f98603f42
EUC-JP	瘟??押??秧??鵝??倭?B	1110000111101001001111110011111110110010101000010011111100111111111000111011111100111111001111111111001110100001001111110011111111001111110000010011111101000010	e1e93f3fb2a13f3fe3bf3f3ff3a13f3fcfc13f42
UTF-8	瘟룩큹押띄떥秧녘쥤鵝녶룴倭쟮B	11100111100110001001111111101011101000111010100111101101100000011011100111100110100010101011110011101011100111011000010011101011100101101010010111100111101001111010011111101011100001011001100011101100101001011010010011101001101101011001110111101011100001011011011011101011101000111011010011100101100000001010110111101100100111111010111001000010	e7989feba3a9ed81b9e68abceb9d84eb96a5e7a7a7eb8598eca5a4e9b59deb85b6eba3b4e580adec9fae42
UHC	瘟룩큹押띄떥秧녘쥤鵝녶룴倭쟮B	1110100010110000101101111110100010110100100010001110010011100011101101101110011110001011101110001110010011101011101100111110100010100010100101101110010010111101100001101110010110001111101010011110100011011110101000000110111001000010	e8b0b7e8b488e4e3b6e78bb8e4ebb3e8a296e4bd86e58fa9e8dea06e42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)