Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????????[?????????[^	001111110011111100111111001111110011111100111111001111110011111100111111010110110011111100111111001111110011111100111111001111110011111100111111001111110101101101011110	3f3f3f3f3f3f3f3f3f5b3f3f3f3f3f3f3f3f3f5b5e
SJIS-WIN	???泣??醫??[???泣??醫??[^	00111111001111110011111110001011100000110011111100111111111001111100111000111111001111110101101100111111001111110011111110001011100000110011111100111111111001111100111000111111001111110101101101011110	3f3f3f8b833f3fe7ce3f3f5b3f3f3f8b833f3fe7ce3f3f5b5e
EUC-JP	???泣??醫??[???泣??醫??[^	00111111001111110011111110110101111000110011111100111111111011101101000000111111001111110101101100111111001111110011111110110101111000110011111100111111111011101101000000111111001111110101101101011110	3f3f3fb5e33f3feed03f3f5b3f3f3fb5e33f3feed03f3f5b5e
UTF-8	劣꾩쥜泣ㅷ뛾醫묒뒪[劣꾩쥜泣ㅷ뛾醫묒뒪[^	111011111010011010011101111010101011111010101001111011001010010110011100111001101011001110100011111000111000010110110111111010111001101110111110111010011000011010101011111010111010110010010010111010111001001010101010010110111110111110100110100111011110101010111110101010011110110010100101100111001110011010110011101000111110001110000101101101111110101110011011101111101110100110000110101010111110101110101100100100101110101110010010101010100101101101011110	efa69deabea9eca59ce6b3a3e385b7eb9bbee986abebac92eb92aa5befa69deabea9eca59ce6b3a3e385b7eb9bbee986abebac92eb92aa5b5e
UHC	劣꾩쥜泣ㅷ뛾醫묒뒪[劣꾩쥜泣ㅷ뛾醫묒뒪[^	111001101110101110000100111011001010001010010001111010111110100010100100111001111000110110000100111011001010001010010001111011001000101010100100010110111110011011101011100001001110110010100010100100011110101111101000101001001110011110001101100001001110110010100010100100011110110010001010101001000101101101011110	e6eb84eca291ebe8a4e78d84eca291ec8aa45be6eb84eca291ebe8a4e78d84eca291ec8aa45b5e

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)