Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	褻奇ｦ御ｿ会	11100101111101101000101011101111101001101000110011100100101111111000100111101111	e5f68aefa68ce4bf89ef
EUC-JP	褻奇ｦ御ｿ会	111010101111100010110100111100011000111010100110101110001110011010001110101111111011001011110001	eaf8b4f18ea6b8e68ebfb2f1
UTF-8	褻奇ｦ御ｿ会	111010001010010010111011111001011010010110000111111011111011110110100110111001011011111010100001111011111011110110111111111001001011110010011010	e8a4bbe5a587efbda6e5bea1efbdbfe4bc9a
UHC	褻奇?御??	111000001110000111010000111101000011111111100101110110010011111100111111	e0e1d0f43fe5d93f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)