Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????B	001111110011111100111111001111110011111101000010	3f3f3f3f3f42
SJIS-WIN	錮溷､眼谿B	11100111111111001001111111100101101001001000101011100001111001101010111001000010	e7fc9fe5a48ae1e6ae42
EUC-JP	錮溷､眼谿B	1110111011111110110111101110011110001110101001001011010011100011111011001011000001000010	eefedee78ea4b4e3ecb042
UTF-8	錮溷､眼谿B	11101001100011001010111011100110101110101011011111101111101111011010010011100111100111001011110011101000101100001011111101000010	e98caee6bab7efbda4e79cbce8b0bf42
UHC	錮??眼谿B	110011011101000100111111001111111110010011010001110011011010110001000010	cdd13f3fe4d1cdac42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)