Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	逶夜棣逞ｿ逶	1110011110011011100101101110100110011110101001101110011110010111101111111110011110011011	e79b96e99ea6e797bfe79b
EUC-JP	逶夜棣逞ｿ逶	111011011111101111001100111010111101110010101000111011011111011110001110101111111110110111111011	edfbccebdca8edf78ebfedfb
UTF-8	逶夜棣逞ｿ逶	111010011000000010110110111001011010010010011100111001101010001110100011111010011000000010011110111011111011110110111111111010011000000010110110	e980b6e5a49ce6a3a3e9809eefbdbfe980b6
UHC	?夜?逞??	0011111111100101101010000011111111010110110000010011111100111111	3fe5a83fd6c13f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)