Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????E	00111111001111110011111100111111001111110011111101000101	3f3f3f3f3f3f45
SJIS-WIN	ﾌ螢鳧闔ｻE	1111000010111001110011001110010110100011111010011110100011101000100011101011101101000101	f0b9cce5a3e9e8e88ebb45
EUC-JP	?ﾌ螢鳧闔ｻE	001111111000111011001100111010101010010111110010111010101110111111101110100011101011101101000101	3f8ecceaa5f2eaefee8ebb45
UTF-8	ﾌ螢鳧闔ｻE	11101110100000011011100011101111101111101000110011101000100111101010001011101001101100111010011111101001100101111001010011101111101111011011101101000101	ee81b8efbe8ce89ea2e9b3a7e99794efbdbb45
UHC	??螢鳧闔?E	00111111001111111111101110101011110111011100000011111001111011110011111101000101	3f3ffbabddc0f9ef3f45

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)