Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	螢ｯ竏夛ｶ械	11100101101000111010111111100010100010001001101011101010101101101000101001000010	e5a3afe2889aeab68a42
EUC-JP	螢ｯ竏夛ｶ械	111010101010010110001110101011111110001111101000110101001110110010001110101101101011001110100011	eaa58eafe3e8d4ec8eb6b3a3
UTF-8	螢ｯ竏夛ｶ械	111010001001111010100010111011111011110110101111111001111010101110001111111001011010010010011011111011111011110110110110111001101010001010110000	e89ea2efbdafe7ab8fe5a49befbdb6e6a2b0
UHC	螢????械	1111101110101011001111110011111100111111001111111100110011111110	fbab3f3f3f3fccfe

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)