Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???B	00111111001111110011111101000010	3f3f3f42
SJIS-WIN	蟲衰疑B	11100101101100111001000010001010100010110101111001000010	e5b3908a8b5e42
EUC-JP	蟲衰疑B	11101010101101011011111111101010101101011011111101000010	eab5bfeab5bf42
UTF-8	蟲衰疑B	11101000100111111011001011101000101000011011000011100111100101101001000101000010	e89fb2e8a1b0e7969142
UHC	蟲衰疑B	11110101111110011110000111110001111010111111011101000010	f5f9e1f1ebf742

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)