Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	÷¬ðím	1111011110101100111100001110110101101101	f7acf0ed6d
SJIS-WIN	÷￢??m	10000001100000001000000111001010001111110011111101101101	818081ca3f3f6d
EUC-JP	÷¬ðím	1010000111100000101000101100110010001111101010011100001110001111101010111011111101101101	a1e0a2cc8fa9c38fabbf6d
UTF-8	÷¬ðím	110000111011011111000010101011001100001110110000110000111010110101101101	c3b7c2acc3b0c3ad6d
UHC	÷?ð?m	10100001110000000011111110101001101000110011111101101101	a1c03fa9a33f6d

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)