Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	ðùÌ´Þ±	11110000111110011000111111001100101101001101111010110001	f0f98fccb4deb1
SJIS-WIN	????´?±	001111110011111100111111001111111000000101001100001111111000000101111101	3f3f3f3f814c3f817d
EUC-JP	ðù?Ì´Þ±	1000111110101001110000111000111110101011111000110011111110001111101010101100000010100001101011011000111110101001101100001010000111011110	8fa9c38fabe33f8faac0a1ad8fa9b0a1de
UTF-8	ðùÌ´Þ±	1100001110110000110000111011100111000010100011111100001110001100110000101011010011000011100111101100001010110001	c3b0c3b9c28fc38cc2b4c39ec2b1
UHC	ð???´Þ±	1010100110100011001111110011111100111111101000101010010110101000101011011010000110111110	a9a33f3f3fa2a5a8ada1be

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)