Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	èßå·½BF	1110100011011111100111001110010110110111101111010100001001000110	e8df9ce5b7bd4246
SJIS-WIN	??????BF	0011111100111111001111110011111100111111001111110100001001000110	3f3f3f3f3f3f4246
EUC-JP	èß?å??BF	1000111110101011101100101000111110101001110011100011111110001111101010111010100100111111001111110100001001000110	8fabb28fa9ce3f8faba93f3f4246
UTF-8	èßå·½BF	1100001110101000110000111001111111000010100111001100001110100101110000101011011111000010101111010100001001000110	c3a8c39fc29cc3a5c2b7c2bd4246
UHC	?ß??·½BF	0011111110101001101011000011111100111111101000011010010010101000111101100100001001000110	3fa9ac3f3fa1a4a8f64246

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)