Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	ì°Ñæè§	111011001011000011010001111001101110100010100111	ecb0d1e6e8a7
SJIS-WIN	?°???§	0011111110000001100010110011111100111111001111111000000110011000	3f818b3f3f3f8198
EUC-JP	ì°Ñæè§	10001111101010111100000010100001111010111000111110101010110100001000111110101001110000011000111110101011101100101010000111111000	8fabc0a1eb8faad08fa9c18fabb2a1f8
UTF-8	ì°Ñæè§	110000111010110011000010101100001100001110010001110000111010011011000011101010001100001010100111	c3acc2b0c391c3a6c3a8c2a7
UHC	?°?æ?§	001111111010000111000110001111111010100110100001001111111010000111010111	3fa1c63fa9a13fa1d7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)