Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	ðÁÔä°¶	111100001100000111010100111001001011000010110110	f0c1d4e4b0b6
SJIS-WIN	????°¶	0011111100111111001111110011111110000001100010111000000111110111	3f3f3f3f818b81f7
EUC-JP	ðÁÔä°¶	10001111101010011100001110001111101010101010000110001111101010101101010010001111101010111010001110100001111010111010001011111001	8fa9c38faaa18faad48faba3a1eba2f9
UTF-8	ðÁÔä°¶	110000111011000011000011100000011100001110010100110000111010010011000010101100001100001010110110	c3b0c381c394c3a4c2b0c2b6
UHC	ð???°¶	101010011010001100111111001111110011111110100001110001101010001011010010	a9a33f3f3fa1c6a2d2

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)