Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	âå²ê±¥	1110001011100101100011101011001011101010101011011011000110100101	e2e58eb2eaadb1a5
SJIS-WIN	??????±￥	00111111001111110011111100111111001111110011111110000001011111011000000110001111	3f3f3f3f3f3f817d818f
EUC-JP	âå??ê?±?	100011111010101110100100100011111010101110101001001111110011111110001111101010111011010000111111101000011101111000111111	8faba48faba93f3f8fabb43fa1de3f
UTF-8	âå²ê±¥	11000011101000101100001110100101110000101000111011000010101100101100001110101010110000101010110111000010101100011100001010100101	c3a2c3a5c28ec2b2c3aac2adc2b1c2a5
UHC	???²?±?	0011111100111111001111111010100111110111001111111010000110101001101000011011111000111111	3f3f3fa9f73fa1a9a1be3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)