Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	諷りｷ墅･谿	11100110100001011000001011101000101101111001101011001110101001011110011010101110	e68582e8b79acea5e6ae
EUC-JP	諷りｷ墅･谿	111010111110010110100100111010101000111010110111110101001101000010001110101001011110110010110000	ebe5a4ea8eb7d4d08ea5ecb0
UTF-8	諷りｷ墅･谿	111010001010101110110111111000111000001010001010111011111011110110110111111001011010001010000101111011111011110110100101111010001011000010111111	e8abb7e3828aefbdb7e5a285efbda5e8b0bf
UHC	諷り?墅?谿	11111001101001001010101011101010001111111101111111101010001111111100110110101100	f9a4aaea3fdfea3fcdac

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)