Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	也よ???	10010110111001111000001011100110001111110011111100111111	96e782e63f3f3f
EUC-JP	也よ???	11001100111010011010010011101000001111110011111100111111	cce9a4e83f3f3f
UTF-8	也よ뇮呂멊	111001001011100110011111111000111000001010001000111010111000011110101110111011111010011010000000111010111010100110001010	e4b99fe38288eb87aeefa680eba98a
UHC	也よ뇮呂멊	11100101101001011010101011101000100001111001001111100101111110111001000101000010	e5a5aae88793e5fb9142

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)