Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????B	001111110011111100111111001111110011111101000010	3f3f3f3f3f42
SJIS-WIN	也?（??B	1001011011100111001111111000000101101001001111110011111101000010	96e73f81693f3f42
EUC-JP	也?（堉?B	11001100111010010011111110100001110010101000111110110111111111010011111101000010	cce93fa1ca8fb7fd3f42
UTF-8	也㏓（堉쟊B	11100100101110011001111111100011100011111001001111101111101111001000100011100101101000001000100111101100100111111000101001000010	e4b99fe38f93efbc88e5a089ec9f8a42
UHC	也㏓（堉쟊B	1110010110100101101001111110101110100011101010001110101110111100101000000100110001000010	e5a5a7eba3a8ebbca04c42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)