Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	遮痔渉	1000111011010101100011101010010011110000110110011000111111000010	8ed58ea4f0d98fc2
EUC-JP	遮痔?渉	10111100110101111011110010100110001111111011111011000100	bcd7bca63fbec4
UTF-8	遮痔渉	111010011000000110101110111001111001011110010100111011101000001010011000111001101011100010001001	e981aee79794ee8298e6b889
UHC	遮痔??	111100111011010011110110110000000011111100111111	f3b4f6c03f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)