Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?C??	00111111010000110011111100111111	3f433f3f
SJIS-WIN	銖Cﾑﾁ	1110011111110001010000111101000111000001	e7f143d1c1
EUC-JP	銖Cﾑﾁ	11101110111100110100001110001110110100011000111011000001	eef3438ed18ec1
UTF-8	銖Cﾑﾁ	11101001100010101001011001000011111011111011111010010001111011111011111010000001	e98a9643efbe91efbe81
UHC	銖C??	1110001011000111010000110011111100111111	e2c7433f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)