Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	巍曹汪俎	1001101111011001100100011000001010011111100010101001100011010111	9bd991829f8a98d7
EUC-JP	巍曹汪俎	1101011011011011110000011110001011011101111010101101000011011001	d6dbc1e2ddead0d9
UTF-8	巍曹汪俎	111001011011011110001101111001101001101110111001111001101011000110101010111001001011111110001110	e5b78de69bb9e6b1aae4bf8e
UHC	巍曹汪俎	1110100011100100111100001100011111101000110111001111000010111011	e8e4f0c7e8dcf0bb

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)