Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	愕?惡愕	10011100101100010011111110011100101001101001110010110001	9cb13f9ca69cb1
EUC-JP	愕?惡愕	11011000101100110011111111011000101010001101100010110011	d8b33fd8a8d8b3
UTF-8	愕說惡愕	111001101000010010010101111010001010101010101010111001101000001110100001111001101000010010010101	e68495e8aaaae683a1e68495
UHC	愕說惡愕	1110010011000011111000001110001111100100110000101110010011000011	e4c3e0e3e4c2e4c3

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)