Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	霆?鬱??	11101000101110110011111110011111010101000011111100111111	e8bb3f9f543f3f
EUC-JP	霆?鬱??	11110000101111010011111111011101101101010011111100111111	f0bd3fddb53f3f
UTF-8	霆렪鬱렗諪	111010011001110010000110111010111010000010101010111010011010110010110001111010111010000010010111111010001010101110101010	e99c86eba0aae9acb1eba097e8abaa
UHC	霆렪鬱렗諪	11101111111111011000111010111000111010101010011010001110101011001110111111110101	effd8eb8eaa68eaceff5

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)