Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	霍玖挙蠎ｶ霍	1110100010110111100010111110100010001011100100111110010110111010101101101110100010110111	e8b78be88b93e5bab6e8b7
EUC-JP	霍玖挙蠎ｶ霍	111100001011100110110110111010101011010111110011111010101011110010001110101101101111000010111001	f0b9b6eab5f3eabc8eb6f0b9
UTF-8	霍玖挙蠎ｶ霍	111010011001110010001101111001111000111010010110111001101000110010011001111010001010000010001110111011111011110110110110111010011001110010001101	e99c8de78e96e68c99e8a08eefbdb6e99c8d
UHC	?玖????	00111111110011111011100000111111001111110011111100111111	3fcfb83f3f3f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)