Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	鬘鷺興	1110100110100001100011011110101110001011101110111111100111111011	e9a18deb8bbbf9fb
EUC-JP	鬘鷺興?	11110010101000111011101011101101101101101011110100111111	f2a3baedb6bd3f
UTF-8	鬘鷺興	111010011010110010011000111010011011011110111010111010001000100010001000111011101001110110010110	e9ac98e9b7bae88888ee9d96
UHC	?鷺興?	001111111101011011011100111111011110100100111111	3fd6dcfde93f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)