Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	錺肯苦碍紕	11101000010001001000110101101101100010111110101010001010010101101110001101000010	e8448d6d8bea8a56e342
EUC-JP	錺肯苦碍紕	11101111101001011011100111001110101101101110110010110011101101111110010110100011	efa5b9ceb6ecb3b7e5a3
UTF-8	錺肯苦碍紕	111010011000110010111010111010001000001010101111111010001000101110100110111001111010001010001101111001111011010010010101	e98cbae882afe88ba6e7a28de7b495
UHC	?肯苦碍?	0011111111010000111010011100110111001000111001001111010000111111	3fd0e9cdc8e4f43f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)