Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????B	0011111100111111001111110011111101000010	3f3f3f3f42
SJIS-WIN	甯失鴆自B	111110101010100010001110101110001110100111101111100011101010100101000010	faa88eb8e9ef8ea942
EUC-JP	甯失鴆自B	10001111110011011010101010111100101110101111001011110001101111001010101101000010	8fcdaabcbaf2f1bcab42
UTF-8	甯失鴆自B	11100111100101001010111111100101101001001011000111101001101101001000011011101000100001111010101001000010	e794afe5a4b1e9b486e887aa42
UHC	?失?自B	00111111111000111111011100111111111011011011101101000010	3fe3f73fedbb42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)