Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??d??	0011111100111111011001000011111100111111	3f3f643f3f
SJIS-WIN	鴆自d鴆自	111010011110111110001110101010010110010011101001111011111000111010101001	e9ef8ea964e9ef8ea9
EUC-JP	鴆自d鴆自	111100101111000110111100101010110110010011110010111100011011110010101011	f2f1bcab64f2f1bcab
UTF-8	鴆自d鴆自	11101001101101001000011011101000100001111010101001100100111010011011010010000110111010001000011110101010	e9b486e887aa64e9b486e887aa
UHC	?自d?自	00111111111011011011101101100100001111111110110110111011	3fedbb643fedbb

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)