Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??w??~	001111110011111101110111001111110011111101111110	3f3f773f3f7e
SJIS-WIN	鴆自w鴆自~	11101001111011111000111010101001011101111110100111101111100011101010100101111110	e9ef8ea977e9ef8ea97e
EUC-JP	鴆自w鴆自~	11110010111100011011110010101011011101111111001011110001101111001010101101111110	f2f1bcab77f2f1bcab7e
UTF-8	鴆自w鴆自~	1110100110110100100001101110100010000111101010100111011111101001101101001000011011101000100001111010101001111110	e9b486e887aa77e9b486e887aa7e
UHC	?自w?自~	0011111111101101101110110111011100111111111011011011101101111110	3fedbb773fedbb7e

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)