Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????M^	001111110011111100111111001111110100110101011110	3f3f3f3f4d5e
SJIS-WIN	質鴆自M^	11110000110000001000111010111111111010011110111110001110101010010100110101011110	f0c08ebfe9ef8ea94d5e
EUC-JP	?質鴆自M^	001111111011110011000001111100101111000110111100101010110100110101011110	3fbcc1f2f1bcab4d5e
UTF-8	質鴆自M^	1110111010000001101111111110100010110011101010101110100110110100100001101110100010000111101010100100110101011110	ee81bfe8b3aae9b486e887aa4d5e
UHC	?質?自M^	0011111111110010111101010011111111101101101110110100110101011110	3ff2f53fedbb4d5e

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)