Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	遯医Ι繪｡蜴	1110011110101010100010001110001110000011101001111110001110001001101000011110010110001110	e7aa88e383a7e389a1e58e
EUC-JP	遯医Ι繪｡蜴	111011101010110010110000111001011010011010101001111001011110100110001110101000011110100111101110	eeacb0e5a6a9e5e98ea1e9ee
UTF-8	遯医Ι繪｡蜴	1110100110000001101011111110010110001100101110111100111010011001111001111011100110101010111011111011110110100001111010001001110010110100	e981afe58cbbce99e7b9aaefbda1e89cb4
UHC	遯?Ι繪??	110101001110111000111111101001011100100111111100111010110011111100111111	d4ee3fa5c9fceb3f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)