Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???BF	0011111100111111001111110100001001000110	3f3f3f4246
SJIS-WIN	ﾃ陛覚BF	11000011100101011100001110001010011011110100001001000110	c395c38a6f4246
EUC-JP	ﾃ陛覚BF	1000111011000011110010101100010110110011110100000100001001000110	8ec3cac5b3d04246
UTF-8	ﾃ陛覚BF	1110111110111110100000111110100110011001100110111110100010100110100110100100001001000110	efbe83e9999be8a69a4246
UHC	?陛?BF	001111111111100011001110001111110100001001000110	3ff8ce3f4246

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)