Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????^	001111110011111100111111001111110011111101011110	3f3f3f3f3f5e
SJIS-WIN	闕醍ｴ霊惠^	11101000100011011001000111100111101101001001011111101100100111001010100001011110	e88d91e7b497ec9ca85e
EUC-JP	闕醍ｴ霊惠^	1110111111101101110000101110100110001110101101001100111011101110110110001010101001011110	efedc2e98eb4ceeed8aa5e
UTF-8	闕醍ｴ霊惠^	11101001100101111001010111101001100001101000110111101111101111011011010011101001100111001000101011100110100000111010000001011110	e99795e9868defbdb4e99c8ae683a05e
UHC	闕醍??惠^	110011111111010011110000101101010011111100111111111110111011001101011110	cff4f0b53f3ffbb35e

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)