Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	災?佇?貞	1000110111010000001111111001100011001000001111111001001011100101	8dd03f98c83f92e5
EUC-JP	災?佇?貞	1011101011010010001111111101000011001010001111111100010011100111	bad23fd0ca3fc4e7
UTF-8	災렧佇렧貞	111001111000000110111101111010111010000010100111111001001011110110000111111010111010000010100111111010001011001010011110	e781bdeba0a7e4bd87eba0a7e8b29e
UHC	災렧佇렧貞	11101110101011001000111010110110111011101011011110001110101101101110111111110110	eeac8eb6eeb78eb6eff6

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)