Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????A	001111110011111100111111001111110011111101000001	3f3f3f3f3f41
SJIS-WIN	淨?制經?A	100111111100010000111111100100001010011111100011010100110011111101000001	9fc43f90a7e3533f41
EUC-JP	淨?制經?A	110111101100011000111111110000001010100111100101101101000011111101000001	dec63fc0a9e5b43f41
UTF-8	淨렠制經썬A	11100110101101111010100011101011101000001010000011100101100010001011011011100111101101101001001111101100100011011010110001000001	e6b7a8eba0a0e588b6e7b693ec8dac41
UHC	淨렠制經썬A	1110111111100100100011101011000111110000101001001100110011101000101111011110001101000001	efe48eb1f0a4cce8bde341

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)