Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???	001111110011111100111111	3f3f3f
SJIS-WIN	聿乗畿	111000111110010010001111111001101000101101000101	e3e48fe68b45
EUC-JP	聿乗畿	111001101110011010111110111010001011010110100110	e6e6bee8b5a6
UTF-8	聿乗畿	111010001000000110111111111001001011100110010111111001111001010110111111	e881bfe4b997e795bf
UHC	聿?畿	1110101111010011001111111101000110110010	ebd33fd1b2

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)