Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??	0011111100111111	3f3f
SJIS-WIN	癬逝	11100001100111011001000011000000	e19d90c0
EUC-JP	癬逝	11100001111111011100000011000010	e1fdc0c2
UTF-8	癬逝	111001111001100110101100111010011000000010011101	e799ace9809d
UHC	癬逝	11100000110010001110000010100110	e0c8e0a6

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)