Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??	0011111100111111	3f3f
SJIS-WIN	五映	10001100110111001000100101100110	8cdc8966
EUC-JP	五映	10111000110111101011000111000111	b8deb1c7
UTF-8	五映	111001001011101010010100111001101001100010100000	e4ba94e698a0
UHC	五映	11100111111010011110011110110001	e7e9e7b1

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)