Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??	0011111100111111	3f3f
SJIS-WIN	禪伸	11100010010101111001000001001100	e257904c
EUC-JP	禪伸	11100011101110001011111110101101	e3b8bfad
UTF-8	禪伸	111001111010011010101010111001001011110010111000	e7a6aae4bcb8
UHC	禪伸	11100000110010011110001111011111	e0c9e3df

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)