Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??§	001111110011111110100111	3f3fa7
SJIS-WIN	鉗崔§	111001111110011110011011110000011000000110011000	e7e79bc18198
EUC-JP	鉗崔§	111011101110100111010110110000111010000111111000	eee9d6c3a1f8
UTF-8	鉗崔§	1110100110001001100101111110010110110100100101001100001010100111	e98997e5b494c2a7
UHC	鉗崔§	110011001100011011110101110010111010000111010111	ccc6f5cba1d7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)