Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??	0011111100111111	3f3f
SJIS-WIN	沿倭	10001001100010001001100001100000	89889860
EUC-JP	沿倭	10110001111010001100111111000001	b1e8cfc1
UTF-8	沿倭	111001101011001010111111111001011000000010101101	e6b2bfe580ad
UHC	沿倭	11100110110011011110100011011110	e6cde8de

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)