Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??Wm	00111111001111110101011101101101	3f3f576d
SJIS-WIN	桒胱Wm	111110101110001111100011111101110101011101101101	fae3e3f7576d
EUC-JP	桒胱Wm	10001111110000111100100111100110111110010101011101101101	8fc3c9e6f9576d
UTF-8	桒胱Wm	1110011010100001100100101110100010000011101100010101011101101101	e6a192e883b1576d
UHC	?胱Wm	0011111111001110110011010101011101101101	3fcecd576d

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)