Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?W?z	00111111010101110011111101111010	3f573f7a
SJIS-WIN	辰W辰z	100100100100001101010111100100100100001101111010	92435792437a
EUC-JP	辰W辰z	110000111010010001010111110000111010010001111010	c3a457c3a47a
UTF-8	辰W辰z	1110100010111110101100000101011111101000101111101011000001111010	e8beb057e8beb07a
UHC	辰W辰z	111100101110001101010111111100101110001101111010	f2e357f2e37a

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)