Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	±²vB	10110001101100100111011001000010	b1b27642
SJIS-WIN	±?vB	1000000101111101001111110111011001000010	817d3f7642
EUC-JP	±?vB	1010000111011110001111110111011001000010	a1de3f7642
UTF-8	±²vB	110000101011000111000010101100100111011001000010	c2b1c2b27642
UHC	±²vB	101000011011111010101001111101110111011001000010	a1bea9f77642

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)