Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?h?WB	0011111101101000001111110101011101000010	3f683f5742
SJIS-WIN	巽h巽WB	10010010010001100110100010010010010001100101011101000010	92466892465742
EUC-JP	巽h巽WB	11000011101001110110100011000011101001110101011101000010	c3a768c3a75742
UTF-8	巽h巽WB	111001011011011110111101011010001110010110110111101111010101011101000010	e5b7bd68e5b7bd5742
UHC	巽h巽WB	11100001110111100110100011100001110111100101011101000010	e1de68e1de5742

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)