Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	âÅSêTh	11100010110001011001110101010011111010100101010001101000	e2c59d53ea5468
SJIS-WIN	???S?Th	00111111001111110011111101010011001111110101010001101000	3f3f3f533f5468
EUC-JP	âÅ?SêTh	10001111101010111010010010001111101010101010100100111111010100111000111110101011101101000101010001101000	8faba48faaa93f538fabb45468
UTF-8	âÅSêTh	1100001110100010110000111000010111000010100111010101001111000011101010100101010001101000	c3a2c385c29d53c3aa5468
UHC	???S?Th	00111111001111110011111101010011001111110101010001101000	3f3f3f533f5468

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)