Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?k?S	00111111011010110011111101010011	3f6b3f53
SJIS-WIN	瞳k瞳S	100100111011010101101011100100111011010101010011	93b56b93b553
EUC-JP	瞳k瞳S	110001101011011101101011110001101011011101010011	c6b76bc6b753
UTF-8	瞳k瞳S	1110011110011110101100110110101111100111100111101011001101010011	e79eb36be79eb353
UHC	瞳k瞳S	110101001101101001101011110101001101101001010011	d4da6bd4da53

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)