Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?h?k	00111111011010000011111101101011	3f683f6b
SJIS-WIN	巽h巽k	100100100100011001101000100100100100011001101011	92466892466b
EUC-JP	巽h巽k	110000111010011101101000110000111010011101101011	c3a768c3a76b
UTF-8	巽h巽k	1110010110110111101111010110100011100101101101111011110101101011	e5b7bd68e5b7bd6b
UHC	巽h巽k	111000011101111001101000111000011101111001101011	e1de68e1de6b

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)