Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???h??	001111110011111100111111011010000011111100111111	3f3f3f683f3f
SJIS-WIN	巽脱孫h巽脱	1001001001000110100100100100010110010001101101110110100010010010010001101001001001000101	9246924591b76892469245
EUC-JP	巽脱孫h巽脱	1100001110100111110000111010011011000010101110010110100011000011101001111100001110100110	c3a7c3a6c2b968c3a7c3a6
UTF-8	巽脱孫h巽脱	11100101101101111011110111101000100001001011000111100101101011011010101101101000111001011011011110111101111010001000010010110001	e5b7bde884b1e5adab68e5b7bde884b1
UHC	巽?孫h巽?	111000011101111000111111111000011101110101101000111000011101111000111111	e1de3fe1dd68e1de3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)