Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	豈手∪ﾍ	11100110101011111000111011101000100000011011111011001101	e6af8ee881becd
EUC-JP	豈手∪ﾍ	1110110010110001101111001110101010100010110000001000111011001101	ecb1bceaa2c08ecd
UTF-8	豈手∪ﾍ	111010001011000110001000111001101000100110001011111000101000100010101010111011111011111010001101	e8b188e6898be288aaefbe8d
UHC	豈手∪?	11010001110000101110001010100010101000011111101000111111	d1c2e2a2a1fa3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)