Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???	001111110011111100111111	3f3f3f
SJIS-WIN	宍執蛇	100011101011001110001110101101111000111011010110	8eb38eb78ed6
EUC-JP	宍執蛇	101111001011010110111100101110011011110011011000	bcb5bcb9bcd8
UTF-8	宍執蛇	111001011010111010001101111001011001111110110111111010001001101110000111	e5ae8de59fb7e89b87
UHC	?執蛇	0011111111110010111110111101111011101111	3ff2fbdeef

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)