Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	涇ｽ邵樊ｸ	1111101011111011101111011110011110111000100111101110011010111000	fafbbde7b89ee6b8
EUC-JP	涇ｽ邵樊ｸ	1000111111000111110001111000111010111101111011101011101011011100111010001000111010111000	8fc7c78ebdeebadce88eb8
UTF-8	涇ｽ邵樊ｸ	111001101011011010000111111011111011110110111101111010011000001010110101111001101010100010001010111011111011110110111000	e6b687efbdbde982b5e6a88aefbdb8
UHC	涇?邵樊?	1100110011011100001111111110000111010000110110111110000000111111	ccdc3fe1d0dbe03f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)