Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	銖先･雁ﾞ	1110011111110001100100001110011010100101100010101110010111011110	e7f190e6a58ae5de
EUC-JP	銖先･雁ﾞ	11101110111100111100000011101000100011101010010110110100111001111000111011011110	eef3c0e88ea5b4e78ede
UTF-8	銖先･雁ﾞ	111010011000101010010110111001011000010110001000111011111011110110100101111010011001101110000001111011111011111010011110	e98a96e58588efbda5e99b81efbe9e
UHC	銖先?雁?	1110001011000111111000001011101100111111111001001101001000111111	e2c7e0bb3fe4d23f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)