Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	渉ﾄ賣璽室	1000111111000010110001001110011011001100100011101010001110001110101110101111001010110101	8fc2c4e6cc8ea38ebaf2b5
EUC-JP	渉ﾄ賣璽室?	1011111011000100100011101100010011101100110011101011110010100101101111001011110000111111	bec48ec4eccebca5bcbc3f
UTF-8	渉ﾄ賣璽室	111001101011100010001001111011111011111010000100111010001011001110100011111001111001001010111101111001011010111010100100111011101000011110101100	e6b889efbe84e8b3a3e792bde5aea4ee87ac
UHC	??賣璽室?	001111110011111111011000111000111101111111011110111000111111100000111111	3f3fd8e3dfdee3f83f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)