Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	霑ﾒ寬ｽ辞写	11101000101111111101001011111010101010101011110110001110101010111000111011001010	e8bfd2faaabd8eab8eca
EUC-JP	霑ﾒ?ｽ辞写	1111000011000001100011101101001000111111100011101011110110111100101011011011110011001100	f0c18ed23f8ebdbcadbccc
UTF-8	霑ﾒ寬ｽ辞写	111010011001110010010001111011111011111010010010111001011010111110101100111011111011110110111101111010001011111010011110111001011000011010011001	e99c91efbe92e5afacefbdbde8be9ee58699
UHC	霑?寬???	1110111111000101001111111100111010110000001111110011111100111111	efc53fceb03f3f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)