Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	?莎?蓑?篩	001111111110010010110011001111111001011010101010001111111110001010111111	3fe4b33f96aa3fe2bf
EUC-JP	蔣莎?蓑?篩	1000111111011001101101101110100010110101001111111100110010101100001111111110010011000001	8fd9b6e8b53fccac3fe4c1
UTF-8	蔣莎렍蓑렮篩	111010001001010010100011111010001000111010001110111010111010000010001101111010001001001110010001111010111010000010101110111001111010111110101001	e894a3e88e8eeba08de89391eba0aee7afa9
UHC	蔣莎렍蓑렮篩	111011011111100011011110111011011000111010100011110111101110111010001110101110111101111011101000	edf8deed8ea3deee8ebbdee8

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)