Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??{???	001111110011111101111011001111110011111100111111	3f3f7b3f3f3f
SJIS-WIN	郁?{煜?云	100010001110100000111111011110111111101101010101001111111000100101011101	88e83f7bfb553f895d
EUC-JP	郁?{煜?云	10110000111010100011111101111011100011111100100111111100001111111011000110111110	b0ea3f7b8fc9fc3fb1be
UTF-8	郁렪{煜렎云	11101001100000111000000111101011101000001010101001111011111001111000010110011100111010111010000010001110111001001011101010010001	e98381eba0aa7be7859ceba08ee4ba91
UHC	郁렪{煜렎云	1110100111110100100011101011100001111011111010011111001010001110101001001110100111110110	e9f48eb87be9f28ea4e9f6

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)