Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????®	001111110011111100111111001111110011111110101110	3f3f3f3f3fae
SJIS-WIN	蔚?蘖?鴨?	100010010101010100111111100111110101000000111111100010101001101100111111	89553f9f503f8a9b3f
EUC-JP	蔚?蘖?鴨®	1011000110110110001111111101110110110001001111111011001111111011100011111010001011101110	b1b63fddb13fb3fb8fa2ee
UTF-8	蔚렎蘖렔鴨®	1110100010010100100110101110101110100000100011101110100010011000100101101110101110100000100101001110100110110100101010001100001010101110	e8949aeba08ee89896eba094e9b4a8c2ae
UHC	蔚렎蘖렔鴨®	111010101010010110001110101001001110010111101110100011101010100111100100111001011010001011100111	eaa58ea4e5ee8ea9e4e5a2e7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)