Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	鏃?蹄?棕鞨	11101000010101100011111110010010111110110011111110011110101000011110100011100000	e8563f92fb3f9ea1e8e0
EUC-JP	鏃?蹄?棕鞨	11101111101101110011111111000100111111010011111111011100101000111111000011100010	efb73fc4fd3fdca3f0e2
UTF-8	鏃렎蹄렚棕鞨	111010011000111110000011111010111010000010001110111010001011100110000100111010111010000010011010111001101010001110010101111010011001111010101000	e98f83eba08ee8b984eba09ae6a395e99ea8
UHC	鏃렎蹄렚棕鞨	111100001110110010001110101001001111000010110100100011101010110111110000111101111100101011101010	f0ec8ea4f0b48eadf0f7caea

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)