Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	螟ｱ驟檎粟閠	1110010110100100101100011110100110000101100011001110011110001000101111101110100010000000	e5a4b1e9858ce788bee880
EUC-JP	螟ｱ驟檎粟閠	111010101010011010001110101100011111000111100101101110001110100110110000110000001110111111100000	eaa68eb1f1e5b8e9b0c0efe0
UTF-8	螟ｱ驟檎粟閠	111010001001111010011111111011111011110110110001111010011010100110011111111001101010101010001110111001111011001010011111111010011001011010100000	e89e9fefbdb1e9a99fe6aa8ee7b29fe996a0
UHC	螟?驟檎粟?	11011001101011010011111111110110101011101101000011010101111000011101100000111111	d9ad3ff6aed0d5e1d83f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)