Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	畯經?畯經	111110110110111111100011010100110011111111111011011011111110001101010011	fb6fe3533ffb6fe353
EUC-JP	畯經?畯經	1000111111001101101110111110010110110100001111111000111111001101101110111110010110110100	8fcdbbe5b43f8fcdbbe5b4
UTF-8	畯經툐畯經	111001111001010110101111111001111011011010010011111011011000100010010000111001111001010110101111111001111011011010010011	e795afe7b693ed8890e795afe7b693
UHC	畯經툐畯經	11110001111000011100110011101000110001011111010011110001111000011100110011101000	f1e1cce8c5f4f1e1cce8

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)