Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	莨医オ紊	1110010010111100100010001110001110000011010010011110001101000011	e4bc88e38349e343
EUC-JP	莨医オ紊	1110100010111110101100001110010110100101101010101110010110100100	e8beb0e5a5aae5a4
UTF-8	莨医オ紊	111010001000111010101000111001011000110010111011111000111000001010101010111001111011010010001010	e88ea8e58cbbe382aae7b48a
UHC	??オ紊	001111110011111110101011101010101101101010100010	3f3fabaadaa2

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)