Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	ë¬±nëB	1110101110101100101100010110111011101011101011011001000101000010	ebacb16eebad9142
SJIS-WIN	?￢±n???B	00111111100000011100101010000001011111010110111000111111001111110011111101000010	3f81ca817d6e3f3f3f42
EUC-JP	ë¬±në??B	1000111110101011101100111010001011001100101000011101111001101110100011111010101110110011001111110011111101000010	8fabb3a2cca1de6e8fabb33f3f42
UTF-8	ë¬±nëB	1100001110101011110000101010110011000010101100010110111011000011101010111100001010101101110000101001000101000010	c3abc2acc2b16ec3abc2adc29142
UHC	??±n??B	00111111001111111010000110111110011011100011111110100001101010010011111101000010	3f3fa1be6e3fa1a93f42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)