Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	ë¬¨ë©\	11101011101011001010100011101011101010011001101101011100	ebaca8eba99b5c
SJIS-WIN	?￢¨???\	001111111000000111001010100000010100111000111111001111110011111101011100	3f81ca814e3f3f3f5c
EUC-JP	ë¬¨ë©?\	100011111010101110110011101000101100110010100001101011111000111110101011101100111000111110100010111011010011111101011100	8fabb3a2cca1af8fabb38fa2ed3f5c
UTF-8	ë¬¨ë©\	11000011101010111100001010101100110000101010100011000011101010111100001010101001110000101001101101011100	c3abc2acc2a8c3abc2a9c29b5c
UHC	??¨???\	0011111100111111101000011010011100111111001111110011111101011100	3f3fa1a73f3f3f5c

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)