Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	????薔?	00111111001111110011111100111111111001010100101100111111	3f3f3f3fe54b3f
EUC-JP	勖?勖?薔?	1000111110110011111011010011111110001111101100111110110100111111111010011010110000111111	8fb3ed3f8fb3ed3fe9ac3f
UTF-8	勖렓勖렓薔멱	111001011000101110010110111010111010000010010011111001011000101110010110111010111010000010010011111010001001011010010100111010111010100110110001	e58b96eba093e58b96eba093e89694eba9b1
UHC	勖렓勖렓薔멱	111010011110110110001110101010001110100111101101100011101010100011101101111110011011100011101000	e9ed8ea8e9ed8ea8edf9b8e8

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)