Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	壯??猥ο?	100110101110000100111111001111111110000011001110100000111100110100111111	9ae13f3fe0ce83cd3f
EUC-JP	壯??猥ο?	110101001110001100111111001111111110000011010000101001101100111100111111	d4e33f3fe0d0a6cf3f
UTF-8	壯좑풎猥ο쉑	1110010110100011101011111110110010100010100100011110110110010010100011101110011110001100101001011100111010111111111011001000100110010001	e5a3afeca291ed928ee78ca5cebfec8991
UHC	壯좑풎猥ο쉑	111011011110000010100000111011111011111010010010111010001110010110100101111011111011110110100111	ede0a0efbe92e8e5a5efbda7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)