Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	掌??愼?	10001111101101100011111100111111100111001100010000111111	8fb63f3f9cc43f
EUC-JP	掌??愼?	10111110101110000011111100111111110110001100011000111111	beb83f3fd8c63f
UTF-8	掌쿡췹愼렩	111001101000111010001100111011001011111110100001111011001011011110111001111001101000010010111100111010111010000010101001	e68e8cecbfa1ecb7b9e684bceba0a9
UHC	掌쿡췹愼렩	11101101111001101100010011101110110000111110111111100011111001011000111010110111	ede6c4eec3efe3e58eb7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)