Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??U???	001111110011111101010101001111110011111100111111	3f3f553f3f3f
SJIS-WIN	障?U?矜?	1000111111100001001111110101010100111111111000011110000000111111	8fe13f553fe1e03f
EUC-JP	障?U勖矜汶	101111101110001100111111010101011000111110110011111011011110001011100010100011111100011011100101	bee33f558fb3ede2e28fc6e5
UTF-8	障렚U勖矜汶	11101001100110101001110011101011101000001001101001010101111001011000101110010110111001111001111110011100111001101011000110110110	e99a9ceba09a55e58b96e79f9ce6b1b6
UHC	障렚U勖矜汶	1110111010100001100011101010110101010101111010011110110111010000111010001101101010100001	eea18ead55e9edd0e8daa1

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)