Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????B	0011111100111111001111110011111101000010	3f3f3f3f42
SJIS-WIN	諸?諸?B	10001111100101000011111110001111100101000011111101000010	8f943f8f943f42
EUC-JP	諸?諸?B	10111101111101000011111110111101111101000011111101000010	bdf43fbdf43f42
UTF-8	諸완諸완B	11101000101010111011100011101100100110011000010011101000101010111011100011101100100110011000010001000010	e8abb8ec9984e8abb8ec998442
UHC	諸완諸완B	111100001011001110111111110011111111000010110011101111111100111101000010	f0b3bfcff0b3bfcf42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)