Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????C	0011111100111111001111110011111101000011	3f3f3f3f43
SJIS-WIN	湲?諸￡C	1001111111010001001111111000111110010100100000011001001001000011	9fd13f8f94819243
EUC-JP	湲?諸£C	1101111011010011001111111011110111110100101000011111001001000011	ded33fbdf4a1f243
UTF-8	湲렣諸￡C	11100110101110011011001011101011101000001010001111101000101010111011100011101111101111111010000101000011	e6b9b2eba0a3e8abb8efbfa143
UHC	湲렣諸￡C	111010101011100010001110101101001111000010110011101000011100110001000011	eab88eb4f0b3a1cc43

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)