Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?®?U	00111111101011100011111101010101	3fae3f55
SJIS-WIN	諺??U	1000110010111111001111110011111101010101	8cbf3f3f55
EUC-JP	諺®?U	10111000110000011000111110100010111011100011111101010101	b8c18fa2ee3f55
UTF-8	諺®윮U	111010001010101110111010110000101010111011101100100111001010111001010101	e8abbac2aeec9cae55
UHC	諺®윮U	11100101111011001010001011100111100111111010110101010101	e5eca2e79fad55

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)