Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??	0011111100111111	3f3f
SJIS-WIN	曙?	100011111000110000111111	8f8c3f
EUC-JP	曙渲	1011110111101100100011111100011111101100	bdec8fc7ec
UTF-8	曙渲	111001101001101110011001111001101011100010110010	e69b99e6b8b2
UHC	曙渲	11011111111101011110000011000010	dff5e0c2

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)