Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???	001111110011111100111111	3f3f3f
SJIS-WIN	愈耿毒	100101101111101011100011110101001001001111000101	96fae3d493c5
EUC-JP	愈耿毒	110011001111110011100110110101101100011011000111	ccfce6d6c6c7
UTF-8	愈耿毒	111001101000010010001000111010001000000010111111111001101010111110010010	e68488e880bfe6af92
UHC	愈耿毒	111010101110111111001100111010101101010010111000	eaefccead4b8

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)