Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	焄難ｾ常	11111011010101001001001111101111101111101000111111101101	fb5493efbe8fed
EUC-JP	焄難ｾ常	100011111100100111100011110001101111000110001110101111101011111011101111	8fc9e3c6f18ebebeef
UTF-8	焄難ｾ常	111001111000010010000100111010011001101110100011111011111011110110111110111001011011100010111000	e78484e99ba3efbdbee5b8b8
UHC	焄難?常	11111101101101101101000111110001001111111101111111001000	fdb6d1f13fdfc8

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)