Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	?攀?淀?瓠	001111111001110110110011001111111001011110000100001111111110000101000000	3f9db33f97843fe140
EUC-JP	澔攀?淀?瓠	1000111111001000111011001101101010110101001111111100110111100100001111111110000110100001	8fc8ecdab53fcde43fe1a1
UTF-8	澔攀욤淀렪瓠	111001101011111010010100111001101001010010000000111011001001101010100100111001101011011110000000111010111010000010101010111001111001001110100000	e6be94e69480ec9aa4e6b780eba0aae793a0
UHC	澔攀욤淀렪瓠	111110111100101111011010111001111011111111101000111011111110001110001110101110001111101111010010	fbcbdae7bfe8efe38eb8fbd2

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)