Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	櫻??蟹?域	100111110100111000111111001111111000101001001001001111111000100011100110	9f4e3f3f8a493f88e6
EUC-JP	櫻??蟹?域	110111011010111100111111001111111011001110101010001111111011000011101000	ddaf3f3fb3aa3fb0e8
UTF-8	櫻뗣굜蟹섆域	111001101010101110111011111010111001011110100011111010101011010110011100111010001001111110111001111011001000010010000110111001011001111110011111	e6abbbeb97a3eab59ce89fb9ec8486e59f9f
UHC	櫻뗣굜蟹섆域	111001011010000110001011111000111000001010000100111110101010111110011000111001001110011010110100	e5a18be38284faaf98e4e6b4

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)