Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	營??夷ら．	10011010011110100011111100111111100010001100111010000010111001111000000101000100	9a7a3f3f88ce82e78144
EUC-JP	營??夷ら．	11010011110110110011111100111111101100001101000010100100111010011010000110100101	d3db3f3fb0d0a4e9a1a5
UTF-8	營뚯궠夷ら．	111001111000011110011111111010111001101010101111111010101011011010100000111001011010010010110111111000111000001010001001111011111011110010001110	e7879feb9aafeab6a0e5a4b7e38289efbc8e
UHC	營뚯궠夷ら．	111001111011110110001100111011001000001010110011111011001010100010101010111010011010001110101110	e7bd8cec82b3eca8aae9a3ae

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)