Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??d???	001111110011111101100100001111110011111100111111	3f3f643f3f3f
SJIS-WIN	旭?d旭?除	100010001010111000111111011001001000100010101110001111111000111110011100	88ae3f6488ae3f8f9c
EUC-JP	旭?d旭?除	101100001011000000111111011001001011000010110000001111111011110111111100	b0b03f64b0b03fbdfc
UTF-8	旭렔d旭렔除	11100110100101111010110111101011101000001001010001100100111001101001011110101101111010111010000010010100111010011001100110100100	e697adeba09464e697adeba094e999a4
UHC	旭렔d旭렔除	1110100111101111100011101010100101100100111010011110111110001110101010011111000010110110	e9ef8ea964e9ef8ea9f0b6

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)