Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??\??	0011111100111111010111000011111100111111	3f3f5c3f3f
SJIS-WIN	駭?\駭?	11101001011011100011111101011100111010010110111000111111	e96e3f5ce96e3f
EUC-JP	駭?\駭?	11110001110011110011111101011100111100011100111100111111	f1cf3f5cf1cf3f
UTF-8	駭찫\駭찱	11101001101001111010110111101100101100001010101101011100111010011010011110101101111011001011000010110001	e9a7adecb0ab5ce9a7adecb0b1
UHC	駭찫\駭찱	111110101011010010101010010001000101110011111010101101001010101001000111	fab4aa445cfab4aa47

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)