Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??\	001111110011111101011100	3f3f5c
SJIS-WIN	賊奪\	1001000110101111100100100100010001011100	91af92445c
EUC-JP	賊奪\	1100001010110001110000111010010101011100	c2b1c3a55c
UTF-8	賊奪\	11101000101100111000101011100101101001011010101001011100	e8b38ae5a5aa5c
UHC	賊奪\	1110111011100100111101111010110001011100	eee4f7ac5c

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)