Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	ﾂ崚卍堕つ淞	1100001010011011110000111001100111000010100100011100001010000010110000101001111111000010	c29bc399c291c282c29fc2
EUC-JP	ﾂ崚卍堕つ淞	100011101100001011010110110001011101001011000100110000101100010010100100110001001101111011000100	8ec2d6c5d2c4c2c4a4c4dec4
UTF-8	ﾂ崚卍堕つ淞	111011111011111010000010111001011011010010011010111001011000110110001101111001011010000010010101111000111000000110100100111001101011011110011110	efbe82e5b49ae58d8de5a095e381a4e6b79e
UHC	??卍?つ淞	001111110011111111011000101100110011111110101010110001001110000111100111	3f3fd8b33faac4e1e7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)