Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	Ã¢±Ì	11000011101000101011000111001100	c3a2b1cc
SJIS-WIN	?￠±?	001111111000000110010001100000010111110100111111	3f8191817d3f
EUC-JP	Ã¢±Ì	10001111101010101010101010100001111100011010000111011110100011111010101011000000	8faaaaa1f1a1de8faac0
UTF-8	Ã¢±Ì	1100001110000011110000101010001011000010101100011100001110001100	c383c2a2c2b1c38c
UHC	??±?	0011111100111111101000011011111000111111	3f3fa1be3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)