Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	Ã¢M	1000111011000011100011101010001001001101	8ec38ea24d
SJIS-WIN	???￠M	001111110011111100111111100000011001000101001101	3f3f3f81914d
EUC-JP	?Ã?¢M	0011111110001111101010101010101000111111101000011111000101001101	3f8faaaa3fa1f14d
UTF-8	Ã¢M	110000101000111011000011100000111100001010001110110000101010001001001101	c28ec383c28ec2a24d
UHC	????M	0011111100111111001111110011111101001101	3f3f3f3f4d

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)