Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	ú±îM@B	111110101011000110001010111011101001001110011011010011010100000001000010	fab18aee939b4d4042
SJIS-WIN	?±????M@B	00111111100000010111110100111111001111110011111100111111010011010100000001000010	3f817d3f3f3f3f4d4042
EUC-JP	ú±?î??M@B	1000111110101011111000101010000111011110001111111000111110101011110000100011111100111111010011010100000001000010	8fabe2a1de3f8fabc23f3f4d4042
UTF-8	ú±îM@B	110000111011101011000010101100011100001010001010110000111010111011000010100100111100001010011011010011010100000001000010	c3bac2b1c28ac3aec293c29b4d4042
UHC	?±????M@B	00111111101000011011111000111111001111110011111100111111010011010100000001000010	3fa1be3f3f3f3f4d4042

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)