Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	æ~æmæ~æm^	111001100111111011100110011011011110011001111110111001100110110101011110	e67ee66de67ee66d5e
SJIS-WIN	?~?m?~?m^	001111110111111000111111011011010011111101111110001111110110110101011110	3f7e3f6d3f7e3f6d5e
EUC-JP	æ~æmæ~æm^	1000111110101001110000010111111010001111101010011100000101101101100011111010100111000001011111101000111110101001110000010110110101011110	8fa9c17e8fa9c16d8fa9c17e8fa9c16d5e
UTF-8	æ~æmæ~æm^	11000011101001100111111011000011101001100110110111000011101001100111111011000011101001100110110101011110	c3a67ec3a66dc3a67ec3a66d5e
UHC	æ~æmæ~æm^	10101001101000010111111010101001101000010110110110101001101000010111111010101001101000010110110101011110	a9a17ea9a16da9a17ea9a16d5e

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)