Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????B	00111111001111110011111100111111001111110011111101000010	3f3f3f3f3f3f42
SJIS-WIN	町???應?B	100100101010110000111111001111110011111110011100111001000011111101000010	92ac3f3f3f9ce43f42
EUC-JP	町?焌?應?B	1100010010101110001111111000111111001001111010000011111111011000111001100011111101000010	c4ae3f8fc9e83fd8e63f42
UTF-8	町렢焌렪應렱B	11100111100101001011101011101011101000001010001011100111100001001000110011101011101000001010101011100110100001111000100111101011101000001011000101000010	e794baeba0a2e7848ceba0aae68789eba0b142
UHC	町렢焌렪應렱B	11101111111010111000111010110011111100011110000010001110101110001110101111101011100011101011111001000010	efeb8eb3f1e08eb8ebeb8ebe42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)