Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	çZà¯çZà¯B	111001110101101011100000101011111110011101011010111000001010111101000010	e75ae0afe75ae0af42
SJIS-WIN	?Z???Z??B	001111110101101000111111001111110011111101011010001111110011111101000010	3f5a3f3f3f5a3f3f42
EUC-JP	çZà¯çZà¯B	100011111010101110101110010110101000111110101011101000101000111110100010101101001000111110101011101011100101101010001111101010111010001010001111101000101011010001000010	8fabae5a8faba28fa2b48fabae5a8faba28fa2b442
UTF-8	çZà¯çZà¯B	110000111010011101011010110000111010000011000010101011111100001110100111010110101100001110100000110000101010111101000010	c3a75ac3a0c2afc3a75ac3a0c2af42
UHC	?Z???Z??B	001111110101101000111111001111110011111101011010001111110011111101000010	3f5a3f3f3f5a3f3f42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)