Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	©¡©ø¢ç}B	1010100110100001101010011111100010100010111001110111110101000010	a9a1a9f8a2e77d42
SJIS-WIN	????￠?}B	001111110011111100111111001111111000000110010001001111110111110101000010	3f3f3f3f81913f7d42
EUC-JP	©¡©ø¢ç}B	10001111101000101110110110001111101000101100001010001111101000101110110110001111101010011100110010100001111100011000111110101011101011100111110101000010	8fa2ed8fa2c28fa2ed8fa9cca1f18fabae7d42
UTF-8	©¡©ø¢ç}B	1100001010101001110000101010000111000010101010011100001110111000110000101010001011000011101001110111110101000010	c2a9c2a1c2a9c3b8c2a2c3a77d42
UHC	?¡?ø??}B	00111111101000101010111000111111101010011010101000111111001111110111110101000010	3fa2ae3fa9aa3f3f7d42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)