Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	ðçÙÛ¥ÎäÕ¬¡ðçÙÛ¥ÎäÕ¬¡B	111100001110011111011001110110111010010111001110111001001101010110101100101000011111000011100111110110011101101110100101110011101110010011010101101011001010000101000010	f0e7d9dba5cee4d5aca1f0e7d9dba5cee4d5aca142
SJIS-WIN	????￥???￢?????￥???￢?B	00111111001111110011111100111111100000011000111100111111001111110011111110000001110010100011111100111111001111110011111100111111100000011000111100111111001111110011111110000001110010100011111101000010	3f3f3f3f818f3f3f3f81ca3f3f3f3f3f818f3f3f3f81ca3f42
EUC-JP	ðçÙÛ?ÎäÕ¬¡ðçÙÛ?ÎäÕ¬¡B	10001111101010011100001110001111101010111010111010001111101010101110001110001111101010101110010100111111100011111010101011000010100011111010101110100011100011111010101011011000101000101100110010001111101000101100001010001111101010011100001110001111101010111010111010001111101010101110001110001111101010101110010100111111100011111010101011000010100011111010101110100011100011111010101011011000101000101100110010001111101000101100001001000010	8fa9c38fabae8faae38faae53f8faac28faba38faad8a2cc8fa2c28fa9c38fabae8faae38faae53f8faac28faba38faad8a2cc8fa2c242
UTF-8	ðçÙÛ¥ÎäÕ¬¡ðçÙÛ¥ÎäÕ¬¡B	1100001110110000110000111010011111000011100110011100001110011011110000101010010111000011100011101100001110100100110000111001010111000010101011001100001010100001110000111011000011000011101001111100001110011001110000111001101111000010101001011100001110001110110000111010010011000011100101011100001010101100110000101010000101000010	c3b0c3a7c399c39bc2a5c38ec3a4c395c2acc2a1c3b0c3a7c399c39bc2a5c38ec3a4c395c2acc2a142
UHC	ð????????¡ð????????¡B	10101001101000110011111100111111001111110011111100111111001111110011111100111111101000101010111010101001101000110011111100111111001111110011111100111111001111110011111100111111101000101010111001000010	a9a33f3f3f3f3f3f3f3fa2aea9a33f3f3f3f3f3f3f3fa2ae42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)