Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????C]	001111110011111100111111001111110100001101011101	3f3f3f3f435d
SJIS-WIN	ｸｹｼ｣C]	101110001011100110111100101000110100001101011101	b8b9bca3435d
EUC-JP	ｸｹｼ｣C]	10001110101110001000111010111001100011101011110010001110101000110100001101011101	8eb88eb98ebc8ea3435d
UTF-8	ｸｹｼ｣C]	1110111110111101101110001110111110111101101110011110111110111101101111001110111110111101101000110100001101011101	efbdb8efbdb9efbdbcefbda3435d
UHC	????C]	001111110011111100111111001111110100001101011101	3f3f3f3f435d

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)