Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??i??iB	00111111001111110110100100111111001111110110100101000010	3f3f693f3f6942
SJIS-WIN	題?i題?iB	100100011110100000111111011010011001000111101000001111110110100101000010	91e83f6991e83f6942
EUC-JP	題?i題?iB	110000101110101000111111011010011100001011101010001111110110100101000010	c2ea3f69c2ea3f6942
UTF-8	題렍i題렍iB	111010011010000110001100111010111010000010001101011010011110100110100001100011001110101110100000100011010110100101000010	e9a18ceba08d69e9a18ceba08d6942
UHC	題렍i題렍iB	1111000010111001100011101010001101101001111100001011100110001110101000110110100101000010	f0b98ea369f0b98ea36942

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)