Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??i??iB	00111111001111110110100100111111001111110110100101000010	3f3f693f3f6942
SJIS-WIN	質謝i質謝iB	1000111010111111100011101101001101101001100011101011111110001110110100110110100101000010	8ebf8ed3698ebf8ed36942
EUC-JP	質謝i質謝iB	1011110011000001101111001101010101101001101111001100000110111100110101010110100101000010	bcc1bcd569bcc1bcd56942
UTF-8	質謝i質謝iB	111010001011001110101010111010001010110010011101011010011110100010110011101010101110100010101100100111010110100101000010	e8b3aae8ac9d69e8b3aae8ac9d6942
UHC	質謝i質謝iB	1111001011110101110111101111001101101001111100101111010111011110111100110110100101000010	f2f5def369f2f5def36942

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)