Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??i??iB	00111111001111110110100100111111001111110110100101000010	3f3f693f3f6942
SJIS-WIN	縣失i縣失iB	1110001101110000100011101011100001101001111000110111000010001110101110000110100101000010	e3708eb869e3708eb86942
EUC-JP	縣失i縣失iB	1110010111010001101111001011101001101001111001011101000110111100101110100110100101000010	e5d1bcba69e5d1bcba6942
UTF-8	縣失i縣失iB	111001111011100010100011111001011010010010110001011010011110011110111000101000111110010110100100101100010110100101000010	e7b8a3e5a4b169e7b8a3e5a4b16942
UHC	縣失i縣失iB	1111101011100011111000111111011101101001111110101110001111100011111101110110100101000010	fae3e3f769fae3e3f76942

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)