Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??z??zB	00111111001111110111101000111111001111110111101001000010	3f3f7a3f3f7a42
SJIS-WIN	佇?z佇?zB	100110001100100000111111011110101001100011001000001111110111101001000010	98c83f7a98c83f7a42
EUC-JP	佇?z佇?zB	110100001100101000111111011110101101000011001010001111110111101001000010	d0ca3f7ad0ca3f7a42
UTF-8	佇렡z佇렡zB	111001001011110110000111111010111010000010100001011110101110010010111101100001111110101110100000101000010111101001000010	e4bd87eba0a17ae4bd87eba0a17a42
UHC	佇렡z佇렡zB	1110111010110111100011101011001001111010111011101011011110001110101100100111101001000010	eeb78eb27aeeb78eb27a42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)