Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????B	00111111001111110011111100111111001111110011111101000010	3f3f3f3f3f3f42
SJIS-WIN	張??張??B	100100101010001100111111001111111001001010100011001111110011111101000010	92a33f3f92a33f3f42
EUC-JP	張??張??B	110001001010010100111111001111111100010010100101001111110011111101000010	c4a53f3fc4a53f3f42
UTF-8	張ㅷ즯張ㅷ즯B	11100101101111001011010111100011100001011011011111101100101001101010111111100101101111001011010111100011100001011011011111101100101001101010111101000010	e5bcb5e385b7eca6afe5bcb5e385b7eca6af42
UHC	張ㅷ즯張ㅷ즯B	11101101111001011010010011100111101000111000000111101101111001011010010011100111101000111000000101000010	ede5a4e7a381ede5a4e7a38142

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)