Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	貞邁?雍六	100100101110010111100111101100000011111111101000101101001001100001011010	92e5e7b03fe8b4985a
EUC-JP	貞邁?雍六	110001001110011111101110101100100011111111110000101101101100111110111011	c4e7eeb23ff0b6cfbb
UTF-8	貞邁樂雍六	111010001011001010011110111010011000001010000001111011111010010010010100111010011001101110001101111001011000010110101101	e8b29ee98281efa494e99b8de585ad
UHC	貞邁樂雍六	11101111111101101101100011100100110100011110001011101000101111001101011110111111	eff6d8e4d1e2e8bcd7bf

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)