Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?_B	001111110101111101000010	3f5f42
SJIS-WIN	奪_B	10010010010001000101111101000010	92445f42
EUC-JP	奪_B	11000011101001010101111101000010	c3a55f42
UTF-8	奪_B	1110010110100101101010100101111101000010	e5a5aa5f42
UHC	奪_B	11110111101011000101111101000010	f7ac5f42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)