Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???	001111110011111100111111	3f3f3f
SJIS-WIN	迯弟傷	111001111000110110010010111011011000111110011101	e78d92ed8f9d
EUC-JP	迯弟傷	111011011110110111000100111011111011110111111101	ededc4efbdfd
UTF-8	迯弟傷	111010001011111110101111111001011011110010011111111001011000001010110111	e8bfafe5bc9fe582b7
UHC	?弟傷	0011111111110000101010011101111110111111	3ff0a9dfbf

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)