Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	猷ヨ?猷??	100101110101000110000011100010000011111110010111010100010011111100111111	975183883f97513f3f
EUC-JP	猷ヨ?猷??	110011011011001010100101111010000011111111001101101100100011111100111111	cdb2a5e83fcdb23f3f
UTF-8	猷ヨ뼅猷띰쨬	111001111000110010110111111000111000001110101000111010111011110010000101111001111000110010110111111010111001110110110000111011001010100010101100	e78cb7e383a8ebbc85e78cb7eb9db0eca8ac
UHC	猷ヨ뼅猷띰쨬	111010111010001110101011111010001001011010001111111010111010001110110110111011111010010010000110	eba3abe8968feba3b6efa486

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)