Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????B	00111111001111110011111100111111001111110011111101000010	3f3f3f3f3f3f42
SJIS-WIN	?犀??犀?B	001111111000110111010010001111110011111110001101110100100011111101000010	3f8dd23f3f8dd23f42
EUC-JP	?犀??犀?B	001111111011101011010100001111110011111110111010110101000011111101000010	3fbad43f3fbad43f42
UTF-8	若犀씕若犀씕B	11101111101001011011010011100111100010101000000011101100100101001001010111101111101001011011010011100111100010101000000011101100100101001001010101000010	efa5b4e78a80ec9495efa5b4e78a80ec949542
UHC	若犀씕若犀씕B	11100101101011101101111111111001100111011010101011100101101011101101111111111001100111011010101001000010	e5aedff99daae5aedff99daa42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)