Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	蝓溘汐尞奇ｧ	1110010110011111100111111110001110001110101011001111101010101011100010101110111110100111	e59f9fe38eacfaab8aefa7
EUC-JP	蝓溘汐尞奇ｧ	11101010101000011101111011100101101111001010111010001111101110101110101110110100111100011000111010100111	eaa1dee5bcae8fbaebb4f18ea7
UTF-8	蝓溘汐尞奇ｧ	111010001001110110010011111001101011101010011000111001101011000110010000111001011011000010011110111001011010010110000111111011111011110110100111	e89d93e6ba98e6b190e5b09ee5a587efbda7
UHC	??汐?奇?	0011111100111111111000001011000100111111110100001111010000111111	3f3fe0b13fd0f43f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)