Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	陞ｽ蟶夊鳩螟	1110100010011110101111011110010110111000100110101110100010010100101101011110010110100100	e89ebde5b89ae894b5e5a4
EUC-JP	陞ｽ蟶夊鳩螟	111011111111111010001110101111011110101010111010110101001110101011001000101101111110101010100110	effe8ebdeabad4eac8b7eaa6
UTF-8	陞ｽ蟶夊鳩螟	111010011001100110011110111011111011110110111101111010001001111110110110111001011010010010001010111010011011001110101001111010001001111010011111	e9999eefbdbde89fb6e5a48ae9b3a9e89e9f
UHC	陞???鳩螟	111000111011001100111111001111110011111111001111110011011101100110101101	e3b33f3f3fcfcdd9ad

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)