Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	蹂ｼｴ踐璽捨	11100110111110001011110010110100111001101111011010001110101000111000111011001100	e6f8bcb4e6f68ea38ecc
EUC-JP	蹂ｼｴ踐璽捨	111011001111101010001110101111001000111010110100111011001111100010111100101001011011110011001110	ecfa8ebc8eb4ecf8bca5bcce
UTF-8	蹂ｼｴ踐璽捨	111010001011100110000010111011111011110110111100111011111011110110110100111010001011100010010000111001111001001010111101111001101000110110101000	e8b982efbdbcefbdb4e8b890e792bde68da8
UHC	蹂??踐璽捨	11101011101100110011111100111111111101001100001011011111110111101101111011010111	ebb33f3ff4c2dfdeded7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)