Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	失悉執勺簫	10001110101110001000111010111011100011101011011110001110110110011110001011010010	8eb88ebb8eb78ed9e2d2
EUC-JP	失悉執勺簫	10111100101110101011110010111101101111001011100110111100110110111110010011010100	bcbabcbdbcb9bcdbe4d4
UTF-8	失悉執勺簫	111001011010010010110001111001101000001010001001111001011001111110110111111001011000101110111010111001111011000010101011	e5a4b1e68289e59fb7e58bbae7b0ab
UHC	失悉執勺簫	11100011111101111110001111111010111100101111101111101101110000111110000111000111	e3f7e3faf2fbedc3e1c7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)