Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????B	00111111001111110011111100111111001111110011111101000010	3f3f3f3f3f3f42
SJIS-WIN	夕城舌夕城舌B	10010111010110111000111111101001100100001110001110010111010110111000111111101001100100001110001101000010	975b8fe990e3975b8fe990e342
EUC-JP	夕城舌夕城舌B	11001101101111001011111011101011110000001110010111001101101111001011111011101011110000001110010101000010	cdbcbeebc0e5cdbcbeebc0e542
UTF-8	夕城舌夕城舌B	11100101101001001001010111100101100111111000111011101000100010001000110011100101101001001001010111100101100111111000111011101000100010001000110001000010	e5a495e59f8ee8888ce5a495e59f8ee8888c42
UHC	夕城舌夕城舌B	11100000101010101110000011110010111000001101111111100000101010101110000011110010111000001101111101000010	e0aae0f2e0dfe0aae0f2e0df42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)