Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	í¨bí¨b^	111011011001100010101000011000101110110110011000101010000110001001011110	ed98a862ed98a8625e
SJIS-WIN	??¨b??¨b^	0011111100111111100000010100111001100010001111110011111110000001010011100110001001011110	3f3f814e623f3f814e625e
EUC-JP	í?¨bí?¨b^	100011111010101110111111001111111010000110101111011000101000111110101011101111110011111110100001101011110110001001011110	8fabbf3fa1af628fabbf3fa1af625e
UTF-8	í¨bí¨b^	110000111010110111000010100110001100001010101000011000101100001110101101110000101001100011000010101010000110001001011110	c3adc298c2a862c3adc298c2a8625e
UHC	??¨b??¨b^	0011111100111111101000011010011101100010001111110011111110100001101001110110001001011110	3f3fa1a7623f3fa1a7625e

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)