Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????^	001111110011111100111111001111110011111101011110	3f3f3f3f3f5e
SJIS-WIN	螢ﾎｰ脣^	111001011010001111110110110000001100111010110000111000111111101001011110	e5a3f6c0ceb0e3fa5e
EUC-JP	螢?ﾎｰ脣^	11101010101001010011111110001110110011101000111010110000111001101111110001011110	eaa53f8ece8eb0e6fc5e
UTF-8	螢ﾎｰ脣^	11101000100111101010001011101110100100111010011111101111101111101000111011101111101111011011000011101000100001001010001101011110	e89ea2ee93a7efbe8eefbdb0e884a35e
UHC	螢???脣^	1111101110101011001111110011111100111111111000101110111001011110	fbab3f3f3fe2ee5e

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)