Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	逋語ｷ俯楙蟶	1110011110011001100011001110101010110111100110001110101110011110101111001110010110111000	e7998ceab798eb9ebce5b8
EUC-JP	逋語ｷ俯楙蟶	111011011111100110111000111011001000111010110111110100001110110111011100101111101110101010111010	edf9b8ec8eb7d0eddcbeeaba
UTF-8	逋語ｷ俯楙蟶	111010011000000010001011111010001010101010011110111011111011110110110111111001001011111110101111111001101010010110011001111010001001111110110110	e9808be8aa9eefbdb7e4bfafe6a599e89fb6
UHC	逋語?俯楙?	11111000111001111110010111011110001111111101110011110110110110011110101000111111	f8e7e5de3fdcf6d9ea3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)