Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	蛛ｲ螳咋∋闥	1110010110000001101100101110010110101110100011011110111010000001101110011110100010010010	e581b2e5ae8dee81b9e892
EUC-JP	蛛ｲ螳咋∋闥	111010011110000110001110101100101110101010110000101110101111000010100010101110111110111111110010	e9e18eb2eab0baf0a2bbeff2
UTF-8	蛛ｲ螳咋∋闥	111010001001101110011011111011111011110110110010111010001001111010110011111001011001001010001011111000101000100010001011111010011001011110100101	e89b9befbdb2e89eb3e5928be2888be997a5
UHC	蛛?螳?∋?	111100011100100000111111110100111101100100111111101000011111010100111111	f1c83fd3d93fa1f53f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)