Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????^	0011111100111111001111110011111101011110	3f3f3f3f5e
SJIS-WIN	鮏蒻鮏蒿^	111111000100001111100100111010001111110001000011111001001110010001011110	fc43e4e8fc43e4e45e
EUC-JP	鮏蒻鮏蒿^	1000111111101010110110111110100011101010100011111110101011011011111010001110011001011110	8feadbe8ea8feadbe8e65e
UTF-8	鮏蒻鮏蒿^	11101001101011101000111111101000100100101011101111101001101011101000111111101000100100101011111101011110	e9ae8fe892bbe9ae8fe892bf5e
UHC	?蒻?蒿^	00111111111001011011011000111111111110111101101001011110	3fe5b63ffbda5e

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)