Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	熙悉昭ﾛ湿	111010101010010010001110101110111000111110111010110110111000111010111100	eaa48ebb8fbadb8ebc
EUC-JP	熙悉昭ﾛ湿	11110100101001101011110010111101101111101011110010001110110110111011110010111110	f4a6bcbdbebc8edbbcbe
UTF-8	熙悉昭ﾛ湿	111001111000011010011001111001101000001010001001111001101001100010101101111011111011111010011011111001101011100110111111	e78699e68289e698adefbe9be6b9bf
UHC	熙悉昭??	1111110111110111111000111111101011100001101110010011111100111111	fdf7e3fae1b93f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)