Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	闕ｼ邏夊ｦ従	11101000100011011011110011100111101101001001101011101000101001101000111101011101	e88dbce7b49ae8a68f5d
EUC-JP	闕ｼ邏夊ｦ従	111011111110110110001110101111001110111010110110110101001110101010001110101001101011110110111110	efed8ebceeb6d4ea8ea6bdbe
UTF-8	闕ｼ邏夊ｦ従	111010011001011110010101111011111011110110111100111010011000001010001111111001011010010010001010111011111011110110100110111001011011111010010011	e99795efbdbce9828fe5a48aefbda6e5be93
UHC	闕?邏???	1100111111110100001111111101010110100100001111110011111100111111	cff43fd5a43f3f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)