Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	銓篇咲ｧ狗	111001111111001010010101110100011000110111100111101001111000101111100111	e7f295d18de7a78be7
EUC-JP	銓篇咲ｧ狗	11101110111101001100101011010011101110101110100110001110101001111011011011101001	eef4cad3bae98ea7b6e9
UTF-8	銓篇咲ｧ狗	111010011000101010010011111001111010111110000111111001011001001010110010111011111011110110100111111001111000101110010111	e98a93e7af87e592b2efbda7e78b97
UHC	銓篇??狗	1110111110110000111110001011100100111111001111111100111110110111	efb0f8b93f3fcfb7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)