Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	訒ｭ雉ｪ貂ｧ	111110111010001110101101111010001011001110101010111001101011100010100111	fba3ade8b3aae6b8a7
EUC-JP	訒ｭ雉ｪ貂ｧ	10001111110111011100100010001110101011011111000010110101100011101010101011101100101110101000111010100111	8fddc88eadf0b58eaaecba8ea7
UTF-8	訒ｭ雉ｪ貂ｧ	111010001010100010010010111011111011110110101101111010011001101110001001111011111011110110101010111010001011001010000010111011111011110110100111	e8a892efbdade99b89efbdaae8b282efbda7
UHC	??雉?貂?	0011111100111111111101101100101100111111111101011011000000111111	3f3ff6cb3ff5b03f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)