Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	曜???↑	10010111011010100011111100111111001111111000000110101010	976a3f3f3f81aa
EUC-JP	曜?Ŋ孼↑	1100110111001011001111111000111110101001101010111000111110111010110000111010001010101100	cdcb3f8fa9ab8fbac3a2ac
UTF-8	曜섇Ŋ孼↑	1110011010011011100111001110110010000100100001111100010110001010111001011010110110111100111000101000011010010001	e69b9cec8487c58ae5adbce28691
UHC	曜섇Ŋ孼↑	11101000111110001001100011100101101010001010111111100101111011011010000111101000	e8f898e5a8afe5eda1e8

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)