Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	鬱蝎?竭堰	100111110101010011100101100110010011111111100010100100011000100110000001	9f54e5993fe2918981
EUC-JP	鬱蝎?竭堰	110111011011010111101001111110010011111111100011111100011011000111100001	ddb5e9f93fe3f1b1e1
UTF-8	鬱蝎렫竭堰	111010011010110010110001111010001001110110001110111010111010000010101011111001111010101110101101111001011010000010110000	e9acb1e89d8eeba0abe7abade5a0b0
UHC	鬱蝎렫竭堰	11101010101001101100101011101001100011101011100111001010111001101110010111101000	eaa6cae98eb9cae6e5e8

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)