Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	愽ﾟﾅ眤門	1001110011000111110111111100010111100001110000001001011011100101	9cc7dfc5e1c096e5
EUC-JP	愽ﾟﾅ眤門	11011000110010011000111011011111100011101100010111100010110000101100110011100111	d8c98edf8ec5e2c2cce7
UTF-8	愽ﾟﾅ眤門	111001101000010010111101111011111011111010011111111011111011111010000101111001111001110010100100111010011001011010000000	e684bdefbe9fefbe85e79ca4e99680
UHC	????門	001111110011111100111111001111111101101010100110	3f3f3f3fdaa6

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)