Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	鹿昭ｾ治	111100101010100110001110101011011000111110111010101111101000111010100001	f2a98ead8fbabe8ea1
EUC-JP	?鹿昭ｾ治	001111111011110010101111101111101011110010001110101111101011110010100011	3fbcafbebc8ebebca3
UTF-8	鹿昭ｾ治	111011101000011110100000111010011011100110111111111001101001100010101101111011111011110110111110111001101011001010111011	ee87a0e9b9bfe698adefbdbee6b2bb
UHC	?鹿昭?治	0011111111010110111000111110000110111001001111111111011010111101	3fd6e3e1b93ff6bd

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)