Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	蠖ｧ蝸ｽ逍ｫ	111001011011110110100111111001011001011110111101111001111001011010101011	e5bda7e597bde796ab
EUC-JP	蠖ｧ蝸ｽ逍ｫ	111010101011111110001110101001111110100111110111100011101011110111101101111101101000111010101011	eabf8ea7e9f78ebdedf68eab
UTF-8	蠖ｧ蝸ｽ逍ｫ	111010001010000010010110111011111011110110100111111010001001110110111000111011111011110110111101111010011000000010001101111011111011110110101011	e8a096efbda7e89db8efbdbde9808defbdab
UHC	??蝸?逍?	0011111100111111111010001100010000111111111000011100111000111111	3f3fe8c43fe1ce3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)