Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????	00111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f
SJIS-WIN	跚ｼｴ昌ｷｼﾀ	111001101110011110111100101101001000111110111001101101111011110011000000	e6e7bcb48fb9b7bcc0
EUC-JP	跚ｼｴ昌ｷｼﾀ	1110110011101001100011101011110010001110101101001011111010111011100011101011011110001110101111001000111011000000	ece98ebc8eb4bebb8eb78ebc8ec0
UTF-8	跚ｼｴ昌ｷｼﾀ	111010001011011110011010111011111011110110111100111011111011110110110100111001101001100010001100111011111011110110110111111011111011110110111100111011111011111010000000	e8b79aefbdbcefbdb4e6988cefbdb7efbdbcefbe80
UHC	???昌???	0011111100111111001111111111001111100011001111110011111100111111	3f3f3ff3e33f3f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)