Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??J????	00111111001111110100101000111111001111110011111100111111	3f3f4a3f3f3f3f
SJIS-WIN	偲湿J偲ﾘﾅ自	1000111011000011100011101011110001001010100011101100001111011000110001011000111010101001	8ec38ebc4a8ec3d8c58ea9
EUC-JP	偲湿J偲ﾘﾅ自	10111100110001011011110010111110010010101011110011000101100011101101100010001110110001011011110010101011	bcc5bcbe4abcc58ed88ec5bcab
UTF-8	偲湿J偲ﾘﾅ自	11100101100000011011001011100110101110011011111101001010111001011000000110110010111011111011111010011000111011111011111010000101111010001000011110101010	e581b2e6b9bf4ae581b2efbe98efbe85e887aa
UHC	??J???自	0011111100111111010010100011111100111111001111111110110110111011	3f3f4a3f3f3fedbb

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)