Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	ﾂ凖猟搜	11000010100110011100001110010111110000101001110101110010	c299c397c29d72
EUC-JP	ﾂ凖猟搜	1000111011000010110100101100010111001110110001001101100111010011	8ec2d2c5cec4d9d3
UTF-8	ﾂ凖猟搜	111011111011111010000010111001011000011110010110111001111000110010011111111001101001000010011100	efbe82e58796e78c9fe6909c
UHC	???搜	0011111100111111001111111110001010100100	3f3f3fe2a4

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)