Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	鐔￥臭鐔э	11101000010111001000000110001111100011110100110011101000010111001000010010001111	e85c818f8f4ce85c848f
EUC-JP	鐔￥臭鐔э	11101111101111011010000111101111101111011010110111101111101111011010011111101111	efbda1efbdadefbda7ef
UTF-8	鐔￥臭鐔э	1110100110010000100101001110111110111111101001011110100010000111101011011110100110010000100101001101000110001101	e99094efbfa5e887ade99094d18d
UHC	?￥臭?э	0011111110100001110011011111011010101011001111111010110011101111	3fa1cdf6ab3facef

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)