Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	弔?咳???	1001001010100010001111111000101001010000001111110011111100111111	92a23f8a503f3f3f
EUC-JP	弔?咳???	1100010010100100001111111011001110110001001111110011111100111111	c4a43fb3b13f3f3f
UTF-8	弔렚咳漏렧렞	111001011011110010010100111010111010000010011010111001011001001010110011111011111010010110001110111010111010000010100111111010111010000010011110	e5bc94eba09ae592b3efa58eeba0a7eba09e
UHC	弔렚咳漏렧렞	111100001100000010001110101011011111101010100110110100101110100010001110101101101000111010101111	f0c08eadfaa6d2e88eb68eaf

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)