Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	莨亥胸絅	1110010010111100100010001110010110001011101110011110001101000100	e4bc88e58bb9e344
EUC-JP	莨亥胸絅	1110100010111110101100001110011110110110101110111110010110100101	e8beb0e7b6bbe5a5
UTF-8	莨亥胸絅	111010001000111010101000111001001011101010100101111010001000001110111000111001111011010110000101	e88ea8e4baa5e883b8e7b585
UHC	?亥胸絅	00111111111110101010010011111101110110001100110011100111	3ffaa4fdd8cce7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)