Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	窈??齬?〈	111000100111011100111111001111111110101010010111001111111000000101110001	e2773f3fea973f8171
EUC-JP	窈??齬?〈	111000111101100000111111001111111111001111110111001111111010000111010010	e3d83f3ff3f73fa1d2
UTF-8	窈닸뱲齬삯〈	111001111010101010001000111010111000101110111000111010111011000110110010111010011011110110101100111011001000001010101111111000111000000010001000	e7aa88eb8bb8ebb1b2e9bdacec82afe38088
UHC	窈닸뱲齬삯〈	111010011010000110110100111001101001001110011000111001011110000110111011111010011010000110110100	e9a1b4e69398e5e1bbe9a1b4

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)