Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	僥??謠??	1001100101000110001111110011111111100110100011110011111100111111	99463f3fe68f3f3f
EUC-JP	僥??謠??	1101000110100111001111110011111111101011111011110011111100111111	d1a73f3febef3f3f
UTF-8	僥삭퀙謠계츓	111001011000001110100101111011001000001010101101111011011000000010011001111010001010110010100000111010101011001110000100111011001011100010010011	e583a5ec82aded8099e8aca0eab384ecb893
UHC	僥삭퀙謠계츓	111010001110100110111011111010001011001110001101111010011010101010110000111010001010111010001110	e8e9bbe8b38de9aab0e8ae8e

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)