Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	鄒ｯ驢ｯ繝貼	11100111101111101010111111101001100001101010111111100011100000111001001101011100	e7beafe986afe383935c
EUC-JP	鄒ｯ驢ｯ繝貼	111011101100000010001110101011111111000111100110100011101010111111100101111000111100010110111101	eec08eaff1e68eafe5e3c5bd
UTF-8	鄒ｯ驢ｯ繝貼	111010011000010010010010111011111011110110101111111010011010100110100010111011111011110110101111111001111011100110011101111010001011001010111100	e98492efbdafe9a9a2efbdafe7b99de8b2bc
UHC	鄒?驢??貼	111101011101101100111111110101011111000000111111001111111111010011100100	f5db3fd5f03f3ff4e4

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)