Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	邑?樗?員?	100101110101011100111111100100101001010000111111100010001111010100111111	97573f92943f88f53f
EUC-JP	邑?樗?員?	110011011011100000111111110000111111010000111111101100001111011100111111	cdb83fc3f43fb0f73f
UTF-8	邑렲樗렓員렎	111010011000001010010001111010111010000010110010111001101010100010010111111010111010000010010011111001011001001110100001111010111010000010001110	e98291eba0b2e6a897eba093e593a1eba08e
UHC	邑렲樗렓員렎	111010111110100110001110101111111110111011000000100011101010100011101010101011001000111010100100	ebe98ebfeec08ea8eaac8ea4

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)