Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????^	0011111100111111001111110011111101011110	3f3f3f3f5e
SJIS-WIN	酌室酌室^	100011101101111010001110101110101000111011011110100011101011101001011110	8ede8eba8ede8eba5e
EUC-JP	酌室酌室^	101111001110000010111100101111001011110011100000101111001011110001011110	bce0bcbcbce0bcbc5e
UTF-8	酌室酌室^	11101001100001011000110011100101101011101010010011101001100001011000110011100101101011101010010001011110	e9858ce5aea4e9858ce5aea45e
UHC	酌室酌室^	111011011100110011100011111110001110110111001100111000111111100001011110	edcce3f8edcce3f85e

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)