Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	冶??缸?┏	100101101110100000111111001111111110001110011101001111111000010010101100	96e83f3fe39d3f84ac
EUC-JP	冶??缸?┏	110011001110101000111111001111111110010111111101001111111010100010101110	ccea3f3fe5fd3fa8ae
UTF-8	冶싰맏缸뗦┏	111001011000011010110110111011001000101110110000111010111010011110001111111001111011110010111000111010111001011110100110111000101001010010001111	e586b6ec8bb0eba78fe7bcb8eb97a6e2948f
UHC	冶싰맏缸뗦┏	111001011010011110011010111010101011100010111010111110011111110010001011111001101010011010101110	e5a79aeab8baf9fc8be6a6ae

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)