Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	ｾｼ治焦	101111101011110010001110101000011000111111000101	bebc8ea18fc5
EUC-JP	ｾｼ治焦	1000111010111110100011101011110010111100101000111011111011000111	8ebe8ebcbca3bec7
UTF-8	ｾｼ治焦	111011111011110110111110111011111011110110111100111001101011001010111011111001111000010010100110	efbdbeefbdbce6b2bbe784a6
UHC	??治焦	001111110011111111110110101111011111010110100101	3f3ff6bdf5a5

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)