Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	ä½TSB	111001001011110110000110010101000101001101000010	e4bd86545342
SJIS-WIN	???TSB	001111110011111100111111010101000101001101000010	3f3f3f545342
EUC-JP	ä??TSB	1000111110101011101000110011111100111111010101000101001101000010	8faba33f3f545342
UTF-8	ä½TSB	110000111010010011000010101111011100001010000110010101000101001101000010	c3a4c2bdc286545342
UHC	?½?TSB	00111111101010001111011000111111010101000101001101000010	3fa8f63f545342

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)