Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	Þû¹¶h	1101111011111011101110011011011001101000	defbb9b668
SJIS-WIN	???¶h	001111110011111100111111100000011111011101101000	3f3f3f81f768
EUC-JP	Þû?¶h	10001111101010011011000010001111101010111110010100111111101000101111100101101000	8fa9b08fabe53fa2f968
UTF-8	Þû¹¶h	110000111001111011000011101110111100001010111001110000101011011001101000	c39ec3bbc2b9c2b668
UHC	Þ?¹¶h	1010100010101101001111111010100111110110101000101101001001101000	a8ad3fa9f6a2d268

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)