Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????^	001111110011111100111111001111110011111101011110	3f3f3f3f3f5e
SJIS-WIN	嶸弥个嶸凡^	1111101010110100100101101110110110011000101000101111101010110100100101100111110101011110	fab496ed98a2fab4967d5e
EUC-JP	嶸弥个嶸凡^	10001111101110111111010011001100111011111101000010100100100011111011101111110100110010111101111001011110	8fbbf4ccefd0a48fbbf4cbde5e
UTF-8	嶸弥个嶸凡^	11100101101101101011100011100101101111001010010111100100101110001010101011100101101101101011100011100101100001111010000101011110	e5b6b8e5bca5e4b8aae5b6b8e587a15e
UHC	嶸??嶸凡^	111001111010111000111111001111111110011110101110110110111110110101011110	e7ae3f3fe7aedbed5e

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)