Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	姚??燁??	1001101101001100001111110011111111111011010110010011111100111111	9b4c3f3ffb593f3f
EUC-JP	姚??燁??	110101011010110100111111001111111000111111001010101100110011111100111111	d5ad3f3f8fcab33f3f
UTF-8	姚뷂퐦燁뗩릶	111001011010011110011010111010111011011110000010111011011001000010100110111001111000011110000001111010111001011110101001111010111010011010110110	e5a79aebb782ed90a6e78781eb97a9eba6b6
UHC	姚뷂퐦燁뗩릶	111010001110111010010100111011111011110110001111111001111010011110001011111010011001000010010100	e8ee94efbd8fe7a78be99094

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)