Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	鬲奠慇夋ｪ	111010011010110110011010111110011001110010111110111110101001111110101010	e9ad9af99cbefa9faa
EUC-JP	鬲奠慇夋ｪ	1111001010101111110101001111101111011000110000001000111110111000111000011000111010101010	f2afd4fbd8c08fb8e18eaa
UTF-8	鬲奠慇夋ｪ	111010011010110010110010111001011010010110100000111001101000010110000111111001011010010010001011111011111011110110101010	e9acb2e5a5a0e68587e5a48befbdaa
UHC	?奠慇??	00111111111011101111010111101011110110110011111100111111	3feef5ebdb3f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)