Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????	0011111100111111001111110011111100111111	3f3f3f3f3f
SJIS-WIN	閾ｾ繽寅妨	111010001000011110111110111000111000111110010011110100001001011001010111	e887bee38f93d09657
EUC-JP	閾ｾ繽寅妨	11101111111001111000111010111110111001011110111111000110110100101100101110111000	efe78ebee5efc6d2cbb8
UTF-8	閾ｾ繽寅妨	111010011001011010111110111011111011110110111110111001111011100110111101111001011010111110000101111001011010011010101000	e996beefbdbee7b9bde5af85e5a6a8
UHC	???寅妨	00111111001111110011111111101100110110011101101110101010	3f3f3fecd9dbaa

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)