Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???R?	0011111100111111001111110101001000111111	3f3f3f523f
SJIS-WIN	絶??R艶	10010000111000100011111100111111010100101000100110010000	90e23f3f528990
EUC-JP	絶??R艶	11000000111001000011111100111111010100101011000111110000	c0e43f3f52b1f0
UTF-8	絶볩쉭R艶	11100111101101011011011011101011101100111010100111101100100010011010110101010010111010001000100110110110	e7b5b6ebb3a9ec89ad52e889b6
UHC	絶볩쉭R艶	111011111011111010010011111011111011110110101101010100101110011011111101	efbe93efbdad52e6fd

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)