Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	??麝??騏	0011111100111111111010100110110000111111001111111110100101110101	3f3fea6c3f3fe975
EUC-JP	??麝??騏	0011111100111111111100111100110100111111001111111111000111010110	3f3ff3cd3f3ff1d6
UTF-8	룴가麝키룵騏	111010111010001110110100111010101011000010000000111010011011101010011101111011011000001010100100111010111010001110110101111010011010100010001111	eba3b4eab080e9ba9ded82a4eba3b5e9a88f
UHC	룴가麝키룵騏	100011111010100110110000101000011101111011111010110001011011000010001111101010101101000111001001	8fa9b0a1defac5b08faad1c9

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)