Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	ｼ瑩箴ﾔ犒靄	10111100111000001111000011100010101111001101010011100000101101011110100011001001	bce0f0e2bcd4e0b5e8c9
EUC-JP	ｼ瑩箴ﾔ犒靄	100011101011110011100000111100101110010010111110100011101101010011100000101101111111000011001011	8ebce0f2e4be8ed4e0b7f0cb
UTF-8	ｼ瑩箴ﾔ犒靄	111011111011110110111100111001111001000110101001111001111010111010110100111011111011111010010100111001111000101010010010111010011001110110000100	efbdbce791a9e7aeb4efbe94e78a92e99d84
UHC	?瑩箴??靄	001111111111101110101001111011011101011100111111001111111110010011110111	3ffba9edd73f3fe4f7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)