Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??i??iB	00111111001111110110100100111111001111110110100101000010	3f3f693f3f6942
SJIS-WIN	遇涅i遇涅iB	1000101111110110100111111011100001101001100010111111011010011111101110000110100101000010	8bf69fb8698bf69fb86942
EUC-JP	遇涅i遇涅iB	1011011011111000110111101011101001101001101101101111100011011110101110100110100101000010	b6f8deba69b6f8deba6942
UTF-8	遇涅i遇涅iB	111010011000000110000111111001101011011010000101011010011110100110000001100001111110011010110110100001010110100101000010	e98187e6b68569e98187e6b6856942
UHC	遇涅i遇涅iB	1110100111100111111001101110111001101001111010011110011111100110111011100110100101000010	e9e7e6ee69e9e7e6ee6942

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)