Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	猥瑜ｾﾇ而猥	11100000110011101110000011101111101111101100011110001110101001111110000011001110	e0cee0efbec78ea7e0ce
EUC-JP	猥瑜ｾﾇ而猥	111000001101000011100000111100011000111010111110100011101100011110111100101010011110000011010000	e0d0e0f18ebe8ec7bca9e0d0
UTF-8	猥瑜ｾﾇ而猥	111001111000110010100101111001111001000110011100111011111011110110111110111011111011111010000111111010001000000010001100111001111000110010100101	e78ca5e7919cefbdbeefbe87e8808ce78ca5
UHC	猥瑜??而猥	11101000111001011110101110100101001111110011111111101100101110111110100011100101	e8e5eba53f3fecbbe8e5

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)