Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????????????????	00111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f
SJIS-WIN	鴦??誼??柔レ?藥??誼??矣??擾	111010011111000100111111001111111000101101100010001111110011111110001111010111111000001110001100001111111110010101011010001111110011111110001011011000100011111100111111111000011110000100111111001111111000111111101111	e9f13f3f8b623f3f8f5f838c3fe55a3f3f8b623f3fe1e13f3f8fef
EUC-JP	鴦??誼??柔レ?藥??誼??矣??擾	111100101111001100111111001111111011010111000011001111110011111110111101110000001010010111101100001111111110100110111011001111110011111110110101110000110011111100111111111000101110001100111111001111111011111011110001	f2f33f3fb5c33f3fbdc0a5ec3fe9bb3f3fb5c33f3fe2e33f3fbef1
UTF-8	鴦볝굥誼쀨몛柔レ젞藥띾씭誼쇿꼧矣⑹젔擾	111010011011010010100110111010111011001110011101111010101011010110100101111010001010101010111100111011001000000010101000111010111010101010011011111001101001111110010100111000111000001110101100111011001010000010011110111010001001011110100101111010111001110110111110111011001001010010101101111010001010101010111100111011001000011110111111111010101011110010100111111001111001111110100011111000101001000110111001111011001010000010010100111001101001001110111110	e9b4a6ebb39deab5a5e8aabcec80a8ebaa9be69f94e383aceca09ee897a5eb9dbeec94ade8aabcec87bfeabca7e79fa3e291b9eca094e693be
UHC	鴦볝굥誼쀨몛柔レ젞藥띾씭誼쇿꼧矣⑹젔擾	1110010011101100100100111110001110000010100010111110101111111110100101111110100010010001100010011110101011110101101010111110110010100000100110001110010110110111100011011110101110011101101111101110101111111110100110011110010110000100100001001110101111111000101010011110110010100000100100101110100011110110	e4ec93e3828bebfe97e89189eaf5abeca098e5b78deb9dbeebfe99e58484ebf8a9eca092e8f6

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)