Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???nR???n^[???nR???n^[^	0011111100111111001111110110111001010010001111110011111100111111011011100101111001011011001111110011111100111111011011100101001000111111001111110011111101101110010111100101101101011110	3f3f3f6e523f3f3f6e5e5b3f3f3f6e523f3f3f6e5e5b5e
SJIS-WIN	錵衰鯵nR錵衰鯵n^[錵衰鯵nR錵衰鯵n^[^	1110100001000101100100001000101010001000101100010110111001010010111010000100010110010000100010101000100010110001011011100101111001011011111010000100010110010000100010101000100010110001011011100101001011101000010001011001000010001010100010001011000101101110010111100101101101011110	e845908a88b16e52e845908a88b16e5e5be845908a88b16e52e845908a88b16e5e5b5e
EUC-JP	錵衰鯵nR錵衰鯵n^[錵衰鯵nR錵衰鯵n^[^	1110111110100110101111111110101010110000101100110110111001010010111011111010011010111111111010101011000010110011011011100101111001011011111011111010011010111111111010101011000010110011011011100101001011101111101001101011111111101010101100001011001101101110010111100101101101011110	efa6bfeab0b36e52efa6bfeab0b36e5e5befa6bfeab0b36e52efa6bfeab0b36e5e5b5e
UTF-8	錵衰鯵nR錵衰鯵n^[錵衰鯵nR錵衰鯵n^[^	1110100110001100101101011110100010100001101100001110100110101111101101010110111001010010111010011000110010110101111010001010000110110000111010011010111110110101011011100101111001011011111010011000110010110101111010001010000110110000111010011010111110110101011011100101001011101001100011001011010111101000101000011011000011101001101011111011010101101110010111100101101101011110	e98cb5e8a1b0e9afb56e52e98cb5e8a1b0e9afb56e5e5be98cb5e8a1b0e9afb56e52e98cb5e8a1b0e9afb56e5e5b5e
UHC	?衰?nR?衰?n^[?衰?nR?衰?n^[^	001111111110000111110001001111110110111001010010001111111110000111110001001111110110111001011110010110110011111111100001111100010011111101101110010100100011111111100001111100010011111101101110010111100101101101011110	3fe1f13f6e523fe1f13f6e5e5b3fe1f13f6e523fe1f13f6e5e5b5e

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)