Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????????????	001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f
SJIS-WIN	厭レ????淫??憶?〃肄??	100010010111110110000011100011000011111100111111001111110011111110001000111110100011111100111111100010011010111100111111100000010101011011100011111001010011111100111111	897d838c3f3f3f3f88fa3f3f89af3f8156e3e53f3f
EUC-JP	厭レ????淫??憶?〃肄??	101100011101111010100101111011000011111100111111001111110011111110110000111111000011111100111111101100101011000100111111101000011011011111100110111001110011111100111111	b1dea5ec3f3f3f3fb0fc3f3fb2b13fa1b7e6e73f3f
UTF-8	厭レ꼯鱗븝쭇淫볧뭵憶귣〃肄믥독	111001011000111010101101111000111000001110101100111010101011110010101111111011111010011110110010111010111011100010011101111011001010110110000111111001101011011110101011111010111011001110100111111010111010110110110101111001101000011010110110111010101011011110100011111000111000000010000011111010001000001010000100111010111010111110100101111010111000111110000101	e58eade383aceabcafefa7b2ebb89decad87e6b7abebb3a7ebadb5e686b6eab7a3e38083e88284ebafa5eb8f85
UHC	厭レ꼯鱗븝쭇淫볧뭵憶귣〃肄믥독	111001101111010010101011111011001000010010001010111011001110011110111010111011111010011110000011111010111110001010010011111011011001001010000100111001011110001110000010111010111010000110101000111011001011110110010010111001111011010110110110	e6f4abec848aece7baefa783ebe293ed9284e5e382eba1a8ecbd92e7b5b6

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)