Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????????}?????????{^	001111110011111100111111001111110011111100111111001111110011111100111111011111010011111100111111001111110011111100111111001111110011111100111111001111110111101101011110	3f3f3f3f3f3f3f3f3f7d3f3f3f3f3f3f3f3f3f7b5e
SJIS-WIN	而基???????}而基???????{^	10001110101001111000101011101110001111110011111100111111001111110011111100111111001111110111110110001110101001111000101011101110001111110011111100111111001111110011111100111111001111110111101101011110	8ea78aee3f3f3f3f3f3f3f7d8ea78aee3f3f3f3f3f3f3f7b5e
EUC-JP	而基???????}而基???????{^	10111100101010011011010011110000001111110011111100111111001111110011111100111111001111110111110110111100101010011011010011110000001111110011111100111111001111110011111100111111001111110111101101011110	bca9b4f03f3f3f3f3f3f3f7dbca9b4f03f3f3f3f3f3f3f7b5e
UTF-8	而基렱쿰렱희렱쇤햐}而基렱쿰렱희렱쇤햐{^	111010001000000010001100111001011001111110111010111010111010000010110001111011001011111110110000111010111010000010110001111011011001110110101100111010111010000010110001111011001000011110100100111011011001011010010000011111011110100010000000100011001110010110011111101110101110101110100000101100011110110010111111101100001110101110100000101100011110110110011101101011001110101110100000101100011110110010000111101001001110110110010110100100000111101101011110	e8808ce59fbaeba0b1ecbfb0eba0b1ed9daceba0b1ec87a4ed96907de8808ce59fbaeba0b1ecbfb0eba0b1ed9daceba0b1ec87a4ed96907b5e
UHC	而基렱쿰렱희렱쇤햐}而基렱쿰렱희렱쇤햐{^	111011001011101111010000111100011000111010111110110001001111000110001110101111101100100011110001100011101011111010111100111010011100011111100001011111011110110010111011110100001111000110001110101111101100010011110001100011101011111011001000111100011000111010111110101111001110100111000111111000010111101101011110	ecbbd0f18ebec4f18ebec8f18ebebce9c7e17decbbd0f18ebec4f18ebec8f18ebebce9c7e17b5e

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)