Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????????????????	00111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f
SJIS-WIN	褥?∥違??喩??榮??寃??娃??飮	111001011111000100111111100000010110000110001000111000010011111100111111100110100110011100111111001111111001111011000100001111110011111110011011100000110011111100111111100010001010000100111111001111111001111101011010	e5f13f816188e13f3f9a673f3f9ec43f3f9b833f3f88a13f3f9f5a
EUC-JP	褥?‖違??喩??榮??寃??娃??飮	111010101111001100111111101000011100001010110000111000110011111100111111110100111100100000111111001111111101110011000110001111110011111111010101111000110011111100111111101100001010001100111111001111111101110110111011	eaf33fa1c2b0e33f3fd3c83f3fdcc63f3fd5e33f3fb0a33f3fddbb
UTF-8	褥띕∥違얗윀喩쎼렃榮싩뵳寃쇨성娃븐뼚飮	111010001010010010100101111010111001110110010101111000101000100010100101111010011000000110010101111011001001011010010111111011001001110010000000111001011001011010101001111011001000111010111100111010111010000010000011111001101010011010101110111011001000101110101001111010111011010110110011111001011010111110000011111011001000011110101000111011001000010010110001111001011010100010000011111010111011100010010000111010111011110010011010111010011010001110101110	e8a4a5eb9d95e288a5e98195ec9697ec9c80e596a9ec8ebceba083e6a6aeec8ba9ebb5b3e5af83ec87a8ec84b1e5a883ebb890ebbc9ae9a3ae
UHC	褥띕∥違얗윀喩쎼렃榮싩뵳寃쇨성娃븐뼚飮	1110100110110011101101101110101110100001101010111110101011011110101111101110100110011111100010111110101011100111100110111110001110001110100111011110011110110100100110101110011110010100101100011110101010110010101111001110101010111100101110101110100011011111101110101110110010010110101000001110101111100110	e9b3b6eba1abeadebee99f8beae79be38e9de7b49ae794b1eab2bceabcbae8dfbaec96a0ebe6

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)