Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????????????????	00111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f
SJIS-WIN	褥?∥違??喩??榮??寃??筌??游	111001011111000100111111100000010110000110001000111000010011111100111111100110100110011100111111001111111001111011000100001111110011111110011011100000110011111100111111111000101010001100111111001111111001111111100000	e5f13f816188e13f3f9a673f3f9ec43f3f9b833f3fe2a33f3f9fe0
EUC-JP	褥?‖違??喩??榮??寃??筌??游	111010101111001100111111101000011100001010110000111000110011111100111111110100111100100000111111001111111101110011000110001111110011111111010101111000110011111100111111111001001010010100111111001111111101111011100010	eaf33fa1c2b0e33f3fd3c83f3fdcc63f3fd5e33f3fe4a53f3fdee2
UTF-8	褥띕∥違얗윀喩쎼렃榮싩뵳寃쇨성筌먲퐣游	111010001010010010100101111010111001110110010101111000101000100010100101111010011000000110010101111011001001011010010111111011001001110010000000111001011001011010101001111011001000111010111100111010111010000010000011111001101010011010101110111011001000101110101001111010111011010110110011111001011010111110000011111011001000011110101000111011001000010010110001111001111010110110001100111010111010100010110010111011011001000010100011111001101011100010111000	e8a4a5eb9d95e288a5e98195ec9697ec9c80e596a9ec8ebceba083e6a6aeec8ba9ebb5b3e5af83ec87a8ec84b1e7ad8ceba8b2ed90a3e6b8b8
UHC	褥띕∥違얗윀喩쎼렃榮싩뵳寃쇨성筌먲퐣游	1110100110110011101101101110101110100001101010111110101011011110101111101110100110011111100010111110101011100111100110111110001110001110100111011110011110110100100110101110011110010100101100011110101010110010101111001110101010111100101110101110111110100111100100001110111110111101100011001110101011111101	e9b3b6eba1abeadebee99f8beae79be38e9de7b49ae794b1eab2bceabcbaefa790efbd8ceafd

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)