Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????????????????	00111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f
SJIS-WIN	繞??宜?ぜ衰??歪??惟??筌??誼	111000111000010100111111001111111000101101011000001111111000001010111010100100001000101000111111001111111001100001100011001111110011111110001000110100100011111100111111111000101010001100111111001111111000101101100010	e3853f3f8b583f82ba908a3f3f98633f3f88d23f3fe2a33f3f8b62
EUC-JP	繞??宜?ぜ衰??歪??惟??筌??誼	111001011110010100111111001111111011010110111001001111111010010010111100101111111110101000111111001111111100111111000100001111110011111110110000110101000011111100111111111001001010010100111111001111111011010111000011	e5e53f3fb5b93fa4bcbfea3f3fcfc43f3fb0d43f3fe4a53f3fb5c3
UTF-8	繞볤퀡宜배ぜ衰ⓥ뼳歪묎섹惟듭춷筌뚯슦誼	111001111011100110011110111010111011001110100100111011011000000010100001111001011010111010011100111010111011000010110000111000111000000110011100111010001010000110110000111000101001001110100101111010111011110010110011111001101010110110101010111010111010110010001110111011001000010010111001111001101000001110011111111010111001001110101101111011001011011010110111111001111010110110001100111010111001101010101111111011001000101010100110111010001010101010111100	e7b99eebb3a4ed80a1e5ae9cebb0b0e3819ce8a1b0e293a5ebbcb3e6adaaebac8eec84b9e6839feb93adecb6b7e7ad8ceb9aafec8aa6e8aabc
UHC	繞볤퀡宜배ぜ衰ⓥ뼳歪묎섹惟듭춷筌뚯슦誼	1110100110100100100100111110101010110011100101011110101111110001101110011110100010101010101111001110000111110001101010001110001010010110101101101110100011100000100100011110101010111100101111011110101011101110101101011110110010101101100100111110111110100111100011001110110010011010101100001110101111111110	e9a493eab395ebf1b9e8aabce1f1a8e296b6e8e091eabcbdeaeeb5ecad93efa78cec9ab0ebfe

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)