Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????????????????	00111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f
SJIS-WIN	額??鎰??遺???▲?油??濡レ??	1000101001111010001111110011111111101000010011000011111100111111100010001110001000111111001111110011111110000001101000110011111110010110111110110011111100111111100101000100011110000011100011000011111100111111	8a7a3f3fe84c3f3f88e23f3f3f81a33f96fb3f3f9447838c3f3f
EUC-JP	額??鎰??遺??璵▲?油??濡レ??	10110011110110110011111100111111111011111010110100111111001111111011000011100100001111110011111110001111110011001110011010100010101001010011111111001100111111010011111100111111110001111010100010100101111011000011111100111111	b3db3f3fefad3f3fb0e43f3f8fcce6a2a53fccfd3f3fc7a8a5ec3f3f
UTF-8	額곗눊鎰앾쭓遺밴슈璵▲룊油붼뼸濡レ뵂歷	111010011010000110001101111010101011001110010111111010111000100010001010111010011000111010110000111011001001010110111110111011001010110110010011111010011000000110111010111010111011000010110100111011001000101010001000111001111001001010110101111000101001011010110010111010111010001110001010111001101011001010111001111010111011011010111100111010111011110010111000111001101011111110100001111000111000001110101100111010111011010110000010111011111010011010001100	e9a18deab397eb888ae98eb0ec95beecad93e981baebb0b4ec8a88e792b5e296b2eba38ae6b2b9ebb6bcebbcb8e6bfa1e383acebb582efa68c
UHC	額곗눊鎰앾쭓遺밴슈璵▲룊油붼뼸濡レ뵂歷	1110010011111110101100001110110010000111101010001110110011110000100111011110111110100111100010111110101110110110101110011110101010111101101101001110011010100101101000011110001110001111100010011110101011111010100101001110100110010110101110111110101110100001101010111110110010010100100010001110011010111000	e4feb0ec87a8ecf09defa78bebb6b9eabdb4e6a5a1e38f89eafa94e996bbeba1abec9488e6b8

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)