Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????????????????	00111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f
SJIS-WIN	勇??維??諭??筌?????淞る?語	1001011101000101001111110011111110001000110110110011111100111111100101110100000000111111001111111110001010100011001111110011111100111111001111110011111110011111110000101000001011101001001111111000110011101010	97453f3f88db3f3f97403f3fe2a33f3f3f3f3f9fc282e93f8cea
EUC-JP	勇??維??諭??筌??佾??淞る?語	11001101101001100011111100111111101100001101110100111111001111111100110110100001001111110011111111100100101001010011111100111111100011111011000011111011001111110011111111011110110001001010010011101011001111111011100011101100	cda63f3fb0dd3f3fcda13f3fe4a53f3f8fb0fb3f3fdec4a4eb3fb8ec
UTF-8	勇싲즾維싨룚諭꾠룋筌믨퀗佾띸춯淞る윪語	111001011000101110000111111011001000101110110010111011001010011010111110111001111011011010101101111011001000101110101000111010111010001110011010111010001010101110101101111010101011111010100000111010111010001110001011111001111010110110001100111010111010111110101000111011011000000010010111111001001011110110111110111010111001110110111000111011001011011010101111111001101011011110011110111000111000001010001011111011001001110010101010111010001010101010011110	e58b87ec8bb2eca6bee7b6adec8ba8eba39ae8abadeabea0eba38be7ad8cebafa8ed8097e4bdbeeb9db8ecb6afe6b79ee3828bec9caae8aa9e
UHC	勇싲즾維싨룚諭꾠룋筌믨퀗佾띸춯淞る윪語	1110100110111000100110101110101110100011100100001110101110101011100110101110011010001111100101101110101110110001100001001110001110001111100010101110111110100111100100101110101010110011100011001110110011101011100011011110011110101101100011001110000111100111101010101110101110011111101010011110010111011110	e9b89aeba390ebab9ae68f96ebb184e38f8aefa792eab38ceceb8de7ad8ce1e7aaeb9fa9e5de

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)