Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????????????????	00111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f
SJIS-WIN	褥?∥意??儀??奄??援??碎??筌	111001011111000100111111100000010110000110001000110100110011111100111111100010110101011000111111001111111000100110000010001111110011111110001001100001110011111100111111111000011110101000111111001111111110001010100011	e5f13f816188d33f3f8b563f3f89823f3f89873f3fe1ea3f3fe2a3
EUC-JP	褥?‖意??儀??奄??援??碎??筌	111010101111001100111111101000011100001010110000110101010011111100111111101101011011011100111111001111111011000111100010001111110011111110110001111001110011111100111111111000101110110000111111001111111110010010100101	eaf33fa1c2b0d53f3fb5b73f3fb1e23f3fb1e73f3fe2ec3f3fe4a5
UTF-8	褥띕∥意덌쭏儀륁젘奄멸램援쏁쥗碎몄탮筌	111010001010010010100101111010111001110110010101111000101000100010100101111001101000010010001111111010111000110110001100111011001010110110001111111001011000010010000000111010111010010110000001111011001010000010011000111001011010010110000100111010111010100110111000111010111001111010101000111001101000111110110100111011001000111110000001111011001010010110010111111001111010001010001110111010111010101010000100111011011000001110101110111001111010110110001100	e8a4a5eb9d95e288a5e6848feb8d8cecad8fe58480eba581eca098e5a584eba9b8eb9ea8e68fb4ec8f81eca597e7a28eebaa84ed83aee7ad8c
UHC	褥띕∥意덌쭏儀륁젘奄멸램援쏁쥗碎몄탮筌	1110100110110011101101101110101110100001101010111110101111110010100010001110111110100111100010001110101111110000100011111110110010100000100101001110010111110010101110001110101010110111101001011110101010110101100110111110011110100010100011011110000111101111101110001110110010110101100011101110111110100111	e9b3b6eba1abebf288efa788ebf08feca094e5f2b8eab7a5eab59be7a28de1efb8ecb58eefa7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)