Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????????[?????????[^	001111110011111100111111001111110011111100111111001111110011111100111111010110110011111100111111001111110011111100111111001111110011111100111111001111110101101101011110	3f3f3f3f3f3f3f3f3f5b3f3f3f3f3f3f3f3f3f5b5e
SJIS-WIN	霄ｰｾﾄ鞁瘤ｲ[霄ｰｾﾄ鞁瘤ｲ[^	11101000101110101011000011110001100011101011111011000100111010001101100111110011111010011110000110001110101100100101101111101000101110101011000011110001100011101011111011000100111010001101100111110011111010011110000110001110101100100101101101011110	e8bab0f18ebec4e8d9f3e9e18eb25be8bab0f18ebec4e8d9f3e9e18eb25b5e
EUC-JP	霄ｰ?ｾﾄ鞁?瘤ｲ[霄ｰ?ｾﾄ鞁?瘤ｲ[^	1111000010111100100011101011000000111111100011101011111010001110110001001111000011011011001111111110000111101110100011101011001001011011111100001011110010001110101100000011111110001110101111101000111011000100111100001101101100111111111000011110111010001110101100100101101101011110	f0bc8eb03f8ebe8ec4f0db3fe1ee8eb25bf0bc8eb03f8ebe8ec4f0db3fe1ee8eb25b5e
UTF-8	霄ｰｾﾄ鞁瘤ｲ[霄ｰｾﾄ鞁瘤ｲ[^	111010011001110010000100111011111011110110110000111011101000010010001001111011111011110110111110111011111011111010000100111010011001111010000001111011101000101110011100111001111001100010100100111011111011110110110010010110111110100110011100100001001110111110111101101100001110111010000100100010011110111110111101101111101110111110111110100001001110100110011110100000011110111010001011100111001110011110011000101001001110111110111101101100100101101101011110	e99c84efbdb0ee8489efbdbeefbe84e99e81ee8b9ce798a4efbdb25be99c84efbdb0ee8489efbdbeefbe84e99e81ee8b9ce798a4efbdb25b5e
UHC	???????瘤?[???????瘤?[^	0011111100111111001111110011111100111111001111110011111111010111101110110011111101011011001111110011111100111111001111110011111100111111001111111101011110111011001111110101101101011110	3f3f3f3f3f3f3fd7bb3f5b3f3f3f3f3f3f3fd7bb3f5b5e

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)