Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????????????B	00111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111101000010	3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f42
SJIS-WIN	???絶?????絶??穩??B	00111111001111110011111110010000111000100011111100111111001111110011111100111111100100001110001000111111001111111110001001110010001111110011111101000010	3f3f3f90e23f3f3f3f3f90e23f3fe2723f3f42
EUC-JP	縕??絶??焰??絶??穩??B	1000111111010100110000100011111100111111110000001110010000111111001111111000111111001001111011110011111100111111110000001110010000111111001111111110001111010011001111110011111101000010	8fd4c23f3fc0e43f3f8fc9ef3f3fc0e43f3fe3d33f3f42
UTF-8	縕귨풜絶쏂콒焰배쾫絶잞풘穩롧씥B	11100111101110001001010111101010101101111010100011101101100100101001110011100111101101011011011011101100100011111000001011101100101111011001001011100111100001001011000011101011101100001011000011101100101111101010101111100111101101011011011011101100100111101001111011101101100100101001100011100111101010011010100111101011101000011010011111101100100101001010010101000010	e7b895eab7a8ed929ce7b5b6ec8f82ecbd92e784b0ebb0b0ecbeabe7b5b6ec9e9eed9298e7a9a9eba1a7ec94a542
UHC	縕귨풜絶쏂콒焰배쾫絶잞풘穩롧씥B	11101000101100101000001011101111101111101001111111101111101111101001101111101000101100011000111011100110111110111011100111101000101100101000001011101111101111101001111111101111101111101001101111101000101100011000111011100111100111011011100101000010	e8b282efbe9fefbe9be8b18ee6fbb9e8b282efbe9fefbe9be8b18ee79db942

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)