Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????????????	001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f
SJIS-WIN	癌??影??暎⑨?慂??嗚??	100010101110000000111111001111111000100101100101001111110011111110011101111100111000011101001000001111111001110011001000001111110011111110011010011010100011111100111111	8ae03f3f89653f3f9df387483f9cc83f3f9a6a3f3f
EUC-JP	癌??影??暎??慂??嗚??	1011010011100010001111110011111110110001110001100011111100111111110110101111010100111111001111111101100011001010001111110011111111010011110010110011111100111111	b4e23f3fb1c63f3fdaf53f3fd8ca3f3fd3cb3f3f
UTF-8	癌꿱눎影졿콖暎⑨푶慂딉슛嗚붼뙠	111001111001100110001100111010101011111110110001111010111000100010001110111001011011110110110001111011001010000110111111111011001011110110010110111001101001101010001110111000101001000110101000111011011001000110110110111001101000010110000010111010111001010010001001111011001000101010011011111001011001011110011010111010111011011010111100111010111001100110100000	e7998ceabfb1eb888ee5bdb1eca1bfecbd96e69a8ee291a8ed91b6e68582eb9489ec8a9be5979aebb6bceb99a0
UHC	癌꿱눎影졿콖暎⑨푶慂딉슛嗚붼뙠	111001001101111110110010111010001000011110101010111001111010111110100000111001101011000110010000111001111011001010101000111011111011111010000100111010011011110110001010111011111011110110111000111001111111000010010100111010011000110010100101	e4dfb2e887aae7afa0e6b190e7b2a8efbe84e9bd8aefbdb8e7f094e98ca5

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)