Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????????????????	00111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111	3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f
SJIS-WIN	畏?????臟??円??癌??節	100010001101100000111111001111110011111100111111001111111110010001100110001111110011111110001001011111100011111100111111100010101110000000111111001111111001000011011111	88d83f3f3f3f3fe4663f3f897e3f3f8ae03f3f90df
EUC-JP	畏?????臟??円??癌??節	101100001101101000111111001111110011111100111111001111111110011111000111001111110011111110110001110111110011111100111111101101001110001000111111001111111100000011100001	b0da3f3f3f3f3fe7c73f3fb1df3f3fb4e23f3fc0e1
UTF-8	畏울슈溫싢닾臟띺깴円욑숯癌뉛슬節	111001111001010110001111111011001001101010111000111011001000101010001000111001101011101010101011111011001000101110100010111010111000101110111110111010001000011110011111111010111001110110111010111010101011100110110100111001011000011010000110111011001001101010010001111011001000100010101111111001111001100110001100111010111000100110011011111011001000101010101100111001111010111110000000	e7958fec9ab8ec8a88e6baabec8ba2eb8bbee8879feb9dbaeab9b4e58686ec9a91ec88afe7998ceb899bec8aace7af80
UHC	畏울슈溫싢닾臟띺깴円욑숯癌뉛슬節	1110100011100110101111111110111110111101101101001110100010101110100110101110001010001000101011001110110111110100100011011110100110000011101000101110010111110111100111101110111110111101101000011110010011011111100001111110111110111101101111011110111110111101	e8e6bfefbdb4e8ae9ae288acedf48de983a2e5f79eefbda1e4df87efbdbdefbd

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)