Sunteți pe pagina 1din 26

Curso DE BIOINFORMATICA Clase 1.

Introduccin general
Lic. T.M. Antonio Flores Msc(C) Bioq. y Biol. Molecular

INTRODUCCION A LA BIOINFORMATICA
La Biologia esta en el medio de un paradigma manejado por la tecnologia computacional. Aunque es ya de por si una ciencia informacional en muchos aspectos, el campo de la biologia ha llegado a ser rapidamente mucho mas computacional y analitico. Los avances rapidos en investigacion genetica y bioquimica, combinadas con las herramientas proveidas por la biotecnologia moderna han generado volumenes masivos de datos geneticos y secuencias de proteinas. La Bioinformatica ha sido definida como un medio para analizar, comparar, mostrar graficamente, modelar, almacenar, sistematizar, buscar y finalemente distribuir informacion biologica que incluye secuencias, estructuras, funcion y filogenia. Asi la Bioinformatica puede ser definida como una disciplina que genera herramientas computacionales, bases de datos y metodos para apoyar la investigacion genomica y post-genomica. Esta comprende el estudio de la estructura y funcion del ADN, Genes y expresion genetica, produccion de proteinas, estructura y funcion, sistemas geneticos de regulacion y aplicaciones clinicas. La Bioinformatica necesita de las ciencias de la computacion, matematicas, estadistica, medicina y biologia.

Definicin
La Bioinformtica es el campo de la ciencia en el que la Biologa, la ciencia de la computacin y la tecnologa de la informacin emergen en una sola disciplina. Hay tres importantes sub disciplinas dentro de la bioinformtica: 1. El desarrollo de nuevos algoritmos y estadstica con los cuales evaluar la relacin entre miembros de grandes set de datos; 2. el anlisis e interpretacin de varios tipos de datos incluyendo secuencias de nucletidos y aminocidos, dominios de protenas y estructuras de las mismas; y por ultimo 3. El desarrollo e implementacin de herramientas que permiten el acceso eficiente y manejo de diferentes tipos de informacin

La bioinformtica puede ser usada en los siguientes campos:


Medicina Molecular Medicina Preventiva Terapia Gnica Desarrollo de nuevas drogas Limpieza de desechos biolgicos Estudios de cambios climticos Fuentes de energa alternativa Biotecnologa Resistencia microbiana Anlisis forense Estudios de evolucin Mejoramiento de cultivos Resistencia a insectos Mejoramiento de la calidad nutricional

Breve historia

Eventos importantes en la historia de la Bioinformatica 1665 Robert Hooke published Micrographia, described the cellular structure of cork. He also described microscopic examinations of fossilized plants and animals, comparing their microscopic structure to that of the living organisms they resembled. He argued for an organic origin of fossils, and suggested a plausible mechanism for their formation.

1683 Antoni van Leeuwenhoek discovered bacteria. 1686 John Ray, John Ray's in his book "Historia Plantarum" catalogued and described 18,600 kinds of plants. His book gave the first definition of species based upon common descent. 1843 Richard Owen elaborated the distinction of homology and analogy. 1864 Ernst Haeckel (Hckel) outlined the essential elements of modern zoological classification. 1865 Gregory Mendel (1823-1884), Austria, established the theory of genetic inheritance. 1902 The chromosome theory of heredity is proposed by Sutton and Boveri, working independently. 1962 Pauling's theory of molecular evolution 1905 The word "genetics" is coined by William Bateson. 1913 First ever linkage map created by Columbia undergraduate Alfred Sturtevant (working with T.H. Morgan). 1930 Tiselius, Uppsala University, Sweden, A new technique, electrophoresis, is introduced by Tiselius for separating proteins in solution. "The moving-boundary method of studying the electrophoresis of proteins" (published in Nova Acta Regiae Societatis Scientiarum Upsaliensis, Ser. IV, Vol. 7, No. 4)

1946 Genetic material can be transferred laterally between bacterial cells, as shown by Lederberg and Tatum. 1952 Alfred Day Hershey and Martha Chase proved that the DNA alone carries genetic information. This was proved on the basis of their bacteriophage research. 1961 Sidney Brenner, Franois Jacob, Matthew Meselson, identify messenger RNA, 1965 Margaret Dayhoff's Atlas of Protein Sequences

Eventos importantes en la historia de la Bioinformtica. Continuacin.

1970 Needleman-Wunsch algorithm 1977 DNA sequencing and software to analyze it (Staden) 1981 Smith-Waterman algorithm developed 1981 The concept of a sequence motif (Doolittle) 1982 GenBank Release 3 made public 1982 Phage lambda genome sequenced 1983 Sequence database searching algorithm (Wilbur-Lipman) 1985 FASTP/FASTN: fast sequence similarity searching 1988 National Center for Biotechnology Information (NCBI) created at NIH/NLM 1988 EMBnet network for database distribution 1990 BLAST: fast sequence similarity searching 1991 EST: expressed sequence tag sequencing 1993 Sanger Centre, Hinxton, UK 1994 EMBL European Bioinformatics Institute, Hinxton, UK 1995 First bacterial genomes completely sequenced 1996 Yeast genome completely sequenced 1997 PSI-BLAST 1998 Worm (multicellular) genome completely sequenced 1999 Fly genome completely sequenced 2000 Jeong H, Tombor B, Albert R, Oltvai ZN, Barabasi AL. The large-scale organization of metabolic networks. Nature 2000 Oct 5;407(6804):651-4, PubMed 2000 The genome for Pseudomonas aeruginosa (6.3 Mbp) is published. 2000 The A. thaliana genome (100 Mb) is secquenced. 2001 The human genome (3 Giga base pairs) is published.

Herramientas Bioinformaticas
Pueden ser categorizadas en las siguientes categorias: 1. Herramientas de Similaridad y homologia. 2. Analisis de funcion de proteinas. 3. Analisis estructural. 4. Analisis de secuencias.

Herramientas Bioinformaticas. Continuacion


Herramientas de similaridad y homologia El termino Homologia implica una relacion evolucionaria comun entre dos secuencias a analizar. Las secuencias homologas son secuencias que estan relacionadas por divergencia de un ancestro comun. Asi el grado de similaridad entre dos secuencias puede se medida, mientras su homologia es un caso de ser verdadera o falsa. Este set de herramientas puede ser usada para identificar similaridades entre secuencias consultadas (query) nuevas de estructuras y funciones desconocidas y secuencias de las bases de datos cuya estructura y funcion han sido elucidados. Analisis de funcion de proteinas El analisis de funcion es identificar y mapear todos los elementos funcionales (tanto codantes como no codantes) en un genoma. Este grupo de programas nos permite comparar las secuencias de proteinas con bases de datos secundarias que contienen informacion en motifs, firmas y dominios de proteinas. Los altos puntajes significantes contra esos diferentes patrones en la base de datos nos permite aproximar la funcion bioquimica de nuestra proteinas consultada. Analisis estructural Este set de herramientas nos permite comparar estructuras con bases de datos conocidas. La funcion de una proteinas es mas directamente una consecuencia de su estructura, mas que su secuencia con homologos estructurales tendiendo a compartir funciones. La determinacion de las estructuras 2D/3D es crucial en el estudio de su funcion. Analisis de secuencias Este set de herramientas nos permite llevar un analisis mas detallado de nuestra secuencia a consultar, incluyendo analisis evolucionario, identificacion de mutaciones, islas de CpG, etc. La identificacion de esos y otras propiedades biologicas son las claves que ayudan a la busqueda para elucidar la funcion especifica de las secuencias.

Herramientas Bioinformaticas que aprenderemos


Swiss pdb viewer Clustal X BLAST Herramientas para diseo de primers http://expasy.org/tools/

Que habilidades necesitamos como principiantes?


Conocimientos basicos de Biologia Molecular. Nivel basico-intermedio de Computacion e internet. Una Pizca de suerte. Paciencia y dedicacion. http://www.roseindia.net/bioinformatics/bioi nformatics_tools.shtml

Habilidades requeridas para llegar a ser un Bioinformtico exitoso


Biologia Molecular. Central Dogma of molecular biology Alguna experiencia con uno o mas paquetes de sofware de Biologia Molecular. Aprender a usar sofware de analisis de secuencias modelamiento molecular. Dominar algunos de los sofware como BLAST, FASTA etc. Aprender Linux o Unix. Lenguaje de programacion tales como C/C++, Perl o Python, Java and HTML debiera ser conocido por Bioinformaticos. Sistemas de manejo de bases de datos. Aprender Oracle y MySQL (Free Database Server) los que son extensamente usados para almacenar Gigabites de datos para futuros analisis.

CONCEPTOS BASICOS DE BIOLOGIA MOLECULAR

Composicion de acidos nucleicos

Codigo Genetico

Dogma central de la biologia molecular

Estructura de las regiones en genes de eucariotas y procariotas

Splicing en eucariotas

Estructura secundaria de una proteina

Base de datos Biolgicas


ENTREZ NCBI (National Center for Biotechnology Information) DDBJ (DNA Data Bank of Japan) EMBL (European Molecular Biology Laboratory)

Entrez: A Discovery System


Word weight
PubMed abstracts

Pre-computed and pre-compiled data. 3 -D 3-D Taxonomy

Phylogeny

Structure Structure A potential gold mine of undiscovered relationships. Gene

VAST
Neighbors Related Structures

Used less than expected.

BLAST

Nucleotide sequences
Hard Link

Protein sequences

BLAST
Neighbors Related Sequences BLink Domains

Neighbors Related Sequences

S-ar putea să vă placă și