Documente Academic
Documente Profesional
Documente Cultură
Ingeniera en Biotecnologa
Informe de Bioinformtica
Taller No.1
Nombre: Anah Boada
Fecha: 07 de Noviembre-2016
Profesor: Dr. Francisco Flores
OBJETIVOS
Objetivo General:
Identificar las Bases de datos biolgicas y formatos de secuencias a partir de
ejercicios de aprendizaje.
Objetivos Especficos:
Revisar y entender el uso de las diferentes bases de datos biolgicas
disponibles en la red.
Aprender a realizar bsquedas de secuencias biolgicas en las bases de
datos.
Conocer los diferentes formatos de secuencias existentes para su uso en
herramientas bioinformticas.
1. Bases de datos biolgicas
a) Ingresar y familiarizarse con cada una de las siguientes bases de datos
biolgicas:
NCBI: El Centro Nacional para la Informacin Biotecnolgica es parte de la
Biblioteca Nacional de Medicina de Estados Unidos. El NCBI ofrece adems algunas
herramientas bioinformticas para el anlisis de secuencias de ADN, ARN y
protenas, siendo BLAST una de las ms usadas. NCBI alberga genoma secuenciado
en GenBank, y un ndice de los artculos biomdicos de investigacin en PubMed
Central y PubMed, as como otra informacin relevante a la biotecnologa.
EMBL/em
GCG
PLAIN/Raw
ALR14683
629 aa
linear
BCT
02-SEP-2016
pyruvate dehydrogenase [Vibrio natriegens NBRC 15636 =
ATCC 14048 = DSM 759].
ALR14683
Source
1..629
/organism="Vibrio natriegens
NBRC 15636 = ATCC 14048 = DSM
759"
/strain="ATCC 14048"
/isolation_source="salt
marsh mud"
/culture_collection="ATCC:14048"
/db_xref="taxon:1219067"
/chromosome="1"
/country="USA"
/collection_date="27-Feb2012"
Protei
n
1..629
dehydrogenase"
/product="pyruvate
/EC_number="2.3.1.12"
Region
s
1..629
/region_name="aceF"
/note="pyruvate
dehydrogenase dihydrolipoyltransacetylase;
Validated; PRK11854"
/db_xref="CDD:236999"
Region
3..74
/region_name="lipoyl_domain"
/note="Lipoyl domain of the
dihydrolipoyl acyltransferase
component (E2) of 2-oxo acid
dehydrogenases. 2-oxo acid
dehydrogenase multienzyme
complexes, like pyruvate
dehydrogenase (PDH), 2oxoglutarate dehydrogenase (OGDH)
and branched-chain 2-oxo
acid...; cd06849"
/db_xref="CDD:133458"
Region
105..176
/region_name="lipoyl_domain"
/note="Lipoyl domain of the
dihydrolipoyl acyltransferase
component (E2) of 2-oxo acid
dehydrogenases. 2-oxo acid
dehydrogenase multienzyme
complexes, like pyruvate
dehydrogenase (PDH), 2oxoglutarate dehydrogenase (OGDH)
and branched-chain 2-oxo
acid...; cd06849"
/db_xref="CDD:133458"
Region
205..276
/region_name="lipoyl_domain"
/note="Lipoyl domain of the
dihydrolipoyl acyltransferase
component (E2) of 2-oxo acid
dehydrogenases. 2-oxo acid
dehydrogenase multienzyme
complexes, like pyruvate
dehydrogenase (PDH), 2oxoglutarate dehydrogenase (OGDH)
and branched-chain 2-oxo
acid...; cd06849"
/db_xref="CDD:133458"
Region
pfam02817"
324..357
/region_name="E3_binding"
/note="e3 binding domain;
/db_xref="CDD:280908"
415..629
/region_name="2-oxoacid_dh"
/note="2-oxoacid
dehydrogenases acyltransferase (catalytic
domain); pfam00198"
/db_xref="CDD:278621"
Region
Sites
Site
surface"
Site
order(31,38..43,47)
/site_type="other"
/note="E3 interaction
/db_xref="CDD:133458"
41
/site_type="other"
/note="lipoyl attachment
site [posttranslational
modification]"
/db_xref="CDD:133458
CDS
1..629
/gene="aceF"
/locus_tag="PN96_01340"
/coded_by="CP009977.1:264390..266279"
/inference="EXISTENCE:
similar to AA
sequence:RefSeq:WP_020333942.1"
/note="E2 component of
pyruvate dehydrogenase multienzyme
complex; in Escherichia coli
AceF contains three
N-terminal lipoyl domains;
Derived by automated
computational analysis using
gene prediction method:
Protein Homology."
/transl_table=11
ORIGE
N
e)
En el grfico se puede observar las caractersticas de las protenas separadas en
otro nivel de la secuencia, adems se puede identificar caractersticas de las
regiones de la base de datos de dominio conservado (CDD), y de igual forma
podemos conocer la medida exacta de cada dominio e identificar el tamao de
cada fragmento.
f) Obtener la secuencia codificante de la protena (nucletidos)
(haciendo click derecho en CDS y abriendo nueva pestaa)
CONCLUSIONES:
Gracias a este nuevo material bioinformtico se logr identificar las Bases de datos
biolgicas y formatos de secuencias a partir de ejercicios de aprendizaje, que se
encuentran disponibles en la red y que para el biotecnlogo son un arma poderosa
para su investigacin. Se pudo realizar bsquedas de secuencias biolgicas en las
bases de datos, conociendo los diferentes formatos de secuencias existentes para
su uso en herramientas bioinformticas.