Documente Academic
Documente Profesional
Documente Cultură
Integrantes:
Aula: 101
2019-II
I. INTRODUCCION
La comunidad científica que realiza investigación dentro del área biológica, en el afán de
día se enfrenta a mayores retos que implican el manejo de enormes volúmenes de datos
procesamiento y análisis inteligente de los datos, beneficiando los estudios científicos que
permiten conocer mejor las estructuras de los organismos vivos. La complejidad que
Bioinformática
Para poder conocer cómo es que es el procedimiento y que herramientas se utiliza, se hace
uso de la bioinformática, las tareas más importantes de las que se ocupa la bioinformática
consisten en entender las correlaciones, las estructuras y los patrones en los datos
disciplinas, entre las que están la informática, las matemáticas, la estadística, la química
Alcance de la Bioinformática
La biología al igual que todas las ciencias que son base de la investigación científica,
en tiempo real.
informático que tienen que ver con el almacenamiento y procesamiento de datos, entre
las
cuales podemos mencionar las bases de datos (BD)relacionales y semánticas, las bodegas
Con base en su contenido, las bases de datos biológicas se pueden dividir en tres
categorías:
Bases de datos primarias, las cuales contienen datos biológicos originales.
Bodegas de Datos
materia, que varían con el tiempo y que no son transitorios, los cuales soportan el
Ligand Depot es una fuente de datos integrados para encontrar información acerca
información valiosa de una gran cantidad de datos biológicos. Para ello, son
del conocimiento.
Entre las técnicas de minería de datos en bioinformática mas comunes se pueden
destacar:
conjunto de datos.
evolutivo.
conjunto de datos de tal manera que los objetos en el mismo grupo sean
grafica de los datos genómicos. Los mas grandes paquetes de análisis, tales
II. PROCEDIMIENTO
Una vez obtenida la secuencia (en este caso proporcionada por el profesor),
UNIPROT:
a) Copiar la secuencia en PROTPARAM > Compute parameters
(%)
Alanina A 36 7.2
Arginina R 44 8.7
Asparagina N 28 5.6
Aspartato D 30 6.0
Cisteina C 10 2.0
Glutamina Q 17 3.4
Glicina G 26 5.2
Histidina H 13 2.6
Isoleucina I 24 4.8
Leucina L 34 6.8
Lisina K 20 4.0
Metionina M 15 3.0
Fenilalanina F 25 5.0
Prolina P 23 4.6
Serina S 57 11.3
Treonina T 22 4.4
Triptófano W 05 1.0
Tirosina Y 13 2.6
Valina V 36 7.2
La Serina es el aminoácido más abundante de todos y desempeña un importante papel
en la función catalítica de muchas enzimas. Se observa que esta proteína podría tener
funciones catalíticas.
Se observa la
composición y la fórmula
molecular con el conteo
de átomos de la proteína
III. RESULTADOS
PROTPARAM
COMPOSICION DE AMINOACIDOS
Pyl SEC
Trp 0% 0%
Thr
1%
4%
Val Ala
7% 7% Arg Asn
Ser 9% 6%
12%
Asp
Pro 6%
5%
Cantidad de residuos cargados
Glu Cys
Lys 5% 2%
Gly
4% Leu His
Phe Ile 5%
7% 5% 3% Gln
5%
3%
Met
3%
Ala Arg Asn Asp Cys Gln Glu Gly His Ile Leu
Lys Met Phe Pro Ser Thr Trp Val Pyl SEC
0
64
62
60
58 64
56 0
54 55
52
50
N° total de residuos con carga N° total de residuos con carga
negativa (Asp + Glu) positiva (Arg + Lys)
Serie 1 Serie 2
Composición Atómica
4500
3887
4000
3500
3000
2468
2500
2000
1500
500
25
0
Carbono Hidrogeno Nitrogeno Oxigeno Azufre
Serie 1
IV. DISCUSION SOBRE PROTPARAM
aminoácidos esenciales.
desconocido
positiva (-NH3).
La comparación de las columnas nos muestra la cantidad de Aa
observar en el gráfico.
Carbono C 2468
Hidrogeno H 3887
Oxigeno O 751
Azufre S 25
TOTAL, ATOMOS
INTERPRETACIÓN DE DATOS EN UNIPROT
Mediante el uso del programa el total de secuencias más con mayor coinciden es de 250
resultados.
Identity
En esta categoría miramos el porcentaje de identidad que tiene la secuencia dada con los
aminoácidos de cadenas proteica que el sistema posee, por ende, los resultados son
En la imagen anterior observamos que los dos primero poseen una identidad al 100%;
Score
El Score es dado por la suma de valores designados a cada aminoácido, de tal modo que
cuando se hace el alineamiento cada uno de los aminoácidos que coinciden pasan a
tener un valor ya dados para después sumarse y generar una cifra que representara al
Score. Así es como en la siguiente imagen se muestran los 15 alineamientos con los
E-value
En la evaluación del E-Value tendremos en cuenta que entre mas bajo signifique este,
Dando una revisión a las categorías analizadas, resalta de manera automática la elección
Caenorhabditis elegans, que también posee el logo ( ) Que nos da la certeza de que
esta revisado por la página, que de manera más sencilla está avalado como un buen
alineamiento. Y para la comparación de los resultados nos redirigimos más abajo donde
vemos a otra proteína que posee el logo de review, la cual es la Cell death protein 3
Value de 0.0 lo hace una opción mas que viable para la comparación.
RESULTADOS
1. Función:
sustratos.
sustratos.
2. Nombres y taxonomia:
Nombre alternativo:
Caspase ced-3
Dividido en 3:
Identificador
6239 [NCBI]
Taxonómico
Eukaryota › Metazoa › Ecdysozoa › Nematoda › Chromadorea ›
Línea
Rhabditida › Rhabditina › Rhabditomorpha › Rhabditoidea ›
Taxonómica
Rhabditidae › Peloderinae › Caenorhabditis
Nombre alternativo:
Caspase ced-3
Dividido en 3:
Identificador
31234 [NCBI]
Taxonómico
4. PTM / Processing
subunidades p15 y p13. Herramienta que nos permite ver las descripciones de las
V. CONCLUSIONES
respectivas secuencias.
La interfaz nos proporcionó resultados en diversos formatos, prácticos para su
del mismo modo que en esta investigación, por lo que se recomienda el empleo
No existe una matriz única que se pueda usar siempre, se utilizan según la
fueron:
PAM:
relacionadas
BLOSUM
identidad
REFERENCIAS BIBLIOGRAFICAS
Pundir, S., Martin, M. J., & O’Donovan, C. (2016). UniProt Tools. Current Protocols in
(2003). "ExPASy: The proteomics server for in-depth protein knowledge and
https://www.todostuslibros.com/libros/bioinformatica_978-84-7978-645-8
Hirshfield, S. (2001).
Ruth Ortega Herrero. Metabolismo del glutatión y enzimas antioxidantes frente al estrés