Sunteți pe pagina 1din 11

Exercițiul 2.

Date structurale
Întoarceți-vă la tabelul Search NCBI databases și accesați baza de date Gene. O să
obțineți un tabel a TUTUROR secvențe nucleotidice înregistrate din totă lumea. Însă aveți nevoie
doar de UNA corespunzătoare genei de interes cu referință DOAR la specia umană (Homo
sapiens). Observați pe dreapta meniul Results by taxon, unde trebuie să selectați Homo sapiens.

Ca rezultat o să obțineți link-ul către gena necesară (verificați dacă în coloana MIM este
indicat codul aceleași patologii pepe care ați identificat-o în baza de date OMIM).
Apăsați link-ul corespunzător și o să accesați pagina Full report cu descrierea genei.

Analizați secțiunea Summary pentru a elabora o descriere scurtă a genei.


Căutați pe pagină secvența genei în secțiunea NCBI Reference Sequences (RefSeq),
Genomic. În secțiunea Download trebuie să apăsați link-ul FASTA.
Se va deschide secvența nucleotidică a genei. Copiați-o pentru fișierul de raportare.

Întoarceți-vă la pagina Full report și analizați compartimentul mRNA and Protein(s). O să


observați codurile secvențelor care se încep cu NM sau XM (pentru mRNA) și NP sau XP
(pentru proteine). Apăsați link-ul pentru a accesa pagina cu structura unei proteine, codul cărei se
începe cu NP. Sursa va genera pagina cu descrierea secvenței aminoacidice.
Apăsați link-ul FASTA pentru a obține doar secvența. Copiați secvența pentru raportul
final.

Reveniți la pagina de descriere a proteinei și identificați link-ul către Protein 3D


structures. Selectați unul din ei din listă.
Copiați informația cu referunță la structura proteinei. Imaginea structurii este una
interactivă, vă puteți antrena cu ajutorul mouse-ului să schimbați poziția și rotația molecule
pentru a o analiza. Apoi, descărcați imaginea, folosing formatul PNG al imaginei, și transferați în
fișierul de raportare.
Ulterior, accesați pagina web cu instrumente ENSEMBL: http://www.ensembl.org/. În
câmpul Search scrieți denumirea genei și selectați HUMAN în loc de ALL SPECIES. Apăsați
butonul GO.
O să obțineți o pagină cu rezultate. Selectați unul din ele, precum de ex. APOB (Human
Gene) și accesați linkul. Pe pagina următoare, o să vedeți informații cimilare celor oferite de
bazele de date din NCBI, astfel, trebuie să înțelegeți că toate informații din diferite baze de date
sunt interconectate, oferă informații de aceeași calitate și descriere, iar diferențele posibile se
referă la modul de reprezentare, cantitatea de informații oferite și tipul acestor. Precum puteți
observa, la stânga se află Content panel care Vă ajută să navigați între diferite compartimente.

Ca rezultat al expresiei genei este o moleculă de mRNA, astfel să analizăm transcriptul


genic. Le puteți observa prin apăsarea butonului Show transcript table. Copiați informațiile în
următorul tabel.

Name of the transcript Transcript length, bp Protein length, aa UniProt ID


APOB-201 14121 4563aa NM_000384
NP_000375

In case of more transcript records, include only the first 5.

La etapa următoare, selectați în meniul din stânga categoria Ontologies și apăsați link-ul
GO: Biological process.
În tablul puteți observa informații despre procesele biologice în care protein codificată de către
gena de interes își are funcția. În cazul în care numărul de rezultate este foarte mare, utilizați
câmpul Filter și introduceți o denumire a unui process biologic sau un cuvânt cheie, de ex. lipid.
Copiați rezultatele în următorul table.
Tabel. Procese biologice în care este implicată GENE_NAME
Accession ID Term Definition of the biological process
GO:0006629 lipid metabolic process The chemical reactions and pathways
involving lipids, compounds soluble
in an organic solvent but not, or
sparingly, in an aqueous solvent.
Includes fatty acids; neutral fats,
other fatty-acid esters, and soaps;
long-chain (fatty) alcohols and
waxes; sphingoids and other long-
chain bases; glycolipids,
phospholipids and sphingolipids; and
carotenes, polyprenols, sterols,
terpenes and other isoprenoids.

Apăsați link-ul Accession pentru a trece la pagina unde se oferă definirea Gene Ontology (GO)
a proceselor biologice. Copiați într-un table.
Repetați acțiunea pentru a identifica GO: Molecular function.
Table. Funcții moleculare ale GENE_NAME
Accession ID Term Definition of the molecular process
GO:0005319 lipid transporter activity Enables the directed movement of
lipids into, out of or within a cell, or
between cells.

Analizați diferența dintre definirea proceselor molecular și funcțiile biologice determinate de


proteinele codate de gena respectivă.
Urmăriți link-ul Phenotypes din meniul din stânga.

Copiați tabelul Phenotypes, diseases and traits associated with this gene XXXXX, în care
denumirea fenotipului / patologiei / caracterului a fost înregistrată în careva bază de date în coloana
Source. Urmăriți link-ul menționat acolo pentru a obține informații despre alte resurse, în care informații
specific pot fi găsite. De ex, accesând link-ul OrphaNet (https://www.orpha.net/) este posibil de a
identifica astfel de informații precum Diagnostics tests aplicate în determinarea fenotipului / patologiei /
caracterului corespunzător. Elaborați tabelul în care titlul primei coloane poate să fie diferit, în
dependență de baza de date accesată.
Speciality(ies)/objective(s) / Test method Number
Targeted mutation analysis 29
... ...

Test Purpose(s) Number


Antenatal diagnosis 9
În caz că link-ul Source vă duce la pagina OMIM, trebuie să identificați în meniul din partea
dreaptă referința către GTR, care corespunde Genetic testing registry, ce conține informații
similare. La fel, puteți găsi denumrea laboratoarelor unde astfel de teste se realizează.
Întoarceți-vă la pagina cu rezultatele Phenotype și în tabelul Phenotype, disease and
trait annotations associated with variants in this gene găsiți numărul de variante pentru:
ALL variants with a phenotype annotation XX records
Annotated by HGMD but no phenotype description is publicly available XX records

În meniul din stânga, accesați Genetic variation Variant table. O să obțineți tabelul cu variantele
molecular a genei de interes. În special, informațiile oferite se vor referi la polimorfismele
mononucleotidice (single nucleotide polimorphisms, SNP), fiind cele mai frecvente.

Pentru a mări numărul de rezultate, aplicați filtre:


- setați valoare Global MAF la 0.1-0.5 (MAF – minor allele frequency – este frecvența
variantei gene ice poate determina fenotipul / patologia / caracterul anumit
- setați Consequences la Only Exonic, prin apăsarea butonului corespunzător.
În tabelul resultant, apăsați pe coloana GlobalMAF pentru a aranja rezultatele în ordinea
descrescătoare. Astfel, înscrierea care s-a poziționat prima se va folosi pentru analize ulterioare,
și arată sub forma de cod rsXXXXX. Apăsați link-ul. Din fereastra nouă deschisă, identificați
următoarele informații pentru a le include în raport:
Codul SNP: rs1042031
Alleles: C/A/T
Ancestral form: C
MAF: T – 0.128
Phenotype data: Cholesterol, total; Familial hypercholesterolemia, Familial
hypobetalipoproteinemia, Low-density lipoprotein cholesterol.
Identificați butonul Population genetics. În fereastra obținută găsiți informații ce se
referă la populația Europeană (European population EUR).
Elaborați tabelul cu Alelle frequencies și un graphic de tipul barplot demonstrând
frecvența lor în %. Copiați informația pentru toate populațiile Europene menționate!!! Calculați
frecvența medie a alelelor între toate populații Europene, folosind Excel.
C T
EUR * *
CEU 81.3% 18.7%
…..
TSI 82.7% 17.3%
* - calculați frecvența medie a alelelor în populația Europeasnă, în baza datelor populațiilor
existente.

TSI

...

T
C
CEU

EUR

0.00% 10.00% 20.00% 30.00% 40.00% 50.00% 60.00% 70.00% 80.00% 90.00%100.00%

Creați tabelul referitor la frecvențele genotipice și graphic de tipul barplot cu frecvențele


în %. Copiați informația pentru toate populațiile Europene menționate!!! Calculați frecvența
medie a alelelor între toate populații Europene, folosind Excel.

CC CT TT
EUR
CEU 67.7% 27.3% 5.1%
…..
TSI 66.4% 32.7% 0.9%
* - calculați frecvența medie a genotipurilor în populația Europeană, în baza datelor populațiilor
existente.

TSI

...

TT
CT
CC
CEU

EUR

0.00% 10.00% 20.00% 30.00% 40.00% 50.00% 60.00% 70.00% 80.00% 90.00%100.00%

Astfel, puteți face concluzii despre răspândirea polimorfismului mononucleotidic în


populație, ce vă permite să știți cât de frecvent se întâlnește fenotipul/patologia/caracterul asociat
în populație. Deci, atunci când posedați această informație despre SNP pentru fiecare din pacienți
și identificați asocierea cu datele fenotipice, puteți cunoaște sau prognoza anumit riscul/boală
corespunzătoare sau chear tratmentul, precum și despre factorii mediului care pot mări riscul
asociat cu SNP-ul menționat.
Complexitatea, precum și raționamentul medicului este determinat de faptul că numărul
de SNP-uri relevante este foarte mare pentru utilizarea eficientă și actualmente, numai cele mai
puternic asociate cu bolile rare sau condițiile complexe sunt cunoscute și utilizate. Cu regret, nu
toate din ele pot fi cunoscute pentru fiecare din pacienți, ci doar unele.
Astfel, viitorul Dstră va fi în strânsă dependență cu abilitățile Dstră în aplicarea
informațiilor despre aspectele genomice și cele ale mediului pentru tratamentul potrivit la
momentul necesar prin terapie corespunzătorare unui anumit pacient. (right treatment at the
right moment by a right therapy or drug a certain pacient)!

S-ar putea să vă placă și