Sunteți pe pagina 1din 23

Tehnici bioinformatice aplicate in determinarea omologiei

structurale
Alinierea secventelor proteinelor si de acizi nucleici- (aminoacizi,
nucleotide)

Scopul alinierii: obținerea de informații privind similaritatea dintre


secvențe
Elementele cheie in procesul de aliniere:
 Stabilirea tipului de aliniere
globală: se considera intreaga lungime a secventelor proteice
locală: se considera un nr limitat de AA (domenii active,
domenii functionale,etc)
multiplă-mai mult de trei secvente in aliniere(vezi LP Uniprot)
simpla-doua secvente in aliniere (vezi LP Uniprot)
 Stabilirea matricilor de scor (rezultatul alinierilor), care vor fi
utilizate pentru a evalua calitatea alinierii

 Alegerea algoritmului de construire al alinierii (algoritm exact vs.


algoritm aproximativ)

 Stabilirea metodelor statistice utilizate pentru a evalua calitatea


alinierii
Alinierea - Procedeu de comparare a două sau mai multor
secvenţe, prin căutarea caracterelor individuale (diferentelor) sau a
pattern-urilor cu ordine identică în secvenţe

Alinierea simpla- compararea a doua secvente proteice/ acizi


nucleici

Alinierea multipla: compararea mai multor secvente proteice/


acizi nucleici
- identificarea de similarități între mai multe secvențe ADN sau de
aminoacizi (proteine)
Similaritatea identificată intr-o serie de proteine/acizi nucleici este cu atât mai
semnificativă cu cat numarul de structuri chimice (proteine, acizi nucleici)
este mai mare:

Identitatea structurala obtinuta intr-o serie de proteine/acizi nucleici este cu


atât mai semnificativă cu cat numarul de structuri chimice (proteine, acizi
nucleici) este mai mare:

-aceasta sugerează prezența unor regiuni conservate în cadrul mai multor


specii in lantul evolutiv

Identificarea similarităților este utilă:

-în proiectarea experimentelor pentru testarea și modificarea funcțiilor unor


proteine specifice,

-în predicția funcției și structurii proteinelor

- în identificarea de noi membrii în familiile de proteine


Rezultatul alinierilor o numim matrice de aliniere

Alinierea a două secvențe: matrice cu două linii și L coloane (L=nr de


elemente ale alinierii)

Alinierea a K secvențe: matrice cu K linii și L coloane

Exemplu: K=3 (n1=lg. secvenței 1, n2=lg. secvenței 2, n3=lg. secvenței 3)


L>=max{n1,n2,n3}
O matrice de scor (sau de substituție) Se schimba un AA cu un alt AA

conține pentru fiecare pereche de elemente (nucleotide sau


aminoacizi) o valoare care exprimă șansa ca elementele respective să
apară în alinierea unor secvențe corelate din punct de vedere biologic

NOI PRACTIC, CAUTAM SANSA CA AA SA NU FIE SCHIMBATI A.I


ASEMANARILE SA FIE F MARI SI SA SPUNEM CA PROTEINA SI-A
PASTRAT SECVENTA DE-A LUNGUL EVOLUTIEI

O matrice de scor are dimensiunea:

 4x4 - în cazul secvențelor de nucleotide

 20x20 – în cazul secvențelor de aminoacizi


Scorul M(i,j) asociat unei perechi de aminoacizi se poate calcula în două
moduri:

 Pe baza proprietăților fizico-chimice ale aminoacizilor din pereche


(polarizare,hidrofobicitate,mici, mari etc.)

GHID= CE IDENTIFICAM IN UNIPROT DUPA CE OBTINEAM ALINIERILE

 Pe baza unui model probabilist construit folosind frecvența de apariție a


perechii în secvențe despre care se cunoaște că au evoluat pornind de la
același strămoș

(M(i,j) reflectă frecvența situațiilor în care aminoacidul i înlocuiește aminoacidul j în


secvențe înrudite).
aliniaţi secvenţa `abcdef`cu secven’a `abdgf`

Scriem a doua secvenţă sub prima:

abcdef
abdgf

Mutăm secvenţa astfel încât să obţinem cea mai bună potrivire

Identificăm caracterele identice prin linii verticale


Ce program să fie folosit?
Există trei programe principale disponibile:
BLAST,
FASTA
BLITZ.

În general, se recomandă ca prima dată să fie utilizat programul BLAST.


BLAST este o varianta rapidă care dă bune rezultate. A SE VEDEA BD
UNIPROT

BLAST (Basic Local Alignment Search Tool) este algoritmul utilizat prin care se
aliniaza secvenţa introdusă contra secvenţelor din baza de date interogată.

Metode statistice sunt aplicate pentru a aprecia semnificaţia potrivirilor.

Aliniamentele raportate (adică secventele din baza de date care pot fi identice cu
secvenţa introdusă) sunt listate în ordinea semnificanţei(procentul de identitate), aşa
cum a fost estimată de statisticile aplicate.

BLASTN - Compară o secvenţă de nucleotide cu secvenţele de nucleotide din


baza de date.
BLASTP - Compară o secvenţă de aminoacizi cu sevenţele de aminoacizi din
baza de date de proteine interogată.
Baze de date in care putem efectua alinieri
https://www.expasy.org/
https://www.expasy.org/proteomics
https://web.expasy.org/blast/
https://blast.ncbi.nlm.nih.gov/Blast.cgi
https://www.expasy.org/proteomics- T-Coffee algoritm de aliniere
http://tcoffee.crg.cat/apps/tcoffee/index.html
Genomul uman

S-a stabilit delimitarea genomului uman în două fracțiuni:


genom nuclear și genom mitocondrial.
Genomul nuclear conține 99,5% din ADN, este complex și deține totalitatea
informației genetice necesare pentru sinteza proteică și pentru transmiterea
caracterelor de la generație la generație.

Genomul mitocondrial conține doar 0,5% din ADN, este redus și deține informația
pentru sinteza enzimelor respiratorii mitocondriale implicate în mecanismul
respirației celulare și în supraviețuirea celulei.

Datorită faptului că secvențele de baze azotate din structura ADN-ului se repetă


diferit de-a lungul macromoleculei, s-au identificat în genomul uman mai multe
tipuri de ADN și anume: ADN înalt repetitiv, ADN moderat repetitiv și ADN
nerepetitiv.
ADN inalt repetitiv = este reprezentat de secvente de ADN f scurte
repetate. Formeaza aproximativ 10% din genom.

ADNul moderat repetitive - este reprezentat de secvente scurte de ADN si


reprezinta 35% din genom

https://www.youtube.com/watch?v=MvuYATh7Y74
Cum descifrăm genomul uman - Mark J. Kiel

https://www.youtube.com/watch?v=AHvkbV3wPIA
Bioinformatics - The Human Genome Project
Baze de date utile in studiul genomului uman

https://www.ncbi.nlm.nih.gov/gene/?term=human

https://www.ncbi.nlm.nih.gov/genome/?term=human
https://www.youtube.com/watch?v=wtebnV_QFQU

Chromosome 21 - How accidental inheritance can lead to Downs syndrome

S-ar putea să vă placă și