Bioinformatica este un domeniu al tiinei n care biologia, tiina despre
calculatoare i tehnologia informaiei se contopesc ntr-o singur disciplin. Scopul final al acestei tiine este de a permite att descoperirea unor noi cunotine n biologie, ct i de a crea o perspectiv global din care principiile unificatoare ale biologiei s poat fi deosebite. Exist trei direcii majore de cercetare n bioinformatic:
-dezvoltarea unor noi algoritmi i statistici cu ajutorul crora s poat fi
extrase, dintr-un numr mare de date, acele elemente care prezint trsturi comune.
-analiza i interpretarea diferitelor tipuri de date referitoare la secvenele
de nucleotide i aminoacizi, structura proteinelor.
-dezvoltarea i implementarea unor unelte care s permit accesul
eficient i manipularea diferitelor tipuri de informaii.
De ce este necesar bioinformatica?
Raiunile utilizrii metodelor informatice n rezolvarea problemelor din biologie cuprind:
-o cretere exploziv a informaiilor biologice care impun utilizarea
calculatoarelor la catalogarea i regsirea informaiilor
-o perspectiv mai larg atunci cnd sunt proiectate experimentele. Pe
msur ce trecem de la paradigma gen/protein/boal (caracteristic cercetrii tiinifice fcute de grupuri de oameni de tiin izolate) ctre considerarea ntregului organism, dobndim tot mai multe i mai profunde cunotinte despre sntate i boal (care necesit coordorarea eforturilor tiinifice la nivelul globului). 1
Despre ce este vorba?
Bioinformatica, ca fundament al Diagnosticului genetic, spre exemplu, are din ce n ce mai mult influen asupra vieii fiecruia dintre noi, dar cei mai muli nu realizeaz acest lucru. Bioinformatica asigur baza teoretic i uneltele practice oamenilor de tiin pentru explorarea proteinelor i ADN (DeoxyriboNucleic Acid - DNA). ADN-ul i proteinele sunt mari molecule care constau dintr-un lan de mici radicali numii nucleotide (mononucleotide), respectiv, aminoacizi. Ei constituie blocurile de construcie utilizate de natur, dar aceste elemente de construcie nu sunt utilizate analog cramizilor ntr-o construcie obinuit, deoarece funcia final a moleculei depinde foarte mult de ordinea de asamblare a acestor blocuri. Astfel c este posibil s concepi aceti radicali ca fiind numerotai. Structura 3D (tridimensional) depinde de ordinea acestor radicali. Ordinea aminoacizilor unei anumite proteine este motenit de la ADN corespunztor. Acest bucat de ADN const ntr-o secven ordonat de nucleotide.
Proiectul Genomului uman
Proiectul Genomului uman este o cale de a explora celulele corpului nostru.
Aproape toate celulele noastre (celulele musculare care ne fac s zmbim, celulele creierului care percep umorul i lucrurile ce ne nconjoar, celulele ochilor notrii care capteaz informaia optic i o transmit creierului) conin un set complet al genelor noastre: GENOMUL.
Dac am putea cltori n interiorul corpului nostru, ntr-o celul, am
vedea 23 de perechi de cromozomi mpachetai ntr-un nucleu. Fiecare cromozom conine o lung spiral de ADN (DNA) (asemntoare unei scri). Dac ADN-ul din toi cromozomii unei celule ar fi desfurat i pus cap la cap s-ar obine un ir de atomi a crui lungime ar atinge aproximativ doi metri. Dubla spirala a ADN-ului conine patru tipuri de blocuri de construcie (notate A, T, C, G). Un A se mperecheaz ntotdeauna cu un T i un C cu un G. ADN-ul codeaz cu doar patru litere informaia necesar pentru a face fiecare parte a corpului nostru. Fiecare dintre sutele noastre de gene codific o anumit parte. Molecula p-ARN (RNA-preliminaries) copiaz informaia unei gene ntro molecul mesager: ARN-mesager, notat mARN (mRNA). Blocurile de construcie ale mARN i ADN se numesc baze. Bazele unei secvene de ADN specific ordinea bazelor unei secvene de mARN. ADN-ul st numai n interiorul nucleului. mARN cltorete n citoplasm. Acolo, o main de fcut proteine numit ribozom poate citi mARN pentru a face o anumit protein. Fiecare trei baze a mARN codific un aminoacid. Proteinele sunt fcute din aminoacizi. Molecula tARN (transfer RNA) traduce limbajul ADN i mARN n limbajul proteinelor. Molecula tARN aduce aminoacidul potrivit i ribozomul i leag mpreun construind astfel proteina. Proteinele sunt lucrtorii. Unele formeaz structurile (precum tendoanele i prul), altele proceseaz informaia ce ne atinge simurile (prin lumin, pipit i miros, de exemplu), controleaz reaciile chimice i poart mesaje ntre celule.
Despre istoria Bioinformaticii
n ultimii 20 de ani s-a dovedit c multe proteine, cu diverse origini, dar
avnd funcii similare au secvene similare de aminoacizi. Prin urmare, exist secvene ADN care sunt similare chiar dac proteina analizat provine de la specii diferite cum sunt oarecii i oamenii. Astfel, cutm diferenele i similaritile la nivelul ADN dintre un oarece i un om pentru foarte multe secvene similare. nc de la nceputul anilor 90, multe laboratoare analizeaz ntregul genom al ctorva specii cum sunt: bacteriile, fermenii (yeasts), oarecii i oamenii. n tot timpul acestui efort colaborativ cantiti enorme de date sunt colectate i stocate n baze de date, majoritatea dintre ele fiind public accesibile. Pe lng adunarea acestor date, este necesar compararea acestor secvene de nucleotide sau de aminoacizi pentru a depista similaritile i diferenele. Deoarece nu este foarte uor s compari secvene de cteva (sute) de nucleotide sau amino acizi cu mna, cteva tehnici numerice au fost dezvoltate pentru a rezolva aceast problem. n plus, aceste tehnici sunt mai puin generatoare de erori dect abordarea manual. Utilizarea tehnicilor numerice pentru analiza datelor biologice constituie ceea ce astzi este cunoscut sub numele de Bioinformatic (Biocomputing). 4
Bioinformatica la ora actual
Civa algoritmi au fost dezvoltai i implementai pentru a asigura o
interfa grafic ce permite utilizatorului accesul la bazele de date existente. n acest mod, compararea secvenelor nou gsite cu acelea stocate n baza de date este o problem de cteva minute. Dar chiar i aa, este necesar o analiz atent a rezultatului i, eventual, reluarea cutrii n baza de date cu un filtru de selecie mai fin. Astfel, este posibil determinarea rapid a diferenelor dintre specii, precum i diferenele dintre un individ sntos i unul bolnav. Bioinformatica poate de aceea conduce la o mai bun nelegere a vieii i a cauzelor moleculare ale diferitelor boli. Una dintre problemele de care se ocup bioinformatica se refer la crearea i meninerea bazelor de date cu informaii biologice. Secvenele de acizi nucleici (i secvenele proteice legate de ele) constituie majoritatea unor astfel de baze de date. n timp ce stocarea i organizarea milioanelor de nucleotide este departe de a fi trivial, proiectarea unei baze de date i dezvoltarea unei interfee prin intermediul creia cercettorii pot att accesa informaia existent ct i trimite noi date este numai la nceput. Cea mai presant sarcin n bioinformatic implic analiza acestor secvene informaionale. Bioinformatica (Computational Biology, Bioinformatics) este numele dat acestui proces i implic urmtoarele:
Dezvoltarea unor metode de prezicere a structurii i/sau funciei ale
proteinelor nou descoperite i ale secvenelor din structura ARN. Gruparea proteinelor n familii de secvene nrudite i dezvoltarea modelelor de proteine. Ordonarea proteinelor similare i generarea arborelui filogenetic pentru examinarea relaiilor de evoluie.
Procesul de evoluie a produs secvene ADN care codific proteine cu
funcii foarte specifice. Este posibil prezicerea structurii tridimensionale a unei proteine utiliznd algoritmi care au fost dedui din cunotiinele noastre de fizic, chimie i foarte important, din analiza altor proteine cu secvene de
aminoacizi similare. Diagrama din figura 3 prezint procesul prin care
secvenele de ADN sunt folosite la modelarea structurii proteinelor.
Fig. 3. Analiza ADN cu ajutorul calculatorului poate fi utilizat la prezicerea