Documente Academic
Documente Profesional
Documente Cultură
Bioinformatica
D1. Bioinformatica este utilizarea calculatoarelor pentru procesarea informaţiilor biologice. Termenul
este adesea utilizat pentru a descrie biologie molecular- computaţională, utilizarea calculatoarelor
pentru a stoca, cauta şi caracteriza codul genetic al genelor, proteinele legate de fiecare genă şi funcţiile
lor asociate.
Biologia este în mod tradiţional o ştiinţă a observaţiilor şi într-o măsura mai mică o ştiinţă a
deducţiilor. Deşi cercetările actuale au schimbat oarecum aceasta orientare de bază, natura datelor
informaţionale s-a schimbat radical. În cazul nucleotidelor şi al amino-acizilor, informaţiile au un
caracter numeric discret. Astfel, este posibila determinarea completă, şi in principiu exactă a unei
secvenţe de genom sau clonă. Nu este posibil a se evita erorile experimentale în totalitate, dar în
genomica secvenţelor actuală, aceasta eroare este extrem de mică.
O caracteristica importantă a bioinformaticii este lucrul cu volum foarte mare de informaţii așa cum se
poate observa din graficele următoare (Fig. 1.1-1.2).
Dogma centrală (principul central) a biologiei molculare se referă la modalitatea în care o bandă
(strand) de DNA (acidul dezoxirobonucleic) corespunde la secvenţa de amino-acizi a unei proteine .
DNA RNA Proteine Fenotip
transcriere translatie
1. DNA îşi replică informaţia într-un proces care implică mai multe enzime.
2. DNA codifică pentru pentru producţia mesagerului RNA (mRNA) în timpul transcrierii
3. În celule eucariote, mRNA este procesat (în esenţă prin divizare) şi migreaza din nucleu catre
citoplasmă.
4. Mesagerul RNA transportă informaţia codată în ribozomi. Ribozomii “citesc” aceasta informaţie şi
o utilizează pentru sinteza proteinelor.
O comparaţie între DNA şi RNA este dată mai jos:
Problemele curente in bioinformatică sunt legate de cele trei domenii majore: genomică, proteomică și
baze de date. Principalele domenii de cercetare sunt:
Exemple de formate de baze de date utilizate de instrumente software pentru acces la înregistrarile
acestor baze de date sunt: gcg, staden, embl, clustal, msf, GenBank (dsitribuita NCBI), rsf (rich
sequence format), FASTA si multi-FASTA.
web('http://www.ncbi.nlm.nih.gov/')
Vom descrie pe scurt în cele ce urmeaza formatul FASTA. Un format FASTA este constituit dintr-o
singura linie de descriere urmata de linii de secvenţe de date. Primul caracter din linia de descriere este
“>” urmat de descriere. Toate liniile trebuie sa aibă mai puţin de 80 de caractere. Ex:
Pentru a trece dintr-un format în altul se utilizeaza programe software de conversie, în general
disponibile fără cost (ex. NCBI BLAST in format FASTA, READSEQ).
Bibliografie:
Optional
4. Dan E. Krane, Michael L. Raymer, “Fundamental Concepts of Bioinformatics”, Benjamin
Cummings, 2002, ISBN: 0805346333
5. Bryan Bergeron, “Bioinformatics Computing”, Prentice Hall PTR, 2002, ISBN: 0-13-100825-0
6. Arthur M. Lesk, “Introduction to Bioinformatics”, Oxford University Press, 2005
7. Cynthia Gibas, Per Jambeck, “Developing Bioinformatics Computer Skills”, 2001, ISBN: 1-56592-
664-1
8. Teresa Attwood, David Parry-Smith, “Introduction to Bioinformatics”, Prentice Hall, 2001, ISBN:
0582327881
9. Thomas Lengauer, “From Genomes to Drugs”, vol. I-II, 2002
10. David W. Mount, “Bioinformatics: Sequence and Genome Analysis (Genome Analysis)”, Cold
Spring Harbor Laboratory Press, 2001, ISBN: 0879696087
11. Jin Xiong, “Essential Bioinformatics”, Cambridge University Press, 2006
12. Dan E. Krane, Michael L. Raymer , Fundamental Concepts of Bioinformatics, Benjamin
Cummings, 2002
13. Jean-Charles Sanchez, Garry L. Corthals, Denis F. Hochstrasser (Editori), Biomedical Applications
of Proteomics, Wiley-VCH Verlag GmbH & Co. KGaA, Weinheim, 2004