Sunteți pe pagina 1din 9

Modelul G

CRASS3-3444; Numărul de pagini 9

CR Biologies xxx (2016) xxx – xxx

Liste de con•inut disponibile la ScienceDirect

Comptes Rendus Biologies

www. sc iencedi rec t. com

Trajectories of genetic, 150 years after Mendel / Trajectoires de la génétique, 150 ans après Mendel

Apari•ia genomicii

L'essor de la génomique

Jean Weissenbach A , b , c , *
A Commissariat à l'énergie atomique et aux énergies alternatives, Institut de génomique, Genoscope, 2, rue Gaston-Crémieux, 91000 Évry, France

b CNRS, Unité de génomique métabolique UMR8030, 2, rue Gaston-Crémieux, 91000 Évry, Fran•a
c Université d'Évry, Unité de génomique métabolique UMR8030, 2, rue Gaston-Crémieux, 91000 Évry, Fran•a

ARTICLEINFO ABSTRACT

Istoricul articolului: Este prezentată o scurtă istorie a dezvoltării genomicii. Secven•ierea completă a genomurilor organismelor uni- •i
Primit la 28 martie 2016 pluricelulare se bazează pe progrese importante în secven•ierea •i bioinformatica. Evolu•ia acestor metode este în curs de
Acceptat după revizuire 19 aprilie 2016 Disponibil desfă•urare •i a declan•at o explozie în produc•ia •i analiza datelor. Analizele ini•iale s-au concentrat pe inventarul genelor
online xxx care codifică proteinele. Completitudinea •i calitatea predic•iei genelor rămâne crucială. Analiza genomului ne-a modificat
profund punctele de vedere cu privire la evolu•ie, biodiversitate •i a contribuit la detectarea de noi func•ii, care încă nu au fost
Cuvinte cheie: pe deplin elucidate, precum cele îndeplinite de ARN-uri necodificate. Genomica a devenit baza pentru studiul biologiei •i
Secven•ierea oferă sprijin molecular pentru o grămadă de studii la scară largă, omicile.
Genomi
Bioinformatică
Evoluţie
2016 Académie des sciences. Publicat de Elsevier Masson SAS. Acesta este un articol cu acces liber sub licen•a CC
BY-NC-ND ( http://creativecommons.org/licenses/by-nc-nd/
4.0 / ).

RELUA

Mots clés: Un bref historique du développement de la génomique est présenté. Le séquençage de génomes complets d'organismes
Séquençage uni- et multicellulaires s'est appuyé sur d'importants progrès méthodologiques in the domain du séquençage et de la
Genomi bio-informatique. L'évolution de ces méthodes se poursuit et est à l'origine d'une explosion de la production et de l'analyse
Bio-informatică
des données. Les premières analysis ont d'abord cherché à identi fi er les gènes codant pour des protéines. L'exhaustivité et
Evoluţie
la qualité de la prédiction des gènes demeurent déterminantes. Aceste analize au rapid adânc modificate, ne modifică
valorile •i evolu•ia biodiversită•ii, •i contribuie la identificarea noilor func•ii encoremal connues, telles que celles assurées par
les ARN non codants.

2016 Académie des sciences. Publié par Elsevier Masson SAS. Acest articol este publicat în licen•ă sub acces deschis
CC BY-NC-ND ( http://creativecommons.org/licenses/by-nc-nd/
4.0 / ).

* Commissariat à l'énergie atomique et aux énergies alternatives, Institut de génomique, Genoscope, 2, rue Gaston-Crémieux, 91000 Évry, France.
Adresa de email: jsbach@genoscope.cns.fr .

http://dx.doi.org/10.1016/j.crvi.2016.05.002
1631-0691 / 2016 Académie des sciences. Publicat de Elsevier Masson SAS. Acesta este un articol cu acces liber sub licen•a CC BY-NC-ND ( http: // creativecommons.org/licenses/by-nc-nd/4.0/ ).

Vă rugăm să cita•i acest articol în presă ca: J. Weissenbach, The rise of genomics, CR Biologies (2016), http://dx.doi.org/10.1016/
j.crvi.2016.05.002
Modelul G
CRASS3-3444; Numărul de pagini 9

2 J. Weissenbach / CR Biologies xxx (2016) xxx – xxx

1. Introducere context such as adjacent control regions andneighbouring genes.

1.1. From genes to genomics


2. Complete Prokaryote Genomes: the beginning of the era of genomics in the 1990s
Although the word genomics is rather recent [1] , its
origin goes back to the beginning of the last century, when Johannsen introduced in 1909
the concept of the gene, the physical entity that corresponds to the genetic determinant of Pe lângă meritele •tiin•ifice de bază ale secven•ierii genomului microbian,
an inheritable trait in an organism. At the same time, he coined the terms genotype and phenotype.îmbunătă•irile continue ale tehnologiilor existente •i interesul crescând pentru Proiectul
In 1920, Hans Winkler proposed the term genome to designate the complete genetic HumanGenome au fost principalele for•e motrice ale secven•ierii genomului complet al
makeup of an organism. microorganismelor. Primele secven•e complete ale genomului bacterian au venit ca o
surpriză. În timp ce alte genomi microbieni erau secven•ia•i cu ajutorul hăr•ilor genomice
fizice •i a seturilor de clone suprapuse ordonate, Venter •i colegii de la TIGR au reu•it să
A devenit rapid esen•ial identificarea entită•ii fizice, a•a-numitul material ereditar care reasambleze secven•e întregi de genom pe baza secven•ierii pistolului cu genom întreg
a constituit genele, cu alte cuvinte genomul care define•te genotipul unui organism. Au (WGS). Primele secven•e de genom nu erau deci de la organisme model, ci doi agen•i
mai durat câteva decenii de la genomul lui Winkler până la demonstra•ia că ADN-ul este patogeni, inclusiv un izolat non-virulent [7,8] . Acest lucru a necesitat rezolvarea unor
materialul ereditar propriu-zis •i unul suplimentar pentru a-•i stabili structura probleme de bază, •i anume asamblarea genomului complet din mii de citiri de secven•e
tridimensională. Această ultimă etapă stabilită de Watson •i Crick este de obicei luată ca de fragmente clonate, stabilirea unei strategii pentru a umple golurile rămase •i
origine a erei biologiei moleculare. dezvoltarea algoritmilor pentru identificarea cadrelor de lectură deschise (ORF) de-a
lungul secven•ei ADN •i adnotarea definitivă a acestor ORF-uri care au fost considerate
drept adevărate secven•e de codare (CDS).

Bazele ini•iale ale biologiei moleculare au fost simple •i au fost de obicei confirmate
de descoperiri experimentale ulterioare. Aceste descoperiri au constat în principal în
descoperirea temoleculelor •i a ma•inilor implicate în procesele de replicare a genomului
(ADN polimeraze), transcrierea genelor (mARN, ARN polimeraze •i factori de transcrip•ie)
•i sinteza proteinelor (ARNt •i ARNt sintetaze, ribozomi •i factori de traducere). Prima
excep•ie a venit odată cu descoperirea transcriptazei inverse la începutul anilor •aptezeci. Prezen•a lacunelor în ansamblul secven•ei a reflectat distorsiunea de distribu•ie a
Dar, cele mai multe rezultate experimentale timpurii au fost în esen•ă în acord cu Dogma secven•elor clonate care nu ar putea fi rezolvată satisfăcător decât recent odată cu
Centrală. apari•ia secven•ierii cu o singură moleculă. Cu toate acestea, utilizarea unei varietă•i de
proceduri paliative a permis anchetatorilor să ob•ină secven•e complete sau aproape
complete. Completitudinea este importantă din mai multe motive, printre care se numără
dovada experimentală a prezen•ei sau absen•ei unei func•ii date, dar •i în scopuri
comparative. Până la sfâr•itul anilor 1990, acumularea unui număr de secven•e de genom
1.2. Rezultă prima secven•iere bacterian a sus•inut o serie de descoperiri fundamentale •i generale.

Tehnologia progresează, iar secven•ierea ARN a devenit fezabilă în anii •aizeci •i în


primul rând sa concentrat pe transferul •i ARN-urile ribozomale. Primele rezultate ale
secven•ierii pe gene care codifică proteinele au fost ob•inute din ARN-uri bacteriofage [2] ,
la sfâr•itul anilor 1960 •i începutul anilor 1970. Ele erau în mod clar în conformitate cu Analiza •i interpretarea secven•ei genomurilor complete pot fi văzute dintr-o varietate
baza biologiei moleculare. Aminoacizii au fost codifica•i conform codului stabilit •i genele de puncte de vedere. Inventarul seturilor complete de gene ale organismelor a fost printre
au fost încadrate de semnalele de pornire •i oprire a•teptate. A fost nevoie de încă •ase obiectivele majore •i ini•iale ale întregului proiect de secven•iere a genomului •i a fost
ani pentru a ob•ine secven•a completă a genomului din fagul ARN MS2 [3] . Între timp, primul pas către o perspectivă mai profundă asupra biologiei organismului. Analiza
tehnicile pentru secven•ierea ADN-ului au fost dezvoltate [4] secven•ei a furnizat, de asemenea, o reprezentare complet nouă a naturii fizice (structurii)
unui genom procariot în ceea ce prive•te organizarea, topologia, numărul de repliconi,
con•inutul GC, orientarea genelor •i a•a mai departe ( tabelul 1 ). O varia•ie largă în ceea
ce prive•te dimensiunea între speciile bacteriene a apărut ca regulă.
iar secven•a primului genom ADN viral a urmat mai pu•in de un an mai târziu [5] .

Începutul erei clonării genelor în anii 1970 a fost înso•it de secven•ierea primelor
gene non-virale •i a fost urmat de regiuni genomice întregi [6] •i întreprinderi mai
ambi•ioase privind genomii virali din ce în ce mai mari Folosind procedura de secven•iere
dideoxi dezvoltată de Fred Sanger, a fost întreprinsă secven•ierea genomurilor întregi de 3. Eucariote •i genomul uman
la organisme autonome, microorganisme în primul rând •i rapid urmată de proiecte pe
eucariote multicelulare. Secven•ierea genelor clonate a fost întreprinsă din diferite motive. Primele genomi bacterieni au fost rapid urmate de secven•a genomului drojdiei,
În primul rând, a oferit acces extrem de u•or la secven•a de aminoacizi, inclusiv muta•iile bazată pe un set de clone cosmide ordonate •i stabilite prin efortul unei re•ele de „fabrici
ocazionale, decât folosind tehnici de secven•iere a proteinelor. De asemenea, a furnizat de căsu•e” din laboratoarele academice standard.
identificarea genomicii

[9] . În ansamblu, aceste realizări au pregătit scena pentru proiecte mai mari, de•i
genomurile organismelor model, cum ar fi nematodul Caenorhabditis elegans [ 10] •i
modelul plantei Arabidopsis thaliana [ 11] erau deja în desfă•urare.

Vă rugăm să cita•i acest articol în presă ca: J. Weissenbach, The rise of genomics, CR Biologies (2016), http://dx.doi.org/10.1016/
j.crvi.2016.05.002
Modelul G
CRASS3-3444; Numărul de pagini 9

J. Weissenbach / CR Biologies xxx (2016) xxx – xxx 3

tabelul 1
O listă neexhaustivă de caracteristici genomice care poate fi accesată direct prin analiza secven•ei. a secven•ei •i extinderea proiectului la modele precum mouse •i •obolan.

Principalele caracteristici genomice accesate de obicei prin secven•ierea •i analiza genomului Acum, cum să ajungi acolo? Venter era convins că WGS, care a avut atât de mult
succes pentru genomii bacterieni, ar fi adecvat pentru genomurile cu trei ordine de

Caracteristică cometariu mărime mai mari. Lansarea de către Applied Biosystems a unui nou instrument de
secven•iere bazat pe secven•ializarea Sanger folosind electroforeza pe gel capilar •i care
mărimea Exacte, toate replicile
încorporează o serie de alte îmbunătă•iri, a coincis inten•ionat
Con•inut GC Exact
Originea replicării Bazat pe înclinarea GC A
Gene care codifică proteinele Destul de precis
Pseudogene Destul de satisfăcător
Anun•ul lui C. Venter, în mai 1998, privind crearea unei companii private (Celera) pentru a
Utilizarea codonilor Exact
secven•a genomul uman de către WGS. Acest anun•, care a coincis, de asemenea, cu
ARNr, ARNt Exact
RNAS fără codificare Pe baza ARNseq b principala întâlnire interna•ională a genomului de la Cold Spring Harbor, a fost înso•it de o
Orientarea genică Exact critică fermă a proiectului public care tocmai începuse într-un spa•iu foarte redus •i încă
Detectarea SI, a elementelor mobile etc. Clustere de Exact explorase •i discuta o serie de probleme practice.
gene, operoni
Insulele genomice

A Distorsiunea GC este definită ca măsura raportului (GC) / (G + C) a fiecărei fire, care arată o
Dar competi•ia a fost lansată •i a primit o mul•ime de acoperire din partea presei
tendin•ă spre G peste C pe firul principal. Permite detectarea toroanelor principale •i întârziate •i, prin
publice. În primăvara anului 2000, pentru a-i face pe to•i ferici•i, ambele proiecte au
urmare, originea replicării.
anun•at victoria în comun. Dacă se consideră că un genom cu aproximativ 200.000 de
b Detectarea genelor ARN necodificatoare, cum ar fi ARN-urile antisens, se bazează pe utilizarea
goluri este un obiectiv satisfăcător, acesta poate fi considerat o realizare. Cu toate
suplimentară a datelor secven•ei transcriptomului ob•inute de obicei din experimentele ARNseq.
acestea, acest lucru nu a fost cazul celor care lucrează în genetică umană •i care caută
gena lor favorită a bolii •i a durat încă trei ani până când consor•iul public a produs un
ansamblu de secven•e ale genomului uman de înaltă calitate, cu mai pu•in de 300 de
goluri [12] .
Succesul pistolului cu genom întreg (WGS) a stimulat visele despre genomul uman •i,
indiferent de strategie (WGS versus secven•ierea bazată pe hartă), părea posibil să se
întreprindă un proiect atât de gigantic, care să propulseze biologia în •tiin•a mare. Walter Cererea de victorie a lui Venter a însemnat un succes al WGS? Probabil că nu, a•a
Gilbert •i-a estimat costul la aproximativ 1 $ / bază, o estimare care s-a dovedit a fi în cum sus•in principalii lideri ai proiectului public [13] . Cu toate acestea, strategia WGS a
gama realită•ii. Nu este posibil nici măcar să schi•ăm istoria •i diferitele episoade ale func•ionat în mod clar Drosophila, secven•iat înainte de proiectul uman ca o dovadă a
acestui proiect. Datorită costului său, proiectul a ridicat opozi•ie de îndată ce ideea a plutit conceptului •i chiar pentru mouse. De ce nu a func•ionat pentru fiin•e umane, chiar •i
•i a provocat o dezbatere de for•ă. Poate fi de interes să reamintim câteva dintre după adăugarea acoperirii secven•ei oferite de datele proiectului public? Venter •i colegii
principalele argumente ale adversarilor. săi au subestimat probabil efectul heterozigozită•ii în asamblarea lor. Au vrut să fie
„universali” prin amestecarea citirilor secven•iale din mai multe genomi fără legătură din
origini etnice diferite, alegând astfel cele mai proaste condi•ii pentru o asamblare optimă.
Acesta este •i motivul principal pentru care includerea datelor publice ale proiectului a fost
mai degrabă un obstacol [14] la îmbunătă•irea ansamblului. Probabil că a existat o
O primă critică a venit din lipsa de interes în secven•ierea •i, în special, în modalitate mai inteligentă de a folosi secven•a publică, de exemplu, adăugând secven•a
promovarea unei astfel de întreprinderi monstruoase, care a fost exact opusul criteriilor Celera citită la proiectul adunării publice, dar acest lucru ar fi fost în contradic•ie cu
pentru •tiin•a elegantă. Acest proiect de for•ă brută nu era altceva decât o idee inteligentă strategia WGS •i ar fi apărut ca o recunoa•tere a limitării sale.
•i se auzea litania criticilor precum „Este acesta un obiectiv •tiin•ific solid? Nu avem
priorită•i mai bune? Acest lucru nu este departe pentru a instrui tinerii studen•i •i pentru
a-i ajuta să devină oameni de •tiin•ă autonomi! Acest lucru va necesita toate resursele
disponibile pentru biologie! ”•i a•a mai departe.

Genomi din eucariote multicelulare, concentrate mai întâi pe organisme model.


O altă critică principală s-a bazat pe lipsa de interes exprimată de mul•i biologi Alegerile ulterioare s-au bazat în principal pe motive practice sau economice sau pe
pentru secven•ierea intronilor •i a regiunilor intergenice, a•a-numitul ADN junk. Mul•i interesul lor special pentru evolu•ie. Cu excep•ia zborului cu fructe, secven•a primelor
dintre ace•ti biologi au argumentat să limiteze proiectul la secven•e exprimate. genomi eucariote s-a bazat pe hăr•i pregătite pentru secven•ă, făcute din clone
Retrospectiv, acest lucru pare incredibil de scurt •i a fost în principal atitudinea biologilor suprapuse ordonate. Cu toate acestea, trecerea la WGS a avut loc rapid. În ciuda unor
cu alfabetizare slabă sau deloc în materie de genetică. Cu toate acestea, odată ce au dezavantaje ale problemelor exhaustive de acoperire •i asamblare cauzate de varia•ii
putut găsi secven•a genei lor preferate în bănci de date, mul•i dintre primii adversari •i-au structurale, repetări •i heterozigoitate, WGS a devenit în general adoptat din cauza
dat seama rapid de interesul •i utilitatea unui astfel de program. costurilor mai mici •i a necesită•ii unei hăr•i pregătite pentru secven•e. În schimb,
finalizarea până la finalizarea efectivă a devenit din ce în ce mai neglijată, limitând
utilizarea practică a multora dintre aceste secven•e la analize în principal la nivelul
genomului.
Un al treilea argument împotriva sa bazat pe incapacitatea noastră de a interpreta •i
exploata corect datele •i acest lucru a fost în mare parte adevărat. În plus, oamenii nu
erau o specie experimentală. Dar, acest lucru a indicat, de asemenea, că o parte
substan•ială a efortului ar trebui să abordeze problema ob•inerii sensului Adnotarea genomului eucariot a ridicat o serie de provocări [15] în principal datorită
caracterului divizat al proteinelor

Vă rugăm să cita•i acest articol în presă ca: J. Weissenbach, The rise of genomics, CR Biologies (2016), http://dx.doi.org/10.1016/
j.crvi.2016.05.002
Modelul G
CRASS3-3444; Numărul de pagini 9

4 J. Weissenbach / CR Biologies xxx (2016) xxx – xxx

gene codificatoare, secven•e intergenice de lungime foarte variabilă •i prezen•a a astfel de cuno•tin•e rezultate din procesarea secundară a datelor pot fi găsite în alte
numeroase secven•e repetate. Utilizarea unor secven•e suplimentare din transcrip•ii •i resurse de date. Unele dintre acestea, cum ar fi bazele de date cu proteine, rămân foarte
secven•e de proteine ca resursă de identificare a genelor a devenit rutină încă de la generale, în timp ce multe alte baze de date specializate se concentrează pe un set
începutul procesului de adnotare a genomului eucariot. limitat de obiecte sau pe o singură specie. În plus, multe dintre aceste resurse
specializate au o speran•ă de via•ă limitată din cauza dificultă•ilor de finan•are pe termen
lung. Numărul total al acestor ini•iative individuale este dificil de estimat; o descriere a
multora dintre cele mai populare poate fi găsită într-un număr anual specializat al Cercetarea
4. Cre•terea bioinformaticii acizilor nucleici. Edi•ia din 2016 include aproximativ 150 de astfel de baze de date. Din
păcate, nu toate aceste resurse sunt bine organizate.
Bioinformatica a precedat genomica, dar activitatea sa a rămas modestă, la
marginea nucleului biologiei moleculare, de•i toată lumea era convinsă că un fel de
revolu•ie se coace. Secven•ele au trebuit mai întâi manipulate cu programe concepute
pentru aliniere, asamblare, finalizare, verificare a calită•ii etc. Tratarea acestor cantită•i Rolul crucial luat de Bioinformatică a trebuit să fie îndeplinit prin disponibilitatea
uria•e de date ar fi fost imposibilă fără disponibilitatea computerelor •i progresele permanentă •i modernizarea continuă a instrumentelor de analiză a datelor, capacită•ile
spectaculoase ale •tiin•ei informatice. Dezvoltarea unui software adecvat a fost rapidă, în de calcul •i stocare, accesul public •i reprezentarea imaginativă atât a datelor brute, cât •i
ciuda lipsei de biologi cunoscu•i în domeniul computerelor •i de utilizatori califica•i. a datelor analizate, creând o cerere uria•ă de resurse umane suplimentare. •i aceste
nevoi au trebuit să fie ajustate de atunci, la cre•terea convingătoare •i cople•itoare a
produc•iei de date. În plus, de•i aceste resurse sunt total transversale la biologie, ele
suferă periodic de subfinan•are care a fost alocată în mod redus, în special în Europa, de
către agen•iile de finan•are consiliate de biologii de laborator umed, care nu sunt
Data a fost accesibilă •i accesul liber, o provocare la care au trebuit să facă fa•ă întotdeauna con•tien•i de problemele arzătoare ridicate de datele genomice.
băncile de date secven•iale, a fost un pas crucial care a contribuit la schimbarea părerii
multor sceptici ai genomului. În general complete, de•i neterminate pentru anumite
proiecte, sec•iunile de secven•ă au fost trimise băncilor de date de secven•ă. Când sunt
complete, aceste secven•e au fost de obicei adnotate într-un mod constând mai întâi în
definirea cadrelor de citire deschise •i identificarea semnalelor de pornire •i oprire.
Aceasta s-a bazat pe o serie de algoritmi care au func•ionat cu o precizie destul de
satisfăcătoare. Aceste coordonate au fost apoi mapate pe secven•a ADN. A fost 5. Func•ii codificate de genomi
implementat un software de identificare a genelor procariote care utilizează suplimentar
datele transcrip•iei, produse de obicei alături de secven•ierea genomică. [16] . O dificultate 5.1. Cât de completă este lista pieselor adnotărilor func•ionale?
majoră, de la început, a fost să facem distinc•ia între ORF-uri scurte necodificatoare •i
gene reale care codifică proteine scurte. Această problemă nu este încă rezolvată în De•i codurile ADN pentru mult mai mult decât proteine, vom limita această discu•ie la
mod satisfăcător, iar oamenii preferă doar să respingă ORF sub 100 de codoni cu pre•ul proteine. În primele timpuri ale geneticii, în secolul care a urmat stabilirii legilor lui Mendel,
a numeroase e•ecuri de detectare [17] . genotipul era o no•iune abstractă, în care genele puteau fi doar definite prin trăsăturile pe
care le precizau. Genomica tocmai a inversat această concep•ie. Genele •i produsele lor
sunt acum cunoscute prin structura lor chimică, dar fenotipul pe care îl specifică poate fi
prezis doar în situa•ii simple în care cuno•tin•ele s-au acumulat uneori de-a lungul mai
multor decenii. Efectuarea unor predic•ii mai sofisticate rămâne de obicei o presupunere
(vezi mai jos).
Folosind alinieri de secven•ă pentru compara•ii, a fost posibil să se identifice gene
care codifică proteinele cunoscute (vezi mai jos), gene care codifică ARNr •i alte
elemente relevante din punct de vedere biologic, precum semnale de control, elemente
de inser•ie, alte secven•e repetate etc. Ulterior, aceste informa•ii au crescut în
complexitate cu datele produse prin alte abordări la scară largă, cum ar fi proiectele Cu două decenii în urmă, când au devenit disponibile primele secven•e de genom
HapMap •i ENCODE [18,19] •i cu numeroasele descoperiri asupra diferitelor tipuri de întregi, un număr mare de proteine cu func•ie cunoscută, ale căror gene fuseseră deja
ARN necodificator (ARNc). Reprezentarea acestor din urmă elemente •i a modificărilor clonate •i secven•iate, au fost colectate de-a lungul timpului în bănci de date de secven•ă.
epigenetice în băncile de date este încă o chestiune de dezbatere complicată de aspectul Astfel, a fost simplu, pe baza alinierilor de secven•ă •i a compara•iilor, să atribuie func•ii
specificului •esutului. În mod similar, maparea varia•iilor structurale numeroase •i mari unei frac•iuni mari a proteinelor codificate în genomuri complet secven•iate. Acest lucru a
rămâne o problemă. Foarte rapid, inunda•iile de date nu mai puteau fi controlate •i permis oamenilor de •tiin•ă să reconstruiască căile metabolice, să identifice un set mare
secven•ele trebuiau procesate de suite de software care produceau adnotări automate cu de alte func•ii (informa•ionale, fiziologice etc.) •i a oferit o imagine globală a proprietă•ilor
toate inconvenientele pe care astfel de proceduri le generează (vezi mai jos). organismului. Aceste oportunită•i au ini•iat o grabă în secven•ierea •i analiza genomului
procariotului, în special pentru agen•ii patogeni (a se vedea mai jos). Disponibilitatea unor
astfel de reprezentări globale •i listări a deschis calea către genomica comparativă în
scopuri func•ionale •i evolutive. De asemenea, a furnizat o cantitate fără precedent de
cuno•tin•e pentru a în•elege patogenitatea •i a identificat poten•iale •inte pentru
dezvoltarea de noi

În mod frecvent, informa•iile biologice suplimentare de origine experimentală sau de


calcul pot completa util indica•iile constrânse prezentate în băncile de date ale secven•ei
generaliste. În mai multe cazuri,

Vă rugăm să cita•i acest articol în presă ca: J. Weissenbach, The rise of genomics, CR Biologies (2016), http://dx.doi.org/10.1016/
j.crvi.2016.05.002
Modelul G
CRASS3-3444; Numărul de pagini 9

J. Weissenbach / CR Biologies xxx (2016) xxx – xxx 5

antibiotice. Dar 20 de ani mai târziu, rezultatele nu depă•esc speran•ele. . . '' Cele mai multe abordări automate ale adnotării func•iei proteinelor se bazează pe
transferul adnotărilor din proteinele adnotate anterior, pe baza secven•ei sau a
Practic, odată identificat pe întinderea secven•ei, întregul set de gene care codifică similarită•ii structurale. Astfel de adnotări sunt susceptibile la mai multe surse de
proteina a fost sortat în co•uri func•ionale, fiecare co• corespunzând unei categorii de erori, inclusiv erori în adnotările originale din care se deduc noi adnotări, erori în
gene implicate într-un anumit proces celular sau grup de procese. Rezultatul acestei algoritmi, erori în programe sau scripturi utilizate pentru prelucrarea datelor, erori
sortări este adesea afi•at ca plăcintă diagrame în care dimensiunea relativă a fiecărui clericale din partea curatorilor umani, printre al•ii. Efectul unor astfel de erori poate fi
sector reflectă stilul de via•ă •i constrângerile de mediu cu care se confruntă organismul. mărit deoarece se pot propaga de la un set de secven•e adnotate la altul prin
utilizarea pe scară largă a tehnicilor automate pentru adnotarea func•ională a
proteinelor la nivelul genomului. Odată introduse, astfel de erori pot rămâne
nedetectate mult timp. "
O frac•iune considerabilă din CDS-uri nu au avut nicio potrivire în băncile de date
secven•iale. Aceste CDS au fost considerate ca
de bună-credin•ă proteine care codifică genele •i au fost clasificate ca gene ipotetice
care codifică proteine cu func•ie necunoscută. Odată cu cre•terea cantită•ii de secven•e
disponibile, omologii unui subset de astfel de gene ipotetice ar putea fi găsite din nou în
genomuri nou secven•iate, care nu au legătură. Acest lucru le-a crescut probabilitatea de
Alte cauze implică adesea interpretări excesive bazate pe identitate de secven•ă
a fi gene adevărate •i statutul lor a evoluat până la ipotetic conservat. În prezent, frac•ia
slabă sau potriviri care implică doar păr•i ale genelor / proteinelor. Au fost propuse mai
de gene ipotetice (conservate •i neconservate) reprezintă încă aproximativ un sfert până
multe modalită•i de a detecta •i a cură•a erorile de adnotare. În primul rând, erorile ar
la o treime din genele identificate în orice genom bacterian secven•iat •i a rămas aproape
putea fi mai pu•in frecvente dacă analizele ar face o utilizare sistematică a contextului
stabilă în timp, indicând faptul că cuno•tin•ele despre func•ia lor reală au făcut pu•in
genomic, a căilor metabolice, a analizei familiei de proteine, a informa•iilor evolutive sau a
progresul a•a cum se poate vedea în
datelor experimentale. De asemenea, au fost dezvoltate abordări computa•ionale pentru
verificarea adnotărilor deduse automat împotriva surselor independente de dovezi.
Acestea par eficiente în detectarea poten•ialelor erori de adnotare •i pot oferi o modalitate
valoroasă de abordare a problemei de adnotare eronată. Toate băncile de date se
bazează într-o oarecare măsură pe curarea manuală, iar băncile de date secven•iale nu
masa 2 . Descoperirea de noi func•ii •i integrarea acestora în fiziologia unei celule sau a
fac excep•ie de la acest ultim, dar, din păcate, nu în ultimul rând remediu.
unui organism rămâne un proces foarte lent care necesită abordări experimentale
inovatoare •i atent planificate.

5.2. Cât de precisă este lista pieselor? Erori în adnotare

Producerea unor astfel de cantită•i uria•e de date •i analize a fost paralelă cu


acumularea de erori în adnotări. În mod ironic, această problemă de inexactitate în
adnotări a fost deja eviden•iată înainte de adnotarea genomului, dar apari•ia genomicii 5.3. Putem prezice un fenotip din lista pieselor (genotip)?
tocmai a înrăută•it masiv problema.

Disponibilitatea secven•elor complete ale genomului •i a altor date omice a ridicat


După cum sa men•ionat mai sus, acumularea de date a determinat, de asemenea, ini•ial speran•a de a prezice fenotipurile •i a construi modele de sisteme vii •i a condus la
dezvoltarea unor conducte de adnotare automate. Cu toate acestea, aceste suite de apari•ia biologiei sistemelor. Această speran•ă s-a bazat pe analogia că o celulă este un
algoritmi, atunci când sunt aplicate la aceea•i secven•ă de genom, au produs, la un nivel computer care î•i evaluează permanent starea •i cea a mediului său imediat •i ac•ionează
deloc neglijabil, predic•ii genice discrepante. Un rezumat clar al acestei probleme de într-un mod logic după procesarea acestor informa•ii. S-a presupus că, prin colectarea
anotare gre•ită a fost dat de Andorf •i colab. [20] : unor cantită•i masive de date, ar trebui să se poată deduce legile •i principiile care
guvernează logica comportamentului celular. Cu toate acestea, 15 ani mai târziu,
realizările biologiei sistemelor rămân în cel mai bun caz modeste, în ciuda efortului masiv
de colectare sistematică a datelor în toate domeniile omicilor. O explica•ie simplă a
masa 2 acestui e•ec a fost propusă de Brenner [21] . La nivel global afirmă că problema inversă,
Distribu•ia stării proteinelor codificate de genomul Acinetobacter baylyi ADP1 în patru runde de adnotări
succesive între 2003 •i 2003
2015.

Evolu•ia stării genelor care codifică proteinele

2003 A 2006 2009 b 2015


n (%) n (%) n (%) n (%) adică deducerea unui model din comportamentul unui sistem complex este imposibilă,
Proteine deoarece numărul modelelor poten•iale este mult prea mare •i nu poate fi constrâns fără
Func•ii cunoscute 1150 (36) 1150 (36) 1180 (37) 1223 (38) 907 (28) o teorie de ghidare.
Func•ii putative 925 (29) 950 (30) 977 (31)
Conservat 686 (21) 893 (28) 857 (27) 783 (24)
Găsirea rolului genelor ipotetice •i în special a genelor ipotetice conservate este o
ipotetic
Ipotetic 458 (14) 220 (7) 219 (7) 218 (7) condi•ie prealabilă pentru progresul ulterior în predic•iile fenotipului. Pentru multe
Total 3201 3207 3196 3201 organisme model, procariote, precum •i eucariote, au fost stabilite folosind colec•ii
A Barbe •i colab., Acizi nucleici Res. 2004. genomice de mutan•i
b de Berardinis •i colab., Curr. Opin. Microbiol. 2009.

Vă rugăm să cita•i acest articol în presă ca: J. Weissenbach, The rise of genomics, CR Biologies (2016), http://dx.doi.org/10.1016/
j.crvi.2016.05.002
Modelul G
CRASS3-3444; Numărul de pagini 9

6 J. Weissenbach / CR Biologies xxx (2016) xxx – xxx

abordări diverse. Fiecare obiect al acestor colec•ii corespunde unei tulpini cu o genă parazi•i •i endosimbioni. În caz contrar, schimbarea de ni•ă a organismelor vii libere poate
mutantă diferită. Întreaga colec•ie cuprinde un mutant al fiecăreia dintre genele dintr-un necesita sau beneficia de achizi•ionarea de noi func•ionalită•i înso•ite de expansiuni care
genom. Muta•iile de la gene care îndeplinesc func•ii indispensabile (gene esen•iale) nu ar putea fi echilibrate secundar de pierderea genelor care au devenit superfluoase în noul
sunt viabile •i, prin urmare, absente în aceste colec•ii. Colec•iile sunt foarte utile, mediu.
deoarece un mutant poate fi caracterizat printr-un fenotip care corespunde unei descrieri
standardizate a comportamentului său în diferite condi•ii. Cu toate acestea, această Contrac•iile implică gene foarte preferen•iale care nu au niciun efect sau foarte pu•in
abordare are limitările sale, deoarece mul•i mutan•i nu au un fenotip specific. Din motive efect asupra stabilită•ii în condi•iile care prevalează în timpul •i după pierderea genei
care sunt doar uneori în•elese, ele se comportă ca tulpina de tip sălbatic. În concep•ia (genelor). Extensiile sunt probabil mai aleatorii. Ca o consecin•ă a unor astfel de
noastră clasică neo-darwiniană, o inactivare genică afectează unul sau mai multe modificări, varia•ii importante ale con•inutului de gene au început să fie observate
procese biologice, dar acest lucru se aplică doar unui subset de situa•ii. În plus, chiar •i frecvent în cadrul unei singure specii procariote în urmă cu un deceniu, de•i astfel de
atunci când mutan•ii cu o singură genă prezintă un fenotip manifest, acest lucru oferă varia•ii nu au avut loc în aceea•i măsură la specii diferite [27] . Aceasta a stat la baza
rareori explica•ii amoleculare ale rolului biochimic al proteinelor la nivel celular. Nu există conceptului de pan-genom, în care genomul poate fi împăr•it în subseturi de:
o procedură sistematică sau o abordare la scară largă care să ofere o solu•ie generală la
această problemă, care rămâne o provocare majoră. Abordările post-genomice la scară
largă (diferitele omici) sau bioinformatica pot oferi totu•i indicii pentru a ajuta la progresul
în enigma func•iilor necunoscute, în special în aspectele de reglementare.
gene stabile observate la toate tulpinile dintr-o specie, genomul de bază;

gene dispensabile văzute în mai multe tulpini; gene speci fi ce tulpina


găsite într-o singură tulpină.

Cu toate acestea, genele se pot deplasa de la o categorie la alta, a•a cum se vede
cu acumularea de genomi secven•a•i din tulpini suplimentare.

Conceptul de pan-genom a fost extins la unită•i taxonomice superioare •i în special


la întregul regat al bacteriilor într-o analiză a unui set de 573 de genomi care a dus la
6. Evolu•ie
definirea a trei grupe de gene:

Studiul evolu•iei este unul dintre principalii beneficiari ai genomicii. Analiza


comparativă a genomului ne-a schimbat dramatic percep•ia asupra evolu•iei genomului
un grup de bază aproape universal format din aproximativ 250 de familii de gene foarte
bacterian. Viziunea clasică a evolu•iei în care apar modificări prin acumularea muta•iilor
conservate prezente într-o mare majoritate a speciilor (99%) •i care codifică func•ii
punctuale trebuie extinsă prin includerea unor mecanisme suplimentare care să permită
esen•iale;
câ•tigul rapid, pierderea •i rearanjarea por•iunilor semnificative ale genomului. Acest mare
un grup de aproximativ 8000 de familii de gene care apar la frecven•e variabile •i care
transfer al genomului permite procariotelor să evolueze rapid ca răspuns la schimbările
determină specifica•iile metabolice;
de mediu, reprezentând diseminarea lor largă în biosferă.
un grup mare de gene cu evolu•ie rapidă prezente la o frecven•ă foarte scăzută
sugerând o rată mare de rota•ie.

Cele două grupuri din urmă reprezintă rezervorul pentru apari•ia de noi func•ii
Con•inutul de gene dintr-o singură specie procariotă poate fi astfel destul de variabil biologice.
•i multe specii sunt supuse continuu modificărilor mediate în principal prin transferul de Una dintre consecin•ele majore ale HGT la procariote este legată de apari•ia
gene orizontal (HGT) (vezi mai jos), duplicări •i •tergeri care apar ca cei trei factori insulelor genomice care au fost observate pentru prima dată la bacteriile patogene.
principali ai resurselor genomului organismelor unicelulare. În timp ce •tergerile •i Aceste segmente genomice con•in factori de virulen•ă largo sensu •i, prin urmare, au fost
duplicările, care pot implica genomi întregi, rămân esen•iale în eucariote [22-24] , acesta numite insule de patogenitate [28] . În mod similar, alte insule genomice, care conferă
din urmă este mai pu•in supus HGT, dacă se exceptează invaziile de diferite tipuri de adesea o stabilitate crescută în anumite ni•e, pot fi găsite în genomii bacterieni ai
elemente transpozabile, un important mecanism de specia•ie [25] . mediului. Insulele genomice sunt achizi•ionate de HGT, prezintă de obicei caracteristici
specifice, cum ar fi compozi•ia nucleotidică •i frecven•a codonilor diferită de restul
genomului, sunt asociate cu elemente mobile •i sunt înflăcinate de genele ARNt. Aceste
insule pot transmite asocia•ii de factori extrem de importan•i care afectează
adaptabilitatea, stabilitatea •i competitivitatea între organismele procariote extrem de
Procesul HGT a fost mult timp ipotezat înainte de a fi clar identificat prin analize de îndepărtate. Rolul lor în evolu•ie este greu de exagerat.
secven•ă genomică
[26] . Există diferite metode bazate fie pe analize filogenetice, fie pe secven•e
compozi•ionale, oferind puncte de vedere diferite asupra fenomenului, care este acum
larg recunoscut ca o for•ă majoră care modelează evolu•ia genomului. Alinierea
secven•elor complete ale genomului vizualizate prin reprezentări de puncte sau linii a
oferit, de asemenea, o imagine foarte revelatoare asupra dinamicii rearanjărilor 7. Perspective: avem nevoie de mai multe secven•e de genom?
genomului ( Fig. 1 ). Genomii tind să se extindă •i să se contracte. Este admis în mare
măsură că reducerea dimensiunii poate apărea în medii mai stabile •i favorabile, a•a cum 7.1. Procariote
se vede în intracelulare
Mai multe indicii indică faptul că este posibil să avem suficiente secven•e de genom,
deoarece suntem probabil aproape de limite

Vă rugăm să cita•i acest articol în presă ca: J. Weissenbach, The rise of genomics, CR Biologies (2016), http://dx.doi.org/10.1016/
j.crvi.2016.05.002
Modelul G
CRASS3-3444; Numărul de pagini 9

J. Weissenbach / CR Biologies xxx (2016) xxx – xxx 7

Vă rugăm să cita•i acest articol în presă ca: J. Weissenbach, The rise of genomics, CR Biologies (2016), http://dx.doi.org/10.1016/
j.crvi.2016.05.002
Modelul G
CRASS3-3444; Numărul de pagini 9

8 J. Weissenbach / CR Biologies xxx (2016) xxx – xxx

ca limite de dimensiuni superioare •i inferioare, con•inut extrem de GC / AT, satura•ie a deasupra posibilită•ilor oferite de metagenomică în zona biodiversită•ii eucariote. În
setului de gene extrem de conservate, •anse diminuate de a descoperi un nou pliu proteic partea opusă a orizontului, progresul realizat în genomica cu celule unice, în special cu
sau o nouă superfamilie proteică. disponibilitatea recentă a citirilor de secven•e lungi, va completa util imaginea embrionară
dată de analizele metagenomice până în prezent.
În schimb, secven•ele complete ale genomului vor fi, de asemenea, necesare
continuu doar pentru a ghida munca experimentală •i pentru a detecta genele •i trăsăturile
lipsă. Cu toate acestea, necesitatea secven•ierii organismului favorit al fiecărei persoane Genomica devine, de asemenea, un instrument pentru noi aplica•ii, cum ar fi
a dus la o prejudecată majoră în reprezentarea genomului complet secven•iat, precum •i identificarea agen•ilor patogeni •i căutarea atât a muta•iilor dobândite, cât •i a celor
a schi•elor. Bacteriile cu relevan•ă medicală au beneficiat de munca intensivă. Deoarece mo•tenite în bolile umane. Mai mult, nimeni nu putea prevedea că •i genomica va
oferă indicii privind virulen•a, specifica•ia gazdei, rezisten•a la medicamente •i permit revolu•iona antropologia •i arheologia umană •i suntem tocmai la începutul acestei
studiul agen•ilor patogeni la scară planetară, inclusiv agen•ii patogeni emergen•i, mai fascinante reînnoiri a saga omenirii. Aceste aplica•ii care au apărut cu GNS sunt doar
multe tulpini au fost secven•iate pentru mul•i agen•i patogeni. Acest lucru a dus la o men•ionate pentru a ilustra cât de departe a fost apari•ia genomicii •i rezultatul acesteia.
suprareprezentare majoră a câtorva filuri, •i anume la Proteobacterii, Actinobacterii •i
Firmicutes, •i chiar în astfel de diviziuni efortul de secven•iere s-a concentrat pe un set
foarte limitat de specii sau genuri.

8. Dincolo de genomică

Dimpotrivă, genomica mediului rămâne în urmă •i diversitatea evolutivă vastă Secven•ele genomului au devenit un instrument esen•ial •i obligatoriu •i nu numai
a•teaptă încă o explorare mai intensă. Unele ini•iative încearcă să corecteze această pentru biologi. Genomica oferă o descriere moleculară a principalilor actori ai vie•ii,
tendin•ă nesatisfăcătoare [29] . În special, DOE a lansat un program intitulat Genomic proteinele, •i oferă o perspectivă asupra tuturor aspectelor biologiei: metabolism,
Encyclopaedia of Bacteria and Archaea, cu scopul de a acoperi listele actuale de tulpini fiziologie, biologie celulară, patologie, inclusiv boli infec•ioase, evolu•ie •i a•a mai departe.
de tip procariote.

Datorită secven•elor genomului, a devenit posibilă •i identificarea unei noi lumi de


molecule, ARN-urile necodificatoare (ncRNAS) dintre care unele au o func•ie dovedită •i
7.2. Eucariote clară în celule. Nu este scopul acestei lucrări să descrie •i să discute despre ace•ti noi
actori biologici. Rezultatele ini•iale tind să arate că rolul lor poate fi foarte divers. Uneori
O tendin•ă de reprezentare a•a cum se vede în procariote este prezentă •i în pare deja bine documentat în ceea ce prive•te microARN-urile. Dar, în general, rolurile
eucariote. În timp ce costul secven•ierii genomului bacterian a devenit foarte modest ncRNA-urilor, dacă există, sunt mai pu•in clare. Pentru a complica lucrurile, conservarea
odată cu apari•ia NGS, tendin•a observată în genomii eucariote reflectă în mare măsură secven•ei este extrem de variabilă [34] •i au fost raportate unele cazuri de knockout fără
oportunită•ile de finan•are •i are ca rezultat o supra-reprezentare a genomilor de interes fenotip rezultat. Cu toate acestea, speran•e mari sunt plasate în experimentele de
economic. Există astfel întreaga filă a arborelui filogenetic eucariot care rămâne total îndepărtare chirurgicală a regiunilor care codifică ARNc mediate de sistemul CRISPR /
neexplorat. Unele studii de adaptare a secven•ierii metagenomice, cum ar fi proiectul Cas9.
Tara Ocean

[30] , au arătat rezultate încurajatoare •i ar putea fi extinse la alte medii. În mod similar, Genomii nu codifică doar diferitele molecule opera•ionale, ci fac parte, de asemenea,
lumea virală eucariotă rămâne foarte pu•in explorată •i observa•ii la fel de nea•teptate ca din elementele structurale care exercită func•ii ale sistemului celular, a•a cum îl •tim încă
descoperirea viru•ilor uria•i [31] rămân posibile. de la concep•ia modelului de operon lactoză. De asemenea, genomii participă la propria
replicare. Caracterizarea secven•ei genomice a acestor elemente, împreună cu
moleculele care interac•ionează, care contribuie la rolurile multiple este în curs de
desfă•urare •i reprezintă obiectivul biologiei genomului. ARNc-urile joacă probabil mai
7.3. Alte direc•ii multe roluri în biologia genomului. Eforturile ini•iale la scară largă au produs deja cantită•i
masive de date [18,19] •i ar trebui să contribuie la progresul în această nouă disciplină.
Aplicată atât în scopuri de mediu, cât •i medicale, metagenomica a produs o
mul•ime de rezultate •i a oferit o primă perspectivă asupra tărâmului organismelor
necultivate din diferite ni•e. [30,32,33] . Am men•ionat

Fig. 1. A. Dot-diagramă de aliniere a unui E coli Secven•a genomului K12 MG1655 împreună cu acela•i genom după evolu•ie timp de câteva luni în condi•ii nefavorabile. Fiecare potrivire de nucleotide este reprezentată
de un punct. La scara utilizată, succesiunea punctelor apare ca o linie. Nucleotidele potrivite în aceea•i orientare sunt în puncte ro•ii, nucleotidele potrivite în orientări opuse sunt în verde (în stânga jos). Transpunerea
unui segment are ca rezultat schimbări ale alinierilor în regiunea afectată •i întreruperi ale aliniamentului principal (diagonală) (dreapta sus). B. Graficul de puncte al alinierii unui Acinetobacter baylyi

Secven•a ADP1 (abscisă) împreună cu Acinetobacter baumannii AYE (ordonat). Fiecare potrivire de nucleotide este reprezentată de un punct ca panoul A. Spre deosebire de panoul A care prezintă o identitate de
secven•ă foarte mare, genomurile celor două Acinetobacter speciile prezintă o divergen•ă importantă arătată de numeroase întreruperi •i deplasări ale diagonalelor. Se pot observa numeroase •tergeri, transpuneri •i
inversiuni. Originile replicării se află în orientare opusă pe ambii genomi. C. Diagrama liniei de aliniere a unui A. baylyi secven•ă (sus) împreună cu A. baumannii AYE (jos) care prezintă sintezii conservate. Alinierea a fost
calculată de software-ul MicroScope prin compara•ii perechi între secven•ele de proteine corespunzătoare. Liniile verzi unesc grupuri de gene omoloage (care prezintă conservarea secven•ei) în aceea•i orientare (în
ceea ce prive•te originea replicării). Liniile ro•ii unesc grupuri de gene omoloage în orientare opusă. Cromozomii linealiza•i sunt reprezenta•i cu secven•ele lor de inser•ie (în roz), ARNr (în albastru) •i gene ARNt (în verde)
pe fiecare catena de ADN.

Vă rugăm să cita•i acest articol în presă ca: J. Weissenbach, The rise of genomics, CR Biologies (2016), http://dx.doi.org/10.1016/
j.crvi.2016.05.002
Modelul G
CRASS3-3444; Numărul de pagini 9

J. Weissenbach / CR Biologies xxx (2016) xxx – xxx 9

[8] CM Fraser, JD Gocayne, O. White •i colab., Complementul genetic minim al Mycoplasma


Într-un fel, genomica este punctul culminant al biologiei moleculare. Ne-a plasat în
genitalium, Science 270 (1995) 397-403.
centrul informa•iilor care specifică •i controlează procesele •i sistemele biologice. În timp
[9] A. Goffeau, BG Barrell, H. Bussey •i colab., Life with 6000 gene, Science 274 (546) (1996) 563-567.
ce mergem mai departe, ar trebui să avem în vedere avertismentul lui Brenner [21] :
[10] Consor•iul CeS, secven•a genomului nematodului C. elegans: A
platformă pentru investigarea biologiei, Science 282 (1998) 2012–2018.
[11] Ini•iativa AG, Analiza secven•ei genomului plantei cu flori
Arabidopsis thaliana, Nature 408 (2000) 796-815.
'' Ceea ce majoritatea oamenilor au uitat în eliminarea lor u•oară a biologiei [12] Consor•iul interna•ional de secven•iere a genomului uman, finisare
moleculare este că a introdus no•iunea de informa•ii în biologie •i a arătat că are o secven•a euchromatică a genomului uman, Nature 431 (2004) 931-945.

bază materială sub formă de secven•e de acid nucleic. Ne obligă să ne gândim la


[13] RH Waterston, ES Lander, JE Sulston, Despre secven•ierea genomului uman, Proc. Natl. Acad.
sistemele biologice ca la sisteme de procesare a informa•iilor moleculare, mai •tiin•ă. SUA 99 (2002) 3712–3716.
degrabă decât la sisteme implicate doar în procesele moleculare ale tranzac•iilor de [14] MD Adams, GG Sutton, HO Smith, EW Myers, JC Venter, Independen•a ansamblurilor noastre de
genom, Proc. Natl. Acad. •tiin•ă. SUA 100 (2003) 3025-3026.
energie •i ale transformărilor chimice. "

[15] M. Yandell, D. Ence, Un ghid pentru începători pentru adnotarea genomului eucariot, Nat. Pr.
Genet. 13 (2012) 329–342.
[16] E. Sallet, B. Roux, L. Sauviac, MF Jardinaud, S. Carrère, T. Faraut, F. de Carvalho-Niebel, J.
În timp ce în computere oamenii au separat hardware-ul •i software-ul, via•a •i-a Gouzy, P. Gamas, D. Capela, C. Bruand, T. Schiex, Adnotarea genera•iei următoare a
genomurilor procariote cu EuGene-P: aplicare la Sinorhizobium meliloti 2011, DNA Res. 20
păstrat întotdeauna sarcinile strâns complicate •i adesea îndeplinite de aceea•i moleculă.
(2013) 339-354.
Acest lucru nu va facilita separarea complexită•ii sistemelor biologice. Dar provocările
sunt exact ceea ce avem nevoie. [17] DE Wood, H. Lin, A. Levy-Moonshine, R. Swaminathan, YC Chang, BP Anton, L. Osmani, M.
Steffen, S. Kasif, SL Salzberg, Mii de gene ratate găsite în genomii bacterieni •i analiza lor cu
COMBREX, Biol. Direct. 7 (2012) 37.

Dezvăluirea dobânzii [18] DM Altshuler, RA Gibbs, L. Peltonen •i colab., Integrarea varia•iilor genetice comune •i rare în
diverse popula•ii umane, Nature 467 (2010) 52-58.

Autorul declară că nu are niciun interes concurent.


[19] EP Consortium, O enciclopedie integrată a elementelor ADN din genomul uman, Nature 489 (2012)
57–74.
[20] C. Andorf, D. Dobbs, V. Honavar, Explorarea inconsecven•elor în adnotările func•iei proteinelor la
Mul•umiri
nivelul întregului genom: o abordare de învă•are automată, BMC Bioinformatics 8 (2007) 284.

Îi sunt îndatorat lui Susan Cure, Claudine Médigue •i Patrick Wincker pentru că au [21] S. Brenner, Secven•e •i consecin•e, Philos. Trans. R. Soc. Londra, Ser. B 365 (2006) 207–212.

propus numeroase •i grijulii îmbunătă•iri acestui manuscris •i lui Véronique de Berardinis,


[22] B. Dujon, Genomica evolutivă a drojdiei, Nat. Pr. Genet. 11 (2010) 512-524.
Stéphane Cruveiller •i David Vallenet pentru ajutorul lor în pregătirea tabelelor •i a figurii.
[23] O. Jaillon, JM Aury, F. Brunet •i colab., Duplicarea genomului în pescuitul teleost Tetraodon
nigroviridis dezvăluie protocariotipul timpuriu al vertebratelor, Nature 431 (2004) 946-957.

[24] R. Koszul, S. Caburet, B. Dujon, G. Fischer, Evolu•ia genomului eucariot prin duplicarea spontană a
Finan•area: FACAD.
segmentelor cromozomiale mari, EMBO J. 23 (2004) 234-243.

Referin•e [25] A. Belyayev, Rafale de elemente transpozabile ca for•ă motrice evolutivă, J. Evol. Biol. 27 (2014)
2573–2584.
[1] VA McKusick, FH Ruddle, O nouă disciplină, un nou nume, un nou jurnal, Genomics 1 (1987) 1-2. [26] JG Lawrence, H. Ochman, Ameliorarea genomului bacterian: rate de schimbare •i schimb, J. Mol.
Evol. 44 (1997) 383–397.
[2] W. Min Jou, G. Haegeman, M. Ysebaert, W. Fiers, Secven•a nucleotidică a genei care codifică [27] G. Vernikos, D. Medini, DR Riley, H. Tettelin, Zece ani de analize pan-genomice, Curr. Opin.
proteina de acoperire bacteriofag MS2, Nature 237 (1972) 82-88. Microbiol. 23 (2015) 148–154.
[28] U. Dobrindt, B. Hochhut, U. Hentschel, J. Hacker, Insule genomice în microorganisme patogene •i
[3] W. Fiers, R. Contreras, F. Duerinck, G. Haegeman, D. Iserentant, J. Merregaert, W. Min Jou, F. de mediu, Nat. Pr. Microbiol. 2 (2004) 414-424.
Molemans, A. Raeymaekers, A. Van den Berghe, G. Volckaert, M. Ysebaert , Secven•a
nucleotidică completă a ARN-ului bacteriofag MS2: structura primară •i secundară a genei [29] NC Kyrpides, P. Hugenholtz, JA Eisen •i colab., Enciclopedia genomică a bacteriilor •i archaea:
replicazei, Nature 260 (1976) 500-507. secven•ierea amyriad de tulpini de tip, PLoS Biol. 12 (2014) e1001920.

[4] F. Sanger, S. Nicklen, AR Coulson, secven•ierea ADN-ului cu inhibitori de terminare a lan•ului, [30] C. de Vargas, S. Audic, N. Henry •i colab., Ocean plancton. Diversitatea planctonului eucariot în
Proc. Natl. Acad. •tiin•ă. SUA 74 (1977) 5463–5467. oceanul luminat de soare, Science 348 (2015) 1261605.
[5] F. Sanger, GM Air, BG Barrell, NL Brown, AR Coulson, CA Fiddes, [31] C. Abergel, M. Legendre, J.-M. Claverie, Universul cu expansiune rapidă a virusurilor uria•e: Mimivirus,
CA Hutchison, PM Slocombe, M. Smith, Secven•a nucleotidică a bacteriofagului phi X174 ADN, Pandoravirus, Pithovirus •i Mollivirus,
Nature 265 (1977) 687–695. FEMS Microbiol. Rev. 39 (2015) 779–796.
[6] A. Efstratiadis, JW Posakony, T. Maniatis, RM Lawn, C. O'Connell, RA Spritz, JK DeRiel, BG [32] JC Venter, K. Remington, JF Heidelberg •i colab., Secven•ierea pu•tii genomului de mediu al Mării
Forget, SM Weissman, JL Slightom, AE Blechl, Sargasso, Science 304 (2004) 66-74.
O. Smithies, FE Baralle, CC Shoulders, NJ Proudfoot, Structura •i evolu•ia familiei genelor [33] J. Qin, R. Li, J. Raes •i colab., Un catalog de gene microbiene ale intestinului uman stabilit prin
beta-globinei umane, Cell 21 (1980) 653-668. secven•ierea metagenomică, Nature 464 (2010) 59-65.

[7] RD Fleischmann, MD Adams, O. White •i colab., Secven•ierea aleatorie a întregului genom •i [34] W. Haerty, CP Ponting, Nicio genă din genom nu are sens decât în lumina evolu•iei, Annu. Pr.
asamblarea Haemophilus in fl uenzae Rd, •tiin•a 269 (1995) 496-512. Genomică Hum. Genet. 15 (2014) 71-92.

Vă rugăm să cita•i acest articol în presă ca: J. Weissenbach, The rise of genomics, CR Biologies (2016), http://dx.doi.org/10.1016/
j.crvi.2016.05.002

S-ar putea să vă placă și