Sunteți pe pagina 1din 9

GENOMIC COMPARAT

Genomica comparat reprezint studiul diferenelor i asemnrilor n ceea ce privete


structura i organizarea genomului la diferite organisme.
Genomica comparat rspunde la ntrebri de tipul:
-

cum se reflect n genomul nostru diferenele dintre om i alte organisme,

ct de asemntoare sunt proteinele umane, de la Drosophila, viermi, plante,


drojdii i bacterii.

Genomica comparat urmrete dou aspecte importante:


1. nelegerea detaliat a procesului evolutiv la nivelul taxonilor superiori (originea
taxonilor superiori) i la nivelul speciilor nrudite (prin ce se deosebesc ntre ele
speciile nrudite).
2. corelarea secvenelor ADN cu proteine cu funcii cunoscute. Secvenele ADN
care codific proteine implicate n funcii celulare importante sunt mai bine
conservate dect secvenele care codific funcii neimportante sau dect
secvenele necodificatoare. Ideale pentru comparaie sunt specile

cu form,

fiziologie i comportament asemntor, dar cu genom suficient de diferit, aa


nct secvenele non-funcionale sa fi evoluat divergent. n plus, se pare c
proteinele cu structur primar sau secundar similar ndeplinesc funcii
asemntoare.
Gene ortolog, gene paralog i nlocuirea genelor
Genele ortolog sunt gene omoloage de la organisme diferite care codific proteine cu
aceeai funcie i care au evoluat din ancestor comun.
Genele paralog sunt gene omoloage de la acelai organism care codific proteine cu
funcii nrudite, dar nu identice.
Conform acestor definiii, genele ortolog au evoluat prin acumularea gradat de mutaii,
n timp ce genele paralog apar prin duplicaii urmate de acumularea de mutaii. Exemple
de gene paralog sunt familiile de gene.
Numeroase activiti biochimice sunt comune la majoritatea organismelor. De exemplu:
ciclul acidului citric, generarea de ATP, sinteza nucleotidelor, replicarea ADN etc. Se
poate considera c n fiecare caz n parte este vorba despre gene ortolog. ntr-adevr
1

exist familii universale de proteine, care se regsesc att la Archea i Eubacteria, ct


i la Eucaria (Kyrpides 1999). Totui, exist dovezi conform crora, echivalena
funcional a proteinelor nu se datoreaz nici similaritii de secven, nici structurii
tridimensionale identice (Galperin 1998, Huynen 1999). n multe situaii este vorba
despre un proces de nlocuire a genelor. De exemplu, analiza enzimelor din ciclul
acidului citric la bacterii i la archea, arat c n cazul a cel puin 25% dintre enzimele de
la Escerichia colii este vorba despre o nlocuire a genelor.
Un exemplu contrar nlocuirii genelor, este cel legat de posibilitatea ca unele proteine,
cu funcii i secvene foarte diferite s fie nrudite, deoarece au structur tridimensional
asemntoare (Brenner 1998). Se poate ca analizele convenionale s nu detecteze
omologia. De exemplu, structura D-alaninei: D-alanil ligaza, glutation sintetaza,
domeniile de legare ATP de la carbamoil fosfat sintetaza i succinil CoA sintetaza sunt
att de similare nct este aproape sigur c provin din ancestor comun. Totui, prin
compararea secvenelor nu se confirm omologia.
Evoluia proteinelor prin exon shuffling
Analiza secvenelor i a structurii tridimensionale de la numeroase proteine a artat c
acestea sunt alctuite din domenii discrete. Aceste proteine, numite proteine mozaic
sunt larg rspndite la metazoare. Majoritatea proteinelor mozaic sunt extracelulare, sau
formeaz partea extracelular a proteinelor membranare, din care cauz au jucat un rol
important n evoluia organismelor pluricelulare.
Diferitele domenii ale proteinelor mozaic sunt ades implicate n anumite funcii specifice,
care contribuie la activitatea global a proteinei. Aceste domenii sunt mobile n decursul
evoluiei, n sensul c s-au rspndit n timp, i acum se regsesc i la alte proteine
nenrudite (Doolitle 1995). Domeniile mobile se caracterizeaz prin capacitatea de a se
mpacheta independent, prevenindu-se mpachetarea greit la momentul inseriei ntr-o
nou protein. Pn acum au fost identificate mai mult de 60 de domenii mobile.
Analiza genelor care codific proteine mozaic a evideniat o corelaie strns ntre
organizarea domeniilor i structura intron-exon. Acest lucru nseamn c fiecare
domeniu este codificat de un exon sau de o combinaie de exoni, iar o nou combinaie
este creat prin recombinare ntre secvenele implicate. Acest proces, cunoscut sub

numele de exon shuffling (amestecarea exonilor) produce gene rearanjate, cu funcie


alterat.
Deoarece lungimea medie a intronilor este mult mai mare dect lungimea medie a
exonilor, iar frecvena recombinrilor este proporional cu lungimea ADN, marea
majoritate a recombinrilor au loc n regiunile necodificatoare. Numrul mare de
elemente transpozabile i de secvene repetitive la nivelul intronilor va facilita
amestecarea exonilor prin intermediul mperecherilor greite i a recombinrilor ntre
gene neomoloage.
Dei proteinele mozaic sunt comune la metazoare, ele se regsesc i la organismele
unicelulare. Deoarece, pn n prezent au fost secveniate numeroase genomuri
microbiene, inclusiv de la reprezentani ale celor trei regnuri (Archea, Eubacteria,
Eucaria) a devenit posibil determinarea mobilitii domeniilor n decursul evoluiei. n
acest sens, Wolf i colab. (2000) au studiat n genomurile de la 15 bacterii, 4 archea i 1
eucariot genele care codific proteine alctuite din mai multe domenii. Au fost astfel
descoperite 37 de proteine formate dintr-un domeniu nativ i un domeniu strin
achiziionat prin transfer orizontal. n cteva situaii, genomul coninea gena pentru
proteina mozaic i o secven de sine stttoare a domeniului strin, dar de obicei
aceasta lipsea.
Genomica comparat a organitelor
Majoritatea eucariotelor au cel puin un genom extranuclear, care se replic
independent de cel nuclear, este mult mai mic i mai uor de investigat. Majoritatea
organitelor se motenesc uniparental. Mitocondriile animalelor se transmit pe linie
matern, iar cloroplastele i mitocondriile plantelor se motenesc, de asemenea
maternal, dar exist i excepii, ca de exemplu la conifere, unde cloroplastele se
transmit pe linie patern.
ADN mitocondrial (ADNmt) are acelai rol la toate eucariotele, adic codific un numr
limitat de ARN i proteine eseniale pentru formarea i funcionarea mitocondriilor. Dei
rolul genetic al ADNmt pare a fi universal conservat, exist o mare variaie n ceea ce
privete conformaia i mrimea genomului mitocondrial, precum i n coninutul de
gene, ordinea i exprimarea acestora.

ADNmt tipic este circular, dei exist i molecule liniare, avnd la animale i fungi 15-20
kb, ceea ce reprezint aproximativ 1/10000 din cel mai mic genom eucariot Tabel 1). La
plante, n schimb este foarte mare (200-2000 kb), rivaliznd nucleul n ceea ce privete
paradoxul valorii C. Cu ct genomul mitocondrial al plantelor este mai mare, cu att
conine mai mult ADN spacer, ntruct nu pare s aib un numr mai mare de gene
comparativ cu cele de dimensiuni mici. Acest lucru este valabil i n cazul comparaiei
dintre plante i animale; astfel, ADNmt de la Arabidopsis thaliana este de 20 de ori mai
mare dect ADNmt uman, dei are de dou ori mai puine gene ca acesta.
Tabel 1 Trsturi comparative ale ADNmt
Caracteristici
Conformaie
Mrime
ADN necodificator (%)
Numr de gene

Domeniu
Cicular sau liniar
6-2000 kb
10-80
5-97

Dup secvenierea genomului mitocondrial s-a dovedit c exist dou tipuri


fundamentale de ADNmt, denumite tipul ancestral i tipul derivat (Tabel 2).
Tabel 2 Proprietile ADNmt derivat i ancestral (dup Marienfeld 1997)
ADNmt ancestral

ADNmt derivat

1. Conine numeroase extragene comparativ


cu ADNmt animal
2. Conine gene pentru ARNr asemntor
bacteriilor: pentru ARNr 23S, ARNr 16S i
ARNr 5S
3. Set complet sau aproape complet de gene
pentru ARNt
4. mpachetare strns a informaiei genetice
cu civa introni sau fr introni
5. Clusteri de gene asemntori cu cei
bacterieni
6. Folosete codul genetic standard

1. Pierdere extensiv de gene


2. Divergen marcat a structurii ADNr i
ARNr
3. rat accelerat de divergen a secvenelor
att la genele care codific proteine, ct i la
cele pentru ARNr
4. Utilizare cu predilecie a unor codoni,
inclusiv eliminarea celor mai puin folosii
5. Introducerea unor codoni non standard

ADNmt ancestral este cel care a pstrat vestigii ale eubacteriilor endosimbionte
ancestrale, care s-au stabilit n celulele nucleate, conform teoriei endosimbionte privind
orginea organitelor celulare. Prototipul ADNmt ancestral este cel de la protozoarul
heterotrofic flagelat Reclinomonas americana. Acest ADNmt conine 97 de gene i

include toate genele care codific proteine i au fost gsite n toate celelalte genomuri
mitocondriale secveniate.
Genomul mitocondrial derivat este foarte diferit de modelul ancestral. La animale
(inclusiv la numeroase protozoare) se constat o reducere substanial a mrimii i
coninutului de gene. La plante i n special la Angiosperme, se constat o reducere
extensiv a numrului de gene, precum i o cretere a mrimii genomului mitocondrial,
datorat duplicrii frecvente a ADN i achiziionrii de secvene din nucleu i cloroplaste.
n prezent se consider c cea mai apropiat rud a ADNmt este Rickettsia
prowazechii, care este egentul tifosului. Secvenierea genomului de la R. Prowazechii,
dar i profilul funcional al genelor sale arat similariti cu mitocondriile (Andersson
1998). Structura, organizarea i coninutul de gene al acestei bacterii seamn foarte
mult cu ADNmt de la Reclinomonas americana.
Transferul intracelular de gene. Principala funcie a mitocondriilor este generarea de
ATP prin fosforilare oxidativ. n acest proces sunt implicate cel puin 21 de gene care
codific proteinele necesare pentru fosforilarea oxidativ i 14 gene care codific
proteine ribozomale, necesare pentru translatarea ADNmt. Dei se presupunea c toate
aceste gene se gsesc n genomul mitocondrial, analiza secvenelor a artat c din
genomurile mitocondriale lipsesc multe dintre aceste gene, care se regsesc ns n
nucleu. Acest lucru presupune un transfer de gene funcionale din mitocondrii spre
nucleu. Actual, la animale acest transfer a fost stopat, parial din cauza modificrii
codului genetic. La plante i la protozoare ns, acest transfer continu deoarece nu
exist bariere n ceea ce privete codul genetic.
Un transfer similar de gene s-a observat i ntre nucleu i cloroplaste i exist dovezi
privind un transfer invers, dinspre nucleu spre organite.????
Genomica comparat a eucariotelor
Genomul minim eucariot. Reprezint genomul care conine minimum de elemente
care asigur supravieuirea.
Este dificil de stabilit care este la eucariote mrimea minim necesar a genomului,
deoarece a fost secionat pn n prezent un numr mic de genomuri. Totui, genomul
eucariotului parazit Encephalitozoon cuniculi are doar 2,9Mb, iar cel al rudei sale, E.
5

Intestinalis este estimat la 2,3Mb. Aceste genomuri conin puin ADN repetitiv, altul dect
ARNr i probabil, mai puin de 2000 de gene. Cu toate acestea, ele sunt de 7+8 ori mai
mari dect genomul minim procariot. Totui, trecerea de la procariote la eucariote nu
necesit o cretere semnificativ a mrimii genomului.
Dintre organismele pluricelulare al cror genom a fost secveniat, Arabidopsis,
Caenorhabditis i Drosophila au aproximativ acelai numr de gene, respectiv 11-18000
de gene. Aceasta poate s fie minima complexitate necesar pentru foarte diferitele
eucariote pluricelulare pentru dezvoltare i adaptare la mediu.
La vertebrate, genomul minim identificat i apaine unui pete din Japonia (Fugu
rubripes), are acelai numr de gene ca genomul uman. n timp ce la om exist
aproximativ 30.000 de gene distribuite pe 3200Mb, la Fugu acelai numr de gene se
gsete restricionat la 400Mb. Acest lucru se datoreaz densitii mari a genelor,
secvenelor intergenice i intronice scurte, precum i lipsei elementelor repetitive
(Venkatesh 2000). Cu toate acestea punctele de splicing (limitele introni-exoni) sunt
similare la cele dou specii.
n vrful arborelui filogenetic se gsesc mamiferele, la care cel mai mic genom
identificat pn n prezent aparine unei specii de liliac (Miniopterus). Genomul acestuia
reprezint aproximativ 50% din genomul uman, dar nu se cunoate dac aceast
mrime este rezultatul compactrii genelor sau pierderii de gene.
Comparaii ntre principalele genomuri secveniate. Deoarece genomurile eucariote
secveniate pn n prezent aparin unor specii ndeprtate filogenetic, comparaiile pot
fi fcute doar la nivel grosier.
Un punct de pornire este compararea numrului i tipurilor de secvene repetitive
din diferite genomuri, pentru c acestea genereaz diferene n mrimea genomului.
Astfel,:
-

poriunea eucromatinic a genomului uman are o densitate foarte mare de copii


ale elementelor transpozabile comparativ cu alte organisme pluricelulare;

75% din ADN repetitiv uman este reprezentat de elemente LINE i SINE, fa de
alte specii la care nu exist o familie dominant de elemente repetitive;

n timp ce elementele transpozabile din genomul uman sunt vechi ca vrst, cele
de la alte specii au origine mai recent.

Comparaiile la nivelul genelor evideniaz, de asemenea, numeroase aspecte


interesante.
1. Exist diferene n ceea ce privete structura intronilor i exonilor la eucariote; de
exemplu Arabidopsis este foarte diferit. n Tabelul 3 se observ o tendin de
conservare a mrimii exonilor la primele trei specii, ceea ce sugereaz
conservarea unor aspecte n mecanismul de splicing. n ceea ce privete
mrimea intronilor, se observ diferene foarte mari ntre specii.
Tabel 3 Comparaii ntre exonii i exonii din diferite genomuri eucariote
Om

Drosophila

Caenorhabditis

Arabidopsis

Lungimea medie a exonilor (pb)

1340

1497

1311

2013

Lungimea medie a intronilor (pb)

3300

487

267

170

87

59

47

120-140

120-140

120-140

Lungimea obinuit a intronilor (pb)


Lungimea medie a exonilor (pb)

250

2. Numrul de gene este i el foarte variat. Astfel, la om se estimeaz c exist n


jur de 28000-30000 de gene, la drojdii 6000, la Drosophila melanogaster 13000,
la Caenorhabditis 18000, la plante 26000. Trebuie menionat c nici un numr nu
este foarte corect. La om exdist un nivel ridicat de splicing alternativ, ceea ce
face ca aceeai gen s codifice mai multe proteine. Totui, numrul proteine nu
este suficient pentru a explica diferenele fizice i comportamentale dintre specii.
3. La eucariote numeroase proteine sunt alctuite din mai multe domenii. Analiza
secvenelor a artat c peste 90% dintre domeniile care pot fi identificate n
proteinele umane se regsesc i la Drosophila i la Caenorhabditis. Cu alte
cuvinte, evoluia vertebratelor nu este asociat cu apriia de noi domenii, ci
probabil cu noi combinaii ale domeniilor.
Dei numeroase proteine sunt mozaicuri de domenii, un procent mare de
proteine codificate de oricare dintre genomurile secveniate au gene ortolog n
alte genomuri secveniate. De exemplu, 60% dintre proteinele umane au
corespondeni la plante, drojdii, Drosophila i Caenorhabditis, iar 61% dintre
proteinele de la Drosophila, 43% dintre cele de la Caenorhabditis i 46% dintre
proteinele de la drojdii au omologi umani.

n 2001, Venter i colab. a identificat 1523 de proteine umane care au gene


ortolog stricte la Drosophila i Caenorhabditis. Funciile proteinelor care difer
semnificativ ntre om i alte specii sunt cele implicate n imunitate, dezvoltare
neuronal, semnalizare inter i intracelular, homeostazie i apoptoz.
Comparnd proteinele funcionale de la Arabidopsis cu cele de la alte specii s-a
observat c 48-60% dintre proteinele implicate n sinteza proteic au omologi la
alte specii, refelctnd nalta conservare a funciilor genelor corespunztoare. n
contrast, numai 8-23% dintre factorii transcripionali au omologi la alte specii,
sugernd evoluia independent a factorilor transcripionali la plante.
Compararea ordinii genelor la diferite organisme este util n studiile de filogenie
molecular. Genomurile secveniate pn n prezent aparin la specii prea ndeprtate
filogenetic pentru a putea evidenia o dinamic a evoluiei ordinii genelor. De aceea
trebuie comparate specii nrudite, ca de exemplu Saccharomyces cerevisiae i Candida
albicans, la care s-au observat numeroase inversiuni ale ordinii genelor, dar majoritatea
sunt inversiuni simple.
Compararea ordinii genelor ntre cromozomul 19 de la om (HSA19) i regiunile nrudite
de la oarece, a artat c la majoritatea primatelor HSA19 exist ca o singur unitate
conservat de linkage, iar linkage-ul fiecrui bra cromozomial este nalt conservat la
cini, vaci i oi. Spre deosebire de aceast situaie, secvenele omoloage de la oarece
sunt dispersate n ntreg genomul, dar pstreaz o conservare a ordinii genelor. Totui,
dei coninutul n gene este identic, unele regiuni HSA19 sunt mult mai extinse
comparativ cu secvenele nrudite de la oarece. Acest lucru se datoreaz numrului de
elemente repetitive, n special SINE.
Alte aspecte de genomic comparat
Transferul lateral de gene. Studiul amanunit al genomului uman a artat c ntre 113
i 223 de gene au fost transferate de la bacterii la om sau la unii dintre ancestorii
vertebrai. Dovada pentru acest transfer o reprezint prezena la om a unor secvene
asemntoare genelor bacteriene i lipsa acestora la nevertebrate.
Evaluarea posibilitii existenei unui transfer lateral de gene de la bacterii se poate face
i prin intermediul construirii arborilor filogenetici pentru fiecare gen candidat. Dac o
8

gen de la vertebrate formeaz cluster cu gene de la bacterii, este posibil ca aceast


gen s provin prin transfer lateral. (Clusterul reprezint un grup de organisme ce
mparte cel mai apropiat ancestor comun.)
Amprentarea filogenetic. Majoritatea comparaiilor se refer la proteine pentru c,
datorit redundanei codului genetic (mai muli codoni codific acelai aminoacid),
secvenele proteice evolueaz cu o rat mult mai lent dect ADN. Astfel, este mult mai
uor s se detecteze ortologiile i paralogiile la nivelul proteinelor.
Cu toate acestea, compararea secvenelor ADN poate furniza, la rndul ei, informaii,
deoarece genele (secvenele codificatoare) evolueaz cu o rat mai redus dect
secvenele necodificatoare. Acest lucru se datoreaz presiunii exercitate de selecie
asupra produilor genelor.
Analiza comparativ a secvenelor ADN utilizeaz diferenele n ratele locale ale
mutaiilor pentru a identifica elemente funcionale ca: gene, secvene reglatoare, s
.itusuri de splicing etc. n acest fel se detecteaz secvenele ortolog, care provin din
ancestor comun i sunt transmise vertical. Acest proces se numete amprentare
filogenetic.
n selectarea secvenelor ce urmeaz a fi comparate se ine cont de anumite criterii:
-

secvenele trebuie s fie suficient de divergente, aa nct elementele funcionale


s se deosebeasc de elementele nonfuncionale mai puin conservate;

secvenele s fie suficient de apropiate aa nct secveele ortolog s nu se


piard prin evoluie.

Din analiza secvenelor a 100 de perechi de regiuni ortolog intergenice de la om i de la


oarece a rezultat c 17% dintre nucleotide sunt identice, foarte conservate, procentul
fiind de 3 ori mai mare dect la Caenorhabditis. Acest fapt sugereaz c ADN intergenic
poate fi important din punct de vedere funcional.

S-ar putea să vă placă și