Sunteți pe pagina 1din 38

CURS GENOMUL UMAN

Cuprins:
Cartografierea caracterelor umane
Linkage si DL
Secventierea genomului uman si Proiectul Genom Uman
Omica: Proteomica, Nutrigenomica
I. CARTOGRAFIEREA CARACTERELOR UMANE
Cartografierea genica = determinarea localizarii unei gene pe un anumit
cromozom.
Utilitate:
Intelegerea mecanismelor bolilor genetice,
Diagnosticul bolilor genetice,
Stabilirea riscului de recurenta in familie,
Eventual tratament.
Cartarea genomului este utilizată pentru a identifica și înregistra locația
genelor și distanțele dintre gene pe un cromozom. Realizarea unei harti
complete a genomului uman , o “enciclopedie a tuturor genelor si bolilor
genetice asociate lor”, a devenit punctul cheie al geneticii . Cartografierea
genelor a fost o etapa prealabila necesara in abordarea si finalizarea
Genomului Uman. Cartografierea genica(initial) = localizarea unor gene care
determina boli monogenice sau susceptibilitate la boala.
Cartografierea genelor pe cromozomii umani s-a realizat folosind doua
metode:
-cartografierea genetica - analizează modul în care informațiile genetice sunt
asortate între cromozomi sau între diferite regiuni din același cromozom în
timpul meiozei prin recombinare/CO
-cartografierea fizica - analizează distanța fizică dintre secvențele de ADN
cunoscute (inclusiv gene) prin stabilirea numărului de perechi de baze (A-T, C-
G) între ele.
Ambele tipuri de cartografiere a genomului concura la localizarea unei gene
(sau a unei secțiuni de ADN) pe un cromozom.
Alfred Sturtevant a creat prima hartă genetică a unui cromozom la Drosophila
melanogaster în 1913. El a stabilit că genele erau aranjate pe cromozomi într-
un mod liniar, ca mărgele pe un colier și că genele pentru trăsături specifice
sunt situate în anumite locuri. El a propus că frecvența „încrucișării”
(recombinarea) între două gene ar putea ajuta la determinarea localizării lor pe
un cromozom. El și-a dat seama că genele care erau departe una de cealalta
pe un cromozom sunt mai susceptibile de a fi moștenite separat pur și simplu
pentru că există o regiune mai mare peste care poate avea loc recombinarea.
În același mod, genele care sunt apropiate unele de altele pe cromozom sunt
mai susceptibile de a fi moștenite împreună (linkate).
Cartografierea fizică oferă o estimare a distanței (fizice) dintre secvențele
specifice de ADN cunoscute pe un cromozom.
Distanța dintre aceste secvențe de ADN cunoscute este exprimată ca numărul
de perechi de baze dintre ele.
Există mai multe tehnici diferite utilizate pentru cartografierea fizică. Acestea
includ:
1. Harta fragmentelor de restricție (cartografierea fingerprint și
cartografierea optică)
2. Cartografiere FISH
3. Cartarea sequence tagged sites(STS).
Harta fragmentelor de restrictie
Aceasta folosește enzime de restricție specifice pentru a tăia un segment
necunoscut de ADN in secvențe de bază scurte, cunoscute numite site-uri
de restricție. Enzimele de restricție taie întotdeauna ADN-ul intr-o secvență
specifică de ADN (situs de restricție). De exemplu, enzima de restricție EcoRI
(de la Escherichia coli) taie întotdeauna la secvența GAATTC / CTTAAG. Prin
urmare, dacă folosim EcoRI pentru a tăia ADN-ul, știm că secvența ADN de
fiecare parte a tăieturii va fi AATT. O hartă de restricție arată toate pozitiile
acelui sit de restricție special (GAATTC) de-a lungul genomului. O hartă fizică
este generată prin alinierea diferitelor hărți de restricție de-a lungul
cromozomilor.

Fingerprint Mapping
Genomul este separat in fragmente care sunt apoi copiate în celule
bacteriene.
Copiile ADN (clonele) sunt apoi tăiate de enzime de restricție și lungimile
fragmentelor rezultate sunt estimate folosind electroforeza.
Electroforeza separă fragmentele de ADN în funcție de mărime, rezultând
un model distinct de benzi.

Harta fingerprint este construită prin compararea modelelor din toate


fragmentele de ADN pentru a găsi zone de similaritate. Cele cu modele
similare sunt apoi grupate împreună pentru a forma o hartă. Fingerprint
mapping a stat la baza secvențierii genomului uman, șoarece, zebra-fish și
porc.

FISH
Aceasta tehnica folosește sonde fluorescente pentru a detecta localizarea
secvențelor ADN pe cromozomi.
STS
Această tehnică cartografiaza pozițiile secvențelor ADN scurte (între 200-
500 de perechi de baze în lungime) care sunt ușor de recunoscut și apar
doar o singură dată în genom. Foloseste colectii de secvente si amplificare
PCR.

Inlantuire genica(linkage)
Un cromozom este alcatuit din mai multe gene nealelice, ce ocupa, fiecare, o
pozitie fixa. Genele sunt dispuse linear in cromozomi, una dupa alta, fiind
separate prin distante intergenice de lungimi diferite. Linkage-ul dintre doi loci
este stabilit prin observarea unor frecvențe de recombinare mai mici decât se
aștepta între ele. Inlantuirea fizica a locilor aflati pe acelasi cromozom se
numeste sintenie.
Genele situate pe acelasi cromozom au tendinta de a se transmite de la parinti
la descendenti impreuna, ‘in bloc’. Acest fenomen, in care genele nealelice
situate in imediata proximitate pe acelasi cromozom nu segrega in meioza si au
tendinta de a se transmite mai frecvent impreuna in succesiunea generatiilor
se numeste inlatuire genica.
Genele dintr-o regiune cromozomiala care se transmit impreuna formeaza un
grup de inlantuire sau haplotip.
Exemplu: genele din regiunea HLA(4Mb) situate pe bratul scurt al
cromozomului 6, ce cuprinde genele HLA clasa II(DR, DP, DQ), separate de
genele de clasa III. In aceasta regiune se mai gasesc si gene care prin mutatiile
lor produc diferite boli: deficienta de 21-hidroxilaza prin mutatia genei CYP21,
hemocromatoza prin mutatia genei HFE. Genele respective se transmit strans
inlantuit cu genele HLA B(CYP21) si HLA A(HFE).

Trebuie sa precizam ca fenomenul de linkage se refera la loci si nu la alele.


De exemplu sa presupunem ca locusul D pentru o boala genetica dominanta
este inlantuit cu un alt locus M(care ar putea fi un marker al locusului morbid);
acesta prezinta doua forme alelice M si m. In unele familii alela mutanta D este
situate pe acelasi cromozom cu alela marker M(genotip DM), iar in alte familii
– cu alela marker m(genotip Dm); in fiecare caz gena D a locusului morbid si
alela respectiva a locusului marker se vor transmite impreuna, prin gameti, de
la parinti la descendenti.

Fenomenul de inlantuire genica nu este un fenomen absolut deoarece numai


genele situate foarte aproape una de cealalta se transmit intotdeauna
impreuna. In acest caz fenomenul de linkage este complet.
Exemplu: genele C,D,E ce determina grupa de sange Rh, localizate pe
cromozomul 1, se transmit intotdeauna impreuna. Pentru genele situate la
distanta una de alta, pe acelasi cromozom, inlantuirea genica poate fi
incompleta, ele putand fi separate prin crossing-over.

Asortarea independenta si recombinarea omoloaga in meioza


In timpul meiozei I, cromozomii omologi se aliniaza in perechi pe placa
ecuatoriala a fusului de diviziune . Cromozomii omologi paterni si materni
schimba segmente omoloage prin recombinare(crossing-over) si creeaza noi
cromozomi ‘ mozaic’ constand din portiuni alternante ale cromozomilor
bunicilor.
In familia ilustrata in Fig 1 sunt exemplificati cromozomii recombinati ai
descendentilor din generatia II, precum si cromozomii ‘mozaic’ai unui
descendent din generatia III, continand segmente din cromozomii tuturor
bunicilor sai. Formarea unor astfel de cromozomi evidentiaza notiunea de
individualitate genetica umana, fiecare cromozom mostenit de catre un copil
de la un parinte nu este niciodata identic cu vreunul din cromozomii parentali.

Fig. 1: Efectul recombinarii asupra originii diferitelor regiuni cromozomiale


Desi la nivel microscopic cei doi cromozomi omologi arata identic, acestia
difera substantial la nivelul secventelor de ADN. Alelele sunt secvente diferite
ale unui locus de pe o pereche de cromozomi omologi. Variantele alelice
comune(prezente la aproximativ 2% sau mai mult din populatie), constituie un
polimorfism, iar analiza de linkage in familii implica tocmai urmarirea
transmiterii acestor alele specifice.
Alelele locilor de pe cromozomi diferiti se asorteaza independent
Punerea in evidenta a CO
Evidentierea fenomenului de CO intre doua gene se poate face prin
‘incrucisarea’ unui dublu heterozigot pentru acele gene si recesivul homozigot.
Teoretic ar trebui sa rezulte proportii egale de descendenti cu aceleasi
genotipuri si fenotipuri ca si parintii.
Sa presupunem ca exista doi loci polimorfici, 1 si 2, pe doi cromozomi diferiti,
cu alelele A si a pe locusul 1 si alelele B si b pe locusul 2. Sa presupumen ca
genotipul unui individ pentru acesti loci este Aa si Bb; adica este un individ
heterozigot pentru ambii loci, alelele A si B fiind mostenite de la tata si alelele
a si b de la mama. Cei doi cromozomi diferiti se vor alinia cu probabilitate egala
intr-una dintre cele doua combinatii pe placa metafazica a meiozei I. Practic,
dupa ce recombinarea cromozomiala si segregarea s-au incheiat, exista patru
combinatii alelice posibile pentru fiecare gamet, AB, ab, Ab si aB, fiecare
combinatie fiind la fel de probabila, fenomen cunoscut sub numele de asortare
independenta. Deoarece gametii AB contin doar alele derivate pe linie
paterna, iar gametii ab doar alele derivate pe linie materna, acesti gameti sunt
denumiti parentali. Spre deosebire de acestia, gametii Ab si aB fiecare
continand o alela derivate patern si una matern, sunt denumiti gameti non-
parentali. In medie, jumatate (50%) dintre gameti sunt parentali (AB sau ab)si
50% non-parentali(Ab sau aB).

Fig 2: Asortarea independenta a alelelor a doi loci


Alelele locilor de pe acelasi cromozom se asorteaza independent daca intre
acesti loci are loc cel putin un fenomen de crossing-over
Sa presupunem in continuare ca un individ este heterozigot pentru 2 loci 1 si 2
situati pe acelasi cromozom, cu alelele A, B derivate patern si a, b derivate
matren(fig. 10-3). Genele localizate pe acelasi cromozom sunt denumite
sintenice(literal ‘ pe acelasi fir’) indiferent de cat de apropiati se afla pe acelasi
cromozom.

Frecventa recombinarii si distanta genomica


Frecventa recombinarii ca masura a distantei dintre loci
Sa presupunem ca doi loci de pe acelasi cromozom sunt fie foarte indepartati,
fie foarte apropiati, fie sunt la o distanta medie unul fata de celalat(Fig 4).
Fig 4: Asortarea alelelor a doi loci, atunci cand acestia sunt situati pe acelasi
cromozom.
Atunci cand cei doi loci sunt indepartati(Fig. 4A), se va produce cel putin un
proces de recombinare in segmentul cromozomial dintre pozitiile 1 si 2 si vor
exista gameti non-recombinati AB si Ab, precum si gameti recombinati Ab si
aB, in proportii egale.
Daca cei doi loci sunt foarte apropiati, nici o recombinare nu poate aparea in
segmental dintre acestia; in consecinta genotipurile
nerecombinate(cromozomii parentali AB si ab in Fig.4B) sunt transmise
impreuna, iar frecventa genotipurilor recombinate Ab si aB este 0. Intre aceste
doua extreme regasim situatia in care cei doi loci sunt destul de departe
pentru ca un fenomen de recombinare sa apara in unele meioze, dar nu in
toate(Fig. 4C). In aceasta situatie, vom observa genotipuri nerecombinate ale
alelelor la descendenti atunci cand nu s-a produs nici o recombinare si
genotipuri recombinate(cu o frecventa intre 0 si 50%), atunci cand s-a produs o
recombinare. Important de retinut, cu cat doi loci sunt mai apropiati, cu atat
frecventa recombinarii precum si cea a genotipurilor recombinate este mai
redusa.
Detectarea evenimentelor de recombinare necesita heterozigotie si
cunoasterea fazei
Detectarea evenimentelor de recombinare intre loci necesita ca(1) un parinte
sa fie heterozigot(informativ)pentru ambii loci si (2) sa stim care dintre alelele
din locii 1 si 2 sunt situate pe acelasi cromozom 2. In cazul a doi loci sintenici
heterozigotii pentru alelele A si a, respectiv B si b, oricare dintre alelele din
locusul 1 aflata pe acelasi cromozom cu oricare dintre alelele din locusul 2
definesc ceea ce se numeste faza(Fig. 5).

Fig. 5: Fazele posibile ale alelelor A si a si ale alelelor B si b


Un set de alele (A si B sau a si b) de pe acelasi cromozom este in cis (sau
alelele sunt cuplate) si formeaza ceea ce numim haplotip. In contrast, alelele
de pe cromozomi diferiti(A si b sau a si B) sunt in trans(sau decuplate).
Fig. 6: Cotransmiterea genei pentru RP AD cu locusul 2 si nu cu locusul 1: Doi
dintre cei trei descendenti afectati au mostenit alela B la locusul 2 de la mama
lor, in timp ce descendentul II-3 a mostenit alela b. Cei cinci descendenti
neafectati au mostenit de asemenea alela b. Astfel, sapte din opt descendenti
sunt nerecombinanti intre locusul RP9 si locusul 2. Totusi, indivizii II-2, II-4, II-6
si II-8 sunt recombinanti pentru RP9 si locusul 1, indicand faptul ca a avut loc o
recombinare meiotica intre acesti doi loci

Fig. 6 prezinta arborele genealogic al unei familii cu mai multi indivizi afectati
de retinita pigmentara(RP), o boala degenerativa autozomal dominanta a
retinei, ce detremina orbirea progresiva asociata cu pigmentare retiniana
anormala.
Asa cum se poate observa, individul I-1 este hetrozigot pentru ambii loci
marker, 1(cu alelele A si a) si 2(cu alelele B si b), precum si heterozigot pentru
afectiunea in sine(D este alela dominanta implicata in producerea bolii, iar d
este alela normala, recesiva). Alelele A-D-B formeaza un haplotip si a-d-b
celalat haplotip. Pentru ca stim ca sotul este homozigot pentru toti cei trei loci
si poate sa transmita doar A, b si d, putem determina cu usurinta ce alele au
primit copiii de la mama lor si astfel sa urmarim transmiterea alelei care
provoaca RP. Analiza figurii permite stabilirea tipului de haplotip(recombinant
sau non-recombinat) mostenit de la mama de catre fiecare copil.
Cu toate acestea, daca mama I-1 este homozigota bb pentru locusul 2, atunci
toti copiii vor mosteni o alela b maternal, indiferent daca au primit o alela D
mutanta sau o alela normala normala de la locusul RP9. Deoarece in acest
scenariu locusul 2 nu este informativ, este imposibil sa se determine daca
recombinarea a avut loc. In mod similar, daca informatia furnizata pentru
familie in figura 10 a fost pur si simplu aceea ca individul I-1 este heterozigot,
Bb pentru locusul 2 si heterozigot pentru o forma autosomal dominanta de RP,
dar faza nu este cunoscuta, nu se poate determina care dintre copii sunt
nerecombinati si care sunt recombinati intre locusul RP9 si locusul 2. Astfel,
determinarea statusului recombinant sau nerecombinat necesita cunoasterea
localizarii pe acelasi cromozom a alelei B sau b din locusul 2 si a alelei D
mutante pentru RP la individul I-1.
Linkage-ul si frecventa de recombinare
Linkage este termenul folosit pentru a descrie o deviere de la asortarea
independenta a doi loci sau, cu alte cuvinte, tendinta alelelor de pe doi loci
situati foarte aproape pe acelasi cromozom de a fi transmise meiotic impreuna
in bloc, ca o unitate intacta. Analiza de linkage depinde de determinarea
frecventei de recombinare ca masura a apropierii a doi loci pe un cromozom.
Gradul de apropiere(distanta) intre doua gene(loci) de pe acelasi cromozom se
exprima prin procentul recombinarii: loci care sunt separati prin CO la 1% din
gameti se afla la distanta de 1 centiMorgan (cM). Notatia comuna pentru
frecventa de recombinare(in proportie, nu in procent)este litera greaca theta,
θ, unde θ poate varia de la 0(fara recombinare), pana la 0,5(asortare
independenta). Daca doi loci sunt atat de apropiati incat θ = 0(ca in Fig. 4B), se
spune ca se afla in linkage complet; daca sunt atat de indepartati incat θ =
0,5(ca in Fig.4A), ei se asorteaza independent si linkage-ul nu este prezent.
Intre aceste doua extreme exista diferite grade de linkage.
Harti genetice si harti fizice
Distanta dintre doi loci este un concept teoretic care se bazeaza pe date reale –
frecventa recombinarii, θ, intre cei doi loci. Distanta pe harta este masurata in
unitati numite centimorgani(cM), definite ca fiind lungimea genetica pe care se
produce, in medie, o singura recombinare in 1% din meioze(termenul de
‘morgan’ vine de la Thomas Hunt Morgan, cercetatorul care a observant si
descris pentru prima data recombinarea genetica la Drosophila). Prin urmare, o
fractie de recombinare de 1%(adica θ = 0,01) se traduce printr-o distanta de
aproximativ 1 cM. Frecventa de recombinare dintre doi loci creste proportional
cu distanta dintre ei, dar doar pana la un punct, deoarece, odata ce cei doi loci
sunt destul de indepartati astfel incat cel putin o recombinare sa se poata
produce, frecventa de recombinare observata va fi de 50%( θ = 0,5), indiferent
de distanta fizica dintre loci.
Pentru a masura cu exactitate distanta genetica reala dintre doi loci situati la
distante mari trebuie folositi markeri situati la distante genetice mici(de 1 cM
sau mai putin) pe segmentul dintre cei doi loci; suma valorilor θ dintre fiecare
din acesti marker aproximeaza satisfacator distanta genetica dintre cei doi loci.
Folosind aceasta abordare, a fost masurata lungimea genetica a intregului
genom uman si, interesant, s-a constatat ca exista diferente semnificative intre
sexe. Astfel, in cursul meiozei, lungimea estimata a intregului genom uman la
femei este cu aproximativ 60% mai mare(≈ 4596 cM) decat cea a genomului
uman la barbati(2868 cM); aceasta diferenta dependenta de sex este
consistenta si uniforma pentru fiecare autozom. Lungimea medie a genomului
uman haploid, estimata la aproximativ 3,3 miliarde de perechi de baze de ADN
sau ≈3300 Mb(cap 2) este de 3790 cM, o medie de aproximativ1,15cM/Mb.
Motivul pentru care se observa cresterea recombinariipe unitatea de lungime a
AND-ului la femei comparative cu barbatii nu este cunoscut, desi s-ar putea
specula ca are legatura cu probabilitatea crescuta de recombinare oferita de
blocarea gametilor feminini in meioza I(cap 2).
Cu toate acestea, atunci cand recombinarea este masurata la o rezolutie mult
mai mare, folosind markeri distantati la mai putin de 100 kb, recombinarea
raportata la unitatea de lungime devine neuniforma si poate varia de la 4 pana
la 100 cM/Mb. Privita la aceasta scara, relatia aparent liniara dintre distanta
fizica in perechi de baze si recombinarea dintre markeri polimorfici localizati la
milioane de perechi de baze de ADN distanta, este, de fapt, rezultatul unei
medii a asa-numitelor puncte fierbinti(hot spots) de recombinare intercalate
cu regiuni de recombinare redusa sau absenta. Desi reprezinta doar
aproximativ 6% din genomul uman, punctele fierbinti de recombinare sunt
raspunzatoare pentru aproximativ 60% din ansamblul proceselor de
recombinaremeiotica a genomului uman.
Dezechilibru de linkage
In general, alelele de pe doi loci linkati situati la o distanta de 0,1 = 1 cM sau
mai mult nu prezinta nici o faza preferata in populatie. De exemplu, sa
presupunem ca locii 1 si 2 sunt la 1 cM distanta. Sa presupunem, de asemenea,
ca alela A este prezenta la 50%din cromozomii dintr-o populatie si alela a pe
restul de 50%din cromozomi, in timp ce pe locusul 2, o alela de sensibilitate la
boalaS este prezenta la 10% din cromozomi si alela protectoare s pe 90%(fig.
10-7). Deoarece frecventa haplotipului A-S, freq(AS) este pur si simplu produsul
frecventelor celor doua alele-freq(A) x freq(S) = 0,5 x 0,1 = 0,05, alelele se
spune ca sunt in echilibru de linkage. Practic, frecventele celor patru
haplotipuri posibile, A-S, A-s, a-S, si a-s se calculeaza direct din frecventele
alelelor A, a, S, si s.
Cu toate acestea, pe masura ce analizam haplotipurile care implica loci foarte
apropiati, observam ca cunoasterea frecventelor alelelor ce compun acesti loci
nu ne permit sa prezicem frecventele celor patru haplotipuri. Frecventa unui
haplotip, freq(A-S), de exemplu, poate sa nu fie egala cu produsul frecventelor
alelelor individuale care alcatuiesc acel haplotip. In aceasta situatie, freq(A-S) ≠
freq(A) x freq(S), iar alelele sunt declarate a fi in dezechilibru de linkage(DL).
Abaterea(‘delta’)intre frecventele asteptate si cele observate ale haplotipului
se noteaza D si este descrisa de ecuatia:
D = freq(A-S) x freq(a-s) – freq(A-s) x freq(a-S)
D ≠ 0 este echivalent cu a spune ca alelele sunt in DL, in timp ce D = 0 inseamna
ca alelele sunt in echilibru de linkage.
A Frecventele alelice la locusul 2

Frec(S) = 0.1 Frec(s) = 0.9

Frecventele Frec(A) = 0.5 Haplotip A-S Haplotip A-s


alelice la
Frec(A-S) = Frec(A-s) = 0.45
locusul 1
0.05

Frec(a) = 0.5 Haplotip a-S Haplotip a-s

Frec(a-S) = Frec(a-s) = 0.45


0.05

Echilibru de linkage: Frecventele haplotipurilor corespund frecventelor alelice.


B Frecventele alelice la locusul 2
Frec(S) = 0.1 Frec(s) = 0.9
Frecventele Frec(A) = 0.5 Haplotip A-S Haplotip A-s
alelice la Frec(A-S) = 0 Frec(A-s) = 0.5
locusul 1 Frec(a) = 0.5 Haplotip a-S Haplotip a-s
Frec(a-S) = Frec(a-s) = 0.4
0.1

Dezechilibru de linkage: Frecventele haplotipurilor nu corespund frecventelor alelice.

C Frecventele alelice la locusul 2


Frec(S) = 0.1 Frec(s) = 0.9
Frecventele Frec(A) = 0.5 Haplotip A-S Haplotip A-s
alelice la Frec(A-S) = Frec(A-s) = 0.49
locusul 1 0.01
Frec(a) = 0.5 Haplotip a-S Haplotip a-s
Frec(a-S) = Frec(a-s) = 0.41
0.09
Dezechilibru partial de linkage: Frecventele haplotipurilor sunt mai rare decat cele
corespunzatoare frecventelor alelice.

Fig. 7: Tabele care demonstreaza modul in care aceleasi frecvente alelice pot
avea ca rezultat frecvente ale haplotipurilor diferite, suggestive pentru
echilibru de linkage, dezechilibru puternic de linkage sau dezechilibru partial
de linkage. A, in conditii de echilibru de linkage, frecventele haplotipurilor
sunt cele asteptate de la produsul frecventelor alelelor relevante. B, locii 1 si 2
sunt localizati foarte aproape unul de celalat, iar alelele acestor loci prezinta un
dezechilibru puternic de linkage. Haplotipul A-S este absent si a-s este mai
putin frecvent (0,4 in loc de 0,45) in comparatie cu ceea ce se astepta din
frecventele alelelor. C, Alelele locilor 1 si 2 prezinta un dezechilibru partial de
linkage. Haplotipurile A-S si a-s sunt subreprezentate in comparatie cu ceea ce
se asteapta de la frecventele alelelor. De retinut ca frecventele alelelor A si a
pentru locusul 1 si S si s pentru locusul 2 sunt aceleasi in toate cele 3 tabele;
difera doar modul in care alelele sunt distribuite in haplotipuri, prezentate in
cele patru celule centrale ale tabelului.
Fig. 7B si 7C ilustreaza cateva exemple de DL. Sa presupunem ca toti
cromozomii care poarta alela S au de asemenea alela a, dar nu si alela A.
Putem spune despre alelele S si a ca sunt in DL complet. Pentru un al doilea
exemplu, sa presupunem ca haplotipul A-S este prezent la doar 1% din
cromozomii din populatie. Haplotipul A-S are o frecventa mult sub ceea ce s-ar
astepta pe baza frecventelor alelelor A si S in intreaga populatie si D < 0, in
timp ce haplotipul a-S are o frecventa mult mai mare decat cea asteptata si D >
0. Cu alte cuvinte, cromozomii care poarta alela sensibilitatii S sunt imbogatiti
pentru alela a in detrimentul alelei A, comparativ cu cromozomii care poarta
alele de protectie. De retinut ca frecventele alelelor individuale sunt
neschimbate si doar modul in care acestea sunt distribuite in diferitele
haplotipuri difera, iar aceasta determina daca exista DL.
Ce determina DL?
Cand o alela a unei afectiuni apare pentru prima data in populatie la un
fondator, ansamblul de alele de pe loci polimorfici linkati de locusul afectiunii
formeaza un haplotip in care este localizata alela afectiunii. Se face analiza
polimorfismelor mono-nucleotidice(SNPs), care formeaza o arhitectura
complexa a DL. Seturile de SNPs invecinate pot fi asociate in grupuri de
dimensiuni variabile . SNPs-urile dintr-un cluster prezinta niveluri ridicate de DL
intra-cluster, dar nu si cu SNPs-uri din afara acelui cluster.
Viteza cu care recombinarea va muta alela bolii intr-un nou haplotip depinde
de m.m factori:
1) numarul generatiilor de la aparitia mutatiei in populatie (numarul
oportunitatilor de recombinare);
2) Frecventa generationala a recombinarii intre loci. Cu cat valoarea THETA
MAI MICA, cu atat este mai mare sansa ca haplotipul care contine boala sa
persiste intact;
3) Procesele de selectie naturala. Daca o combinatie haplotipica sufera o
selectie pozitiva si se transmite preferential sau o selectie negativa, si prin
urmare este mai putin transmisa, aceste vor fi supra respectiv subreprezentate
in acea populatie.
Clusterele de alele formeaza blocuri definite prin DL
Cei 9 loci polimorfi din clusterul 1, fiecare cu cate doua alele pot genera 2⁹ =
512 haplotipuri diferite
Doar 5 reprezinta 98% din ansamblul tuturor haplotipurilor observate
Clusterele de loci intinse pe segmente de la numai cateva kilobaze la cateva
zeci de kb si care contin alele in DL puternic sunt denumite blocuri DL.
In grupa 2, numai trei din cele 2⁴ = 16 haplotipuri posibile teoretic, care implica
SNP 11 pana la 14 reprezinta 99% din toate haplotipurile gasite.
SNP 10 este in echilibru de linkage cu SNPs din grupa 1 si 2.

Reprezentarea grafica a gradului de DL intre 2 SNPs (gradul de culoare este


proportional cu valoarea DL)

Blocuri de DL: Populatiile africane au blocuri de DL de dimensiuni mai mici =


7,3 kb/bloc
Europeni = 16,3 kb/bloc
Chinezi, japonezi = 13,2 kb/bloc
Explicatie: numar mai mic de generatii de la fondarea populatiilor non-
africane(timp mai scurt pentru recombinare)
Cuantificarea dezechilibrului de linkage
Desi este valoroasa din punct de vedere conceptual, diferenta D dintre
frecventele asteptate si cele observate ale haplotipurilor nu este o modalitate
buna de a cuantifica DL deoarece variaza nu numai cu gradul de DL, ci si cu
frecventele alelelor. Pentru a cuantifica grade diferite de DL geneticienii
folosesc o masura derivata din D, denumita D’.

D’ este proiectat sa varieze de la 0, indicand echilibru de linkage, pana la un


maxim de 1, indicand DL foarte puternic.Deoarece DL este un rezultat nu
numai al distantei genetice, dar si al timpului in care recombinarea a avut o
sansa sa se produca precum si al efectelor posibile ale selectiei pozitive sau
negative ale haplotipurilor, diferitele populatii care traiesc in medii diferite si
cu istorii diferite pot avea valori D’ diferite intre aceleasi doua alele de pe un
acelasi locus din genom.
Cartografierea genelor asociate patologiilor umane
In clinica, o stare patologica este definite ca o colectie de fenotipuri observate
la un pacient sau un grup de pacienti. Desemnarea unei astfel de boli ca fiind
‘genetica’, implicand practic existenta unei gene responsabile de sau care
contribuie la boala – se face in urma unei analize genetice detaliate.
Cartografierea genei asociate unei afectiuni este adesea un prim pas critic in
identificarea variantelor genice care sunt responsabile de producerea sau
cresterea susceptibilitatii la boala. Cartografierea orienteaza atentia catre o
regiune a genomului care va fi supusa unei analize sistematice a tuturor
genelor din acea regiune, in vederea identificarii unor mutatii sau variante care
contribuie la boala.
I. Cartografierea genelor asociate patologiei umane prin analiza de
linkage
Determinarea statusului de linkage a doi loci
Analiza de linkage este o metoda de cartografiere a genelor care utilizeaza
studii familiale de recombinare pentru a determina daca doua sunt transmise
in bloc de la o generatie la alta.Folosind informatii din modelul cunsocut sau
presupus de transmitere(dominanta, recesiva, legata de X)putem determina
care dintre indivizii unei familii au mostenit un cromozom recombinant sau
non-recombinat.
Pentru a decide daca doi loci sunt in linkage si cat de aproape sau de departe
sunt situati unul fata de celalat, se iau in considerare doua seturi de informatii.
Mai intai, folosind datele familiale aflate la indemana, estimam frecventa de
recombinare θ dintre cei doi loci, ceea ce ne va spune cat de aproape sau de
departe sunt situati unul fata de celalalt. Ulterior vom calcula daca θ este
statistic semnificativ fata de 0,5(determinarea linkage-ului a doi loci este
echivalenta cu a stabili daca frecventa lor de recombinare θ difera semnificativ
de valoarea 0,5 asteptata pentru loci fara linkage). Estimarea lui θ si, in acelasi
timp, determinarea semnificatiei statistice a oricareii deviatii a lui θ de la 0,5,
se bazeaza pe un instrument statistici denumit likelihood ratio(raportul
probabilitatii).
Analiza de linkage incepe cu cea a setului de date ale unei familii reale cu N
indivizi. Luand in considerare un model mendelian de transmitere, numaram
cromozomii r care prezinta recombinare intre alela care cauzeaza boala si alele
de pe diferiti loci polimorfici(asa-numiti ‘markeri’). Prin urmare, numarul de
cromozomi care nu prezinta o recombinare este N – r. Fractia de recombinare
θ poate fi considerata a fi probabilitatea, necunoscuta, de aparitie a unei
recombinari intre cei doi loci in cursul fiecarei meioze; probabilitatea ca nici o
recombinare sa nu aiba loc este 1 – θ. Deorece fiecare meioza este un
eveniment independent, se multiplica probabilitatea unei recombinari(θ) sau a
absentei unei recombinari( 1- θ) pentru fiecare cromozom.
Se calculeaza apoi o a doua probabilitate bazata pe ipoteza nula ca cei doi loci
nu sunt in linkage, adica θ = 0,5.
Cea mai buna estimare a fractiei de recombinare este valoarea maxima a
raportului de probabilitate θmax, obtinut cand se calculeaza valoarea
raportului probabilitatii pentru toate valorile lui θ intre 0 si 0,5. Prin conventie,
raportul de probabilitati calculate pentru diferite valori ale lui θ este exprimat
ca log10 si se numeste scorul LOD(Z) in care LOD reprezinta ‘Logaritm of Odds’.
Utilizarea logaritmilor permite ca raporturile de probabilitate calculate de la
diferite familii sa fie combinate prin simpla adunare.
Cum este efectuata propriu-zis analiza de scor LOD in familii cu afectiuni cu
transmitere mendeliana?

Revenind la familia din Fig. 6, in care mama are o forma AD de retinita


pigmentara. Exista zeci de forme diferite ale acestei boli, multe dintre acestea
fiind cartografiate pe loci genomici specifici pentru care au fost identificate
genele asociate. De obicei, atunci cand o noua familie ajunge in atentia
clinicienilor, nu este cunoscuta forma de RP a pacientului. In aceasta familie,
mama este heterozigota pentru doi loci marker pe cromozomul 7, locusul 1
distal de 7q si locusul 2 pe 7p14. Sa presupunem(din alte date de familie), ca
alela D a bolii este in cis cu alela A la locusul 1 si alela B in locusul 2. Avand in
vedere aceasta faza, se poate observa ca a existat o recombinare intre RP si
locusul 2 doar la un singur descendent din cei opt ai sai, fiica II-3. Alelele de pe
locusul de boala nu prezinta totusi tendinta de a urmari alelele din locusul 1
sau alelele din oricare din celelalte sute de loci marker testate de pe ceilalti
autozomi. Astfel, desi locusul RP implicat in aceasta familie ar putea in
principiu sa fie cartografiat oriunde in genomul uman, incepem sa suspectam
pe baza datelor de linkage ca locusul RP se afla in regiunea cromozomului 7
langa locusul markerului 2.
II. Cartografierea genelor implicate in afectiunile umane prin studii de
asociere
A. Designul unui studiu de asociere
O abordare complet diferita a identificarii contributiei genetice la o anumita
patologie consta in identificarea alelelor specificie dintr-o populatie, care sunt
asociate cu boala. Spre deosebire de linkage, aceasta abordare nu depinde de
existenta unui model mendelian de transmitere si, prin urmare, este mai
potrivita pentru descoperirea contributiilor genetice la afectiunile cu
transmitere complexa. Prezenta cu o frecventa crescuta sau scazuta la
persoanele afectate comparativ cu martorii a unei anumite alele de pe un locus
este cunoscuta ca o asociere a bolii. Exista doua metode de studii utilizate in
mod obisnuit pentru studiile de asociere:
a. Studii caz-control. Persoanele afectate sunt selectate dintr-o populatie,
se alege un grup control corespunzator, fara boala, iar genotipurile
indivizilor din cele doua grupuri sunt determinate si utilizate pentru a
popula un tabel doi pe doi(cu doua randuri si doua coloane).
b. Studii transversale sau cohorte. Se alege o mostra aleatorie
reprezentativa pentru intreaga populatie, apoi se analizeaza daca
prezinta(studiu transversal) sau dezvolta dupa o perioada de timp(studiu
cohorta)o anumita patologie si se determina genotipurile tuturor
indivizilor din populatia studiata. Numarul de indivizi cu si fara boala si
cu si fara o alela specifica(sau genotip, sau haplotip specific) sunt
utilizate pentru a completa celulele unui tabel doi pe doi.
B. Raportul de probabilitati si riscul relativ
Aceste doua tipuri diferite de studii de asociere evalueaza puterea asocierii,
utilizand fie rata probabilitatii, fie riscul relativ.
Intr-un studiu caz-control, frecventa unei alele sau a unui haplotip
particular(ex. Un haplotip HLA sau SNP) la indivizii afectati este comparata cu
frecventa la cei neafectati iar asocierea intre boala si genotip este calculata
prin rata probabilitatii(odds ratio, OR).

Folosind un tabel doi pe doi, probabilitatea unui purtator de alela patogena sa


dezvolte boala este data de raportul (a/b), unde (a) este numarul de purtatori
de alela care dezvolta boala si (b) este numarul de purtatori de alela care nu
dezvolta boala. In mod similar, probabilitatea unui nepurtator de alela sa
dezvolte afectiunea este raportul (c/d), unde (c) este numarul de nepurtatori
care dezvolta boala, iar (d) este numarul persoanelor nepurtatoare care nu
dezvolta boala. Rata probabilitatii de boala(odds ratio) este apoi raportul
dintre aceste raporturi.
a
ad
OR = bc =
bc
d
Un OR care difera de 1 semnifica existenta unei asocieri a riscului de boala cu
markerul genetic, in timp ce OR = 1 inseamna ca nu exista nici o asociere.
Daca studiul de asociere a fost conceput ca un studiu cross-sectional sau de tip
cohorta, puterea unei asociatii poate fi masurata prin riscul relativ (RR). RR
este raportul dintre proportia bolnavilor purtatori ai unei alele specifice
([a/(a+b)]) si proportia indivizilor sanatosi purtatori ai acelei alele ([c/(c=d)]).
a
RR = a +
c
b
c+d
Similar OR, un RR care difera de 1 inseamna ca exista o asociere a riscului de
imbolnavire cu markerul genetic, in timp ce RR = 1 inseamna ca nu exista nici o
asociere.
Pentru bolile rare (a < b si c < d), este de preferat un design de tip caz control
cu calculul OR, deoarece este putin probabil ca orice esantion aleatoriu dintr-o
populatie sa contina un numar suficient de indivizi afectati care sa permita un
studiu transversal sau de cohorta.Trebuie retinut ca atunci cad o boala este
rara si calculul unui OR intr-un studiu de caz-control este singura abordare
practica, OR este o aproximare buna pentru un RR (in formula pentru RR atunci
cand a < b si c < d, (a + b) ≈ b si (c + d) ≈ d si astfel RR ≈ OR).
C. Studii de asociere la nivel genomic
1. Harta haplotipurilor HapMap
Timp de multi ani, studiile de asociere pentru genele patologiei umane au fost
limitate la variante ale unor seturi restranse de gene candidate, convenabil
alese pentru posibila lor implicare in procese fiziopatologice relevante pentru
patologia studiata. Multe astfel de studii au fost intreprinse inaintea erei PGU
folosind loci HLA sau loci de grup sangvin, pentru ca acestia sunt foarte
polimorfi si usor de genotipat in studii caz-control. In mod ideal totusi, ar fi de
dorit sa putem testa sistematic o asociere intre orice boala de intere si fiecare
din zecile de milioane de alele rare si/sau comune din genom intr-o maniera
impartiala, fara preselectia genelor si a variantelor genetice in functie de
posibila contributie la boala.
Analizele de asociere efectuate la nivelul intregului genom sunt denumite
studii de asociere genomica, cunoscute sub acronimul de GWAS (Genome
Wide Association Studies). Un studiu orientat pe toate variantele alelice
cunoscute este imposibil de realizat, dar poate fi aproximat. Aceasta abordare
are la baza studiul alelelor aflate in DL.
Dezvoltarea unui astfel de set de markeri a condus la lansarea proiectului
Haplotip Mapping(HapMap), unul dintre cele mai mari eforturi de genomica
umana desfasurat dupa finalizarea PGU. Proiectul HapMap a inclus patru
grupuri populationale distincte dpdv geografic – o populatie europeana, o
populatie din Africa de Vest, o populatie chineza Han si o populatie din Japonia
– si a presupus colectarea si caracterizarea a milioane de loci SNP si
dezvoltarea unei metode de genotipare rapida si ieftina. Ulterior, secventierea
a fost folosita pentru analiza a numeroase populatii in cadrul proiectului 1000
Genomuri, rezultand o extindere masiva a bazei de date a variantelor de ADN
disponibile pentru GWAS in diferite populatii din intreaga lume.
2. Cartografierea genica prin GWAS a trasaturilor complexe
Scopul HapMap nu este doar de a stabili distributia DL in genomul uman ci mai
ales de a identifica variantelor genetice care contribuie la patologia umana.
Detectarea unei asocieri cu allele intr-un bloc DL identifica regiunea genomica
din bloc ca fiind susceptibila sa contina alela asociata bolii. Desi nu este
identificata in mod direct si specific varianta alelica responsabila functional
pentru asocierea cu boala, aceasta regiune va fi locul de focalizare a studiilor
suplimentare ulterioare in vederea identificarii acestei variante alelice.
Istoric, o analiza detaliata a patologiilor asociate cu variante de densitate
ridicata in regiunile HLA din clasa I si clasa II exemplifica abordarea.
Diferite polimorfisme HLA sunt asociate cu DZ tip I, SA, hemocromatoza. Mai
mult de 95% din bolnavii cu SA sunt HLA-B-27-pozitivi si prezinta un risc de a
dezvolta SA de cel putin 150 de ori mai mare decat indivizii HLA-B-27-negativi.
In hemocromatoza peste 80% din pacienti sunt homozigoti pentru mutatia
Cys282Tyr din gena hemocromatozei(HFE) si prezinta allele HLA-A*0301 in
locusul HLA-A. Asocierea se datoreaza proximitatii celor doi loci si DL intre cei
doi loci.
Comparatie intre metodele de linkage si cele de asociere
Linkage
1. Urmareste transmiterea unei trasaturi de boala si a regiunilor genomului
de la individ la individ in genealogia familiei
2. Cauta regiuni ale genomului care contin alele de boala; utilizeaza
variantele polimorfice ca o modalitate de a marca regiunea genomica
mostenita de catre o persoana si de la care parinte
3. Utilizeaza sute de mii de marker polimorfici genomici
4. Nu este conceput pentru a gasi varianta specifica responsabila pentru
sau care predispune la boala; poate doar indica unde poate fi gasita
varianta alelica intr-o regiune(de obicei) de una sau cateva megabaze.
5. Se bazeaza pe evenimentele de recombinare care apar in familii in
numai cateva generatii pentru a permite masurarea distantei
geneticeintre o gena a bolii si markerii polimorfici cromozomiali.
6. Necesita prelevarea de probe din familii, nu doar de la persoanele
afectate de boala.
7. Pierde puterea atunci cand boala are mostenire complexa, cu o lipsa
substantiala de penetrare
8. Cel mai adesea folosit pentru a carta bolile cauzatoare de mutatii cu
efecte suficient de puternice pentru a determina un model de
transmitere mendelian.
Asociere
1. Testeaza modificarea frecventei alelelor sau haplotipurilor particulare la
persoanele afectate in comparatie cu lotul control asimptomatic dintr-o
populatie
2. Examineaza anumite alele sau haplotipuri pentru contributia lor la boala
3. Utilizeaza de la cativa marker(in genele vizate) la sute de mii de
markeripentru analize la nivel genomic
4. Ocazional poate identifica varianta care este de fapt responsabila pentru
boala; cel mai adesea insa, defineste un haplotip care contine gena
asociata bolii pe un interval de la 1 la 10kb
5. Se bazeaza pe gasirea unui set de alele, inclusiv a genei bolii, care au
ramas impreuna pentru mai multe generatii din cauza lipsei
evenimentelor de recombinare
6. Se poate efectua pe studii caz-control sau cohort populationale
7. Este sensibila la stratificarea populatiei, desi acest lucru poate fi
controlat prin selectarea adecvata a lotului de control sau prin folosirea
unor abordari bazate pe analiza familiala
8. Este cea mai buna abordare pentru gasirea de variante cu efect mic, dar
care contribuie la trasaturi complexe.
Proiectul Genom Uman
Lansat in 1990, pentru o durata de 15 ani, PGUa avut ca obiective principale
secventierea genomului uman haploid(22A + X + Y ≈ 3,2GB), constand in
identificarea si localizareaa genelor care alcatuiesc genomul uman.
Determinarea secventei genomului uman sau stabilirea ordinii ‘liniare’ a
nucleotidelor in ADN a implicat trei etape majore:
I. Secventierea unor fragmente mici(circa 800nt)de ADN folosind doua
strategii: secventierea ‘clona cu clona’, in mod ierarhizat, metoda mai
precisa dar mai laborioasa si deci costisitoare; ‘secventierea globala
aleatorie’ – ‘shotgun integral’ – mai putin precisa, dar mai rapida si
mai ieftina; secventierea este comparabila cu ‘fabricarea elementelor
unui puzzle’;
II. Asamblarea genomului – cu ajutorul unor programe computerizate
care ordoneaza, orienteaza si asambleaza secventele segmentelor
mici in secvente continue din ce in ce mai mari, pentru a crea
reprezentarea originala a cromozomului din care deriva; asamblarea
genomului este comparabila cu ‘reconstituirea unui puzzle’;
III. Adnotarea genomului – efectuata in doi timpi:
1. Identificarea si localizarea elementelor structurale ale genomului (gene
cu regiuni codante, reglatoare si necodante; regiuni intergenice)sau
adnotarea structurala(‘gene finding’)
2. Atasarea informatiei biologice (functie si expresie) la aceste elemente
sau adnotarea functionala; adnotarea genomului este comparabila cu
‘descifrarea unui text neinteligibil’.
Schita genomului uman(2001)
O prima schita de lucru a genomului uman a fost gata in iunie 2000 si publicata
la 15 februarie 2001 in doua versiuni in revista Nature de catre IHGSC si in
revista Science de catre compania privata Celera Genomics. Ambele versiuni
raportau secventierea a 96% din eucromatina (2,69Gb) si erau incomplete si
imperfecte: o parte importanta din genom ramanea nesecventiat ( 4% din
eucromatina si toata heterocromatina, circa 8% din genom), iar partea
secventiata avea 150.000de lacune’ (segmente nesecventiate).
Date obtinute din secventierea si analiza initiala a genomului uman(IHGSC):
1. Secventele codante reprezinta mai putin de 5% din genom, iar numarul
prognozat de gene era cuprins intre 30.000 si 35.000. Deci genele ce
contin ADN codant sunt niste ‘insule intr-un ocean’ de ADN necodant;
aceasta dispozitie era nu numai surprinzatoare(prin logica economiei sau
rentabilitatii), dar si misterioasa. Cert este ca genomul nu poate fi
considerat o simpla succesiune de gene pe cromozomi, ci o structura cu
arhitectura complexa in care genele sunt dispersate pe cromozomi si
separate prin largi regiuni intergenice, necodante. Acest ADN non-
codant nu este in intregime ‘inutil’.
2. Numarul genelor la om este relativ mic daca il comparam cu
organismele mai inferioare: 6.000 la o celula de drojdie, 13.000 la
drosophila, 18.000 la un vierme C. elegans (care are numai 1000 de
celule) si 26.000 pentru o planta. Se pune intrebarea: ce face diferenta
dintre om si alte specii? Raspunsurile posibile ar fi: pozitia genelor in
genom; structura mai complexa(modulara) a genelor si proteinelor;
modul in care ‘lucreaza ‘ genele (mai intens, mai complex) capabile sa
produca, prin matisare alternativa, mai multe proteine.
3. Genomul a doua persoane neinrudite, din populatii diferite, are in
comun 99,9% din secventele nucleotidice de ADN. Se spulbera definitiv
ideea raselor umane, dar apre o intrebare: ce deosebeste un om de
altul, facandu-ne pe fiecare unic? Raspunsul este diferenta de 0,1%(3
milioane pb), care determina variatii personalizate de secventa. Aceasta
mica parte din genom este alcatuita din secvente de ADN de diferite
marimi, variabile de la o persoana la alta. Numarul, pozitia si structura
acestor secvente polimorfice sunt caracteristice fiecarui individ. Analiza
schitei genomului uman arata ca oamenii difera intre ei prin circa o
pereche de baze la fiecare 1000pb.Acest polimorfism al unui singur
nucleotid(SNPs – single nucleotid polymorphisms) reprezinta markerii
nostril de individualitate cei mai valorosi, care participa la determinarea
raspunsului la agresiuni(boal) si a efectului medicamentelor, abilitatii,
memoriei, coordonarii fizice, creativitatii.
Versiunea finisata a GU(IHGSC, 2004)
Versiunea ‘draft’ a genomului uman, incompleta si imperfecta, trebuia
‘finisata’; numai IHGSC a continuat acest proces si la 14 aprilie 2003
(sarbatorind 50 de ani de la descoperirea structurii ADN), cu doi ani mai
devreme decat era planificat, a fost anuntata prima versiune ‘finisata’(precizie
99,9%), aproape completa a genomului uman, inaugurandu-se oficial ‘era
genomicii’; ea a fost publicata in 2004 si este accesibila gratuit pe internet.
Versiunea finisata(IHGSC, Build 35)cuprindea secventa a circa 93% din genomul
uman(2,85 miliarde nucleotide dintr-un total estimat de 3,1Gb), ce corespunde
la 99% din genomul eucromatinic si era, o imbunatatire majora a ‘schitei
initiale’ (2001)(rata de erori era de circa 1 la 100.000pb, deci de 10 ori mai
mica decat in 2001, iar continuitatea de 500 de ori mai buna). Au ramas
nesecventiate 341 de lacune, ce reprezinta ~7% din genom: ~ 1% din
eucromatina (28Mb) si ~ 6% din regiunile de heterocromatina constitutiva(~
198 Mb care probabil nu contin gene.
Genome browsers (site-uri de navigatie)
www.ensemble.org
www.ncbi.nlm.nih.gov/genome
www.genome.ucsc.edu)
Cele mai relevante si surprinzatoare informatii pe care le aduce aceasta
versiune finisata sunt:
Contine cvasitotalitatea genelor ce codifica proteine, dar numarul lor este mai
mic decat in versiunea initiala fiind estimat la ~22.500(cu variatii intre 20.000
si 25.000, din care ~19.500 sunt gene cunoscute si restul ‘prezise’; genele au in
total 23.1667 exoni (secvente codante) ce ocupa 35 Mb (1,1%) din genomul
eucromatinic; distributia genelor in cromozomi este surprinzator de
neregulata: regiuni ‘urbane’ cu densitate genica mare si regiuni ‘desertice’, fara
gene, numai cu ADN non-codant.
Cresterea numarului de gene ARN ‘clasice’(ARNr, ARNt) si multe altele ‘noi’
(ARNmi, ARNsi) -foarte probabil la fel de numeroase ca genele pentru proteine;
rolul lor biologic si ‘consecintele medicale’ raman a fi elucidate.
O parte majora a ADN necodant, considerat initial inutil pare sa aiba functii
importante, neelucidate complet, numeroase secvente fiind transcrise, iar
unele secvente (5,1%) fiind puternic conservate in evolutie.
Rata mutatiilor la barbati este de doua ori mai mare decat la femei, deoarece
celulele germinale efectueaza la barbat un numar mai mare de replicari si
diviziuni pana la formarea spermatozoizilor
S-a descoperit o remarcabila plasticitate genomica, demonstrandu-se ‘nasterea
si moartea’ genelor umane si evidentiindu-se importanta duplicatiilor
segmentare (5,5% din ADN eucromatinic) drept cauza principala, dar si
consecinta plasticitatii genomului. S-a descoperit un nou tip de polimorfism al
ADN-ului un polimorfism cantitativ, al numarului de copii pentru o secventa
data – denumit CNP (copy number polymorphism) sau CNV (copy number
variations). Duplicatiile segmentare si CNV au avut un rol important in evolutie
si au o contributie semnificativa la patologia umana, producand prin CO inegal
deletii sau duplicatii genice/cromozomiale, care genereaza boli genomice.
Prin proiectul ELSI (componenta a PGU) au fost puse in discutie numeroase
probleme etice (protectia datelor individuale; trecerea de la autonomie – ca
ultim arbitru, la beneficiul comun si consimtamantul deschis), sociale
(inegalitatea de accces la aplicatiile testelor moleculare sau genomice) si legale
(patentarea datelor, metodelor, genelor).
Etape ulterioare in studiul genomului uman
Re-secventierea cu noi tehnici a fiecarui cromozom; in mai 2006 a fost re-
secventiat cromozomul 1 (cel mai mare), iar in 2007 a fost declarata incheiata
secventa intregului genom uman(build 36), cu mai putin de o eroare la 10.000
de nucleotide. In august 2009 Genome Reference Consortium (GRCh) a
publicat versiunea a 37-a a genomului uman; structura sa este aproape in
intregime descifrata, dar intelegerea expresiei, functiei si reglarii genice, rolul
ADN intergenic, diferentele dintre indivizi, sunt departe de a fi complete.
Adnotarea structurala si functionala a genomului uman
A. Structura si functia genelor pentru proteine
Marimea si organizarea genelor pentru proteine prezinta variatii considerabile.
Unele gene sunt foarte mici, sub 10kb(Histona H4, α-interferon, insulina, β-
globina), iar altele foarte mari(imunoglobulinr, distrofina – cea mai mare gena
cunoscuta, 2400 kb). Marimea medie a genelor este 27kb. Marea majoritate a
genelor sunt fragmentate in exoni(secvente codante) separate de
introni(secvente non-codante). Primul si ultimul exon contin segmente
necodante UTR(untranslated region): 5’-UTR in primul exon si 3’-UTR in ultimul
exon. Numarul si marimea exonilor variaza mult de la o gena la alta (in medie 9
exoni/gena si 145 pb/exon; la fel de variabila este marimea intronilor (dela
cateva zeci de kb la 800 kb, in medie 3365 pb/intron). In ansamblul unei gene
marimea totala a intronilor este mult mai mare decat a exonilor. Exista si gene
fara introni pentru histone, interferoni.
Circa 9% din genele pentru proteine sunt gene suprapuse, fiind transcrise de
pe catenele opuse ale ADN. Multe gene ARN sunt suprapuse cu genele pentru
protein. Exista si gene intricate una in alta, fie pe aceeasi catena(exoni in
introni), fie cu orientari opuse pe fiecare catena de ADN (de ex: gena NF1 are
un intronul 27b pe catena antisens incluse 3 gene mici diferite).
Secventele de reglare a expresiei genelor sunt mult mai complexe la om decat
la organismele inferioare. Au fost identificate urmatoarele tipuri de secvente
reglatoare situate in cis fata de unitatea de transcriptie: promotor (fixeaza ARN
polimeraza si declanseaza transcriptia), enhancer (amplificator/stimulator al
functiei), silencer (represor al functiei), locus control region (LCR – comutator al
transcriptiei genelor in functie de contextual molecular), insulators (elemente
de izolare/limitare a genelor vecine).
In regiunile promotor a 60% din gene exista 1% insule CpG nemetilate.
Metilarea acestor insule duce la represia transcriptiei.
Proiectul ENCODE(ENCyclopedia Of DNA Elements) – identificarea si adnotarea
tuturor elementelor functionale ale genomului uman.
Genele pentru proteine pot fi transcrise divergent (in directii opuse), sau co-
transcrise (in aceeasi directie), pornind de la un promotor comun si formand
transcripte multigenice care sunt apoi clivate in transcripte distincte. O gena
produce mai multe transcripte si deci mai multe proteine. Numarul mediu de
transcripte pe gena este de 5,7 transcripte/gena.
B. Nasterea si moartea genelor
Plasticitatea remarcabila a genomului uman a fost demonstrata prin studiul
“nasterii si mortii” genelor umane. Nasterea genelor se face prin duplicatie,
cele mai recente duplicatii intereseaza aprox. 1200 gene, majoritatea fiind
genele receptorilor olfactivi, genele corelate cu imunitatea sau
reproducerea. Moartea genelor se produce prin mutatii care transforma
genele in pseudogene non-procesate, nefunctionale. S-au identificat
37gene care au “murit” recent prin mutatii care le fac gene nefunctionale!
Pseudogenele sunt secvente asemanatoare genelor, dar nefunctionale
datorita unor mutatii inactivatoare. Numarul lor este estimat la
12.600!(Ensembl, 2011). Studii recente in cadrul proiectului ENCODE au
aratat ca unele pseudogene procesate sunt transcrise activ si ar putea fi
“pseudogene reactivate”.
Inca sunt lucruri de facut…
Intelegerea functiei, expresiei, reglarii genelor. Stabilirea rolul ADN-ului
intergenic, variatiile genetice intre indivizi si populatii, sunt date ce
trebuiesc completate.
Informatii despre fiecare gena-portaluri Entrez, Ensembl, Gene Wiki,
 Gene: NF1 ENSG00000196712
 Description
 neurofibromin 1 [Source:HGNC Symbol;Acc:HGNC:7765]
 Synonyms
 VRNF, WSS, NFNS
 Location
 Chromosome 17: 31,094,927-31,382,116 forward strand.
 GRCh38:CM000679.2
 About this gene
 This gene has 23 transcripts (splice variants), 79 orthologues, is a
member of 1 Ensembl protein family and is associated with 88
phenotypes!
 NF1 (HGNC Symbol)
 CCDS
 This gene is a member of the Human CCDS set: CCDS11264.1,
CCDS42292.1, CCDS45645.1
 UniProtKB
 This gene has proteins that correspond to the following UniProtKB
identifiers: P21359
 RefSeq
 Overlapping RefSeq annotation not matched
 Overlapping RefSeq Gene ID 4763 matches and has similar biotype of
protein_coding
 LRG
 LRG_214 provides a stable genomic reference framework for describing
sequence variants for this gene
 Ensembl version
 ENSG00000196712.16
 Other assemblies
 This gene maps to 29,421,945-29,709,134 in GRCh37 coordinates.
 View this locus in the GRCh37 archive: ENSG00000196712
 Gene type
 Known protein coding
OMICA
Studiul structurii, organizarii si functiei genomului uman se numeste genomica.
Proteomul reprezinta ansamblul de proteine sintetizate/exprimate intr-un
organit celular, celula, tesut, organ care asigura functia structurii respective.
Proteomica = studiul functiei unor structuri pe baza expresiei globale a
proteinelor (cu ajutorul electroforezei bidimensionale, cromatografiei,
spectrometriei de masa). Genomul este o structura fixa. Proteomul este
dinamic, variaza temporal si spatial si in anumite conditii de mediu.
Proteomica vs genomica
1) o gena poate codifica mai mult de o proteina!
Ex genomul uman are aprox 21.000 gene care codifica proteine, dar
numarul total de proteine > 250.000-1.000.000.
2) Proteinele sunt dinamice, interactioneaza, sunt sintetizate/degradate.
3) Proteinele sufera modificari posttranslationale = pot varia de la o
persoana la alta, in conditii de mediu diferite, sau la aceeasi persoana in
functie de varsta sau medicamente administrate.
4) concentratiile pot fi extreme de variabile. In cancer de exemplu se crede
ca cele mai importante proteine sunt cele in concentratii foarte mici-dificil
de evaluat!
PROTEOMICA
Cand vorbim de proteom ne putem referi la proteomul unei specii, a unui
organ (ex ficat).
Proteomul nu este constant, difera de la celula la celula si se schimba cu
timpul.
Mai mult, activitatea proteica este modulate si de alti factori aditionali
genelor.
Proteomica investigheaza:
-unde si cand proteinele sunt exprimate,
-rata de producere/degradare a proteinelor,
-cum sunt proteinele modificate,
miscarea proteinelor in compartimentele subcelulare,
-implicarea proteinelor in caile metabolice,
-interactiunea proteinelor.
Nature Reviews Cancer (September 2010) :
Tehnicile bazate pe proteomică permit identificarea biomarkerilor si a
expresiei fenotipice a proteinelor, care ar putea fi utilizate pentru a
previziona răspunsul la medicamente și evoluția clinică a bolii, iar aceste
informații ar putea fi utilizate pentru a individualiza terapia.
În plus, tehnicile proteomice sunt utilizate pentru a înțelege modul în care
căile de semnalizare sunt modificate în celulele tumorale, astfel încât
biologia subiacentă a unei tumori umane să poată fi înțeleasă.
Mai mult, platformele proteomice au fost înrolate în studiile de dezvoltarea
medicamentelor pentru a identifica noi medicamente și pentru a ne
îmbunătăți înțelegerea modului de a viza diferite căi terapeutice.
PROTEOMICA CLINICA
Utilitate generala: intelegerea mai buna a genezei si evolutiei unei boli
Utilitate clinica:
1. Detectarea precoce a cancerelor folosind bio-markeri
2. Identificarea potentialelor tinte terapeutice
3. Monitorizarea eficienta a controlului terapeutic(medicina personalizata)
1. Descoperirea biomarkerilor in:
Cancer
Boala Alzheimer
Nefropatia diabetica
Ex. Studiu 1: Bio-markeri in CRC
(Liu C et al.Int. J Med. Sci. 2011)
Aprox. 940.000 cazuri diagnosticate si 500.000 decese annual
Rata de supravietuire la 5 ani in CRC:
Diagnostic precoce: >90%
Diagnostic in stadiu de metastazare:<10%
CEA ca marker de diagnostic:
Sensibilitatea: 30-40%
Specificitate: redusa
Poate creste si in cancer de san, plaman si alte afectiuni benigne
Examinarea endoscopica este invaziva, neplacuta si implica riscuri
• Noi bio-markeri in diagnosticul precoce al CRC sunt de mare
importanta(cresc sensibilitatea la 93% si specificitatea la 91%).
Ex. Studiu 2: Bio-markeri in cancerul de san(Jinong Li et al, Clinical Chemistry
2002)
200.000 de cazuri noi de cancer de san au fost diagnosticate anual, din care
40.000 vor muri
CA 15.3 este un bio-marker tumoral care se coreleaza cu detectia cancerului de
san, dar are sensibilitate de 23% si specificitate 69%.
• Markerii multipli prin profil SELDI(Studiul bio-markerilor folosind doua
tehnologii: cromatografia si spectrometria de masa (mass
spectrometry))cu specificitate si sensibilitate inalta pot imbunatati
diagnosticul precoce al cancerului mamar(specificitate 91% si
sensibilitate 93%).
Boala Alzheimer
A treia cauza de mortalitate terminala dupa BCV si cancer. Patogenie: amiloid
beta, proteina Tau, cauze genetice(Apo E4) in fluidul cerebro-spinal.
• Panel diagnostic format din 16 proteine descoperite prin studiile de
proteomica.
Nefropatia diabetica
Prezenta unor cantitati anormale de proteine urinare, datorita afectarii
capacitatii de filtrare a nefronului.Apare la 25-40% din pacientii cu DZ tip 1 sau
tip 2. Microalbuminuria este un marker non-specific, mai ales in tipul 2 de DZ.

• Identificarea unor bio-markeri specifici stadiului nefropatiei diabetice.


2. Identificarea tintelor terapeutice
Ex: Her2 (human epidermal growth factor receptor) – este supra-exprimat in
celulele tumorale. Celulele Her-2 + au un potential metastazant mai mare dar
si un raspuns mai bun la Ac monoclonali. Inhibarea prin anticorpi monoclonali
duce la scaderea proliferarii tumorale(Herceptin – anticorp blocant trunchiat).
3. Medicina personalizata
Identificarea markerilor tumorali - diagnostic precoce
Monitorizarea tratamentului – prin evidentierea reducerii nivelului bio-
markerilor
S-a produs o cresterea gradului de incredere in analizele multi-marker
Aplicatiile actuale ale caracteristicilor markerilor unici:
Confirmarea diagnosticului
Monitorizare limitata
Aplicatii potentiale ale fenotipului markerilor multipli:
Detectie precoce
Diagnostic corect
Stadializare in functie de severitate
Tratament tintit
Prognostic
Monitorizare in timp real al raspunsului la tratament
Stratificarea trialurilor clinic pentru aprecierea eficacitatii si a efectelor adverse
Aprecierea sensibilitatii si toxicitatii
NUTRIGENOMICA
Reprezinta aplicarea genomicii, proteomicii, metabolomicii in cercetari
nutritionale, pentru a stabili efectele alimentatiei asupra functiei genomului
precum si actiunile benefice/nocive ale componentelor dietei la nivel individual
sau populational. Substantele nutritive influenteaza raspunsuri fiziologice ce
afecteaza stabilitatea si expresia genomului sau amprentarea (imprinting).
Intelegerea acestor mecanisme va ajuta la evaluarea beneficiilor/riscurilor
diferitelor recomandari dietetice, precum si prevenirea instalarii unor boli,
managemetul bolilor cronice.
Principala provocare a cercetarilor din domeniul nutritiei este complexitatea si
dificultatea integrarii factorilor aditionali (stilul de viata!), care afecteaza
rezultatele si fac dificila interpretarea. Studiile pe termen lung in medicina sunt
“gold standard”. Studiile nutritionale sunt influentate de complianta redusa pe
termen lung, modificari inevitabile ale stilului de viata.Dereglarile metabolice
sunt recunoscute in multe afectiuni. Identificarea proceselor metabolice
caracteristice bolilor si dezvoltarea de strategii care blocheaza/corecteaza
aceste cai pot fi o alternative promitatoare in managementul bolii.
Nutrigenomica in cancer
Mai mult anumiti nutrienti nu servesc numai ca substrat sau produsi ai
reactiilor enzimatice, dar pot actiona ca si “reglatori”ai expresiei genice si pot
juca un rol in modularea cailor metabolice , fie in domeniul preventiei sau al
tratamentului.
In cancer este cunoscuta dereglarea metabolica. Celulele canceroase “prefera”
sa utilizeze anumiti nutrienti, ca glucoza si glutamatul ca sursa de energie. De
asemenea metabolismul lipidic este crescut rezultand mediatori ca
eicosanoizi, ce creeaza un micromediu suportiv celulelor tumorale.
Folosind nutrienti care pot modula aceste cai si sa interfere cu particularitatile
metabolice din cancer, interventiile nutritionale sunt astfel capabile sa inhibe
dezvoltatrea celulelor canceroase.
Mai mult fata de tratamentele conventionale, nutrientii pot fi combinati
sigur/sau pot exista in natura combinatii efective pentru tinte multiple!

S-ar putea să vă placă și