Documente Academic
Documente Profesional
Documente Cultură
Gorgan PDF
Gorgan PDF
BIOFLUX
CLUJ-NAPOCA, 2008
CUPRINS
INTRODUCERE.............................................................................................................4
1. DEFINIIA I CARACTERISTICILE POPULAIEI.................................................6
1.1. Metode utilizate n studiul genetic al populaiilor............................................13
2. ASPECTE PRIVIND FILIAIA I DIVERSITATEA MOLECULAR......................15
2.1. Importana biologiei molecular n indicarea direciilor evolutive...15
2.2. Rolul ADN mitocondrial (ADNmt)......16
2.3. Aspecte ale evoluiei moleculare...16
2.3.1.Evoluia secvenelor nucleotidice i proteice..16
2.3.2.Metode de deducere a direciilor de filiaie, pornind de la date
moleculare17
2.3.3.Evoluia secvenelor de aminoacizi..18
2.3.4.Mutaiile i rata de substituie a aminoacizilor22
2.4. Tipuri de modificri la nivelul macromoleculei de ADN.24
2.4.1.Diferene nucleotidice ntre secvene...25
2.4.2.Modele de evoluie ale secvenelor nucleotidice26
2.4.3.Estimarea numrului de substituii nucleotidice.30
2.4.3.1.
Modelul Jukes-Cantor..30
2.4.3.2.
Modelul Kimura cu 2 parametri..31
2.4.3.3.
Modelul Tajima-Nei..31
2.4.3.4.
Modelul Tamura-Nei.32
2.4.3.5.
Madelul Tamura32
2.4.3.6.
Distane Gamma...34
2.4.4.Estimarea numeric a distanelor evolutive34
2.5. Arbori filogenetici.35
2.5.1.Arbori ai genelor i arbori ai speciilor...36
2.5.2.Metode de reconstruire a arborilor filogenetici...38
2.5.2.1.
Metode bazate pe distane..38
2.5.2.2.
Metoda evoluiei minime (ME)41
2.5.2.3.
Metoda Neighbor-Joining (NJ)41
2.5.2.4.
Alegerea tipului de distan evolutiv folosit n reconstruciile
filogenetice.46
2.5.2.5.
Metoda Maximum Parsimony (MP)...47
2.5.2.6.
Variana i covariana bootstrap (replicrilor repetate)..48
2.6. Situsuri informative i homoplazia.49
2.7. Strategii de cutare a filogeniei MP..51
2.8. Metode ML (Maximum Likelihood)52
3. METODOLOGIA DE OBINERE A SECVENELOR NUCLEOTIDICE.55
3.1. Determinare unor parametri i indici fenotipici...55
3.2. Protocolul de extracie al ADN total din esut muscular57
3.2.1.Prelucrarea statistic a datelor obinute din extracia ADN..59
3.2.1.1.
Estimarea valorilor medii ale populaiilor i stabilirea
intervalelor de variabilitate...59
1
3.2.1.2.
Compararea mai multor probe60
3.3. Reacia de amplificare genic prin polimerizare n lan (PCR).61
3.3.1.Principii generale.61
3.3.2.Ciclurile de replicare...63
3.3.2.1.
Denaturarea..63
3.3.2.2.
Alinierea primerilor...64
3.3.2.3.
Extensia.64
3.3.2.4.
Condiiile de reacie.65
3.3.3.Componentele PCR65
3.3.4.Amplificarea genic la reprezentani ai familiei Cyprinidae.65
3.3.4.1.
Amplificarea genei care determin sinteza citocromului B66
3.3.4.2.
Amplificarea regiunii de control mitocondrial68
3.3.4.3.
Amplificarea genei care codific subunitatea 4L a
dehidrogenazei (ND4L)69
3.4. Testarea produilor PCR prin electroforez70
3.5. Purificarea produilor PCR71
3.6. Cuantificarea produilor PCR72
3.6.1.Prepararea gelului de cuantificare72
3.6.2.Pregtirea probelor pentru cuantificare...72
3.6.3.Cuantificarea probelor72
3.7. Reacia de secveniere73
3.7.1.Reacia de secveniere a citocromului B.74
3.7.2.Reacia de secveniere a regiunii de control mitocondrial75
3.7.3.Reacia de secveniere a ND4L75
3.8. Precipitarea in etanol a probelor pentru secveniere.75
3.9. Analiza secvenelor.76
4. Studiul relaiilor filogenetice77
4.1. Evaluarea uniformitii populaiilor77
4.2. Testarea obinerii produilor PCR prin electroforez orizontal n gel de
agaroz.82
4.3. Cuantificarea produilor PCR87
4.4. Secvenierea genelor utilizate n studiile de filogenie95
4.5. Compararea secvenelor nucleotidice ale citocromului B provenite de la
indivizi aparinnd genului Cyprinus.96
4.5.1.Caracterizarea haplotipului CY01I99
4.5.1.1.
Frecvenele tipurilor de asocieri nucleotidice..99
4.5.1.2.
Translaia i caracterizarea catenei polipeptidice...99
4.5.2.Caracterizarea haplotipului CY04I.102
4.5.2.1.
Frecvenele tipurilor de asocieri nucleotidice102
4.5.2.2.
Translaia i caracterizarea catenei polipeptidice.102
4.5.3.Caracterizarea haplotipului CY0104N...103
4.5.3.1.
Frecvenele tipurilor de asocieri nucleotidice103
4.5.3.2.
Translaia i caracterizarea catenei polipeptidice.104
4.5.4.Caracterizarea haplotipului CY03M...105
4.5.4.1.
Frecvenele tipurilor de asocieri nucleotidice105
4.5.4.2.
Translaia i caracterizarea catenei polipeptidice.106
4.5.5.Caracterizarea haplotipului CY06M...107
4.5.5.1.
Frecvenele tipurilor de asocieri nucleotidice107
4.5.5.2.
Translaia i caracterizarea catenei polipeptidice.107
2
INTRODUCERE
Bazele geneticii populaiilor, puse n perioada 1920-1930, au permis
descoperirea faptului c procesele evolutive afecteaz i nivelul infraspecific
populaional. Studiul genetic al populaiilor se realizeaz optim cu ajutorul matematicii,
prin intermediul creia putem calcula frecvena genelor n succesiunea de generaii i
putem cuantifica factorii care contribuie la modificarea acestei frecvene.
nc Ch. Darvin a considerat evoluia ca proces statistic, pornind de la observaia
ca variaiile ereditare au caracter ntmpltor, iar selecia natural, realizat prin
supravieuirea i reproducerea difereniat a indivizilor mai api, reprezint factorul
major al procesului.
F. Galton (1822-1911), a fost primul care a folosit metode statistico-matematice
n studiul populaiilor. n lucrrile sale Typical laws of heredity in man (1877) i
Natural inheritance (1889) red consideraii asupra fenomenului ereditii, pornind de
la cunoaterea corelaiilor i regresiilor existente la prini i descendeni.
K. Pearson (1857-1936) a continuat cercetrile lui F. Galton i a elaborat
metodele de studiu a populaiilor mari, a dezvoltat metoda corelaiilor i a elaborat
testul 2. Astfel a aprut biometria, disciplin care are ca obiect de studiu variabilitatea
organismelor, interpretat cu ajutorul metodelor matematice.
n 1900, cnd au fost redescoperite legile lui Mnedel, s-a constatat, unanim, c
acestea sunt n esen legi probabilistice, fenotipizarea diferitelor caractere la
descendeni avnd un caracter aleatoriu dar determinist.
Matematicianul G.H. Hardy i medicul W. Weinberg, au descoperit c, n cazul
uni grup de indivizi izolai reproductiv, ntre care se realizeaz panmixia, frecvena
genelor, respectiv a genotipurilor, se menine constant att timp ct nu intervin factori
externi care pot modifica acest echilibru. Astfel a fost elaborat cunoscuta lege HardyWeinberg.
n deceniul trei al secolului trecut, ilutrii cercettori H. Nilson-Ehle, E.M. East i
R.A. Emerson au demonstrat c i caracterele cantitative au o determinare poligenic
i se transmit mendelian. Astfel a luat natere Genetica cantitativ, disciplin n cadrul
creia se studiaz ereditatea caracterelor cantitative ale unei populaii prin metode
statistice.
R.A. Fisher prin lucrarea sa Teoria genetic a seleciei naturale (1930), S.
Wright prin lucrarea Evoluia n populaiile mendeliene (1931) i H.B.S. Haldane prin
lucrarea Teoria matematic a seleciei naturale i artificiale (1932) aduc o contribuie
important la fundamentarea geneticii populaiilor.
Trebuie menionat c genetica populaiilor este strns legat de genetica
cantitativ, deoarece frecvena genelor, factorii care modific aceast frecven ct i
ereditatea caracterelor cantitive se pot studia numai la nivelul populaional.
4
CAPITOLUL 1
din diversitatea genotipurilor unei populaii, a acelor genotipuri care corespund mai
bine obiectivelor propuse de realizat n procesul de ameliorare.
n analiza genetic a populaiilor hibride se folosete metoda biometric,
completat cu calculul statistic al datelor, obinnd, astfel, modelul teoretic al
populaiei, pornind de la o anumit situaie dat i urmrind influena exercitat de
diferii factori care acioneaza asupra acesteia.
Astfel de studii genetice asupra populaiilor, bazate pe mbinarea metodei
biometrice cu calculul statistic, a efectuat W. Johansen (1903), care a definit att
populaia, ct i gruprile componente de indivizi din cadrul populaiei, adic liniile
pure.
Populaiile autogame, precum i soiurile autogame, pot fi descompuse n linii
pure prin alegerea descendenilor pe parcursul mai multor generaii i prin
consangvinizare.
De asemenea, n analiza genetic a populaiilor se studiaz frecvena genelor i
a genotipurilor din populaiile naturale, dup metoda elaborat de G. Hardz i W.
Weinberg (1908), care au demonstrat caracterul legic al echilibrul genetic al
populaiilor.
14
CAPITOLUL 2
15
orice filogenie poate fi explicat e nevoie de un criteriu pentru a selecta una sau
cteva filogenii preferate dintr-un set de filogenii posibile. Metodele de deducere
filogenetic ncearc s realizeze acest scop n unul din dou moduri: (1) definind o
secven specific de pai (un algoritm) ce duce la obinerea unui arbore filogenetic ;
sau (2) definind un criteriu pentru a compara filogeniile alternative ntre ele i
deciznd care e mai bun.
Metodele pur algoritmice combin deducerea arborelui filogenetic i definiia
arborelui preferat ntr-o singur supoziie. Aceste metode includ toate formele de
analiz a grupelor perechi (cum ar fi UPMGA) i alte metode bazate pe distane cum
ar fi NJ (neighbor joining). Ele sunt de obicei mai rapide deoarece merg direct spre
arborele final fr a necesita evaluarea unui numr mare de soluii.
A doua grup de metode presupune doi pai logici. Primul este definirea unui
criteriu de optimalitate (descris formal de printr-o funcie obiectiv) cu ajutorul cruia
fiecrui arbore i se acord un punctaj folosit pentru compararea arborilor unul cu
cellalt. Al doilea pas este utilizarea unui algoritm specific pentru calcularea valorii
funciei obiective i gsirea arborelui cu cel mai bun punctaj. Astfel supoziiile
evolutive fcute n primul pas sunt decuplate de folosirea calculatorului n pasul al
doilea. Preul acestei clariti logice este viteza lent de lucru a calculatorului, iar
pentru seturi date ce conin mai mult de 20 de taxoni arborele optim nu poate fi
ntotdeauna gsit din cauza numrului mare de posibile soluii.
Folosirea algoritmilor este radical diferit ntre cele dou metode. n cazul
metodelor pur algoritmice, algoritmul este cel care definete criteriul de selecie al
arborilor i are deci o valoare crucial. n metodele bazate pe un criteriu algoritmul
este doar unealt pentru evaluarea valorii funciei obiective i cutarea arborilor ce
optimizeaz aceast valoare. Deoarece metodele bazate pe criterii acord fiecrui
arbore analizat un punctaj, filogeniile pot fi aranjate n ordinea preferinelor. Aceasta
reprezint un avantaj enorm n faa metodelor pur algoritmice. Dac un set de date
poate fi explicat egal de bine de cteva mii de arbori filogenetici, folosind metode
bazate pe criterii nu vom fi dui n eroare c un anumit arbore explic datele foarte
bine. O metod algoritmic d un singur arbore, neputnd ti ct confiden putem
avea n acesta. Unii autori (Hedges et al., 1992) au sugerat utilizarea metodelor
statistice cum ar fi bootstrapping-ul pentru determinarea gradului de confiden pe
care l putem avea ntr-un arbore gsit prin metode pur algoritmice.
2.3.3. EVOLUIA SECVENELOR DE AMINOACIZI
nainte de inventarea metodelor rapide de secveniere n 1977 (Maxam & Gilbert,
1977; Sanger et al., 1977) majoritatea studiilor de evoluie molecular se bazau pe
secvene proteice. Astzi secvenierea ADN-ului este mult mai simpl i rapid dect
secvenierea proteinelor i majoritatea secvenelor proteice sunt obinute prin
transcriere folosind codul genetic. Totui secvenele proteice i-au pstrat
utilitatea pentru studiile filogenetice : ele sunt mult mai conservate, dect secvenele
de ADN i pot oferi informaii utile n cazul comparrii grupelor ndeprtate din punct
de vedere filogenetic. n plus, modelele matematice ale schimbrii evolutive a
aminoacizilor sunt mult mai simple dect cele pentru secvene de acizi nucleici, motiv
pentru care facem mai nti o prezentare a evoluiei secvenelor proteice i doar apoi
a celor nucleotidice.
Studiul schimbrilor evolutive al secvenelor polipeptidice ncepe prin compararea
a dou sau mai multe secvene. Cel mai simplu indice este numrul de aminoacizi
18
diferii (nd). Daca secvenele aliniate conin inserii sau deleii acestea trebuiesc
eliminate nainte de calcularea nd. Un alt indice simplu este distana p ce reprezint
proporia de aminoacizi prin care dou secvene de aminoacizi difer. Se calculeaz
mprind numrul de aminoacizi diferii la numrul total de situsuri comparate.
p=
nd
;
n
V(p)=
p (1 p )
n
Acest indice nu face nici o corecie pentru substituii multiple n cadrul aceluiai
situs sau pentru diferenele n ratele de evoluie ntre situsuri.
Urmtorul indice este distana cu corecie Poisson (PC) deoarece n realitate n
cadrul aceluiai situs pot avea loc substituii multiple ceea ce duce la o relaie neliniar
ntre p i timpul t. Odat cu trecerea timpului discrepana dintre nd i numrul real de
substituii crete (Figura 1)
Dac r este rata de substituie per an i per situs (pentru simplitate se presupune c e
acelai pentru toate situsurile) numrul mediu de substituii per situs ntr-o perioada de
timp t este rt, iar probabilitatea a k substituii (k = 1, 2, 3, ) este dat de distribuia
Poisson :
distana PC
distana p
substituie a aminoacizilor este de 10 per situs per an. (Dup Nei & Kumar, 2000)
P(k;t)=
e rt (rt ) k
k!
Deci probabilitatea ca ntr-un anumit situs s nu aib loc nici o substituie (k =0) este
P(0;t)=e-rt. Pentru un numr de n aminoacizi, numrul de aminoacizi neschimbai este
de ne-rt.
19
De obicei ns, secvena ancestral nefiind cunoscut ecuaia de mai sus nu este
aplicabil, trebuind s comparm dou secvene actuale divergena crora a nceput t
timp n urm. Probabilitatea (q) ca nici unul din situsurile omoloage ale celor dou
secvene s nu se fi schimbat este:
q = (e-rt)2 = e-2rt
Ea poate fi estimat ca 1 - ^p, deoarece q = 1 p, de unde 1- p = e-2rt. Daca d =
2rt este numrul total de substituii per situs pentru dou secvene atunci el poate fi
calculat ca :
d = -ln (1 p)
O estimare a lui d ( d ) poate fi obinut nlocuind n ecuaia de mai sus p cu p ,
r = d / (2t),
dar pentru aceasta trebuie s cunoatem momentul nceperii divergenei dintre cele
dou secvene. Daca cunoatem rata de substituie
a aminoacizilor putem folosi
formula de mai sus pentru a estima timpul evolutiv
t = d / (2r).
n modul de calculare a distanei descris mai sus se presupune c rata de
substituie aminoacizilor este identic pentru toate situsurile. Aceast aproximare de
cele mai multe ori nu este valabil, rata substituiei fiind mai ridicat pentru situsurile
mai puin importante din punct de vedere funcional, iar aminoacizii din centrul activ al
unei proteine pot fi conservai pentru perioade de timp foarte mari (Kimura, 1983).
Uzzel & Corbin (1971) au artat c de fapt distribuia numrului de substituii per situs
k are o varian mai mare dect cea a distribuiei Poisson i urmrete de fapt o
distribuie negativ binomial, iar distribuia lui r per situs urmrete o distribuie
gamma.
f (r) =
ba
e -b r r a-1
(a)
gamma definit:
( a ) e t t a 1 dt
0
20
Densitatea probabilitii
Forma distribuiei f(r) este dat de a care se mai numete i parametru de form
sau parametru gamma. Distribuia gamma este foarte flexibil i ia diverse forme n
dependen de a. Pentru a r este acelai pentru toate situsurile, pentru a=1 r
urmeaz o distribuie exponenial indicnd c rata de substituie variaz mult de la un
situs la altul, iar pentru a < 1 r are o distribuie i mai concav indicnd c un mare
numr de situsuri au r = 0 (Figura 2).
Spre exemplu Uzzell & Corbin (1971) au estimat c a = 2 pentru citocromul c de la
vertebrate, iar Zhang & Gu (1998)au estimat acest parametru ntre 0,2 i 3,5 pentru un
set de proteine nucleare i mitocondriale. Cnd r variaz conform unei distribuii
gamma poate fi estimat numrul de substituii de aminoacizi per situs. Probabilitatea
identitii a doi aminoacizi din dou situsuri omoloage peste un timp t este q = e-2rt,
iar q mediu pentru toate situsurile este dat de
a
q qf ( r ) dr
a 2r t
0
d G a 1 p
1 / a
cu variana
(1 2 / a )
V ( d G ) p 1 p
/n
21
iar estimarea ( d G ) a lui dG se obine nlocuind p prin p . Efectul variaiei lui r asupra
distanei d este semnificativ numai atunci cnd p > 0,2 iar a < 0,2, deci cnd p < 0,2
nu este necesar utilizarea distanei dG.
2.3.4. MUTAIILE I RATA DE SUBSTITUIE A AMINOACIZILOR
Genele sau secvene ale moleculelor de ADN care funcioneaz ca modele
structurale pentru ARNm sunt numite gene structurale. De cnd secvenele de
aminoacizi din structura unui lan polipeptidic se pot determina cu ajutorul secvenelor
nucleotidice din genele structurale, orice schimbare n secvena de aminoacizi este
cauzat de mutaiile produse la nivelul ADN. De asemenea, o mutaie care produce o
modificare n structura ADN nu este necesar s se reflecte n modificarea secvenei
aminoacizilor, fapt datorat degenerrii codului genetic.
naintea inventrii metodelor rapide de secveniere a ADN n 1977 (Maxam i
Gilbert, 1977; Sanger et al., 1977), cea mai mare parte a studiilor de evoluie
molecular au avut la baz utilizarea secvenelor de aminoacizi. Unele principii
importante ale evoluiei moleculare, cum ar fi: evoluia prin duplicarea genelor (Ingram
1963; Ohno, 1970) i ceasul evoluiei moleculare (Zuckerkandl i Pauling, 1962;
Margoliash, 1963), au fost descoperite prin studiul secvenelor de aminoacizi. n
prezent, secvenierea ADN este mult mai simpl dect secvenierea aminoacizilor
care este de obicei dedus din secvenierea nucleotidelor prin utilizarea codului
genetic (Nei i Kumar, 2000).
Nu este adevrat faptul c orice mutaie poate fi ncorporat ntr-o secven,
deoarece speciile sunt alctuite din populaii cu numeroi indivizi, iar o mutaie nou
aprut ntr-un individ, poate dispare din populaie prin ans sau prin aciunea
seleciei purificatoare. Numai n cazul n care mutaia survine la nivelul ntregii
populaii, atunci aceasta poate fi inclus n genomul speciei. Acest proces poart
numele de fixare a mutaiei n populaie. Odat fixat o mutaie n cadrul unei
populaii, orice individ aparinnd acelei populaii va avea aceeai mutaie. Cnd sunt
comparate dou secvene de aminoacizi provenite de la dou specii diferite, sunt
urmrii iniial, noii aminoacizi care au fost ncorporai.
Cnd apare o mutaie n cadrul populaiei, supravieuirea alelelor depinde n
principal de ans, dac este sau nu avantajoas din punct de vedere selectiv i de
mrimea populaiei. De exemplu, considernd A1 gena slbatic i A2 alela. ntr-un
organism diploid, gena mutant apare iniial n stare heterozigot (A1A2). n urma
ncrucirii A1A2 x A1A1, dac nu rezult descendeni (generaia F1) din diferite
cauze biologice (de exemplu sterilitatea homozigotului A1A1), gena mutant va
dispare n generaia urmtoare. Supravieuirea genei alele, nu este sigur nici chiar
dac n urma ncrucirii A1A2 x A1A1 se produc urmai, deoarece descendenii cu
genotipul A1A2 apar cu o probabilitate de 0,5. n plus, exist i o ans de 0,25 ca
descendenii cu aceste genom s nu apar (Nei i Kumar, 2000).
Cnd o mutaie este neutr sau nu afecteaz fitness-ul individului purttor,
frecvena relativ a mutantei poate crete sau descrete prin ans n cadrul
populaiei (Nei i Kumar, 2000).
Pn acum n toate modelele descrise s-a vorbit despre substituiile aminoacizilor
de parc fiecare substituie este fixat n secvena considerat. De fapt secvenele de
aminoacizi nu sunt independente, fiecare specie constnd din populaii, iar mutaiile
au loc n individ ele putnd dispare prin deriv genetic sau prin selecie
22
a 2 Nv
1
v
2N
Deci rata de substituie per locus i per generaie este egal cu rata mutaiei.
Aceasta regul simpl a fost descoperit n 1968 de ctre Kimura.
n cazul mutaiilor avantajoase selective situaia este alta, fitnesul indivizilor fiind
de 1 n cazul genotipului AA, 1+s n cazul genotipului Aa i 1+2s n cazul genotipului
aa (s este numit coeficient de selecie i este pozitiv pentru mutaiile folositoare i
negativ pentru cele duntoare. Probabilitatea fixrii mutaiilor avantajoase u 2s
pentru populaii mari unde Ns 1 , deci rata de fixare a mutaiilor avantajoase este
a 2 Nv 2s 4 Nsv
6
Tranziii
T
Transversii
gT
gC
T
gA
gC
C
gA
gT
G
gA
gT
gC
Kimura model
Tamura Nei model
A
gT
gC
T
gA
2gC
C
gA
2gT
G
1gA
gT
gC
Equal input model
General reversible model
A
gT
gC
gG
agT
bgC
T
gA
gC
gG
agA
dgC
C
gA
gT
gG
bgA
dgT
G
gA
gT
gC
cgA
egT
fgC
Tamura model
Unrestricted model
A
2
1
1
a12
a13
T
2
1
1
a21
a23
C
2
2
1
a31
a32
G
2
2
1
a41
a42
a43
G
gG
gG
gG
1gG
gG
gG
cgG
egG
fgG
a14
a24
a34
-
Not: un element (eij) care intr n una din matricile anterioare de substituie nucleotidic va
nlocui nucleotida din rndul i cu nucleotida din coloana j. gA, gT, gC i gG sunt frecvenele nucleotidelor.
1 = gG + gC; 2 = gA + gT.
25
p nd / n
unde nd i n sunt numrul de nucleotide diferite i numrul total de situsuri,
variana lui p este aceiai ca pentru secvenele de aminoacizi. Pe lng acest indice
ades este necesar s cunoatem frecvenele diferitelor perechi de nucleotide dintre
dou secvene, X i Y. Existnd patru nucleotide, A, T, G i C n fiecare secven
exist 16 perechi diferite de nucleotide. Patru perechi sunt formate din nucleotide
identice (AA, TT, CC i GG), patru sunt perechi de tipul tranziiilor (AG, GA, TC i CT)
i opt sunt perechi de tipul transversiilor (restul perechilor). Frecvenele totale ale
perechilor de nucleotide identice, perechilor de tipul tranziiilor, i perechilor de tipul
transversiilor pot fi notate cu O, P i Q respectiv, deci p = P + Q. Dac substituiile de
nucleotide ar avea loc aleatoriu Q ar trebui s fie de dou ori mai mare ca P (8 : 4)
pentru un p mic. De fapt tranziiile au loc mai frecvent ca transversiile i deci P poate fi
mai mare dect Q. Raportul R dintre tranziii i transversii poate fi calculat dup
1
1
V ( R ) R 2
nP nQ
fapt ce indic c dac nP i nQ nu sunt mari, variana lui R poate fi foarte mare. n
26
a C
bG
cT
(a C b G cT )
(g A dG eT )
g A
dG
eT
(h A jC fT )
h A
jC
fT
i A
kC
lG
(i A k C l G )
aC
bG
cT
(aC b G cT )
(g A dG eT )
a A
dG
eT
(h A j C fT )
b A
dC
fT
c A
eC
f G
(i A kC lG )
27
1
1
1
3
4
4
4
4
1
1 3 1
4
4
4
4
1
1
3
1
4
4
4
4
1
1
3
1
4
4
4
4
iar dac combinm frecvena bazelor i rata de substituie ntr-un singur parametru
/ 4 se obine o form mai simpl. Acest parametru reprezint probabilitatea
schimbrii unui nucleotid n oricare altul :
Un alt model utilizat frecvent este cel al lui Kimura cu 2 parametri propus n 1980
(K2P). El ia n calcul observaia c tranziiile i transversiile au loc cu rate diferite, ns
n continuare admite o frecven egal a bazelor. Deci a = c = d = f =1 i b = e = k
obinndu-se:
1
1
1
1
( k 2)
4
4
4
4
1
1
1
1
( k 2)
4
4
4
4
1
1
1
1
( k 2)
k
4
4
4
4
1
1
1
1
( k 2)
4
4
4
4
28
C
G
T
( k G Y )
(
)
A
T
R
G
T
( k A Y )
A
C
T
A
C
G
( k C R )
unde
, k , R A G , Y C T .
C
G
T
( G Y )
( T R )
A
G
T
( A Y )
A
C
T
A
C
G
( C R )
R A G , Y C T ,
C
G (1 K / R )
T
A
G
T (1 K / Y )
(1 K / R )
C
T
A
A
C (1 K / Y )
G
Elementele din matricea de mai sus ce corespund tranziiilor au fiecare cte dou
componente, deoarece tranziiile au loc fie ratei generale fie ratei din grup. Cnd K = 0
acest model se rezum la cel F81, cnd K crete peste 0, tranziiile au loc din ce n ce
mai frecvent fa de transversii. Acest model este implimentat n pachetul de
programe PHYLIP 2.6 i toate versiunile ulterioare (Felsenstein, 2004).
Aceste matrice ne dau doar rata instantanee a substituiilor ntr-un moment de
timp dt, ns n cazul construciei arborilor filogenetici dup metoda maximei
29
P(t ) e Qt
Aceleai modele de mai sus pot fi folosite i pentru a calcula distana dintre dou
secvene nucleotidice X i Y care s-au difereniat dintr-un strmo comun t timp n
urm.
2.4.3. ESTIMAREA NUMRULUI DE SUBSTITUII NUCLEOTIDICE
2.4.3.1. MODELUL JUKES CANTOR
Cel mai simplu model de substituie nucleotidic este cel propus de Jukes i
Cantor n 1969. Acest model presupune c substituia nucleotidic intervine n orice
site cu frecven egal, astfel nct, o nucleotid este nlocuit cu una din celelalte trei
nucleotide rmase cu o probabilitate pe an (sau o alt unitate de timp). Mai mult,
probabilitatea de nlocuire a unei nucleotide cu oricare din celelalte trei, este r=3,
unde r reprezint probabilitatea de nlocuire pe site pe an. Dac lum n considerare
dou secvene X i Y care au evoluat divergent dintr-o secven comun ancestral,
cu t ani n urm. Dac notm cu qt nucleotidele comune dintre cele dou secvene i
cu pt (pt=1 qt) proporia nucleotidelor diferite, procentul nucleotidelor comune qt+1
n timpul t+1 (msurat n ani), poate fi obinut astfel n primul rnd, trebuie s
precizm c acest site care prezint nucleotide comune pentru X i Y n timpul t, va
rmne neschimbat n timp, adic n t+1, cu o probabilitate (1-r)2 sau aproximativ 12r, deoarece r reprezint o cantitate foarte mic astfel nct r2 poate fi neglijat. n plus,
un site care prezint nucleotide diferite n timpul t, va avea aceleai nucleotide n
timpul t+1 cu o probabilitate 2r/3. Aceast probabilitate este obinut innd cont de
faptul c n momentul n care secvenele X i Z au nucleotidele i respectiv j, n timpul t,
ele devin identice dac i n X se schimb cu j, dar j din Y rmne neschimbat sau
dac j din Y este nlocuit cu i, iar i din X rmne neschimbat. Probabilitatea de
apariie a primului eveniment este de (1-r)=r(1-r)/3, deoarece i in X trebuie s fie
nlocuit cu nucleotida j (cu o probabilitate mai mare dect cazul celorlalte dou
nucleotide), iar nucleotida j din Y trebuie s rmn neschimbat. Probabilitatea de
apariie a celui de-al doilea eveniment este de asemenea r(1-r)/3. Mai mult,
probabilitatea total este 2r(1-r)/3, care devine aproximativ 2r/3 dac nu se ine cont
de valoarea lui r2.
Dac:
2
r 1 qt , care poate fi scris ca:
3
2 r 8r
q t 1 q t
qt
3
3
qt 1 1 2r qt
dq 2r 8r
q 1
3
1 e 8 rt / 3 .
4
9 p1 p
, (Kimura i Ohta, 1972).
V d
3 4 p 2 n
P (1 / 4)(1 2e 4( )t e 8 t )
Q (1 / 2)(1 e 8 t )
iar d 2rt 2t 4 t (1 / 2) ln(1 2 P Q ) (1 / 4) ln(1 2Q )
1
cu variana V ( d ) c12 P c 32 Q (c1 P c 3 Q ) 2
n
1
1
, c2
, c3 (c1 c 2 ) / 2
unde c1
1 2P Q
1 2Q
2.4.3.3. MODELUL TAJIMA - NEI
n modelul lui Tajima i Nei frecvena n echilibru a nucleotidelor este considerat
4
3
4
xij2
2
2
cu xij (i < j) fiind
identic, iar d (1 / 2) 1 g i p / c unde c
i 1
i 1 j i 12 g i g j
31
V (d )
b 2 p(1 p)
(b p) 2 n
2g g
2g A gG
gR
gY
1
1
P2
Q
P1
Q T C 1
ln 1
gR
gY 2gT g C
2g R
2gY
2g A gG
g g g
g g g
1
2 g R g Y A G R T C Y ln 1
Q
gR
gY 2g R gY
f r
b a br a 1
2
2
e r , unde a r / V r i b r / V r , r i V r fiind
a
este adesea numit conformaie gamma sau parametru gamma i de valoarea lui b
care este factor de mrime (Kocher i Wilson, 1991; Tamura i Nei, 1993; Wakeley,
1993, 1994).
Din acest motiv, unii autori dezvolt distanele gamma corespunztoare, pentru
substituia nucleotidelor. Distanele gamma pot fi derivate ale aceleiai metode
matematice, ca i cele utilizate pentru calcularea distanelor n cazul secvenelor de
aminoacizi.
2.4.4. ESTIMAREA NUMERIC A DISTANELOR EVOLUTIVE
Formulele analitice prezentate mai sus sunt bazate pe modele matematice de
substituie a nucleotidelor relativ simple, iar estimrile sunt aceleai cu estimrile prin
metoda maximei verosimilitudini pentru acelai model. Dac se dorete ns
efectuarea estimrilor pe baza unui model mai complicat cum ar fi Tamura-Nei
gamma sau GTR este mai util estimarea numeric a distanelor folosind metoda
maximei verosimilitudini. Spre exemplu, formula analitic pentru estimarea distanei
Tamura-Nei gamma necesit informaii privind frecvena nucleotidelor i a
parametrului a. Frecvena nucleotidelor este estimat din dou secvene de ADN
comparate, iar valoarea lui a este obinut utiliznd secvene adiionale.
Dac utilizm metode numerice este posibil estimarea frecvenei nucleotidelor i
valoarea parametrului a din setul de date. Altfel spus putem estima att toi parametrii
ct i distanele maximiznd verosimilitudinea pentru setul de date i topologia
34
b c
Figura 6 Cele dou tipuri mari de arbori filogenetici: a-cu rdcina, bfr rdcin
Dac numrul taxonilor (m) este 4, exist 3 topologii posibile pentru arbori fr
rdcin i 15 pentru arbori cu rdcin. Numrul posibil de topologii crete brusc
odat cu creterea lui m. Numrul de topologii posibile pentru un arbore cu rdcin
ce prezint doar bifurcaii (rezolvat complet) este
1 3 5 (2m 3)
(2m 3)!
m2
(m 2)!
36
dg1 t0
dg2 -t1
populaie
polimorf
ancestral
dg3 -t2
sp -t3
A
a
B
c
Cnd genele luate n studiu aparin unei familii multigenice poate s apar alt
problem. Dac spre exemplu dou specii nrudite 1 i 2 au dou gene duplicate, a1
b1 i a2 b2 respectiv, iar duplicarea a avut loc naintea separrii celor dou specii
atunci genele a1 i a2 sunt ortoloage, adic una este descendentul direct al celeilalte,
iar perechile a1 cu b1, a2 cu b2, a1 cu b2 i a2 cu b1 sunt paraloage, adic nu sunt
descinse direct una din cealalt. Cnd construim un arbore filogenetic al speciilor
trebuie s utilizm doar gene ortoloage i nu paraloage, deoarece doar primele
reprezint fenomenele de speciaie. diferenierea ntre cele dou tipuri de gene nu
este ntotdeauna simpl, mai ales n cazul familiilor multigenice, de aceia deducerea
filogeniei speciilor din cea a genelor trebuie fcut mereu cu mult grij.
Bineneles c nu ntotdeauna se caut a obine un arbore al speciilor. n studiul
familiilor multigenice se caut cunoaterea istoriei evolutive a membrilor familiei i
procesul duplicrii genelor.
O alt problem n reconstruirea arborilor filogenetici este c de multe ori
lungimea secvenelor utilizate este mic, aprnd erori statistice. O filogenie teoretic
construit dintr-un set de date cu lungime foarte mare i un numr ateptat de
substituii se numete arbore real, iar cel din secvenele disponibile cu numrul real de
substituii, arbore realizat, i unul i cellalt fiind diferii de fapt de arborele reconstituit
sau dedus. Majoritatea modelelor i metodelor de reconstrucie a arborilor filogenetici
au tendina de a produce filogeniile realizate, iar UPGMA pe cea real. Din pcate
aceast din urm metod este foarte sensibil la erori i dimensiunea setului de date.
Desigur c cel mai util este arborele real, cel ce reprezint evoluia istoric, ns n
practic este mult mai simplu s obinem arborele realizat, deoarece setul de date se
refer anume la acest tip de arbore. De asemeni topologia unei filogenii realizate este
aceiai cu cea a celei reale, exceptnd cazurile n care prima devine cu noduri
pluriramificate datorit erorilor statistice (unele ramificaii interne pot s nu prezinte
37
cazul n care frecvena genelor este folosit n reconstrucia filogenetic, acest model
produce arbori destul de buni, comparativ cu alte metode bazate pe distan (Nei et
al., 1983; Takezaki i Nei, 1996). n acest caz, o msur a distanei care prezint un
coeficient mai mic de variaie, pare s duc la construirea de arbori cu o mai mare
precizie, comparativ cu alte metode de determinare a distanei, chiar dac nu respect
exact numrul de substituii genice (Takezaki i Nei, 1996). Prin UPGMA se pot
construi arbori pentru evoluia n cadrul speciilor, cu toate c erori de topologie apar
adesea cnd rata substituiei genelor nu este constant sau cnd numrul de gene
sau nucleotide este mic.
n cadrul UPGMA, un mod de msurare a distanelor evolutive, este calcularea
acestora pentru toate perechile de taxoni sau secvene, valorile distanelor fiind sub
forma unei matrici (Tabelul 4)
Taxon
2
3
4
5
Din aceast matrice, rezult c dij reprezint distana dintre taxonii i i j. Analiza
grupat (de tip clustal) a taxonilor ncepe cu perechea de taxoni ntre care exist cea
mai mic distan. Presupunnd c d12 este cea mai mic distan dintre toate
valorile matricei rezultate, taxonii 1 i 2 vor fi grupai pornind dintr-un ram comun
localizat la distana b=d12/2. Din acestea, putem presupune c lungimea ramurilor
celor doi taxoni care provin dintr-un ram comun, este aceeai. n acest caz, taxonii 1 i
2 vor fi ncadrai ntr-un singur taxon compus sau grup [u=(1-2)], iar distana dintre
acest grup i un alt taxon k (k1,2) este dat de: duk=(d1k+d2k)/2. n plus, obinem o
nou matrice (Tabel 5)
Taxon
3
4
5
n continuare, presupunnd c distana du3 este cea mai mic, taxonii u i 3 vor fi
ncadrai ntr-un nou taxon compus sau cluster [v=(1-2-3)], cu o lungime a ramului
comun de b=du3/2=(d13+d23)/(2x2). Aceast distan ntre noul cluster (grup) creat v
i fiecare dintre taxonii rmai (k), este dat de: dkv=(dk1+dk2+dk3)/3. Atunci
matricea se va transforma n (Tabelul 6):
Taxon
4
5
Presupunnd c dv4 este cea mai mic valoare din matricea anterioar, putem
ncadra v=(1-2-3) i 4 ca avnd un ram comun dat de b=dv4/2=(d14+d24+d34)/(3x2).
39
Este evident c ultimul taxon care se altur celorlali trei, este 5 i ramul comun este
dat de: b=(d15+d25+d35+d45)/(4x2).
Este de asemenea posibil, ca n cea de-a doua matrice cea mai mic distan
poate fi d45 (sau oricare alta n afar de du3). n acest caz, taxonii 4 i 5, sunt unii cu
ramura comun dat de b=d45/2, crendu-se astfel un nou taxon compus, v=(4-5).
Distanele ntre v i alt taxon (3 i u) sunt date de d3v=(d34+d35)/2 i
duv=(d14+d15+d24+d25)/4. Presupunnd c duv este cel mai mic, taxonii u i v sunt
grupai iar taxonul 3 va fi ultimul care se va altura grupului. De asemenea, dac d3v
este cel mai mic, taxonii 3 i v se vor grupa primii.
Dup cum reiese din exemplul anterior, distana dintre dou grupuri (A i B) este
dat de urmtoarea formul:
iar
dij este distana dintre taxonul i din grupul A i taxonul j din grupul B. Ramura
comun dintre cele dou grupe, este dat de dAB/2. Cu toate acestea, n scopul
modelrii pe calculator, ecuaia de mai sus nu este utilizabil, fiind folosii algoritmi
mai facili pentru a calcula dAB (Swofford et al., 1996).
S R (d ij eij ) 2
i j
unde dij i eij sunt distanele observat i respectiv patristic dintre taxonii i i j.
Distana patristic este suma lungimii estimate a ramificaiilor ce unesc cei doi taxoni.
SR este calculat pentru toate topologiile plauzibile i topologia cu cea mai mic
valoare este aleas drept filogenie final. O alt posibilitate de a calcula SR este
aplicnd formula :
S R ( d ij eij ) 2 / d ij
i j
n practic cele dou formule dau rezultate identice sau aproape identice. O problem
ce se datoreaz criteriului de optimizare al acestei metode este obinerea frecvent a
ramificaiilor cu lungime negativ (ceia ce din punct de vedere biologic este imposibil).
Felsenstein (1995) a mbuntit metoda LS prin aplicarea constrngerii de a
considera doar topologiile cu ramificaii nenegative.
40
S bi
i
fiind calculat pentru toate topologiile posibile, cea corect, fiind topologia cu cea mai
mic valoare a lui S. n acest caz, bi este o estimare a lungimii ramului i, iar T este
numrul total de ramuri T=2m-3.
Ideea metodei minimei evoluii (minimum evolution ME) a fost prima dat
promovat de Edwards i Cavalli-Sforza (1963), fr a da nici o explicaie asupra
algoritmului. Mai trziu, Kidd i Sgaramella-Zonta (1971) au sugerat c lungimea
total a ramurilor [L(S)] poate fi calculat pe baza valorii absolute (| bi |) a tuturor
L S nu
lungimilor estimate ale ramurilor, fr nici o justificare teoretic. Dar,
prezint proprieti statistice care s permit un calcul rapid al valorii lui S, iar testele
statistice dezvoltate de Rzhetsky i Nei (1992, 1993)nu sunt aplicabile pentru L(S). De
menionat este faptul c n prezena erorilor estimate statistic ale ramurilor cu lungime
mic, poate deveni negativ chiar i pentru o topologie corect a arborelui (Sitnikova
et al., 1995).
ME presupune o examinare a tuturor topologiilor posibile i gsirea celei cu cea
mai mic valoare S pn la epuizarea tuturor variantelor, iar arborele cu cea mai mic
valoare S, este considerat ca fiind un arbore filogenetic ME. Baza teoretic a acestei
strategii, este faptul c arborii filogenetici ME sunt n general identici sau asemntori
cu arborii Neighbor Joining (NJ), cnd valoarea lui m este relativ mic (Saitou i
Imanishi 1989; Rzhetsky i Nei, 1992), astfel nct arborii de tip NJ pot fi folosii ca
punct de plecare cnd valoarea lui m este mare.
2.5.2.3. METODA NEIGHBOR JOINING (NJ)
Dei metoda ME are proprieti statistice utile, necesit o perioad de calcul
suficient de mare atunci cnd numrul taxonilor comparai este mare. Saitou i Nei
(1987) au dezvoltat o metod eficient de realizare a arborilor filogenetici, care se
bazeaz pe principiul evoluiei minime (ME). Aceast metod nu examineaz toate
topologiile posibile, dar n fiecare stadiu de grupare a taxonilor, se folosete un
principiu de evoluie minim. Aceast metod se numete Neighbour Joining (NJ) i
este privit ca o versiune simplificat a metodei ME. Cnd se folosesc 4 din 5 taxoni,
metodele NJ, ME dau rezultate identice (Saitou i Nei, 1987). Exist o oarecare
asemnare ntre NJ i metoda adiional de realizare a arborilor, care d att
topologia ct i lungimea ramurii simultan.
Unul dintre conceptele importante n aceast metod, este reprezentat de
neighbors, definii ca doi taxoni conectai printr-un singur nod ntr-un arbore fr
punct de origine. De exemplu, taxonii 1 i 2 din arborele prezentat n Figura 37, sunt
considerai neighbors (vecini), pentru c sunt conectai doar prin nodul A. Similar,
41
taxonii 5 i 6 sunt considerai neighbors, dar toate celelalte perechi nu. Cu toate
acestea dac se combin taxonii 1 i 2 i se consider ca fiind un singur taxon,
acesta, (1-2) i taxonul 3 sunt acum neighbors. Este posibil definirea topologiei unui
arbore prin alturri succesive ale taxonilor vecini (nj) i producerea unor noi perechi
de taxoni vecini. De exemplu, topologia arborelui din Figura 8 poate fi descris prin
urmtoarele perechi de taxoni vecini (neighbors): (1, 2), (5, 6), (1 2, 3) i (1 2
3,4). Astfel, prin gsirea acestor perechi de taxoni vecini, se poate obine topologia
arborelui.
42
S 0 LiX
i 1
1 m
d ij T m 1 , unde LiX este lungimea braului
m 1 i j
estimat ntre nodurile i i X, iar T=i<jdij. n acest caz, i reprezint un anumit nod
exterior, iar X nodul interior (Figura 9). n situaia opus, aa cum este n cazul Figurii
m
10, din care reiese faptul c suma S12 este dat de L1X+L2X, LXY i
L
i 3
iZ
. Dar,
L1 X L 2 X d 12 ,
L XY
m
L
i 3
iY
m
1
m
2
2
d
d
m
L
L
d iY
1i
2i
1X
2X
2m 2 i 3
i 3
1
dij
m 3 3 i j
43
S12 L1 X L2 X L XY LiY
i 3
Dac notm cu R1
d
i 3
m
1
d1i d 2i 1 d ij
2m 2 i 3
m 2 3 i j
m
1i
S12
2T R1 R2 d 12
2m 2
2
Qij m 2 d ij Ri R j
b Ai
b Aj
1
m 2d ij Ri R j
2m 2
, (Saitou i Nei, 1987)
1
m 2d ij Ri R j
2m 2
Aceste valori sunt determinate prin metoda ptratului minim, pentru actuala
topologie a arborelui. Urmtorul pas, este calcularea distanei ntre noul nod A i
taxonii rmai (k; 3km) (Figura 11).
44
45
d Ak d ik d jk d ij 2
Dac se calculeaz toate distanele pe baza acestei valori, vom obine o nou
matrice de tipul (m-1)(m-1). Pentru aceast nou matrice, putem calcula o nou sum
Sij, care va fi notat cu Sij`, deoarece nu include lungimea ramurilor externe pentru
prima pereche de taxoni vecini identificai, astfel nct apare ca fiind mai mic dect
suma total (Sij) a lungimii braelor la acest nivel al construciei arborelui filogenetic.
Pentru gsirea unei noi perechi de taxoni vecini, se ia n considerare din nou
perechea cu cea mai mic valoare Sij. Un nou nod B poate fi creat pentru aceast
nou pereche de taxoni i o nou valoare a matricei distanei (m-2)(m-2) este
calculat. Aceast procedur se repet, pn cnd toi taxonii sunt grupai ntr-un
singur arbore fr punct de origine (unrooted tree) de tip neighbour joining (Figurile 12
- 14).
2.5.2.4. ALEGEREA TIPULUI DE DISTAN EVOLUTIV FOLOSIT N
RECONSTRUCIILE FILOGENETICE
Acurateea unei filogenii deduse pe baz de secvene depinde de doi factori : (1)
relaia liniar dintre distana estimat i numrul real de substituii i (2) eroarea
standard a coeficientului de variaie a distanei utilizate. Pn n momentul de fa nu
a fost pus la punct nici un test statistic general valabil pentru a putea alege modul de
estimare a distanei evolutive. Totui n urma estimrilor pe calculator i a datelor
experimentale s-a ajuns la o serie de generalizri utile:
1. Cnd numrul de substituii nucleotidice estimat prin metoda JC este 0,05
se recomand utilizarea distanei p sau distana JC chiar dac exist diferen ntre
numrul de transversii i tranziii sau dac rata de substituie r variaz de la situs la
situs. n acest caz utilizarea modelului K2P sau a altor modele mai complexe d
acelai rezultat ns aceste metode au o varian mai mare datorit numrului mai
mare de parametri.
2. Cnd 0,05<d<1.0, iar numrul de nucleotide examinate este mare se
recomand utilizarea distanei JC. Dac raportul R dintre tranziii i transversii
este
mai mare ca 5 iar numrul de nucleotide examinate este mare este recomandat
folosirea modelului K2P sau distana gamma. Dac ns numrul de secvene folosite
este mare, iar n este mic atunci distana p d cele mai bune rezultate (doar dac rata
de substituie nu variaz foarte mult pentru diverse linii filogenetice). n ultimii ani s-a
observat o utilizare frecvent a estimrii gamma a modelului HKY, deoarece acesta
ine cont de coninutul n perechi GC, raportul R dintre tranziii i transversii i variaia
ratei de substituie ntre situsuri. Datorit varianei mari modelul HKY d ns de obicei
rezultate mai proaste dect utilizarea distanelor p sau JC. Doar n cazurile extreme
cnd n > 10000, iar rata de substituie a nucleotidelor variaz foarte mult de la o linie
evolutiv la alta utilizarea modelelor complexe cum ar fi HKY este ndreptit.
3. Cnd d > 1 pentru mai multe perechi de secvene arborele filogenetic construit
este de obicei greit (din cauza varianei mari a distanelor estimate i a erorilor de
aliniere). Acest tip de seturi de date trebuiesc ocolite pe ct este posibil eliminnd
poriunile slab conservate folosindu-le pe cele mai puin variabile (ca n cazul
46
VB d
2
1 B
db d , unde d = media valorilor db la sfritul tuturor
B 1 b 1
2
2
1 B
d ijb d ij dklb d kl , unde ij i kl se refer la perechile de
1 B b 1
secvene i i j, k i l.
Un avantaj al acestei metode este acela c poate calcula variana i covariana,
chiar atunci cnd nu sunt disponibile formulele matematice i ofer estimri mai bune
dect alte formule analitice (Efron i Tibshirani, 1993).
Cov B dij , d kl
49
Secvena
Situsuri omoloage
1 2 3 4 56 7 89
TAGAGATCG
TGCCGATCA
TGATAACCG
TGAGAACCA
Topologie I
Topologie II
Topologie III
Situs
3
Situs
4
Sit
Figura 15 Tipuri de situsuri
g i si mi
g i mi si
rci
Formulele de mai sus sunt date pentru un singur situs, practic ns este
necesar calcularea acestor valori pentru toate situsurile informative, calculndu-se n
final indici totali (CI - consistenci index, RI - retention index i RC - rescaled
consistenci index) dup formulele:
CI i m i
s ; RI g s g m ; RC RI
CI
Cnd m > 10 cutarea arborilor specificai nu este aplicabil exist alte dou
modaliti numite metoda ramificrii i unirii (branch and bound) i cutarea
euristic. n cazul primei metode filogeniile care sunt evident mai lungi ca una
examinat anterior sunt ignorate toate, iar arborele MP este determinat calculnd
lungimea unui grup de arbori care au potenialul de a avea lungimea minim. n cea
de a doua metod este examinat doar o mic parte din toate topologiile posibile i nu
exist nici o garanie c va fi gsit topologia cu o lungime minim. Totui utiliznd
anumii algoritmi, probabilitatea gsirii topologiei corecte crete.
De multe ori nu exist o singur topologie de lungime minim ci mai multe. n
acest caz se practic reprezentarea unei filogenii-consens, care este o sintez a
tuturor filogeniilor obinute. n filogeniile-consens stric toate modurile de ramificare ce
intr n conflict sunt rezolvate prin crearea unui nod intern pluriramificat. n filogeniileconsens dup regula majoritar acele moduri de ramificare care predomin sunt
pstrate n arborele final. De obicei se utilizeaz regula majoritar de 50%, adic
modurile de ramificare prezente n 50% sau mai mult dintre topologii sunt pstrate.
2.8. METODE ML (Maximum Likelihood)
Analizele filogenetice tind s deduc istoria evolutiv (sau un set de istorii
probabile) care corespunde cel mai bine setului de date observat (n cazul de fat este
vorba de secvene nucleotidice sau de aminoacizi dar poate fi vorba i de caractere
morfologice, frecvene ale genelor, situsuri de restricie etc.). Necunoscutele
problemei sunt ordinea de ramificare i lungimea ramurilor a filogeniei. Pentru a aplica
metodele ML este nevoie de un model concret de substituie ce descrie transformarea
unei secvene n alta.
Metodele ML de reconstrucie filogenetic evalueaz ipoteza despre istoria
evolutiv n termeni probabilistici (Care este probabilitatea c o anumit istorie
evolutiv - topologie i un anumit model de substituie vor da natere datelor
observate). O istorie evolutiv ce are o probabilitate mai mare de a da natere datelor
observate are prioritate fa de una cu o probabilitate mai mic. Aceast metod a fost
utilizat pentru prima dat n reconstruciile filogenetice de ctre Cavalli-Sforza i
Edwards n 1967 ns aceti autori au considerat calculele necesare prea complicate
pentru calculatoarele de la acea vreme i au dezvoltat metode aproximative ca de
exemplu ME (Huelsenbeck & Crandall, 1997). Felsenstein a utilizat pentru prima dat
aceast metod n 1981 pentru analiza filogenetic a secvenelor de nucleotide, dup
care metoda a nceput s fie din ce n ce mai utilizat. Printre avantajele acestei
metode se numr variana mic i posibilitatea utilizrii unui numr minim de
parametri. Chiar pentru un numr mic de nucleotide acest tip de metode depesc de
multe ori metodele bazate pe distane i cele MP.
Principiul de baz al metodei implic calcularea verosimilitudinii unei filogenii.
Deoarece majoritatea modelelor de substituie folosite sunt reversibile n timp,
verosimilitudinea unei filogenii este independent de localizarea rdcinii.
Presupunnd c fiecare situs evolueaz independent putem calcula verosimilitudinea
fiecrui situs separat i s combinm aceste valori pentru obinerea unei valori finale.
Pentru a calcula verosimilitudinea unui situs j trebuie s lum n considerare toate
scenariile posibile prin care starea final a situsului ar fi putut evolua. Bineneles c
unele scenarii sunt mult mai plauzibile dect altele, ns fiecare are o anumit ans
s se fi produs. Spre exemplu dac considerm o filogenie ca n fig. 14 a n rdcin
am fi putut avea teoretic oricare din cele 4 nucleotide (A, G, C, T), pentru oricare alt
52
nod intern este de asemeni posibil existena oricrui nucleotid. Deci avem un total de
4 X 4 = 16 posibiliti. Cum oricare dintre aceste 16 scenarii ar fi putut duce la setul
final de date observate, probabilitile tuturor evenimentelor trebuiesc calculate i
nsumate pentru a obine probabilitatea unui situs j (aceast probabilitate depinde
dup cum am mai menionat de topologie i de modelul de substituie nucleotidic)
(fig. 14 c). Cum am presupus c fiecare situs evolueaz independent de celelalte,
probabilitatea unui scenariu evolutiv este egal cu produsul probabilitilor tuturor
situsurilor 1, 2, 3, j n. Pentru c probabilitatea unei singure observaii este foarte
mic n locul lor se utilizeaz logaritmii acestora, deci probabilitile sunt acumulate ca
sum a logaritmilor verosimilitudinilor fiecrui situs luat n parte (fig. 14 e)
Din cauza volumului foarte mare de calcule ce trebuiesc efectuate dac numrul
de taxoni este mai mare ca 10 i secvenele utilizate sunt mari au fost dezvoltate o
serie de algoritmi de cutare (ca i n cazul metodelor MP).
Cum modalitatea real de substituie a nucleotidelor este foarte complicat, s-ar
putea crede c un model matematic cu muli parametri este mai bun dect un model
cu mai puini parametri. Totui chiar dac un model cu mai muli parametri
corespunde datelor mai exact dect unul mai simplu, numrul mare de parametri l
face mai sensibil la erori. Deci este mai util utilizarea unui model mai simplu atta
timp ct acesta aproximeaz modul de substituie al nucleotidelor suficient de bine.
n cazul metodelor ML corespondena dintre model i date poate fi examinat
folosind testul LR (Likelihood Ratio Test) sau criteriul informaiei al lui Akaike (AIC
Akaike Information Criterion). Cnd avem dou modele 1 i 2 i modelul 1 este caz
particular al modelului 2, iar topologia corect este cunoscut putem calcula testul LR
dup formula
LR 2(ln L2 ln L1 )
unde lnL1 i lnL2 sunt valorile ML pentru modelele 1 i 2. n acest mod putem testa
dac modelul 2 este semnificativ mai bun dect modelul 1.
n
Spre exemplu modelul lui Kimura este caz special al modelului HKY, primul
avnd un parametru liber, cellalt patru. Deci diferena n gradul de coresponden
dintre model i date poate fi evaluat prin testul LR sau 2 cu 3 grade de libertate.
Dac dintre cele dou dou modele comparate unul nu este caz particular al celuilalt
testul LR nu poate fi utilizat, un mod alternativ de a genera distribuia testului este
simularea Monte Carlo (parametric bootstrapping) (Goldman, 1993) sau se aplic AIC
definit ca
AIC 2 ln L 2 p
unde lnL este logaritmul verosimilitudinii unui anumit model, iar p este numrul de
parametri liberi ce trebuiesc estimai. Se consider c predictibilitatea statistic a unui
model este cu att mai bun cu ct AIC are valori mai mici. Din ecuaia de mai sus se
vede c chiar dac un model mai sofisticat are valori ale lnL mici din cauza
53
numrului mare de parametri p valoarea indicelui AIC crete. Totui n alte domenii
acest criteriu d indicaii mult mai bune dect n reconstruciile filogenetice. De cele
mai multe ori valoarea AIC pentru un model complex cum ar fi HKY este mai mic
dect pentru un model simplu precum K2P ceia ce nu nseamn ns obligatoriu c
topologia obinut cu un model mai complex este ntotdeauna mai bun.
Metode ML aplicabile n cazul secvenelor de aminoacizi i a proteinelor
Cnd secvenele de ADN sunt destul de apropiate ntre ele din punct de vedere
filogenetic metodele ML funcioneaz foarte bine, n special atunci cnd sunt utilizai
prima i a doua poziie a codonului. Dac se folosesc secvene (ce codific proteine)
ndeprtate filogenetic apar complicaii deoarece rata substituiilor sinonime este mult
mai mare dect cea a substituiilor nesinonime, frecvena celor 4 nucleotide n cea de
a treia poziie a codonului poate varia mult artnd c este astfel violat modelul
staionar de substituie. Din contra, schimbrile evolutive ale secvenelor proteice sunt
mult mai ncete astfel nct se poate utiliza metoda ML pentru secvenele proteice
utiliznd spre exemplu matricea de tranziie a aminoacizilor a lui Dayhoff et al. din
1978.
54
CAPITOLUL 3
55
g = greutatea corpului, n g;
Ls = lungimea standard, n cm.
Pentru a obine informaii cu privire la gradul de uniformitate a populaiei, precum
i asupra nivelului de semnificaie statistic a diferenelor dintre populaiile celor dou
specii, s-au efectuat msurtori biometrice la 50 exemplare/specie i s-au calculat
valorile unor parametri statistici (Snedecor, 1968): x = media aritmetic; S=deviaia
standard; Es = eroarea standard; C.V. % = coeficientul de variaie.
1. Media aritmetic:
, n care:
xi
n
x
S x
n
, unde:
x 2 = suma ptratelor valorilor individuale;
(x)2 = ptratul sumei valorilor individuale;
n = numrul indivizilor
3. Eroarea standard:
S2=variana
Sx
S
S
n
n
4. Coeficientul de variaie:
S = deviaia standard;
C.V .%
S 100
, n care:
x
x = media aritmetic.
Pentru a stabili uniformitatea loturilor care au fost utilizate n experimentele
ulterioare de extracie a ADN total i de secveniere, au fost folosii cte 50 de indivizi
aparinnd celor dou specii, pentru fiecare populaie analizat.
56
57
Modul de lucru:
Se eticheteaz tuburi Eppendorf de 1,5ml autoclavate, n care se introduc cte
500l soluie tampon (tampon pentru liz). Tuburile se in nchise, pn n momentul
introducerii esutului.
Se cntresc ntre 20 200mg de esut muscular proaspt, congelat sau
conservat n alcool etilic 95% (n acest caz, esutul se usuc nainte de cntrire, pe
hrtie de filtru). Fragmentul de esut se aeaz pe o lam steril i se taie mrunt cu
un bisturiu sau cu o lam, sterilizate. Dac fragmentul este mic (dac provine de la un
individ de 1 2cm), aceast etap nu este necesar.
Se introduc fragmentele de esut n tubul Eppendorf (de 1,5ml) corespunztor,
care conine 500l soluie tampon pentru liz. Aceast etap se repet pentru toi
indivizii. n fiecare tub, se adaug cte 10l proteinaz K (10l reprezint echivalentul
a 200g proteinaz dintr-o soluie stoc 20mg/ml care este preparat i congelat la 20C). Se agit fiecare prob pe un vortex i se pstreaz peste noapte n etuv la
37C.
Not: pentru realizarea acestei etape se recomand s se lucreze cu un numr de
probe echivalent cu numrul de cuve din centrifug.
n ziua urmtoare, sub ni, n fiecare tub de 1,5ml se adaug 600l de soluie
fenol : cloroform : alcool izoamilic (25 : 24 : 1), pn la semnul superior al tubului
(Figura 12). Se agit tuburile timp de 30 60 secunde, apoi se centrifugheaz
(utiliznd o centrifug de mas), la o turaie 8000 rotaii/minut, timp de 4 minute. n
timpul centrifugrii, se eticheteaz noi tuburi Eppendorf de 1,5ml. La sfritul
centrifugrii, tuburile prezint o faz inferioar de culoare glbuie care conine
solventul organic, o faz superioar care conine ADN i o faz intermediar unde
sunt depozitate toate resturile pe care dorim s le eliminm din soluia de ADN (Figura
13)
Not: dac aceast faz intermediar este foarte mare, se repet splarea cu fenol :
cloroform : alcool izoamilic urmat de centrifugare. Dac fazele sunt bine separate, se
trece la etapa urmtoare.
Se separ faza superioar a fiecrui tub, n noile tuburi etichetate; - pentru
aceasta se utilizeaz o pipet Gilson P-100, cu ajutorul creia se extrag 700l de ADN
(Figura 14). Dac pipetarea se face repede, iar concentraia ADN este foarte mare n
faza superioar a tubului, n momentul pipetrii, se pot extrage resturi ale fazei
intermediare. Se extrage faza superioar din fiecare tub meninndu-le deschise sub
ni, iar la sfrit, se adaug cte 550l cloroform (Figura 15). Se agit tuburile timp
de 30 60 secunde, apoi se centrifugheaz la 8000 rotaii/minut, timp de 3 minute,
utiliznd o centrifug de mas (tip COBOS MC-10). n timpul centrifugrii, se
eticheteaz noi tuburi.
Se separ fazele superioare rezultate n urma centrifugrii (Figura 16), n noile
tuburi, n acelai mod ca n etapa precedent (Figura 17), avnd grij s nu se preia
nimic din faza intermediar de separare.
Se adaug 1ml etanol rece 95% (pstrat la -20C) n noile tuburi dup separare
pn la semnul superior al fiecrui tub (Figura 18). Se agit tuburile i se las la
temperatura de -20C, timp de 30 60 minute, timp n care se va forma un precipitat
albicios (ADN total) pe fundul tuburilor (Figura 19).
Dup precipitarea ADN, se centrifugheaz tuburile la 10.000 rotaii/minut, timp de
5 minute, pentru sedimentare. Se elimin supernatantul i se aeaz tuburile
deasupra unei hrtii de filtru, astfel nct s se scurg ultimele picturi de alcool.
Urmeaz uscarea peletelor, mutnd tuburile, deschise, ntr-o centrifug cu vacuum,
unde sunt meninute timp de 10 minute, cu temperatura n scdere. Dac n acest
58
LI x S x t , n 1
LS x S x t , n 1
Astfel, intervalul LI-LS, include media populaiei cu o probabilitate de 1-.
59
ext
int
S S S
S S S S
S S S S S
2
ext
int
2
i
Unde:
= variana interaciunii;
2
ext
=variana extern;
2
t
=variana total
S 2 SS
SS
, SS =suma de ptrate; SS =suma de ptrate medie;
grade libertate
SS t x
2
t
nt
60
SS ext SS c SS r SS i ,
xc 2 xt 2
SS c
nt
nt r
x r 2 xt 2
SS r
nt
nt c
x x x x x
SS i
c1r1
nc1r1
c1r 2
nc1r 2
c 2 r1
nc 2 r1
c2r 2
nc 2 r 2
nt
SS c SS r
SS int SS t SS c SS r SS i
glt =nt 1, glt=grade de libertate totale, nt=numr total de valori;
glc = c 1, glc=grade de libertate pe coloane, c=numr de valori pe coloane;
glr = r 1, glr=grade de libertate pe rnduri, r=numr de valori pe rnduri;
gli = (c-1)(r-1), gli=grade de libertate ale interaciunii;
glint = nt cr, glint=grade de libertate interne
Sursa
variabilitate
SSc
SS r
SS i
(c-1)(r-1)
SSc / c - 1
SS r / r - 1
SS i /(c - 1)(r - 1)
int
SSint
nt - cr
SSint / nt - cr
SS t
nt - 1
c
r
c-1
r-1
SS c / SS int
SS r / SS int
SS i / SS int
500 perechi de baze (pb) nu necesit mult timp pentru o sintez complet
(aproximativ 30 de secunde fiind suficiente). n general, un timp de extensie de 30 de
secunde este suficient pentru produi sub 50pb, 60 de secunde sunt necesare pentru
produi cu lungimi cuprinse ntre 500 i 1500pb i 90 de secunde sunt necesare
pentru produi cu lungimi mai mari. Optimizarea timpului de elongare este necesar,
deoarece un timp prea mare poate favoriza apariia de artefacte (alinieri nespecifice)
(Palumbi, 1996).
3.3.2.4. CONDIIILE DE REACIE
Pentru sistematica molecular, atenia a fost ndreptat ctre primeri i ct de bine
se aliniaz la matria de ADN. Dac alinierea nu este eficient, sau dac primerii se
aliniaz nespecific, amplificarea poate s fie blocat sau se pot amplifica produi
alternativi. Astfel, complementaritatea perfect primer matri, poate determina
amplificri cu mare specificitate. Din pcate, temperaturile ridicate, adesea mpiedic
utilizarea primerilor universali (primeri realizai a fi eficieni pentru un anumit numr de
taxoni) (Kocher et al., 1989).
3.3.3. COMPONENTELE PCR
Mediul de reacie este foarte important pentru specificitatea i eficiena
amplificrii. Astfel, mediul de reacie trebuie s conin un tampon, amestecul de
nucleotide, polimeraz, primeri, ADN i Mg2+ (un cofactor necesar pentru activitatea
enzimei) (Carbonari et al., 1993). Numai primerii i nucleotidele se consum n cursul
reaciei acestea fiind adugate n exces, astfel nct sinteza s nu poat fi limitat de
aceste componente.
Cofactorul, nu se consum n timpul reaciei i nici nu este degradat de
temperaturile extreme ale ciclurilor de amplificare, astfel nct concentraiile iniiale i
finale sunt aceleai. Ionul, este un important cofactor n cataliza enzimatic a reaciei
de sintez, astfel, o concentraie optim poate accelera considerabil desfurarea
reaciei. Oricum, Mg2+ interacioneaz cu sarcinile negative ale gruprii fosfat ale
nucleotidelor, suficient de puternic nct Mg2+ s atrag gruprile PO4- i s rmn
n cantitate destul de mic pentru a mai reaciona ca i cofactor. Din acest motiv,
concentraia de Mg2+ trebuie s fie mai mare dect concentraia dNTP.
Varierea concentraiei de Mg2+ este una dintre cele mai comune metode de
stabilire a condiiilor de reacie pentru PCR. De obicei se utilizeaz o cantitate de
1,5mM MgCl2.
3.3.4. AMPLIFICAREA GENIC LA REPREZENTANI AI FAMILIEI CYPRINIDAE
n cazul celor dou specii analizate, a indivizilor ginogenetici i a hibrizilor
interspecifici, au fost amplificate 3 secvene aparinnd la trei gene diferite. Astfel, au
fost amplificate regiunile cu hipervariabilitate aparinnd citocromului b i regiunii de
control a ADNmt (D-loop), precum i o regiune conservativ necodificatoare la speciile
analizate, segmentul 4L al dehidrogenazei (ND4L).
65
5`-ATCTTCGGTTTACAAGACCGGT-3`
5`-ATGATGACCGCCTTCGTAGGCTA-3`
Primerii pentru
primul segment
Primerii pentru
al doilea segment
Glutamat (Glu)
15081bp
L14724
Treonin (Thr)
16221 bp
H15149
L15138
H15910
66
Primerii utilizai pentru amplificarea acestui fragment, sunt Glu-F i Thr-R (Zardoya i
Doadrio, 1998), avnd ca regiuni complementare, secvene nucleotidice din afara
citocromului b i anume, genele care codific sinteza acidului glutamic (Glu) i a
treoninei (Thr). (Figura 18).
Tabel 8 Compoziia mediului de reacie i cantitile corespunztoare de reactivi pentru
amplificarea cytb la specii ale genului Carassius
Cantitatea
Reactiv
Concentraia
pentru o prob Nr. probe
Amestec final
(l)
ddH2O-miliQ
33
n
33n
PCR buffer
10X
4,5
n
4,5n
dNTPs
8mM
5,0
n
5,0n
MgCl2
25mM
2,0
n
2,0n
Primer 1 (Glu-F)
2mM
1,5
n
1,5n
Primer 2 (Thr-R)
2mM
1,5
n
1,5n
Taq polimeraza
5000U/ml
0,5
n
0,5n
Glu-F 5`-GAAGAACCACCGTTGTTATTCAA-3`
Thr-R 5`-ACCTCCRATCTYCGGAGGACA-3`
Figura 18 Structura primerilor utilizai n amplificarea cytb la Carassius gibelio Bloch.
68
CTRL A 5`-TTCCACCTCTAACTCCCAAAGCTAG-3`
CTRL E 5`-CCTGAAGTAGGAACCAGATG-3`
Figura 19 Structura primerilor utilizai n amplificarea regiunii de control mitocondrial la
speciile analizate de ciprinide
Pentru specii aparinnd genului Carassius, a fost utilizat acelai mediu de reacie
i aceiai primeri ca n cazul speciilor genului Cyprinus. Referitor la parametrii
programului de amplificare, acesta s-a desfurat la o temperatur de aliniere a
primerilor de 60C i 30 cicluri de replicare.
3.3.4.3. AMPLIFICAREA GENEI CARE CODIFIC SUBUNITATEA 4L A
DEHIDROGENAZEI (ND4L)
NADH dehidrogenaza prezint 7 subuniti pe toat suprafaa ADNmt. A fost
amplificat i secveniat subunitatea 4L, deoarece este considerat a fi o regiune
puternic conservativ, astfel nct eventualele substituii nucleotidice de la acest nivel,
ne vor putea confirma (n cazul apariiei acestor substituii) diferene decelate n cadrul
celorlalte gene secveniate, hipervariabile citocromul b i d-loop.
La speciile genului Cyprinus, pentru amplificarea genei, s-a folosit un amestec de
reacie modificat prin dublarea cantitii de Taq polimeraz de la 0,3l, la 0,6l
(Tabelul 9). Pentru amplificarea segmentului dorit, s-au folosit doi primeri degenerai
L10420 pentru catena direct i H10720 pentru revers (Figura 20)
Reacia de amplificare a genei s-a desfurat dup un program care avea
temperatura de aliniere a primerilor de 51C i un numr de 40 cicluri de replicare.
n cazul speciilor genului Carassius, pentru amplificarea genei codificatoare a
ND4L, a fost folosit acelai mediu de reacie (inclusiv aceiai primeri) i aceleai
condiii de amplificare ale programului PCR ca n cazul speciilor genului Cyprinus.
69
L10420 5`-AAYAARAYCNTTGATTTCGRCTCA-3`
H10720 5`-TCYGTGCCRTGYGTYCGNGC-3`
Figura 20 Structura primerilor utilizai n amplificarea ND4L la ciprinide
Avnd valori aproximative ale lungimilor genelor amplificate (valori provenite din
banca de gene GenBank), pentru verificarea produilor PCR obinui, au fost folosite
geluri de agaroz avnd concentraii de 1,5% i volume de 30ml. Prepararea unui
70
astfel de gel, necesit o cantitate de 0,45g agaroz (SEAKEM) la 30ml TBE 1X.
Astfel, se adaug soluia de TBE 1X peste agaroz, se amestec pn la
omogenizare i se introduce n cuptorul cu microunde pentru aproximativ 20 de
secunde. Dup expirarea timpului, se scoate, se agit i se reintroduce n cuptor
pentru alte 20 de secunde. Flaconul ce conine gelul, se rcete n jet de ap; dup
rcire, se introduc n flacon 1,5l bromur de etidiu i se agit pn la dispariia culorii
roii a bromurii.
Se toarn gelul n suportul pentru gel, se introduce un pieptene i se las s se
ntreasc. (Not: cuva de electroforez trebuie s fie aezat pe un loc perfect plan
naintea turnrii gelului). Dup ntrire, se scoate pieptenele prin culisare i se aeaz
gelul n cuva de electroforez care conine tampon TBE sau TAE 1X.
Pregtirea probelor pentru migrarea n gel, necesit un fag, n care se introduc
cte 2,5l loading buffer pentru fiecare prob, plus aceeai cantitate pentru markerul
molecular de 100pb i controlul negativ. n continuare, peste buffer se adaug cte
10l din fiecare prob (produs PCR). Se omogenizeaz coninutul fiecrei celule a
fagului, n momentul introducerii probei. Dup realizarea amestecurilor, se ncarc
probele n gelul de agaroz, pstrnd ordinea, ntotdeauna pe ultima poziie
disponibil de ncrcare, fiind situat controlul negativ (C-).
Electroforeza produilor PCR a fost efectuat n cuve tip FOTODYNE, ntr-un
cmp electric de 90V i 50 60mA, timp de 40 50 de minute, n funcie de mrimea
fragmentelor.
3.5. PURIFICAREA PRODUILOR PCR
Purificarea tuturor produilor PCR obinui s-a realizat utiliznd un kit de reacie
QIAGEN (QIAquick PCR purification kit) i un protocol furnizat de aceeai firm.
Acestea sunt utilizate pentru purificarea direct a produilor PCR mono- sau
bicatenari cu lungimi cuprinse ntre 10pb 10kb de primerii neataai, nucleotide
libere, polimeraze i sruri. Kit-ul conine coloane de purificare, tampon PB, tampon
PE, tampon EB (productorul nu furnizeaz compoziia fiecrui tampon) i tuburi
colectoare.
Ca prim etap a purificrii, se adaug 5 volume tampon PB la 1 volum produs
PCR i se amestec. Nu este necesar ndeprtarea uleiului mineral adugat n tuburi
pentru a mpiedica evaporarea n timpul amplificrii). Se ataeaz coloanele la tuburile
colectoare (tuburi cu un volum de 2ml). Produii PCR amestecai cu alcool sunt
introdui n coloane i se centrifugheaz la 13000 rotaii/minut (rpm), timp de 30 60
secunde, utiliznd o centrifug de mas. Se descarc tuburile colectoare, plasnd din
nou coloanele n aceleai tuburi.
Pentru etapa de splare, se adaug 0,75ml tampon PE n coloane i se
centrifugheaz la 13000 rpm timp de 30 60s. Se golesc tuburile colectoare, i se
centrifugheaz din nou coloanele timp de 1 minut la 14000 rpm, pentru a elimina
complet alcoolul din probe. Not: etanolul rezidual nu va fi eliminat complet dac nu
este golit tubul colector naintea acestei ultime centrifugri.
Se aeaz coloanele n tuburi Eppendorf sterile de 1,5ml. Pentru a dizolva ADN
din coloane, se adaug 50l tampon EB (10mM Tris-Cl, pH=8,5) sau H2O miliQ n
centrul membranei i se centrifugheaz coloanele, timp de 1 minut la 13000 rpm.
Pentru a crete concentraia de ADN, se adaug numai 30l tampon EB n centrul
membranei, se las n repaus 1 minut i se centrifugheaz.
71
72
ng pentru 25fmoli
ng pentru 50fmoli
ng pentru 100fmoli
3,3
4,9
6,5
8,1
16
33
50
65
80
100
130
165
195
6,5
9,8
13
16
33
65
100
130
165
195
260
325
390
13
20
26
33
65
130
195
260
325
390
520
650
780
74
76
CAPITOLUL 4
77
Indivizi
ginogenetici
Crap oglind
Iai
Larga-Jijia Movileni
Indivizi fr solzi
Indivizi cu solzi
Populaia
Nr.crt.
Lt
(cm)
Ls
(cm)
Lc
(cm)
Ha
(cm)
Hd
(cm)
G
(g)
C
(cm)
Ip
Ic K
CF
27,6
24,6
7,3
3,9
9,7
442
20,5
2,55
1,20
2,96
27,0
23,8
7,1
3,7
11,7
413
18,2
2,03
1,31
3,07
27,7
24,9
7,4
3,9
11,5
400
18,8
2,17
1,32
2,60
28,2
24,9
7,5
4,1
10,4
487
19,6
2,40
1,27
3,17
27,4
23,7
7,2
3,9
11,1
408
19,4
2,14
1,23
3,05
25,8
22,5
6,8
3,4
10,9
430
19,5
2,06
1,15
3,80
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
28,3
27,9
28,6
27,8
25,3
29,1
26,9
29,3
26,0
28,1
26,2
29,2
27,9
25,6
25,4
29,2
26,9
26,2
26,2
28,1
28,1
29,1
27,5
26,9
28,0
27,2
25,3
26,9
28,5
25,7
27,4
27,2
28,4
26,4
25,4
25,3
24,8
25,7
24,6
21,7
25,9
22,8
25,6
21,4
24,7
21,9
25,7
22,1
24,7
22,9
25,5
22,6
22,3
22,4
24,8
24,1
25,9
23,7
22,8
24,3
24,0
21,8
22,7
24,1
22,3
24,6
24,0
23,5
23,0
21,9
7,6
7,4
7,8
7,1
6,3
7,6
6,7
7,2
6,0
7,2
6,2
7,6
6,4
7,2
6,7
7,1
6,6
6,2
6,3
7,2
6,1
7,4
6,6
6,2
7,6
7,6
6,1
6,4
7,2
6,1
7,3
7,1
6,8
6,6
6,1
4,1
4,0
4,2
4,1
3,2
4,2
3,4
4,2
3,2
3,9
3,4
4,1
3,9
3,2
3,4
4,2
3,6
3,4
3,4
3,8
4,0
4,3
3,6
3,4
4,1
3,8
3,2
3,5
4,0
3,5
4,0
4,0
4,1
3,7
3,5
10,9
10,9
10,3
9,5
10,9
11,5
11,9
9,8
11,2
10,0
9,6
10,9
10,3
11,2
9,8
10,5
10,2
11,1
10,6
11,0
11,3
11,3
11,3
10,2
9,8
10,6
9,3
9,8
11,0
10,4
11,3
9,4
9,3
11,5
9,6
452
487
463
451
358
506
351
345
502
369
372
500
485
475
402
427
436
341
358
343
403
437
389
454
507
360
347
475
406
450
464
398
410
410
368
19,1
20,1
19,5
20,6
19,1
20,6
18,4
20,5
18,3
19,0
20,3
20,6
19,3
19,8
18,5
20,4
18,6
18,5
18,8
18,8
19,5
20,5
19,3
18,9
20,1
20,0
20,5
19,5
18,3
18,5
19,7
18,2
19,9
18,7
19,6
2,32
2,27
2,49
2,59
1,99
2,25
1,92
2,62
1,91
2,46
2,29
2,35
2,14
2,20
2,34
2,44
2,21
2,02
2,11
2,25
2,12
2,30
2,10
2,25
2,49
2,26
2,34
2,32
2,19
2,15
2,18
2,55
2,51
2,01
2,27
1,32
1,23
1,31
1,19
1,14
1,26
1,24
1,25
1,17
1,30
1,08
1,24
1,14
1,25
1,24
1,25
1,22
1,20
1,19
1,32
1,23
1,26
1,23
1,21
1,21
1,20
1,07
1,16
1,31
1,21
1,25
1,32
1,18
1,23
1,11
2,79
3,20
2,74
3,03
3,51
2,90
2,96
2,06
5,15
2,44
3,53
2,96
4,51
3,15
3,36
2,57
3,78
3,06
3,18
2,25
2,89
2,52
2,93
3,83
3,53
2,60
3,35
4,06
2,92
4,06
3,11
2,88
3,16
3,37
3,52
78
Populaia
Nr.crt.
Lt
(cm)
Ls
(cm)
Lc
(cm)
Ha
(cm)
Hd
(cm)
G
(g)
C
(cm)
Ip
Ic K
CF
42
43
44
45
46
47
48
49
50
26,7
29,3
28,3
29,9
28,5
26,0
26,7
25,4
28,1
24,0
25,8
24,9
25,6
24,4
22,6
22,3
22,2
24,7
7,4
7,7
7,5
7,3
7,0
6,8
6,7
6,7
7,3
3,9
4,2
3,9
4,6
3,8
3,4
3,6
3,3
3,9
11,4
10,5
9,7
11,1
11,4
11,6
10,9
11,3
9,7
501
341
451
463
398
404
469
497
344
18,8
20,3
20,2
20,3
20,1
19,3
19,0
18,7
20,0
2,11
2,47
2,57
2,31
2,14
1,95
2,06
1,96
2,53
1,28
1,27
1,23
1,26
1,22
1,17
1,17
1,19
1,23
3,64
1,99
2,92
2,76
2,73
3,48
4,21
4,52
2,28
27,3
1,25
23,8
1,34
6,95
0,53
3,78
0,35
10,6
0,73
423
52,7
19,4
0,76
2,25
0,19
1,22
0,06
3,18
0,64
2,50
2,67
1,05
0,69
1,46
105,
1,52
0,38
0,12
1,27
0,17
0,18
0,07
0,04
0,10
7,46
0,1
0,02
0,01
0,09
27,7
24,1
7,30
4,14
10,9
423,
19,8
2,61
1,58
3,53
27
23,4
6,59
3,42
10,2
422
19
1,89
0,86
2,82
Media
Deviaia standard
Coeficient
de
variaie
Eroarea standard
Limita superioar
a intervalului de
confiden
Limita inferioar a
intervalului
de
confiden
Ip=indice profil; Ic K=indice de circumferin Kieslev; CF= coeficient Fulton; Lt=lungimea total, Ls=lungime
standard, Lc=lungimea capului, Ha=nlimea la nivelul nottoarei anale, Hd=nlimea la nivelul nottoarei
dorsale, G=greutate, C=circumferin
30
25
cm
20
15
10
0
Lt
Ls
Lc
Ha
Hd
79
Ia
Larga-Jijia - Movileni
i
Populaia
Nr.
crt.
Lt
(cm)
Ls
(cm)
Lc
(cm)
Ha
(cm)
Hd
(cm)
G (g)
C
(cm)
Ip
IK
CF
18,2
15,8
4,0
2,0
5,9
257
15,3
2,68
1,03
6,52
19,5
15,6
3,7
2,4
6,3
274
15,2
2,48
1,03
7,22
19,2
15,9
4,1
2,2
6,1
252
14,7
2,61
1,08
6,27
21,7
17,8
4,4
2,6
6,9
371
17,6
2,58
1,01
6,58
18,5
14,7
4,1
1,9
5,2
248
15,2
2,83
0,97
7,81
19,2
15,6
4,1
2,3
5,5
262
14,6
2,84
1,07
6,90
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
19,9
17,3
18,3
21,0
20,7
18,6
20,6
20,0
20,2
20,1
18,6
21,3
18,4
18,4
18,1
18,7
17,7
18,0
19,2
16,6
14,4
14,6
17,2
17,2
15,5
16,7
16,4
16,7
16,6
15,3
17,3
15,4
15,2
15,0
15,3
14,4
14,8
15,7
4,2
3,6
3,8
4,4
4,3
4,3
4,3
4,8
4,4
4,1
3,9
4,9
4,0
3,6
3,9
3,9
3,6
4,1
4,1
2,3
1,4
2,0
2,4
2,3
2,1
2,3
2,0
2,1
2,4
2,0
2,4
1,8
2,1
2,0
2,0
1,9
1,9
2,1
6,2
5,0
5,9
6,7
6,5
5,9
6,6
5,8
6,3
6,6
5,7
6,7
5,4
5,9
6,1
5,7
5,4
5,5
6,0
268
243
260
342
309
249
284
289
277
280
261
340
264
263
266
266
243
237
250
15,8
14,4
15,6
16,8
16,3
15,7
16,3
15,6
16,1
16,6
14,8
17,0
14,0
14,3
14,8
14,8
13,2
14,2
16,1
2,68
2,88
2,47
2,57
2,65
2,63
2,53
2,83
2,65
2,52
2,68
2,58
2,85
2,58
2,46
2,68
2,67
2,69
2,62
1,05
1,00
0,94
1,02
1,06
0,99
1,02
1,05
1,04
1,00
1,03
1,02
1,10
1,06
1,01
1,03
1,09
1,04
0,98
5,86
8,14
8,35
6,72
6,07
6,69
6,10
6,55
5,95
6,12
7,29
6,57
7,23
7,49
7,88
7,43
8,14
7,31
6,46
26
19,4
16,2
4,1
2,1
6,2
255
15,3
2,61
1,06
6,00
80
Populaia
Nr.
crt.
Lt
(cm)
Ls
(cm)
Lc
(cm)
Ha
(cm)
Hd
(cm)
G (g)
C
(cm)
Ip
IK
CF
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
18,8
17,1
18,9
17,3
18,0
17,4
20,0
17,9
19,5
18,1
17,3
20,7
18,6
19,6
19,6
18,7
18,6
17,6
19,4
18,3
21,1
20,5
19,6
17,7
19,02
1,17
15,4
13,9
15,9
14,2
14,8
15,4
15,1
14,9
14,5
16,9
16,3
16,2
16,8
17,0
16,6
16,4
17,1
16,7
16,0
16,3
14,6
16,8
17,3
14,3
15,83
0,99
4,1
3,7
3,6
3,9
3,9
4,3
4,1
4,5
3,7
4,1
4,2
3,8
3,8
4,4
4,2
3,9
3,7
4,8
4,6
4,6
4,5
4,5
4,4
3,8
4,12
0,34
2,0
2,0
2,0
2,1
1,9
1,4
2,6
2,0
2,3
2,4
1,4
2,0
1,4
2,6
1,4
2,6
2,4
1,9
1,4
1,5
1,6
2,4
1,5
1,9
2,04
0,34
5,9
5,6
5,8
5,6
5,9
5,4
5,6
5,5
5,5
6,6
6,7
5,8
6,4
5,3
5,8
6,1
6,6
5,9
5,5
6,2
6,7
5,8
5,8
6,0
5,96
0,46
264
231
250
243
247
269
283
243
253
257
244
273
253
268
331
289
240
237
302
243
287
244
278
240
267,59
29,47
14,8
14,3
15,2
14,3
14,6
15,1
14,3
15,7
16,6
16,6
16,8
14,0
15,2
16,5
14,4
14,7
14,1
14,1
14,5
14,6
14,0
14,8
15,0
15,6
15,20
0,97
2,61
2,48
2,74
2,54
2,51
2,84
2,70
2,70
2,62
2,56
2,43
2,82
2,61
3,19
2,86
2,68
2,58
2,82
2,90
2,63
2,19
2,90
3,00
2,37
2,66
0,17
1,04
0,97
1,05
0,99
1,01
1,02
1,06
0,95
0,87
1,02
0,97
1,16
1,11
1,03
1,15
1,12
1,21
1,19
1,11
1,12
1,04
1,13
1,15
0,92
1,04
0,07
7,23
8,60
6,22
8,49
7,62
7,43
8,24
7,38
8,31
5,37
5,68
6,36
5,31
5,40
7,29
6,52
4,77
5,09
7,37
5,57
9,19
5,14
5,39
8,21
6,84
1,07
2,34
1,99
0,67
0,67
0,91
58,93
1,93
0,34
0,13
2,13
0,16
0,14
0,04
0,04
0,06
4,16
0,13
0,02
0,01
0,15
19,38
16,18
4,47
2,39
6,32
267,94
15,56
3,02
1,40
7,19
18,66
15,46
3,75
1,68
5,60
267,22
14,84
2,30
0,68
6,47
Media
Deviaia standard
Coeficient
de
variaie
Eroarea standard
Limita superioar
a intervalului de
confiden
Limita inferioar
a intervalului de
confiden
Ip=indice profil; Ic K=indice de circumferin Kieslev; CF= coeficient Fulton; Lt=lungimea total, Ls=lungime
standard, Lc=lungimea capului, Ha=nlimea la nivelul nottoarei anale, Hd=nlimea la nivelul nottoarei
dorsale, G=greutate, C=circumferin
81
25
20
cm
15
10
0
Lt
Ls
Lc
Ha
Hd
Dac comparm valorile medii ale celor doi indici i al coeficientului Fulton, pentru
ambele genuri investigate (Tabel 17), putem constata c valorile sunt aproximativ
egale, ceea ce denot c exist similaritate fenotipic chiar i ntre indivizii celor dou
genuri. Astfel, se constat c exist o diferen foarte mic (0,41) n ceea ce privete
indicele de profil pentru indivizii celor dou genuri, de unde rezult c morfologic,
populaiile studiate sunt asemntoare.
Tabel 17 Compararea indicilor calculai pentru cele dou genuri
Nr.
crt.
Indici fenotipici
Cyprinus
Carassius
Indice de profil
2,25
2,66
Indice de
circumferin
1,22
1,04
Coeficient Fulton
3,18
6,84
Dup cum s-a precizat n capitolul anterior, s-a folosit un marker molecular de
100pb pentru determinarea lungimilor fragmentelor amplificate. De asemenea, rolul
controlului negativ (C-), este de determinare a eventualelor contaminri.
Pentru a doua parte a citocromului b (cyt b) n cazul speciilor aceluiai gen, s-au
obinut fragmente cu lungimi de aproximativ 800pb (Figura 25).
83
n cazul speciilor genului Carassius gibelio Bloch, dup cum a fost precizat i n
capitolul anterior, amplificarea citocromului b a avut loc ntr-o singur etap,
obinndu-se un segment de aproximativ 1200pb (Figura 26).
Potrivit datelor furnizate de banca de gene (GenBank din cadrul NCBI National
Center for Biotechnology Information), lungimea total a citocromului b la ambele
genuri studiate, este de aproximativ 1140pb. Rezultatele obinute de noi n urma
clonrii acestei gene, dup cum reiese din figurile anterioare, nu corespund acestor
date, deoarece segmentele amplificate includ secvenele primerilor i fragmente din
secvenele genelor limitrofe, deoarece primerii utilizai, n majoritatea cazurilor se
aliniaz n aceste zone.
84
La Carassius gibelio, pentru toi indivizii analizai, n urma amplificrii d-loop, s-au
obinut fragmente cu lungimi de aproximativ 300pb (Figura 28), datorit poziiei
primerilor utilizai, care determin amplificarea doar a primului segment hipervariabil al
acestei gene.
85
86
87
Tabel 18 Estimarea cantitilor de ADN necesare secvenierii primei pri a cyt b, pentru
indivizi ai genului Cyprinus
Nr.
Concentraia ADN
Cantitatea de
Banda
fmol
prob
(ng/ul)
ADN (l)
Cy01I
533
5,9
4
71,5
Cy02I
500
5,6
4,5
76,3
Cy03I
1/2x200
1,1
7,6
25
Cy04I
500
5,6
4
67,8
Cy05I
0,8x500
4,48
5
67,5
Cy06I
533
5,9
4
71,5
Cy07I
500
5,6
4
67,8
Cy08I
533
5,6
4
71,5
Cy09I
533
5,9
4
71,5
Cy10I
0,8x500
4,48
5
67,8
Cy01M
533
5,6
4
71,5
Cy02M
533
5,9
4
71,5
Cy03M
533
5,6
4
71,5
Cy04M
533
5,9
4
71,5
Cy05M
0,8x500
4,48
5
67,8
Cy06M
0,8x500
4,48
5
67,8
Cy07M
500
5,6
4
67,8
Cy08M
500
5,6
4
67,8
Cy09M
500
5,6
4
67,8
Cy10M
500
5,6
4
67,8
88
Tabel 19 Estimarea cantitilor de ADN necesare secvenierii cyt b a doua parte, pentru
indivizi ai genului Cyprinus
Nr.
prob
Banda
Concentraia
ADN (ng/ul)
Cantitatea de
ADN (l)
fmol
Cy01I
Cy02I
Cy03I
Cy04I
Cy05I
Cy06I
Cy07I
Cy08I
Cy09I
Cy10I
Cy01M
Cy02M
Cy03M
Cy04M
Cy05M
Cy06M
Cy07M
Cy08M
Cy09M
Cy10M
533
1,8x726/713
1,8x726/713
1,5x726/713
1,8x726/713
1,8x726/713
2x726/713
1,8x726/713
1,8x726/713
1,3x726/713
427/417/413
1,8x726/713
1,8x726/713
0,5x200
1,8x726/713
1,8x726/713
1,8x726/713
1,8x726/713
1,8x726/713
427/417/413
5,94
28,8
28,8
24
28,8
28,8
32,0
28,8
28,8
28,8
14
28,8
28,8
1,1
28,8
28,8
28,8
28,8
28,8
14
6
1,5
1,5
1,5
1,5
1,5
1
1,5
1,5
1,5
3
1,5
1,5
7,5
1,5
1,5
1,5
1,5
1,5
3
67,5
81,8
81,8
68,18
81,8
81,8
60,6
81,8
81,8
81,8
79,54
81,8
81,8
15,6
81,8
81,8
81,8
81,8
81,8
79,54
89
Se observ c, doar n cazul unui singur individ (Cy04M) nu s-a obinut cantitatea
de ADN dorit pentru reacia de secveniere, cu toate c este posibil ca aceasta s
decurg normal.
Tabel 20 Estimarea cantitilor de ADN necesare secvenierii cyt b pentru indivizi ai
genului Carassius
Nr.
prob
Banda
Concentraia
ADN (ng/ul)
Cantitatea de
ADN (l)
fmol
Ca01I
Ca02I
Ca03I
Ca04I
Ca05I
Ca06I
Ca07I
Ca08I
Ca09I
Ca10I
Ca01M
Ca02M
Ca03M
Ca04M
Ca05M
Ca06M
Ca07M
Ca08M
Ca09M
Ca10M
427/417/413
0,7x427/417/413
0,7x427/417/413
427/417/413
427/417/413
726/713
726/713
427/417/413
427/417/413
427/417/413
427/417/413
726/713
427/417/413
427/417/413
427/417/413
427/417/413
427/417/413
427/417/413
427/417/413
0,7x427/417/413
14
9,8
9,8
14
14
16
16
14
14
14
14
16
14
14
14
14
14
14
14
9,8
2
3
3
2
2
1,55
1,55
2
2
2
2
1,55
2
2
2
2
2
2
2
3
70,7
74,2
74,2
70,7
70,7
60,6
60,6
70,7
70,7
70,7
70,7
60,6
70,7
70,7
70,7
70,7
70,7
70,7
70,7
74,2
n acest caz, au fost obinute valori ale concentraiei de ADN, cuprinse ntre
60,6fmoli i 74,2fmoli ADN, ceea ce asigur un optim al cantitii de produs PCR
pentru reacia de secveniere.
Pentru d-loop la speciile genului Cyprinus, s-au calculat cantitile de ADN
necesar reaciei de secveniere, pe baza Figurii 34.
90
91
Banda
Concentraia
ADN (ng/ul)
Cantitatea
de ADN (l)
fmol
Ca01I
Ca02I
Ca03I
Ca04I
Ca05I
Ca06I
Ca07I
Ca08I
Ca09I
Ca10I
Ca01M
Ca02M
Ca03M
Ca04M
Ca05M
Ca06M
Ca07M
Ca08M
Ca09M
Ca10M
533
0,7x427/417/413
0,8x427/417/413
0,8x427/417/413
533
533
0,8x427/417/413
0,5x427/417/413
500
0,7x427/417/413
533
500
0,8x427/417/413
0,8x427/417/413
533
500
500
0,8x427/417/413
0,8x427/417/413
0,8x427/417/413
5,94
9,8
11,2
11,2
5,94
5,94
11,2
7
5,6
9,8
5,94
5,6
11,2
11,2
5,94
5,6
5,6
11,2
11,2
11,2
4
2,5
2
2
4
4
2
3,5
4,5
2,5
4
4,5
2
2
4
4,5
4,5
2
2
2
72
74,24
67,87
67,87
72
72
67,87
74,24
76,36
74,24
72
76,36
67,87
67,87
72
76,36
76,36
67,87
67,87
67,87
92
93
Banda
Concentraia
ADN (ng/ul)
Cantitatea de
ADN (l)
fmol
Cy01I
Cy02I
Cy03I
Cy04I
Cy05I
Cy06I
Cy07I
Cy08I
Cy09I
Cy10I
Cy01M
Cy02M
Cy03M
Cy04M
Cy05M
Cy06M
Cy07M
Cy08M
Cy09M
Cy10M
249
249
311
311
0,4x427/417/413
0,5x427/417/413
0,5x427/417/413
0,5x427/417/413
311
311
0,5x427/417/413
0,5x427/417/413
0,5x427/417/413
0,5x427/417/413
0,5x427/417/413
311
0,5x427/417/413
0,5x427/417/413
0,5x427/417/413
0,5x427/417/413
2,78
2,78
3,4
3,4
5,6
7
7
7
3,4
3,4
7
7
7
7
7
3,4
7
7
7
7
4,5
4,5
3,5
3,5
2,5
2
2
2
3,5
3,5
2
2
2
2
2
3,5
2
2
2
2
62,5
62,5
59,5
59,5
70
70
70
70
59,5
59,5
70
70
70
70
70
59,5
70
70
70
70
94
Banda
Concentraia
ADN (ng/ul)
Cantitatea de
ADN (l)
fmol
Ca01I
Ca02I
Ca03I
Ca04I
Ca05I
Ca06I
Ca07I
Ca08I
Ca09I
Ca10I
Ca01M
Ca02M
Ca03M
Ca04M
Ca05M
Ca06M
Ca07M
Ca08M
Ca09M
Ca10M
0,7x427/417/413
0,8x427/417/413
0,8x427/417/413
0,7x427/417/413
0,7x427/417/413
0,8x427/417/413
0,7x427/417/413
0,7x249
0,7x249
0,5x249
0,7x427/417/413
0,7x427/417/413
0,7x427/417/413
0,7x427/417/413
0,7x427/417/413
0,7x427/417/413
0,8x427/417/413
0,8x427/417/413
0,8x427/417/413
0,7x427/417/413
9,8
11,2
11,2
9,8
9,8
11,2
9,8
1,94
1,94
1,39
9,8
9,8
9,8
9,8
9,8
9,8
11,2
11,2
11,2
9,8
1,5
1,5
1,5
1,5
1,5
1,5
1,5
7,5
7,5
7,5
1,5
1,5
1,5
1,5
1,5
1,5
1,5
1,5
1,5
1,5
73,5
84
84
73,5
73,5
84
73,5
72,75
72,75
52,12
73,5
73,5
73,5
73,5
73,5
73,5
84
84
84
73,5
95
96
Procent de divergen
Cy01I
Cy01I
Cy04I
Cy0104M
Cy03M
Cy06M
99,9
99,9
99,9
98,9
Cy01I
99,8
99,8
98,9
Cy04I
99,8
98,9
Cy03M
98,9
Cy0104M
Cy04I
0,1
Cy03M
0,1
0,2
Cy0104M
0,1
0,2
0,2
Cy06M
1,1
1,2
1,2
1,2
Cy01I
Cy04I
Cy0104M
Cy03M
Cy06M
Cy06M
n plus, pentru a stabili o mai clar difereniere ntre toate noile haplotipuri, au fost
analizate numrul i procentele n care se gsesc bazele azotate n fiecare dintre
acestea (Tabel 26).
Tabel 26 Procentul bazelor azotate, n cadrul haplotipurilor stabilite
Baze
azotate
A
G
T
C
A+T
C+G
Specii analizate
Cy01I
Cy04I
Cy0104M
Cy03M
Cy06M
Nr.
350
349
349
350
347
30,70
30,60
30,60
30,70
30,44
Nr.
155
155
156
156
159
13,60
13,60
13,68
13,68
13,95
Nr.
295
297
295
294
293
25,88
26,0
25,88
25,79
25,70
Nr.
340
340
340
340
341
29,82
20,80
29,82
29,82
29,91
Nr.
645
645
644
644
640
56,58
56,58
56,49
56,49
56,14
Nr.
495
495
496
496
500
43,42
43,42
43,51
43,51
43,86
97
%
35
30
25
20
15
10
0
Cy01I
Cy04I
Cy0104M
Cy03M
Cy06M
Haplotip
A
35
30
25
20
15
10
0
A
Baze azotate
Cy01I
Cy04I
Cy0104M
Cy03M
Cy06M
Referitor la cantitatea de adenin (A), aceasta este egal pentru Cy01I i Cy03M
(30,70%) i pentru haplotipurile Cy04I Cy0104M (30,60%). Cantitatea de guanin
este aproximativ egal pentru toate haplotipurile, fiind cuprins ntre 13,60% (Cy01I i
Cy04I) i 13,68% pentru Cy0104M i Cy03M. De asemeni, se constat diferene i
pentru celelalte baze azotate: timina se gsete n proporie de 25,88% pentru Cy01I,
Cy0104M, avnd valori diferite pentru celelalte haplotipuri, iar citozina, n proporii
aproximativ egale pentru toate haplotipurile.
Procentul de baze complementare este de 56,58% n cazul A+T pentru primele
dou haplotipuri i 56,49% pentru Cy0104M i Cy03M, pentru Cy06M fiind de 56,14%.
Procentul de G+C este de 43,42% pentru primele dou haplotipuri (Cy01I, Cy04I), de
43,51% pentru (Cy0104M, Cy03M) i 43,86% pentru Cy06M.
4.5.1. CARACTERIZAREA HAPLOTIPULUI CY01I
4.5.1.1. FRECVENELE TIPURILOR DE ASOCIERI NUCLEOTIDICE
n aceast categorie au fost ncadrate toate secvenele ntre care nu exist
diferene (Cy01I, Cy02I, Cy03I, Cy05I, Cy06I, Cy07I, Cy08I, Cy09I, Cy10I, Cy02M,
Cy05M, Cy07M, Cy08M, Cy09M, Cy10M), aparinnd celor dou populaii luate n
studiu.
Referitor la procentele dinucleotidelor, constatm, c valoarea cea mai mare o are
perechea AC (10,3%), iar valoarea cea mai mic perechea GG, n proporie de 2,3%.
Referitor la trinucleotide, cea mai mare frecven o nregistreaz tripletul CAT (3,9%),
iar valoarea cea mai mic, tripletele GGG i GCG, ambele avnd o frecven de 0,2%.
Tetramerii cu frecvena cea mai mare, sunt ACTA (1,6%), iar cei cu frecven
redus: TCTC, CTCA, ATAC, ACCC, toi n procent de 1,0%. n cazul pentamerilor,
cea mai mare frecven o are pentamerul TCCTA (0,9%), iar cea mai mic frecven,
o au TTCCT, TACCA, CTCCT, CTCAT i CTAGT (0,4%). n ceea ce privete
hexamerii, acetia au frecvene cuprinse ntre 0,3% i 0,4%.
Tetramerii, pentamerii i hexamerii cu frecven joas, sunt cei care se gsesc
ntr-un singur exemplar n ntreaga gen, avnd o frecven de 0,1%.
Cu ajutorul modulului EditSeq al DNA Star, a fost calculat temperatura de topire
a ADN, dup un model Davis-Botstein-Roth; n acest caz, prezint o valoare de
82,26C.
4.5.1.2. TRANSLAIA I CARACTERIZAREA CATENEI POLIPEPTIDICE
Translaia s-a realizat pe baza unui cod genetic mitocondrial pentru vertebrate,
utiliznd modulul EditSeq din cadrul programului DNA Star.
Catena polipeptidic obinut este prezentat n Figura 40.
99
MASLRKTHPL
LAMHYTSDIS
GLYYGSYLYK
SAVPYMGDML
HETGSNNPIG
GDPENFTPAN
LMVVPLLHTS
IKIANDALVD
TAFSSVTHIC
ETWNIGVILL
VQWIWGGFSV
LNSDADKVSF
PLVTPPHIKP
KQRGLTFRPI
ASSYSPHSHY
LPTPSNISAW
RDVNYGWLIR
LLVMMTAFVG
DNATLTRFFA
HPYFSYKDLL
EWYFLFAYAI
TQFLFWTLVA
A.RC.MAMTA
WNFGSLLGLC
NVHANGASFF
YVLPWGQMSF
FHFLLPFVIT
GFVIMLLALT
LRSIPNKLGG
DMIILTWIGG
MLQNKALKWA
LITQILTGLF
FICIYMHIAR
WGATVITNLL
AATIIHLLFL
LLALFSPNLL
VLALLFSILV
MPVEHLIMWH
Aminoacizi
Simbol
Nume
A
Ala
C
Cys
D
Asp
E
Glu
F
Phe
G
Gly
H
His
I
Ile
K
Lys
L
Leu
M
Met
N
Asn
P
Pro
Q
Gln
R
Arg
S
Ser
T
Thr
V
Val
W
Trp
Y
Tyr
B
Asx
Z
Glx
.
Ter
Frecvena
(%)
7,94
1,06
2,91
1,32
6,88
6,08
3,97
7,67
2,65
15,08
4,23
4,50
5,29
1,59
2,38
6,61
6,61
5,82
3,44
3,97
0,00
0,00
0,53
100
(Daltoni)
42592,56
Aminoacizi
Numr de
aminoaciz
i
Puterni
c bazici
Puterni
c acizi
Hidrofob
i
Polar
i
Punct
izoelectri
c
378
19
16
177
92
8,423
Sarcina
electric
la
pH=7
5,279
Concentrai
a la o
extincie =1
i =280nm
0,45
comparativ pentru cele dou metode, se constat c pentru ambele metode (Garnier
Robson i Chou-Fasman) sunt date 22 astfel de regiuni, cu diferena c n cazul celei
de-a doua, sunt prezentate ca regiuni cu suprafee mai mari.
Pe baza graficului hidrofobicitii realizat dup un model Kyte-Doolitle (Kyte i
Doolittle, 1982), se constat c exist 15 zone hidrofobe i 13 zone hidrofile.
Din graficul indexului antigenic calculat pe baza modelului Jameson Wolf
(Jameson i Wolf, 1988), se constat existena a 23 de regiuni cu potenial antigenic.
4.5.2. CARACTERIZAREA HAPLOTIPULUI CY04I
4.5.2.1. FRECVENELE TIPURILOR DE ASOCIERI NUCLEOTIDICE
n acest haplotip intr o singur secven care difer de haplotipul general prin
existena unei transversii (substituia adeninei de ctre timin) n poziia 432.
Referitor la procentele dinucleotidelor constatm, c valoarea cea mai mare o are
perechea AC (10,3%), iar valoarea cea mai mic perechea GG, n proporie de 2,3%.
n cazul trinucleotidelor, cea mai mare frecven o nregistreaz tripletul CAT (3,9%),
iar valoarea cea mai mic, tripletele GGG i GCG, ambele avnd o frecven de 0,2%.
Tetramerii cu frecvena cea mai mare, sunt ACTA (1,6%), iar cei cu frecvena
redus: TCTC, CTCA, ATAC, ACCC, toi n procent de 1,0%. n cazul pentamerilor
(Tabelul 38), cea mai mare frecven o are pentamerul TCCTA (0,9%), iar cea mai
mic frecven, o au TTCCT, TACCA, CTCCT, CTCAT i CTAGT (0,4%). n ceea ce
privete hexamerii, acetia au frecvene cuprinse ntre 0,3% i 0,4%.
Tetramerii, pentamerii i hexamerii cu frecven joas, sunt cei care se gsesc
ntr-un singur exemplar n ntreaga gen, avnd o frecven de 0,1%.
Cu ajutorul modulului EditSeq al DNA Star, a fost calculat temperatura de topire
a secvenei de ADN, dup un model Davis-Botstein-Roth; n acest caz, prezint o
valoare de 82,26C.
4.5.2.2. TRANSLAIA I CARACTERIZAREA CATENEI POLIPEPTIDICE
Translaia s-a realizat pe baza codului genetic mitocondrial pentru vertebrate,
utiliznd modulul EditSeq din cadrul programului DNA Star (Figura 42).
MASLRKTHPL
LAMHYTSDIS
GLYYGSYLYK
SAVPYMGDML
HETGSNNPIG
GDPENFTPAN
LMVVPLLHTS
IKIANDALVD
TAFSSVTHIC
ETWNIGVILL
VQWIWGGFSV
LNSDADKVSF
PLVTPPHIKP
KQRGLTFRPI
ASSYSPHSHY
LPTPSNISAW
RDVNYGWLIR
LLVMMTAFVG
DNATLTRFFA
HPYFSYKDLL
EWYFLFAYAI
TQFLFWTLVA
A.RC.MAMTA
WNFGSLLGLC
NVHANGASFF
YVLPWGQMSF
FHFLLPFVIT
GFVIMLLALT
LRSIPNKLGG
DMIILTWIGG
MLQNKALKWA
LITQILTGLF
FICIYMHIAR
WGATVITNLL
AATIIHLLFL
LLALFSPNLL
VLALLFSILV
MPVEHLIMWH
existena a doi codoni stop (notai cu .) ctre sfritul lanului polipeptidic ceea ce
corespunde cu structura lanului polipeptidic al haplotipului anterior, de unde putem
concluziona c in cazul de fa, n poziia 432, s-a produs o mutaie nonsens, deci, o
mutaie care nu determin o modificare a aminoacidului.
Tabel 29 Compoziia lanului polipeptidic pentru haplotipul Cy04I
Aminoacizi
Simbol
Nume
A
C
D
E
F
G
H
I
K
L
M
N
P
Q
R
S
T
V
W
Y
B
Z
.
Ala
Cys
Asp
Glu
Phe
Gly
His
Ile
Lys
Leu
Met
Asn
Pro
Gln
Arg
Ser
Thr
Val
Trp
Tyr
Asx
Glx
Ter
Numr
Procent din
greutatea total (%)
Frecvena
(%)
30
4
11
5
26
23
15
29
10
57
16
17
20
6
9
25
25
22
13
15
0
0
2
5,01
0,97
2,97
1,52
8,98
3,08
4,83
7,70
3,01
15,14
4,93
4,55
4,56
1,80
3,30
5,11
5,93
5,12
5,68
5,75
0,00
0,00
0,00
7,94
1,06
2,91
1,32
6,88
6,08
3,97
7,67
2,65
15,08
4,23
4,50
5,29
1,59
2,38
6,61
6,61
5,82
3,44
3,97
0,00
0,00
0,53
Tetramerul cu frecvena cea mai mare, este ACTA (1,6%), iar cel cu frecvena
redus: TTCC n procent de 0,9%. n cazul pentamerilor, cea mai mare frecven o
are pentamerul TCCTA (0,9%), iar cea mai mic frecven, o au TTCCT, TACCA,
CTCCT, CTCAT i CTAGT (0,4%). n ceea ce privete hexamerii, acetia au frecvene
cuprinse ntre 0,3% i 0,4%.
Tetramerii, pentamerii i hexamerii cu frecven joas, sunt cei care se gsesc
ntr-un singur exemplar n ntreaga gen, avnd o frecven de 0,1%.
Cu ajutorul modulului EditSeq al DNA Star, a fost calculat temperatura de topire
a ADN, dup un model Davis-Botstein-Roth; n acest caz, prezint o valoare de
82,30C.
4.5.3.2. TRANSLAIA I CARACTERIZAREA CATENEI POLIPEPTIDICE
Translaia s-a realizat pe baza codului genetic mitocondrial pentru vertebrate,
utiliznd modulul EditSeq din cadrul programului DNA Star (Figura 43).
MASLRKTHPL
LAMHYTSDIS
GLYYGSYLYK
SAVPYMGDML
HETGSNNPIG
GDPENFTPAN
LMVVPLLHTS
IKIANDALVD
TAFSSVTHIC
ETWNIGVILL
VQWIWGGFSV
LNSDADKVSF
PLVTPPHIKP
KQRGLTFRPI
ASSYSPHSHY
LPTPSNISAW
RDVNYGWLIR
LLVMMTAFVG
DNATLTRFFA
HPYFSYKDLL
EWYFLFAYAI
TQFLFWTLVA
A.RC.MAMTA
WNFGSLLGLC
NVHANGASFF
YVLPWGQMSF
FHFLLPFVIT
GFVIMLLALT
LRSIPNKLGG
DMIILTWIGG
MLQNKALKWA
LITQILTGLF
FICIYMHIAR
WGATVITNLL
AATIIHLLFL
LLALFSPNLL
VLALLFSILV
MPVEHLIMWH
104
105
IKIANDALVD
TAFSSVTHIC
ETWNIGVILL
VQWIWGGFSV
LNSDADKVSF
PLVTPPHIKP
KQRGLTFRPI
ASSYSPHSHY
LPTPSNISAW
RDVNYGWLIR
LLVMMTAFVG
DNATLTRFFA
HPYFSYKDLL
EWYFLFAYAI
TQFLFWTLVA
A.RC.MAMTA
WNFGSLLGLC
NVHANGASFF
YVLPWGQMSF
FHFLLPFVIT
GFVIMLLALT
LRSIPNKLGG
DMIILTWIGG
MLQNKALKWA
LITQILTGLF
FICIYMHIAR
WGATVITNLL
AATIIHLLFL
LLALFSPNLL
VLALLFSILV
MPVEHLIMWH
106
IKIANDALVD
TAFSSVTHIC
ETWNIGVVLL
VQWIWGGFSV
LNSDADKVSF
PLVTPPHIKP
KQRGLTFRPI
ASSYSPHSHY
LPTPSNISAW
RDVNYGWLIR
LLVMMTAFVG
DNATLTRFFA
HPYFSYKDLL
EWYFLFAYAI
TQFLFWTLVA
A.RC.MAMTA
WNFGSLLGLC
NVHANGASFF
YVLPWGQMSF
FHFLLPFVIA
GFVIMLLALT
LRSIPNKLGG
DMIILTWIGG
MLQNKALKWA
LITQILTGLF
FICIYMHIAR
WGATVITNLL
AATIIHLLFL
LLALFSPNLL
VLALLFSILV
MPVEHLIMWH
107
Aminoacizi
Simbol
Frecvena
(%)
Ala
31
5,18
8,20
C
D
E
F
G
H
I
K
L
M
N
P
Q
R
S
T
V
W
Y
B
.
Cys
Asp
Glu
Phe
Gly
His
Ile
Lys
Leu
Met
Asn
Pro
Gln
Arg
Ser
Thr
Val
Trp
Tyr
Asx
Ter
4
11
5
26
23
15
28
10
57
16
17
20
6
9
25
24
23
13
15
0
2
0,97
2,98
1,52
8,99
3,08
4,83
7,45
3,01
15,16
4,93
4,56
4,57
1,81
3,30
5,12
5,70
5,36
5,69
5,57
0,00
0,00
1,06
2,91
1,32
6,88
6,08
3,97
7,41
2,65
15,08
4,23
4,50
5,29
1,59
2,38
6,61
6,35
6,08
3,44
3,97
0,00
0,53
Greutate
molecula
r
(Daltoni)
Numr
de
aminoaci
zi
42548,51
378
19
16
178
91
8,423
Sarcin
a
electric
la
pH=7
5,279
Concentra
ia la o
extincie
=1
i
=280nm
0,45
108
109
Cy09M
Cy10M
Cy08M
Cy07M
Cy05M
Cy02M
Cy10I
Cy09I
Cy08I
Cy07I
Cy06I
Cy05I
Cy03I
Cy02I
Cy01I
Cy03M
Cy04I
Cy01M
Cy04M
Cy06M
0.001
110
6M
Cy1
0M
Cy09M
C y0
M
04
Cy
08
Cy
Cy
C y04
M
07
Cy
01
M
5M
Cy0
Cy02M
Cy03M
C y0
Cy1
0I
1I
Cy
0
2I
9I
0
Cy
C y0
Cy06I
7
Cy0
5I
8I
Cy
03
I
0
Cy
Figura 48 Arbore filogenetic circular al genului Cyprinus, realizat prin metoda UPGMA pe
baza secvenelor citocromului B
111
Cy01M
Cy04M
Cy05M
Cy04I
Cy08I
Cy03M
Cy03I
Cy02I
Cy06I
Cy09I
Cy10I
Cy05I
Cy01I
Cy07I
Cy02M
Cy07M
Cy08M
Cy09M
Cy10M
Cy06M
0.001
Se observ c exist o similaritate ntre cele dou tipuri de arbori realizai prin
metode diferite.
Nu a fost folosit metoda maximum parsimony n acest caz, deoarece diversitatea
taxonilor este sczut, ceea ce poate duce la o cretere a probabilitii de apariie a
erorilor.
112
Procent de divergen
Cy01I
Cy01I
Cy01M
Cy05M
Cy06M
Cy GB
99,7
99,7
68,7
99,7
Cy01I
99,5
69,0
100
Cy01M
69,0
99,5
Cy05M
69,0
Cy06M
Cy01M
0,3
Cy05M
0,3
0,5
Cy06M
40,6
40,2
40,2
Cy GB
0,3
0,0
0,5
40,2
Cy01I
Cy01M
Cy05M
Cy06M
Cy GB
Cy GB
n plus, pentru a stabili o mai clar difereniere ntre toate noile haplotipuri, au fost
analizate numrul i procentele n care se gsesc bazele azotate n fiecare dintre
acestea (Tabel 35).
113
Cy01M
Specii analizate
Cy05M
Cy06M
Cy GB
Nr.
%
145
36,90
145
36,90
146
37,15
143
36,39
145
36,90
Nr.
%
54
13,74
54
13,74
53
13,49
55
13,99
54
13,74
Nr.
%
129
32,82
130
33,08
129
32,82
131
33,33
130
33,08
Nr.
65
64
65
64
64
Baze
azotate
16,54
16,28
16,54
16,28
16,28
A+T
Nr.
%
274
69,72
275
69,97
275
69,97
274
69,72
275
69,97
C+G
Nr.
%
119
30,28
118
30,03
118
30,03
119
30,28
118
30,03
40
35
30
25
20
15
10
0
Cy01I
Cy01M
Cy05M
Cy06M
Cy GB
Haplotip
A
114
%
40
35
30
25
20
15
10
0
A
Baze azotate
Cy01I
Cy01M
Cy05M
Cy06M
Cy GB
n acest caz, ntre ARNm din haplotipul general pentru cele dou populaii i cel al
prezentei secvene de ADN const n existena uracilului n locul citozinei.
De asemenea, se constat ca i n cazul precedent, c structura secundar a
ARNm prezint 31 de poriuni monocatenare i 14 regiuni bicatenare.
4.6.3. CARACTERIZAREA HAPLOTIPULUI CY05M
4.6.3.1. FRECVENELE TIPURILOR DE ASOCIERI NUCLEOTIDICE
n acest haplotip, se ncadreaz o singur secven Cy05M din populaia LargaJijia Mrgineni, caracteristic unui individ de tip slbatic aparinnd speciei Cyprinus
carpio. Diferena dintre acest haplotip i cel general al celor dou populaii, const n
substituia guaninei de ctre adenin, printr-un proces de tranziie, n poziia 285.
Referitor la procentele dinucleotidelor constatm c valoarea cea mai mare o are
perechea AT (14,5%), iar valoarea cea mai mic perechea GC, n proporie de 1,8%;
i n acest caz fiind absente dinucleotidele de tip CG.
Cea mai mare frecven o nregistreaz tripletul TAT (6,6%), iar valoarea cea mai
mic, tripletele GTC i TGC, ambele avnd o frecven de 0,3%.
Tetramerul cu frecvena cea mai mare, este TATT (3,6%), iar cel cu frecvena
redus TTTT (1,0%). n cazul pentamerilor, cea mai mare frecven o are pentamerul
TATTA (2,8%), iar cea mai mic frecven, o au TTAAT, TATTT, TATAT, TAGTA,
TAATC I TAATA, toi cu o frecven de 0,8%. n ceea ce privete hexamerii, acetia
au frecvene cuprinse ntre 0,5% i 1,5%.
Tetramerii, pentamerii i hexamerii cu frecven joas, sunt cei care se gsesc
ntr-un singur exemplar n ntreaga gen, avnd o frecven de 0,3%.
Cu ajutorul modulului EditSeq al DNA Star, a fost calculat temperatura de topire
a ADN, dup un model Davis-Botstein-Roth; n acest caz, prezint o valoare de
75,94C.
4.6.4. CARACTERIZAREA HAPLOTIPULUI CY06MD
4.6.4.1. FRECVENELE TIPURILOR DE ASOCIERI NUCLEOTIDICE
117
Din analiza procentelor dinucleotidelor constatm c valoarea cea mai mare o are
perechea AT (14,3%), iar valoarea cea mai mic perechea GC, n proporie de 1,8%;
i n acest caz fiind absente dinucleotidele de tip CG.
Referitor la trinucleotide, cea mai mare frecven o nregistreaz tripletul TAT
(6,6%), iar valoarea cea mai mic, tripletele GTC i GAT, ambele avnd o frecven
de 0,3%.
Tetramerul cu frecvena cea mai mare, este TATT (3,6%), iar cei cu frecven
redus TTTT, TGAA, TCAA (1,0%). n cazul pentamerilor, cea mai mare frecven o
are pentamerul TATTA (2,8%), iar cea mai mic frecven, o au TTAAT, TATTT,
TATAT, TAGTA, TAATA, TAAAG, GTACA, GCATA i CATAT, toi cu o frecven de
0,8%. n ceea ce privete hexamerii, acetia au frecvene cuprinse ntre 0,5% i 1,5%.
Tetramerii, pentamerii i hexamerii cu frecven joas, sunt cei care se gsesc
ntr-un singur exemplar n ntreaga gen, avnd o frecven de 0,3%.
Cu ajutorul modulului EditSeq al DNA Star, a fost calculat temperatura de topire
a ADN, dup un model Davis-Botstein-Roth; n acest caz, prezint o valoare de
76,04C.
4.6.5. RELAII FILOGENETICE N CADRUL GENULUI CYPRINUS, BAZATE PE
DIFERENE ALE SECVENELOR D-LOOP
Ca i n cazul citocromului b, au fost utilizate metode care se bazeaz pe distane
i rata de substituie, dar care implic i mutaii de genul tranziiilor i transversiilor.
Astfel i n acest caz au fost utilizate UPGMA (Figura 52) pe baza unui model TamuraNei, metoda evoluiei minime (ME) dup un algoritm Neighbour-Joining (Figura 53) i
Maximum-Parsimony (Figura 54).
118
Cy09M
Cy10M
Cy08M
Cy07M
Cy04M
Cy03M
Cy02M
Cy10I
Cy09I
Cy08I
Cy07I
Cy06I
Cy05I
Cy04I
Cy03I
Cy02I
Cy01I
Cy01M
Cy GB
Cy05M
Cy06M
0.002
119
Cy01M
Cy GB
Cy05M
Cy09I
Cy07I
Cy05I
Cy03I
Cy01I
Cy02I
Cy04I
Cy06I
Cy08I
Cy10I
Cy02M
Cy03M
Cy04M
Cy07M
Cy08M
Cy09M
Cy10M
Cy06M
0.002
Din cele dou figuri, se observ c i n acest caz, Cy06M provine dintr-un nod
comun ancestral, din care provin i ramurile comune pentru celelalte secvene. De
asemenea, se observ c secvenele Cy01M i Cy GB, provin dintr-un ram comun,
din care provine i ramul pentru Cy05M.
Ulterior, a fost construit un arbore filogenetic bazat pe metoda Maximum
Parsimony (MP) (Figura 54). Din acesta, se poate observa c secvena Cy06M a
urmat o linie evolutiv monofiletic dintr-o specie ancestral. De asemenea, se
constat c secvenele Cy01I i Cy02I, precum i Cy01M, CyGB, au evoluat din
noduri comune.
120
Cy07I
Cy02M
Cy05M
Cy07M
Cy09M
Cy05I
Cy09I
Cy03M
Cy02I
Cy01I
Cy04M
Cy08I
Cy10M
Cy08M
Cy04I
Cy06I
Cy10I
Cy03I
Cy01M
Cy GB
Cy06M
Figura 54 Arbore filogenetic al genului Cyprinus, realizat prin metoda MP
pe baza secvenelor d-loop
Procent de divergen
Procent de similaritate
Cy01I
Cy01I
Cy01M
Cy GB
100
98,9
Cy01I
98,9
Cy01M
Cy01M
0,0
Cy GB
1,2
1,2
Cy01I
Cy01M
Cy GB
Cy GB
n plus, pentru a stabili o mai clar difereniere ntre toate noile haplotipuri, au fost
analizate numrul i procentele n care se gsesc bazele azotate n fiecare dintre
acestea (Tabel 37).
Tabel 37 Procentul bazelor azotate, n cadrul haplotipurilor stabilite
Specii analizate
Baze azotate
Cy01I
Cy01M
Cy GB
Nr.
63
63
65
A
%
24,14
24,14
24,90
Nr.
44
44
43
G
%
16,86
16,86
16,48
Nr.
74
74
75
T
%
28,35
28,35
28,74
Nr.
80
80
78
C
%
30,65
30,65
29,89
Nr.
137
137
140
A+T
%
52,49
52,49
53,64
Nr.
124
124
121
C+G
%
47,51
47,51
46,36
122
Din Tabelul 37 i Figurile 55 i 56, dup cum a fost precizat i anterior, se observ
c diferene majore se constat pentru secvena Cy GB, care prezint valori diferite
pentru toate bazele azotate, comparativ cu celelalte haplotipuri.
%
35
30
25
20
15
10
0
Cy01I
Cy01M
Cy GB
Haplotip
A
35
30
25
20
15
10
0
A
Baze azotate
Cy01I
Cy01M
Cy GB
Referitor la cantitatea de adenin (A), aceasta este egal pentru Cy01I i Cy01M,
fiind n proporie de 24,14%, iar pentru Cy GB, n proporie de 24,90%. Cantitatea de
guanin este cuprins ntre 16,86% (Cy01I, Cy01M) i 16,48% pentru Cy GB. De
asemeni, se constat diferene i pentru celelalte baze azotate: cantitatea de timin
123
are valori de 28,35% pentru haplotipul general i 28,74% pentru Cy GB, iar citozina,
30,65% pentru Cy01I (ca reprezentant al haplotipului general caracteristic celor dou
populaii) i 29,89% pentru haplotipul Cy GB.
Procentul de baze complementare este de 52,49% n cazul A+T pentru Cy01I i
53,64% pentru Cy GB. Procentul de G+C este de 47,51% (Cy01I, Cy01M) i de
46,36% pentru Cy GB.
4.7.1. CARACTERIZAREA HAPLOTIPULUI CY01IM
4.7.1.1. FRECVENELE TIPURILOR DE ASOCIERI NUCLEOTIDICE
n acest haplotip, au fost ncadrate toate secvenele, deoarece procentele de
similaritate sunt de 100%.
Din analiza procentelor dinucleotidelor, s-a constatat c valoarea cea mai mare o
are perechea CT (10.3%), iar valoarea cea mai mic perechea GT, n proporie de
2,3%.
Referitor la trinucleotide, cea mai mare frecven o nregistreaz tripletul CTA
(4,6%), iar valoarea cea mai mic, tripletele ACG, AGA, AGT, ATC, CGT, GAG, GCG,
GTA, GTG i TCG, avnd o frecven de 0,4%.
Tetramerii cu frecvena cea mai mare, sunt TACT, CATT (2,3%), iar cei cu
frecvena cea mai mic TTTT, TTTA, TTCA, TGCT, GCTA, GCAT, CTTT, CTCA,
CTAT n procent de 1,2%. n cazul pentamerilor, cea mai mare frecven o are
pentamerul CTACT (1,5%). n ceea ce privete hexamerii, acetia au frecvene
cuprinse ntre 1,2% (AGCATT) i 0,4%.
Tetramerii, pentamerii i hexamerii cu frecven joas, sunt cei care se gsesc
ntr-un singur exemplar n ntreaga gen, avnd o frecven de 0,4%.
Cu ajutorul modulului EditSeq al DNA Star, a fost calculat temperatura de topire
a ADN, dup un model Davis-Botstein-Roth; n acest caz, prezint o valoare de
82,46C.
4.7.1.2. TRANSLAIA I CARACTERIZAREA CATENEI POLIPEPTIDICE
Translaia s-a realizat pe baza codului genetic mitocondrial pentru vertebrate,
utiliznd modulul EditSeq din cadrul programului DNA Star.
Catena polipeptidic obinut este prezentat n Figura 57.
MTPVHFSFSS AFILGLMGLA FHRTHLLSAL LCLEGMMLSL
FIALALWALQ FESTGFSTAP MLLLAFSACE ASTGLALLVA ARTHGT
Figura 57 Catena polipeptidic a ND4L, caracteristic haplotipului Cy01IM
al speciei Cyprinus carpio
Aminoacizi
Simbol
Nume
Frecvena
(%)
Ala
13
9,99
14,94
C
D
E
F
G
H
I
K
L
M
N
P
Q
R
S
T
V
W
Y
B
Z
.
Cys
Asp
Glu
Phe
Gly
His
Ile
Lys
Leu
Met
Asn
Pro
Gln
Arg
Ser
Thr
Val
Trp
Tyr
Asx
Glx
Ter
2
0
3
8
6
4
2
0
19
5
0
2
1
2
9
8
2
1
0
0
0
0
2,23
0,00
4,19
12,73
3,70
5,93
2,45
0,00
23,25
7,09
0,00
2,10
1,39
3,38
8,48
8,75
2,14
2,01
0,00
0,00
0,00
0,00
2,30
0,00
3,45
9,20
6,90
4,60
2,30
0,00
21,84
5,75
0,00
2,30
1,15
2,30
10,34
9,20
2,30
1,15
0,00
0,00
0,00
0,00
Greutate
molecula
r
(Daltoni)
Numr
de
aminoaci
zi
9247,07
87
45
20
6,736
Sarcin
a
electric
la
pH=7
-0,479
Concentra
ia la o
extincie
=1
i
=280nm
1,56
125
126
Cy09M
Cy10M
Cy08M
Cy07M
Cy06M
Cy05M
Cy04M
Cy03M
Cy02M
Cy01M
Cy10I
Cy09I
Cy08I
Cy07I
Cy06I
Cy05I
Cy04I
Cy03I
Cy02I
Cy01I
Cy GB
0,001
127
Cy07I
Cy08I
Cy01I
Cy03I
Cy06M
Cy04M
Cy05I
Cy10I
Cy01M
Cy09M
Cy07M
Cy08M
Cy03M
Cy10M
Cy09I
Cy02I
Cy04I
Cy06I
Cy02M
Cy05M
Cy GB
128
Cy
01
I
GB
Cy0
8I
Cy07I
Cy
Cy
M
05
I
03
Cy
Cy
02
M
6M
Cy0
Cy0
6I
Cy04M
Cy04I
Cy05I
I
Cy02
Cy
Cy
I
09
10
I
M
09
Cy
03M
Cy
10
M
1M
y0
Cy
Cy07M
Cy08M
caz, este cea n care, hibridul obinut n urma ncrucirii Carassius auratus x
Cyprinus carpio este ncruciat cu o femel aparinnd speciei Carassius cuvieri, caz
n care, la nivel mitocondrial, va fi transmis doar ADN-ul provenit de la genitorul
matern.
innd cont de faptul c la Cyprinidae n general i la reprezentanii genului
Carassius n special, este ntlnit fenomenul de ginogenez i n aceste cazuri, este
posibil s fie doar fali hibrizi, adic indivizi ginogenetici. n acest caz, specia Cyprinus
carpio, nu a contribuit cu informaia sa genetic la formarea descendenilor, ci,
materialul seminal, a avut rol, doar de iniiere a diviziunii celulare.
Aceste dou exemple, demonstreaz nc o dat importana studiilor de genetic
i filogenie molecular n determinarea hibrizilor, a genitorilor acestora precum i a
sexului genitorilor.
Procent de divergen
1,8
CagIM
Y
1,6
Cag137I
M
6,5
Cacu
v
5,7
Caula
n
0,0
6,5
CaxC
y
CaxCy
x
Ccuv
Ccaras
Ccara
s
n plus, pentru a stabili o mai clar difereniere ntre toate noile haplotipuri, au fost
analizate numrul i procentele n care se gsesc bazele azotate n fiecare dintre
acestea (Tabel 41).
131
Specii analizate
Ccaras
Ccuv
Caulan
CagIMY
Cag137IM
CaxCy
CaxCyxCcuv
Nr,
%
198
28,95
199
29,09
202
29,53
194
28,36
198
28,95
202
29,53
194
28,36
Nr,
%
100
14,62
99
14,47
97
14,18
101
14,77
101
14,77
97
14,18
101
14,77
Nr,
%
203
29,68
203
29,68
200
29,24
205
29,97
198
28,95
200
29,24
205
29,97
Nr,
%
183
26,75
183
26,75
185
27,05
184
26,90
187
27,34
185
27,05
184
26,90
Nr,
%
Nr,
%
401
58,63
283
41,37
402
58,77
282
41,23
402
58,77
282
41,23
399
58,33
285
41,67
396
57,89
288
42,11
402
58,77
282
41,23
399
58,33
285
41,67
A+T
C+G
30
25
20
15
10
0
CagIMY
Cag137IM
Ccaras
Ccuv
Caulan
CaxCy
CaxCyxCcuv
Haplotip
A
132
30
25
20
15
10
0
A
Baze azotate
CagIMY
Cag137IM
Ccaras
Ccuv
Caulan
CaxCy
CaxCyxCcuv
134
Ala
Cys
Asp
Glu
Phe
Gly
His
Ile
Lys
Leu
Met
Asn
Pro
Gln
Arg
Ser
Thr
Val
Trp
Tyr
Asx
Glx
Ter
18
3
9
2
17
16
9
20
5
29
8
12
8
3
5
17
13
15
8
11
0
0
0
4,98
1,21
4,04
1,01
9,75
3,56
4,81
8,82
2,50
12,79
4,09
5,33
3,03
1,50
3,04
5,77
5,91
5,02
5,80
6,99
0,00
0,00
0,00
Greutate
molecula
r
(Daltoni)
Numr
de
aminoaci
zi
25666,07
228
10
11
Frecvena
(%)
105
61
7,098
7,89
1,32
3,95
0,88
7,46
7,02
3,95
8,77
2,19
12,72
3,51
5,26
3,51
1,32
2,19
7,46
6,58
5,70
3,51
4,82
0,00
0,00
0,00
Sarcin
a
electric
la
pH=7
0,311
Concentra
ia la o
extincie
=1
i
=280nm
0,43
135
Ulterior, a fost realizat o analiz a structurii proteinei (Figura 98); astfel, au fost
determinate zonele alfa helicoidale, beta pliate i de inflexiune, prin dou metode
Garnier-Robson (Garnier et al., 1978) i Chou-Fasman (Chou i Fasman, 1978);
reprezentarea grafic a zonelor hidrofobe (Kyte i Doolittle, 1982), zonele de flexie
(Karplus i Schultz, 1985), indexul antigenic (Jameson i Wolf, 1988) i graficul
probabil al suprafeei (Emini et al., 1985).
Din analiza structurii lanului polipeptidic, se poate observa c referitor la regiunile
alfa helicoidale, exist diferene ntre cele dou metode Garnier-Robson i ChouFasman. Astfel, n cazul primei metode, se observ c exist 9 regiuni alfa helicoidale,
n timp ce, potrivit celei de-a doua metode, exist doar 4, cu 3 puncte de suprapunere
ale suprafeelor. De asemenea, pentru regiunile beta pliate, se observ c exist o
similaritate relativ ntre cele dou metode, comparativ cu regiunile alfa, n ceea ce
privete suprafaa acestor zone. Pentru determinarea efectuat prin prima metod, se
constat existena a 18 regiuni beta pliate, n timp ce, pentru cea de-a doua metod
(Chou-Fasman), sunt considerate ca existnd 7 astfel de regiuni. Referitor la zonele
de inflexiune, de asemenea, comparativ pentru cele dou metode, se constat c
pentru prima metod (GarnierRobson) sunt prezentate 14 regiuni, iar prin a doua
metod (Chou-Fasman) sunt date 12 astfel de regiuni, cu precizarea c n cazul celei
de-a doua, sunt prezentate ca regiuni cu suprafee mai mari.
Pe baza graficului hidrofobicitii, realizat dup un model Kyte-Doolitle (Kyte i
Doolittle, 1982), se constat c exist 9 zone hidrofobe i 7 zone hidrofile.
Din graficul indexului antigenic calculat pe baza modelului Jameson Wolf
(Jameson i Wolf, 1988), se constat existena a 9 regiuni cu potenial antigenic.
136
LITQILTGLF
FICIYMHIAR
WGATVITNLL
AATVIHLLFL
leucina (15,08%), iar cea mai sczut o are cisteina (1,06%). Se constat de
asemenea, existena a doi codoni stop (notai cu .) ctre sfritul lanului polipeptidic.
Se constat c din totalul de 228 aminoacizi, 11 sunt acizi, 10 sunt bazici, 61
polari i 105 hidrofobi. De asemenea, se constat c lanul polipeptidic are o sarcin
electric de 0,31 (la pH=7) i un punct izoelectric de 7,09.
Tabel 44 Compoziia lanului polipeptidic
Procent din
Aminoacizi
Numr
greutatea total
Simbol
Nume
(%)
A
Ala
18
4,98
C
Cys
3
1,21
D
Asp
9
4,04
E
Glu
2
1,01
F
Phe
17
9,75
G
Gly
16
3,56
H
His
9
4,81
I
Ile
20
8,82
K
Lys
5
2,50
L
Leu
29
12,79
M
Met
8
4,09
N
Asn
12
5,33
P
Pro
8
3,03
Q
Gln
3
1,50
R
Arg
5
3,04
S
Ser
17
5,77
T
Thr
13
5,91
V
Val
15
5,02
W
Trp
8
5,80
Y
Tyr
11
6,99
B
Asx
0
0,00
Z
Glx
0
0,00
.
Ter
0
0,00
Frecvena
(%)
7,89
1,32
3,95
0,88
7,46
7,02
3,95
8,77
2,19
12,72
3,51
5,26
3,51
1,32
2,19
7,46
6,58
5,70
3,51
4,82
0,00
0,00
0,00
138
Cag09M
Cag10M
Cag08M
Cag07M
Cag06M
Cag05M
Cag04M
Cag02M
Cag01M
Cag10I
Cag09I
Cag08I
Cag06I
Cag05I
Cag04I
Cag03I
Cag02I
Cag01I
Cag07I
Cag03M
CaxCy
Ccaras
Caulan
Ccuv
CaxCyxCcuv
0.005
Astfel, prin metoda UPGMA bazat pe modelul Tamura Nei, care include
ambele tipuri de mutaii posibile (tranziii i transversii), a fost obinut un arbore
filogenetic (Figura 67), din care se observ c Cy06 deriv direct dintr-un nod comun
ancestral, din care deriv i braul comun al celorlalte secvene.
139
Cag08M
Cag09M
Cag07M
Cag06M
Cag05M
Cag04M
Cag02M
Cag01M
Cag10I
Cag09I
Cag08I
Cag06I
Cag05I
Cag04I
Cag03I
Cag02I
Cag10M
Cag01I
Cag07I
Cag03M
CaxCy
Ccaras
Caulan
Ccuv
CaxCyxCcuv
0.005
140
Ca
g0
6I
Ca
g0
4I
cuv
Ca
Cag0
9M
Cag05M
C
Cyx
Cax
uv
Cc
ul
an
g0
Ca
2I
Cc
ara
s
1
Cag
0I
C a xC
y
Cag08I
Cag03M
Cag07M
1I
C ag0
Cag
09I
03
C ag
Cag08M
0M
M
Cag06
g1
Ca
Ca
g0
4M
g
Ca
Ca
Ca
g0
2M
5I
g0
01M
Ca
7
g0
142
Procent de divergen
CagIMD
Cag25I
D
Cacu
v
Caula
n
CaxC
y
CaxCy
x
Ccuv
Ccara
s
99,6
91,1
74,3
73,1
91,1
73,1
CagIMD
90,7
73,9
72,7
90,7
72,7
Cag137I
M
70,2
69,0
100,0
69,0
Cacuv
94,7
70,2
94,7
Caulan
69,0
100,0
CaxCy
69,0
CaxCyx
Ccuv
Cag25I
D
0,4
Cacuv
9,7
10,2
Caulan
31,5
32,1
38,0
CaxCy
33,4
34,0
40,0
5,6
CaxCyx
Ccuv
9,7
10,2
0,0
38,0
40,0
Ccaras
33,4
34,0
40,0
5,6
0,0
40,0
CagIM
D
Cag25I
D
Cacu
v
Caula
n
CaxC
y
CaxCy
x
Ccuv
Ccaras
Ccara
s
143
Specii analizate
Ccaras Ccuv
Caulan
CagIMD
Cag25ID
CaxCy
CaxCyxCcuv
Nr,
%
91
36,99
91
36,99
91
37,45
94
38,21
91
37,45
91
37,45
94
38,21
Nr,
%
38
15,45
38
15,45
35
14,40
38
15,45
33
13,58
35
14,40
38
15,45
Nr,
%
77
31,30
76
30,89
74
30,45
73
29,67
74
30,45
74
30,45
73
29,67
Nr,
%
40
16,26
41
16,67
43
17,70
41
16,67
45
18,52
43
17,70
41
16,67
Nr,
%
Nr,
%
168
68,29
78
31,71
167
67,89
79
32,11
165
67,90
78
32,10
167
67,89
79
32,11
165
67,90
78
32,10
165
67,90
78
32,10
167
67,89
79
32,11
A+T
C+G
40
35
30
25
20
15
10
0
CagIMD
Cag25ID
Ccaras
Ccuv
Caulan
CaxCy
CaxCyxCcuv
Haplotip
A
144
40
35
30
25
20
15
10
0
A
Baze azotate
CagIMD
Cag25ID
Ccaras
Ccuv
Caulan
CaxCy
CaxCyxCcuv
Astfel i n acest caz, au fost utilizate UPGMA (Figura 72) pe baza unui model
Tamura-Nei, metoda evoluiei minime (ME) dup un algoritm Neighbour-Joining
(Figura 73) i Maximum Parsimony (Figura 74).
Cag09M
Cag10M
Cag08M
Cag07M
Cag06M
Cag05M
Cag04M
Cag03M
Cag02M
Cag01M
Cag10I
Cag09I
Cag08I
Cag07I
Cag06I
Cag04I
Cag03I
Cag01I
Cag02I
Cag05I
Ccaras
CaxCy
Caulan
Cacuv
CaxCyxCc
0.01
147
Cag02I
Cag05I
Cag10M
Cag09M
Cag08M
Cag07M
Cag06M
Cag01I
Cag03I
Cag04I
Cag06I
Cag07I
Cag08I
Cag09I
Cag10I
Cag01M
Cag02M
Cag03M
Cag04M
Cag05M
Ccaras
CaxCy
Caulan
Cacuv
CaxCyxCc
0.01
148
v
cu
Ca
g
08
Ca
g0
2
I
Cag1
0
Cag08I
Cc
Cyx
C ax
Ca
2
Ca
Ccara
Ca
xC
y
g
Ca
ul
an
M
07
05M
Cag
Cag06M
Cag04I
Cag01I
3I
Cag0
Ca
g 07
I
g
Ca
Ca
g
10
4M
g0
Ca
5I
Cag03M
g0
Ca
M
Cag01
Cag
09M
2I
g0
Ca
Ca
g0
9I
06
Ca i n cazul citocromului b, topologia arborilor obinui prin toate cele trei metode
este identic, evideniind gruparea taxonilor n categorii de similaritate precum i
treapta evolutiv a fiecrui grup. Astfel, se observ c specia Carassius auratus
langsdrfi provine din aceeai specie de origine ca i Carassius cuvieri, precum i
grupul din care au derivat speciile Carassius carasssius i Carassius gibelio. De
asemeni, se observ c hibrizii sunt situai n aceleai grupe cu speciile de origine.
149
150
Procent de divergen
CagIMN
Cac
uv
Caul
an
Cax
Cy
Cax
Cyx
Ccu
v
Ccara
s
93,5
95,1
97,7
97,0
97,3
CagIM
N
93,5
93,9
94,7
94,3
Cacuv
97,3
95,8
97,0
Caulan
98,5
99,6
CaxCy
98,9
CaxCyx
Ccuv
Cacuv
6,8
Caulan
5,2
6,9
CaxCy
2,3
6,5
2,7
CaxCyx
Ccuv
3,1
5,6
4,4
1,5
Ccaras
2,7
6,1
3,1
0,4
1,2
CagI
MN
Cac
uv
Caul
an
Cax
Cy
Cax
Cyx
Ccu
v
Ccaras
Ccara
s
n plus, pentru a stabili o mai clar difereniere ntre toate noile haplotipuri, au fost
analizate numrul i procentele n care se gsesc bazele azotate n fiecare dintre
acestea (Tabel 48).
Tabel 48 Procentul bazelor azotate, n cadrul haplotipurilor stabilite
Specii analizate
Baze
azotate
CagIMN
Ccaras
Ccuv
Caulan
CaxCy
CaxCyxCcuv
Nr,
64
59
57
59
60
59
A
%
24,52
22,61
21,84
22,61
22,99
22,61
Nr,
43
45
47
45
44
45
G
%
16,48
17,24
18,01
17,24
16,86
17,24
Nr,
78
80
79
78
80
81
T
%
29,89
30,65
30,27
29,89
30,65
31,03
Nr,
76
77
78
79
77
16
C
%
29,12
29,50
29,89
30,27
29,50
29,12
Nr,
142
139
136
137
140
140
A+T
%
54,41
53,26
52,11
52,49
53,64
53,64
Nr,
119
122
125
124
121
121
C+G
%
45,59
46,74
47,09
47,51
46,36
46,36
151
35
30
25
20
15
10
0
CagIMN
Ccaras
Ccuv
Caulan
CaxCy
CaxCyxCcuv
Haplotip
A
35
30
25
20
15
10
0
A
Baze azotate
CagIMN
Ccaras
Ccuv
Caulan
CaxCy
CaxCyxCcuv
timin, are valori cuprinse ntre 31,03% pentru hibridul Carassius auratus x Cyprinus
carpio x Carassius cuvieri i 29,89% pentru haplotipurile CagIMN i Caulan. Pentru
citozin, se nregistreaz valori cuprinse ntre 30,27% pentru Caulan i 29,12% pentru
secvenele CaugIMN i CyxCyxCcuv.
Referitor la procentele n care se gsesc bazele complementare, pentru A+T se
nregistreaz valori cuprinse ntre 54,41% pentru haplotipul CagIMN i 52,11% pentru
Ccuv, iar pentru C+G, valori cuprinse ntre 45,59% (CagIMN) i 47,51% pentru
secvena Caulan.
4.10.1. CARACTERIZAREA HAPLOTIPULUI CAGIMN
4.10.1.1. FRECVENELE TIPURILOR DE ASOCIERI NUCLEOTIDICE
n acest haplotip au fost ncadrate toate secvenele, aparinnd celor dou
populaii luate n studiu, Larga-Jijia Movileni i Iai.
Din analiza, procentelor dinucleotidelor constatm c valoarea cea mai mare o are
perechea TT (10,7%), iar valoarea cea mai mic perechea GT, n proporie de 1,1%.
Referitor la trinucleotide, cea mai mare frecven o nregistreaz tripletul TTT (4,2%),
iar valoarea cea mai mic, tripletele AGT, CGC, CGG, CGT, GAG, GAT, GCG, GTA,
TCG i TGT, avnd o frecven de 0,4%. Se constat c exist i trinucleotide lips:
AAA, ACG, GGG, GGT, GTC i GTG.
Tetramerul cu frecvena cea mai mare, este CCTA (2,7%), iar cei cu frecven
redus: TTTT, TTGC, TTCA, TTAT, TACT i TACA, toi n procent de 1,2%. n cazul
pentamerilor, cea mai mare frecven o are pentamerul CCCTA (1,5%), iar restul, au
valori de 1,2% - 0,8%. n ceea ce privete hexamerii, acetia au frecvene cuprinse
ntre 1,2% i 0,4%.
Tetramerii, pentamerii i hexamerii cu frecven joas, sunt cei care se gsesc
ntr-un singur exemplar n ntreaga gen, avnd o frecven de 0,4%.
Cu ajutorul modulului EditSeq al DNA Star, a fost calculat temperatura de topire
a ADN, dup un model Davis-Botstein-Roth; n acest caz, prezint o valoare de
81,68C.
4.10.1.2. TRANSLAIA I CARACTERIZAREA CATENEI POLIPEPTIDICE
Translaia s-a realizat pe baza unui cod genetic mitocondrial pentru vertebrate,
utiliznd modulul EditSeq din cadrul programului DNA Star.
Catena polipeptidic obinut este prezentat n Figura 80.
MTPVHFSFSS AFILGLMGLA FHRTHLLSAL LCLEGMMLSL FIALALWALQ
FESTGFSTAP MLLLAFSACE ASTGLALLVA TARTHGT
Figura 80 Catena polipeptidic a ND4L caracteristic haplotipului CagIMN
al speciei Carassius gibelio
153
Ala
Cys
Asp
Glu
Phe
Gly
His
Ile
Lys
Leu
Met
Asn
Pro
Gln
Arg
Ser
Thr
Val
Trp
Tyr
Asx
Glx
Ter
Numr
Procent din
greutatea total (%)
Frecvena
(%)
13
2
0
3
8
6
4
2
0
19
5
0
2
1
2
9
8
2
1
0
0
0
0
9,99
2,23
0,00
4,19
12,73
3,70
5,93
2,45
0,00
23,25
7,09
0,00
2,10
1,39
3,38
8,48
8,75
2,14
2,01
0,00
0,00
0,00
0,00
14,94
2,30
0,00
3,45
9,20
6,90
4,60
2,30
0,00
21,84
5,75
0,00
2,30
1,15
2,30
10,34
9,20
2,30
1,15
0,00
0,00
0,00
0,00
(Daltoni)
9247,07
Aminoacizi
Numr de
aminoaciz
i
Puterni
c bazici
Puterni
c acizi
Hidrofob
i
Polar
i
Punct
izoelectri
c
87
45
20
6,736
Sarcina
electric
la
pH=7
-0,479
Concentrai
a la o
extincie =1
i =280nm
1,56
154
155
CAG01M
CAG09M
CAG06I
CAG04I
CAG05I
CAG08M
CAG08I
CAG10M
CAG02M
CAG03M
CAG07I
CAG06M
CAG10I
CAG05M
CAG09I
CAG04M
CAG01I
CAG07M
CAG02I
CAG03I
CAXCYXCC
CAXCY
CCARAS
CAULAN
CCUV
0.005
156
CAG01I
CAG02I
CAG03I
CAG04I
CAG05I
CAG06I
CAG07I
CAG08I
CAG09I
CAG10I
CAG01M
CAG02M
CAG03M
CAG04M
CAG05M
CAG06M
CAG07M
CAG08M
CAG09M
CAG10M
CAXCYXCC
CAXCY
CCARAS
CAULAN
CCUV
0.005
157
UL
CA
CA
G
05
M
CA
G0
2I
I
CAG
08
CAG07I
UV
CC
2
AN
0M
G1
CA
CC
AR
AS
CA
XC
CAXC
1
CAG
0I
YXCC
CAG06I
CAG09I
CAG08
M
CAG
03M
CA
G0
2M
G0
CA
1M
CAG09M
05I
CAG
I
CAG01
6M
G0
CA
CA
G0
3I
AG
7
G0
CA
CA
G0
4
I
04
7M
y0
Ca
g0
4M
Ca
g0
5M
0.01
Ca
g07
M
Cag0
8M
0M
Ca g10M
C y1
M
09
Cy
M
08
Cy
Cy
05
M
Cag09M
gen, cu decelarea speciilor de origine, difereniat, pentru fiecare dintre cele trei gene
secveniate, deci pentru trei regiuni diferite ale ADNmt. Astfel, pentru citocromul b n
cazul celor dou genuri, Carassius i Cyprinus, au fost trasai arborii filogenetici,
utiliznd cele trei metode menionate i n capitolele anterioare UPGMA (Figura 85),
Minimum Evolution (Figura 86) i Maximum Parsimony (Figura 87).
2M
g0
Ca
1M
g0
Ca
Cy
02
M
C y1
0I
g1
Ca
0I
09I
Cag
C y0 9
I
I
Cag0 8
Cy08I
Cag06I
Cy07I
Cag05I
C y0 6I
Cag 0
4I
5I
Cy 0
C
C ag
03 I
I
y03
Ca
g0
2I
I
02
Cy
C y06 M
Cy 0
1M
Cy
0 4M
y
xC
Ca
n
C aula
C cuv
CaxC yxCuv
r as
C ca
Cy
04
I
C
3M
g0
Ca
Cy
03
M
I
01
Cy
Ca
g0
1I
ag
07
I
159
C ag09M
C ag10M
C ag08M
C ag07M
C ag05M
C ag04M
C ag02M
C ag01M
C ag10I
C ag09I
C ag08I
C ag06I
C ag05I
C ag04I
C ag03I
C ag02I
C ag01I
C ag07I
C ag03M
C ax C y
C c aras
C aulan
C c uv
C ax C y x C uv
C y 06M
C y 01M
C y 04M
C y 04I
C y 03M
C y 01I
C y 02I
C y 03I
C y 05I
C y 06I
C y 07I
C y 08I
C y 09I
C y 10I
C y 02M
C y 05M
C y 07M
C y 08M
C y 09M
C y 10M
0.01
Figura 86 Arbore filogenetic realizat pe baza secvenelor citocromului b, pentru cele dou
genuri analizate, prin metoda ME
160
Cag03I
Cag01M
Cag07M
Cag06I
Cag05I
Cag10M
Cag08I
Cag02M
Cag04M
Cag09M
Cag05M
Cag04I
Cag10I
Cag08M
Cag09I
Cag02I
Cag07I
Cag01I
Cag03M
CaxCy
Ccaras
Caulan
Ccuv
CaxCyxCuv
Cy06M
Cy10M
Cy09I
Cy03M
Cy04I
Cy06I
Cy07I
Cy01M
Cy04M
Cy02M
Cy01I
Cy08I
Cy05I
Cy05M
Cy02I
Cy03I
Cy09M
Cy07M
Cy10I
Cy08M
10
Figura 87 Arbore filogenetic realizat pe baza secvenelor citocromului b, pentru cele dou
genuri analizate, prin metoda MP
161
162
Cag09M
Cag10M
Cag08M
Cag07M
Cag06M
Cag05M
Cag04M
Cag03M
Cag02M
Cag01M
Cag10I
Cag09I
Cag08I
Cag07I
Cag06I
Cag04I
Cag03I
Cag01I
Cag02I
Cag05I
CaxCy
Ccaras
Caulan
Cacuv
CaxCyxCc
Cy06M
Cy05M
Cy01I
Cy02I
Cy03I
Cy04I
Cy05I
Cy06I
Cy07I
Cy08I
Cy09I
Cy10I
Cy01M
Cy02M
Cy03M
Cy04M
Cy07M
Cy08M
Cy09M
Cy10M
Cy GB
0.05
Figura 88 Arbore filogenetic realizat pe baza secvenelor d-loop, pentru cele dou genuri
analizate, prin metoda UPGMA
163
Cag02I
Cag05I
Cag10M
Cag09M
Cag08M
Cag07M
Cag06M
Cag05M
Cag04M
Cag03M
Cag02M
Cag01M
Cag10I
Cag09I
Cag08I
Cag07I
Cag04I
Cag03I
Cag01I
Cag06I
Caulan
CaxCy
Ccaras
Cacuv
CaxCyxCc
Cy06M
Cy05M
Cy01I
Cy02I
Cy03I
Cy04I
Cy05I
Cy06I
Cy07I
Cy08I
Cy09I
Cy10I
Cy01M
Cy02M
Cy03M
Cy04M
Cy07M
Cy08M
Cy09M
Cy10M
Cy GB
0.05
Figura 89 Arbore filogenetic realizat pe baza secvenelor d-loop, pentru cele dou genuri
analizate, prin metoda ME
164
Cag01I
Cag02M
Cag03I
Cag05M
Cag10M
Cag07M
Cag08I
Cag06M
Cag10I
Cag04I
Cag06I
Cag02I
Cag05I
Cag04M
Cag03M
Cag09M
Cag01M
Cag08M
Cag07I
Cag09I
CaxCy
Ccaras
Caulan
Cacuv
CaxCyxCc
Cy06M
Cy05M
Cy07I
Cy06I
Cy GB
Cy09I
Cy08M
Cy01I
Cy03I
Cy08I
Cy02I
Cy04I
Cy09M
Cy02M
Cy04M
Cy10M
Cy07M
Cy03M
Cy10I
Cy05I
Cy01M
10
Figura 90 Arbore filogenetic realizat pe baza secvenelor d-loop, pentru cele dou genuri
analizate, prin metoda MP
165
Cag02I
Cag10M
Cag04I
Cag04M
Cag07I
Cag01M
Cag02M
Cag08I
Cag06M
Cag03M
Cag09I
Cag09M
Cag01I
Cag05I
Cag03I
Cag06I
Cag05M
Cag10I
Cag07M
Cag08M
CaxCyxCcuv
CaxCy
Ccaras
Caulan
Ccuv
Cy GB
Cy05I
Cy09I
Cy01I
Cy04M
Cy01M
Cy03M
Cy08I
Cy02M
Cy02I
Cy07M
Cy08M
Cy04I
Cy06I
Cy09M
Cy10I
Cy05M
Cy03I
Cy07I
Cy06M
Cy10M
0.02
Figura 91 Arbore filogenetic realizat pe baza secvenelor ND4L, pentru cele dou genuri
analizate, prin metoda UPGMA
166
Cag03M
Cag04M
Cag02M
Cag01M
Cag10I
Cag09I
Cag08I
Cag07I
Cag06I
Cag05I
Cag04I
Cag03I
Cag02I
Cag01I
Cag05M
Cag06M
Cag07M
Cag08M
Cag09M
Cag10M
Caulan
CaxCy
Ccaras
CaxCyxCcuv
Ccuv
Cy GB
Cy01I
Cy02I
Cy03I
Cy04I
Cy05I
Cy06I
Cy07I
Cy08I
Cy09I
Cy10I
Cy01M
Cy02M
Cy03M
Cy04M
Cy05M
Cy06M
Cy07M
Cy08M
Cy09M
Cy10M
0.02
Figura 92 Arbore filogenetic realizat pe baza secvenelor ND4L, pentru cele dou genuri
analizate, prin metoda ME
167
Cag01I
Cag04I
Cag04M
Cag05M
Cag10I
Cag08I
Cag06M
Cag03I
Cag09M
Cag06I
Cag07M
Cag08M
Cag10M
Cag02I
Cag07I
Cag03M
Cag02M
Cag09I
Cag05I
Cag01M
CaxCyxCcuv
Caulan
CaxCy
Ccaras
Ccuv
Cy GB
Cy02M
Cy09M
Cy09I
Cy02I
Cy10I
Cy07I
Cy08M
Cy04M
Cy05M
Cy01I
Cy03M
Cy06I
Cy01M
Cy03I
Cy08I
Cy05I
Cy06M
Cy07M
Cy04I
Cy10M
5
Figura 93 Arbore filogenetic realizat pe baza secvenelor ND4L, pentru cele dou genuri
analizate, prin metoda MP
168
BIBLIOGRAFIE
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
COSNER M., JANSEN R., MORET B., RAUBESON L., WANG L., WARNOW T.,
WYMAN S., 2000 A new fast heuristic for computing the breakpoint phylogeny
and experimental phylogenetic analyses of real and synthetic data. n: Proc. 8th
International Conf. on Intelligent Systems for Mol. Biol. p. 104 115.
CRISTEA M., 1991 Genetica ecologic i evoluia, Ed. Ceres, Bucureti, p. 24
36.
DANZMANN R. G., GHARBI K., 2001 Gene mapping in fishes: a means to an
end, n Genetics, nr. 111, p. 3 23.
DAY W., 1983 Computationally di_cult parsimony problems in phylogenetic
systematics, n Journal of Theoretical Biology nr. 103, p. 429 438.
DAYHOFF M. O., SCHWARTZ R. M., ORCUTT B. C., 1978 A model of
evolutionary change in proteins, In Atlas of protein sequence and structure (M.
O. Dayhoff, ed.), National Biomedical Research Foundation , Silver Spring ,
MD., p. 345 352.
DESPER R., GASCUEL O., 2004 Theoretical Foundation of the Balanced
Minimum Evolution Method of Phylogenetic Inference and Its Relationship to
Weighted Least-Squares Tree Fitting n Mol. Biol. Evol., vol 21, nr. 3, p. 587 598.
DILL W., 1988 The inland fisheries of Israel, din The Israeli gomn. of Aquac.,
Bamidgeh, nr. 403, p. 75 104.
DOADRIO I., 1990 Phylogenetic relationships and classification of west
palearctic species of the genus Barbus (Osteichthyes, Cyprinidae). Aquat.
Living Resour. Nr. 3, p. 265-282.
DOBZHANSKY TH., 1970 Genetics of the evolutionary process, Columbia
Univ. Press, New York, p. 391 393.
DOBZHANSKY TH., AYALA F. J., STEBBINS L. G., VALENTINE J. W., 1977
Evolution, W. H. Ferman and Comp., San Francisco, p. 72 75.
DOBZHANSKY TH., BOESIGER E., 1968 Essais sur l`volution, Masson et
CieEditeurs, Paris, p. 61.
ECK R. V., DAYHOFF M. O., 1966 Atlas of protein sequence and structure
National Biomedical Research Foundation, (abstract).
EDWARDS A. W. F., CAVALLI-SFORZA L. L., 1963 The reconstruction of
evolution. n Heredity Nr. 18, p. 553.
EFRON B., 1982a Maximum likelihood and decision theory, n Annals of
Statistics, Nr.10, p. 340-356.
EFRON B., 1982b The jackknife, the bootstrap and other resampling plans,
Society for Industrial and Applied Mathemathics, Philadelphia, PA., p. 38.
EFRON B., TIBSHIRANI R. J., 1993 An introduction to the bootstrap. Ed.
Chapman & Hall, New York, p. 193 274.
EL-MABROUK N., 2000 Genome rearrangement by reversals and insertionsdeletions of contiguous segments, n Proc. 11th Ann. Symp. Combin. Pattern
Matching Vol. 1848 of Lecture Notes in Computer Science. Springer Verlag, p.
222 234.
EMINI E. A., HUGHES J., PERLOW D., BOGER J., 1985 Induction of hepatitis
A virus-neutralizing antibody by a virus-specific synthetic peptide. n J. Virology
Nr. 55, p. 836 839.
FEIDER Z., GROSSU V. AL., GYURKO T., POP V., 1964 Zoologia
vertebratelor,; Editura Didactic i Pedagogic, Bucureti, p.182-253.
FELSENSTEIN J., 1981 Evolutionary trees from DNA sequences: A maximum
likeli-hood approach, n J. Mol. Evol. nr. 17, p. 368 376.
173
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
100.
101.
102.
103.
104.
105.
106.
107. GORGAN D. L., BRA I. I., 2003 The nucleic acid content at Cyprinus carpio
L. and Carassius auratus gibelio Bloch., An. t. ale Univ. Al. I. Cuza, Genetic
i Biologie Molecular, Tom IV, p. 119 123, Iai.
108. GORGAN D. L., 2004a Stabilirea secvenei nucleotidice a citocromului b la
Carassius auratus gibelio Bloch., Acta Ihtyologica Nr.1, sub tipar.
109. GORGAN D. L., 2004b Stabilirea secvenei nucleotidice a ND4L la Carassius
auratus gibelio Bloch. i Cyprinus carpio L., n Studii i cercetri, Biologie, Serie
nou, vol. IX, Universitatea din Bacu, p. 103 106.
110. GORGAN D. L., CMPEANU S. C., OLTEANU ZENOVIA, 2004c Determinarea
cantitii totale de ADN la Carassius auratus gibelio Bloch, sub tipar.
111. GORGAN D. L., CMPEANU S. C., GHERASIM SORINA RALUCA, 2004d
Comparative researches about total DNA quantity from three different organs
from Carassius auratus gibelio Bloch and Cyprinus carpio L., sub tipar.
112. GORGAN D. L., SANJUAN L. A., COMENSAA S. A., BRA I. I., 2004e The
D-loop sequence determination from Carassius auratus gibelio Bloch. species,
An. t. ale Univ. Al. I. Cuza, Genetic i Biologie Molecular, Tom V, p. 103
106, Iai.
113. GORGAN D. L., CMPEANU MIRELA MIHAELA, 2004f ND4L nucleotide
sequence compare for different species of Carassius genera, sub tipar.
114. GRANT V., 1977 Organismic evolution, W. H. Ferman and Comp., San
Francisco, p. 418.
115. GUINDON S., GASCUEL O., 2003 PHYML: a simple, fast, and accurate
algorithm to estimate large phylogenies by maximum likelihood. n Syst. Biol.
Nr. 52 (5), p. 696 704.
116. GUSTAFSSON J. P., STEBBINS G. L., AYALA F. J., 1986 Genetics,
Development and evolution, Plenum Press, New York (abstract).
117. HALL T. A., 1999 BioEdit: a user-friendly biological sequence alignment editor
and analysis program for Windows 95/98/ NT. n Nucleic Acids Symp. Ser. Nr.
41, p.9598.
118. HARTIGAN J. A., 1973 Minimum evolution fits to a given tree. Biometrics Nr.
29, p. 53 65.
119. HARTMAN T., 2003 A simpler 1.5-approximation algorithm for sorting by
transpositions. n: Proc. 14th Ann. Symp. Combin. Pattern Matching, Vol. 2676
of Lecture Notes in Computer Science. Springer Verlag, p. 156 169.
120. HARTMAN T., SHARAN R., 2004 A 1.5-approximation algorithm for sorting by
transpositions and transreversals. n: Proc. 4th Internationall Workshop Algs. in
Bioinformatics. Vol. 3240 of Lecture Notes in Computer Science. Springer
Verlag, p. 50 61.
121. HASEGAWA M., KISHINO H., YANO T., 1985 dating of the human-ape
splitting by a molecular clock of mitochondrial DNA. J. Mol. Evol., nr. 22, p. 160
174.
122. HEARD S., 1996 Patterns in phylogenetic tree balance with variable and
evolvingspeciation rates. Evol. Nr. 50, p. 2141 2148.
123. HENDY M. D., PENNY D., 1989 A framework for the quantitative study of
evolutionary trees, Sysyt. Zool. Nr. 38, p. 297 309.
124. HICKERSON M. J., ROSS J. R. P., 2001 postglacial population history and
genetic structure of the northern clingfish (Gobbiesox maeandricus), revealed
from mtDNA analysis. n Marine Biology nr. 138, p. 407 419.
125. HIGGINS D. G., SHARP P.M., (1989). Fast and sensitive multiple sequence
alignments on a microcomputer. CABIOS, Vol. 5, Nr. 2:, p. 151-153.
175
126. HIGGINS D. G., 1994 Clustal V: Multiple alignment of DNA and protein
sequences. n Methods Mol. Biol., Nr. 25, p. 307 318.
127. HILLIS D. M., LARSON A., DAVIS S. K., ZIMMER ELIZABETH, 1996 - Nucleic
Acids III: Sequencing, n Molecular systematics, 2nd ed., Sinauer Assoc.,
Sunderland MA, Chapter 9, p. 318 370.
128. HOLLEBECQ M. G., CHOURROUT D., WOHLFARTH G., BILLARD R., 1986
Diploid gynogenesis induced by heat shock after fertilization with the UVirradiated sperm of common carp, Aquaculture, 54, p. 69 76.
129. HORVATH L., ORBAN L., 1995 Genome and gene manipulation in common
carp, Aquaculture, 129, (1-4), p. 157 183.
130. HOULE D., MEZEY J., GALPERN P., 2002 Interpretation of the results of
common principal components analysis, n Evolution, nr. 56(3), p. 433 440.
131. HOWES G. J. 1991 - Systematics and biogeography: an overview In Cyprinid
fishes: Systematics, biology and exploitation, Ed. I. J.Winfield & J. S. Nelson,.
1991. London: Chapman &Hall, p. 1-33.
132. HULATA G., 2001 - Genetic manipulations in aquaculture: a review of stock
improvement by classical and modern technologies, n Genetica, nr. 111, p. 155
173.
133. HUSON, D., SMITH, K., WARNOW, T., 1999 Correcting large distances for
phylogenetic reconstruction. n Proc. 3rd International Workshop Alg.
Engineering. Vol. 1668 of Lecture Notes in Computer Science. Springer Verlag,
p. 273 286.
134. HUSSAIN M. G., CHATTERGI A., Mc ANDREW B. J., JOHNSTONE R., 1991
Triploidy induction in Nile tilapia, Oreochromis niloticus L. using pressure, heat
and cold shocks n Theory of Applicable Genetics, 81, p. 6 12.
135. HUXLEY J., 1974 Evolution the modern synthesis; Third Edition, Baker, Allen
et Unwin Ltd, p. 565 566.
136. IGUCHI K., YAMAMOTO G., MATSUBARA N., NISHIDA M., 2003
Morphological and genetic analysis of fish of a Carassius complex (Cyprinidae)
in Lake Kasumigaua with reference to the taxonomic status of two all-female
triploid morphs. Biol. J. Linn. Soc., London, Nr. 79, p. 351 357.
137. IJIRI K., EGAMI N., 1980 Hertwig effect caused by UV-irradiation of sperm of
Oryazis latipes (Teleost) and its photoreactivation, Mut. Res., 69, p. 241 248.
138. IMSIRIDOU A., ZALDIVAR J. M., 1999 Methodology and formats for genetic
identification of fish species. Joint Research Centre, p. 1 36.
139. INGRAM V. M., 1963 The hemoglobins in genetics and evolution. Columbia
University Press, New York (abstract).
140. JAMESON B. A., WOLF H., 1988 The antigenic index: a novel algorithm for
predicting antigenic determinants. CABIOS vol. 4, p. 181 186.
141. KARAKOUSIS Z., MACHORDOM A., DOADRIO I., ECONOMIDIS P.S., 1995
Phylogenetic relationships of Barbus peloponensis Valenciennes, 1842
(Osteichthyes: Cyprinidae from Greece and other speciei of barbus as revealed
by allozyme electrophoresis. Biochem, System. Ecol., Nr. 23, p. 39 45.
142. KARPLUS P. A., SCHULTZ G. E., 1985 Prediction of chain flexibility in
proteins. n Naturwissenschaften, nr. 72, p. 212 213.
143. KAVUMPURATH S., PANDIAN T. J., 1994 Induction of heterozygous and
homozygous diploid gynogenesis in Betta splendens (Regan) using hydrostatic
pressure, Aquaculture and Fisheries Management, Aquaculture Research
Issue, Nr. 25, (1), p. 133 143.
176
162.
163.
164.
165.
166.
167.
168.
169.
170.
171.
172.
173.
174.
175.
176.
177.
178.
179.
180.
181.
200. MORET B., ROSHAN U., WARNOW T., 2002 Sequence length requirements
for phylogenetic methods. n Proc. 2nd International Workshop Algs. in
Bioinformatics., vol. 2452 Lecture Notes in Computer Science, Springer Verlag,
p. 343 356.
201. MORET B., TANG J., WANG L. S., WARNOW T., 2002 Steps toward accurate
reconstructions of phylogenies from gene-order data. J. Comput. Syst. Sci. Nr.
65 (3), p. 508 525.
202. MORET B., TANG J., WARNOW T., 2005 Reconstructing phylogenies from
gene content and gene-order data. n: Gascuel, O. (Ed.), Mathematics of
Evolution and Phylogeny. Oxford University Press, p. 321 352.
203. MLLER S., 1989 Geschichte der Fiszucht in Europa, Teil VII. Einige wichtige
Etappen in der Entwicklung der Karpfenteichwirtschaft, Z. Binnenfisch D.D.R.,
Berlin, Nr. 36, p. 10 14.
204. MURAKAMI M., MATSUBA C., FUJITANI H., 2001 The maternal origins of the
triploid ginbuna (Carassius auratus langsdrfi); phylogenetic relationships within
the Carassius auratus taxa by partial mitochondrial D-loop sequnecing. Genes
Genet. Syst. Nr. 76 (1), p. 25 32 (abstarct).
205. NAGY A., RAJKI K., HORVATH L., CSANYI V., 1978 Investigation on carp
(Cyprinus carpio L.) gynogenesis. J. Fish. Biol., Nr. 13, p. 215 224 (abstract).
206. NAGY A., CSANYI V., BAKOS J., BERCSENYI, M., 1984 Utilization of
gynogenesis and sex-reversal in commercial carp breeding: growth of the first
gynogenetic hybrids. Aquacult. Hung., Nr. 4, p. 7 16.
207. NAKHLEH L., ROSHAN U., ST. JOHN K., SUN J., WARNOW T., 2001
Designing fast converging phylogenetic methods. n: Proc. 9th International
Conf. on Intelligent Systems for Mol. Biol., vol. 17 of Bioinformatics. Oxford U.
Press, p. S190 S198.
208. NAKHLEH L., MORET B., ROSHAN U., JOHN K. S., WARNOW T., 2002 The
accuracy of fast phylogenetic methods for large datasets. In: Proc. 7th Pacific
Symp. On Biocomputing. World Scientific Pub., p. 211 222.
209. NEE S., 2001 Inferring speciation rates from phylogenies, n Evolution, nr.
55(4), p. 661 668.
210. NEI M., 1986 Stochastic errors in DNA evolution and molecular phylogeny. n
Evolutionary perspectives and the new genetics. p. 133 - 147 Ed. Alan R. Liss,
New York.
211. NEI M., 1991 Relative efficiencies of different tree making methods for
molecular data. n Recent advances in phylogenetic studies of Dna sequences.
Oxford University Press, p. 133 147.
212. NEI M., 1996 Phylogenetic analysis in molecular evoutionary genetics. Annu.
Rev. Genet., Nr. 30, p. 371 403.
213. NEI M., TAJIMA F., 1983 Maximum likelihood estimation of the number of
nucleotide sbstitutions from restriction sites data. n Genetics, Nr. 105, p. 207
217.
214. NEI M., TAJIMA F., TATENO Y., 1983 Accuracy of estimated phylogenetic
trees from molecular data II. Genes frequency data. J. Mol. Evol. Nr. 19, p. 153
170.
215. NEI M., MILLER J.C, 1990 A simple method for estimating average number of
nucleotide substitutions within and between populations from restriction data. n
Genetics, nr. 125, p. 873-879.
180
216. NEI M., GU X., SITNIKOVA T., 1997 Evolution by the birth-and-death process
in multigene families of the vertebrate immune system. Proc. Natl. Acad Sci.
USA, Nr. 94, p. 7799 7806.
217. NEI M., KUMAR S., TAKAHASHI K., 1998 The optimization principle in
phylogenetic analysis tends to give incorrect topologies when the number of
nucleotides or amino acids used is small, n PNAS, nr. 95 (21) p. 12390 12397.
218. NEI M., KUMAR S., 2000 Molecular evolution and phylogenetics, Oxford
University Press.
219. NELSON G. J., 1994 Fishes of the world, Editat de Whilez, New York.
220. NICOLAU AURELIA, BREZEANU GH., CALOIANU I., BUNIA A., 1973
Reproducerea artificial i dezvoltarea la peti, Editura Academiei R.S.R.,
Bucureti (abstract).
221. NICOLESCU CARMEN, 2002 Types of gynogenetic carps obtained using
genetic manipulated gametes, An. t. ale Univ. Al. I. Cuza, seciunea II
Genetic i Biologie Molecular, Tom III, p.68 77, Iai.
222. NICOLESCU CARMEN, 1994 Das Studium der Wirksamkeit einiger Methoden
in der genetischen Inaktivierung der Karpfengameten, Analele Universitii
Valachia Trgovite, anul II, fascicola I, p. 101 111.
223. NICOLESCU CARMEN, 1996 Studiul genetic al unor forme de peti obinute
prin manipulri genetice (ginogenez, androgenez, poliploidizare, hibridare
interspecific) tez de doctorat (rezumat).
224. NICOLESCU CARMEN, 1997 Studiul eficienei unor tehnici n diploidizarea
meterialului genetic al gameilor la crap, Al XXII-lea Congres al Academiei
Romno Americane de tiine i Arte, 26 27 iunie 1997, vol. I, seciunea V
tiine medicale i biologie, p. 146 163.
225. NIXON C K., CARPENTER J. M., 2000 On the other phylogenetic
systematics, n Cladistics Nr. 16, p. 298 318.
226. NOGUSA S., 1960 A comparative study of the chromosomes in fishes with
particular considerations on taxonomy and evolution, Mem. Univ. Agr., nr. 3.,
Hyogo p. 1 62.
227. NORMAN A. J, PORTER A. H., 2001 Toward a new synthesis: population
genetics and evolutionary developmental biology, n Genetica, nr. 112 113, p.
45 58.
228. NU GH., BUNEAG C., 1977 Investigaii biochimice, Editura Didactic i
Pedagogic, Bucureti. p. 188 189.
229. OBRHELOVA, N. P., 1971 Vergleinchende osteologie der gattung Leuciscus
(Pisces) aus tertiaren schichten der nordlichen und westlichen CSSR,
Paleontolog. Abhandl. Nr. 4, p. 549-660.
230. OHNO S., 1970 Evolution by gene duplication. Springer Verlag, Berlin
(abstract).
231. OJIMA Y., HAYASHI M., UENO K., 1972 Cytogenetic studies in lower
vertebrates Karyotype and DNA studies in 15 Species of Japanese
Cyprinidae, Genetics, 476, p. 431 440, Japan.
232. OLSEN G., MATSUDA H., HAGSTROM R., OVERBEEK R., 1994 Fast
DNAmt: A tool for construction of phylogenetic trees of DNA sequences using
maximum likelihood. Computations in Applied Biosciences, nr. 10 (1), p. 41
48.
233. OPRESCU S., 1980 Introducere n citogenetica animal, Ed. tiinific,
Bucureti.
181
234. ORNDUFF R., 1979 Reproductive biology in relation to sistematics; Taxon, 18,
p. 121 133.
235. OWCZARZY R., VALLONE M. P., GALLO J. F., PANER T. M., LANE M. J.,
BENIGHT A. S., 1998 Predicting sequence-dependent melting stability of the
short duplex DNA oligomers. Ed. John Wiley & Sons, p. 217 239.
236. PBO S., 1990 amplifying ancient DNA In PCR protocols: A guide to
methods and applications, Eds. M. A. Tunes, D.H. Gelfand, J. J. Sninsky i T. J.
White, Academic Press San Diego, p. 159 166.
237. PAAVER T., 1983 Biochimiceskaia genetika karpa Cyprinus carpio L., Akad.
nauk Estonsk. S. S. R. Inst. Zool. Bot., p. 85 92.
238. PAGE R., 1998 Introduction to tree building, DEEB IBLS, University of
Glasgow, p. 1 5.
239. PAGE R., 1998 GeneTree: comparing gene and species phylogenies using
reconciled trees. Bioinf. Nr. 14 (9), p. 819 820.
240. PAGE R., CHARLESTON M., 1997 From gene to organismal phylogeny:
Reconciled trees and the gene tree/species tree problem. Mol. Phyl. Evol. Nr. 7,
p. 231 240.
241. PAGE R., CHARLESTON M., 1997 Reconciled trees and incongruent gene
and species trees. n: Mirkin, B., McMorris, F. R., Roberts, F. S., Rzehtsky, A.
(Eds.), Mathematical Hierarchies in Biology, vol. 37. American Math. Soc., p. 57
70.
242. PALUMBI S., 1996 Nucleic Acids II: The polymerase chain reaction, n
Molecular systematics, 2nd ed., Sinauer Assoc., Sunderland MA, Chapter 7, p.
205 317.
243. PALUMBI S. R., CIPRIANO F., HARE M. P., 2001 Predicting nuclear gene
coalescence from mitochondrial data: the three-times rule, n Evolution, nr.
55(5), p. 859 868.
244. PAMILO P., NEI M., 1998 Relationship between gene trees and species trees.
Mol. Biol. Evol. Nr. 5, p. 568 583.
245. PETRE A., NEGRUIU E., 1975 Genetic animal, Editura Didactic i
Pedagogic, Bucureti, p. 237 260.
246. PIONTKIVSKA H., ROONEY A. P., NEI M., 2002 Purifying selection and birthand-death evolution in the histone H4 gene family. n Mol. Biol. Evol. Nr. 19,
p.689-697.
247. POJOGA I., 1977 Piscicultura modern n apele interioare, Editura Ceres,
Bucureti, 34 58.
248. POJOGA I., 1977 Piscicultura, Editura Ceres, Bucureti, p. 15 33.
249. POJOGA I., NEGRIU R., 1988 Piscicultura practic, Editura Ceres, Bucureti,
p. 67.
250. POSADA D., CRANDALL KEITH, 1998 Modeltest: testing the model of DNA
substitution, n Bioinformatics applications note, vol. 14, Nr. 9, p. 817 818.
251. PRESCOTT L. M., Harley Johon P. 1999 Microbiologa cuarta edicin Editorial
MacGraw Hill Madrid Espaa p. 320-344.
252. QUILLET E., 1994 Survival growth and reproductive traits in mitotic
gynogenetic rainbow trout females, Aquaculture, 123, p. 223 237.
253. QUINTEIRO J., VIDAL R., MENDEY M. R., 2000 Phylogeny and
biogeographic history of hake (genus Merluccius), inferred from mitochondrial
DNA control region sequences. n Marine Biology, nr. 136, p. 163 174.
254. RAICU P, 1980 Genetica, , Editura Didactic i Pedagogic, Bucureti, p. 533
553.
182
275. SHEN S.C., 1993 Fishes of Taiwan Ed. Department of Zoology, National Taiwan
University, Taipei. p. 960.
276. SITNIKOVA T., RZHETSKY A., NEI M., 1995 Interior branch and bootstrap
tests of phylogenetic trees. Mol. Biol. Evol. Nr. 12, p. 319 333.
277. SNEATH P. H. A., SOKAL R. R., 1973 Numerical taxonomy. Ed. Freeman,
San Francisco CA. (abstract).
278. SNEDECOR, G. W., 1968 Metode statistice aplicate n cercetrile de
agricultur i biologie, Editura Didactic i Pedagogic, Bucureti, p. 37.
279. SOKAL R. R., MICHENER C. D., 1958 A statistical method for evaluating
systematic relationships. Univ. Kansas Sci. Bull. Nr. 28, p. 1409 1438.
280. SOKAL R. R., SNEATH P. H. A., 1963 Principles of numerical taxonomy.
Freeman, San Francisco CA. (abstract).
281. SOURDIS J., NEI M., 1988 Relative efficiencies of the maximum parsimony
and distance-matrix methods in obtaining the correct phylogenetic tree, n Mol.
Biol. Evol., nr. 5, p. 298 311.
282. SPIRIN A., 1958 Spektrofotometriceskoe opredelenie summarnovo kolicestva
nucleinovih kislot. Biohimia, p.656.
283. STAN TR., 1985 Piscicultura, lucr. practice, lito. I. A. Iai, p. 15 16.
284. STAN, T., PSRIN, B., 1996 Acvacultur, Universitatea Agronomic i de
Medicin Veterinar Ion Ionescu De la Brad, Iai, p 31.
285. STEBBINS G. L., 1969 The basis of progressive evolution, Univ. North
Carolina, Press, Chapel Hill (abstract).
286. STUART G. W., MOFFETT KAREN, LEADER J. J., 2001 A comprehensive
vertebrate phylogeny using vector representations of protein sequences from
whole genomes. Mol. Biol. Evol. p. 1 31.
287. SUCIU MARIA, POPESCU ALEXANDRINA, 1981 Lucrri practice de zoologie,
ediia a II-a, Editura Didactic i Pedagogic, Bucureti.
288. SUSKO E., INAGAKI Y., ROGER A. J., 2004 On Inconsistency of the
Neighbor-Joining, Least Squares, and Minimum Evolution Estimation When
Substitution Processes Are Incorrectly Modeled, n Mol. Biol. Evol., vol 21 nr. 9,
p. 1629 1642.
289. SWOFFORD D. L., BEGLE D. P., 1993 PAUP: Phylogentic analysis using
parsimony, ver. 3.1. users manual, Illinois Natural History Survey, Champaign,
p. 74 102.
290. TAISESCU ELENA, 1979 Studiul complementului cromosomial la unele specii
de peti din fauna rii noastre, Rez., Tez Dr., Fac. Biol., Univ. Bucureti
(rezumat).
291. TAKAHASHI K., NEI M., 2000 Efficiencies of fast algorithms of phylogenetic
inference under the citeria of Maximum-Parsimony, Minimum Evolution, and
Maximum Likelihood when a large number of sequences are used. Mol. Biol.
Evol. Nr. 17(8), p. 1251 1258.
292. TAKEZAKI N., NEI M., 1994 Inconsistency of the maximum parsimony method
when the rate of nucleotide substitution is constant. J. Mol. Evol. Nr. 39, p. 210
218.
293. TAKEZAKI N., 1998 The trees generated by distance methods of phylogenetic
reconstruction. Mol. Biol. Evol. Nr. 15, p. 727 737.
294. TAKEZAKI N., NEI M., 1996 Genetic distances and reconstruction of
phylogenetic trees from microsatellite DNA. n Genetics Nr., 144, p. 389 399.
184
313. WAKELEY J., 1993 Substitution rate variation among sites in hypervariable
region I of human mitochondrial DNA, J. Mol. Evol. Nr. 37, p. 613 623.
314. WAKELEY J., 1994 Substitution rate variation among sites and the estimation
of transition bias, Mol. Biol. Evol., Nr. 11, p. 436 442.
315. WANG H. Y., LEE S. C., 2002 - Secondary structure of mitochondrial 12S rRNA
among fish and its phylogenetic applications. Mol. Biol. Evol., Nr. 19, p. 138
148.
316. WANG L. S., WARNOW T., 2001 Estimating true evolutionary distances
between genomes. n: Proc. 33rd Ann. ACM Symp. Theory of Comput. ACM
Press, New York, p. 637 646.
317. WANG L. S., JANSEN R., MORET B., RAUBESON L., WARNOW T., 2002
Fast phylogenetic methods for genome rearrangement evolution: An empirical
study. n: Proc. 7th Pacific Symp. on Biocomputing. World Scientific Pub., p.
524 535.
318. WANG L. S., WARNOW T., 2005 Distance-based genome rearrangement
phylogeny. n: Gascuel O. (Ed.), Mathematics of Evolution and Phylogeny.
Oxford University Press, p. 353 383.
319. WELCOMME R.L., 1988 International introductions of inland aquatic species,
Rome, FAO. (abstract).
320. WERNER S., 1979 Industrienmabige fischproduction, veb Deutscher
Lanswirtschaf sverlang, Berlin, D. D. R. (abstract).
321. WHEELER W., 2001 Homology and the optimization of DNA sequence data, n
Cladistics, Nr. 17, p. 5 11.
322. WILLIAMS G. C., 1966 Adaptation and natural selection. A critique of some
current. Evolutionary thought, Princeton Univ. Press. (abstract).
323. WILEY E. O., 1981 Phylogenetics: The theory and practice of phylogenetic
systematics. Ed. by Wiley, New York (abstract).
324. WILEY E. O., BROOKS D. R., SIEGEL-CAUSEY D., FUNK V. A., 1991 The
Compleat cladist: A primer of phylogenetic procedures. Museum of Natural
History, University of Kansas, Lawrence, (abstract).
325. WILLS C., 1981 Genetic variability, Clarendon Press, Oxford (abstract).
326. WILSON A. C., CARLSON S. S., WHITE T. J., 1977 Biochemical Evolution.
Annu. Rev. Biochem., Nr. 46, p. 573 639.
327. WOLF C., RENTSCH J., HUBNER P., 1999 PCR-RFLP analysis of
mitochondrial DNA: a reliable method for species identification. J. Agric. Food
Chem. Nr. 47, p. 1350 1355.
328. WOO-JAI L., CONROY JANET, HOWELL H. W., KOCHER T. D., 1995
Structure and evolution of teleost mitochondrial control regions. J. Mol. Evol.
(1995) Nr. 41, p. 54 66.
329. WU C., YE Y., CHEN R., 1986 Genome manipulation in carp (Cyprinus carpio
L.), Aquaculture, 54, p. 57 61.
330. ZARDOYA R., MEYER A., 1996 Phylogenetic performance of mitochondrial
protein-coding genes in resolving ralationships among vertebrate. Mol. Biol.
Evol. Nr. 13)7), p. 933 942.
331. ZARDOYA R., DOADRIO, I., 1998 Phylogenetic relationships of Greek
Cyprinidae: molecular evidence for at least two independent origins of the
Greek cyprinid fauna, sub tipar.(abstract).
332. ZARDOYA R., DOADRIO, I., 1998 Phylogenetic relationships of Iberian
cyprinids: systematic and biogeographical implications, Proc. R. Soc. Lond. B
Nr. 265, p. 1365-1372.
186
333. ZHANG H., OKAMOTO N., IKEDA Y., 1995 - Two c-myc genes from a tetraploid
fish, the common carp (Cyprinus carpio). n Gene Nr. 153, p. 231236.
334. ZHANG J., ROSENBERG H. F., NEI M., 1998 Positive Darwinian selection
after gene duplication in primate ribonuclease genes. Proc. Natl. Acad. Sci.
USA, Nr. 95, p. 3708 3713.
335. ZUCKERKANDL E., PAULING L., 1962 Molecular disease, evolution and
genetic heterogenity. In Horizons in biochem8istry,. Acad. Soc. New York. p.
189 252.
187