Documente Academic
Documente Profesional
Documente Cultură
r
u
l
d
e
s
u
b
s
t
i
t
u
i
i
p
e
r
s
i
t
u
s
Timpul n milioane de ani
Figura 1. Relaia dintre distana PC i distana p odat cu trecerea timpului. Rata de
substituie a aminoacizilor este de 10
-8
per situs per an. (Dup Nei & Kumar, 2000)
20
De obicei ns, secvena ancestral nefiind cunoscut ecuaia de mai sus nu este
aplicabil, trebuind s comparm dou secvene actuale divergena crora a nceput t
timp n urm. Probabilitatea (q) ca nici unul din situsurile omoloage ale celor dou
secvene s nu se fi schimbat este:
q = (e-rt)2 = e-2rt
Ea poate fi estimat ca 1 - ^p, deoarece q = 1 p, de unde 1- p = e-2rt. Daca d =
2rt este numrul total de substituii per situs pentru dou secvene atunci el poate fi
calculat ca :
d = -ln (1 p)
O estimare a lui d ( d
este dat de
V( d
) = p / [(1 - p) n].
Pe de alt parte aceleai formule de mai sus pot servi pentru calcularea ratei de
substituie a aminoacizilor
r = d
/ (2t),
dar pentru aceasta trebuie s cunoatem momentul nceperii divergenei dintre cele
dou secvene. Daca cunoatem rata de substituie a aminoacizilor putem folosi
formula de mai sus pentru a estima timpul evolutiv
t
= d
/ (2r).
n modul de calculare a distanei descris mai sus se presupune c rata de
substituie aminoacizilor este identic pentru toate situsurile. Aceast aproximare de
cele mai multe ori nu este valabil, rata substituiei fiind mai ridicat pentru situsurile
mai puin importante din punct de vedere funcional, iar aminoacizii din centrul activ al
unei proteine pot fi conservai pentru perioade de timp foarte mari (Kimura, 1983).
Uzzel & Corbin (1971) au artat c de fapt distribuia numrului de substituii per situs
k are o varian mai mare dect cea a distribuiei Poisson i urmrete de fapt o
distribuie negativ binomial, iar distribuia lui r per situs urmrete o distribuie
gamma.
f (r) =
) (a
b
a
I
e -b r r a-1 unde a= , ) ( / r V r ) ( / r V r b = , iar ) (a I este funcia
gamma definit:
}
= I
0
1
) ( dt t e a
a t
21
Forma distribuiei f(r) este dat de a care se mai numete i parametru de form
sau parametru gamma. Distribuia gamma este foarte flexibil i ia diverse forme n
dependen de a. Pentru = a r este acelai pentru toate situsurile, pentru a=1 r
urmeaz o distribuie exponenial indicnd c rata de substituie variaz mult de la un
situs la altul, iar pentru a < 1 r are o distribuie i mai concav indicnd c un mare
numr de situsuri au r = 0 (Figura 2).
Spre exemplu Uzzell & Corbin (1971) au estimat c a = 2 pentru citocromul c de la
vertebrate, iar Zhang & Gu (1998)au estimat acest parametru ntre 0,2 i 3,5 pentru un
set de proteine nucleare i mitocondriale. Cnd r variaz conform unei distribuii
gamma poate fi estimat numrul de substituii de aminoacizi per situs. Probabilitatea
identitii a doi aminoacizi din dou situsuri omoloage peste un timp t este q = e-2rt,
iar q mediu pentru toate situsurile este dat de
}
|
.
|
\
|
+
= =
0
2
) (
a
t r a
a
dr r qf q
(Nei & Kumar, 2000). daca notm ca n cazul coreciei Poisson dG = t r 2 i
p q = 1 avem urmtoarea formul pentru distana dintre dou secvene :
( ) | | 1 1
/ 1
=
a
G
p a d cu variana ( ) | | n p p d V
a
G
/ 1 )
(
) / 2 1 ( +
=
Figura 2 Distribuia gamma a ratei de substituie per situsuri pentru
diferite valori ale parametrului gamma (a) (Dup Nei & Kumar, 2000)
Rata evolutiv relativ
D
e
n
s
i
t
a
t
e
a
p
r
o
b
a
b
i
l
i
t
i
i
22
iar estimarea (
G
d
care este de 4000 de ori mai mare ca n cazul mutaiei neutre (unde a = v =10-9).
Acest exemplu este totui un pic exagerat deoarece odat ce o protein are o funcie
stabilit majoritatea mutaiilor vor fi duntoare sau neutre i foarte puine vor
amplifica activitatea proteinei. Mai multe studii au artat c rata mutaiilor pozitive este
mult mai mic ca a celor neutre.
Marea majoritate a mutaiilor sunt ns duntoare, ele fiind rapid eliminate din
populaie, ele necontribuind deci la substituiile de aminoacizi nefiind fixate. Mutaiile
puin duntoare se comport altfel ns. Ele pot fi totui fixate ntr-o populaie cu o
mic probabilitate n special n populaii mici. Totui o acumulare continu de mutaii
puin duntoare i-ar putea deteriora structura i funcia. Deci ca mutaiile uor
duntoare s fie fixate trebuie s se acumuleze i mutaii uor benefice pentru ca
proteina s-i pstreze funcia. n acest caz rata medie de acumulare a mutaiilor
poate deveni mai mult sau mai puin (constant pe termen lung bineneles).
n unele cazuri heterozigoii (Aa) pentru o nou mutaie pot avea un fitnes crescut
fa de oricare dintre homozigoi (AA sau aa) acest fenomen fiind cunoscut sub
denumirea de selece supradominant. n acest caz fitnesul indivizilor AA, Aa i aa
poate fi exprimat ca 1-s1, 1 i 1-s2 respectiv calculele probabilitii fixrii sunt prea
complicate pentru a fi redate aici, ns cnd
2 1
s s ~ probabilitatea este de cteva ori
mai mare ca cea pentru mutaiile neutre.
24
2.4. TIPURI DE MODIFICRI LA NIVELUL MACROMOLECULEI DE ADN
Exist patru tipuri principale de modificri care au loc n macromolecula de ADN:
nlocuirea nucleotidelor, deleia, adiia i inversia acestora. Adiia, deleia i inversia se
pot produce pentru una sau mai multe nucleotide. Adiia i deleia pot modifica
secvenele cadrelor deschise de citire, poriuni numite ORF (open reading frame), caz
n care, sunt numite frameshift mutations (Figura 3). nlocuirea nucleotidelor poate fi
mprit n dou clase: tranziii i transversii (Figura 4). Tranziiile reprezint
nlocuirea unei baze azotate purinice (adenin sau guanin) cu alt baz purinic sau
a unei baze azotate pirimidinice (timin sau citozin) cu o alt pirimidin. Substituia
nucleotidelor purinice cu nucleotide pirimidinice sau invers, poart numele de
transversii. n majoritatea secvenelor de ADN, s-a constatat c substituia
nucleotidelor prin tranziii, intervine mai frecvent dect substituia prin transversii
(Fitch, 1967; Gojobori et al., 1982; Kocher et al., 1991).
Figura 3 Modul de apariie al frameshift mutaiilor
Figura 4 Cele dou modaliti de substituie a nucleotidelor
(dup, Nei i Kumar, 2000)
Modificrile evolutive de la nivelul macromoleculelor de ADN sunt mai complicate
dect cele din secvenele proteice, deoarece exist mai multe tipuri de ADN cum ar fi
regiunile codificatoare, regiuni necodificatoare, exoni, introni, regiuni terminale, regiuni
T C
A G
Tranziii
Transversii
25
repetitive i secvene de inserie. Modificrile produse de mutaii la nivelul ADN;
variaz n funcie de zona n care apar. Chiar dac lum n considerare o singur
regiune codificatoare, modelul substituiei nucleotidelor n prima, a doua i a treia
poziie a unui codon, este diferit. Mai mult, unele regiuni se afl sub aciunea seleciei
naturale, mai mult dect altele, acest fapt contribuind la variaii ale modelului de
evoluie ale diferitelor regiuni ale ADN.
2.4.1 DIFERENE NUCLEOTIDICE NTRE SECVENE
Cnd dou secvene de ADN provin din aceeai secven ancestral, evolueaz
divergent gradual, datorit substituiei nucleotidice. Cea mai simpl msur a
divergenei dintre secvene, este proporia siturilor nucleotidice care difer ntre dou
nucleotide sau distana p pentru secvenele nucleotidice.
n cazul substituiei aminoacizilor, distana p ne d o estimare a numrului de
nucleotide substituite per site, cnd secvenele au origine apropiat. Cnd p are
valoare mare, ne d o subestimare numeric, deoarece nu ine cont de mutaiile
napoi i de cele paralele.
Pentru a estima numrul substituiilor nucleotidice, este necesar s folosim un
model matematic al substituiilor nucleotidice. Din acest motiv, a fost constituit o
matri a ratei substituiilor nucleotidice (Tabelul 3) (Nei i Kumar, 2000).
n continuare, vor fi prezentate doar modelele utilizate n prelucrarea datelor din
prezenta lucrare, modele alese pe baza numrului de nucleotide implicate precum i a
numrului de mutaii aprute n cadrul secvenei unei gene.
Tabel 3 Modele ale substituiei nucleotidice (Nei i Kumar, 2000)
A T C G A T C G
Jukes Cantor model HKY model
A - - gT gC gG
T - gA - gC gG
C - gA gT - gG
G - gA gT gC -
Kimura model Tamura Nei model
A - - gT gC 1gG
T - gA - 2gC gG
C - gA 2gT - gG
G - 1gA gT gC -
Equal input model General reversible model
A - gT gC gG - agT bgC cgG
T gA - gC gG agA - dgC egG
C gA gT - gG bgA dgT - fgG
G gA gT gC - cgA egT fgC -
Tamura model Unrestricted model
A - 2 1 1 - a12 a13 a14
T 2 - 1 1 a21 - a23 a24
C 2 2 - 1 a31 a32 - a34
G 2 2 1 - a41 a42 a43 -
Not: un element (eij) care intr n una din matricile anterioare de substituie nucleotidic va
nlocui nucleotida din rndul i cu nucleotida din coloana j. gA, gT, gC i gG sunt frecvenele nucleotidelor.
1 = gG + gC; 2 = gA + gT.
26
n n p
d
/ =
unde n
d
i n sunt numrul de nucleotide diferite i numrul total de situsuri,
variana lui p este aceiai ca pentru secvenele de aminoacizi. Pe lng acest indice
ades este necesar s cunoatem frecvenele diferitelor perechi de nucleotide dintre
dou secvene, X i Y. Existnd patru nucleotide, A, T, G i C n fiecare secven
exist 16 perechi diferite de nucleotide. Patru perechi sunt formate din nucleotide
identice (AA, TT, CC i GG), patru sunt perechi de tipul tranziiilor (AG, GA, TC i CT)
i opt sunt perechi de tipul transversiilor (restul perechilor). Frecvenele totale ale
perechilor de nucleotide identice, perechilor de tipul tranziiilor, i perechilor de tipul
transversiilor pot fi notate cu O, P i Q respectiv, deci p = P + Q. Dac substituiile de
nucleotide ar avea loc aleatoriu Q ar trebui s fie de dou ori mai mare ca P (8 : 4)
pentru un p mic. De fapt tranziiile au loc mai frecvent ca transversiile i deci P poate fi
mai mare dect Q. Raportul R dintre tranziii i transversii poate fi calculat dup
formula Q P R
/
= unde P
i Q
este supus unei mari erori cnd numrul de nucleotide studiate este
mic i variana este dat de :
|
|
.
|
\
|
+ =
nQ nP
R R V
1 1
)
(
2
fapt ce indic c dac nP i nQ nu sunt mari, variana lui R
.
Ca i n cazul secvenelor de aminoacizi distana p d o estimare corect a
numrului de substituii per situs numai dac secvenele sunt destul de apropiate.,
dac p este mare apare o subestimare a numrului de substituii deoarece nu sunt
luate n calcul substituiile paralele i cele ce au loc napoi. n cazul secvenelor
nucleotidice aceasta este mult mai grav deoarece exist doar patru stri posibile n loc
de 20.
2.4.2 MODELE DE EVOLUIE ALE SECVENELOR NUCLEOTIDICE
Pentru a putea estima numrul de substituii nucleotidice este necesar
utilizarea unor modele matematice care s corecteze substituiile multiple. Din aceast
cauz au fost dezvoltate un numr mare de modele. Expresia matematic a unui
model de substituie este un tabel al ratelor de substituie per situs i per unitate de
distan evolutiv. Pentru secvenele de ADN aceste rate pot fi exprimate ca o matrice
O de 4 4 n care fiecare element
ij
O reprezint rata schimbrii de la baza i la
baza j n timpul unei perioade de timp dt infinit de mic. Cea mai general form a
acestei matrici este:
27
|
|
|
|
|
.
|
\
|
+ +
+ +
+ +
+ +
= O
) (
) (
) (
) (
G C A G C A
T T C A C A
T G T G A A
T G C T G C
l k i l k i
f f j h j h
e d e d g g
c b a c b a
t t t t t t
t t t t t t
t t t t t t
t t t t t t
rndurile i coloanele corespunznd celor patru perechi de baze (A, C, G i T).
Factorul este dat de rata medie instantanee de substituie care este modificat de
parametrii relativi a, b, c.l, care corespund cte unul pentru fiecare transformare
posibil dintr-o baz ntr-alta diferit. Produsul dintre i parametrii relativi este
parametrul ratei de substituie. Ceilali parametri,
G C A
t t t , , i T sunt parametri de
frecven i corespund frecvenelor bazelor A, C, G i T respectiv. Pentru a simplifica
modelul se admite c frecvenele rmn constante n timp, aflndu-se deci n
echilibru, iar rata de schimbare spre oricare dintre baze este proporional cu
frecvena de echilibru i este independent de baza de la care se pornete. n matrice
elementele din diagonal sunt alese astfel nct n sum toate elementele de pe un
rnd dau 0. O matrice analoag poate fi construit i pentru aminoacizi, n acest caz
ea ar fi de 20 20 i nu de 44.
Aproape toate modelele de substituie propuse pn la ora actual sunt cazuri
particulare ale matricei de mai sus (motiv pentru care am i prezentat-o). De obicei se
admite c rata total a schimbrii de la o baz i la alta j pentru o perioad mai lung
de timp este aceiai cu rata schimbrii de la j la i. n termeni matematici aceasta
corespunde cu afirmaia c g = a, h = b, i = c, j = d, k = e i l = f. Asemenea modele
se numesc cu timp reversibil . Cel mai generalizat model cu timp reversibil (GTR) este
reprezentat prin matricea simetric :
|
|
|
|
|
.
|
\
|
+ +
+ +
+ +
+ +
= O
) (
) (
) (
) (
G C A G C A
T T C A C A
T G T G A A
T G C T G C
l k i f e c
f f j h d b
e d e d g a
c b a c b a
t t t t t t
t t t t t t
t t t t t t
t t t t t t
Majoritatea altor modele folosite fie pentru deducerea arborilor filogenetici pe
baza maximei verosimilitudini (maximum likelihood) sau pentru estimarea distanelor
evolutive perechi pot fi obinute restrngnd ali parametric ai modelului GTR. Spre
exemplu dac substituiile sunt mprite n transversii, tranziii ntre bazele purinice i
tranziii ntre bazele pirimidinice (adic a = c = d = f) obinem modelul lui Tamura i Nei
din 1993 (TrN). La fel putem obine modelul lui Kimura cu 3 tipuri de substituii (K3ST)
cernd ca toate bazele s aib aceiai frecven ( 4 1 = = = =
T G C A
t t t t ) i
mprind substituiile n tranziii (b = e), transversii de tipul A-T sau C-G (c = d) i
transversii de tipul A-C sau G-T (a = f). Alte restricii duc la modele mai simple i mai
des utilizate. Dac admitem c frecvena de echilibru a bazelor este aceiai (
4 1 = = = =
T G C A
t t t t ), iar toate substituiile au aceiai rat (a = b = c = d = e = f
= 1) modelul se reduce la cel al lui Jukes i Cantor din 1969 (JC).
28
|
|
|
|
|
|
|
|
|
.
|
\
|
= O
4
3
4
1
4
1
4
1
4
1
4
3
4
1
4
1
4
1
4
1
4
3
4
1
4
1
4
1
4
1
4
3
iar dac combinm frecvena bazelor i rata de substituie ntr-un singur parametru
4 / = o se obine o form mai simpl. Acest parametru reprezint probabilitatea
schimbrii unui nucleotid n oricare altul :
|
|
|
|
|
.
|
\
|
= O
o o o o
o o o o
o o o o
o o o o
3
3
3
3
Un alt model utilizat frecvent este cel al lui Kimura cu 2 parametri propus n 1980
(K2P). El ia n calcul observaia c tranziiile i transversiile au loc cu rate diferite, ns
n continuare admite o frecven egal a bazelor. Deci a = c = d = f =1 i b = e = k
obinndu-se:
|
|
|
|
|
|
|
|
|
.
|
\
|
+
+
+
+
= O
) 2 (
4
1
4
1
4
1
4
1
4
1
) 2 (
4
1
4
1
4
1
4
1
4
1
) 2 (
4
1
4
1
4
1
4
1
4
1
) 2 (
4
1
k k
k k
k k
k k
Dac avem rata tranziiilor de 4 / k = o i cea a transversiilor de 4 / = |
matricea de mai sus poate fi rescris ca :
|
|
|
|
|
.
|
\
|
= O
| o | o |
| | o | o
o | | o |
| o | | o
2
2
2
2
n matricea de mai sus | o / = k reprezint un indice ce arat predominana
tranziiilor asupra transversiilor. Dac k = 1, adic | o = modelul K2P se reduce la
cel JC.
29
Modelul K2P poate fi generalizat pentru a permite o frecven de echilibru inegal
(aa numitul model HKY85, propus de Hasegawa et al. n 1985). Matricea ratelor de
substituie a acestui model este dat de
|
|
|
|
|
.
|
\
|
+
+
+
+
= O
) (
) (
) (
) (
R C G C A
T Y A C A
T G R T A
T G C Y G
k
k
k
k
t t t t t
t t t t t
t t t t t
t t t t t
unde
T C Y G A R
k t t t t t t | o + = + = = = , , , . Aceasta corespunde modelului
GTR cu constrngerea ca a = c = d = f =1 i b = e = k. Modelul JC poate de asemeni fi
transformat pentru a permite frecvena inegal a bazelor azotate (modelul F81, propus
de Felsenstein n 1981). Acest lucru se poate face punnd k = 1 n matricea modelului
HKY85 de mai sus :
|
|
|
|
|
.
|
\
|
+
+
+
+
= O
) (
) (
) (
) (
R C G C A
T Y A C A
T G R T A
T G C Y G
t t t t t
t t t t t
t t t t t
t t t t t
Felsenstein a mai propus ulterior (n 1984) o alt metod ce ine cont de
frecvena inegal a bazelor ntr-un model cu 2 parametri. Acest model mparte
substituiile n dou componente : o rat general de substituie ce produce toate
tipurile de substituii, i o rat n grup ce produce doar tranziii. Matricea acestui model
poate fi obinut din cea a modelului GTR dac a = c = d = f = 1, b = (
R
K t / 1+ ), iar
e = (
Y
K t / 1+ ), unde K este parametrul ce arat raportul tranziii : transversii,
T C Y G A R
t t t t t t + = + = , , iar elementele din diagonal sunt calculate astfel
nct s reprezinte suma negativ a celorlalte elemente de pe rndul respectiv.
|
|
|
|
|
.
|
\
|
+
+
+
+
= O
G Y C A
T C R A
Y T G A
T R G C
K
K
K
K
t t t t
t t t t
t t t t
t t t t
) / 1 (
) / 1 (
) / 1 (
) / 1 (
Elementele din matricea de mai sus ce corespund tranziiilor au fiecare cte dou
componente, deoarece tranziiile au loc fie ratei generale fie ratei din grup. Cnd K = 0
acest model se rezum la cel F81, cnd K crete peste 0, tranziiile au loc din ce n ce
mai frecvent fa de transversii. Acest model este implimentat n pachetul de
programe PHYLIP 2.6 i toate versiunile ulterioare (Felsenstein, 2004).
Aceste matrice ne dau doar rata instantanee a substituiilor ntr-un moment de
timp dt, ns n cazul construciei arborilor filogenetici dup metoda maximei
30
verosimilitudini (ML) avem nevoie de probabilitile schimbrii oricrui caracter n
oricare altul nt-un ram de lungime t. Matricea probabilitii substituiilor se calculeaz
ca:
Qt
e t P = ) (
Aceleai modele de mai sus pot fi folosite i pentru a calcula distana dintre dou
secvene nucleotidice X i Y care s-au difereniat dintr-un strmo comun t timp n
urm.
2.4.3. ESTIMAREA NUMRULUI DE SUBSTITUII NUCLEOTIDICE
2.4.3.1. MODELUL JUKES CANTOR
Cel mai simplu model de substituie nucleotidic este cel propus de Jukes i
Cantor n 1969. Acest model presupune c substituia nucleotidic intervine n orice
site cu frecven egal, astfel nct, o nucleotid este nlocuit cu una din celelalte trei
nucleotide rmase cu o probabilitate pe an (sau o alt unitate de timp). Mai mult,
probabilitatea de nlocuire a unei nucleotide cu oricare din celelalte trei, este r=3,
unde r reprezint probabilitatea de nlocuire pe site pe an. Dac lum n considerare
dou secvene X i Y care au evoluat divergent dintr-o secven comun ancestral,
cu t ani n urm. Dac notm cu qt nucleotidele comune dintre cele dou secvene i
cu pt (pt=1 qt) proporia nucleotidelor diferite, procentul nucleotidelor comune qt+1
n timpul t+1 (msurat n ani), poate fi obinut astfel n primul rnd, trebuie s
precizm c acest site care prezint nucleotide comune pentru X i Y n timpul t, va
rmne neschimbat n timp, adic n t+1, cu o probabilitate (1-r)2 sau aproximativ 1-
2r, deoarece r reprezint o cantitate foarte mic astfel nct r2 poate fi neglijat. n plus,
un site care prezint nucleotide diferite n timpul t, va avea aceleai nucleotide n
timpul t+1 cu o probabilitate 2r/3. Aceast probabilitate este obinut innd cont de
faptul c n momentul n care secvenele X i Z au nucleotidele i respectiv j, n timpul t,
ele devin identice dac i n X se schimb cu j, dar j din Y rmne neschimbat sau
dac j din Y este nlocuit cu i, iar i din X rmne neschimbat. Probabilitatea de
apariie a primului eveniment este de (1-r)=r(1-r)/3, deoarece i in X trebuie s fie
nlocuit cu nucleotida j (cu o probabilitate mai mare dect cazul celorlalte dou
nucleotide), iar nucleotida j din Y trebuie s rmn neschimbat. Probabilitatea de
apariie a celui de-al doilea eveniment este de asemenea r(1-r)/3. Mai mult,
probabilitatea total este 2r(1-r)/3, care devine aproximativ 2r/3 dac nu se ine cont
de valoarea lui r2.
Dac:
( ) ( )
t t t
q r q r q + =
+
1
3
2
2 1
1
, care poate fi scris ca:
t t t
q
r r
q q
3
8
3
2
1
=
+
Dac notm diferena
t t
q q
+1
cu dq/dt, atunci vom abine:
q
r r
dt
dq
3
8
3
2
=
; innd cont de condiia iniial q=1 la t=0, atunci:
31
( )
3 / 8
1
4
3
1
rt
e q
=
.
n cazul prezentului model, numrul ateptat de substituii nucleotidice pe site (d)
pentru dou secvene este 2rt. Din acest motiv, valoarea lui d este dat de:
( ) ( ) | | p d 3 / 4 1 ln 4 / 3 = , unde: p=1-q este procentul nucleotidelor diferite
dintre X i Y (Jukes i Cantor, 1969).
O estimare a valorii ( ) d
=
, (Kimura i Ohta, 1972).
n cadrul acestui model, se presupune c rata substituiei nucleotidelor este
aceeai pentru fiecare pereche de nucleotide, astfel nct frecvenele ateptate ale
celor patru baze azotate A, T, C i G sunt egale cu 0,25. Oricum, nefcnd nici o
precizare referitoare la frecvena iniial, valoarea lui d rmne aceeai; altfel spus, nu
este necesar o constan a valorii frecvenelor nucleotidice, pentru ca ecuaia ce d
valoarea diferenei (d) s fie aplicabil (Rzhetsky i Nei, 1995).
2.4.3.2. MODELUL KIMURA CU 2 PARAMETRI
n cazul modelului lui Kimura cu 2 parametri se ea n considerare frecvena mai
mare a tranziiilor fa de cea a translaiilor, rata de substituie r fiind astfel | o 2 + i
nu 3o . Conform acestui model
) 1 )( 2 / 1 (
) 2 1 )( 4 / 1 (
8
8 ) ( 4
t
t t
e Q
e e P
|
| | o
+
=
+ =
iar ) 2 1 ln( ) 4 / 1 ( ) 2 1 ln( ) 2 / 1 ( 4 2 2 Q Q P t t rt d = + = | o
cu variana | |
2
3 1
2
3
2
1
) (
1
)
( Q c P c Q c P c
n
d V + + =
unde 2 / ) ( ,
2 1
1
,
2 1
1
2 1 3 2 1
c c c
Q
c
Q P
c + =
=
=
2.4.3.3. MODELUL TAJIMA - NEI
n modelul lui Tajima i Nei frecvena n echilibru a nucleotidelor este considerat
identic, iar
(
+ =
=
4
1
2 2
/ 1 ) 2 / 1 (
i
i
c p g d unde
= + =
=
3
1
4
1
2
2
i i j
j i
ij
g g
x
c cu xij (i < j) fiind
frecvena relativ a perechii de nucleotide ij din dou secvene de ADN comparate. n
acest caz variana lui d
este dat de
32
n p b
p p b
d V
2
2
) (
) 1 (
) (
=
Dac rata de substituie a nucleotidelor este aceiai pentru toate perechile de
nucleotide atunci b = n echilibru i ecuaia lui d se reduce la cea a metodei Jukes
Cantor, ns n practic b < i metoda Tajima - Nei d valori mai ridicate dect
metoda Jukes Cantor.
2.4.3.4. MODELUL TAMURA - NEI
Unul din modelele matematice ce d concluziile de ordin filogenetic prin metoda
maximum likelihood (ML) (metoda probabilitii maxime), este cel al lui Hasegawa et
al. (HKY) (1985). Acest model este un hibrid ntre modelul bazat pe 2 parametri al lui
Kimura i modelul inputului egal i ia n considerare att tranziiile ct i transversiile,
precum i valorile coninutului n GC. Oricum, formulele pentru valoarea lui ( ) d
n
cadrul acestui model sunt destul de complicate (Rzhetsky i Nei, 1995), astfel nct nu
ar trebui s nu-l lum n considerare. n plus, acest model este inclus n modelul
propus de Tamura i Nei (1993), ca un caz special, permind soluii analitice pentru
valoarea distanei (d). n acord cu acest model, formula pentru valoarea lui d este:
(
Q
g g g
g g g
g
g g g
g g
Q
g
P
g g
g
g
g g
Q
g
P
g g
g
g
g g
d
Y R Y
Y C T
R
R G A
Y R
Y C T
Y
Y
C T
R G A
R
R
G A
2
1
1 ln 2
2
1
2
1
2
2
1
2
1 ln
2
2 1
unde P1 i P2 sunt proporiile diferenelor de tranziii dintre A i G, respectiv dintre
T i C, iar Q este proporia diferenelor datorate transversiilor (Tamura i Nei, 1993).
Att formula pentru d
ct i pentru )
r
u
l
e
s
t
i
m
a
t
d
e
s
u
b
s
t
i
t
u
i
i
p
e
r
s
i
t
u
s
c
a
l
c
u
l
a
t
c
u
d
i
v
e
r
s
e
m
o
d
e
l
e
Figura 5 Numrul de substituii nucleotidice estimate folosind diferite metode (modelul
actual al substituiilor urmeaz modelul Tamura-Nei). Frecvenele nucleotidelor sunt g
A
= 0,3; g
T
=0,4; g
C
= 0,2; g
G
=0,1. Rata tranziii/transversii este
1
/ = 4 i
2
/ = 8. (dup
Nei & Kumar, 2000)
34
2.4.3.6. DISTANE GAMMA
n cadrul distanelor evolutive, rata de substituie a nucleotidelor, se presupune a fi
aceeai pentru toate siturile nucleotidice. n realitate, aceast presupunere nu este pe
deplin valabil, deoarece rata substituiei este diferit n situri diferite. n cazul genelor
care codific proteine, acest fapt este evident, deoarece prima, a doua i a treia
poziie a unui codon prezint diferite rate de substituie. Existena zonelor pliate n
zonele active ale proteinei, determin de asemenea rate diferite de substituie de-a
lungul siturilor nucleotidice. Variaia ratei de substituie poate fi observat i n genele
codificatoare din macromolecula de ARN, deoarece ARNs prezint fore de pliere i
adesea formeaz bucle i poriuni bicatenare la baza buclelor, care prezint diferite
rate de substituie. Analize statistice ale ratei de substituie (r) n diferite situsuri
nucleotidice, au sugerat c aceasta variaz urmnd aproximativ distribuia gamma
dat de ecuaia:
( )
( )
1
I
=
a br
a
r e
a
b
r f
, unde ( ) r V r a /
2
= i ( ) r V r b /
2
= , r i ( ) r V fiind
media i respectiv variana ratei de substituie r (Johnson i Kotz, 1970). ( ) a I este
funcia gamma, definit de formula:
( )
}
= I
0
1
dt t e a
a t
. Forma distribuiei ( ) r f este dat de valoarea lui a" care
este adesea numit conformaie gamma sau parametru gamma i de valoarea lui b
care este factor de mrime (Kocher i Wilson, 1991; Tamura i Nei, 1993; Wakeley,
1993, 1994).
Din acest motiv, unii autori dezvolt distanele gamma corespunztoare, pentru
substituia nucleotidelor. Distanele gamma pot fi derivate ale aceleiai metode
matematice, ca i cele utilizate pentru calcularea distanelor n cazul secvenelor de
aminoacizi.
2.4.4. ESTIMAREA NUMERIC A DISTANELOR EVOLUTIVE
Formulele analitice prezentate mai sus sunt bazate pe modele matematice de
substituie a nucleotidelor relativ simple, iar estimrile sunt aceleai cu estimrile prin
metoda maximei verosimilitudini pentru acelai model. Dac se dorete ns
efectuarea estimrilor pe baza unui model mai complicat cum ar fi Tamura-Nei
gamma sau GTR este mai util estimarea numeric a distanelor folosind metoda
maximei verosimilitudini. Spre exemplu, formula analitic pentru estimarea distanei
Tamura-Nei gamma necesit informaii privind frecvena nucleotidelor i a
parametrului a. Frecvena nucleotidelor este estimat din dou secvene de ADN
comparate, iar valoarea lui a este obinut utiliznd secvene adiionale.
Dac utilizm metode numerice este posibil estimarea frecvenei nucleotidelor i
valoarea parametrului a din setul de date. Altfel spus putem estima att toi parametrii
ct i distanele maximiznd verosimilitudinea pentru setul de date i topologia
35
corespunztoare. De asemeni este posibil selecia celui mai apropriat model al
substituiilor folosind testul LRT (likelihood ratio test). Metoda numeric d rezultate
bune atta timp ct numrul de nucleotide examinate n este foarte mare, iar topologia
folosit este mai mult sau mai puin corect. Cnd n este mic distanele estimate
obinute astfel nu dau o estimare bun a topologiei arborelui.
2.5. ARBORI FILOGENETICI
Analizele filogenetice ale secvenelor de ADN sau proteine, au devenit un mijloc
important pentru studiul istoriei evolutive a organismelor, de la bacterii la om. De cnd
s-a constatat c rata de evoluie a ADN variaz extensiv cu gena sau segmentul de
ADN (Wilson et al., 1977; Dayhoff et al., 1978), se pot studia relaiile filogenetice
existente ntre toate nivelele de clasificare ale organismelor (regnuri, filumuri, familii,
genuri, specii i populaii intraspecifice), utiliznd diferite gene sau secvene de ADN.
Analiza filogenetic este de asemeni important pentru elucidarea modelelor evolutive
ale familiilor de gene (Atchley et al., 1994; Goodwin et al., 1996; Nei et al., 1997) ca i
pentru explicarea proceselor de evoluie adaptativ, la nivel molecular (Jermann et al.,
1995; Chandrasekharan et al., 1996; Zhang et al., 1998).
Reconstrucia arborilor filogenetici utiliznd metode statistice a fost iniiat
independent n cadrul taxonomiei numerice, referitor la caracterele morfologice (Sokal
i Sneath, 1963) i n genetica populaional pentru frecvena genelor (Cavalli
Sforza i Edwards, 1964, 1967). Unele metode statistice dezvoltate n aceste scopuri
sunt nc utilizate pentru analiza statistic a datelor de ordin molecular, dar , recent,
numeroase metode noi au fost dezvoltate.
Relaiile filogenetice dintre organisme sau gene sunt de obicei prezentate sub
form de arbori filogenetici cu o rdcin (Figura 6a) sau fr rdcin (Figura 6b).
Modul n care se dispun ramurile ntr-un arbore filogenetic se numete topologia
arborelui. Exist un numr foarte mare de arbori (cu rdcin sau fr) pentru un
anumit numr de taxoni (orice tip de unitate taxonomic, fie ea familie, specie,
populaie, secven de ADN sau aminoacizi).
a b c d
c
d
a
b
Figura 6 Cele dou tipuri mari de arbori filogenetici: a-cu rdcina, b-
fr rdcin
a
b
36
Dac numrul taxonilor (m) este 4, exist 3 topologii posibile pentru arbori fr
rdcin i 15 pentru arbori cu rdcin. Numrul posibil de topologii crete brusc
odat cu creterea lui m. Numrul de topologii posibile pentru un arbore cu rdcin
ce prezint doar bifurcaii (rezolvat complet) este
| |
| | )! 2 ( 2
)! 3 2 (
) 3 2 ( 5 3 1
2
=
m
m
m
m
pentru m 2 > . Deci numrul posibil de topologii pentru m = 2, 3, 4, 5 i 6 este de 1, 3,
15, 105 i 945 respectiv. Cnd m = 10 el devine 34.459.425, doar una dintre aceste
topologii fiind cea adevrat! Pentru a calcula numrul total de topologii pentru un
arbore fr rdcin nlocuim n formula de mai sus m prin m 1.
ntr-un arbore filogenetic fr rdcin de m taxoni exist 2m 3 ramificaii, m
ramificaii externe i deci m 3 ramificaii interne. Numrul de noduri interne este de
m 2. Pentru un arbore cu rdcin numrul de ramificaii interne este de m 2,
numrul de noduri interne este de m 1, iar numrul total de ramificaii este de 2m
2.
Teoretic o secven de ADN se mparte dihotomic la fiecare speciaie sau
duplicaie de gene, arborii filogenetici fiind de obicei bifurcai. Totui cnd se studiaz
o secven relativ scurt unele ramificaii interne pot s nu prezinte nici o substituie
putnd aprea astfel arbori pluriramificai. Majoritatea metodelor folosite pentru
deducerea arborilor filogenetici construiesc arbori bifurcai, dar un arbore obinut poate
fi transformat ntr-unul pluriramificat eliminnd orice ramificaie cu lungime 0. Este
posibil de asemeni ca chiar dac adevrata filogenie este un fenomen dihotomic
arborele reconstruit s apar pluriramificat datorit erorilor statistice. n realitate cele
dou cazuri sunt practic imposibil de deosebit.
2.5.1. ARBORI AI GENELOR I ARBORI AI SPECIILOR
De cele mai multe ori suntem interesai s obinem un arbore filogenetic care s
reprezinte istoria evolutiv a speciilor sau populaiilor. Acest tip de arbore este
denumit arbore al speciilor sau al populaiilor. ntr-un arbore al speciilor momentul
divergenei dintre dou specii corespunde cu apariia izolrii reproductive. Totui cnd
se construiete un arbore filogenetic pornind de la o gen de la fiecare specie,
arborele obinut poate s nu fie n concordan cu filogenia speciilor. n cazul
existenei alelelor polimorfe divergena genelor are loc anterior separrii populaiilor
(Figura 7)
37
Cnd genele luate n studiu aparin unei familii multigenice poate s apar alt
problem. Dac spre exemplu dou specii nrudite 1 i 2 au dou gene duplicate, a1
b1 i a2 b2 respectiv, iar duplicarea a avut loc naintea separrii celor dou specii
atunci genele a1 i a2 sunt ortoloage, adic una este descendentul direct al celeilalte,
iar perechile a1 cu b1, a2 cu b2, a1 cu b2 i a2 cu b1 sunt paraloage, adic nu sunt
descinse direct una din cealalt. Cnd construim un arbore filogenetic al speciilor
trebuie s utilizm doar gene ortoloage i nu paraloage, deoarece doar primele
reprezint fenomenele de speciaie. diferenierea ntre cele dou tipuri de gene nu
este ntotdeauna simpl, mai ales n cazul familiilor multigenice, de aceia deducerea
filogeniei speciilor din cea a genelor trebuie fcut mereu cu mult grij.
Bineneles c nu ntotdeauna se caut a obine un arbore al speciilor. n studiul
familiilor multigenice se caut cunoaterea istoriei evolutive a membrilor familiei i
procesul duplicrii genelor.
O alt problem n reconstruirea arborilor filogenetici este c de multe ori
lungimea secvenelor utilizate este mic, aprnd erori statistice. O filogenie teoretic
construit dintr-un set de date cu lungime foarte mare i un numr ateptat de
substituii se numete arbore real, iar cel din secvenele disponibile cu numrul real de
substituii, arbore realizat, i unul i cellalt fiind diferii de fapt de arborele reconstituit
sau dedus. Majoritatea modelelor i metodelor de reconstrucie a arborilor filogenetici
au tendina de a produce filogeniile realizate, iar UPGMA pe cea real. Din pcate
aceast din urm metod este foarte sensibil la erori i dimensiunea setului de date.
Desigur c cel mai util este arborele real, cel ce reprezint evoluia istoric, ns n
practic este mult mai simplu s obinem arborele realizat, deoarece setul de date se
refer anume la acest tip de arbore. De asemeni topologia unei filogenii realizate este
aceiai cu cea a celei reale, exceptnd cazurile n care prima devine cu noduri
pluriramificate datorit erorilor statistice (unele ramificaii interne pot s nu prezinte
a b c d
A
B
dg
1
t
0
dg
2
-t
1
dg
3
-t
2
sp -t
3
populaie
polimorf
ancestral
Figura 7 Diagram ce arat c n cazul existenei polimorfismului,
momentul separrii genelor este anterior separrii populaiilor
38
nici o substituie). Odat cu creterea numrului de nucleotide utilizate arborele
realizat se apropie de cel real.
Cnd se construiete o filogenie a speciilor sau populaiilor arborele real trebuie
s aib lungimea ramificaiilor proporional cu timpul de evoluie, iar dou linii
evolutive descendente din acelai nod intern trebuie s aib aceiai lungime. n
realitate ns rata de evoluie a genelor este supus erorilor randomice ct i anumitor
tipuri de presiune selectiv, astfel nct n unele linii gena poate evolua mai rapid, iar
n altele mai ncet, arborele realizat nereuind s produc tipul de arbore filogenetic
descris mai sus.
2.5.2. METODE DE RECONSTRUIRE A ARBORILOR FILOGENETICI
Metodele utilizate la ora actual pentru reconstruirea arborilor filogenetici pot
fi mprite n trei mari categorii:
1. metode bazate pe distane
2. metode MP (Maximum Parsimony)
3. metode ML (Maximum Likelyhood)
Reconstrucia unui arbore filogenetic este de obicei privit ca deducerea statistic a
adevratului arbore filogenetic care este necunoscut. Acest proces poate fi subprit
n dou etape i anume estimarea topologiei i estimarea lungimii ramificaiilor. Cnd
topologia este cunoscut estimarea lungimii ramificaiilor este relatv simpl,
utilizndu-se metode ca cea a ptratelor minime sau ML. Cum pentru un numr dat de
secvene exist foarte multe topologii posibile au fost dezvoltate metode de optimizare
a cutrii cum ar fi cea a maximei verosimilitudini (ML) sau a evoluiei minime (ME).
Pentrun secvene mici i un numr de specii mare aceste metode tind ns s dea
topologii greite.
2.5.2.1. METODE BAZATE PE DISTANE
n cadrul metodelor bazate pe distan sau pe matrixul de distan, acestea sunt
calculate pentru toate perechile de taxoni, iar arborii filogenetici sunt construii innd
cont de relaiile stabilite n jurul valorilor acestor distane.
n acest caz, direciile filogenetice sunt construite considernd matrici ale
distanelor n care sunt calculate distanele ntre secvene luate dou cte dou.
Exist un numr foarte mare de metode prin care se pot estima direciile filogenetice
pornind de la distane.
UPGMA (Unweighted Pair-Group Method using Arithmetic Averages)
Numele metodei provine de la unweighted pair-group method using arithmetic
averages" (UPGMA). Metoda este atribuit autorilor Sokal i Michener (1958), dar s-a
constatat ulterior c prezenta metod este complet diferit de cea utilizat de acetia.
n schimb, algoritmul apare publicat de ctre Sneath i Sokal (1973). Un arbore
construit pe baza acestei metode este numit i fenogram, deoarece a fost iniial
folosit la reprezentarea gradului de similaritate fenotipic pentru un grup de specii, n
cadrul taxonomiei numerice. Oricum, poate fi folosit n filogenia molecular atunci
cnd rata de substituie a genelor este mai mult sau mai puin constant. n special n
39
cazul n care frecvena genelor este folosit n reconstrucia filogenetic, acest model
produce arbori destul de buni, comparativ cu alte metode bazate pe distan (Nei et
al., 1983; Takezaki i Nei, 1996). n acest caz, o msur a distanei care prezint un
coeficient mai mic de variaie, pare s duc la construirea de arbori cu o mai mare
precizie, comparativ cu alte metode de determinare a distanei, chiar dac nu respect
exact numrul de substituii genice (Takezaki i Nei, 1996). Prin UPGMA se pot
construi arbori pentru evoluia n cadrul speciilor, cu toate c erori de topologie apar
adesea cnd rata substituiei genelor nu este constant sau cnd numrul de gene
sau nucleotide este mic.
n cadrul UPGMA, un mod de msurare a distanelor evolutive, este calcularea
acestora pentru toate perechile de taxoni sau secvene, valorile distanelor fiind sub
forma unei matrici (Tabelul 4)
Tabel 4 Prima matrice a distanelor (Nei i Kumar, 2000)
Taxon 1 2 3 4
2 d12 - - -
3 d13 d23 - -
4 d14 d24 d34
5 d15 d25 d35 d45
Din aceast matrice, rezult c dij reprezint distana dintre taxonii i i j. Analiza
grupat (de tip clustal) a taxonilor ncepe cu perechea de taxoni ntre care exist cea
mai mic distan. Presupunnd c d12 este cea mai mic distan dintre toate
valorile matricei rezultate, taxonii 1 i 2 vor fi grupai pornind dintr-un ram comun
localizat la distana b=d12/2. Din acestea, putem presupune c lungimea ramurilor
celor doi taxoni care provin dintr-un ram comun, este aceeai. n acest caz, taxonii 1 i
2 vor fi ncadrai ntr-un singur taxon compus sau grup [u=(1-2)], iar distana dintre
acest grup i un alt taxon k (k1,2) este dat de: duk=(d1k+d2k)/2. n plus, obinem o
nou matrice (Tabel 5)
Tabel 5 A doua matrice a distanelor (Nei i Kumar, 2000)
Taxon u=(1-2) 3 4
3 du3 - -
4 du4 d34 -
5 du5 d35 d45
n continuare, presupunnd c distana du3 este cea mai mic, taxonii u i 3 vor fi
ncadrai ntr-un nou taxon compus sau cluster [v=(1-2-3)], cu o lungime a ramului
comun de b=du3/2=(d13+d23)/(2x2). Aceast distan ntre noul cluster (grup) creat v
i fiecare dintre taxonii rmai (k), este dat de: dkv=(dk1+dk2+dk3)/3. Atunci
matricea se va transforma n (Tabelul 6):
Tabel 6 A treia matrice a distanelor
Taxon v=(1-2-3) 4
4 dv4 -
5 dv5 d45
Presupunnd c dv4 este cea mai mic valoare din matricea anterioar, putem
ncadra v=(1-2-3) i 4 ca avnd un ram comun dat de b=dv4/2=(d14+d24+d34)/(3x2).
40
Este evident c ultimul taxon care se altur celorlali trei, este 5 i ramul comun este
dat de: b=(d15+d25+d35+d45)/(4x2).
Este de asemenea posibil, ca n cea de-a doua matrice cea mai mic distan
poate fi d45 (sau oricare alta n afar de du3). n acest caz, taxonii 4 i 5, sunt unii cu
ramura comun dat de b=d45/2, crendu-se astfel un nou taxon compus, v=(4-5).
Distanele ntre v i alt taxon (3 i u) sunt date de d3v=(d34+d35)/2 i
duv=(d14+d15+d24+d25)/4. Presupunnd c duv este cel mai mic, taxonii u i v sunt
grupai iar taxonul 3 va fi ultimul care se va altura grupului. De asemenea, dac d3v
este cel mai mic, taxonii 3 i v se vor grupa primii.
Dup cum reiese din exemplul anterior, distana dintre dou grupuri (A i B) este
dat de urmtoarea formul:
( )
=
ij
ij AB
rs d d / , unde r i s sunt numerele de taxoni n grupele A i B,
iar
ij
d este distana dintre taxonul i din grupul A i taxonul j din grupul B. Ramura
comun dintre cele dou grupe, este dat de dAB/2. Cu toate acestea, n scopul
modelrii pe calculator, ecuaia de mai sus nu este utilizabil, fiind folosii algoritmi
mai facili pentru a calcula dAB (Swofford et al., 1996).
METODA PTRATELOR MINIME (LS Least Squares)
Cnd rata de substituie a nucleotidelor variaz de la un taxon la altul metoda
UPGMA d adeseori filogenii cu topologie greit. n acest caz poate fi utilizat
metoda ptratelor minime.
n cazul metodei ptratelor minime obinuite, se ia n considerare urmtoarea
sum rezidual a ptratelor
<
=
j i
ij ij R
e d S
2
) (
unde dij i eij sunt distanele observat i respectiv patristic dintre taxonii i i j.
Distana patristic este suma lungimii estimate a ramificaiilor ce unesc cei doi taxoni.
SR este calculat pentru toate topologiile plauzibile i topologia cu cea mai mic
valoare este aleas drept filogenie final. O alt posibilitate de a calcula SR este
aplicnd formula :
| |
<
=
j i
ij ij ij R
d e d S / ) (
2
n practic cele dou formule dau rezultate identice sau aproape identice. O problem
ce se datoreaz criteriului de optimizare al acestei metode este obinerea frecvent a
ramificaiilor cu lungime negativ (ceia ce din punct de vedere biologic este imposibil).
Felsenstein (1995) a mbuntit metoda LS prin aplicarea constrngerii de a
considera doar topologiile cu ramificaii nenegative.
41
2.5.2.2. METODA EVOLUIEI MINIME (ME)
n cadrul acestei metode, suma lungimilor tuturor ramurilor estimate este:
=
T
i
i
b S
fiind calculat pentru toate topologiile posibile, cea corect, fiind topologia cu cea mai
mic valoare a lui S. n acest caz,
i
b
|) a tuturor
lungimilor estimate ale ramurilor, fr nici o justificare teoretic. Dar, ( ) S L
nu
prezint proprieti statistice care s permit un calcul rapid al valorii lui S, iar testele
statistice dezvoltate de Rzhetsky i Nei (1992, 1993)nu sunt aplicabile pentru L(S). De
menionat este faptul c n prezena erorilor estimate statistic ale ramurilor cu lungime
mic, poate deveni negativ chiar i pentru o topologie corect a arborelui (Sitnikova
et al., 1995).
ME presupune o examinare a tuturor topologiilor posibile i gsirea celei cu cea
mai mic valoare S pn la epuizarea tuturor variantelor, iar arborele cu cea mai mic
valoare S, este considerat ca fiind un arbore filogenetic ME. Baza teoretic a acestei
strategii, este faptul c arborii filogenetici ME sunt n general identici sau asemntori
cu arborii Neighbor Joining (NJ), cnd valoarea lui m este relativ mic (Saitou i
Imanishi 1989; Rzhetsky i Nei, 1992), astfel nct arborii de tip NJ pot fi folosii ca
punct de plecare cnd valoarea lui m este mare.
2.5.2.3. METODA NEIGHBOR JOINING (NJ)
Dei metoda ME are proprieti statistice utile, necesit o perioad de calcul
suficient de mare atunci cnd numrul taxonilor comparai este mare. Saitou i Nei
(1987) au dezvoltat o metod eficient de realizare a arborilor filogenetici, care se
bazeaz pe principiul evoluiei minime (ME). Aceast metod nu examineaz toate
topologiile posibile, dar n fiecare stadiu de grupare a taxonilor, se folosete un
principiu de evoluie minim. Aceast metod se numete Neighbour Joining (NJ) i
este privit ca o versiune simplificat a metodei ME. Cnd se folosesc 4 din 5 taxoni,
metodele NJ, ME dau rezultate identice (Saitou i Nei, 1987). Exist o oarecare
asemnare ntre NJ i metoda adiional de realizare a arborilor, care d att
topologia ct i lungimea ramurii simultan.
Unul dintre conceptele importante n aceast metod, este reprezentat de
neighbors, definii ca doi taxoni conectai printr-un singur nod ntr-un arbore fr
punct de origine. De exemplu, taxonii 1 i 2 din arborele prezentat n Figura 37, sunt
considerai neighbors (vecini), pentru c sunt conectai doar prin nodul A. Similar,
42
taxonii 5 i 6 sunt considerai neighbors, dar toate celelalte perechi nu. Cu toate
acestea dac se combin taxonii 1 i 2 i se consider ca fiind un singur taxon,
acesta, (1-2) i taxonul 3 sunt acum neighbors. Este posibil definirea topologiei unui
arbore prin alturri succesive ale taxonilor vecini (nj) i producerea unor noi perechi
de taxoni vecini. De exemplu, topologia arborelui din Figura 8 poate fi descris prin
urmtoarele perechi de taxoni vecini (neighbors): (1, 2), (5, 6), (1 2, 3) i (1 2
3,4). Astfel, prin gsirea acestor perechi de taxoni vecini, se poate obine topologia
arborelui.
Figura 8 Arborele filogenetic cu lungime tiut a ramurilor, pentru ase secvene
(Nei i Kumar, 2000)
Construirea unui arbore prin intermediul acestei metode, ncepe cu arborele n
form de stea care este produs, pe baza presupunerii c nu exist o grupare a
taxonilor (Figura 9). n practic, aceast presupunere este n general incorect. Astfel,
dac se estimeaz lungimea ramului unui arbore n form de stea i se calculeaz
suma tuturor ramurilor (S0), aceast sum ar trebui s fie mai mare dect suma (SF)
pentru arborele de tip NJ final. Dac se elimin taxonii vecini 1 i 2 din cadrul arborelui
prezentat n Figura 10, suma (S12) a tuturor lungimilor ramurilor, trebuie s fie mai
mic dect S0, cu toate c este posibil s fie mai mare dect SF. n practic,
deoarece nu se tie exact care perechi de taxoni sunt vecini, se consider toate
perechile de taxoni, ca poteniale perechi de taxoni vecini i se calculeaz suma
lungimilor ramurilor (Sij) pentru taxonii i i j, utiliznd o topologie similar cu cea din
Figura 39, se pot alege taxonii i i j care au cea mai mic valoare pentru Sij Desigur,
valorile distanelor sunt subiectul erorilor stochastice, astfel nct taxonii vecini alei n
acest mod, nu sunt ntotdeauna adevraii taxoni vecini. O dat identificat o pereche
de taxoni vecini, aceti sunt ncadrai ntr-un taxon compus, procedura repetndu-se
pn la producerea arborelui final.
43
Figura 9 Arbore filogenetic n form de stea (Nei i Kumar, 2000)
Figura 10 Separarea primilor taxoni vecini (1 i 2), (Nei i Kumar, 2000)
Matematic, valoarea sumei S0 pentru un arbore n form de stea este:
( ) 1
1
1
1
0
=
= =
=
m T d
m
L S
m
j i
ij
m
i
iX
, unde
iX
L este lungimea braului
estimat ntre nodurile i i X, iar T=i<jdij. n acest caz, i reprezint un anumit nod
exterior, iar X nodul interior (Figura 9). n situaia opus, aa cum este n cazul Figurii
10, din care reiese faptul c suma S12 este dat de L1X+L2X, LXY i
=
m
i
iZ
L
3
. Dar,
12 2 1
d L L
X X
= + ,
( )
( ) ( )( )
s =
= =
=
(
+ +
=
j i
m
i
iY
m
i
m
i
iY X X i i XY
dij
m
L
d L L m d d
m
L
3 3
3 3
2 1 2 1
3
1
2 2
2 2
1
44
Din care, rezult:
( )
( )
s = =
+ +
= + + + =
j i
ij
m
i
i i
m
i
iY XY X X
d
m
d d
m
L L L L S
3 3
2 1
3
2 1 12
2
1
2 2
1
Dac notm cu
=
=
m
i
i
d R
3
1 1
i
=
=
m
i
i
d R
3
2 2
, atunci S12 poate fi exprimat:
( ) 2 2 2
2
12 2 1
12
d
m
R R T
S +
=
Desigur, Sij poate fi calculat n acelai mod dac nlocuim 1 i 2 cu i i j n
ecuaia de mai sus. Ultima ecuaie necesit mult mai puin timp de calcul dect cea
anterioar. Mai mult, dac T este acelai pentru toate perechile de tipul i i j, Sij poate
fi nlocuit cu:
( )
j i ij ij
R R d m Q = 2
n scopul de a calcula valoarea relativ a lui Sij.
O dat cu determinarea celei mai mici valori a lui Sij, poate fi creat un nou nod (A),
care permite conectarea taxonilor i i j. Lungimile braelor (bAi i bAj) din acest nod
pn la taxonii i i j sunt date de:
( )
( ) | |
( )
( ) | |
j i ij Aj
j i ij Ai
R R d m
m
b
R R d m
m
b
+
2
2 2
1
2
2 2
1
, (Saitou i Nei, 1987)
Aceste valori sunt determinate prin metoda ptratului minim, pentru actuala
topologie a arborelui. Urmtorul pas, este calcularea distanei ntre noul nod A i
taxonii rmai (k; 3km) (Figura 11).
Figura 11 Separarea nodului A de restul taxonilor, (Nei i Kumar, 2000)
45
Figura 12 Separarea taxonilor 5 i 6 prin formarea nodului B,
(Nei i Kumar, 2000)
Figura 13 Separarea taxonului 3 prin apariia nodului C,
(Nei i Kumar, 2000)
Figura 14 Separarea taxonului 4 prin apariia nodului D,
(Nei i Kumar, 2000)
46
Aceast distan este dat de:
( ) 2
ij jk ik Ak
d d d d + =
Dac se calculeaz toate distanele pe baza acestei valori, vom obine o nou
matrice de tipul (m-1)(m-1). Pentru aceast nou matrice, putem calcula o nou sum
Sij, care va fi notat cu Sij`, deoarece nu include lungimea ramurilor externe pentru
prima pereche de taxoni vecini identificai, astfel nct apare ca fiind mai mic dect
suma total (Sij) a lungimii braelor la acest nivel al construciei arborelui filogenetic.
Pentru gsirea unei noi perechi de taxoni vecini, se ia n considerare din nou
perechea cu cea mai mic valoare Sij. Un nou nod B poate fi creat pentru aceast
nou pereche de taxoni i o nou valoare a matricei distanei (m-2)(m-2) este
calculat. Aceast procedur se repet, pn cnd toi taxonii sunt grupai ntr-un
singur arbore fr punct de origine (unrooted tree) de tip neighbour joining (Figurile 12
- 14).
2.5.2.4. ALEGEREA TIPULUI DE DISTAN EVOLUTIV FOLOSIT N
RECONSTRUCIILE FILOGENETICE
Acurateea unei filogenii deduse pe baz de secvene depinde de doi factori : (1)
relaia liniar dintre distana estimat i numrul real de substituii i (2) eroarea
standard a coeficientului de variaie a distanei utilizate. Pn n momentul de fa nu
a fost pus la punct nici un test statistic general valabil pentru a putea alege modul de
estimare a distanei evolutive. Totui n urma estimrilor pe calculator i a datelor
experimentale s-a ajuns la o serie de generalizri utile:
1. Cnd numrul de substituii nucleotidice estimat prin metoda JC este 05 , 0 s
se recomand utilizarea distanei p sau distana JC chiar dac exist diferen ntre
numrul de transversii i tranziii sau dac rata de substituie r variaz de la situs la
situs. n acest caz utilizarea modelului K2P sau a altor modele mai complexe d
acelai rezultat ns aceste metode au o varian mai mare datorit numrului mai
mare de parametri.
2. Cnd 0,05<d<1.0, iar numrul de nucleotide examinate este mare se
recomand utilizarea distanei JC. Dac raportul R dintre tranziii i transversii este
mai mare ca 5 iar numrul de nucleotide examinate este mare este recomandat
folosirea modelului K2P sau distana gamma. Dac ns numrul de secvene folosite
este mare, iar n este mic atunci distana p d cele mai bune rezultate (doar dac rata
de substituie nu variaz foarte mult pentru diverse linii filogenetice). n ultimii ani s-a
observat o utilizare frecvent a estimrii gamma a modelului HKY, deoarece acesta
ine cont de coninutul n perechi GC, raportul R dintre tranziii i transversii i variaia
ratei de substituie ntre situsuri. Datorit varianei mari modelul HKY d ns de obicei
rezultate mai proaste dect utilizarea distanelor p sau JC. Doar n cazurile extreme
cnd n > 10000, iar rata de substituie a nucleotidelor variaz foarte mult de la o linie
evolutiv la alta utilizarea modelelor complexe cum ar fi HKY este ndreptit.
3. Cnd d > 1 pentru mai multe perechi de secvene arborele filogenetic construit
este de obicei greit (din cauza varianei mari a distanelor estimate i a erorilor de
aliniere). Acest tip de seturi de date trebuiesc ocolite pe ct este posibil eliminnd
poriunile slab conservate folosindu-le pe cele mai puin variabile (ca n cazul
47
imunoglobulinelor unde regiunile variabile nu sunt utilizate n construirea arborilor
genelor).
4. n cazul utilizrii secvenelor ce codific proteine distincia ntre substituiile
sinonime (ds) i cele nesinonime (dn) poate fi util deoarece rata substituiilor
sinonime este mai mare datorit faptului c acestea sunt neutre din punct de vedere
selectiv. Astfel utiliznd ds se poate evita diferena dintre rata de substituie ntre
situsurile sinonime i cele nesinonime. Acest lucru se poate face doar dac ds < 0,5.
Pentru specii mai ndeprtate filogenetic dn d rezultate mai bune deoarece ds sau ps
pot da estimri greite datorit saturrii rapide cu mutaii a situsurilor.
5. Cnd mai multe tipuri de estimri a distanelor evolutive dau rezultate similare
este recomandat utilizarea celui mai simplu model de substituie deoarece cele mai
complexe au o varian mai mare. Cnd rata de substiie a nucleotidelor este
aproapre identic pentru toate liniile evolutive i aportul R dintre tranziii i transversii
nu este mare distana p pare s dea topologii corecte mai frecvent dect alte metode,
chiar dac divergena dintre secvene este mare.
2.5.2.5. METODA MAXIMUM PARSIMONY (MP)
Metod iniial elaborat pentru caracterele morfologice, prezint mai multe
versiuni (Wiley, 1981; Felsenstein, 1982; Wiley et al., 1991; Maddison i Maddison,
1992; Swofford i Begle 1993). Eck i Dayhoff n 1996 par a fi fost primii care au
utilizat aceast metod pentru realizarea arborilor, pornind de la secvene de
aminoacizi. Fitch (1971)i Hartigan (1973) au elaborat un algoritm mai riguros al
metodei MP pentru secvene de nucleotide. n cadrul acestei metode se iau n
considerare 4 sau mai multe secvene aliniate de nucleotide sau aminoacizi (m4), iar
nucleotidele (aminoacizii) taxonilor ancestrali sunt luate n considerare separat pentru
fiecare site i o anumit topologie, presupunnd c modificrile produse de mutaii
apar la nivelul oricreia dintre cele patru nucleotide (sau 20 de aminoacizi). Se
calculeaz apoi, cel mai mic numr de substituii nucleotidice (sau de aminoacizi) care
explic ntregul proces evolutiv pentru o anumit topologie. Acest calcul este realizat
pentru toate topologiile presupuse a fi corecte i topologia care implic cel mai mic
numr de substituii este aleas ca reprezentnd arborele corect. Cu ct este implicat
mai puin procesul evolutiv de creare a unei inferene filogenetice, cu att putem
obine concluzii mai exacte.
Dac nu exist substituii n paralel sau n sens invers (nu exist omologie) la
fiecare site nucleotidic i numrul de nucleotide examinate (n) este foarte mare, ar
trebui ca utiliznd MP s se obin arborele real. Cu toate acestea, n practic,
secvenele de nucleotide sufer adesea substituii n paralel sau n sens invers, i n
este relativ mic. n acest caz, MP tinde s confere o topologie incorect. n plus,
Felsenstein (1981) a artat c atunci cnd rata substituiei nucleotidelor variaz
proporional cu direcia evolutiv, MP poate genera topologii incorecte chiar i atunci
cnd se examineaz un numr foarte mare de nucleotide. n anumite condiii, aceasta
se poate ntmpla chiar i atunci cnd rata de substituie este constant pentru toate
direciile evolutive (Hendy i Penny, 1989; Takezaki i Nei, 1996). n acest caz,
ramurile lungi (sau cele scurte) ale arborelui real, tind s se alture, sau se atrag n
cadrul arborelui final. Astfel, acest fenomen, este adesea numit long branch
attraction (engl. atracia dintre ramurile lungi) (Hendy i Penny, 1989) sau Short
branch attraction (engl. atracia dintre braele scurte) (Nei, 1996). n analiza
parsimoniei este de asemenea dificil abordarea inferenei filogenetice ntr-un cadru
48
statistic, deoarece nu exist o cale de calcul a mediei i varianei numrului minim de
substituii obinute pe criteriul parsimoniei.
Cu toate acestea, MP prezint avantaje comparativ cu alte metode de realizare a
arborilor. n primul rnd, nu implic folosirea unui numr mare de supoziii necesare n
cadrul metodelor bazate pe distan sau probabilitatea substituiei nucleotidelor (sau
aminoacizilor). n timp ce toate modelele matematice utilizate n prezent, reprezint o
aproximare a realitii, MP poate furniza arbori adecvai comparativ cu alte metode
atunci cnd gradul de divergent al secvenelor este sczut. De fapt, simulrile au
artat c atunci cnd: 1. gradul de divergen al secvenelor este sczut (d0,1); 2.
rata substituiei nucleotidelor este mai mult sau mai puin constant; 3. numrul de
nucleotide examinate este mare, metodele MP sunt adesea mai bune dect metodele
bazate pe distan, n obinerea unor topologii reale (Sourdis si Nei 1988;Nei 1991).n
plus, analiza parsimoniei este foarte util pentru anumite tipuri de date moleculare, de
tipul secvenelor inserate sau inserii/deleii.
2.5.2.6. VARIANA I COVARIANA BOOTSTRAP (REPLICRILOR REPETATE)
Exist unele metode de estimare a numrului de substituii ale aminoacizilor ntre
dou secvene, n funcie de modelul matematic folosit. n practic, orice model este o
aproximare a realitii i d numai valori aproximative ale substituiei aminoacizilor.
Mai mult, formulele analitice pentru calcularea distanelor varianelor estimate sunt de
asemenea aproximative.
Cnd trebuiesc estimate lungimile ramurilor unui arbore filogenetic pentru mai
multe secvene, aceasta se poate realiza prin metoda LS (least-square = metoda
ptratului minim), dar trebuiesc cunoscute varianele i covarianele distanelor
estimate pentru toate perechile de secvene diferite.
n aceste cazuri, se poate folosi metoda bootstrap pentru calcularea varianelor i
covarianelor distanelor msurate. Aceast metod nu necesit formularea unei
ipoteze referitoare la distribuiile distanelor, exceptnd faptul c fiecare site al unui
aminoacid poate evolua independent (Efron, 1982a, 1982b; Efron i Tibshirani, 1993).
Presupunnd c avem trei secvene proteice cu n aminoacizi, nrudite evolutiv:
x11 x12 x13 x14 x15.....x1n
x21 x22 x23 x24 x25.....x2n
x31 x32 x33 x34 x35.....x3n
Xij reprezint aminoacidul din poziia j secvena i. Putem astfel, calcula valorile dij
pentru secvenele i i j. Mai mult, se poate obine chiar o estimare a distanei pentru
fiecare pereche de secvene.
n cadrul acestei metode, pentru calcularea varianelor i covarianelor, o secven
aleatoare de trei aminoacizi cu n situsuri de aminoacizi este generat din setul original
de date. Aceast prob (model) este produs prin luarea de probe (separarea de
modele) din cadrul situsurilor aminoacizior (pe coloane), cu nlocuire, utiliznd numere
pseudoaleatoare. Acest model aleator al secvenelor de aminoacizi poate include
dou sau mai multe reprezentri ale unui site, dar nici o reprezentare a altuia. De
exemplu, un model aleator poate avea urmtoarele secvene cu n situsuri de
aminoacizi.
49
x11 x12 x12 x14 x15.....x1n-1
x21 x22 x22 x24 x25.....x2n-1
x31 x32 x32 x34 x35.....x3n-1
Acesta, poart numele de bootstrap resampled data set i odat obinut, o
estimare a distanelor este calculat cu ajutorul ecuaiilor:
( )
( ) | | 1 1
1
1
=
=
=
o
o
/
ln
/
p d
p d
n n p
R
d
, pentru oricare trei perechi de secvene.
Dac aceasta se repet de B ori, poate fi generat distana B pentru un numr dat
de perechi de secvene. Se noteaz cu
b
d
i d
=
B
b
b B
d d
B
d V
1
2
1
1
, unde d = media valorilor
b
d
la sfritul tuturor
replicrilor. Pentru calcularea ( ) d V
B
=
B
b
kl klb ij ijb kl ij B
d d d d
B
d d Cov
1
2 2
1
1
,
, unde ij i kl se refer la perechile de
secvene i i j, k i l.
Un avantaj al acestei metode este acela c poate calcula variana i covariana,
chiar atunci cnd nu sunt disponibile formulele matematice i ofer estimri mai bune
dect alte formule analitice (Efron i Tibshirani, 1993).
2.6. SITUSURI INFORMATIVE I HOMOPLAZIA
Un situs nucleotidic este informativ numai dac favorizeaz o anumit filogenie
fa de altele. n cutarea arborelui MP situsurile identice pentru toate speciile sunt
eliminate, fiind folosite doar cele variabile. Nu toate situsurile variabile sunt utile pentru
a gsi o filogenie MP. Spre exemplu situsurile la care exist diferene unice (Figura
15) nu sunt informative deoarece ele pot fi explicate prin acelai numr de substituii
oricare ar fi topologia.
Lund n considerare urmtoarele patru secvene ipotetice se poate ilustra mai
exact diferena dintre situsurile informative i neinformative
50
Secvena
Situsuri omoloage
1 2 3 4 5 6 7 8 9
1 T A G A G A T C G
2 T G C C G A T C A
3 T G A T A A C C G
4 T G A G A A C C A
Exist trei arbori fr rdcin posibili pentru 4 secvene. Situsul 1 nu este
informativ, toate secvenele avnd A n aceast poziie, deci nu este necesar nici o
schimbare pentru oricare din cele trei topologii. Pentru situsul doi secvena 1 are A,
celelalte 3 avnd G. Deci se poate presupune c n cadrul taxonului 1 a avut loc o
mutaie care a substituit G cu A. Nici acest situs nu este informativ deoarece oricare
din cele 3 filogenii necesit o singur schimbare. Dup cum se arat n figura 12 de
mai sus, pentru situsul 3 oricare dintre topologii necesit 2 mutaii, deci nici acest
situs nu este informativ. Se observ c dac n topologia I n nodul intern ce duce la
taxonii 1 i 2 am avea C n loc de G, numrul de scimbri este tot de dou. Pentru
situsul 4 oricare ar fi topologia sunt necesare tot dou schimbri, deci nici acesta nu
Topologie I Topologie II Topologie III
Situs
3
Situs
4
Sit
Figura 15 Tipuri de situsuri
51
este informativ. Pentru situsul 5, filogenia I necesit o singur schimbare, pe cnd
filogeniile II i III necesit cte 2, deci abea acest situs este informativ.
Din acest exemplu i din cele spuse mai sus se poate vedea c este informativ
numai un situs ce are cel puin dou tipuri de nucleotide, fiecare fiind prezent de cel
puin dou ori. Pentru aceste situsuri informative ( situsurile 5, 7 i 9) topologia I
necesit 1, 1 i 2 mutaii respectiv, topologia II necesit 2, 2 i 1 mutaie, iar topologia
III necesit 2, 2 i 2 respectiv. Deci arborele I este ales ca fiind Arborele MP el
necesitnd cel mai mic numr de mutaii.
Deoarece doar situsurile informative sunt utile n definirea filogeniilor MP pentru a
obine o topologie viabil sunt necesari un numr mare de asemenea situsuri. Dac
ns secvenele au un grad nalt de homoplazie (mutaii paralele i napoi), topologia
va fi incorect chiar pentru un numr foarte mare de situsuri informative. Din acest
motiv a fost propus un indice numit indice de consisten care msoar gradul
homoplaziei. Pentru un singur situs nucleotidic i acest indice este dat de ci = mi / si
unde m este numrul minim posibil de substituii pentru respectivul situs pentru orice
topologie i este egal cu numrul de nucleotide observate minus unu, deoarece o
stare este considerat cea ancestral, iar s este numrul de substituii pentru
respectiva topologie.
Limita de jos a indicelui de consisten nu este 0 i ci variaz pentru fiecare
topologie n parte. Din aceste motive se folosesc ali doi indici i anume indicele de
retenie i indicele de consisten recalculat. Indicele de retenie poate fi calculat ca ri
= (gi - si)/(gi - mi) unde gi este numrul maxim posibil de substituii pentru situsul i
pentru orice topologie i este egal cu numrul de substituii necesare pentru o
topologie n form de stea admind c cel mai frecvent nucleotid este ancestral i
este plasat n centru. Indicele de retenie devine 0 cnd gi = si, adic numrul maxim
de substituii este identic cu numrul de substituii pentru respectiva topologie.
Indicele de consisten recalculat (rci) este dat de ri X ci, adic
i
i
i i
i i
i
s
m
m g
s g
rc
=
Formulele de mai sus sunt date pentru un singur situs, practic ns este
necesar calcularea acestor valori pentru toate situsurile informative, calculndu-se n
final indici totali (CI - consistenci index, RI - retention index i RC - rescaled
consistenci index) dup formulele:
( ) ( )
RI
CI
RC m g s g RI s m CI
i
i
i
i
i
i
i
i
i
i
i
i
= = =
; ;
2.7. STRATEGII DE CUTARE A FILOGENIEI MP
Cnd numrul de secvene sau taxoni utilizai este mic, adic m < 10, se poate
calcula lungimea tuturor topologiilor posibile, alegnd topologia cu lungime minim ca
arborele MP. Acest tip de cutare se numete exhaustiv. Cum numrul de topologii
posibile crete foarte repede odat cu creterea lui m examinarea tuturor topologiilor
devine la un moment dat imposibil. Dac cunoatem a priori c o parte din topologii
sunt false, putem calcula doar lungimea celor rmase, acest tip de cutare fiind
cutarea arborilor specificai.
52
Cnd m > 10 cutarea arborilor specificai nu este aplicabil exist alte dou
modaliti numite metoda ramificrii i unirii (branch and bound) i cutarea
euristic. n cazul primei metode filogeniile care sunt evident mai lungi ca una
examinat anterior sunt ignorate toate, iar arborele MP este determinat calculnd
lungimea unui grup de arbori care au potenialul de a avea lungimea minim. n cea
de a doua metod este examinat doar o mic parte din toate topologiile posibile i nu
exist nici o garanie c va fi gsit topologia cu o lungime minim. Totui utiliznd
anumii algoritmi, probabilitatea gsirii topologiei corecte crete.
De multe ori nu exist o singur topologie de lungime minim ci mai multe. n
acest caz se practic reprezentarea unei filogenii-consens, care este o sintez a
tuturor filogeniilor obinute. n filogeniile-consens stric toate modurile de ramificare ce
intr n conflict sunt rezolvate prin crearea unui nod intern pluriramificat. n filogeniile-
consens dup regula majoritar acele moduri de ramificare care predomin sunt
pstrate n arborele final. De obicei se utilizeaz regula majoritar de 50%, adic
modurile de ramificare prezente n 50% sau mai mult dintre topologii sunt pstrate.
2.8. METODE ML (Maximum Likelihood)
Analizele filogenetice tind s deduc istoria evolutiv (sau un set de istorii
probabile) care corespunde cel mai bine setului de date observat (n cazul de fat este
vorba de secvene nucleotidice sau de aminoacizi dar poate fi vorba i de caractere
morfologice, frecvene ale genelor, situsuri de restricie etc.). Necunoscutele
problemei sunt ordinea de ramificare i lungimea ramurilor a filogeniei. Pentru a aplica
metodele ML este nevoie de un model concret de substituie ce descrie transformarea
unei secvene n alta.
Metodele ML de reconstrucie filogenetic evalueaz ipoteza despre istoria
evolutiv n termeni probabilistici (Care este probabilitatea c o anumit istorie
evolutiv - topologie i un anumit model de substituie vor da natere datelor
observate). O istorie evolutiv ce are o probabilitate mai mare de a da natere datelor
observate are prioritate fa de una cu o probabilitate mai mic. Aceast metod a fost
utilizat pentru prima dat n reconstruciile filogenetice de ctre Cavalli-Sforza i
Edwards n 1967 ns aceti autori au considerat calculele necesare prea complicate
pentru calculatoarele de la acea vreme i au dezvoltat metode aproximative ca de
exemplu ME (Huelsenbeck & Crandall, 1997). Felsenstein a utilizat pentru prima dat
aceast metod n 1981 pentru analiza filogenetic a secvenelor de nucleotide, dup
care metoda a nceput s fie din ce n ce mai utilizat. Printre avantajele acestei
metode se numr variana mic i posibilitatea utilizrii unui numr minim de
parametri. Chiar pentru un numr mic de nucleotide acest tip de metode depesc de
multe ori metodele bazate pe distane i cele MP.
Principiul de baz al metodei implic calcularea verosimilitudinii unei filogenii.
Deoarece majoritatea modelelor de substituie folosite sunt reversibile n timp,
verosimilitudinea unei filogenii este independent de localizarea rdcinii.
Presupunnd c fiecare situs evolueaz independent putem calcula verosimilitudinea
fiecrui situs separat i s combinm aceste valori pentru obinerea unei valori finale.
Pentru a calcula verosimilitudinea unui situs j trebuie s lum n considerare toate
scenariile posibile prin care starea final a situsului ar fi putut evolua. Bineneles c
unele scenarii sunt mult mai plauzibile dect altele, ns fiecare are o anumit ans
s se fi produs. Spre exemplu dac considerm o filogenie ca n fig. 14 a n rdcin
am fi putut avea teoretic oricare din cele 4 nucleotide (A, G, C, T), pentru oricare alt
53
nod intern este de asemeni posibil existena oricrui nucleotid. Deci avem un total de
4 X 4 = 16 posibiliti. Cum oricare dintre aceste 16 scenarii ar fi putut duce la setul
final de date observate, probabilitile tuturor evenimentelor trebuiesc calculate i
nsumate pentru a obine probabilitatea unui situs j (aceast probabilitate depinde
dup cum am mai menionat de topologie i de modelul de substituie nucleotidic)
(fig. 14 c). Cum am presupus c fiecare situs evolueaz independent de celelalte,
probabilitatea unui scenariu evolutiv este egal cu produsul probabilitilor tuturor
situsurilor 1, 2, 3, j n. Pentru c probabilitatea unei singure observaii este foarte
mic n locul lor se utilizeaz logaritmii acestora, deci probabilitile sunt acumulate ca
sum a logaritmilor verosimilitudinilor fiecrui situs luat n parte (fig. 14 e)
Din cauza volumului foarte mare de calcule ce trebuiesc efectuate dac numrul
de taxoni este mai mare ca 10 i secvenele utilizate sunt mari au fost dezvoltate o
serie de algoritmi de cutare (ca i n cazul metodelor MP).
Cum modalitatea real de substituie a nucleotidelor este foarte complicat, s-ar
putea crede c un model matematic cu muli parametri este mai bun dect un model
cu mai puini parametri. Totui chiar dac un model cu mai muli parametri
corespunde datelor mai exact dect unul mai simplu, numrul mare de parametri l
face mai sensibil la erori. Deci este mai util utilizarea unui model mai simplu atta
timp ct acesta aproximeaz modul de substituie al nucleotidelor suficient de bine.
n cazul metodelor ML corespondena dintre model i date poate fi examinat
folosind testul LR (Likelihood Ratio Test) sau criteriul informaiei al lui Akaike (AIC
Akaike Information Criterion). Cnd avem dou modele 1 i 2 i modelul 1 este caz
particular al modelului 2, iar topologia corect este cunoscut putem calcula testul LR
dup formula
) ln (ln 2
1 2
L L LR =
unde lnL1 i lnL2 sunt valorile ML pentru modelele 1 i 2. n acest mod putem testa
dac modelul 2 este semnificativ mai bun dect modelul 1.
[
=
= =
n
j
j n j
L L L L L L
1
) ( ) ( ) ( ) 2 ( ) 1 (
... ...
=
= + + + + + =
n
j
j n j
L L L L L L
1
) ( ) ( ) ( ) 2 ( ) 1 (
ln ln ... ln ... ln ln ln
Spre exemplu modelul lui Kimura este caz special al modelului HKY, primul
avnd un parametru liber, cellalt patru. Deci diferena n gradul de coresponden
dintre model i date poate fi evaluat prin testul LR sau 2 cu 3 grade de libertate.
Dac dintre cele dou dou modele comparate unul nu este caz particular al celuilalt
testul LR nu poate fi utilizat, un mod alternativ de a genera distribuia testului este
simularea Monte Carlo (parametric bootstrapping) (Goldman, 1993) sau se aplic AIC
definit ca
p L AIC 2 ln 2 + =
unde lnL este logaritmul verosimilitudinii unui anumit model, iar p este numrul de
parametri liberi ce trebuiesc estimai. Se consider c predictibilitatea statistic a unui
model este cu att mai bun cu ct AIC are valori mai mici. Din ecuaia de mai sus se
vede c chiar dac un model mai sofisticat are valori ale lnL mici din cauza
54
numrului mare de parametri p valoarea indicelui AIC crete. Totui n alte domenii
acest criteriu d indicaii mult mai bune dect n reconstruciile filogenetice. De cele
mai multe ori valoarea AIC pentru un model complex cum ar fi HKY este mai mic
dect pentru un model simplu precum K2P ceia ce nu nseamn ns obligatoriu c
topologia obinut cu un model mai complex este ntotdeauna mai bun.
Metode ML aplicabile n cazul secvenelor de aminoacizi i a proteinelor
Cnd secvenele de ADN sunt destul de apropiate ntre ele din punct de vedere
filogenetic metodele ML funcioneaz foarte bine, n special atunci cnd sunt utilizai
prima i a doua poziie a codonului. Dac se folosesc secvene (ce codific proteine)
ndeprtate filogenetic apar complicaii deoarece rata substituiilor sinonime este mult
mai mare dect cea a substituiilor nesinonime, frecvena celor 4 nucleotide n cea de
a treia poziie a codonului poate varia mult artnd c este astfel violat modelul
staionar de substituie. Din contra, schimbrile evolutive ale secvenelor proteice sunt
mult mai ncete astfel nct se poate utiliza metoda ML pentru secvenele proteice
utiliznd spre exemplu matricea de tranziie a aminoacizilor a lui Dayhoff et al. din
1978.
55
CAPITOLUL 3
METODOLOGIA DE OBINERE A SECVENELOR NUCLEOTIDICE
Un prim obiectiv al cercetrilor, l constituie cel de stabilire a omogenitii loturilor,
urmat de stabilirea cantitii totale de ADN pentru diferite specii i subspecii ale
genurilor Carassius i Cyprinus, stabilirea unor intervale de variaie a cantitii de ADN
pentru diferite esuturi, provenind de la indivizi diferii ai celor dou genuri,
amplificarea genelor luate n studiu, verificarea acestora n electroforez, urmat de
purificare i reacia de secveniere.
3.1. DETERMINAREA UNOR PARAMETRI I INDICI FENOTIPICI LA INDIVIZII
STUDIAI
Asupra indivizilor aparinnd celor dou specii de ciprinide utilizai pentru dozarea
acizilor nucleici, s-au efectuat msurtori, urmrindu-se o serie de parametri fenotipici
(Lt = lungime total; Ls = lungime standard; g = greutate individual; C =
circumferin; Hd = nlime maxim; Ha = nlime minim; Lc = lungime cap) i de
indici fenotipici (indice de profil = Lt / Hd; coeficient Fulton = g x 100 / Ls3; indice de
circumferin (Kiselev) = Ls / C i raportul Lc x 100 / Lt) (Gorgan et al., 2000)
Pentru determinarea parametrilor fenotipici se vor avea n vedere, urmtorii
parametri (Voican et al., 1974, 1975):
- lungimea total a petelui (Lt) este distana de la vrful botului pn la linia care
unete vrfurile lobilor nottoarei caudale;
- lungimea standard (Ls) este distana de la vrful botului pn la extremitatea
nveliului solzos, la baza nottoarei caudale;
- lungimea capului (Lc) este distana de la vrful botului pn la marginea posterioar
a osului opercular, fr membrana branhiostegal;
- nlimea maxim a corpului (Hd) se msoar n regiunea cea mai lat a corpului;
- nlimea minim a corpului (Ha) se msoar acolo unde nlimea corpului este cea
mai redus (la extremitatea posterioar a pedunculului caudal);
- circumferina maxim a corpului (C) se msoar la nivelul grosimii maxime i
nlimii maxime;
- greutatea individual (g) s-a determinat prin cntrirea petilor;
Indicii fenotipici menionai s-au determinat pe baza valorilor parametrilor fenotipici
dup cum urmeaz:
56
n
xi
x
=
- indicele de profil = Ls / Hd unde:
Ls = lungimea standard, n cm.
Hd = nlimea maxim a corpului, n cm;
- coeficientul Fulton (de ngrare):
g = greutatea corpului, n g;
Ls = lungimea standard, n cm.
Pentru a obine informaii cu privire la gradul de uniformitate a populaiei, precum
i asupra nivelului de semnificaie statistic a diferenelor dintre populaiile celor dou
specii, s-au efectuat msurtori biometrice la 50 exemplare/specie i s-au calculat
valorile unor parametri statistici (Snedecor, 1968): x = media aritmetic; S=deviaia
standard; Es = eroarea standard; C.V. % = coeficientul de variaie.
1. Media aritmetic:
, n care: xi = suma valorilor individuale;
n = numrul indivizilor.
2. Estimarea deviaiei standard pornind de la prob ctre populaie
( )
n
x
x S
2
2
= , unde:
x 2 = suma ptratelor valorilor individuale;
(x)2 = ptratul sumei valorilor individuale;
n = numrul indivizilor
3. Eroarea standard:
S2=variana
4. Coeficientul de variaie:
S = deviaia standard;
x = media aritmetic.
Pentru a stabili uniformitatea loturilor care au fost utilizate n experimentele
ulterioare de extracie a ADN total i de secveniere, au fost folosii cte 50 de indivizi
aparinnd celor dou specii, pentru fiecare populaie analizat.
, 100
3
Ls
g
unde:
n
S
n
S
S
x
= =
2
x
S
V C
100
.% .
= , n care:
57
3.2. PROTOCOLUL DE EXTRACIE AL ADN TOTAL DIN ESUT MUSCULAR
Tehnica este folosit pentru extragerea ADN total din esuturi proaspete,
congelate sau pstrate n etanol (Ausubel i colab., 1995). n vederea determinrii
cantitilor totale de acizi nucleici i a intervalelor de variabilitate ale acestui parametru
pentru diferite esuturi, au fost folosii cte 20 de indivizi aparinnd celor dou specii.
Soluii:
1. Tampon pentru liza celular:
Conine: Tris HCl 50mM (pH=8), SDS 1,0%, EDTA 25mM.
Pentru 50ml, ntr-o eprubet se introduc 25ml H2O miliQ (ap distilat filtrat prin
filtru de carbon, schimbtor de ioni etc.) autoclavat, la care se adaug 2,5ml soluie
stoc 1M Tris HCl (pH=8), 5ml 10% SDS, 2,5ml 0,5M EDTA. Se completeaz volumul
cu H2O miliQ pn la 50ml i se introduce ntr-un tub Corning nou cu volumul de
50ml, neautoclavat.
Soluii stoc:
1. Soluie Tris-HCl 1M (pH=8): - cantitile sunt calculate pentru un volum de
100ml;
- se dizolv 12,11g Tris n 80ml H2O miliQ;
- se corecteaz pH-ul la 8 cu HCl;
- se autoclaveaz.
2. Soluie Tris-EDTA (TE) (pH=8,0): -cantitile sunt considerate pentru un volum
de 100ml;
- ntr-o eprubet de 100ml se introduce 1ml soluie stoc Tris-HCl 1M (pH=8);
- 200l EDTA 0,5M;
- se completeaz cu H2O-miliQ pn la 100ml i se autoclaveaz.
3. Soluie NaOH 10N (100ml):
- se cntresc 40g NaOH
- se adaug 70ml H2O-miliQ autoclavat i se agit pn la dizolvare;
- se aduce volumul la 100ml;
- nu se autoclaveaz.
4. Soluie SDS 10% (dodecil sulfat de sodiu):
- se introduc 10g SDS n 80ml H2O-miliQ autoclavat i se nclzete soluia la 80C
pentru o mai bun dizolvare;
- se ajusteaz pH-ul la 7,2 (dac este necesar), utiliznd HCl;
- se aduce volumul la 100ml cu H2O-miliQ;
- nu se autoclaveaz.
5. Soluie EDTA 0,5M (etilendiaminotetraacetatsare disodic Ref. SIGMA
ED2SS):
- se cntresc 18,61g EDTA, peste care se adaug 80ml H2O-miliQ;
- se agit puternic i se adaug 1ml soluie NaOH 10N;
- se adaug NaOH pn cnd soluia devine alcalin (pH=8,0), iar EDTA este
dizolvat complet.
- se aduce volumul la 100ml cu H2O-miliQ i se autoclaveaz;
58
Modul de lucru:
Se eticheteaz tuburi Eppendorf de 1,5ml autoclavate, n care se introduc cte
500l soluie tampon (tampon pentru liz). Tuburile se in nchise, pn n momentul
introducerii esutului.
Se cntresc ntre 20 200mg de esut muscular proaspt, congelat sau
conservat n alcool etilic 95% (n acest caz, esutul se usuc nainte de cntrire, pe
hrtie de filtru). Fragmentul de esut se aeaz pe o lam steril i se taie mrunt cu
un bisturiu sau cu o lam, sterilizate. Dac fragmentul este mic (dac provine de la un
individ de 1 2cm), aceast etap nu este necesar.
Se introduc fragmentele de esut n tubul Eppendorf (de 1,5ml) corespunztor,
care conine 500l soluie tampon pentru liz. Aceast etap se repet pentru toi
indivizii. n fiecare tub, se adaug cte 10l proteinaz K (10l reprezint echivalentul
a 200g proteinaz dintr-o soluie stoc 20mg/ml care este preparat i congelat la -
20C). Se agit fiecare prob pe un vortex i se pstreaz peste noapte n etuv la
37C.
Not: pentru realizarea acestei etape se recomand s se lucreze cu un numr de
probe echivalent cu numrul de cuve din centrifug.
n ziua urmtoare, sub ni, n fiecare tub de 1,5ml se adaug 600l de soluie
fenol : cloroform : alcool izoamilic (25 : 24 : 1), pn la semnul superior al tubului
(Figura 12). Se agit tuburile timp de 30 60 secunde, apoi se centrifugheaz
(utiliznd o centrifug de mas), la o turaie 8000 rotaii/minut, timp de 4 minute. n
timpul centrifugrii, se eticheteaz noi tuburi Eppendorf de 1,5ml. La sfritul
centrifugrii, tuburile prezint o faz inferioar de culoare glbuie care conine
solventul organic, o faz superioar care conine ADN i o faz intermediar unde
sunt depozitate toate resturile pe care dorim s le eliminm din soluia de ADN (Figura
13)
Not: dac aceast faz intermediar este foarte mare, se repet splarea cu fenol :
cloroform : alcool izoamilic urmat de centrifugare. Dac fazele sunt bine separate, se
trece la etapa urmtoare.
Se separ faza superioar a fiecrui tub, n noile tuburi etichetate; - pentru
aceasta se utilizeaz o pipet Gilson P-100, cu ajutorul creia se extrag 700l de ADN
(Figura 14). Dac pipetarea se face repede, iar concentraia ADN este foarte mare n
faza superioar a tubului, n momentul pipetrii, se pot extrage resturi ale fazei
intermediare. Se extrage faza superioar din fiecare tub meninndu-le deschise sub
ni, iar la sfrit, se adaug cte 550l cloroform (Figura 15). Se agit tuburile timp
de 30 60 secunde, apoi se centrifugheaz la 8000 rotaii/minut, timp de 3 minute,
utiliznd o centrifug de mas (tip COBOS MC-10). n timpul centrifugrii, se
eticheteaz noi tuburi.
Se separ fazele superioare rezultate n urma centrifugrii (Figura 16), n noile
tuburi, n acelai mod ca n etapa precedent (Figura 17), avnd grij s nu se preia
nimic din faza intermediar de separare.
Se adaug 1ml etanol rece 95% (pstrat la -20C) n noile tuburi dup separare
pn la semnul superior al fiecrui tub (Figura 18). Se agit tuburile i se las la
temperatura de -20C, timp de 30 60 minute, timp n care se va forma un precipitat
albicios (ADN total) pe fundul tuburilor (Figura 19).
Dup precipitarea ADN, se centrifugheaz tuburile la 10.000 rotaii/minut, timp de
5 minute, pentru sedimentare. Se elimin supernatantul i se aeaz tuburile
deasupra unei hrtii de filtru, astfel nct s se scurg ultimele picturi de alcool.
Urmeaz uscarea peletelor, mutnd tuburile, deschise, ntr-o centrifug cu vacuum,
unde sunt meninute timp de 10 minute, cu temperatura n scdere. Dac n acest
59
interval de timp sedimentele nu sunt uscate, se mai las tuburile nc 5 minute n
centrifug.
Dup uscarea peletelor, se adaug n fiecare tub cte 200l soluie TE (pH=8,0) i
se resuspend manual sau pipetnd de cteva ori. Pentru o mai bun resuspensie, se
pot lsa ntre 15 i 30 minute la temperatura camerei, la 37C sau timp mai ndelungat
la 4C. Dup resuspendarea peletelor de ADN, coninutul fiecrui tub este repartizat n
trei tuburi de cte 1,5ml (etichetate anterior), punnd cte 50l din soluia
resuspendat. Din cele trei tuburi ale unei probe, unul se pstreaz la 4C, iar
celelalte dou se congeleaz (-20C - -80C).
3.2.1. PRELUCRAREA STATISTIC A DATELOR OBINUTE DIN EXTACIA ADN
3.2.1.1. ESTIMAREA VALORILOR MEDII ALE POPULAIILOR I STABILIREA
INTERVALELOR DE VARIABILITATE
Folosind valorile mediei ( ) x i deviaiei standard (S) (conform formulelor
prezentate anterior), calculate pe baza probelor dintr-o populaie, se pot estima
valorile corespunztoare pentru ntreaga populaie (sau specie). Estimarea mediei
populaiei implic calculul erorii standard a mediei ( )
x
S , care ine cont de
variabilitatea i mrimea probei (Varvara et al., 2001).
Se caut o valoare critic pentru un anumit grad de confiden i un anumit
numr de grade de libertate t(, t-1); atunci, probabilitatea estimrii va fi dat de 1-,
adic =0,05. Valoare lui t reprezint valoarea critic a distribuiei t pentru un anumit
nivel de confiden sau prag de semnificaie i n-1 grade de libertate. Pragul de
semnificaie reprezint probabilitatea aleas arbitrar, ca intervalul de confiden
calculat s cuprind media populaiei. Pentru majoritatea studiilor, probabilitatea de
95%, adic =0,05, este considerat satisfctoare.
Eroarea standard a mediei este folosit pentru a calcula intervalul de confiden a
mediei populaiei, interval care s cuprind, cu o anumit probabilitate, media
populaiei.
( )
x
S n t x = 1 , o , unde reprezint media populaiei, iar x valorile medii ale
probelor.
Limitele intervalului: limita inferioar (LI) i limita superioar (LS), sunt date de
formulele:
( )
( ) 1 ,
1 ,
+ =
=
n t S x LS
n t S x LI
x
x
o
o
Astfel, intervalul LI-LS, include media populaiei cu o probabilitate de 1-.
60
3.2.1.2. COMPARAREA MAI MULTOR PROBE
ANOVA model I bifactorial cu numr egal de observaii n celul
Acest model se folosete n condiii asemntoare cu modelul bifactorial cu o
observaie n celul la care se adaug interaciunea dintre factori. Evidenierea
interaciunii poate fi sugerat de reprezentarea grafic a mediilor probelor urmrite.
Observaia n acest caz este egal cu media general + efectul nivelului i al
factorului A + efectul nivelului j al factorului B + interaciunea AiBj + eroarea
ntmpltoare (Fowler et al., 2000).
n fiecare celul trebuie s avem un numr egal de observaii
S S S S S
S S S S
S S S
i r c t
i r c ext
ext t
2
int
2 2 2 2
2 2 2 2
2
int
2 2
+ + + =
+ + =
+ =
,
Unde:
Si
2
= variana interaciunii;
S
ext
2
=variana extern;
St
2
=variana total
Se stabilesc ipotezele modelului:
H01: A1=A2=An H11: A1A2An
H02: B1=B2=Bn H12: B1B2Bn
H03: interaciunea=0 H13: interaciunea0
libertate grade
SS
SS S = =
2
, SS =suma de ptrate; SS =suma de ptrate medie;
( )
t
t
t t
n
x
x SS
2
2
=
,
i
SS = suma de ptrate a interaciunii
Ai
A1 A2
Bj
B1
-
-
-
-
x
-
-
-
-
x
B2
-
-
-
-
x
-
-
-
-
x
61
( ) ( )
( ) ( )
( ) ( ) ( ) ( ) ( )
i r c t
r c
t
t
r c
r c
r c
r c
r c
r c
r c
r c
i
t
t
t
r
r
t
t
t
c
c
i r c ext
SS SS SS SS SS
SS SS
n
x
n
x
n
x
n
x
n
x
SS
n
x
c n
x
SS
n
x
r n
x
SS
SS SS SS SS
=
+ + + =
(
(
(
(
=
+ + =
int
2
2 2
2
2 2
1 2
2
1 2
2 1
2
2 1
1 1
2
1 1
2 2
2 2
,
glt =nt 1, glt=grade de libertate totale, nt=numr total de valori;
glc = c 1, glc=grade de libertate pe coloane, c=numr de valori pe coloane;
glr = r 1, glr=grade de libertate pe rnduri, r=numr de valori pe rnduri;
gli = (c-1)(r-1), gli=grade de libertate ale interaciunii;
glint = nt cr, glint=grade de libertate interne
Tabel sintetic al valorilor calculate pentru testul ANOVA
Sursa de
variabilitate
SS
Grade de
libertate
SS
F
c
c
SS c - 1
c
SS / c - 1
c SS / int SS
r
r
SS r - 1
r
SS / r - 1
r SS / int SS
i
i
SS (c-1)(r-1)
i
SS /(c - 1)(r - 1)
i SS / int SS
int
int
SS nt - cr
int
SS / nt - cr
t
t
SS nt - 1
Dac: Fc F (, c 1, g.l.int) H01 (F), H11 (A)
Fr F (, r 1, g.l.int) H02 (F), H12 (A)
Fi F (, (c-1)(r-1), g.l.int) H03 (F), H13 (A)
3.3. REACIA DE AMPLIFICARE GENIC PRIN POLIMERIZARE N LAN (PCR)
3.3.1. PRINCIPII GENERALE
Aprut la nceputul anilor 80, reac ia de polimerizare n lan (PCR) este att
de utilizat n zilele noastre n nenumrate domenii, nct s-a uitat meritul su
revoluionar . tiina aa numitei reacii de polimerizare n lan este astzi foarte bine
cunoscut i ntlnit n multe laboratoare. Tehnica PCR este considerat a fi un
veritabil fotocopiator genetic".
Reacia de polimerizare n lan permite o rapid amplificare a secvenelor ADN,
chiar si atunci cnd materialul de iniiere este un ADN puternic degradat, acesta
62
fiind utilizat in studii de antropologie moleculara si paleogenetica, cum ar fi analiza
ADN recuperat din oase fosile, din mumii sau din esuturi formolizate. Se poate
realiza amplificarea ADN-ului chiar si dintr-o singura celula. Practic, PCR-ul
reprezint o forma de clonare in vitro ce poate genera i modifica fragmente de
lungimi i secvene bine definite ntr-o simpl reacie automatizat.
Metaforic vorbind, metoda permite sa fie gsit acul n carul cu fn, deoarece
prin ea, o singur gen dintre nenumratele gene purtate de o molecul de ADN
poate fi reprodus n cteva ore n miliarde de copii identice; ceea ce unei celule, n
starea sa cea mai activ proliferativ (celula canceroas) i-ar trebui o lun de zile,
pentru a realiza acelai lucru.
Probele ADN i reacia de polimerizare n lan sunt descoperiri ce au fost puse
imediat n practic, n medicina legal i n identificarea genelor responsabile de boli
ereditare.
Reacia de polimerizare n Lan este o metod foarte sensibil de
amplificare, prin care se realizeaz miliarde de copii identice ale unei anumite gene
din macromolecula de ADN, n numai cteva ore, sistemul putnd fi contaminat
foarte uor de elemente ale genelor ADN amplificate anterior sau de particule
externe. Posibilitatea de contaminare n reaciile de amplificare este un aspect cu
implicaii deosebite, att n aplicaii de cercetare ct i n cele cu specific diagnostic.
n ciuda sensibilitii deosebite, PCR este victima propriului su succes. Pot s
apar reacii fals pozitive prin acizii nucleici contaminai datorit puterii de
amplificare incredibile a reaciei. Contaminarea noilor probe cu ADN amplificat
anterior este o problem important a laboratoarelor n care se execut PCR.
Reacia de polimerizare n lan permite manipularea direct a secvenelor de
acizi nucleici, putndu-se realiza astfel secvenierea unui fragment ADN
(determinarea ordinii de succesiune a bazelor azotate n molecula de ADN),
determinarea variaiilor existente ntre diferite molecule ADN, modificarea secvenei
moleculelor de acizi nucleici de interes. Este o tehnic ingenioas bazat pe
capacitatea ADN-polimerazei de a copia o caten ADN prin elongarea catenelor
complementare, iniiat de o pereche de primeri. Teoretic, fiecare ciclu dubleaz
cantitatea de ADN int. Comportamentul i manipularea ADN polimerazei a fost o
concentrare a eforturilor pentru a nelege felul n care materialul genetic este copiat,
reparat i motenit.
Se poate porni cu o cantitate extrem de mic de ADN, de la o singur sau
cteva molecule de ADN ce trebuie amplificat, denumit ADN int. Acest ADN int
ce urmeaz a fi amplificat, are n mod curent, sub 45 kilobaze.
Reacia de polimerizare n lan se desfoar in vitro, avnd nevoie de
urmtorii reactivi: template-ul ADN ce urmeaz a fi amplificat, primerii necesari
amplificrii unui anumit sector din ADN int, deoxiribonucleotide sub form de
trifosfai (dATP, dGTP, dTTP i dCTP) care pot fi dozai n soluie apoas prin
spectofotometrie UV la 260 nm, ADN polimeraza, capabil de a rmne funcional
la temperaturi nalte de pana la 100 C i bufferul (MgCl
2
n concentraii de
aproximativ 1,5 mM) care este de o importan vital, deoarece determin condiiile
de hibridare a primerilor i cele de funcionare a polimerazei (Taq polimeraza nu
poate funciona cnd salinitatea mediului este crescut). ADN ce urmeaz a fi
amplificat se afl n cantitate foarte mic i este utilizat ca template pe un sector
limitat (ADN int), delimitat de doi primeri, cu orientare opus, unul pe catena
direct 5` - 3` i cellalt, pe catena 3` - 5`. Primerii sunt reprezentai de secvene
scurte oligonucleotidice sintetizate in vitro, de ADN monocatenar, de numai 20-30
nucleotide lungime. Secvena primerilor este proiectat naintea sintezei artificiale,
63
astfel nct s fie realizat mperecherea complementar cu o secven aflat
naintea sectorului din ADN int ce urmeaz a fi amplificat, primerii delimitnd astfel
acel sector. Cei doi primeri sunt proiectai s se asocieze unul aproape de cellalt
dar sunt situai pe catene diferite i sunt orientai n aa fel nct ei copie secvena
de ADN care se gsete ntre ei. Cu ct primerii sunt mai lungi, cu att temperatura
de asociere poate fi mai mare ceea ce creeaz o specificitate sporit. Cu toate
acestea, priimerii nepurificai si lungi vor conine cantiti mai mari de produse
nespecifice in amestecul final. Dac este necesar utilizarea unor primeri mai lungi
atunci se recomand purificarea lor, n caz contrar aceasta nu este necesar.
Exist i aa numiii primeri nespecifici sau degenerai care sunt de fapt un
amestec de oligonucleotide ale unor secvene de acizi nucleici diferite i sunt utilizai
pentru amplificarea simultan a mai multor loci n macromolecula de ADN int.
Majoritatea polimerazelor recunosc ADN mono catenar ca fiind un posibil model
de amplificare i se leag temporar la acest lan, pentru formarea unei duble catene.
De asemenea, polimerazele se leag i de deoxinucleotidtrifosfaii (dNTPs) valabili n
mediu i folosind energia nmagazinat n legturile triple, catalizeaz reacia de
ataare a nucleotidelor la a doua caten de ADN; apoi enzima se mut la sfritul
poriunii unde catena este dubl iar procesul este repetat de sute sau mii de ori pe
secund.
ADN polimeraza acioneaz unidirecional; ncepe s acioneze de la captul 3` al
poriunii dublucatenare, sinteza decurgnd n direcia 5`3`. Astfel, polimeraza poate
ncepe s acioneze, oriunde gsete o jonciune de tip ADN monocatenar
bicatenar. Pentru direcionarea nceputului sintezei unui anumit segment de ADN, este
necesar un scurt segment oligonucleotidic (un mic numr de nucleotide unite ntr-un
lan scurt complementar unei secvene de ADN) poziionat chiar deasupra poriunii
dorite pentru sintez (Prescott i Harley, 1999).
Acest fragment oligonucleotidic nu se poate alinia la ADN dublu catenar, n
schimb, se leag imediat la secvena complementar a ADN mono catenar. Prin
nclzire, legturile dintre cele dou catene ale ADN se rup, formndu-se poriuni
monocatenare. Prin urmare, denaturarea ADN prin cldur, urmat de o uoar
rcire, n prezena oligonucleotidelor complementare, determin alinierea acestora la
macromolecula de ADN monocatenar, oriunde ntlnesc secvene similare
complementare. (Palumbi, 1996; Monod i Francois 1996; Lisker i Armendares,
2000; Mas Eva et al., 2001).
3.3.2. CICLURILE DE REPLICARE
Replicarea n PCR const n trei faze mai importante: denaturare, aliniere i
extensie.
3.3.2.1. DENATURAREA
n aceast faz, cldura este folosit n scopul opririi tuturor reaciilor enzimatice
i denaturrii ADN de la dublu catenar, la mono catenar. De obicei, se folosete o
temperatur de 94C sau 92C dup metode mai noi. O temperatur prea joas sau
un timp de denaturare prea scurt, pot fi ineficiente, rmnnd poriuni de ADN
bicatenar. Cu toate c Taq polimeraza este rezistent la denaturarea termic, nu este
totui imun la aciunea cldurii, o nclzire excesiv, ducnd la o scdere a activitii
64
enzimatice. De exemplu, dup 30 cicluri de replicare cu incubare la 94C pentru 60 de
minute, activitatea enzimei, se reduce la jumtate.
3.3.2.2. ALINIEREA PRIMERILOR
n aceast faz, temperatura este mai joas, astfel nct primerii oligonucleotidici
se pot lega n zonele complementare din catena de ADN. Aceasta este faza critic a
reaciei de amplificare, deoarece dac primerii se leag corect doar n zona int
(zona care urmeaz a fi amplificat), atunci exist o probabilitate suficient de mare s
se obin produi de calitate.
Alinierea este un proces randomic, care depinde de concentraia primerilor,
disponibilitatea siturilor de legtur i de prezena zonelor cu similaritate sczut
secvenei primerilor, care duc la alinieri nespecifice. Trebuie remarcat i faptul c,
dac macromolecula de ADN care folosete drept matri este fragmentat, atunci,
mici fragmente din aceasta, pot aciona ca primeri, fiecare avnd o int precis n
cadrul genomului. Acesta este un motiv pentru care molecule de ADN cu greutate
molecular mare i molecule mici, nu trebuiesc amestecate ca matrie pentru viitoare
amplificri (Palumbi, 1996).
O temperatur mare de aliniere a primerilor, sau o concentraie mare a acestora
n mediul de reacie, pot determina o blocare a formrii legturilor i implicit de aliniere
a primelor cu matria de ADN. O temperatur joas, determin o aliniere nespecific a
primerilor n diferite poriuni care prezint o complementaritate sczut, generndu-se
astfel numeroase artefacte. Dac temperatura de aliniere este foarte sczut,
catenele de ADN se vor realinia formnd structura iniial ADN dublu catenar.
Timpul de aliniere a primerilor, constituie de asemenea o problem foarte
important pentru obinerea unui produs bun. Astfel, un timp de aliniere foarte lung,
permite primerilor s gseasc noi posibile situri de legtur i s se alinieze
nespecific. Cu toate acestea, un timp scurt de aliniere, poate determina o mare
specificitate de aliniere n PCR. n general, timpul de aliniere este de 30 60 secunde,
dar poate funciona la fel de bine i un timp mai scurt de 15 secunde la temperaturi
mari de aliniere cu primeri specifici.
3.3.2.3. EXTENSIA
Faza de extensie sau elongare, determin activitatea enzimatic i sinteza
segmentului de ADN. Taq polimeraza funcioneaz de obicei bine la 72C, aceasta
fiind i temperatura utilizat de obicei pentru aceast etap. Enzima se activeaz i i
ncepe activitatea la temperaturi sczute, ceea ce este foarte important pentru
succesul reaciei de amplificare. Majoritatea primerilor au o temperatur de aliniere
mai mic de 72C, astfel nct majoritatea vor fi foarte slab legai de secvena int, o
dat cu creterea temperaturii de extensie. O dat cu creterea temperaturii de la
temperatura de aliniere ctre 72C, ncepe i reacia de polimerizare, dar destul de
lent. Oricum, aceast reacie de polimerizare este suficient pentru a aduga cteva
extra-baze, crescnd astfel stabilitatea complexului primer matri. Astfel, o dat cu
trecerea timpului (de obicei 30 de secunde), temperatura de extensie crete, primerul
fiind deja parte component a noii catene de ADN.
Timpul de extensie, este o alt variabil important. n condiii optime, Taq poate
lega mii de nucleotide pe minut. Prin urmare, produii PCR cu o lungime mai mic de
65
500 perechi de baze (pb) nu necesit mult timp pentru o sintez complet
(aproximativ 30 de secunde fiind suficiente). n general, un timp de extensie de 30 de
secunde este suficient pentru produi sub 50pb, 60 de secunde sunt necesare pentru
produi cu lungimi cuprinse ntre 500 i 1500pb i 90 de secunde sunt necesare
pentru produi cu lungimi mai mari. Optimizarea timpului de elongare este necesar,
deoarece un timp prea mare poate favoriza apariia de artefacte (alinieri nespecifice)
(Palumbi, 1996).
3.3.2.4. CONDIIILE DE REACIE
Pentru sistematica molecular, atenia a fost ndreptat ctre primeri i ct de bine
se aliniaz la matria de ADN. Dac alinierea nu este eficient, sau dac primerii se
aliniaz nespecific, amplificarea poate s fie blocat sau se pot amplifica produi
alternativi. Astfel, complementaritatea perfect primer matri, poate determina
amplificri cu mare specificitate. Din pcate, temperaturile ridicate, adesea mpiedic
utilizarea primerilor universali (primeri realizai a fi eficieni pentru un anumit numr de
taxoni) (Kocher et al., 1989).
3.3.3. COMPONENTELE PCR
Mediul de reacie este foarte important pentru specificitatea i eficiena
amplificrii. Astfel, mediul de reacie trebuie s conin un tampon, amestecul de
nucleotide, polimeraz, primeri, ADN i Mg2+ (un cofactor necesar pentru activitatea
enzimei) (Carbonari et al., 1993). Numai primerii i nucleotidele se consum n cursul
reaciei acestea fiind adugate n exces, astfel nct sinteza s nu poat fi limitat de
aceste componente.
Cofactorul, nu se consum n timpul reaciei i nici nu este degradat de
temperaturile extreme ale ciclurilor de amplificare, astfel nct concentraiile iniiale i
finale sunt aceleai. Ionul, este un important cofactor n cataliza enzimatic a reaciei
de sintez, astfel, o concentraie optim poate accelera considerabil desfurarea
reaciei. Oricum, Mg2+ interacioneaz cu sarcinile negative ale gruprii fosfat ale
nucleotidelor, suficient de puternic nct Mg2+ s atrag gruprile PO4- i s rmn
n cantitate destul de mic pentru a mai reaciona ca i cofactor. Din acest motiv,
concentraia de Mg2+ trebuie s fie mai mare dect concentraia dNTP.
Varierea concentraiei de Mg2+ este una dintre cele mai comune metode de
stabilire a condiiilor de reacie pentru PCR. De obicei se utilizeaz o cantitate de
1,5mM MgCl2.
3.3.4. AMPLIFICAREA GENIC LA REPREZENTANI AI FAMILIEI CYPRINIDAE
n cazul celor dou specii analizate, a indivizilor ginogenetici i a hibrizilor
interspecifici, au fost amplificate 3 secvene aparinnd la trei gene diferite. Astfel, au
fost amplificate regiunile cu hipervariabilitate aparinnd citocromului b i regiunii de
control a ADNmt (D-loop), precum i o regiune conservativ necodificatoare la speciile
analizate, segmentul 4L al dehidrogenazei (ND4L).
66
3.3.4.1. AMPLIFICAREA GENEI CARE DETERMIN SINTEZA CITOCROMULUI B
n cazul speciilor analizate, a fost amplificat citocromul b difereniat, in funcie de
primerii utilizai i condiiile de reacie specifice. La Cyprinus carpio L i hibrizii
intraspecifici analizai, datorit lungimii mari a acestei gene, de aproximativ 1140pb, a
fost necesar amplificarea n dou etape, pe secvene diferite, utilizndu-se dou
perechi de primeri (Figurile 16 i 17).
H15149 5`-AAACTGCAGCCCTCAGAATGATATTTGTCCTCA-3` Primerii pentru
L14724 5`-CGAAGCTTGATATGAAAAACCATCGTTG-3` primul segment
H15910 5`-ATCTTCGGTTTACAAGACCGGT-3` Primerii pentru
L15138 5`-ATGATGACCGCCTTCGTAGGCTA-3` al doilea segment
Figura 16 Primerii utilizai pentru amplificarea citocromului b, la Cyprinus carpio
15081bp 16221 bp
L14724 H15149
L15138 H15910
Figura 17 Poziia primerilor utilizai pentru amplificarea genei la Cyprinus carpio L i
hibrizii intraspecifici
Pentru prima parte a citocromului b, n cazul tuturor indivizilor aparinnd genului
Cyprinus, a fost folosit acelai mediu de reacie, precum i aceleai condiii de
amplificare. Referitor la mediul de reacie, prepararea acestuia se realizeaz ntr-un
tub Eppendorf steril de 1,5ml, n care se adaug toate componentele utilizate n
amplificare, innd cont de cantitile necesare corelate cu numrul de probe plus 2
(pentru controlul negativ i o rezerv de reactivi). Astfel, se multiplic cantitile
necesare, cu numrul de probe (Tabelul 6). Controlul negativ (C-) n toate cazurile,
conine acelai mediu de reacie utilizat pentru toate celelalte probe, exceptnd ADN
folosit drept matri pentru amplificare, nlocuit n acest caz cu H2O miliQ (ap
bidistilat, filtrat prin filtru de carbon i schimbtor de ioni). Este utilizat pentru
decelarea eventualelor contaminri ale mediului de reacie.
Primerii utilizai pentru amplificarea primului segment, sunt L14724 (Pbo, 1990)
pentru catena direct i H15149 (Kocher et al., 1989)
Glutamat (Glu)
Citocrom b (cyt b) 1140
Treonin (Thr)
67
Tabel 6 Compoziia mediului de reacie i cantitile corespunztoare de reactivi pentru
amplificarea cytb prima parte la specii ale genului Cyprinus
Reactiv Concentraia
Cantitatea
pentru o prob
(l)
Nr. probe Amestec final
ddH2O-miliQ - 33,2 n 33,2n
PCR buffer 10X 4,5 n 4,5n
dNTPs 8Mm 5,0 n 5,0n
MgCl2 25mM 2,0 n 2,0n
Primer 1 (L14724) 2mM 1,5 n 1,5n
Primer 2 (H15149) 2mM 1,5 n 1,5n
Taq polimeraza 5000U/ml 0,3 n 0,3n
Compoziia soluiilor din mediul de reacie:
1. 10X PCR buffer: 500mM KCl, 100mM Tris HCl (pH=8,4 la 20C), 15mM
MgCl2, 1mg/ml gelatin.
2. 10X dNTP stoc: 2mM dATP, 2mM dCTP, 2mM dGTP, 2mM dTTP (neutralizat
la pH=7 cu NaOH).
3. 10X Primeri: primerul liofilizat 2,5M dizolvat n TE (10mM Tris, 0,1mM EDTA,
pH=8).
4. Taq polimeraza: 5000 uniti/ml.
Procesul de amplificare a primei pri a citocromului b a urmat acelai program
pentru toate probele analizate aparinnd genului Cyprinus, avnd o temperatur de
aliniere a primerilor de 45C timp de 1 minut i 30 cicluri de replicare.
Pentru al doilea segment al citocromului b n cazul speciilor i hibrizilor aceluiai
gen Cyprinus au fost efectuate modificri ale temperaturii de aliniere a primerilor
(pentru mrirea procentului de amplificri specifice) care a fost ridicat la 50C, timp
de 1 minut, ntregul proces avnd 30 cicluri de replicare. De asemenea, au fost
schimbai primerii, n acest caz utilizndu-se L15138 (Chang et al., 1994) pentru
catena direct i H15910 (Chang et al., 1994; Tatsuo et al., 2004) pentru catena
complementar (Tabel 7).
Tabel 7 Compoziia mediului de reacie i cantitile corespunztoare de reactivi pentru
amplificarea cytb a 2-a parte la specii ale genului Cyprinus
Reactiv Concentraia
Cantitatea
pentru o prob
(l)
Nr. probe Amestec final
ddH2O-miliQ - 33,2 n 33,2n
PCR buffer 10X 4,5 n 4,5n
dNTPs 8mM 5,0 n 5,0n
MgCl2 25mM 2,0 n 2,0n
Primer 1 (L15138) 2mM 1,5 n 1,5n
Primer 2 (H15910) 2mM 1,5 n 1,5n
Taq polimeraza 5000U/ml 0,3 n 0,3n
n cazul speciilor genului Carassius, amplificarea citocromului b s-a desfurat
ntr-o singur etap, datorit imperfeciunii de amplificare a primerilor intermediari.
Astfel, pentru specificitatea amplificrii i pentru a mri cantitatea de produs obinut,
au fost modificate cantitatea de Taq polimeraz din amestecul de reacie de la 0,3l la
0,5l (Tabelul 8), iar numrul de cicluri a fost modificat la 40 etape de amplificare.
68
Primerii utilizai pentru amplificarea acestui fragment, sunt Glu-F i Thr-R (Zardoya i
Doadrio, 1998), avnd ca regiuni complementare, secvene nucleotidice din afara
citocromului b i anume, genele care codific sinteza acidului glutamic (Glu) i a
treoninei (Thr). (Figura 18).
Tabel 8 Compoziia mediului de reacie i cantitile corespunztoare de reactivi pentru
amplificarea cytb la specii ale genului Carassius
Reactiv Concentraia
Cantitatea
pentru o prob
(l)
Nr. probe Amestec final
ddH2O-miliQ - 33 n 33n
PCR buffer 10X 4,5 n 4,5n
dNTPs 8mM 5,0 n 5,0n
MgCl2 25mM 2,0 n 2,0n
Primer 1 (Glu-F) 2mM 1,5 n 1,5n
Primer 2 (Thr-R) 2mM 1,5 n 1,5n
Taq polimeraza 5000U/ml 0,5 n 0,5n
Glu-F 5`-GAAGAACCACCGTTGTTATTCAA-3`
Thr-R 5`-ACCTCCRATCTYCGGAGGACA-3`
Figura 18 Structura primerilor utilizai n amplificarea cytb la Carassius gibelio Bloch.
3.3.4.2. AMPLIFICAREA REGIUNII DE CONTROL MITOCONDRIAL
Replicarea ADNmt este iniiat pe o singur caten, n interiorul regiunii de
control, (regiune necodificatoare). Pe msur ce aceast caten i sintetizeaz
catena complementar, cealalt caten a duplexului iniial, este liber, formnd o
bucl monocatenar numit D-loop (engl. displacement lopp). Cnd replicarea a
avansat pentru aproximativ dou treimi din suprafaa moleculei, este iniiat replicarea
i la nivelul buclei, pn cnd se va forma un nou genom circular bicatenar (Clayton,
1982, Abilock i Stephenson, 2001).
n cazul speciei Cyprinus carpio L. i a varietii crap oglind, a fost folosit un
mediu de reacie standard (Tabel 9) i primeri universali specifici regiunii de control
mitocondrial control A pentru catena direct i control E pentru catena revers (Figura
19). Reacia de amplificare, a decurs dup un program a crui temperatur de aliniere
a primerilor a fost de 62C, la un numr de 40 cicluri de amplificare. Temperatura
ridicat utilizat pentru alinierea primerilor, s-a datorat dificultilor de amplificare,
datorate alinierilor imperfecte concretizate n benzi multiple; prin mrirea temperaturii,
se mrete specificitatea alinierilor.
69
Tabel 9 Compoziia mediului de reacie i cantitile corespunztoare de reactivi pentru
amplificarea d-loop
Reactiv Concentraia
Cantitatea
pentru o prob
(l)
Nr. probe Amestec final
ddH2O-miliQ - 33,2 n 33,2n
PCR buffer 10X 4,5 n 4,5n
dNTPs 8mM 5,0 n 5,0n
MgCl2 25mM 2,0 n 2,0n
CTRL A 2mM 1,5 n 1,5n
CTRL E 2mM 1,5 n 1,5n
Taq polimeraza 5000U/ml 0,3 n 0,3n
CTRL A 5`-TTCCACCTCTAACTCCCAAAGCTAG-3`
CTRL E 5`-CCTGAAGTAGGAACCAGATG-3`
Figura 19 Structura primerilor utilizai n amplificarea regiunii de control mitocondrial la
speciile analizate de ciprinide
Pentru specii aparinnd genului Carassius, a fost utilizat acelai mediu de reacie
i aceiai primeri ca n cazul speciilor genului Cyprinus. Referitor la parametrii
programului de amplificare, acesta s-a desfurat la o temperatur de aliniere a
primerilor de 60C i 30 cicluri de replicare.
3.3.4.3. AMPLIFICAREA GENEI CARE CODIFIC SUBUNITATEA 4L A
DEHIDROGENAZEI (ND4L)
NADH dehidrogenaza prezint 7 subuniti pe toat suprafaa ADNmt. A fost
amplificat i secveniat subunitatea 4L, deoarece este considerat a fi o regiune
puternic conservativ, astfel nct eventualele substituii nucleotidice de la acest nivel,
ne vor putea confirma (n cazul apariiei acestor substituii) diferene decelate n cadrul
celorlalte gene secveniate, hipervariabile citocromul b i d-loop.
La speciile genului Cyprinus, pentru amplificarea genei, s-a folosit un amestec de
reacie modificat prin dublarea cantitii de Taq polimeraz de la 0,3l, la 0,6l
(Tabelul 9). Pentru amplificarea segmentului dorit, s-au folosit doi primeri degenerai
L10420 pentru catena direct i H10720 pentru revers (Figura 20)
Reacia de amplificare a genei s-a desfurat dup un program care avea
temperatura de aliniere a primerilor de 51C i un numr de 40 cicluri de replicare.
n cazul speciilor genului Carassius, pentru amplificarea genei codificatoare a
ND4L, a fost folosit acelai mediu de reacie (inclusiv aceiai primeri) i aceleai
condiii de amplificare ale programului PCR ca n cazul speciilor genului Cyprinus.
70
Tabel 10 Compoziia mediului de reacie i cantitile corespunztoare de reactivi
pentru amplificarea ND4L
Reactiv Concentraia
Cantitatea
pentru o prob
(l)
Nr. probe Amestec final
ddH2O-miliQ - 31,9 n 31,9n
PCR buffer 10X 4,5 n 4,5n
dNTPs 8mM 5,0 n 5,0n
MgCl2 25mM 2,0 n 2,0n
CTRL A 2mM 1,5 n 1,5n
CTRL E 2mM 1,5 n 1,5n
Taq polimeraza 5000U/ml 0,6 n 0,6n
L10420 5`-AAYAARAYCNTTGATTTCGRCTCA-3`
H10720 5`-TCYGTGCCRTGYGTYCGNGC-3`
Figura 20 Structura primerilor utilizai n amplificarea ND4L la ciprinide
3.4. TESTAREA PRODUILOR PCR PRIN ELECTROFOREZ
La sfritul fiecrei reacii de amplificare, este necesar o verificare a produilor
obinui pentru a observa dac a avut loc amplificarea, dac au avut loc amplificri
multiple sau pentru decelarea eventualelor contaminri.
Soluii necesare:
- agaroz SEAKEM;
- tampon TBE: - soluie stoc 10X (108g Tris base, 55g acid boric, 40ml 0,5M EDTA
(pH=8,0), se completeaz cu ap bidistilat pn la 1l) i 1X soluie de lucru
(89mM Trios base, 89mM acid boric, 2mM EDTA);
- loading buffer: 20% glicerol, 1mg/ml bromfenol albastru, 1mg/ml xilencianol;
- soluie bromur de etidiu: pentru 1000X soluie stoc, cu o concentraie 0,5mg/ml
sunt necesare: 50mg bromur de etidiu, 100ml H2O bidistilat. Se dilueaz
soluia stoc n proporie 1:1000.
- marker molecular de 100pb
Concentraia gelului de agaroz depinde de mrimea fragmentelor de ADN care
urmeaz a fi evideniate prin electroforez (Tabelul11) (Ausubel et al., 1992)
Tabel 11 Concentraia gelului de agaroz corelat cu mrimea fragmentului de ADN
Concentaia gelului de agaroz
(%)
Lungimea fragmentului de ADN
(kb)
0,5 1 30
0,7 0,8 12
1,0 0,5 10
1,2 0,4 7
1,5 0,2 3
Avnd valori aproximative ale lungimilor genelor amplificate (valori provenite din
banca de gene GenBank), pentru verificarea produilor PCR obinui, au fost folosite
geluri de agaroz avnd concentraii de 1,5% i volume de 30ml. Prepararea unui
71
astfel de gel, necesit o cantitate de 0,45g agaroz (SEAKEM) la 30ml TBE 1X.
Astfel, se adaug soluia de TBE 1X peste agaroz, se amestec pn la
omogenizare i se introduce n cuptorul cu microunde pentru aproximativ 20 de
secunde. Dup expirarea timpului, se scoate, se agit i se reintroduce n cuptor
pentru alte 20 de secunde. Flaconul ce conine gelul, se rcete n jet de ap; dup
rcire, se introduc n flacon 1,5l bromur de etidiu i se agit pn la dispariia culorii
roii a bromurii.
Se toarn gelul n suportul pentru gel, se introduce un pieptene i se las s se
ntreasc. (Not: cuva de electroforez trebuie s fie aezat pe un loc perfect plan
naintea turnrii gelului). Dup ntrire, se scoate pieptenele prin culisare i se aeaz
gelul n cuva de electroforez care conine tampon TBE sau TAE 1X.
Pregtirea probelor pentru migrarea n gel, necesit un fag, n care se introduc
cte 2,5l loading buffer pentru fiecare prob, plus aceeai cantitate pentru markerul
molecular de 100pb i controlul negativ. n continuare, peste buffer se adaug cte
10l din fiecare prob (produs PCR). Se omogenizeaz coninutul fiecrei celule a
fagului, n momentul introducerii probei. Dup realizarea amestecurilor, se ncarc
probele n gelul de agaroz, pstrnd ordinea, ntotdeauna pe ultima poziie
disponibil de ncrcare, fiind situat controlul negativ (C-).
Electroforeza produilor PCR a fost efectuat n cuve tip FOTODYNE, ntr-un
cmp electric de 90V i 50 60mA, timp de 40 50 de minute, n funcie de mrimea
fragmentelor.
3.5. PURIFICAREA PRODUILOR PCR
Purificarea tuturor produilor PCR obinui s-a realizat utiliznd un kit de reacie
QIAGEN (QIAquick PCR purification kit) i un protocol furnizat de aceeai firm.
Acestea sunt utilizate pentru purificarea direct a produilor PCR mono- sau
bicatenari cu lungimi cuprinse ntre 10pb 10kb de primerii neataai, nucleotide
libere, polimeraze i sruri. Kit-ul conine coloane de purificare, tampon PB, tampon
PE, tampon EB (productorul nu furnizeaz compoziia fiecrui tampon) i tuburi
colectoare.
Ca prim etap a purificrii, se adaug 5 volume tampon PB la 1 volum produs
PCR i se amestec. Nu este necesar ndeprtarea uleiului mineral adugat n tuburi
pentru a mpiedica evaporarea n timpul amplificrii). Se ataeaz coloanele la tuburile
colectoare (tuburi cu un volum de 2ml). Produii PCR amestecai cu alcool sunt
introdui n coloane i se centrifugheaz la 13000 rotaii/minut (rpm), timp de 30 60
secunde, utiliznd o centrifug de mas. Se descarc tuburile colectoare, plasnd din
nou coloanele n aceleai tuburi.
Pentru etapa de splare, se adaug 0,75ml tampon PE n coloane i se
centrifugheaz la 13000 rpm timp de 30 60s. Se golesc tuburile colectoare, i se
centrifugheaz din nou coloanele timp de 1 minut la 14000 rpm, pentru a elimina
complet alcoolul din probe. Not: etanolul rezidual nu va fi eliminat complet dac nu
este golit tubul colector naintea acestei ultime centrifugri.
Se aeaz coloanele n tuburi Eppendorf sterile de 1,5ml. Pentru a dizolva ADN
din coloane, se adaug 50l tampon EB (10mM Tris-Cl, pH=8,5) sau H2O miliQ n
centrul membranei i se centrifugheaz coloanele, timp de 1 minut la 13000 rpm.
Pentru a crete concentraia de ADN, se adaug numai 30l tampon EB n centrul
membranei, se las n repaus 1 minut i se centrifugheaz.
72
3.6. CUANTIFICAREA PRODUILOR PCR
3.6.1. PREPARAREA GELULUI DE CUANTIFICARE
Pentru cuantificarea ADN din probele purificate n coloane QIAGEN, se va
prepara un gel de agaroz 3%, cu un volum de 30ml. Astfel, pentru un volum de 30ml
sunt necesari 3ml TBE 10X care se dilueaz cu 27ml H2O bidistilat.
n prepararea gelului sunt utilizate dou tipuri de agaroz, cu densiti diferite;
Seakem : Nusieve n raport de 2 : 1., adic, 0,6g Seakem : 0,3g Nusieve. Peste acest
amestec (0,9g agaroz) se adaug soluia TBE 1X, se agit pn la omogenizare i
se introduce n cuptorul cu microunde, unde se las aproximativ 20 de secunde; se
scoate flaconul, se agit pentru o mai bun omogenizare i se introduce din nou n
cuptor pentru alte 20 de secunde. Se rcete flaconul n jet de ap, se introduc 1,5l
bromur de etidiu i se agit flaconul pn la dispariia culorii roii a bromurii de etidiu.
Se toarn gelul ntr-o cuv de gel, se ataeaz un pieptene i se las s se
rceasc. Dup rcire, se scoate pieptenele i se introduce gelul n cuva de
electroforez.
3.6.2. PREGTIREA PROBELOR PENTRU CUANTIFICARE
Amestecul pentru electroforez, ca i n cazul testrii produilor PCR, se
realizeaz ntr-un fag. n fiecare celul a fagului (corespunztor numrului de probe
plus una pentru marker) se introduc cte 2l loading buffer. Peste bufferul de
ncrcare a probelor, se adaug cte 5l din fiecare mostr de ADN purificat i 8l
marker X174-Hinf I. Se omogenizeaz coninutul fiecrei celule a fagului, n
momentul introducerii probei. Dup realizarea amestecurilor, se ncarc probele
(amestecul corespunztor fiecrei probe) n gelul de electroforez.
Migrarea probelor n gel, s-a realizat n cuve de electroforez tip FOTODYNE,
ntr-un cmp electric de 90V, 50 60mA, timp de 40 70 minute, n funcie de
mrimea fragmentelor.
3.6.3 CUANTIFICAREA PROBELOR
Markerul molecular este reprezentat de fagul X174, cu o lungime de 3500pb.
Hinf I este o enzim care taie macromolecula de ADN a fagului, dnd fragmente cu
lungimi (msurate n pb) i greuti cunoscute (Tabel 12). Concentraia fagului n
marker este de 0,0375g/l fag; dac se utilizeaz 8l marker, atunci vom avea
0,3g/l fag.
Tabel 12 Lungimile i greutile fragmentelor de ADN ale fagului X174
X174-Hinf I (pb) Greutatea fragmentului (ng)
726/713 80
533 29,7
500 28
427/417/413 70
311 17
249 13,9
200 11
73
Cuantificarea se face prin compararea intensitii benzilor date de probele
purificate cu intensitatea benzilor date de marker. Astfel, pentru fiecare band de
ADN, se va alege cte o band a marker-ului (pe criteriul similaritii intensitilor), iar
datele vor fi notate ntr-un Tabel sintetic.
Concentraia ADN (ng/l) este dat de raportul dintre greutatea (ng) benzii
respective i cantitatea (l) de ADN purificat ncrcat n gel (5l). cantitatea de ADN
(l) necesar secvenierii se aproximeaz astfel nct s obinem 60 90fmoli ADN
dublu catenar, conform Tabelului 13:
De exemplu, pentru a obine 50fmol ADN cu o lungime de 500pb, sunt necesare
16ng ADN. tiind cte ng sunt necesare pentru a obine un anumit numr de fmoli,
putem aproxima cantitatea de ADN dublu catenar pe care o vom utiliza.
Pentru a obine cantitatea de fmoli, se nmulete cantitatea de ADN aproximat,
cu concentraia ADN (ng/l) corespunztoare. n continuare se face echivalena cu
numrul de fmoli corespunztori la 33ng pentru un segment de 0,5Kpb, date furnizate
de Tabelul 12 (Beckman Coulter Protocol).
Tabel 13 Estimarea concentraiei ADN
Lungimea
(perechi de kilobaze)
ng pentru 25fmoli ng pentru 50fmoli ng pentru 100fmoli
0,2 3,3 6,5 13
0,3 4,9 9,8 20
0,4 6,5 13 26
0,5 8,1 16 33
1,0 16 33 65
2,0 33 65 130
3,0 50 100 195
4,0 65 130 260
5,0 80 165 325
6,0 100 195 390
8,0 130 260 520
10,0 165 325 650
12,0 195 390 780
n continuare, va fi calculat cantitatea de H
2
O miliQ necesar pentru fiecare
prob n reacia de secveniere. Astfel, tiind c pentru fiecare prob se vor folosi
12,5l amestec de reacie i 7l de ADN, tiind cantitatea real de ADN care va fi
folosit, se va scade aceast cantitate din 7, obinndu-se cantitatea de ap necesar
n reacie pentru fiecare prob.
3.7. REACIA DE SECVENIERE
Probele sunt pregtite pentru reacia de secveniere, n tuburi de 0,2ml.
Not: toi reactivii kit-ului de secveniere trebuiesc decongelai pe ghea, iar
probele de ADN pentru secveniere, trebuiesc de asemenea pstrate permanent pe
mediu cu ghea.
Ca i n cazul reaciei de amplificare genic n PCR, n cazul reaciei de
secveniere se folosete un kit pe baza cruia se prepar mediul de reacie (Tabel
14).
74
Tabel 14 Compoziia mediului pentru reacia de secveniere
Reactivi Cantiti (l)
10X buffer 2
dNTP mix 1
ddATP 2
ddGTP 2
ddCTP 2
ddTTP 2
Primer (10M) 0,5
ADN polimeraz 1
Cantitatea total a amestecului de reacie este de 12,5l, iar volumul final al
reaciei de secveniere este de 20l; restul de 7,5l este constituit din ADN sau
ADN+H2O. Odat calculate cantitile de ADN necesare pentru fiecare prob, astfel
nct s obinem ntre 60 90fmoli, iar dac aceast cantitate este mai mic de 7,5l,
se adaug H2OmiliQ sterilizat, pn cnd volumul final de ADN plus ap, ajunge la
7,5l.
Dup adugarea n toate tuburile a cantitilor de ap necesare, se prepar
amestecul de reacie, multiplicnd fiecare din cantitile menionate n Tabelul 14 cu
numrul de probe plus 0,5. Dup prepararea amestecului de reacie, se repartizeaz
cte 12,5l n fiecare tub de 0,2ml (tuburile trebuiesc meninute pe ghea). n
continuare, se adaug cantitatea calculat de ADN i se omogenizeaz cu amestecul
de reacie.
3.7.1. REACIA DE SECVENIERE A CITOCROMULUI B
n cazul tuturor indivizilor aparinnd celor dou genuri Carassius i Cyprinus, au
fost folosii aceiai primeri L14724 i H15149 pentru prima parte a genei, ca i n cazul
reaciei de amplificare, cu deosebirea c au fost utilizate concentraii mai mari (10M)
pentru reacia de secveniere. Programul utilizat, a avut o temperatur de aliniere a
primerilor de 45,0C i un numr de 30 cicluri de replicare.
Reacia de secveniere pentru al doilea fragment al cyt b, ca i n cazul
amplificrii, a decurs difereniat pentru speciile celor dou genuri. n cazul speciilor
genului Cyprinus, s-au folosit primerii L15138 i H15910 n concentraie 10M,
urmnd un program de secveniere cu temperatura de aliniere a primerilor de 47C.
n cazul speciilor genului Carassius, reacia de secveniere a ultimei pri a genei
ce codific sinteza citocromului b, s-a desfurat utiliznd primerii L15138 pentru
catena direct i Cyt-R pentru catena complementar (Figura 21), n concentraii de
10M. Reacia s-a desfurat dup un program a crui temperatur de aliniere a
primerilor a fost de 45C i 30 cicluri de replicare.
L15138 5`-ATGATGACCGCCTTCGTAGGCTA-3`
Cyt-R 5`-TCTTTATATGAGAARTANGGGTG-3`
Figura 21 Structura primerilor utilizai n reacia de secveniere a prii a doua a cyt b la
specii ale genului Carassius
75
3.7.2. REACIA DE SECVENIERE A REGIUNII DE CONTROL MITOCONDRIAL
(D-LOOP)
Pentru reacia de secveniere a d-loop, n cazul speciilor ambelor genuri au fost
folosii cei doi primeri universali CTRL-A pentru catena direct i CTRL-E pentru
catena antisens, n concentraii de 10M. De asemeni, programul utilizat pentru
reacia de secveniere, a avut o temperatur de aliniere a primerilor de 50C i 30
cicluri de replicare
3.7.3. REACIA DE SECVENIERE A ND4L
Pentru secvenierea genei care codific informaia sintezei nicotinamid
dehidrogenazei subunitatea 4L, pentru toate speciile analizate, indivizi ginogenetici i
hibrizi, au fost folosii aceiai primeri L10420 pentru catena sens i H10720 pentru
catena antisens, n concentraie 10M. Programele reaciei de secveniere au fost
diferite; pentru speciile genului Cyprinus, a fost folosit o temperatur de aliniere a
primerilor de 47C n 30 cicluri de replicare.
n cazul speciilor genului Carassius, programul de secveniere a avut temperatura
de aliniere a primerilor de 50C i 30 cicluri de replicare.
3.8. PRECIPITAREA N ETANOL A PROBELOR PENTRU SECVENIERE
Sunt folosite tuburi Eppendorf de 0,5ml care se eticheteaz cu iniiala numelui
genei i a catenei.
Se prepar soluia STOP (1,5M NaOAc i 0,05M EDTA). Aceste soluii se prepar
n tuburi Eppendorf de 1,5ml n volum de 50l (sau 100l pentru precipitarea a 24 de
probe). Astfel, se amestec 25l de ap miliQ steril cu 25l 3M NaOAc soluie stoc i
45l de ap miliQ steril cu 5l de 0,5M EDTA stoc. Se adaug n fiecare tub cte 5l
soluie STOP care conine 2l de 1,5M NaOAc, 2l 0,05M EDTA i 1l de glicogen
(20mg/ml) care se gsete n kit-ul de secveniere.
Pentru a aduga aceast soluie STOP n toate tuburile se prepar un amestec
ntr-un tub Eppendorf de 1,5ml, astfel (cantitile sunt date n l/prob): 1,5M NaOAc
2l, 0,05M EDTA 2l i glicogen 1l.
Se nmulesc aceste cantiti cu numrul de probe plus 1 i se adaug cte 5l
din acest amestec n fiecare tub etichetat anterior. Se centrifugheaz cteva secunde
tuburile de 0,2ml care conin reacia de secveniere i se transfer tot coninutul (20l)
n tuburile de 0,5ml, unde se afl soluia stop i se omogenizeaz cu pipeta. Se
deschid toate tuburile i se adaug cte 65l etanol 95% rece (-20C). Se nchid
tuburile i se agit bine.
Se centrifugheaz imediat la 4C i 14500rpm, timp de 15 minute.
Not: cea mai important etap este cea de amestecare a ADN cu soluia stop i
alcoolul, urmat de centrifugarea imediat dup amestecare.
Dup centrifugare, se extrage cu pipeta tot lichidul supernatant. Nu trebuie atins
sedimentul, pentru a nu-l desprinde de pereii tubului i astfel se poate folosi acelai
vrf de pipet (dac se atinge sedimentul, vrful pipetei trebuie schimbat). Se adaug
cte 190l etanol 70% n fiecare tub (alcoolul se introduce n tub, prelingndu-l pe
perei pentru a nu fragmenta peleta de ADN).
76
Se centrifugheaz la 4C i 14500rpm, timp de 5 minute (alcoolul trebuie meninut
la -20C). Dup centrifugare, se elimin cu pipeta tot alcoolul supernatant, urmrind
permanent unde se afl sedimentul, pentru a nu-l elimina). Se adaug 190l etanol
70%, rece, i se repet etapa anterioar. Dup eliminarea alcoolului, se
centrifugheaz (utiliznd o centrifug normal de mas) la 8000rpm, 1 minut. Pentru a
sedimenta toate picturile de alcool, care se afl pe perei. Cu un vrf de pipet foarte
fin (pentru pipete de 10l) se elimin tot alcoolul din tuburi. Se las tuburile deschise
10 15 minute pentru a usca sedimentele ntr-o ni unde nu ptrunde praf. Se
scoate formamida din congelator pentru decongelare. Dup evaporarea complet a
alcolului din tuburi, se adaug n fiecare 40l formamid i se ametec pe vortex, timp
de 5 secunde. Se centrifugheaz cteva secunde pentru a colecta toate picturile de
pe pereii tuburilor n partea inferioar a acestora. Se las la temperatura camerei, 10
minute. Se amestec din nou pe vortex 5 secunde i se centrifugheaz. Se las n
repaus la temperatura camerei, timp de 10 minute.
Dac probele vor fi introduse direct n secveniator, se transfer cte 40l pe
placa pentru probe. n aceast etap, se pipeteaz de cteva ori pentru a resuspenda
ADN n formamid. Dac probele nu sunt secveniate imediat, se pstreaz tuburile la
-20C. Probele nu pot fi pstrate congelate mai mult de o lun.
Secvenierea propriu-zis s-a realizat utiliznd un secveniator BECKMAN
COULTER CEQ8000 cu opt capilare. Pentru toate genele s-a folosit un timp de
secveniere de 120 minute, exceptnd partea a doua a citocromului b, care, datorit
lungimii (aproximativ 800pb), a necesitat un timp de 160 minute.
3.9. ANALIZA SECVENELOR
Pelucrarea primar a secvenelor sub form de fluorograme i corectarea, au fost
realizate utiliznd programul CEQ2000 furnizat de BECKMAN COULTER, iar datele
au fost exportate sub form de text pentru aliniere.
Unirea secvenelor direct i revers pentru fiecare individ, a fost efectuat
utiliznd programul ESEE 32 (The Eyeball Sequence Editor), prin aliniere cu
secvenele primerilor i tierea celor dou catene, urmat de unirea ntr-o caten
unic.
Alinierea tuturor secvenelor unei gene, provenite de la indivizi diferii (indivizi
aparinnd la populaii diferite, indivizi obinui prin ginogenez, precum i hibrizi), a
fost efectuat prin metodele ClustalW (Thompson et al., 1994) i Clustal V (Higgins i
Sharp, 1989; Higgins, 1994; Wheeler, 2000) utiliznd modulul MegAlign din cadrul
programului LaseGene 7.
Compararea secvenelor, ca i trasarea arborilor filogenetici, a fost realizat prin
utilizarea programului MEGA 4 (Nei i Kumar, 2000).
77
CAPITOLUL 4
STUDIUL RELAIILOR FILOGENETICE
4.1. EVALUAREA UNIFORMITII POPULAIILOR
Pe baza parametrilor fenotipici nregistrai conform Figurii 11 i a indicilor fenotipici
calculai, utiliznd metodele prezentate n capitolul 4.1., au fost obinute valorile pentru
loturile analizate, difereniat pentru cele dou genuri Cyprinus i Carassius. Astfel, n
cazul speciilor genului Cyprinus, din datele prezentate n Tabelul 15 i Figura 22, se
poate observa c valorile medii ale erorilor standard sunt destul de sczute, iar limitele
intervalelor de variabilitate (calculate cu o probabilitate de =0,05 i n-1 grade de
libertate, adic, la o valoare a lui t de 2,021) ale parametrilor fenotipici investigai sunt
foarte restrnse, ceea ce ne sugereaz o omogenitate a loturilor investigate. n plus,
n cazul indicilor analizai se constat de asemeni, valori foarte mici ale erorii standard
(ntre 0,009 pentru indicele de circumferin i 0,027 pentru indicele de profil) i ale
coeficientului de variaie (0,38 pentru indicele de profil), fapt care ne confirm nc o
dat uniformitatea fenotipic a indivizilor analizai, cu toate c provin din regiuni
geografice diferite (Iai i Larga-Jijia Movileni) i au origini diferite (indivizi
ginogenetici hibrizi, hibrizi i indivizi normali).
78
Tabel 15 Parametrii fenotipici calculai, la indivizii genului Cyprinus
Populaia Nr.crt.
Lt
(cm)
Ls
(cm)
Lc
(cm)
Ha
(cm)
Hd
(cm)
G
(g)
C
(cm)
Ip Ic K CF
L
a
r
g
a
-
J
i
j
i
a
M
o
v
i
l
e
n
i
I
n
d
i
v
i
z
i
c
u
s
o
l
z
i
1 27,6 24,6 7,3 3,9 9,7 442 20,5 2,55 1,20 2,96
2 27,0 23,8 7,1 3,7 11,7 413 18,2 2,03 1,31 3,07
3 27,7 24,9 7,4 3,9 11,5 400 18,8 2,17 1,32 2,60
4 28,2 24,9 7,5 4,1 10,4 487 19,6 2,40 1,27 3,17
5 27,4 23,7 7,2 3,9 11,1 408 19,4 2,14 1,23 3,05
I
n
d
i
v
i
z
i
f
s
o
l
z
i
6 25,8 22,5 6,8 3,4 10,9 430 19,5 2,06 1,15 3,80
7 28,3 25,3 7,6 4,1 10,9 452 19,1 2,32 1,32 2,79
8 27,9 24,8 7,4 4,0 10,9 487 20,1 2,27 1,23 3,20
9 28,6 25,7 7,8 4,2 10,3 463 19,5 2,49 1,31 2,74
10 27,8 24,6 7,1 4,1 9,5 451 20,6 2,59 1,19 3,03
11 25,3 21,7 6,3 3,2 10,9 358 19,1 1,99 1,14 3,51
12 29,1 25,9 7,6 4,2 11,5 506 20,6 2,25 1,26 2,90
13 26,9 22,8 6,7 3,4 11,9 351 18,4 1,92 1,24 2,96
14 29,3 25,6 7,2 4,2 9,8 345 20,5 2,62 1,25 2,06
15 26,0 21,4 6,0 3,2 11,2 502 18,3 1,91 1,17 5,15
I
n
d
i
v
i
z
i
g
i
n
o
g
e
n
e
t
i
c
i
16 28,1 24,7 7,2 3,9 10,0 369 19,0 2,46 1,30 2,44
17 26,2 21,9 6,2 3,4 9,6 372 20,3 2,29 1,08 3,53
18 29,2 25,7 7,6 4,1 10,9 500 20,6 2,35 1,24 2,96
19 27,9 22,1 6,4 3,9 10,3 485 19,3 2,14 1,14 4,51
20 25,6 24,7 7,2 3,2 11,2 475 19,8 2,20 1,25 3,15
C
r
a
p
o
g
l
i
n
d
21 25,4 22,9 6,7 3,4 9,8 402 18,5 2,34 1,24 3,36
22 29,2 25,5 7,1 4,2 10,5 427 20,4 2,44 1,25 2,57
23 26,9 22,6 6,6 3,6 10,2 436 18,6 2,21 1,22 3,78
24 26,2 22,3 6,2 3,4 11,1 341 18,5 2,02 1,20 3,06
25 26,2 22,4 6,3 3,4 10,6 358 18,8 2,11 1,19 3,18
I
a
i
26 28,1 24,8 7,2 3,8 11,0 343 18,8 2,25 1,32 2,25
27 28,1 24,1 6,1 4,0 11,3 403 19,5 2,12 1,23 2,89
28 29,1 25,9 7,4 4,3 11,3 437 20,5 2,30 1,26 2,52
29 27,5 23,7 6,6 3,6 11,3 389 19,3 2,10 1,23 2,93
30 26,9 22,8 6,2 3,4 10,2 454 18,9 2,25 1,21 3,83
31 28,0 24,3 7,6 4,1 9,8 507 20,1 2,49 1,21 3,53
32 27,2 24,0 7,6 3,8 10,6 360 20,0 2,26 1,20 2,60
33 25,3 21,8 6,1 3,2 9,3 347 20,5 2,34 1,07 3,35
34 26,9 22,7 6,4 3,5 9,8 475 19,5 2,32 1,16 4,06
35 28,5 24,1 7,2 4,0 11,0 406 18,3 2,19 1,31 2,92
36 25,7 22,3 6,1 3,5 10,4 450 18,5 2,15 1,21 4,06
37 27,4 24,6 7,3 4,0 11,3 464 19,7 2,18 1,25 3,11
38 27,2 24,0 7,1 4,0 9,4 398 18,2 2,55 1,32 2,88
39 28,4 23,5 6,8 4,1 9,3 410 19,9 2,51 1,18 3,16
40 26,4 23,0 6,6 3,7 11,5 410 18,7 2,01 1,23 3,37
41 25,4 21,9 6,1 3,5 9,6 368 19,6 2,27 1,11 3,52
79
Populaia Nr.crt.
Lt
(cm)
Ls
(cm)
Lc
(cm)
Ha
(cm)
Hd
(cm)
G
(g)
C
(cm)
Ip Ic K CF
42 26,7 24,0 7,4 3,9 11,4 501 18,8 2,11 1,28 3,64
43 29,3 25,8 7,7 4,2 10,5 341 20,3 2,47 1,27 1,99
44 28,3 24,9 7,5 3,9 9,7 451 20,2 2,57 1,23 2,92
45 29,9 25,6 7,3 4,6 11,1 463 20,3 2,31 1,26 2,76
46 28,5 24,4 7,0 3,8 11,4 398 20,1 2,14 1,22 2,73
47 26,0 22,6 6,8 3,4 11,6 404 19,3 1,95 1,17 3,48
48 26,7 22,3 6,7 3,6 10,9 469 19,0 2,06 1,17 4,21
49 25,4 22,2 6,7 3,3 11,3 497 18,7 1,96 1,19 4,52
50 28,1 24,7 7,3 3,9 9,7 344 20,0 2,53 1,23 2,28
Media 27,3 23,8 6,95 3,78 10,6 423 19,4 2,25 1,22 3,18
Deviaia standard 1,25 1,34 0,53 0,35 0,73 52,7 0,76 0,19 0,06 0,64
Coeficient de
variaie
2,50 2,67 1,05 0,69 1,46 105, 1,52 0,38 0,12 1,27
Eroarea standard 0,17 0,18 0,07 0,04 0,10 7,46 0,1 0,02 0,01 0,09
Limita superioar
a intervalului de
confiden
27,7 24,1 7,30 4,14 10,9 423, 19,8 2,61 1,58 3,53
Limita inferioar a
intervalului de
confiden
27 23,4 6,59 3,42 10,2 422 19 1,89 0,86 2,82
Ip=indice profil; Ic K=indice de circumferin Kieslev; CF= coeficient Fulton; Lt=lungimea total, Ls=lungime
standard, Lc=lungimea capului, Ha=nlimea la nivelul nottoarei anale, Hd=nlimea la nivelul nottoarei
dorsale, G=greutate, C=circumferin
0
5
10
15
20
25
30
Lt Ls Lc Ha Hd C
Parametrul fenotipic investigat
c
m
Figura 22 Intervalele de variabilitate ale parametrilor fenotipici investigai la speciile
genului Cyprinus
80
Analiznd datele observate n cazul speciilor genului Carassius (Tabelul 16),
putem constata c valorile erorii standard sunt foarte mici, ceea ce semnific o
grupare a tuturor datelor foarte aproape de valoare medie pe prob i parametru
investigat. Pe baza erorii standard a mediei i a valorii lui t dat de =0,05 (adic, o
probabilitate de 95%) i n-1 grade de libertate (unde n reprezint numrul de valori din
fiecare prob), s-au calculat limitele intervalelor de variabilitate pentru toi parametrii
i indicii fenotipici investigai. Din reprezentarea grafic a intervalelor de variabilitate
(Figura 23), se observ limitele reduse ale tuturor parametrilor, ceea ce semnific o
uniformitate a indivizilor analizai. De asemenea, analiznd indicele de profil, se
constat c acesta variaz ntre limite foarte nguste la cei 50 de indivizi (2,19
3,19cm). Chiar i pentru coeficientul Fulton, valorile sunt destul de restrnse, fiind
cuprinse ntre 4,77 9,19g/cm. Toate aceste valori, ne confirm nc o dat c loturile
analizate sunt uniforme din punct de vedere morfologic.
Tabel 16 Parametrii fenotipici calculai, la indivizii genului Carassius
Populaia
Nr.
crt.
Lt
(cm)
Ls
(cm)
Lc
(cm)
Ha
(cm)
Hd
(cm)
G (g)
C
(cm)
Ip IK CF
L
a
r
g
a
-
J
i
j
i
a
-
M
o
v
i
l
e
n
i
1 18,2 15,8 4,0 2,0 5,9 257 15,3 2,68 1,03 6,52
2 19,5 15,6 3,7 2,4 6,3 274 15,2 2,48 1,03 7,22
3 19,2 15,9 4,1 2,2 6,1 252 14,7 2,61 1,08 6,27
4 21,7 17,8 4,4 2,6 6,9 371 17,6 2,58 1,01 6,58
5 18,5 14,7 4,1 1,9 5,2 248 15,2 2,83 0,97 7,81
6 19,2 15,6 4,1 2,3 5,5 262 14,6 2,84 1,07 6,90
7 19,9 16,6 4,2 2,3 6,2 268 15,8 2,68 1,05 5,86
8 17,3 14,4 3,6 1,4 5,0 243 14,4 2,88 1,00 8,14
9 18,3 14,6 3,8 2,0 5,9 260 15,6 2,47 0,94 8,35
10 21,0 17,2 4,4 2,4 6,7 342 16,8 2,57 1,02 6,72
11 20,7 17,2 4,3 2,3 6,5 309 16,3 2,65 1,06 6,07
12 18,6 15,5 4,3 2,1 5,9 249 15,7 2,63 0,99 6,69
13 20,6 16,7 4,3 2,3 6,6 284 16,3 2,53 1,02 6,10
14 20,0 16,4 4,8 2,0 5,8 289 15,6 2,83 1,05 6,55
15 20,2 16,7 4,4 2,1 6,3 277 16,1 2,65 1,04 5,95
16 20,1 16,6 4,1 2,4 6,6 280 16,6 2,52 1,00 6,12
17 18,6 15,3 3,9 2,0 5,7 261 14,8 2,68 1,03 7,29
18 21,3 17,3 4,9 2,4 6,7 340 17,0 2,58 1,02 6,57
19 18,4 15,4 4,0 1,8 5,4 264 14,0 2,85 1,10 7,23
20 18,4 15,2 3,6 2,1 5,9 263 14,3 2,58 1,06 7,49
21 18,1 15,0 3,9 2,0 6,1 266 14,8 2,46 1,01 7,88
22 18,7 15,3 3,9 2,0 5,7 266 14,8 2,68 1,03 7,43
23 17,7 14,4 3,6 1,9 5,4 243 13,2 2,67 1,09 8,14
24 18,0 14,8 4,1 1,9 5,5 237 14,2 2,69 1,04 7,31
25 19,2 15,7 4,1 2,1 6,0 250 16,1 2,62 0,98 6,46
I
a
i
26 19,4 16,2 4,1 2,1 6,2 255 15,3 2,61 1,06 6,00
81
Populaia
Nr.
crt.
Lt
(cm)
Ls
(cm)
Lc
(cm)
Ha
(cm)
Hd
(cm)
G (g)
C
(cm)
Ip IK CF
27 18,8 15,4 4,1 2,0 5,9 264 14,8 2,61 1,04 7,23
28 17,1 13,9 3,7 2,0 5,6 231 14,3 2,48 0,97 8,60
29 18,9 15,9 3,6 2,0 5,8 250 15,2 2,74 1,05 6,22
30 17,3 14,2 3,9 2,1 5,6 243 14,3 2,54 0,99 8,49
31 18,0 14,8 3,9 1,9 5,9 247 14,6 2,51 1,01 7,62
32 17,4 15,4 4,3 1,4 5,4 269 15,1 2,84 1,02 7,43
33 20,0 15,1 4,1 2,6 5,6 283 14,3 2,70 1,06 8,24
34 17,9 14,9 4,5 2,0 5,5 243 15,7 2,70 0,95 7,38
35 19,5 14,5 3,7 2,3 5,5 253 16,6 2,62 0,87 8,31
36 18,1 16,9 4,1 2,4 6,6 257 16,6 2,56 1,02 5,37
37 17,3 16,3 4,2 1,4 6,7 244 16,8 2,43 0,97 5,68
38 20,7 16,2 3,8 2,0 5,8 273 14,0 2,82 1,16 6,36
39 18,6 16,8 3,8 1,4 6,4 253 15,2 2,61 1,11 5,31
40 19,6 17,0 4,4 2,6 5,3 268 16,5 3,19 1,03 5,40
41 19,6 16,6 4,2 1,4 5,8 331 14,4 2,86 1,15 7,29
42 18,7 16,4 3,9 2,6 6,1 289 14,7 2,68 1,12 6,52
43 18,6 17,1 3,7 2,4 6,6 240 14,1 2,58 1,21 4,77
44 17,6 16,7 4,8 1,9 5,9 237 14,1 2,82 1,19 5,09
45 19,4 16,0 4,6 1,4 5,5 302 14,5 2,90 1,11 7,37
46 18,3 16,3 4,6 1,5 6,2 243 14,6 2,63 1,12 5,57
47 21,1 14,6 4,5 1,6 6,7 287 14,0 2,19 1,04 9,19
48 20,5 16,8 4,5 2,4 5,8 244 14,8 2,90 1,13 5,14
49 19,6 17,3 4,4 1,5 5,8 278 15,0 3,00 1,15 5,39
50 17,7 14,3 3,8 1,9 6,0 240 15,6 2,37 0,92 8,21
Media 19,02 15,83 4,12 2,04 5,96 267,59 15,20 2,66 1,04 6,84
Deviaia standard 1,17 0,99 0,34 0,34 0,46 29,47 0,97 0,17 0,07 1,07
Coeficient de
variaie
2,34 1,99 0,67 0,67 0,91 58,93 1,93 0,34 0,13 2,13
Eroarea standard 0,16 0,14 0,04 0,04 0,06 4,16 0,13 0,02 0,01 0,15
Limita superioar
a intervalului de
confiden
19,38 16,18 4,47 2,39 6,32 267,94 15,56 3,02 1,40 7,19
Limita inferioar
a intervalului de
confiden
18,66 15,46 3,75 1,68 5,60 267,22 14,84 2,30 0,68 6,47
Ip=indice profil; Ic K=indice de circumferin Kieslev; CF= coeficient Fulton; Lt=lungimea total, Ls=lungime
standard, Lc=lungimea capului, Ha=nlimea la nivelul nottoarei anale, Hd=nlimea la nivelul nottoarei
dorsale, G=greutate, C=circumferin
82
0
5
10
15
20
25
Lt Ls Lc Ha Hd C
Parametrul fenotipic investigat
c
m
Figura 23 Intervalele de variabilitate ale parametrilor fenotipici analizai, la speciile
genului Carassius
Dac comparm valorile medii ale celor doi indici i al coeficientului Fulton, pentru
ambele genuri investigate (Tabel 17), putem constata c valorile sunt aproximativ
egale, ceea ce denot c exist similaritate fenotipic chiar i ntre indivizii celor dou
genuri. Astfel, se constat c exist o diferen foarte mic (0,41) n ceea ce privete
indicele de profil pentru indivizii celor dou genuri, de unde rezult c morfologic,
populaiile studiate sunt asemntoare.
Tabel 17 Compararea indicilor calculai pentru cele dou genuri
Nr.
crt.
Indici fenotipici Cyprinus Carassius
1 Indice de profil 2,25 2,66
2
Indice de
circumferin
1,22 1,04
3 Coeficient Fulton 3,18 6,84
4.2. TESTAREA OBINERII PRODUILOR PCR PRIN ELECTROFOREZ
ORIZONTAL N GEL DE AGAROZ
Amplificarea genic, s-a realizat pentru 10 indivizi din fiecare populaie (Larga-Jijia
Movileni i Iai), aparinnd celor dou genuri, inclusiv hibrizi i indivizi ginogenetici.
Trebuie menionat faptul c toate experimentele de amplificare genic prin PCR i
secvenierea, au fost efectuate n cadrul Laboratorului de Genetic i Filogenie
83
Molecular a Facultii de tiine, Universitatea din Vigo, Spania i completate cu
rezultate obinute n cadrul Laboratorului de Genetic Molecular i Arheogenetic,
Universitatea Alexandru Ioan Cuza
Pentru toate cele trei gene, reaciile de amplificare s-au desfurat conform
protocoalelor prezentate n capitolul anterior, pe baza unei matrie de ADNmt provenit
din esutul muscular, deoarece s-a constatat c purificarea este mult mai bun n
ciuda faptului c este prezent n cantitate mai mic la nivelul acestui esut, fapt care,
pe de alt parte, determin i o mai bun dizolvare a acestuia n buffer TE.
n cazul speciilor genului Cyprinus, s-a constatat c pentru prima parte a
citocromului b, s-au obinut n urma amplificrii, fragmente de aproximativ 480 perechi
de baze (pb) (Figura 24).
Figura 24 Electroforez n gel de agaroz 1,5%, pentru prima parte a Cytb
la indivizi ai genului Cyprinus (C-=control negativ, M=marker molecular de 100pb)
Dup cum s-a precizat n capitolul anterior, s-a folosit un marker molecular de
100pb pentru determinarea lungimilor fragmentelor amplificate. De asemenea, rolul
controlului negativ (C-), este de determinare a eventualelor contaminri.
Pentru a doua parte a citocromului b (cyt b) n cazul speciilor aceluiai gen, s-au
obinut fragmente cu lungimi de aproximativ 800pb (Figura 25).
84
Figura 25 Electroforez n gel de agaroz 1,5%, pentru a doua parte a Cytb
la indivizi ai genului Cyprinus (C-=control negativ, M=marker molecular de 100pb)
n cazul speciilor genului Carassius gibelio Bloch, dup cum a fost precizat i n
capitolul anterior, amplificarea citocromului b a avut loc ntr-o singur etap,
obinndu-se un segment de aproximativ 1200pb (Figura 26).
Potrivit datelor furnizate de banca de gene (GenBank din cadrul NCBI National
Center for Biotechnology Information), lungimea total a citocromului b la ambele
genuri studiate, este de aproximativ 1140pb. Rezultatele obinute de noi n urma
clonrii acestei gene, dup cum reiese din figurile anterioare, nu corespund acestor
date, deoarece segmentele amplificate includ secvenele primerilor i fragmente din
secvenele genelor limitrofe, deoarece primerii utilizai, n majoritatea cazurilor se
aliniaz n aceste zone.
Figura 26 Electroforez n gel de agaroz 1,5%, pentru Cytb
la Carassius gibelio Bloch (C-=control negativ, M=marker molecular de 100pb)
85
n cazul regiunii de control mitocondrial (d-loop), pentru indivizii genului Cyprinus,
s-au obinut n urma clonrii, fragmente cu lungimi de aproximativ 420pb (Figura 27).
Figura 27 Electroforez n gel de agaroz 1,5%, pentru d-loop
la indivizi ai genului Cyprinus (C-=control negativ, M=marker molecular de 100pb)
La Carassius gibelio, pentru toi indivizii analizai, n urma amplificrii d-loop, s-au
obinut fragmente cu lungimi de aproximativ 300pb (Figura 28), datorit poziiei
primerilor utilizai, care determin amplificarea doar a primului segment hipervariabil al
acestei gene.
Figura 28 Electroforez n gel de agaroz 1,5%, pentru d-loop
la Carassius gibelio Bloch (C-=control negativ, M=marker molecular de 100pb)
86
Amplificarea subunitii 4L a dehidrogenazei, a determinat obinerea unui segment
de aproximativ 280pb pentru indivizii ambelor genuri Cyprinus (Figura 29) i Carassius
(Figura 30).
Figura 29 Electroforez n gel de agaroz 1,5%, pentru ND4L
la indivizi ai genului Cyprinus (C-=control negativ, M=marker molecular de 100pb)
Figura 30 Electroforez n gel de agaroz 1,5%, pentru ND4L
la Carassius gibelio Bloch (C-=control negativ, M=marker molecular de 100pb)
87
4.3. CUANTIFICAREA PRODUILOR PCR
Cuantificarea produilor PCR, reprezint estimarea cantitilor de produs purificat
i determinarea cantitilor necesare reaciei de secveniere. Dup cum a fost precizat
anterior, cuantificarea se realizeaz utiliznd markerul molecular X174-Hinf I prin
migrarea produilor PCR purificai, ntr-un gel de agaroz 3%.
Pentru citocromul b prima parte, la speciile genului Cyprinus, pe baza
electroforegramei (Figura 31), au fost estimate cantitile de ADN existente n fiecare
prob (Tabelul 18).
Figura 31 Electroforez n gel de agaroz 3%, pentru cyt b prima parte
la indivizi ai genului Cyprinus
Din Tabelul 18, putem constata c valorile concentraiilor de ADN amplificat n
PCR i purificat, corespunztoare primei pri a citocromului b, sunt suficient de
ridicate, astfel nct s se obin concentraii suficiente (ntre 60 90 fmoli) pentru
reacia de secveniere.
88
Tabel 18 Estimarea cantitilor de ADN necesare secvenierii primei pri a cyt b, pentru
indivizi ai genului Cyprinus
Nr.
prob
Banda
Concentraia ADN
(ng/ul)
Cantitatea de
ADN (l)
fmol
Cy01I 533 5,9 4 71,5
Cy02I 500 5,6 4,5 76,3
Cy03I 1/2x200 1,1 7,6 25
Cy04I 500 5,6 4 67,8
Cy05I 0,8x500 4,48 5 67,5
Cy06I 533 5,9 4 71,5
Cy07I 500 5,6 4 67,8
Cy08I 533 5,6 4 71,5
Cy09I 533 5,9 4 71,5
Cy10I 0,8x500 4,48 5 67,8
Cy01M 533 5,6 4 71,5
Cy02M 533 5,9 4 71,5
Cy03M 533 5,6 4 71,5
Cy04M 533 5,9 4 71,5
Cy05M 0,8x500 4,48 5 67,8
Cy06M 0,8x500 4,48 5 67,8
Cy07M 500 5,6 4 67,8
Cy08M 500 5,6 4 67,8
Cy09M 500 5,6 4 67,8
Cy10M 500 5,6 4 67,8
Pentru partea a doua a citocromului b la specii ale genului Cyprinus, a fost
realizat cuantificarea pe baza Figurii 32, iar datele au fost sintetizate n Tabelul 19.
Figura 32 Electroforez n gel de agaroz 3%, pentru cyt b partea a doua,
la indivizi ai genului Cyprinus
89
Tabel 19 Estimarea cantitilor de ADN necesare secvenierii cyt b a doua parte, pentru
indivizi ai genului Cyprinus
Nr.
prob
Banda
Concentraia
ADN (ng/ul)
Cantitatea de
ADN (l)
fmol
Cy01I 533 5,94 6 67,5
Cy02I 1,8x726/713 28,8 1,5 81,8
Cy03I 1,8x726/713 28,8 1,5 81,8
Cy04I 1,5x726/713 24 1,5 68,18
Cy05I 1,8x726/713 28,8 1,5 81,8
Cy06I 1,8x726/713 28,8 1,5 81,8
Cy07I 2x726/713 32,0 1 60,6
Cy08I 1,8x726/713 28,8 1,5 81,8
Cy09I 1,8x726/713 28,8 1,5 81,8
Cy10I 1,3x726/713 28,8 1,5 81,8
Cy01M 427/417/413 14 3 79,54
Cy02M 1,8x726/713 28,8 1,5 81,8
Cy03M 1,8x726/713 28,8 1,5 81,8
Cy04M 0,5x200 1,1 7,5 15,6
Cy05M 1,8x726/713 28,8 1,5 81,8
Cy06M 1,8x726/713 28,8 1,5 81,8
Cy07M 1,8x726/713 28,8 1,5 81,8
Cy08M 1,8x726/713 28,8 1,5 81,8
Cy09M 1,8x726/713 28,8 1,5 81,8
Cy10M 427/417/413 14 3 79,54
La indivizii genului Carassius din ambele populaii, s-a realizat cuantificarea
ntregului citocrom b (Figura 33 i Tabelul 20).
Figura 33 Electroforez n gel de agaroz 3%, pentru cyt b,
la indivizi ai genului Carassius
90
Se observ c, doar n cazul unui singur individ (Cy04M) nu s-a obinut cantitatea
de ADN dorit pentru reacia de secveniere, cu toate c este posibil ca aceasta s
decurg normal.
Tabel 20 Estimarea cantitilor de ADN necesare secvenierii cyt b pentru indivizi ai
genului Carassius
Nr.
prob
Banda
Concentraia
ADN (ng/ul)
Cantitatea de
ADN (l)
fmol
Ca01I 427/417/413 14 2 70,7
Ca02I 0,7x427/417/413 9,8 3 74,2
Ca03I 0,7x427/417/413 9,8 3 74,2
Ca04I 427/417/413 14 2 70,7
Ca05I 427/417/413 14 2 70,7
Ca06I 726/713 16 1,55 60,6
Ca07I 726/713 16 1,55 60,6
Ca08I 427/417/413 14 2 70,7
Ca09I 427/417/413 14 2 70,7
Ca10I 427/417/413 14 2 70,7
Ca01M 427/417/413 14 2 70,7
Ca02M 726/713 16 1,55 60,6
Ca03M 427/417/413 14 2 70,7
Ca04M 427/417/413 14 2 70,7
Ca05M 427/417/413 14 2 70,7
Ca06M 427/417/413 14 2 70,7
Ca07M 427/417/413 14 2 70,7
Ca08M 427/417/413 14 2 70,7
Ca09M 427/417/413 14 2 70,7
Ca10M 0,7x427/417/413 9,8 3 74,2
n acest caz, au fost obinute valori ale concentraiei de ADN, cuprinse ntre
60,6fmoli i 74,2fmoli ADN, ceea ce asigur un optim al cantitii de produs PCR
pentru reacia de secveniere.
Pentru d-loop la speciile genului Cyprinus, s-au calculat cantitile de ADN
necesar reaciei de secveniere, pe baza Figurii 34.
91
Figura 34 Electroforez n gel de agaroz 3%, pentru d-loop,
la indivizi ai genului Cyprinus
Comparativ, la indivizii genului Carassius, s-au obinut cantiti mai mari de
produs PCR purificat i implicit cantiti mai mari de ADN ce pot fi utilizate pentru
reacia de secveniere (Figura 35 i Tabelul 21).
Figura 35 Electroforez n gel de agaroz 3%, pentru d-loop,
la indivizi ai genului Carassius
92
Tabel 21 Estimarea cantitilor de ADN necesare secvenierii d-loop pentru indivizi ai
genului Cyprinus
Nr.
prob
Banda
Concentraia
ADN (ng/ul)
Cantitatea de
ADN (l)
fmol
Cy01I 200 2,2 7,5 50
Cy02I 311 3,4 7,5 77,2
Cy03I 249 2,7 7,5 61,3
Cy04I 500 5,6 4,5 76,3
Cy05I 200 2,2 7,5 50
Cy06I 200 2,2 7,5 50
Cy07I 200 2,2 7,5 50
Cy08I 249 2,7 7,5 61,3
Cy09I 311 3,4 7,5 77,2
Cy10I 200 2,2 7,5 50
Cy01M 200 2,2 7,5 50
Cy02M 200 2,2 7,5 50
Cy03M 200 2,2 7,5 50
Cy04M 249 2,7 7,5 61,3
Cy05M 311 3,4 7,5 77,2
Cy06M 200 2,2 7,5 50
Cy07M 200 2,2 7,5 50
Cy08M 249 2,7 7,5 61,3
Cy09M 200 2,2 7,5 50
Cy10M 200 2,2 7,5 50
Din Tabelul 21, se observ c s-au obinut cantiti de ADN cu valori cuprinse ntre 50fmoli
pentru majoritatea indivizilor i 77,2fmoli pentru trei dintre indivizii analizai.
Tabel 22 Estimarea cantitilor de ADN necesare secvenierii d-loop pentru indivizi ai
genului Carassius
Nr.
prob
Banda
Concentraia
ADN (ng/ul)
Cantitatea
de ADN (l)
fmol
Ca01I 533 5,94 4 72
Ca02I 0,7x427/417/413 9,8 2,5 74,24
Ca03I 0,8x427/417/413 11,2 2 67,87
Ca04I 0,8x427/417/413 11,2 2 67,87
Ca05I 533 5,94 4 72
Ca06I 533 5,94 4 72
Ca07I 0,8x427/417/413 11,2 2 67,87
Ca08I 0,5x427/417/413 7 3,5 74,24
Ca09I 500 5,6 4,5 76,36
Ca10I 0,7x427/417/413 9,8 2,5 74,24
Ca01M 533 5,94 4 72
Ca02M 500 5,6 4,5 76,36
Ca03M 0,8x427/417/413 11,2 2 67,87
Ca04M 0,8x427/417/413 11,2 2 67,87
Ca05M 533 5,94 4 72
Ca06M 500 5,6 4,5 76,36
Ca07M 500 5,6 4,5 76,36
Ca08M 0,8x427/417/413 11,2 2 67,87
Ca09M 0,8x427/417/413 11,2 2 67,87
Ca10M 0,8x427/417/413 11,2 2 67,87
93
Se poate observa din Tabelul 22 c s-au obinut cantitile optime de ADN
necesare reaciei de secveniere, pentru toi indivizii analizai, aparinnd celor dou
populaii Iai i Larga-Jijia Movileni.
Pentru subunitatea 4L a dedidrogenazei (ND4L) n cazul speciilor i varietilor
analizate pentru genul Cyprinus, s-au calculat cantitile necesare de ADN pe baza
Figurii 36.
Figura 36 Electroforez n gel de agaroz 3%, pentru ND4L,
la indivizi ai genului Cyprinus
La indivizii genului Carassius din ambele populaii analizate, s-au calculat
cantitile de ADN (produs PCR purificat) necesare reaciei de secveniere, pe baza
Figurii 37.
Figura 37 Electroforez n gel de agaroz 3%, pentru ND4L,
la indivizi ai genului Carassius
94
Tabel 23 Estimarea cantitilor de ADN necesare secvenierii ND4L pentru indivizi ai
genului Cyprinus
Nr.
prob
Banda
Concentraia
ADN (ng/ul)
Cantitatea de
ADN (l)
fmol
Cy01I 249 2,78 4,5 62,5
Cy02I 249 2,78 4,5 62,5
Cy03I 311 3,4 3,5 59,5
Cy04I 311 3,4 3,5 59,5
Cy05I 0,4x427/417/413 5,6 2,5 70
Cy06I 0,5x427/417/413 7 2 70
Cy07I 0,5x427/417/413 7 2 70
Cy08I 0,5x427/417/413 7 2 70
Cy09I 311 3,4 3,5 59,5
Cy10I 311 3,4 3,5 59,5
Cy01M 0,5x427/417/413 7 2 70
Cy02M 0,5x427/417/413 7 2 70
Cy03M 0,5x427/417/413 7 2 70
Cy04M 0,5x427/417/413 7 2 70
Cy05M 0,5x427/417/413 7 2 70
Cy06M 311 3,4 3,5 59,5
Cy07M 0,5x427/417/413 7 2 70
Cy08M 0,5x427/417/413 7 2 70
Cy09M 0,5x427/417/413 7 2 70
Cy10M 0,5x427/417/413 7 2 70
Din Tabelul 23 rezult c s-au obinut cantiti de ADN necesare secvenierii,
cuprinse ntre 59,5 i 70fmoli.
Se poate constata din Tabelul 24, c i n acest caz, pentru indivizii genului
Carassius, cantitile de ADN obinute pentru reacia de secveniere a ND4L sunt mai
mari dect n cazul varietilor genului Cyprinus.
95
Tabel 24 Estimarea cantitilor de ADN necesare secvenierii d-loop pentru indivizi ai
genului Carassius
Nr.
prob
Banda
Concentraia
ADN (ng/ul)
Cantitatea de
ADN (l)
fmol
Ca01I 0,7x427/417/413 9,8 1,5 73,5
Ca02I 0,8x427/417/413 11,2 1,5 84
Ca03I 0,8x427/417/413 11,2 1,5 84
Ca04I 0,7x427/417/413 9,8 1,5 73,5
Ca05I 0,7x427/417/413 9,8 1,5 73,5
Ca06I 0,8x427/417/413 11,2 1,5 84
Ca07I 0,7x427/417/413 9,8 1,5 73,5
Ca08I 0,7x249 1,94 7,5 72,75
Ca09I 0,7x249 1,94 7,5 72,75
Ca10I 0,5x249 1,39 7,5 52,12
Ca01M 0,7x427/417/413 9,8 1,5 73,5
Ca02M 0,7x427/417/413 9,8 1,5 73,5
Ca03M 0,7x427/417/413 9,8 1,5 73,5
Ca04M 0,7x427/417/413 9,8 1,5 73,5
Ca05M 0,7x427/417/413 9,8 1,5 73,5
Ca06M 0,7x427/417/413 9,8 1,5 73,5
Ca07M 0,8x427/417/413 11,2 1,5 84
Ca08M 0,8x427/417/413 11,2 1,5 84
Ca09M 0,8x427/417/413 11,2 1,5 84
Ca10M 0,7x427/417/413 9,8 1,5 73,5
4.4. SECVENIEREA GENELOR UTILIZATE N STUDIILE DE FILOGENIE
Secvenierea propriu-zis a celor 3 gene luate n studiu pentru toi indivizii
aparinnd la dou genuri, fiecare cu cte dou populaii diferite, s-a realizat cu
ajutorul unui secveniator Beckman Coulter cu 8 capilare. Pentru fiecare din cele trei
gene, au fost secveniate ambele catene (direct i revers), secvenele fiind obinute
sub form de fluorograme.
Toate fluorogramele au fost corectate utiliznd programul CEQ 2000 DNA
Analysis System, furnizat de Beckman Coulter. Aceast corectare este necesar
pentru a verifica dac citirea electronic a fost corect i a completa sau nlocui
eventualele erori date de suprapunerea curbelor fluorogramei. Ulterior, secvenele
corectate au fost exportate pentru aliniere n programul ESEE 32 (The Eyeball
Sequence Editor) care a permis alinierea catenelor complementare pe baza
secvenelor primerilor, tierea i unirea ambelor catene ntr-o unic secven care are
lungimea real.
96
4.5. COMPARAREA SECVENELOR NUCLEOTIDICE ALE CITOCROMULUI B,
PROVENITE DE LA INDIVIZI APARINND GENULUI CYPRINUS
n cazul speciilor genului Cyprinus, pentru citocromul b, au fost aliniate cele 20 de
secvene (19 indivizi aparinnd celor dou populaii i 1 individ de crap oglind
Cy06M), utiliznd metoda Clustal V (Higgins i Sharp, 1989).
Din alinierea secvenelor pentru 20 de indivizi ai genului Cyprinus, se constat c
exist un numr de 15 diferene ntre cele douzeci de secvene.
Cele mai multe diferene, apar la individul de crap oglind (Cy06M). Astfel, pentru
acesta au fost nregistrate un numr de 12 diferene, dintre care, 11 tranziii i 1
transversie. Tranziiile au fost observate n poziiile: 177 (substituia citozinei cu
timin); 198 i 864 (substituia timinei cu citozin); 352, 568, 624, 693,897 i 990
(substituia adeninei de guanin); 591 i 732 (substituia guaninei de ctre adenin).
Transversia s-a produs n poziia 870, unde a avut loc nlocuirea timinei de ctre
adenin. n cazul acestei secvene, se poate constata c rata de apariie a tranziiilor
este foarte mare comparativ cu cea de apariie a transversiilor.
Alte diferene, au fost constatate pentru individul Cy03M (individ normal din
populaia Movileni) n cazul cruia s-a produs o transversie n poziia 396, unde a fost
substituit timina de ctre guanin; la indivizii Cy01M i Cy04M s-a nregistrat o
tranziie n poziia 507 (nlocuirea adeninei de ctre guanin) i n final, pentru
individul Cy04I (din populaia Iai), a avut loc o transversie n poziia 432, unde a fost
substituit adenina cu timin.
Referitor la restul indivizilor, se constat o rat destul de sczut a diferenelor
existente ntre cele dou populaii.
Din cele prezentate anterior, putem concluziona c au fost gsite 5 noi haplotipuri
pentru citocromul b: Cy06M pentru crapul oglind din populaia Mrgineni, Cy0104M
i Cy03M pentru crapul normal cu solzi, din aceeai populaie i Cy04I pentru crapul
cu solzi din populaia Iai, fiind stabilit haplotipul general pentru cele dou populaii
(dat de celelalte secvene care nu prezint diferene).
Pe baza comparaiei ntre secvene, s-a realizat tabelul similaritii i divergenei
(Tabel 25), din care se constat c procentele de similaritate sunt cuprinse ntre
98,9% (pentru secvenele Cy06M i restul care nu prezint foarte multe diferene) i
99,9% pentru secvenele care difer ntre ele doar printr-o singur nucleotid.
97
Tabel 25 Procentele de similaritate i divergen pentru secvenele haplotipurilor stabilite
Procent de similaritate
P
r
o
c
e
n
t
d
e
d
i
v
e
r
g
e
n
Cy01I Cy04I Cy0104M Cy03M Cy06M
Cy01I 99,9 99,9 99,9 98,9 Cy01I
Cy04I 0,1 99,8 99,8 98,9 Cy04I
Cy03M 0,1 0,2 99,8 98,9 Cy03M
Cy0104M 0,1 0,2 0,2 98,9 Cy0104M
Cy06M 1,1 1,2 1,2 1,2 Cy06M
Cy01I Cy04I Cy0104M Cy03M Cy06M
n plus, pentru a stabili o mai clar difereniere ntre toate noile haplotipuri, au fost
analizate numrul i procentele n care se gsesc bazele azotate n fiecare dintre
acestea (Tabel 26).
Tabel 26 Procentul bazelor azotate, n cadrul haplotipurilor stabilite
Baze
azotate
Specii analizate
Cy01I Cy04I Cy0104M Cy03M Cy06M
A
Nr. 350 349 349 350 347
% 30,70 30,60 30,60 30,70 30,44
G
Nr. 155 155 156 156 159
% 13,60 13,60 13,68 13,68 13,95
T
Nr. 295 297 295 294 293
% 25,88 26,0 25,88 25,79 25,70
C
Nr. 340 340 340 340 341
% 29,82 20,80 29,82 29,82 29,91
A+T
Nr. 645 645 644 644 640
% 56,58 56,58 56,49 56,49 56,14
C+G
Nr. 495 495 496 496 500
% 43,42 43,42 43,51 43,51 43,86
98
0
5
10
15
20
25
30
35
%
Cy01I Cy04I Cy0104M Cy03M Cy06M
Haplotip
A G T C
Figura 38 Graficul frecvenei bazelor azotate n cadrul haplotipurilor caracterizate
0
5
10
15
20
25
30
35 %
A G T C
Baze azotate
Cy01I Cy04I Cy0104M Cy03M Cy06M
Figura 39 Graficul frecvenei bazelor azotate, comparativ ntre haplotipurile analizate
Din Tabelul 26 i Figurile 38 i 39, se poate observa c diferene majore se
constat pentru secvena Cy06M, care prezint valori diferite pentru toate bazele
azotate, comparativ cu celelalte haplotipuri.
99
Referitor la cantitatea de adenin (A), aceasta este egal pentru Cy01I i Cy03M
(30,70%) i pentru haplotipurile Cy04I Cy0104M (30,60%). Cantitatea de guanin
este aproximativ egal pentru toate haplotipurile, fiind cuprins ntre 13,60% (Cy01I i
Cy04I) i 13,68% pentru Cy0104M i Cy03M. De asemeni, se constat diferene i
pentru celelalte baze azotate: timina se gsete n proporie de 25,88% pentru Cy01I,
Cy0104M, avnd valori diferite pentru celelalte haplotipuri, iar citozina, n proporii
aproximativ egale pentru toate haplotipurile.
Procentul de baze complementare este de 56,58% n cazul A+T pentru primele
dou haplotipuri i 56,49% pentru Cy0104M i Cy03M, pentru Cy06M fiind de 56,14%.
Procentul de G+C este de 43,42% pentru primele dou haplotipuri (Cy01I, Cy04I), de
43,51% pentru (Cy0104M, Cy03M) i 43,86% pentru Cy06M.
4.5.1. CARACTERIZAREA HAPLOTIPULUI CY01I
4.5.1.1. FRECVENELE TIPURILOR DE ASOCIERI NUCLEOTIDICE
n aceast categorie au fost ncadrate toate secvenele ntre care nu exist
diferene (Cy01I, Cy02I, Cy03I, Cy05I, Cy06I, Cy07I, Cy08I, Cy09I, Cy10I, Cy02M,
Cy05M, Cy07M, Cy08M, Cy09M, Cy10M), aparinnd celor dou populaii luate n
studiu.
Referitor la procentele dinucleotidelor, constatm, c valoarea cea mai mare o are
perechea AC (10,3%), iar valoarea cea mai mic perechea GG, n proporie de 2,3%.
Referitor la trinucleotide, cea mai mare frecven o nregistreaz tripletul CAT (3,9%),
iar valoarea cea mai mic, tripletele GGG i GCG, ambele avnd o frecven de 0,2%.
Tetramerii cu frecvena cea mai mare, sunt ACTA (1,6%), iar cei cu frecven
redus: TCTC, CTCA, ATAC, ACCC, toi n procent de 1,0%. n cazul pentamerilor,
cea mai mare frecven o are pentamerul TCCTA (0,9%), iar cea mai mic frecven,
o au TTCCT, TACCA, CTCCT, CTCAT i CTAGT (0,4%). n ceea ce privete
hexamerii, acetia au frecvene cuprinse ntre 0,3% i 0,4%.
Tetramerii, pentamerii i hexamerii cu frecven joas, sunt cei care se gsesc
ntr-un singur exemplar n ntreaga gen, avnd o frecven de 0,1%.
Cu ajutorul modulului EditSeq al DNA Star, a fost calculat temperatura de topire
a ADN, dup un model Davis-Botstein-Roth; n acest caz, prezint o valoare de
82,26C.
4.5.1.2. TRANSLAIA I CARACTERIZAREA CATENEI POLIPEPTIDICE
Translaia s-a realizat pe baza unui cod genetic mitocondrial pentru vertebrate,
utiliznd modulul EditSeq din cadrul programului DNA Star.
Catena polipeptidic obinut este prezentat n Figura 40.
100
Figura 40 Catena polipeptidic a citocromului b caracteristic haplotipului Cy01I al
speciei Cyprinus carpio
Dup realizarea translaiei, se constat c ntreg lanul polipeptidic, este alctuit
din 378 aminoacizi (Tabelul 27), din care se observ c frecvena cea mai mare, o are
leucina (15,08%), iar cea mai sczut o are cisteina (1,06%). Se constat de
asemenea, existena a doi codoni stop (notai cu .) ctre sfritul lanului polipeptidic.
Se constat c din totalul de 378 aminoacizi, 16 sunt acizi, 19 sunt bazici, 92
polari i 177 hidrofobi (Tabelul 28). De asemenea, se constat c lanul polipeptidic
are o sarcin electric de 5,28 (la pH=7) i un punct izoelectric de 8,42 (Figura 41).
Tabel 27 Compoziia lanului polipeptidic
Aminoacizi
Numr
Procent din
greutatea total (%)
Frecvena
(%) Simbol Nume
A Ala 30 5,01 7,94
C Cys 4 0,97 1,06
D Asp 11 2,97 2,91
E Glu 5 1,52 1,32
F Phe 26 8,98 6,88
G Gly 23 3,08 6,08
H His 15 4,83 3,97
I Ile 29 7,70 7,67
K Lys 10 3,01 2,65
L Leu 57 15,14 15,08
M Met 16 4,93 4,23
N Asn 17 4,55 4,50
P Pro 20 4,56 5,29
Q Gln 6 1,80 1,59
R Arg 9 3,30 2,38
S Ser 25 5,11 6,61
T Thr 25 5,93 6,61
V Val 22 5,12 5,82
W Trp 13 5,68 3,44
Y Tyr 15 5,75 3,97
B Asx 0 0,00 0,00
Z Glx 0 0,00 0,00
. Ter 2 0,00 0,53
MASLRKTHPL IKIANDALVD LPTPSNISAW WNFGSLLGLC LITQILTGLF
LAMHYTSDIS TAFSSVTHIC RDVNYGWLIR NVHANGASFF FICIYMHIAR
GLYYGSYLYK ETWNIGVILL LLVMMTAFVG YVLPWGQMSF WGATVITNLL
SAVPYMGDML VQWIWGGFSV DNATLTRFFA FHFLLPFVIT AATIIHLLFL
HETGSNNPIG LNSDADKVSF HPYFSYKDLL GFVIMLLALT LLALFSPNLL
GDPENFTPAN PLVTPPHIKP EWYFLFAYAI LRSIPNKLGG VLALLFSILV
LMVVPLLHTS KQRGLTFRPI TQFLFWTLVA DMIILTWIGG MPVEHLIMWH
ASSYSPHSHY A.RC.MAMTA MLQNKALKWA
101
Tabel 28 Caracterizarea lanului polipeptidic
Figura 41 Curba de titrare pentru lanul polipeptidic al citocromului b, haplotip Cy01I al
speciei Cyprinus carpio
Ulterior, a fost realizat o analiz a structurii proteinei, fiind determinate zonele
alfa helicoidale, beta pliate i de inflexiune, prin dou metode Garnier-Robson
(Garnier et al., 1978) i Chou-Fasman (Chou i Fasman, 1978); reprezentarea grafic
a zonelor hidrofobe (Kyte i Doolittle, 1982), zonele de flexie (Karplus i Schultz,
1985), indexul antigenic (Jameson i Wolf, 1988) i graficul probabil al suprafeei
(Emini et al., 1985).
Din analiza structurii lanului polipeptidic, se poate observa c referitor la regiunile
alfa helicoidale, exist diferene ntre cele dou metode Garnier-Robson i Chou-
Fasman. Astfel, n cazul primei metode, se observ c exist 18 regiuni alfa
helicoidale, n timp ce, potrivit celei de-a doua metode, exist doar 5, existnd doar 3
puncte de suprapunere ale suprafeelor. De asemenea, pentru regiunile beta pliate, se
observ c exist o similaritate crescut ntre cele dou metode comparativ cu
regiunile alfa. Pentru determinarea efectuat prin prima metod, se constat existena
a 30 de regiuni beta pliate, n timp ce, pentru cea de-a doua metod (Chou-Fasman),
sunt considerate ca existnd 12 astfel de regiuni. Trebuie remarcat faptul c
similaritatea n acest caz este dat de suprafeele ample considerate ca fiind beta
pliate de cea de-a doua metod. Referitor la zonele de inflexiune, de asemenea,
Greutate
molecular
(Daltoni)
Numr de
aminoaciz
i
Aminoacizi
Punct
izoelectri
c
Sarcina
electric
la
pH=7
Concentrai
a la o
extincie =1
i =280nm
Puterni
c bazici
Puterni
c acizi
Hidrofob
i
Polar
i
42592,56 378 19 16 177 92 8,423 5,279 0,45
102
comparativ pentru cele dou metode, se constat c pentru ambele metode (Garnier
Robson i Chou-Fasman) sunt date 22 astfel de regiuni, cu diferena c n cazul celei
de-a doua, sunt prezentate ca regiuni cu suprafee mai mari.
Pe baza graficului hidrofobicitii realizat dup un model Kyte-Doolitle (Kyte i
Doolittle, 1982), se constat c exist 15 zone hidrofobe i 13 zone hidrofile.
Din graficul indexului antigenic calculat pe baza modelului Jameson Wolf
(Jameson i Wolf, 1988), se constat existena a 23 de regiuni cu potenial antigenic.
4.5.2. CARACTERIZAREA HAPLOTIPULUI CY04I
4.5.2.1. FRECVENELE TIPURILOR DE ASOCIERI NUCLEOTIDICE
n acest haplotip intr o singur secven care difer de haplotipul general prin
existena unei transversii (substituia adeninei de ctre timin) n poziia 432.
Referitor la procentele dinucleotidelor constatm, c valoarea cea mai mare o are
perechea AC (10,3%), iar valoarea cea mai mic perechea GG, n proporie de 2,3%.
n cazul trinucleotidelor, cea mai mare frecven o nregistreaz tripletul CAT (3,9%),
iar valoarea cea mai mic, tripletele GGG i GCG, ambele avnd o frecven de 0,2%.
Tetramerii cu frecvena cea mai mare, sunt ACTA (1,6%), iar cei cu frecvena
redus: TCTC, CTCA, ATAC, ACCC, toi n procent de 1,0%. n cazul pentamerilor
(Tabelul 38), cea mai mare frecven o are pentamerul TCCTA (0,9%), iar cea mai
mic frecven, o au TTCCT, TACCA, CTCCT, CTCAT i CTAGT (0,4%). n ceea ce
privete hexamerii, acetia au frecvene cuprinse ntre 0,3% i 0,4%.
Tetramerii, pentamerii i hexamerii cu frecven joas, sunt cei care se gsesc
ntr-un singur exemplar n ntreaga gen, avnd o frecven de 0,1%.
Cu ajutorul modulului EditSeq al DNA Star, a fost calculat temperatura de topire
a secvenei de ADN, dup un model Davis-Botstein-Roth; n acest caz, prezint o
valoare de 82,26C.
4.5.2.2. TRANSLAIA I CARACTERIZAREA CATENEI POLIPEPTIDICE
Translaia s-a realizat pe baza codului genetic mitocondrial pentru vertebrate,
utiliznd modulul EditSeq din cadrul programului DNA Star (Figura 42).
Figura 42 Catena polipeptidic a citocromului b caracteristic haplotipului Cy04I al
speciei Cyprinus carpio
Dup realizarea translaiei, se constat c ntreg lanul polipeptidic, este alctuit
din 378 aminoacizi (Tabelul 29), din care, frecvena cea mai mare, o are leucina
(15,08%), iar cea mai sczut o are cisteina (1,06%). Se constat de asemenea,
MASLRKTHPL IKIANDALVD LPTPSNISAW WNFGSLLGLC LITQILTGLF
LAMHYTSDIS TAFSSVTHIC RDVNYGWLIR NVHANGASFF FICIYMHIAR
GLYYGSYLYK ETWNIGVILL LLVMMTAFVG YVLPWGQMSF WGATVITNLL
SAVPYMGDML VQWIWGGFSV DNATLTRFFA FHFLLPFVIT AATIIHLLFL
HETGSNNPIG LNSDADKVSF HPYFSYKDLL GFVIMLLALT LLALFSPNLL
GDPENFTPAN PLVTPPHIKP EWYFLFAYAI LRSIPNKLGG VLALLFSILV
LMVVPLLHTS KQRGLTFRPI TQFLFWTLVA DMIILTWIGG MPVEHLIMWH
ASSYSPHSHY A.RC.MAMTA MLQNKALKWA
103
existena a doi codoni stop (notai cu .) ctre sfritul lanului polipeptidic ceea ce
corespunde cu structura lanului polipeptidic al haplotipului anterior, de unde putem
concluziona c in cazul de fa, n poziia 432, s-a produs o mutaie nonsens, deci, o
mutaie care nu determin o modificare a aminoacidului.
Tabel 29 Compoziia lanului polipeptidic pentru haplotipul Cy04I
Aminoacizi
Numr
Procent din
greutatea total (%)
Frecvena
(%)
Simbol Nume
A Ala 30 5,01 7,94
C Cys 4 0,97 1,06
D Asp 11 2,97 2,91
E Glu 5 1,52 1,32
F Phe 26 8,98 6,88
G Gly 23 3,08 6,08
H His 15 4,83 3,97
I Ile 29 7,70 7,67
K Lys 10 3,01 2,65
L Leu 57 15,14 15,08
M Met 16 4,93 4,23
N Asn 17 4,55 4,50
P Pro 20 4,56 5,29
Q Gln 6 1,80 1,59
R Arg 9 3,30 2,38
S Ser 25 5,11 6,61
T Thr 25 5,93 6,61
V Val 22 5,12 5,82
W Trp 13 5,68 3,44
Y Tyr 15 5,75 3,97
B Asx 0 0,00 0,00
Z Glx 0 0,00 0,00
. Ter 2 0,00 0,53
4.5.3. CARACTERIZAREA HAPLOTIPULUI CY0104M
4.5.3.1. FRECVENELE TIPURILOR DE ASOCIERI NUCLEOTIDICE
n acest haplotip, se ncadreaz 2 secvene (Cy01M i Cy04M), care difer de
haplotipul general prin existena unor tranziii (substituia adeninei de ctre guanin) n
poziia 507.
Referitor la procentele dinucleotidelor constatm, c valoarea cea mai mare o are
perechea AC (10,3%), iar valoarea cea mai mic perechea GG, n proporie de 2,4%.
n cazul trinucleotidelor, cea mai mare frecven o nregistreaz tripletul CAT (3,9%),
iar valoarea cea mai mic, tripletele GGG i GCG, ambele avnd o frecven de 0,2%.
104
Tetramerul cu frecvena cea mai mare, este ACTA (1,6%), iar cel cu frecvena
redus: TTCC n procent de 0,9%. n cazul pentamerilor, cea mai mare frecven o
are pentamerul TCCTA (0,9%), iar cea mai mic frecven, o au TTCCT, TACCA,
CTCCT, CTCAT i CTAGT (0,4%). n ceea ce privete hexamerii, acetia au frecvene
cuprinse ntre 0,3% i 0,4%.
Tetramerii, pentamerii i hexamerii cu frecven joas, sunt cei care se gsesc
ntr-un singur exemplar n ntreaga gen, avnd o frecven de 0,1%.
Cu ajutorul modulului EditSeq al DNA Star, a fost calculat temperatura de topire
a ADN, dup un model Davis-Botstein-Roth; n acest caz, prezint o valoare de
82,30C.
4.5.3.2. TRANSLAIA I CARACTERIZAREA CATENEI POLIPEPTIDICE
Translaia s-a realizat pe baza codului genetic mitocondrial pentru vertebrate,
utiliznd modulul EditSeq din cadrul programului DNA Star (Figura 43).
Figura 43 Catena polipeptidic a citocromului b caracteristic haplotipului Cy0104M al
speciei Cyprinus carpio
Dup realizarea translaiei, se constat c ntreg lanul polipeptidic, este alctuit
din 378 aminoacizi (Tabelul 30), din care, frecvena cea mai mare, o are leucina
(15,08%), iar cea mai sczut o are cisteina (1,06%); aceste date arat c exist o
similaritate cu structura lanului polipeptidic al haplotipului, de unde putem concluziona
c i in cazul de fa, n poziia 507, s-a produs o mutaie nonsens, deci, o mutaie
care nu determin o modificare a aminoacidului.
MASLRKTHPL IKIANDALVD LPTPSNISAW WNFGSLLGLC LITQILTGLF
LAMHYTSDIS TAFSSVTHIC RDVNYGWLIR NVHANGASFF FICIYMHIAR
GLYYGSYLYK ETWNIGVILL LLVMMTAFVG YVLPWGQMSF WGATVITNLL
SAVPYMGDML VQWIWGGFSV DNATLTRFFA FHFLLPFVIT AATIIHLLFL
HETGSNNPIG LNSDADKVSF HPYFSYKDLL GFVIMLLALT LLALFSPNLL
GDPENFTPAN PLVTPPHIKP EWYFLFAYAI LRSIPNKLGG VLALLFSILV
LMVVPLLHTS KQRGLTFRPI TQFLFWTLVA DMIILTWIGG MPVEHLIMWH
ASSYSPHSHY A.RC.MAMTA MLQNKALKWA
105
Tabel 30 Compoziia lanului polipeptidic pentru haplotipul Cy0104M
Aminoacizi
Numr
Procent din greutatea
total (%)
Frecvena
(%) Simbol Nume
A Ala 30 5,01 7,94
C Cys 4 0,97 1,06
D Asp 11 2,97 2,91
E Glu 5 1,52 1,32
F Phe 26 8,98 6,88
G Gly 23 3,08 6,08
H His 15 4,83 3,97
I Ile 29 7,70 7,67
K Lys 10 3,01 2,65
L Leu 57 15,14 15,08
M Met 16 4,93 4,23
N Asn 17 4,55 4,50
P Pro 20 4,56 5,29
Q Gln 6 1,80 1,59
R Arg 9 3,30 2,38
S Ser 25 5,11 6,61
T Thr 25 5,93 6,61
V Val 22 5,12 5,82
W Trp 13 5,68 3,44
Y Tyr 15 5,75 3,97
B Asx 0 0,00 0,00
Z Glx 0 0,00 0,00
. Ter 2 0,00 0,53
4.5.4. CARACTERIZAREA HAPLOTIPULUI CY03M
4.5.4.1. FRECVENELE TIPURILOR DE ASOCIERI NUCLEOTIDICE
n acest haplotip se ncadreaz o singur secven (Cy03M) care difer de
haplotipul general prin existena unei transversii (substituia timinei de ctre guanin)
n poziia 396.
Cu ajutorul modulului EditSeq al DNA Star, a fost calculat temperatura de topire
a ADN, dup un model Davis-Botstein-Roth; n acest caz, prezint o valoare de
82,30C.
Referitor la procentele dinucleotidelor constatm, c valoarea cea mai mare o are
perechea AC (10,3%), iar valoarea cea mai mic perechea GG, n proporie de 2,3%.
n cazul trinucleotidelor, cea mai mare frecven o nregistreaz tripletul CAT (3,9%),
iar valoarea cea mai mic, tripletele GGG i GCG, ambele avnd o frecven de 0,2%.
Tetramerul cu frecvena cea mai mare, este ACTA (1,6%), iar cei cu frecvena
redus sunt: TCTC, CTCA, ATAC, ACCC, toi avnd o frecven de 1.0%. n cazul
pentamerilor, cea mai mare frecven o are pentamerul TCCTA (0,9%), iar cea mai
mic frecven, o au TTCCT, TACCA, CTCCT, CTCAT i CTAGT (0,4%). n ceea ce
privete hexamerii, acetia au frecvene cuprinse ntre 0,3% i 0,4%.
Tetramerii, pentamerii i hexamerii cu frecven joas, sunt cei care se gsesc
ntr-un singur exemplar n ntreaga gen, avnd o frecven de 0,1%.
106
4.5.4.2. TRANSLAIA I CARACTERIZAREA CATENEI POLIPEPTIDICE
Translaia s-a realizat pe baza codului genetic mitocondrial pentru vertebrate,
utiliznd modulul EditSeq din cadrul programului DNA Star (Figura 44).
Figura 44 Catena polipeptidic a citocromului b caracteristic haplotipului Cy03M al
speciei Cyprinus carpio
Dup realizarea translaiei, se constat c ntreg lanul polipeptidic, este alctuit
din 378 aminoacizi (Tabelul 31), dintre care, frecvena cea mai mare, o are leucina
(15,08%), iar cea mai sczut o are cisteina (1,06%); aceste date arat c exist o
similaritate cu structura lanului polipeptidic al haplotipului, de unde putem concluziona
c i in cazul de fa, n poziia 396, s-a produs o mutaie nonsens, deci, o mutaie
care nu determin o modificare a aminoacidului.
Tabel 31 Compoziia lanului polipeptidic pentru haplotipul Cy03M
Aminoacizi
Numr
Procent din
greutatea total (%)
Frecvena
(%)
Simbol Nume
A Ala 30 5,01 7,94
C Cys 4 0,97 1,06
D Asp 11 2,97 2,91
E Glu 5 1,52 1,32
F Phe 26 8,98 6,88
G Gly 23 3,08 6,08
H His 15 4,83 3,97
I Ile 29 7,70 7,67
K Lys 10 3,01 2,65
L Leu 57 15,14 15,08
M Met 16 4,93 4,23
N Asn 17 4,55 4,50
P Pro 20 4,56 5,29
Q Gln 6 1,80 1,59
R Arg 9 3,30 2,38
S Ser 25 5,11 6,61
T Thr 25 5,93 6,61
V Val 22 5,12 5,82
W Trp 13 5,68 3,44
Y Tyr 15 5,75 3,97
B Asx 0 0,00 0,00
. Ter 2 0,00 0,53
MASLRKTHPL IKIANDALVD LPTPSNISAW WNFGSLLGLC LITQILTGLF
LAMHYTSDIS TAFSSVTHIC RDVNYGWLIR NVHANGASFF FICIYMHIAR
GLYYGSYLYK ETWNIGVILL LLVMMTAFVG YVLPWGQMSF WGATVITNLL
SAVPYMGDML VQWIWGGFSV DNATLTRFFA FHFLLPFVIT AATIIHLLFL
HETGSNNPIG LNSDADKVSF HPYFSYKDLL GFVIMLLALT LLALFSPNLL
GDPENFTPAN PLVTPPHIKP EWYFLFAYAI LRSIPNKLGG VLALLFSILV
LMVVPLLHTS KQRGLTFRPI TQFLFWTLVA DMIILTWIGG MPVEHLIMWH
ASSYSPHSHY A.RC.MAMTA MLQNKALKWA
107
4.5.5. CARACTERIZAREA HAPLOTIPULUI CY06M
4.5.5.1. FRECVENELE TIPURILOR DE ASOCIERI NUCLEOTIDICE
n acest haplotip se ncadreaz o singur secven (Cy06M) caracteristic
crapului oglind care difer de haplotipul general prin mai multe substituii de tipul:
- tranziie n poziia 177 (substituia citozinei de ctre timin);
- tranziie n poziia 198 (substituia timinei de ctre citozin);
- tranziie n poziia 352 (substituia adeninei de ctre guanin);
- tranziie n poziia 568 (substituia adeninei de ctre guanin);
- tranziie n poziia 591 (substituia guaninei de ctre adenin);
- tranziie n poziia 624 (substituia adeninei de ctre guanin);
- tranziie n poziia 693 (substituia adeninei de ctre guanin);
- tranziie n poziia 732 (substituia guaninei cu adenin);
- tranziie n poziia 864 (substituia timinei cu citozin);
- transversie n poziia 870 (substituia timinei cu adenin);
- tranziie n poziia 897 (substituia adeninei cu guanin);
- tranziie n poziia 990 (substituia adeninei de ctre guanin).
Referitor la procentele dinucleotidelor constatm, c valoarea cea mai mare o are
perechea AC (10,3%), iar valoarea cea mai mic perechea GG, n proporie de 2,5%.
Referitor la trinucleotide, cea mai mare frecven o nregistreaz tripletul CAT (3,9%),
iar valoarea cea mai mic, tripletul GTG, ambele avnd o frecven de 0,2%.
Tetramerul cu frecvena cea mai mare, este ACTA (1,7%), iar cei cu frecvena
redus sunt: CTAT, CACC, ATAC, ACCC, toi avnd o frecven de 1.0%. n cazul
pentamerilor, cea mai mare frecven o are pentamerul TCCTA (0,9%), iar cea mai
mic frecven, o au TTCCT, TACCA i CTCCT (0,4%). n ceea ce privete hexamerii,
acetia au frecvene cuprinse ntre 0,3% i 0,4%.
Tetramerii, pentamerii i hexamerii cu frecven joas, sunt cei care se gsesc
ntr-un singur exemplar n ntreaga gen, avnd o frecven de 0,1%.
Cu ajutorul modulului EditSeq al DNA Star, a fost calculat temperatura de topire
a ADN, dup un model Davis-Botstein-Roth; n acest caz, prezint o valoare de
82,26C.
4.5.5.2. TRANSLAIA I CARACTERIZAREA CATENEI POLIPEPTIDICE
Translaia s-a realizat pe baza unui cod genetic mitocondrial pentru vertebrate,
utiliznd modulul EditSeq din cadrul programului DNA Star.
Catena polipeptidic obinut este prezentat n Figura 45.
Figura 45 Catena polipeptidic a citocromului b caracteristic haplotipului Cy06M al
speciei Cyprinus carpio var. crap oglind
MASLRKTHPL IKIANDALVD LPTPSNISAW WNFGSLLGLC LITQILTGLF
LAMHYTSDIS TAFSSVTHIC RDVNYGWLIR NVHANGASFF FICIYMHIAR
GLYYGSYLYK ETWNIGVVLL LLVMMTAFVG YVLPWGQMSF WGATVITNLL
SAVPYMGDML VQWIWGGFSV DNATLTRFFA FHFLLPFVIA AATIIHLLFL
HETGSNNPIG LNSDADKVSF HPYFSYKDLL GFVIMLLALT LLALFSPNLL
GDPENFTPAN PLVTPPHIKP EWYFLFAYAI LRSIPNKLGG VLALLFSILV
LMVVPLLHTS KQRGLTFRPI TQFLFWTLVA DMIILTWIGG MPVEHLIMWH
ASSYSPHSHY A.RC.MAMTA MLQNKALKWA
108
Tabel 32 Compoziia lanului polipeptidic
Aminoacizi
Numr
Procent din
greutatea total
(%)
Frecvena
(%)
Simbol Nume
A Ala 31 5,18 8,20
C Cys 4 0,97 1,06
D Asp 11 2,98 2,91
E Glu 5 1,52 1,32
F Phe 26 8,99 6,88
G Gly 23 3,08 6,08
H His 15 4,83 3,97
I Ile 28 7,45 7,41
K Lys 10 3,01 2,65
L Leu 57 15,16 15,08
M Met 16 4,93 4,23
N Asn 17 4,56 4,50
P Pro 20 4,57 5,29
Q Gln 6 1,81 1,59
R Arg 9 3,30 2,38
S Ser 25 5,12 6,61
T Thr 24 5,70 6,35
V Val 23 5,36 6,08
W Trp 13 5,69 3,44
Y Tyr 15 5,57 3,97
B Asx 0 0,00 0,00
. Ter 2 0,00 0,53
Dup realizarea translaiei, se constat c ntreg lanul polipeptidic este alctuit
din 378 aminoacizi (Tabelul 32), din care se observ c frecvena cea mai mare, o are
leucina (15,16%), iar cea mai sczut o are cisteina (1,06%). Se constat de
asemenea, existena a doi codoni stop (notai cu .) ctre sfritul lanului polipeptidic.
Se poate observa c din totalul de 378 aminoacizi, 16 sunt acizi, 19 sunt bazici,
91 polari i 178 hidrofobi (Tabelul 33). De asemenea, se constat c lanul polipeptidic
are o sarcin electric de 5,28 (la pH=7) i un punct izoelectric de 8,42 (Figura 46).
Tabel 33 Caracterizarea lanului polipeptidic
Greutate
molecula
r
(Daltoni)
Numr
de
aminoaci
zi
Aminoacizi
Punct
izoelectr
ic
Sarcin
a
electric
la
pH=7
Concentra
ia la o
extincie
=1 i
=280nm
Puterni
c
bazici
Puterni
c acizi
Hidrofo
bi
Pola
ri
42548,51 378 19 16 178 91 8,423 5,279 0,45
109
Figura 46 Curba de titrare pentru lanul polipeptidic al citocromului b, haplotip Cy06M al
speciei Cyprinus carpio var. crap oglind
Ulterior, a fost realizat o analiz a structurii proteinei; astfel, au fost determinate
zonele alfa helicoidale, beta pliate i de inflexiune, prin dou metode Garnier-Robson
(Garnier et al., 1978) i Chou-Fasman (Chou i Fasman, 1978); reprezentarea grafic
a zonelor hidrofobe (Kyte i Doolittle, 1982), zonele de flexie (Karplus i Schultz,
1985), indexul antigenic (Jameson i Wolf, 1988) i graficul probabil al suprafeei
(Emini et al., 1985).
Din analiza structurii lanului polipeptidic, se poate observa c referitor la regiunile
alfa helicoidale i n acest caz exist diferene ntre cele dou metode Garnier-Robson
i Chou-Fasman. Astfel, n cazul primei metode, se observ c exist 17 regiuni alfa
helicoidale, n timp ce, potrivit celei de-a doua metode, exist doar 6, existnd 5
puncte de suprapunere ale suprafeelor comparativ ntre cele dou metode. De
asemenea, pentru regiunile beta pliate, se observ c, pentru determinarea efectuat
cu ajutorul primei metode, se constat existena a 30 de regiuni beta pliate, n timp ce,
pentru cea de-a doua metod (Chou-Fasman), sunt considerate ca existnd doar 11
astfel de regiuni. Trebuie remarcat faptul c similaritatea n acest caz este dat de
suprafeele ample considerate ca fiind beta pliate de cea de-a doua metod. Referitor
la zonele de inflexiune, de asemenea, comparativ pentru cele dou metode, (Garnier-
Robson i Chou-Fasman) sunt date 22 astfel de regiuni, cu diferena c n cazul celei
de-a doua, sunt prezentate ca regiuni cu suprafee mai mari.
Pe baza graficului hidrofobicitii realizat dup un model Kyte-Doolitle (Kyte i
Doolittle, 1982), se constat c exist 15 zone hidrofobe i 12 zone hidrofile.
Din graficul indexului antigenic calculat pe baza modelului Jameson-Wolf
(Jameson i Wolf, 1988), se constat existena a 26 de regiuni cu potenial antigenic.
110
4.5.6. RELAII FILOGENETICE N CADRUL GENULUI CYPRINUS, STABILITE PE
BAZA SECVENELOR CITOCROMULUI B
Metodele folosite n filogenie i modalitile de realizare a arborilor filogenetici,
utilizate n acest caz, sunt cele care includ tranziiile i transversiile, deoarece
haplotipurile analizate pentru cele dou populaii, prezint ambele tipuri de mutaii.
Astfel, prin metoda UPGMA bazat pe modelul Tamura Nei, care include
ambele tipuri de mutaii posibile (tranziii i transversii), au fost obinui arbori
filogenetici (Figurile 47, 48 i 49), din care se observ c Cy06 deriv direct dintr-un
nod comun ancestral, n care i are originea i braul comun al celorlali indivizi.
Cy09M
Cy10M
Cy08M
Cy07M
Cy05M
Cy02M
Cy10I
Cy09I
Cy08I
Cy07I
Cy06I
Cy05I
Cy03I
Cy02I
Cy01I
Cy03M
Cy04I
Cy01M
Cy04M
Cy06M
0.001
Figura 47 Arbore filogenetic rectangular al genului Cyprinus, realizat prin metoda
UPGMA pe baza secvenelor citocromului B
111
C
y
0
9
M
C
y
1
0
M
C
y
0
8
M
C
y
0
7
M
C
y
0
5
M
Cy02M
C
y
1
0
I
C
y
0
9
I
C
y
0
8
I
C
y
0
7
I
C
y
0
6
I
C
y
0
5
I
C
y
0
3
I
C
y
0
2
I
C
y
0
1
I
Cy03M
C
y
0
4
I
C
y
0
1
M
C
y
0
4
M
C
y
0
6
M
Figura 48 Arbore filogenetic circular al genului Cyprinus, realizat prin metoda UPGMA pe
baza secvenelor citocromului B
112
Cy01M
Cy04M
Cy05M
Cy04I
Cy08I
Cy03M
Cy03I
Cy02I
Cy06I
Cy09I
Cy10I
Cy05I
Cy01I
Cy07I
Cy02M
Cy07M
Cy08M
Cy09M
Cy10M
Cy06M
0.001
Figura 49 Arbore filogenetic rectangular al genului Cyprinus, realizat prin metoda
evoluiei minime (ME) dup un model neighbor joining, pe baza secvenelor citocromului
B
Se observ c exist o similaritate ntre cele dou tipuri de arbori realizai prin
metode diferite.
Nu a fost folosit metoda maximum parsimony n acest caz, deoarece diversitatea
taxonilor este sczut, ceea ce poate duce la o cretere a probabilitii de apariie a
erorilor.
113
4.6. COMPARAREA SECVENELOR NUCLEOTIDICE ALE REGIUNII DE
CONTROL MITOCONDRIAL, PROVENITE DE LA INDIVIZI APARINND
GENULUI CYPRINUS
Pentru regiunea de control mitocondrial, n cazul speciilor genului Cyprinus, a fost
secveniat prima parte hipervariabil a d-loop (fapt precizat i n capitolele
anterioare). Ulterior, au fost aliniate cele 20 de secvene (19 indivizi aparinnd celor
dou populaii, 1 individ de crap oglind Cyo06M i o secven provenit de la un
individ de crap, preluat din banca de gene pentru comparaie GenBank Ref. nr, AF
508931), utiliznd metoda Clustal V (Higgins i Sharp, 1989).
Din alinierea celor 21 de secvene, se constat existena a 11 diferene,
majoritatea fiind ntlnite n cadrul secvenei Cy06M, provenit de la un individ de crap
oglind. Astfel, pentru acest individ, comparativ cu celelalte secvene, au fost
constatate 8 diferene, dintre care 5 tranziii, o transversie i o deleie.
Alte diferene, au fost constatate pentru indivizii Cy01M (o tranziie n poziia 388),
Cy05M (o tranziie n poziia 285) i pentru secvena provenit din banca de gene, o
tranziie n poziia 388.
Pentru restul indivizilor, nu au fost nregistrate mutaii la acest nivel al ADNmt. n
plus, putem constata c pentru populaia Iai, nu au fost constatate diferene, deci,
rata de apariie a mutaiilor n aceast populaie este mai sczut.
Din cele prezentate anterior, putem estima c au fost descoperite 4 noi haplotipuri
pentru prima parte a regiunii de control mitocondrial: Cy01M, Cy05M i Cy06M pentru
populaia Movileni (Cy06M pentru populaia de crap oglind Movileni) i haplotipul
general, caracteristic celor dou populaii, dat de secvenele similare.
Pe baza comparaiei ntre secvene, s-a realizat tabelul similaritii i divergenei
(Tabel 34), din care se constat c procentele de similaritate sunt cuprinse ntre 100%
(pentru secvenele Cy01M i secvena preluat din banca de gene) i 68,7% pentru
secvena Cy06M i celelalte secvene care constituie haplotipul general caracteristic
celor dou populaii.
Tabel 34 Procentele de similaritate i divergen pentru secvenele haplotipurilor stabilite
Procent de similaritate
P
r
o
c
e
n
t
d
e
d
i
v
e
r
g
e
n
Cy01I Cy01M Cy05M Cy06M Cy GB
Cy01I 99,7 99,7 68,7 99,7 Cy01I
Cy01M 0,3 99,5 69,0 100 Cy01M
Cy05M 0,3 0,5 69,0 99,5 Cy05M
Cy06M 40,6 40,2 40,2 69,0 Cy06M
Cy GB 0,3 0,0 0,5 40,2 Cy GB
Cy01I Cy01M Cy05M Cy06M Cy GB
n plus, pentru a stabili o mai clar difereniere ntre toate noile haplotipuri, au fost
analizate numrul i procentele n care se gsesc bazele azotate n fiecare dintre
acestea (Tabel 35).
114
Tabel 35 Procentul bazelor azotate, n cadrul haplotipurilor stabilite
Baze
azotate
Specii analizate
Cy01I Cy01M Cy05M Cy06M Cy GB
A
Nr. 145 145 146 143 145
% 36,90 36,90 37,15 36,39 36,90
G
Nr. 54 54 53 55 54
% 13,74 13,74 13,49 13,99 13,74
T
Nr. 129 130 129 131 130
% 32,82 33,08 32,82 33,33 33,08
C
Nr. 65 64 65 64 64
% 16,54 16,28 16,54 16,28 16,28
A+T
Nr. 274 275 275 274 275
% 69,72 69,97 69,97 69,72 69,97
C+G
Nr. 119 118 118 119 118
% 30,28 30,03 30,03 30,28 30,03
0
5
10
15
20
25
30
35
40 %
Cy01I Cy01M Cy05M Cy06M Cy GB
Haplotip
A G T C
Figura 50 Graficul frecvenei bazelor azotate n cadrul haplotipurilor caracterizate
115
0
5
10
15
20
25
30
35
40
%
A G T C
Baze azotate
Cy01I Cy01M Cy05M Cy06M Cy GB
Figura 51 Graficul frecvenei bazelor azotate, comparativ ntre haplotipurile analizate
Din Tabelul 35 i Figurile 50 i 51, se poate observa c diferene majore se
constat pentru secvena Cy06M, care prezint valori diferite pentru trei dintre bazele
azotate (A, G, T), comparativ cu celelalte haplotipuri.
Referitor la cantitatea de adenin (A), aceasta este egal pentru Cy01I, Cy01M i
Cy GB (36,90%), pentru haplotipul Cy05M se gsete n proporie de 37,15%, iar
pentru Cy06M, n proporie de 36,39%. Cantitatea de guanin este cuprins ntre
13,49% (Cy05M) i 13,99 pentru Cy06M. De asemeni, se constat diferene i pentru
celelalte baze azotate: cantitatea de timin variaz ntre 32,82% pentru Cy01I, Cy05M
i 33,33% pentru Cy06M, iar citozina, ntre 18,28% pentru Cy01I (ca reprezentant al
haplotipului general caracteristic celor dou populaii), Cy06M i Cy GB 18,54%
pentru haplotipurile Cy01I i Cy05M.
Procentul de baze complementare este de 69,72% n cazul A+T pentru Cy01I i
Cy06M; 69,97% pentru celelalte trei haplotipuri. Procentul de G+C este de 30,28%
(Cy01I, Cy06M) i de 30,03% pentru Cy01M, Cy05M i Cy GB.
4.6.1. CARACTERIZAREA HAPLOTIPULUI GENERAL AL CELOR DOU
POPULAII
4.6.1.1. FRECVENELE TIPURILOR DE ASOCIERI NUCLEOTIDICE
n acest haplotip, au fost ncadrate toate secvenele ntre care procentele de
similaritate sunt de 100% (Cy01I, Cy02I, Cy03I, Cy04I, Cy05I, Cy06I, Cy07I, Cy08I,
Cy09I, Cy10I, Cy02M, Cy03M, Cy04M, Cy07M, Cy08M, Cy09M, Cy10M), aparinnd
celor dou populaii luate n studiu (Movileni i Iai).
Referitor la procentele dinucleotidelor constatm, c valoarea cea mai mare o are
perechea AT (14,5%), iar valoarea cea mai mic perechea GC, n proporie de 1,8%,
fiind absente dinucleotidele de tipul CG.
116
n ceea ce privete trinucleotidele, cea mai mare frecven o nregistreaz tripletul
TAT (6,6%), iar valoarea cea mai mic, tripletele GTC i TGC, ambele avnd o
frecven de 0,3%.
Tetramerul cu frecvena cea mai mare, este TATT (3,6%), iar cel cu frecvena cea
mai mic TTTT, n procent de 1,0%. n cazul pentamerilor, cea mai mare frecven o
are pentamerul TATTA (2,8%), iar cea mai mic frecven, o au TTAAT, TATTT,
TATAT, TAGTA, TAATC i TAATA (0,8%). n ceea ce privete hexamerii, acetia au
frecvene cuprinse ntre 1,5% (ATATTA) i 0,5%.
Tetramerii, pentamerii i hexamerii cu frecven joas, sunt cei care se gsesc
ntr-un singur exemplar n ntreaga gen, avnd o frecven de 0,3%.
Cu ajutorul modulului EditSeq al DNA Star, a fost calculat temperatura de topire
a ADN, dup un model Davis-Botstein-Roth; n acest caz, prezint o valoare de
76,04C.
4.6.2. CARACTERIZAREA HAPLOTIPULUI CY01M
4.6.2.1. FRECVENELE TIPURILOR DE ASOCIERI NUCLEOTIDICE
n acest haplotip, se ncadreaz o singur secven Cy01M din populaia Larga-
Jijia Mrgineni, caracteristic unui individ de tip slbatic aparinnd speciei Cyprinus
carpio. Dup cum s-a observat n tabelul de similaritate, aceast secven este
identic cu secvena preluat din banca de gene, ceea ce ne permite s concluzionm
c cele dou populaii studiate prezint haplotipuri distincte de cele secveniate pn
acum, aflndu-se n proces de speciaie. n plus, se poate constata c mutaia aprut
n populaiile studiate, datorit frecvenei cu care apare, este deja fixat n genofondul
acestora.
Din analiza procentelor dinucleotidelor, constatm c valoarea cea mai mare o are
perechea AT (14,8%), iar valoarea cea mai mic perechea GC, n proporie de 1,8%;
i n acest caz sunt absente dinucleotidele CG. Referitor la trinucleotide, cea mai mare
frecven o nregistreaz tripletul TAT (6,9%), iar valoarea cea mai mic, tripletele
GTC i TGC, ambele avnd o frecven de 0,3%.
Tetramerul cu frecvena cea mai mare, este TATT (3,8%), iar cel cu frecvena
redus TTTT (1,0%). n cazul pentamerilor, cea mai mare frecven o are pentamerul
TATTA (2,8%), iar cea mai mic frecven, o au TTAAT, TATAT, TAGTA, TAATC I
TAATA, toi cu o frecven de 0,8%. n ceea ce privete hexamerii, acetia au
frecvene cuprinse ntre 0,5% i 1,5%.
Tetramerii, pentamerii i hexamerii cu frecven joas, sunt cei care se gsesc
ntr-un singur exemplar n ntreaga gen, avnd o frecven de 0,3%.
Cu ajutorul modulului EditSeq al DNA Star, a fost calculat temperatura de topire
a ADN, dup un model Davis-Botstein-Roth; n acest caz, prezint o valoare de
75,94C.
4.6.2.2. MODELAREA STRUCTURII SECUNDARE A ARNm
Modelarea structurii ARN, s-a realizat pe baza unei energii minime de -49,0.
Deoarece acest haplotip difer de cel general doar printr-o singur baz azotat
nlocuirea citozinei cu timin n poziia 388 n urma unei tranziii, nu apar modificri
majore n aspectul general al macromoleculei de ARNm. Singura diferen existent
117
n acest caz, ntre ARNm din haplotipul general pentru cele dou populaii i cel al
prezentei secvene de ADN const n existena uracilului n locul citozinei.
De asemenea, se constat ca i n cazul precedent, c structura secundar a
ARNm prezint 31 de poriuni monocatenare i 14 regiuni bicatenare.
4.6.3. CARACTERIZAREA HAPLOTIPULUI CY05M
4.6.3.1. FRECVENELE TIPURILOR DE ASOCIERI NUCLEOTIDICE
n acest haplotip, se ncadreaz o singur secven Cy05M din populaia Larga-
Jijia Mrgineni, caracteristic unui individ de tip slbatic aparinnd speciei Cyprinus
carpio. Diferena dintre acest haplotip i cel general al celor dou populaii, const n
substituia guaninei de ctre adenin, printr-un proces de tranziie, n poziia 285.
Referitor la procentele dinucleotidelor constatm c valoarea cea mai mare o are
perechea AT (14,5%), iar valoarea cea mai mic perechea GC, n proporie de 1,8%;
i n acest caz fiind absente dinucleotidele de tip CG.
Cea mai mare frecven o nregistreaz tripletul TAT (6,6%), iar valoarea cea mai
mic, tripletele GTC i TGC, ambele avnd o frecven de 0,3%.
Tetramerul cu frecvena cea mai mare, este TATT (3,6%), iar cel cu frecvena
redus TTTT (1,0%). n cazul pentamerilor, cea mai mare frecven o are pentamerul
TATTA (2,8%), iar cea mai mic frecven, o au TTAAT, TATTT, TATAT, TAGTA,
TAATC I TAATA, toi cu o frecven de 0,8%. n ceea ce privete hexamerii, acetia
au frecvene cuprinse ntre 0,5% i 1,5%.
Tetramerii, pentamerii i hexamerii cu frecven joas, sunt cei care se gsesc
ntr-un singur exemplar n ntreaga gen, avnd o frecven de 0,3%.
Cu ajutorul modulului EditSeq al DNA Star, a fost calculat temperatura de topire
a ADN, dup un model Davis-Botstein-Roth; n acest caz, prezint o valoare de
75,94C.
4.6.4. CARACTERIZAREA HAPLOTIPULUI CY06MD
4.6.4.1. FRECVENELE TIPURILOR DE ASOCIERI NUCLEOTIDICE
Haplotipul cuprinde o singur secven Cy06M care difer de haplotipul general
prin apariia urmtoarelor modificri ale catenei nucleotidice:
- transversie n poziia 87 (substituia adeninei cu citozin);
- o deleie n poziia 217;
- tranziie n poziia 257 (substituia citozinei cu timina);
- tranziie n poziia 262 (nlocuirea citozinei cu timin);
- tranziie n poziia 263 (nlocuirea timinei cu citozin); practic, n aceste dou ultime
poziii, putem presupune c de fapt s-a produs o inversie care a cuprins cele dou
nucleotide;
- tranziie n poziia 310 (substituia citozinei cu timin);
- tranziie n poziia 340 (substituia guaninei cu adenin);
- tranziie n poziia 353 (substituia adeninei cu guanin).
118
Din analiza procentelor dinucleotidelor constatm c valoarea cea mai mare o are
perechea AT (14,3%), iar valoarea cea mai mic perechea GC, n proporie de 1,8%;
i n acest caz fiind absente dinucleotidele de tip CG.
Referitor la trinucleotide, cea mai mare frecven o nregistreaz tripletul TAT
(6,6%), iar valoarea cea mai mic, tripletele GTC i GAT, ambele avnd o frecven
de 0,3%.
Tetramerul cu frecvena cea mai mare, este TATT (3,6%), iar cei cu frecven
redus TTTT, TGAA, TCAA (1,0%). n cazul pentamerilor, cea mai mare frecven o
are pentamerul TATTA (2,8%), iar cea mai mic frecven, o au TTAAT, TATTT,
TATAT, TAGTA, TAATA, TAAAG, GTACA, GCATA i CATAT, toi cu o frecven de
0,8%. n ceea ce privete hexamerii, acetia au frecvene cuprinse ntre 0,5% i 1,5%.
Tetramerii, pentamerii i hexamerii cu frecven joas, sunt cei care se gsesc
ntr-un singur exemplar n ntreaga gen, avnd o frecven de 0,3%.
Cu ajutorul modulului EditSeq al DNA Star, a fost calculat temperatura de topire
a ADN, dup un model Davis-Botstein-Roth; n acest caz, prezint o valoare de
76,04C.
4.6.5. RELAII FILOGENETICE N CADRUL GENULUI CYPRINUS, BAZATE PE
DIFERENE ALE SECVENELOR D-LOOP
Ca i n cazul citocromului b, au fost utilizate metode care se bazeaz pe distane
i rata de substituie, dar care implic i mutaii de genul tranziiilor i transversiilor.
Astfel i n acest caz au fost utilizate UPGMA (Figura 52) pe baza unui model Tamura-
Nei, metoda evoluiei minime (ME) dup un algoritm Neighbour-Joining (Figura 53) i
Maximum-Parsimony (Figura 54).
119
Cy09M
Cy10M
Cy08M
Cy07M
Cy04M
Cy03M
Cy02M
Cy10I
Cy09I
Cy08I
Cy07I
Cy06I
Cy05I
Cy04I
Cy03I
Cy02I
Cy01I
Cy01M
Cy GB
Cy05M
Cy06M
0.002
Figura 52 Arbore filogenetic rectangular al genului Cyprinus, realizat prin metoda
UPGMA pe baza secvenelor d-loop
120
Cy01M
Cy GB
Cy05M
Cy09I
Cy07I
Cy05I
Cy03I
Cy01I
Cy02I
Cy04I
Cy06I
Cy08I
Cy10I
Cy02M
Cy03M
Cy04M
Cy07M
Cy08M
Cy09M
Cy10M
Cy06M
0.002
Figura 53 Arbore filogenetic al genului Cyprinus, realizat prin metoda ME
pe baza secvenelor d-loop
Din cele dou figuri, se observ c i n acest caz, Cy06M provine dintr-un nod
comun ancestral, din care provin i ramurile comune pentru celelalte secvene. De
asemenea, se observ c secvenele Cy01M i Cy GB, provin dintr-un ram comun,
din care provine i ramul pentru Cy05M.
Ulterior, a fost construit un arbore filogenetic bazat pe metoda Maximum
Parsimony (MP) (Figura 54). Din acesta, se poate observa c secvena Cy06M a
urmat o linie evolutiv monofiletic dintr-o specie ancestral. De asemenea, se
constat c secvenele Cy01I i Cy02I, precum i Cy01M, CyGB, au evoluat din
noduri comune.
121
Cy07I
Cy02M
Cy05M
Cy07M
Cy09M
Cy05I
Cy09I
Cy03M
Cy02I
Cy01I
Cy04M
Cy08I
Cy10M
Cy08M
Cy04I
Cy06I
Cy10I
Cy03I
Cy01M
Cy GB
Cy06M
Figura 54 Arbore filogenetic al genului Cyprinus, realizat prin metoda MP
pe baza secvenelor d-loop
4.7. ANALIZA SECVENELOR NUCLEOTIDICE ALE ND4L DEHIDROGENAZEI,
PROVENITE DE LA INDIVIZI APARINND GENULUI CYPRINUS
Pentru subunitatea 4L a dehidrogenazei (ND4L), n cazul speciilor genului
Cyprinus, au fost aliniate cele 20 de secvene (19 indivizi aparinnd celor dou
populaii, 1 individ de crap oglind Cyo06M i o secven provenit de la un individ de
crap, preluat din banca de gene pentru comparaie GenBank Ref. nr. AF 508931),
utiliznd metoda Clustal V (Higgins i Sharp, 1989).
Din alinierea celor 21 de secvene, se constat c nu exist diferene ntre indivizii
celor dou populaii (Larga-Jijia Movileni i Iai) la acest nivel al ADNmt. n plus,
122
putem concluziona c ND4L este o gen conservativ, cu variabilitate sczut. Totui,
comparnd secvena Cy GB cu haplotipul general al celor dou populaii, se constat
existena a 3 diferene. Astfel pentru secvenele celor dou populaii, n poziia 165 a
avut loc o tranziie (adenina a fost nlocuit cu guanin), o tranziie n poziia 180
(substituia timinei cu citozin) i o transversie n poziia 258 (substituia adeninei cu
citozin).
Din cele precizate anterior, deducem c, a fost gsit un haplotip nou, caracteristic
celor dou populaii (Cy01IM).
Pe baza comparaiei ntre secvene, s-a realizat tabelul similaritii i divergenei
(Tabel 36), din care se constat c procentele de similaritate sunt de 100% pentru
secvenele Cy01I i Cy01M (ca reprezentani ai celor dou populaii) i 98,9% pentru
comparaia ntre secvena Cy GB i celelalte secvene care constituie haplotipul
general caracteristic celor dou populaii.
Tabel 36 Procentele de similaritate i divergen pentru secvenele haplotipurilor stabilite
Procent de similaritate
P
r
o
c
e
n
t
d
e
d
i
v
e
r
g
e
n
Cy01I Cy01M Cy GB
Cy01I 100 98,9 Cy01I
Cy01M 0,0 98,9 Cy01M
Cy GB 1,2 1,2 Cy GB
Cy01I Cy01M Cy GB
n plus, pentru a stabili o mai clar difereniere ntre toate noile haplotipuri, au fost
analizate numrul i procentele n care se gsesc bazele azotate n fiecare dintre
acestea (Tabel 37).
Tabel 37 Procentul bazelor azotate, n cadrul haplotipurilor stabilite
Baze azotate
Specii analizate
Cy01I Cy01M Cy GB
A
Nr. 63 63 65
% 24,14 24,14 24,90
G
Nr. 44 44 43
% 16,86 16,86 16,48
T
Nr. 74 74 75
% 28,35 28,35 28,74
C
Nr. 80 80 78
% 30,65 30,65 29,89
A+T
Nr. 137 137 140
% 52,49 52,49 53,64
C+G
Nr. 124 124 121
% 47,51 47,51 46,36
123
Din Tabelul 37 i Figurile 55 i 56, dup cum a fost precizat i anterior, se observ
c diferene majore se constat pentru secvena Cy GB, care prezint valori diferite
pentru toate bazele azotate, comparativ cu celelalte haplotipuri.
0
5
10
15
20
25
30
35
%
Cy01I Cy01M Cy GB
Haplotip
A G T C
Figura 55 Graficul frecvenei bazelor azotate n cadrul haplotipurilor caracterizate
0
5
10
15
20
25
30
35
%
A G T C
Baze azotate
Cy01I Cy01M Cy GB
Figura 56 Graficul frecvenei bazelor azotate, comparativ ntre haplotipurile analizate
Referitor la cantitatea de adenin (A), aceasta este egal pentru Cy01I i Cy01M,
fiind n proporie de 24,14%, iar pentru Cy GB, n proporie de 24,90%. Cantitatea de
guanin este cuprins ntre 16,86% (Cy01I, Cy01M) i 16,48% pentru Cy GB. De
asemeni, se constat diferene i pentru celelalte baze azotate: cantitatea de timin
124
are valori de 28,35% pentru haplotipul general i 28,74% pentru Cy GB, iar citozina,
30,65% pentru Cy01I (ca reprezentant al haplotipului general caracteristic celor dou
populaii) i 29,89% pentru haplotipul Cy GB.
Procentul de baze complementare este de 52,49% n cazul A+T pentru Cy01I i
53,64% pentru Cy GB. Procentul de G+C este de 47,51% (Cy01I, Cy01M) i de
46,36% pentru Cy GB.
4.7.1. CARACTERIZAREA HAPLOTIPULUI CY01IM
4.7.1.1. FRECVENELE TIPURILOR DE ASOCIERI NUCLEOTIDICE
n acest haplotip, au fost ncadrate toate secvenele, deoarece procentele de
similaritate sunt de 100%.
Din analiza procentelor dinucleotidelor, s-a constatat c valoarea cea mai mare o
are perechea CT (10.3%), iar valoarea cea mai mic perechea GT, n proporie de
2,3%.
Referitor la trinucleotide, cea mai mare frecven o nregistreaz tripletul CTA
(4,6%), iar valoarea cea mai mic, tripletele ACG, AGA, AGT, ATC, CGT, GAG, GCG,
GTA, GTG i TCG, avnd o frecven de 0,4%.
Tetramerii cu frecvena cea mai mare, sunt TACT, CATT (2,3%), iar cei cu
frecvena cea mai mic TTTT, TTTA, TTCA, TGCT, GCTA, GCAT, CTTT, CTCA,
CTAT n procent de 1,2%. n cazul pentamerilor, cea mai mare frecven o are
pentamerul CTACT (1,5%). n ceea ce privete hexamerii, acetia au frecvene
cuprinse ntre 1,2% (AGCATT) i 0,4%.
Tetramerii, pentamerii i hexamerii cu frecven joas, sunt cei care se gsesc
ntr-un singur exemplar n ntreaga gen, avnd o frecven de 0,4%.
Cu ajutorul modulului EditSeq al DNA Star, a fost calculat temperatura de topire
a ADN, dup un model Davis-Botstein-Roth; n acest caz, prezint o valoare de
82,46C.
4.7.1.2. TRANSLAIA I CARACTERIZAREA CATENEI POLIPEPTIDICE
Translaia s-a realizat pe baza codului genetic mitocondrial pentru vertebrate,
utiliznd modulul EditSeq din cadrul programului DNA Star.
Catena polipeptidic obinut este prezentat n Figura 57.
Figura 57 Catena polipeptidic a ND4L, caracteristic haplotipului Cy01IM
al speciei Cyprinus carpio
Dup realizarea translaiei, se constat c ntreg lanul polipeptidic, este alctuit
din 87 aminoacizi. Din Tabelul 38, se observ c frecvena cea mai mare, o are
leucina (21,84%), iar cea mai sczut o au glicina i triptofanul (1,15%). Se constat
de asemenea, c lipsesc acidul aspartic, lizina, asparagina i tirozina.
Se observ c, din totalul de 87 aminoacizi, 3 au caracter acid, 2 sunt bazici, 20
polari i 45 hidrofobi (Tabelul 39). De asemenea, se constat c lanul polipeptidic are
MTPVHFSFSS AFILGLMGLA FHRTHLLSAL LCLEGMMLSL
FIALALWALQ FESTGFSTAP MLLLAFSACE ASTGLALLVA ARTHGT
125
o sarcin electric de -0,49 (la pH=7) i un punct izoelectric de 6,73 (Tabelul 39 i
Figura 58).
Tabel 38 Compoziia lanului polipeptidic
Aminoacizi
Numr
Procent din
greutatea total
(%)
Frecvena
(%)
Simbol Nume
A Ala 13 9,99 14,94
C Cys 2 2,23 2,30
D Asp 0 0,00 0,00
E Glu 3 4,19 3,45
F Phe 8 12,73 9,20
G Gly 6 3,70 6,90
H His 4 5,93 4,60
I Ile 2 2,45 2,30
K Lys 0 0,00 0,00
L Leu 19 23,25 21,84
M Met 5 7,09 5,75
N Asn 0 0,00 0,00
P Pro 2 2,10 2,30
Q Gln 1 1,39 1,15
R Arg 2 3,38 2,30
S Ser 9 8,48 10,34
T Thr 8 8,75 9,20
V Val 2 2,14 2,30
W Trp 1 2,01 1,15
Y Tyr 0 0,00 0,00
B Asx 0 0,00 0,00
Z Glx 0 0,00 0,00
. Ter 0 0,00 0,00
Tabel 39 Caracterizarea lanului polipeptidic
Greutate
molecula
r
(Daltoni)
Numr
de
aminoaci
zi
Aminoacizi
Punct
izoelectr
ic
Sarcin
a
electric
la
pH=7
Concentra
ia la o
extincie
=1 i
=280nm
Puterni
c
bazici
Puterni
c acizi
Hidrofo
bi
Pola
ri
9247,07 87 2 3 45 20 6,736 -0,479 1,56
126
Figura 58 Curba de titrare pentru lanul polipeptidic al ND4L, haplotip Cy01IM,
al speciei Cyprinus carpio
Ulterior, a fost realizat o analiz a structurii proteinei astfel, au fost determinate
zonele alfa helicoidale, beta pliate i de inflexiune, prin dou metode Garnier-Robson
(Garnier et al., 1978) i Chou-Fasman (Chou i Fasman, 1978); reprezentarea grafic
a zonelor hidrofobe (Kyte i Doolittle, 1982), zonele de flexie (Karplus i Schultz,
1985), indexul antigenic (Jameson i Wolf, 1988) i graficul probabil al suprafeei
(Emini et al., 1985).
Din analiza structurii lanului polipeptidic, se poate observa c, referitor la regiunile
alfa helicoidale, nu exist diferene majore ntre cele dou metode Garnier-Robson i
Chou-Fasman. Astfel, n cazul ambelor metode, se observ c exist 3 regiuni alfa
helicoidale, existnd o suprapunere parial a suprafeelor comparativ ntre cele dou
metode. De asemenea, pentru regiunile beta pliate, se observ c, pentru ambele
metode, se constat existena unei singure regiuni beta pliate situate la nceputul
catenei polipeptidice, cu deosebirea dat de diferenele de mrime dintre suprafeele
acestor regiuni determinate prin cele dou metode.
Referitor la zonele de inflexiune, pentru prima metod (GarnierRobson) sunt date
2 astfel de zone, n timp ce prin metoda Chou-Fasman sunt prezentate ca fiind 3 astfel
de regiuni, cu diferena c n cazul celei de-a doua, sunt prezentate ca regiuni cu
suprafee mai mari.
Pe baza graficului hidrofobicitii realizat dup un model Kyte-Doolitle (Kyte i
Doolittle, 1982), se constat c exist 6 zone hidrofobe i 6 zone hidrofile.
Din graficul indexului antigenic calculat pe baza modelului JamesonWolf
(Jameson i Wolf, 1988), se constat existena a 3 regiuni cu potenial antigenic.
127
4.7.2. RELAII FILOGENETICE N CADRUL GENULUI CYPRINUS, BAZATE PE
DIFERENE ALE SECVENELOR ND4L
n acest caz, arborii filogenetici au fost realizai, utiliznd aceleai metode UPGMA
pe baza modelului Tamura-Nei (Figura 59) i Minimum Evolution pe baza unui
algoritm Neighbour-Joining (Figura 60 i 61). Maximum Parsimony, nu poate fi folosit
n acest caz, deoarece nu exist situri informative pentru aceast metod (situri
conservative care s intervin cu o frecven de minim 2).
Cy09M
Cy10M
Cy08M
Cy07M
Cy06M
Cy05M
Cy04M
Cy03M
Cy02M
Cy01M
Cy10I
Cy09I
Cy08I
Cy07I
Cy06I
Cy05I
Cy04I
Cy03I
Cy02I
Cy01I
Cy GB
0,001
Figura 59 Arbore filogenetic al genului Cyprinus, realizat prin metoda UPGMA
pe baza secvenelor ND4L
128
Cy07I
Cy08I
Cy01I
Cy03I
Cy06M
Cy04M
Cy05I
Cy10I
Cy01M
Cy09M
Cy07M
Cy08M
Cy03M
Cy10M
Cy09I
Cy02I
Cy04I
Cy06I
Cy02M
Cy05M
Cy GB
Figura 60 Arbore filogenetic rectangular al genului Cyprinus, realizat prin metoda ME
pe baza secvenelor ND4L
129
C
y
0
7
I
C
y
0
8
I
C
y
0
1
I
C
y
0
3
I
C
y
0
6
M
Cy04M
Cy05I
C
y
1
0
I
C
y
0
1
M
C
y
0
9
M
C
y
0
7
M
C
y
0
8
M
C
y
0
3
M
C
y
1
0
M
C
y
0
9
I
C
y02I
Cy04I
C
y06I
C
y
0
2
M
C
y
0
5
M
C
y
G
B
Figura 61 Arbore filogenetic circular al genului Cyprinus, realizat prin metoda ME
pe baza secvenelor ND4L
Din Figurile 60 i 61, pe baza diferenelor dintre secvene i a sumei lungimilor
braelor, se constat c individul a crui secven a fost preluat din banca de gene,
provine dintr-un nod comun ancestral, cu ramurile din care au evoluat speciile celor
dou populaii. De asemeni, pentru cele dou populaii analizate, se observ c
indivizii acestora se grupeaz difereniat. Se constat din cele dou figuri, c exist
diferene n cadrul arborelui, date de poziiile ramurilor interioare, dar care nu prezint
o importan la fel de mare ca topologia (aspectul general al arborelui) care rmne
neschimbat i care ne furnizeaz informaiile necesare pentru direciile filogenetice
ale haplotipului analizat.
4.8. ANALIZA SECVENELOR NUCLEOTIDICE ALE CITOCROMULUI B,
PROVENITE DE LA INDIVIZI APARINND GENULUI CARASSIUS
Au fost aliniate 20 de secvene ale citocromului b prima parte, provenite de la
indivizi ai celor dou populaii luate n studiu (Larga-Jijia Movileni i Iai), precum i
secvene preluate din banca de gene GenBank, provenite de la specii (Carassius
carassius Ref. nr. AY714387 i Carassius cuvieri Ref. nr. AB045144), subspecii
(Carassius auratus langsdrfi Ref. nr. AB006953) i hibrizi (Carassius auratus x
Cyprinus carpio Ref. nr. AY694420 i Carassius auratus x Cyprinus carpio x
Carassius cuvieri Ref. nr. AY771781 ) ai genului Carassius.
Alinierea s-a realizat, utiliznd metoda Clustal V (Higgins i Sharp, 1989), (Anexa
10).
130
Din alinierea secvenelor pentru 23 de indivizi ai genului Carassius i doi hibrizi,
se constat c exist un numr de 149 diferene. Dintre acestea, comparnd
secvenele care provin de la indivizi ai celor dou populaii analizate, se constat
existena a trei diferene (sau a unei diferene, dar care implic trei secvene) i
anume, existena unei tranziii n poziia 258 (substituirea guaninei cu adenin), pentru
secvenele Cag01I, Cag07I i Cag03M. Se poate observa c aceast mutaie este
prezent n ambele populaii, dar cu o rat destul de sczut.
Cele mai multe diferene (146), apar pentru secvenele preluate din banca de
gene. Astfel, se constat existena a 137 de tranziii i 9 transversii. Secvenele care
prezint cele mai multe diferene fa de haplotipul general al celor dou populaii,
sunt secvenele speciei Carassius cuvieri i a hibridului Carassius auratus x Cyprinus
carpio x Carassius cuvieri; acestea difer prin 38 de tranziii i 6 transversii.
Majoritatea tranziiilor produse au avut loc ntre citozin i timin (25), n timp ce
pentru adenin guanin au fost nregistrate doar 15. Referitor la transversii, 2 s-au
produs ntre guanin citozin, 1 ntre adenin timin i una ntre adenin
citozin.
n cazul individului Carassius auratus langsdrfi, acesta difer fa de haplotipul
general al celor dou populaii, prin 38 de mutaii, dintre care 37 de tranziii i 1
transversie.
Specia Carassius carassius i hibridul Carassius auratus x Cyprinus carpio,
prezint cte 11 diferene fat de haplotipul general, din care 10 tranziii i o
transversie (Gorgan, 2004a).
Din cele prezentate anterior, putem concluziona c au fost gsite 2 noi haplotipuri
pentru citocromul b: un haplotip general (care va fi notat CagIMY) caracteristic
secvenelor care nu prezint diferene n cadrul celor dou populaii i un haplotip
specific secvenelor care prezint acea mutaie n poziia 258 Cag137IM, de asemeni,
caracteristic populaiilor studiate.
Pe baza comparaiei ntre secvene, s-a realizat tabelul similaritii i divergenei
(Tabel 40), din care se constat c procentele de similaritate pentru cele dou
haplotipuri sunt de 99,9%, deoarece difer printr-o singur nucleotid. De asemeni,
procente foarte ridicate de similaritate (100%) se constat ntre secvenele Carassius
carassius i Carassius auratus x Cyprinus carpio, precum i ntre secvenele
Carassius cuvieri i Carassius auratus x Cyprinus carpio x Carassius cuvieri. n primul
caz, din cauza similaritii dintre secvena speciei Carassius carassius i a hibridului
Carassius auratus x Cyprinus carpio, care s-a observat c este de 100%, putem
deduce c, de fapt, la ncruciarea de obinere a hibridului a participat un individ
aparinnd speciei Carassius carassius i nu Carassius auratus cum s-a precizat.
Aceast afirmaie, se bazeaz pe faptul c ADNmt se transmite doar pe linie matern,
iar n acest caz, dac femela ar fi aparinut speciei Cyprinus carpio, cu siguran,
procentul de similaritate cu celelalte secvene ale genului Carassius, ar fi fost mai
sczut. Deci, femela a aparinut unei specii a genului Carassius, iar masculul, speciei
Cyprinus carpio. Din compararea secvenelor, constatm c secvena hibridului
corespunde n procent de 100% cu a unui individ aparinnd speciei Carassius
carassius, deci, femela care a participat la ncruciare, aparinea acestei specii.
Aceast eroare rezid probabil din faptul c femela care a fost introdus n hibridare a
fost determinat doar pe baza caracterelor morfologice sau cele dou specii sunt de
fapt subspecii ale aceleiai specii.
n al doilea caz, n situaia similaritii dintre secvena speciei Carassius cuvieri i
cea a hibridului Carassius auratus x Cyprinus carpio x Carassius cuvieri, innd cont
de faptul c ADNmt se transmite pe linie matern, cea mai probabil situaie n acest
131
caz, este cea n care, hibridul obinut n urma ncrucirii Carassius auratus x
Cyprinus carpio este ncruciat cu o femel aparinnd speciei Carassius cuvieri, caz
n care, la nivel mitocondrial, va fi transmis doar ADN-ul provenit de la genitorul
matern.
innd cont de faptul c la Cyprinidae n general i la reprezentanii genului
Carassius n special, este ntlnit fenomenul de ginogenez i n aceste cazuri, este
posibil s fie doar fali hibrizi, adic indivizi ginogenetici. n acest caz, specia Cyprinus
carpio, nu a contribuit cu informaia sa genetic la formarea descendenilor, ci,
materialul seminal, a avut rol, doar de iniiere a diviziunii celulare.
Aceste dou exemple, demonstreaz nc o dat importana studiilor de genetic
i filogenie molecular n determinarea hibrizilor, a genitorilor acestora precum i a
sexului genitorilor.
Tabel 40 Procentele de similaritate i divergen pentru secvenele haplotipurilor stabilite
Procent de similaritate
P
r
o
c
e
n
t
d
e
d
i
v
e
r
g
e
n
CagIM
Y
Cag137I
M
Cacu
v
Caula
n
CaxC
y
CaxCy
x
Ccuv
Ccara
s
CagIMY 99,9 93,6 94,3 98,2 93,6 98,2 CagIMY
Cag137I
M
0,1 93,7 94,5 98,4 93,7 98,4
Cag137I
M
Cacuv 6,8 6,7 93,7 93,9 100,0 93,9 Cacuv
Caulan 6,0 5,9 6,7 94,6 93,7 94,6 Caulan
CaxCy 1,8 1,6 6,5 5,7 93,9 100,0 CaxCy
CaxCyx
Ccuv
6,8 6,7 0,0 6,7 6,5 93,9
CaxCyx
Ccuv
Ccaras 1,8 1,6 6,5 5,7 0,0 6,5 Ccaras
CagIM
Y
Cag137I
M
Cacu
v
Caula
n
CaxC
y
CaxCy
x
Ccuv
Ccara
s
n plus, pentru a stabili o mai clar difereniere ntre toate noile haplotipuri, au fost
analizate numrul i procentele n care se gsesc bazele azotate n fiecare dintre
acestea (Tabel 41).
132
Tabel 41 Procentul bazelor azotate, n cadrul haplotipurilor stabilite
Baze
azotate
Specii analizate
CagIMY Cag137IM Ccaras Ccuv Caulan CaxCy CaxCyxCcuv
A
Nr, 198 199 202 194 198 202 194
% 28,95 29,09 29,53 28,36 28,95 29,53 28,36
G
Nr, 100 99 97 101 101 97 101
% 14,62 14,47 14,18 14,77 14,77 14,18 14,77
T
Nr, 203 203 200 205 198 200 205
% 29,68 29,68 29,24 29,97 28,95 29,24 29,97
C
Nr, 183 183 185 184 187 185 184
% 26,75 26,75 27,05 26,90 27,34 27,05 26,90
A+T
Nr, 401 402 402 399 396 402 399
% 58,63 58,77 58,77 58,33 57,89 58,77 58,33
C+G
Nr, 283 282 282 285 288 282 285
% 41,37 41,23 41,23 41,67 42,11 41,23 41,67
0
5
10
15
20
25
30
%
CagIMY Cag137IM Ccaras Ccuv Caulan CaxCy CaxCyxCcuv
Haplotip
A G T C
Figura 62 Graficul frecvenei bazelor azotate n cadrul haplotipurilor caracterizate
133
0
5
10
15
20
25
30
%
A G T C
Baze azotate
CagIMY Cag137IM Ccaras Ccuv Caulan CaxCy CaxCyxCcuv
Figura 63 Graficul frecvenei bazelor azotate, comparativ ntre haplotipurile analizate
Din Tabelul 41 i Figurile 62 63, constatm c pentru haplotipurile descoperite n
cele dou populaii analizate, concentraia de adenin este de 28,95% pentru CagIMY
i 29,09% pentru Cag137IM. Cantitatea de guanin, variaz ntre 14,62% n cazul
primului haplotip i 14,47% pentru cel de-al doilea, timina are valori de 29,68% pentru
ambele haplotipuri, ca i citozina, cu o valoare de 26,75%.
Procentul bazelor complementare este de 58,63% pentru A+T n cazul primului
haplotip i de 58,77% pentru cel de-al doilea, iar procentele pentru C+G sunt de
41,37% pentru CagIMY i 41,23% pentru Cag137IM.
Dac urmrim valorile pentru ntreg tabelul, constatm c exist o variaie a
cantitii de adenin, cuprins ntre 28,36%pentru haplotipurile Ccuv, CyxCyxCcuv i
29,53% pentru haplotipurile Ccaras i CaxCy. Cantitatea de guanin variaz
asemntor, avnd valori cuprinse ntre 14,18% pentru CaxCy i 14,77% pentru Ccuv,
Caulan i CaxCyxCcuv. Referitor la cantitatea de timin, se constat c variaz ntre
28,95% pentru Caulan i 29,97% pentru Ccuv i hibridul CaxCyxCcuv. Cantitatea de
citozin, variaz ntre 26,75% pentru primele dou haplotipuri i 27,34% pentru
Caulan.
Referitor la procentele n care se gsesc bazele complementare, pentru A+T se
nregistreaz valori cuprinse ntre 58,77% pentru haplotipurile Cag137IM, Ccaras i
CaxCy i 57,89% pentru Caulan, iar pentru C+G, valori cuprinse ntre 41,23%
(Cag137IM, Ccaras i CaxCy) i 42,11% pentru secvena Caulan.
4.8.1. CARACTERIZAREA HAPLOTIPULUI CAGIMY
4.8.1.1. FRECVENELE TIPURILOR DE ASOCIERI NUCLEOTIDICE
n acest haplotip au fost ncadrate toate secvenele ntre care nu exist diferene
(Cag02I, Cag03I, Cag04I, Cag05I, Cag06I, Cag08I, Cag09I, Cag10I, Cag01M,
134
Cag02M, Cag04M, Cag05M, Cag06M, Cag07M, Cag08M, Cag09M, Cag10M),
aparinnd celor dou populaii luate n studiu, Larga-Jijia Movileni i Iai.
Pentru a caracteriza acest haplotip, au fost calculate frecvenele dinucleotidelor
(Tabelul 84), trinucleotidelor (Tabelul 85), tetramerilor, pentamerilor i hexamerilor
(Tabelul 86), precum i tetramerii, pentamerii i hexamerii cu frecven joas (Tabelul
87).
Din analiza procentelor dinucleotidelor constatm c valoarea cea mai mare o are
perechea AT (9,8%), iar valoarea cea mai mic perechea GG, n proporie de 3,2%.
Referitor la trinucleotide, cea mai mare frecven o nregistreaz tripletul CAT (3,8%),
iar valoarea cea mai mic, tripletele GCG, GGT i GTG, avnd o frecven de 0,1%.
Tetramerul cu frecvena cea mai mare, este CATT (1,9%), iar cei cu frecven
redus: TTAT, TAAT, CTTC, CTCA I CCAT toi n procent de 0,9%. n cazul
pentamerilor (Tabelul 86), cea mai mare frecven o are pentamerul ACATT (0,9%),
iar cea mai mic frecven, o au TTTCT, TTCTA, TTCAT i TTCAC (0,4%). n ceea ce
privete hexamerii, acetia au frecvene cuprinse ntre 0,3% i 0,4%.
Tetramerii, pentamerii i hexamerii cu frecven joas, sunt cei care se gsesc
ntr-un singur exemplar n ntreaga gen, avnd o frecven de 0,1%.
Cu ajutorul modulului EditSeq al DNA Star, a fost calculat temperatura de topire
a ADN, dup un model Davis-Botstein-Roth; n acest caz, prezint o valoare de
81,13C.
4.8.1.2. TRANSLAIA I CARACTERIZAREA CATENEI POLIPEPTIDICE
Translaia s-a realizat pe baza unui cod genetic mitocondrial pentru vertebrate,
utiliznd modulul EditSeq din cadrul programului DNA Star.
Catena polipeptidic obinut este prezentat n Figura 64.
Figura 64 Catena polipeptidic a citocromului b caracteristic haplotipului CagIMY al
speciei Carassius gibelio Bloch.
Dup realizarea translaiei, se constat c ntreg lanul polipeptidic, este alctuit
din 228 aminoacizi (Tabelul 42), din care se observ c frecvena cea mai mare, o are
leucina (15,08%), iar cea mai sczut o are cisteina (1,06%).
Se constat c din totalul de 228 aminoacizi, 11 sunt acizi, 10 sunt bazici, 61
polari i 105 hidrofobi (Tabelul 43). De asemenea, se constat c lanul polipeptidic
are o sarcin electric de 0,31 (la pH=7) i un punct izoelectric de 7,09 (Figura 65).
MASLRKTHPL IKIANDALVD LPTPSNISAW WNFGSLLGLC LITQILTGLF LAMHYTSDIS
TAFSSVTHIC RDVNYGWLIR NIHANGASFF FICIYMHIAR GLYYGSYLYK ETWNIGVVLL
LLVMMTAFVG YVLPWGQMSF WGATVITNLL SAVPYMGDML VQWIWGGFSV DNATLTRFFA
FHFLLPFIIA AATVIHLLFL
135
Tabel 42 Compoziia lanului polipeptidic
Aminoacizi
Numr
Procent din
greutatea total (%)
Frecvena
(%)
Simbol Nume
A Ala 18 4,98 7,89
C Cys 3 1,21 1,32
D Asp 9 4,04 3,95
E Glu 2 1,01 0,88
F Phe 17 9,75 7,46
G Gly 16 3,56 7,02
H His 9 4,81 3,95
I Ile 20 8,82 8,77
K Lys 5 2,50 2,19
L Leu 29 12,79 12,72
M Met 8 4,09 3,51
N Asn 12 5,33 5,26
P Pro 8 3,03 3,51
Q Gln 3 1,50 1,32
R Arg 5 3,04 2,19
S Ser 17 5,77 7,46
T Thr 13 5,91 6,58
V Val 15 5,02 5,70
W Trp 8 5,80 3,51
Y Tyr 11 6,99 4,82
B Asx 0 0,00 0,00
Z Glx 0 0,00 0,00
. Ter 0 0,00 0,00
Tabel 43 Caracterizarea lanului polipeptidic
Greutate
molecula
r
(Daltoni)
Numr
de
aminoaci
zi
Aminoacizi
Punct
izoelectr
ic
Sarcin
a
electric
la
pH=7
Concentra
ia la o
extincie
=1 i
=280nm
Puterni
c
bazici
Puterni
c acizi
Hidrofo
bi
Pola
ri
25666,07 228 10 11 105 61 7,098 0,311 0,43
136
Figura 65 Curba de titrare pentru lanul polipeptidic al citocromului b, haplotip CagIMY
al speciei Carassius gibelio
Ulterior, a fost realizat o analiz a structurii proteinei (Figura 98); astfel, au fost
determinate zonele alfa helicoidale, beta pliate i de inflexiune, prin dou metode
Garnier-Robson (Garnier et al., 1978) i Chou-Fasman (Chou i Fasman, 1978);
reprezentarea grafic a zonelor hidrofobe (Kyte i Doolittle, 1982), zonele de flexie
(Karplus i Schultz, 1985), indexul antigenic (Jameson i Wolf, 1988) i graficul
probabil al suprafeei (Emini et al., 1985).
Din analiza structurii lanului polipeptidic, se poate observa c referitor la regiunile
alfa helicoidale, exist diferene ntre cele dou metode Garnier-Robson i Chou-
Fasman. Astfel, n cazul primei metode, se observ c exist 9 regiuni alfa helicoidale,
n timp ce, potrivit celei de-a doua metode, exist doar 4, cu 3 puncte de suprapunere
ale suprafeelor. De asemenea, pentru regiunile beta pliate, se observ c exist o
similaritate relativ ntre cele dou metode, comparativ cu regiunile alfa, n ceea ce
privete suprafaa acestor zone. Pentru determinarea efectuat prin prima metod, se
constat existena a 18 regiuni beta pliate, n timp ce, pentru cea de-a doua metod
(Chou-Fasman), sunt considerate ca existnd 7 astfel de regiuni. Referitor la zonele
de inflexiune, de asemenea, comparativ pentru cele dou metode, se constat c
pentru prima metod (GarnierRobson) sunt prezentate 14 regiuni, iar prin a doua
metod (Chou-Fasman) sunt date 12 astfel de regiuni, cu precizarea c n cazul celei
de-a doua, sunt prezentate ca regiuni cu suprafee mai mari.
Pe baza graficului hidrofobicitii, realizat dup un model Kyte-Doolitle (Kyte i
Doolittle, 1982), se constat c exist 9 zone hidrofobe i 7 zone hidrofile.
Din graficul indexului antigenic calculat pe baza modelului Jameson Wolf
(Jameson i Wolf, 1988), se constat existena a 9 regiuni cu potenial antigenic.
137
4.8.2. CARACTERIZAREA HAPLOTIPULUI CAG137IM
4.8.2.1. FRECVENELE TIPURILOR DE ASOCIERI NUCLEOTIDICE
Acest haplotip este caracteristic secvenelor Cag01I, Cag07I i Cag03S,
aparinnd celor dou populaii luate n studiu, Larga-Jijia Movileni i Iai. Acestea
difer de haplotipul general prin intervenia unei tranziii n poziia 258 (substituia
guaninei cu adenin).
Din analiza procentelor dinucleotidelor, constatm c valoarea cea mai mare o are
perechea AT (9,8%), iar valoarea cea mai mic perechea GT, n proporie de 2,6%.
Referitor la trinucleotide, cea mai mare frecven o nregistreaz tripletul CAT (3,8%),
iar valoarea cea mai mic, tripletele GCG, GGT i GTG, avnd o frecven de 0,1%.
Tetramerul cu frecvena cea mai mare, este CATT (1,9%), iar cei cu frecven
redus: TTAT, TAAT, CTTC, CTCA I CCAT, toi n procent de 0,9%. n cazul
pentamerilor, cea mai mare frecven o are pentamerul ACATT (0,9%), iar cea mai
mic frecven, o au TTTCT, TTCAT, TTCTA i TTCAC (0,4%). n ceea ce privete
hexamerii, acetia au frecvene cuprinse ntre 0,3% i 0,4%.
Tetramerii, pentamerii i hexamerii cu frecven joas, sunt cei care se gsesc
ntr-un singur exemplar n ntreaga gen, avnd o frecven de 0,1%.
Cu ajutorul modulului EditSeq al DNA Star, a fost calculat temperatura de topire
a ADN, dup un model Davis-Botstein-Roth; n acest caz, prezint o valoare de
81,07C.
4.8.2.2. MODELAREA STRUCTURII SECUNDARE A ARNm
Deoarece exist o singur diferen, constnd n nlocuirea unei nucleotide,
structura general a ARNm este similar structurii ARNm al haplotipului general
pentru aceast gen. Singura diferen n acest caz, fa de structura anterioar, este
dat de existena adeninei n locul guaninei. Ca i n cazul precedent, ARNm prezint
47 regiuni monocatenare, alternnd cu 24 regiuni bicatenare.
4.8.2.3. TRANSLAIA I CARACTERIZAREA CATENEI POLIPEPTIDICE
Translaia s-a realizat pe baza unui cod genetic mitocondrial pentru vertebrate,
utiliznd modulul EditSeq din cadrul programului DNA Star.
Catena polipeptidic obinut este prezentat n Figura 66.
Figura 66 Catena polipeptidic a citocromului b caracteristic haplotipului Cag137IM al
speciei Carassius gibelio Bloch.
Dup realizarea translaiei, se constat c ntreg lanul polipeptidic, este alctuit
din 228 aminoacizi (Tabelul 44), din care se observ c frecvena cea mai mare, o are
MASLRKTHPL IKIANDALVD LPTPSNISAW WNFGSLLGLC LITQILTGLF
LAMHYTSDIS TAFSSVTHIC RDVNYGWLIR NIHANGASFF FICIYMHIAR
GLYYGSYLYK ETWNIGVVLL LLVMMTAFVG YVLPWGQMSF WGATVITNLL
SAVPYMGDML VQWIWGGFSV DNATLTRFFA FHFLLPFIIA AATVIHLLFL
HETGSNNPIG LNSDADKISF HPYFSYKD
138
leucina (15,08%), iar cea mai sczut o are cisteina (1,06%). Se constat de
asemenea, existena a doi codoni stop (notai cu .) ctre sfritul lanului polipeptidic.
Se constat c din totalul de 228 aminoacizi, 11 sunt acizi, 10 sunt bazici, 61
polari i 105 hidrofobi. De asemenea, se constat c lanul polipeptidic are o sarcin
electric de 0,31 (la pH=7) i un punct izoelectric de 7,09.
Tabel 44 Compoziia lanului polipeptidic
Aminoacizi
Numr
Procent din
greutatea total
(%)
Frecvena
(%)
Simbol Nume
A Ala 18 4,98 7,89
C Cys 3 1,21 1,32
D Asp 9 4,04 3,95
E Glu 2 1,01 0,88
F Phe 17 9,75 7,46
G Gly 16 3,56 7,02
H His 9 4,81 3,95
I Ile 20 8,82 8,77
K Lys 5 2,50 2,19
L Leu 29 12,79 12,72
M Met 8 4,09 3,51
N Asn 12 5,33 5,26
P Pro 8 3,03 3,51
Q Gln 3 1,50 1,32
R Arg 5 3,04 2,19
S Ser 17 5,77 7,46
T Thr 13 5,91 6,58
V Val 15 5,02 5,70
W Trp 8 5,80 3,51
Y Tyr 11 6,99 4,82
B Asx 0 0,00 0,00
Z Glx 0 0,00 0,00
. Ter 0 0,00 0,00
4.8.3. RELAII FILOGENETICE N CADRUL GENULUI CARASSIUS, STABILITE
PRIN ANALIZA SECVENELOR CITOCROMULUI B
Metodele folosite n filogenie i modalitile de realizare a arborilor filogenetici,
utilizate n acest caz, sunt cele care includ tranziiile i transversiile, deoarece
haplotipurile analizate pentru cele dou populaii, prezint ambele tipuri de mutaii.
139
Cag09M
Cag10M
Cag08M
Cag07M
Cag06M
Cag05M
Cag04M
Cag02M
Cag01M
Cag10I
Cag09I
Cag08I
Cag06I
Cag05I
Cag04I
Cag03I
Cag02I
Cag01I
Cag07I
Cag03M
CaxCy
Ccaras
Caulan
Ccuv
CaxCyxCcuv
0.005
Figura 67 Arbore filogenetic rectangular al genului Carassius, realizat prin metoda
UPGMA pe baza secvenelor citocromului B
Astfel, prin metoda UPGMA bazat pe modelul Tamura Nei, care include
ambele tipuri de mutaii posibile (tranziii i transversii), a fost obinut un arbore
filogenetic (Figura 67), din care se observ c Cy06 deriv direct dintr-un nod comun
ancestral, din care deriv i braul comun al celorlalte secvene.
140
Cag08M
Cag09M
Cag07M
Cag06M
Cag05M
Cag04M
Cag02M
Cag01M
Cag10I
Cag09I
Cag08I
Cag06I
Cag05I
Cag04I
Cag03I
Cag02I
Cag10M
Cag01I
Cag07I
Cag03M
CaxCy
Ccaras
Caulan
Ccuv
CaxCyxCcuv
0.005
Figura 68 Arbore filogenetic rectangular al genului Carassius, realizat prin metoda ME pe
baza secvenelor citocromului B
141
C
a
g
0
5
M
C
a
g
0
9
M
C
a
g
0
4
I
C
a
g
0
6
I
C
a
g
0
2
I
C
a
g
1
0
I
Cag08I
Cag07M
C
a
g
0
9
I
C
a
g
0
2
M
C
a
g
0
3
I
C
a
g
1
0
M
C
a
g
0
6
M
C
a
g
0
8
M
C
a
g
0
1
M C
a
g
0
4
M
C
a
g
0
5
I
C
a
g
0
7
I
C
a
g
0
1
I
Cag03M
C
axC
y
C
c
a
r
a
s
C
a
u
l
a
n
C
c
u
v
C
a
x
C
y
x
C
c
u
v
5
Figura 69 Arbore filogenetic circular al genului Carassius, realizat prin metoda MP pe
baza secvenelor citocromului B
Din Figura 68 se constat grupele evolutive ale speciilor analizate, n care se
ncadreaz secvenele pe baza similaritilor existente, aa cum au fost ncadrate i n
cazul analizei procentelor de similaritate.
Arborele filogenetic din Figura 68, realizat prin metoda evoluiei minime (ME),
utiliznd un algoritm Neighbour-Joining, ne furnizeaz informaii referitoare la
distanele existente ntre grupele stabilite anterior. Astfel, constatm c pe ultima
treapt a evoluiei se situeaz haplotipul general stabilit pentru cele dou populaii,
urmat de haplotipul caracteristic celorlalte trei secvene. Acesta din urm se situeaz
pe acelai palier evolutiv cu specia Carassius auratus langsdrfi, specie care ns, a
urmat alt traseu evolutiv, pn n acest punct. De asemeni, se poate observa c
specia cea mai apropiat de speciile comune ancestrale, din cadrul acestui grup
evolutiv, este Carassius carassius (caracuda), care se gsea i n apele rii noastre
ca specie dominant, dar care astzi, a fost nlocuit de specia Carassius gibelio,
persistnd ns doar n populaii izolate, pe areale foarte restrnse, limitate la doar
cteva ecosisteme acvatice. Faptul c a fost nlocuit , dovedete o adaptare mai
bun a speciei Carassius gibelio la condiiile actuale, fapt ce o situeaz pe o treapt
142
evolutiv superioar speciei Carassius carassius, fapt confirmat i de prezenta
analiz.
Figura 69 prezint un arbore circular realizat prin metoda Maximum Parsimony
(MP) care ne confirm rezultatele discutate anterior, cu precizarea c specia
Carassius cuvieri a evoluat monofiletic dintr-un nod filogenetic comun ancestral, ceea
ce ne determin s concluzionm c este o specie ancestral care st la originea
celorlalte specii analizate. Bineneles, dac s-ar mri numrul de taxoni analizai, este
posibil s se constate o alt specie ancestral, iar Carassius cuvieri s fie doar un
rezultat al evoluiei, dar, n acest caz, cele trei metode diferite utilizate (UPGMA;
Minimum Evolution i Maximum Parsimony) la care se adaug i modelul utilizat
(Tamura-Nei), ne confirm c este specie ancestral pentru celelalte specii analizate.
4.9. ANALIZA SECVENELOR NUCLEOTIDICE ALE D-LOOP, PROVENITE DE LA
INDIVIZI APARINND GENULUI CARASSIUS
Pentru regiunea de control mitocondrial, n cazul speciilor genului Carassius, a
fost secveniat prima parte hipervariabil a acesteia. Au fost aliniate 20 de secvene
provenite de la indivizi ai celor dou populaii luate n studiu (Larga-Jijia Movileni i
Iai), precum i secvene preluate din banca de gene GenBank, provenite de la specii
(Carassius carassius Ref. nr. AY714387 i Carassius cuvieri Ref. nr. AB045144),
subspecii (Carassius auratus langsdrfi Ref. nr. AB006953) i hibrizi (Carassius
auratus x Cyprinus carpio Ref. nr. AY694420 i Carassius auratus x Cyprinus carpio x
Carassius cuvieri Ref. nr. AY771781 ) ai genului Carassius.
Alinierea s-a realizat, utiliznd metoda Clustal V (Higgins i Sharp, 1989) i a fost
verificat prin metoda Clustal W (Thompson et al., 1994), obinndu-se n ambele
cazuri acelai rezultat.
Din alinierea secvenelor, se observ c exist un numr de 82 diferene ntre cele
25 de secvene, dintre care 64 tranziii, 12 transversii, 3 inversii i 3 deleii.
ntre secvenele celor dou populaii analizate, se constat existena a dou
diferene (sau o diferen care implic dou secvene, comparativ cu celelalte
secvene similare ale acelorai populaii) ce constau n existena unei tranziii pentru
fiecare dintre cele dou secvene n poziia 133, unde a avut loc substituia timinei de
ctre citozin.
Referitor la celelalte secvene preluate din banca de gene, se constat c cele
mai multe diferene (21) fa de haplotipul general al celor dou populaii analizate, l
prezint secvena speciei Carassius cuvieri, care are acelai numr de diferene cu
secvena hibridului Carassius auratus x Cyprinus carpio x Carassius cuvieri. Pentru
secvenele speciei Carasius carassius i ale hibridului Carassius auratus x Cyprinus
carpio, de asemeni, se nregistreaz un numr egal de mutaii (11), dintre care 10
tranziii i o deleie.
Pe baza comparaiei ntre secvene, s-a realizat tabelul similaritii i divergenei
(Tabel 45), din care se constat c procentele de similaritate pentru cele dou
haplotipuri ale populaiilor analizate sunt de 99,6%. De asemeni, procente foarte
ridicate de similaritate (100%) se constat ntre secvenele Carassius carassius i
Carassius auratus x Cyprinus carpio, precum i ntre secvenele Carassius cuvieri
Carassius auratus x Cyprinus carpio x Carassius cuvieri.
143
Tabel 45 Procentele de similaritate i divergen pentru secvenele haplotipurilor stabilite
Procent de similaritate
P
r
o
c
e
n
t
d
e
d
i
v
e
r
g
e
n
CagIM
D
Cag25I
D
Cacu
v
Caula
n
CaxC
y
CaxCy
x
Ccuv
Ccara
s
CagIMD 99,6 91,1 74,3 73,1 91,1 73,1 CagIMD
Cag25I
D
0,4 90,7 73,9 72,7 90,7 72,7
Cag137I
M
Cacuv 9,7 10,2 70,2 69,0 100,0 69,0 Cacuv
Caulan 31,5 32,1 38,0 94,7 70,2 94,7 Caulan
CaxCy 33,4 34,0 40,0 5,6 69,0 100,0 CaxCy
CaxCyx
Ccuv
9,7 10,2 0,0 38,0 40,0 69,0
CaxCyx
Ccuv
Ccaras 33,4 34,0 40,0 5,6 0,0 40,0 Ccaras
CagIM
D
Cag25I
D
Cacu
v
Caula
n
CaxC
y
CaxCy
x
Ccuv
Ccara
s
Pe baza comparaiei ntre secvene, precum i a procentelor de similaritate,
constatm c au fost gsite 2 noi haplotipuri pentru specia Carassius gibelio Bloch i
cele dou populaii analizate un haplotip general CagIMD i unul caracteristic doar
populaiei Iai Cag25ID.
n plus, pentru a stabili o mai clar difereniere ntre toate noile haplotipuri, au fost
analizate numrul i procentele n care se gsesc bazele azotate n fiecare dintre
acestea (Tabel 46).
144
Tabel 46 Procentul bazelor azotate, n cadrul haplotipurilor stabilite
Baze
azotate
Specii analizate
CagIMD Cag25ID Ccaras Ccuv Caulan CaxCy CaxCyxCcuv
A
Nr, 91 91 91 94 91 91 94
% 36,99 36,99 37,45 38,21 37,45 37,45 38,21
G
Nr, 38 38 35 38 33 35 38
% 15,45 15,45 14,40 15,45 13,58 14,40 15,45
T
Nr, 77 76 74 73 74 74 73
% 31,30 30,89 30,45 29,67 30,45 30,45 29,67
C
Nr, 40 41 43 41 45 43 41
% 16,26 16,67 17,70 16,67 18,52 17,70 16,67
A+T
Nr, 168 167 165 167 165 165 167
% 68,29 67,89 67,90 67,89 67,90 67,90 67,89
C+G
Nr, 78 79 78 79 78 78 79
% 31,71 32,11 32,10 32,11 32,10 32,10 32,11
0
5
10
15
20
25
30
35
40
%
CagIMD Cag25ID Ccaras Ccuv Caulan CaxCy CaxCyxCcuv
Haplotip
A G T C
Figura 70 Graficul frecvenei bazelor azotate n cadrul haplotipurilor caracterizate
145
0
5
10
15
20
25
30
35
40
%
A G T C
Baze azotate
CagIMD Cag25ID Ccaras Ccuv Caulan CaxCy CaxCyxCcuv
Figura 71 Graficul frecvenei bazelor azotate, comparativ ntre haplotipurile analizate
Din Tabelul 46 i Figurile 70 71, constatm c pentru haplotipurile descoperite n
cele dou populaii analizate, concentraia de adenin este de 36,99% pentru ambele
haplotipuri analizate, ca i cantitatea de guanin, care este de 15,45%. Timina are
valori de 31,30% pentru haplotipul CagIMD i 30,89% pentru haplotipul Cag25ID, iar
citozina, valori de 18,26% pentru primul haplotip i 16,67% pentru cel de-al doilea.
Procentul bazelor complementare este de 68,29% pentru A+T n cazul primului
haplotip i de 67,89% pentru cel de-al doilea, iar procentele pentru C+G sunt de
31,71% pentru CagIMD i 32,11% pentru Cag25ID.
Din analiza valorilor, constatm c exist o variaie a cantitii de adenin,
cuprins ntre 36,99%pentru haplotipurile celor dou populaii i 38,21% pentru
haplotipurile Ccuv i CaxCyxCcuv. Cantitatea de guanin variaz asemntor, avnd
valori cuprinse ntre 13,58% pentru Caulan i 15,45% pentru cele dou haplotipuri
analizate, Ccuv, i CaxCyxCcuv. Referitor la cantitatea de timin, se constat c
variaz ntre 29,67% pentru Ccuv i hibridul CaxCyxCcuv i 31,30% pentru haplotipul
CagIMD. Cantitatea de citozin, variaz ntre 16,26% pentru primul haplotip i 18,52%
pentru Caulan.
Referitor la procentele n care se gsesc bazele complementare, pentru A+T se
nregistreaz valori cuprinse ntre 67,89% pentru haplotipurile Cag25ID, Ccuv i
CaxCyxCcuv i 68,29% pentru CagIMD, iar pentru C+G, valori cuprinse ntre 31,71%
(CagIMD) i 32,11% pentru secvenele Cag25ID, Ccuv i CaxCyxCcuv.
4.9.1. CARACTERIZAREA HAPLOTIPULUI CAGIMD
4.9.1.1. FRECVENELE TIPURILOR DE ASOCIERI NUCLEOTIDICE
n acest haplotip au fost ncadrate toate secvenele ntre care nu exist diferene
(Cag01I, Cag03I, Cag04I, Cag06I, Cag07I, Cag08I, Cag09I, Cag10I, Cag01M,
146
Cag02M, Cag03M, Cag04M, Cag05M, Cag06M, Cag07M, Cag08M, Cag09M,
Cag10M), aparinnd celor dou populaii luate n studiu, Larga-Jijia Movileni i Iai.
Din analiza procentelor dinucleotidelor, constatm c valoarea cea mai mare o au
perechile AA i AT (13,1%), iar valoarea cea mai mic perechea CG, n proporie de
0,4%. Referitor la trinucleotide, cea mai mare frecven o nregistreaz tripletele AAT
i TAA (4,9%), iar valoarea cea mai mic, tripletele AGC, CCG, CGG, CTG, GAT i
GTC, avnd o frecven de 0,4%. n plus, se constat lipsa trimerilor CGA, CGC,
CGT, GCC, GCG, GCT, GGC i TCG.
Tetramerul cu frecvena cea mai mare, este TATT (2,5%), iar cei cu frecven
redus se gsesc n procent de 1,2%. n cazul pentamerilor (Tabelul 99), cea mai
mare frecven o au pentamerii TTATT, TATTA, AACTA i AAATT (1,2%), iar toi
ceilali au frecvene foarte mici (0,8%). n ceea ce privete hexamerii, acetia au
frecvene cuprinse ntre 0,8% i 0,4%.
Tetramerii, pentamerii i hexamerii cu frecven joas (Tabelul 100), sunt cei care
se gsesc ntr-un singur exemplar n ntreaga gen, avnd o frecven de 0,4%.
Cu ajutorul modulului EditSeq al DNA Star, a fost calculat temperatura de topire
a ADN, dup un model Davis-Botstein-Roth; n acest caz, prezint o valoare de
75,87C.
4.9.2. CARACTERIZAREA HAPLOTIPULUI CAG25ID
4.9.2.1. FRECVENELE TIPURILOR DE ASOCIERI NUCLEOTIDICE
n acest haplotip, se ncadreaz dou secvene Cag02I i Cag05I din populaia
Iai. n plus, se poate constata c mutaia aprut n populaiile studiate, datorit
frecvenei cu care apare, este n curs de a fi fixat n genofondul acestora.
Din analiza procentelor dinucleotidelor, constatm c valoarea cea mai mare o are
perechea AA (13,1%), iar valoarea cea mai mic perechea CG, n proporie de 0,4%.
Referitor la trinucleotide, cea mai mare frecven o nregistreaz tripletul AAT (4,9%),
iar valoarea cea mai mic, tripletele AGC, CCG, CGG, CTG, GAT i GTC, avnd o
frecven de 0,4%. n plus, se constat lipsa trimerilor ACG, CGA, CGC, CGT, GAG,
GCC, GCG, GCT, GGC i TCG.
Tetramerii cu frecvena cea mai mare, sunt TATT, ATTA, ATAT, ACAT i AATT,
(2,1%), iar cei cu frecven redus se gsesc n procent de 1,2%. n cazul
pentamerilor (Tabelul 103), cea mai mare frecven o au pentamerii TATTA, ACTCA,
AACTA i AAATT (1,2%), iar toi ceilali au frecvene foarte mici (0,8%). n ceea ce
privete hexamerii, acetia au frecvene cuprinse ntre 0,8% i 0,4%.
Tetramerii, pentamerii i hexamerii cu frecven joas, sunt cei care se gsesc
ntr-un singur exemplar n ntreaga gen, avnd o frecven de 0,4%.
Cu ajutorul modulului EditSeq al DNA Star, a fost calculat temperatura de topire
a ADN, dup un model Davis-Botstein-Roth; n acest caz, prezint o valoare de
76,03C.
4.9.3. RELAII FILOGENETICE N CADRUL GENULUI CARASSIUS, BAZATE PE
DIFERENE ALE SECVENELOR D-LOOP
Ca i n cazul citocromului b, au fost utilizate metode care se bazeaz pe distane
i rata de substituie, dar care implic i mutaii de genul tranziiilor i transversiilor.
147
Astfel i n acest caz, au fost utilizate UPGMA (Figura 72) pe baza unui model
Tamura-Nei, metoda evoluiei minime (ME) dup un algoritm Neighbour-Joining
(Figura 73) i Maximum Parsimony (Figura 74).
Cag09M
Cag10M
Cag08M
Cag07M
Cag06M
Cag05M
Cag04M
Cag03M
Cag02M
Cag01M
Cag10I
Cag09I
Cag08I
Cag07I
Cag06I
Cag04I
Cag03I
Cag01I
Cag02I
Cag05I
Ccaras
CaxCy
Caulan
Cacuv
CaxCyxCc
0.01
Figura 72 Arbore filogenetic rectangular al genului Carassius, realizat prin metoda
UPGMA pe baza secvenelor d-loop
148
Cag02I
Cag05I
Cag10M
Cag09M
Cag08M
Cag07M
Cag06M
Cag01I
Cag03I
Cag04I
Cag06I
Cag07I
Cag08I
Cag09I
Cag10I
Cag01M
Cag02M
Cag03M
Cag04M
Cag05M
Ccaras
CaxCy
Caulan
Cacuv
CaxCyxCc
0.01
Figura 73 Arbore filogenetic rectangular al genului Carassius, realizat prin metoda ME pe
baza secvenelor d-loop
149
C
a
g
0
8
I
C
a
g
1
0
I
C
a
g
0
2
M
C
a
g
0
8
M
C
a
g
0
7
M
C
a
g
0
5
M
Cag06M
C
ag01I
C
a
g
0
7
I
C
a
g
0
6
I
C
a
g
0
2
I
C
a
g
0
5
I
C
a
g
0
1
M
C
a
g
0
3
M
C
a
g
0
9
M
C
a
g
0
9
I
C
a
g
0
4
M
C
a
g
1
0
M
C
a
g
0
3
I
C a g 0 4 I
C
c
a
ra
s
C
a
x
C
y
C
a
u
l
a
n
C
a
c
u
v
C
a
x
C
y
x
C
c
2
Figura 74 Arbore filogenetic circular al genului Carassius, realizat prin metoda MP pe
baza secvenelor d-loop
Ca i n cazul citocromului b, topologia arborilor obinui prin toate cele trei metode
este identic, evideniind gruparea taxonilor n categorii de similaritate precum i
treapta evolutiv a fiecrui grup. Astfel, se observ c specia Carassius auratus
langsdrfi provine din aceeai specie de origine ca i Carassius cuvieri, precum i
grupul din care au derivat speciile Carassius carasssius i Carassius gibelio. De
asemeni, se observ c hibrizii sunt situai n aceleai grupe cu speciile de origine.
150
4.10. COMPARAREA SECVENELOR NUCLEOTIDICE ALE GENEI CARE
DETERMIN SINTEZA ND4L DEHIDROGENAZEI, PROVENITE DE LA INDIVIZI
APARINND GENULUI CARASSIUS
Pentru subunitatea 4L a dehidrogenazei, n cazul speciilor genului Carassius, au
fost aliniate 20 de secvene provenite de la indivizi ai celor dou populaii luate n
studiu (Larga-Jijia Movileni i Iai), precum i secvene preluate din banca de gene
GenBank, provenite de la specii (Carassius carassius Ref. nr. AY714387 i Carassius
cuvieri Ref. nr. AB045144), subspecii (Carassius auratus langsdrfi Ref. nr.
AB006953) i hibrizi (Carassius auratus x Cyprinus carpio Ref. nr. AY694420 i
Carassius auratus x Cyprinus carpio x Carassius cuvieri Ref. nr. AY771781 ) ai
genului Carassius (Gorgan, 2004b; Gorgan i Cmpeanu, 2004f).
Alinierea s-a realizat, utiliznd metoda Clustal V (Higgins i Sharp, 1989) i a fost
verificat prin metoda Clustal W (Thompson et al., 1994), obinndu-se n ambele
cazuri acelai rezultat.
Din alinierea secvenelor, se constat existena a 51 diferene, dintre care 36 de
tranziii i 15 transversii, doar ntre secvenele preluate din banca de gene. De
asemeni, se constat c ntre secvene provenite din cele dou populaii analizate, nu
exist diferene, de unde putem concluziona innd cont i de numrul mic de mutaii
existent ntre celelalte secvene, c gena care codific informaia sintezei subunitii
4L a dehidrogenazei, este o gen conservativ, prezentnd un potenial mutagen
foarte sczut. Din cele discutate anterior, putem concluziona c a fost gsit un nou
haplotip (CagIMN) pentru gena ND4L, caracteristic speciei Carassius auratus gubelio,
din populaiile Iai i Movileni.
Pe baza comparaiei ntre secvene, s-a realizat Tabelul procentelor de similaritate
i divergen (Tabelul 47)., din care observm c procentele de similaritate pentru
haplotipul stabilit sunt de 97,7% din comparaia cu hibridul Carassius auratus x
Cyprinus carpio i 95,1% pentru comparaia cu secvena speciei Carassius auratus
langsdrfi.
151
Tabel 47 Procentele de similaritate i divergen pentru secvenele haplotipurilor stabilite
Procent de similaritate
P
r
o
c
e
n
t
d
e
d
i
v
e
r
g
e
n
CagI
MN
Cac
uv
Caul
an
Cax
Cy
Cax
Cyx
Ccu
v
Ccara
s
CagIMN 93,5 95,1 97,7 97,0 97,3
CagIM
N
Cacuv 6,8 93,5 93,9 94,7 94,3 Cacuv
Caulan 5,2 6,9 97,3 95,8 97,0 Caulan
CaxCy 2,3 6,5 2,7 98,5 99,6 CaxCy
CaxCyx
Ccuv
3,1 5,6 4,4 1,5 98,9
CaxCyx
Ccuv
Ccaras 2,7 6,1 3,1 0,4 1,2 Ccaras
CagI
MN
Cac
uv
Caul
an
Cax
Cy
Cax
Cyx
Ccu
v
Ccara
s
n plus, pentru a stabili o mai clar difereniere ntre toate noile haplotipuri, au fost
analizate numrul i procentele n care se gsesc bazele azotate n fiecare dintre
acestea (Tabel 48).
Tabel 48 Procentul bazelor azotate, n cadrul haplotipurilor stabilite
Baze
azotate
Specii analizate
CagIMN Ccaras Ccuv Caulan CaxCy CaxCyxCcuv
A
Nr, 64 59 57 59 60 59
% 24,52 22,61 21,84 22,61 22,99 22,61
G
Nr, 43 45 47 45 44 45
% 16,48 17,24 18,01 17,24 16,86 17,24
T
Nr, 78 80 79 78 80 81
% 29,89 30,65 30,27 29,89 30,65 31,03
C
Nr, 76 77 78 79 77 16
% 29,12 29,50 29,89 30,27 29,50 29,12
A+T
Nr, 142 139 136 137 140 140
% 54,41 53,26 52,11 52,49 53,64 53,64
C+G
Nr, 119 122 125 124 121 121
% 45,59 46,74 47,09 47,51 46,36 46,36
152
0
5
10
15
20
25
30
35 %
CagIMN Ccaras Ccuv Caulan CaxCy CaxCyxCcuv
Haplotip
A G T C
Figura 78 Graficul frecvenei bazelor azotate n cadrul haplotipurilor caracterizate
0
5
10
15
20
25
30
35
%
A G T C
Baze azotate
CagIMN Ccaras Ccuv Caulan CaxCy CaxCyxCcuv
Figura 79 Graficul frecvenei bazelor azotate, comparativ ntre haplotipurile analizate
Din Tabelul 48 i Figurile 78 - 79, constatm c, referitor la concentraia de
adenin se nregistreaz valori cuprinse ntre 24,52% pentru haplotipul populaiei Iai
i 21,84% pentru Carassius cuvieri. Cantitatea de guanin are valori cuprinse ntre
18,01% pentru Ccuv i 16,48% pentru haplotipul CagIMN. De asemeni, cantitatea de
153
timin, are valori cuprinse ntre 31,03% pentru hibridul Carassius auratus x Cyprinus
carpio x Carassius cuvieri i 29,89% pentru haplotipurile CagIMN i Caulan. Pentru
citozin, se nregistreaz valori cuprinse ntre 30,27% pentru Caulan i 29,12% pentru
secvenele CaugIMN i CyxCyxCcuv.
Referitor la procentele n care se gsesc bazele complementare, pentru A+T se
nregistreaz valori cuprinse ntre 54,41% pentru haplotipul CagIMN i 52,11% pentru
Ccuv, iar pentru C+G, valori cuprinse ntre 45,59% (CagIMN) i 47,51% pentru
secvena Caulan.
4.10.1. CARACTERIZAREA HAPLOTIPULUI CAGIMN
4.10.1.1. FRECVENELE TIPURILOR DE ASOCIERI NUCLEOTIDICE
n acest haplotip au fost ncadrate toate secvenele, aparinnd celor dou
populaii luate n studiu, Larga-Jijia Movileni i Iai.
Din analiza, procentelor dinucleotidelor constatm c valoarea cea mai mare o are
perechea TT (10,7%), iar valoarea cea mai mic perechea GT, n proporie de 1,1%.
Referitor la trinucleotide, cea mai mare frecven o nregistreaz tripletul TTT (4,2%),
iar valoarea cea mai mic, tripletele AGT, CGC, CGG, CGT, GAG, GAT, GCG, GTA,
TCG i TGT, avnd o frecven de 0,4%. Se constat c exist i trinucleotide lips:
AAA, ACG, GGG, GGT, GTC i GTG.
Tetramerul cu frecvena cea mai mare, este CCTA (2,7%), iar cei cu frecven
redus: TTTT, TTGC, TTCA, TTAT, TACT i TACA, toi n procent de 1,2%. n cazul
pentamerilor, cea mai mare frecven o are pentamerul CCCTA (1,5%), iar restul, au
valori de 1,2% - 0,8%. n ceea ce privete hexamerii, acetia au frecvene cuprinse
ntre 1,2% i 0,4%.
Tetramerii, pentamerii i hexamerii cu frecven joas, sunt cei care se gsesc
ntr-un singur exemplar n ntreaga gen, avnd o frecven de 0,4%.
Cu ajutorul modulului EditSeq al DNA Star, a fost calculat temperatura de topire
a ADN, dup un model Davis-Botstein-Roth; n acest caz, prezint o valoare de
81,68C.
4.10.1.2. TRANSLAIA I CARACTERIZAREA CATENEI POLIPEPTIDICE
Translaia s-a realizat pe baza unui cod genetic mitocondrial pentru vertebrate,
utiliznd modulul EditSeq din cadrul programului DNA Star.
Catena polipeptidic obinut este prezentat n Figura 80.
Figura 80 Catena polipeptidic a ND4L caracteristic haplotipului CagIMN
al speciei Carassius gibelio
Dup realizarea translaiei, se constat c ntreg lanul polipeptidic, este alctuit
din 87 aminoacizi (Tabelul 49), din care se observ c frecvena cea mai mare, o are
leucina (24,84%), iar cea mai sczut o au acidul glutamic i triptofanul (1,15%).
MTPVHFSFSS AFILGLMGLA FHRTHLLSAL LCLEGMMLSL FIALALWALQ
FESTGFSTAP MLLLAFSACE ASTGLALLVA TARTHGT
154
Tabel 49 Compoziia lanului polipeptidic
Aminoacizi
Numr
Procent din
greutatea total (%)
Frecvena
(%)
Simbol Nume
A Ala 13 9,99 14,94
C Cys 2 2,23 2,30
D Asp 0 0,00 0,00
E Glu 3 4,19 3,45
F Phe 8 12,73 9,20
G Gly 6 3,70 6,90
H His 4 5,93 4,60
I Ile 2 2,45 2,30
K Lys 0 0,00 0,00
L Leu 19 23,25 21,84
M Met 5 7,09 5,75
N Asn 0 0,00 0,00
P Pro 2 2,10 2,30
Q Gln 1 1,39 1,15
R Arg 2 3,38 2,30
S Ser 9 8,48 10,34
T Thr 8 8,75 9,20
V Val 2 2,14 2,30
W Trp 1 2,01 1,15
Y Tyr 0 0,00 0,00
B Asx 0 0,00 0,00
Z Glx 0 0,00 0,00
. Ter 0 0,00 0,00
Se constat c din totalul de 87 aminoacizi, 3 sunt acizi, 2 sunt bazici, 20 polari i
45 hidrofobi (Tabelul 50). De asemenea, se constat c lanul polipeptidic are o
sarcin electric de -0,48 (la pH=7) i un punct izoelectric de 6,74 (Figura 81).
Tabel 50 Caracterizarea lanului polipeptidic
Greutate
molecular
(Daltoni)
Numr de
aminoaciz
i
Aminoacizi
Punct
izoelectri
c
Sarcina
electric
la
pH=7
Concentrai
a la o
extincie =1
i =280nm
Puterni
c bazici
Puterni
c acizi
Hidrofob
i
Polar
i
9247,07 87 2 3 45 20 6,736 -0,479 1,56
155
Figura 81 Curba de titrare pentru lanul polipeptidic al ND4L, haplotip CagIMN
al speciei Carassius gibelio
Ulterior, a fost realizat o analiz a structurii proteinei, fiind determinate zonele
alfa helicoidale, beta pliate i de inflexiune, prin dou metode Garnier-Robson
(Garnier et al., 1978) i Chou-Fasman (Chou i Fasman, 1978); reprezentarea grafic
a zonelor hidrofobe (Kyte i Doolittle, 1982), zonele de flexie (Karplus i Schultz,
1985), indexul antigenic (Jameson i Wolf, 1988) i graficul probabil al suprafeei
(Emini et al., 1985).
Din analiza structurii lanului polipeptidic, se poate observa c referitor la regiunile
alfa helicoidale, pentru ambele metode, sunt date ca fiind 2 astfel de zone. De
asemenea, pentru regiunile beta pliate, se constat existena unei singure regiuni, n
cazul ambelor metode. Referitor la zonele de inflexiune, comparativ pentru cele dou
metode, se constat c pentru prima metod (GarnierRobson), sunt prezentate 2
regiuni, iar prin a doua metod (Chou-Fasman), sunt date 3 astfel de regiuni.
Pe baza graficului hidrofobicitii, realizat dup un model Kyte-Doolitle (Kyte i
Doolittle, 1982), se constat c exist 6 zone hidrofobe i 4 zone hidrofile.
Din graficul indexului antigenic, calculat pe baza modelului Jameson Wolf
(Jameson i Wolf, 1988), se constat existena a 9 regiuni cu potenial antigenic.
4.10.2. RELAII FILOGENETICE N CADRUL GENULUI CARASSIUS, OBINUTE
PRIN ANALIZA SECVENELOR GENEI ND4L
n acest caz, arborii filogenetici au fost realizai utiliznd aceleai metode UPGMA
pe baza modelului Tamura-Nei (Figura 82) i Minimum Evolution, pe baza unui
algoritm Neighbour-Joining (Figura 83) i Maximum Parsimony (Figura 84).
156
CAG01M
CAG09M
CAG06I
CAG04I
CAG05I
CAG08M
CAG08I
CAG10M
CAG02M
CAG03M
CAG07I
CAG06M
CAG10I
CAG05M
CAG09I
CAG04M
CAG01I
CAG07M
CAG02I
CAG03I
CAXCYXCC
CAXCY
CCARAS
CAULAN
CCUV
0.005
Figura 82 Arbore filogenetic al genului Carassius, realizat prin metoda UPGMA
pe baza secvenelor ND4L
157
CAG01I
CAG02I
CAG03I
CAG04I
CAG05I
CAG06I
CAG07I
CAG08I
CAG09I
CAG10I
CAG01M
CAG02M
CAG03M
CAG04M
CAG05M
CAG06M
CAG07M
CAG08M
CAG09M
CAG10M
CAXCYXCC
CAXCY
CCARAS
CAULAN
CCUV
0.005
Figura 83 Arbore filogenetic al genului Carassius, realizat prin metoda ME
pe baza secvenelor ND4L
158
C
A
G
0
7
I
C
A
G
0
8
I
C
A
G
0
2
I
C
A
G
0
5
M
C
A
G
1
0
M
C
A
G
1
0
I
CAG06I
CAG08M
C
A
G
0
2
M
C
A
G
0
4
M
C
A
G
0
7
M
C
A
G
0
6
M
C
A
G
0
1
I
C
A
G
0
9
M
C
A
G
0
5
I
C
A
G
0
3
I
C
A
G
0
4
I
C
A
G
0
1
M
C
A
G
0
3
M
CAG09I
C
A
X
C
Y
X
C
C
C
A
X
C
Y
C
C
A
R
A
S
C
A
U
L
A
N
C
C
U
V
2
Figura 84 Arbore filogenetic al genului Carassius, realizat prin metoda ME
pe baza secvenelor ND4L
Din Figurile 83 i 84, pe baza diferenelor dintre secvene i a sumei lungimilor
braelor, se constat c individul a crui secven a fost preluat din banca de gene,
provine dintr-un nod comun ancestral, cu ramurile din care au evoluat speciile celor
dou populaii. De asemeni, pentru cele dou populaii analizate, se observ c
indivizii acestora se grupeaz difereniat. Se constat din cele dou figuri, c exist
diferene n cadrul arborelui, date de poziiile ramurilor interioare, dar care nu prezint
o importan la fel de mare ca topologia (aspectul general al arborelui), care rmne
neschimbat i care ne furnizeaz informaile necesare pentru direciile filogenetice
ale haplotipului analizat.
4.11. DIRECII EVOLUTIVE N CADRUL FAMILIEI CYPRINIDAE
Acest subcapitol se dorete a fi o sintez a datelor de ordin molecular prezentate
anterior i mai exact o cumulare a direciilor evolutive ale speciilor aparinnd la cele
dou genuri. n acest sens, au fost analizate liniile de evoluie caracteristice fiecrui
159
gen, cu decelarea speciilor de origine, difereniat, pentru fiecare dintre cele trei gene
secveniate, deci pentru trei regiuni diferite ale ADNmt. Astfel, pentru citocromul b n
cazul celor dou genuri, Carassius i Cyprinus, au fost trasai arborii filogenetici,
utiliznd cele trei metode menionate i n capitolele anterioare UPGMA (Figura 85),
Minimum Evolution (Figura 86) i Maximum Parsimony (Figura 87).
C
a
g
0
9
M
C
a
g
1
0
M
C
a
g
0
8
M
C
a
g
0
7
M
C
a
g
0
5
M
C
a
g
0
4
M
C
a
g
0
2
M
C
a
g
0
1
M
C
a
g
1
0
I
C
a
g
0
9
I
C
ag08I
Cag06I
Cag05I
C
a
g
0
4I
C
a
g
0
3
I
C
a
g
0
2
I
C
a
g
0
1
I
C
a
g
0
7
I
C
a
g
0
3
M
C
a
x
C
y
C
c
a
r
a
s
C
a
u
l
a
n
C
c
u
v
C
a
x
C
y
x
C
u
v
C
y
0
6
M
C
y
0
1
M
C
y
0
4
M
C
y
0
4
I
C
y
0
3
M
C
y
0
1
I
C
y
0
2
I
C
y
0
3
I
C
y
0
5
I
C
y06I
Cy07I
Cy08I
C
y
0
9
I
C
y
1
0
I
C
y
0
2
M
C
y
0
5
M
C
y
0
7
M
C
y
0
8
M
C
y
0
9
M
C
y
1
0
M
0.01
Figura 85 Arbore filogenetic circular realizat pe baza secvenelor citocromului b, pentru
cele dou genuri analizate, prin metoda UPGMA
160
Cag09M
Cag10M
Cag08M
Cag07M
Cag05M
Cag04M
Cag02M
Cag01M
Cag10I
Cag09I
Cag08I
Cag06I
Cag05I
Cag04I
Cag03I
Cag02I
Cag01I
Cag07I
Cag03M
CaxCy
Ccaras
Caulan
Ccuv
CaxCyxCuv
Cy06M
Cy01M
Cy04M
Cy04I
Cy03M
Cy01I
Cy02I
Cy03I
Cy05I
Cy06I
Cy07I
Cy08I
Cy09I
Cy10I
Cy02M
Cy05M
Cy07M
Cy08M
Cy09M
Cy10M
0.01
Figura 86 Arbore filogenetic realizat pe baza secvenelor citocromului b, pentru cele dou
genuri analizate, prin metoda ME
161
Cag03I
Cag01M
Cag07M
Cag06I
Cag05I
Cag10M
Cag08I
Cag02M
Cag04M
Cag09M
Cag05M
Cag04I
Cag10I
Cag08M
Cag09I
Cag02I
Cag07I
Cag01I
Cag03M
CaxCy
Ccaras
Caulan
Ccuv
CaxCyxCuv
Cy06M
Cy10M
Cy09I
Cy03M
Cy04I
Cy06I
Cy07I
Cy01M
Cy04M
Cy02M
Cy01I
Cy08I
Cy05I
Cy05M
Cy02I
Cy03I
Cy09M
Cy07M
Cy10I
Cy08M
10
Figura 87 Arbore filogenetic realizat pe baza secvenelor citocromului b, pentru cele dou
genuri analizate, prin metoda MP
162
Referitor la direciile evolutive, trasate pe baza secvenelor citocromului b, se
costat n toate cele trei cazuri, c specia Carassius gibelio a evoluat n paralel, dintr-
un nod filogenetic comun, cu specia Carassius carassius. De asemeni, se constat c
ambele au provenit dintr-o specie ancestral comun, din care s-au difereniat i
speciile Carassius auratus langsdrfi i Carassius cuvieri; n plus aceast specie este
foarte apropiat de speciile genului Cyprinus.
n cazul speciilor genului Cyprinus, se constat c direciile evolutive sunt mai
restrnse, probabil i datorit numrului mic de specii utilizat pentru analiz. Cu toate
acestea, constatm c individul de crap oglind (Cy06M) este cel mai apropiat
filogenetic de speciile genului Cyprinus, ceea ce ne demonstreaz faptul c este
obinut prin hibridare dintr-o specie ancestral comun, din care provin i restul
indivizilor. n plus, se constat iniierea unei noi direcii evolutive n cazul haplotipului
Cy0104M (dat de cele dou secvene Cy01M i Cy04M), care poate constitui la rndul
su un nod filogenetic pentru viitoare linii evolutive.
Pentru analiza filogenetic a regiunii de control mitocondrial au fost folosite
secvene de nucleotide comune celor dou genuri, avnd lungimi de 246pb.
Din arborele reprezentat n Figura 88, realizat pe baza UPGMA dup un model
Tamura-Nei, constatm i n acest caz c specia Carassius gibelio provine ditr-un nod
evolutiv comun cu specia Carassius carassius. n plus, din Figurile 88 i 89, observm
c pentru regiunea de control mitocondrial, o specie ancestral, care a evoluat
monofiletic, poate fi considerat specia Carassius cuvieri. Figura 90, n schimb, ne
sugereaz c speciile Carassius cuvieri i Carassius auratus langsdrfi, provin dintr-
un nod filogenetic comun. Referitor la speciile genului Cyprinus, ca i n cazul arborilor
realizai pe baza secvenelor citocromului b, se constat c individul de crap oglind
se difereniaz evolutiv de restul indivizilor aparinnd tipului slbatic, fiind urmat pe
scara evolutiv de individul Cy05M, aparinnd aceleiai populaii Movileni.
Din arborii realizai pe baza secvenelor ND4L, se observ c pentru aceast
regiune, specia Carassius cuvieri a evoluat monofiletic dintr-un nod filogenetic comun,
din care au evoluat i celelalte specii (Figurile 91 - 93). De asemeni, se consider n
cazul metodei MP, c speciile Carassius auratus langsdrfi i Carassius carassius,
deriv dintr-un hibrid interspecific (Carassius aurats x Cyprinus carpio). Pentru
aceast regiune, speciile genului Cyprinus se afl pe acelai palier evolutiv,
difereniindu-se doar individul a crui secven a fost preluat din banca de gene.
163
Cag09M
Cag10M
Cag08M
Cag07M
Cag06M
Cag05M
Cag04M
Cag03M
Cag02M
Cag01M
Cag10I
Cag09I
Cag08I
Cag07I
Cag06I
Cag04I
Cag03I
Cag01I
Cag02I
Cag05I
CaxCy
Ccaras
Caulan
Cacuv
CaxCyxCc
Cy06M
Cy05M
Cy01I
Cy02I
Cy03I
Cy04I
Cy05I
Cy06I
Cy07I
Cy08I
Cy09I
Cy10I
Cy01M
Cy02M
Cy03M
Cy04M
Cy07M
Cy08M
Cy09M
Cy10M
Cy GB
0.05
Figura 88 Arbore filogenetic realizat pe baza secvenelor d-loop, pentru cele dou genuri
analizate, prin metoda UPGMA
164
Cag02I
Cag05I
Cag10M
Cag09M
Cag08M
Cag07M
Cag06M
Cag05M
Cag04M
Cag03M
Cag02M
Cag01M
Cag10I
Cag09I
Cag08I
Cag07I
Cag04I
Cag03I
Cag01I
Cag06I
Caulan
CaxCy
Ccaras
Cacuv
CaxCyxCc
Cy06M
Cy05M
Cy01I
Cy02I
Cy03I
Cy04I
Cy05I
Cy06I
Cy07I
Cy08I
Cy09I
Cy10I
Cy01M
Cy02M
Cy03M
Cy04M
Cy07M
Cy08M
Cy09M
Cy10M
Cy GB
0.05
Figura 89 Arbore filogenetic realizat pe baza secvenelor d-loop, pentru cele dou genuri
analizate, prin metoda ME
165
Cag01I
Cag02M
Cag03I
Cag05M
Cag10M
Cag07M
Cag08I
Cag06M
Cag10I
Cag04I
Cag06I
Cag02I
Cag05I
Cag04M
Cag03M
Cag09M
Cag01M
Cag08M
Cag07I
Cag09I
CaxCy
Ccaras
Caulan
Cacuv
CaxCyxCc
Cy06M
Cy05M
Cy07I
Cy06I
Cy GB
Cy09I
Cy08M
Cy01I
Cy03I
Cy08I
Cy02I
Cy04I
Cy09M
Cy02M
Cy04M
Cy10M
Cy07M
Cy03M
Cy10I
Cy05I
Cy01M
10
Figura 90 Arbore filogenetic realizat pe baza secvenelor d-loop, pentru cele dou genuri
analizate, prin metoda MP
166
Cag02I
Cag10M
Cag04I
Cag04M
Cag07I
Cag01M
Cag02M
Cag08I
Cag06M
Cag03M
Cag09I
Cag09M
Cag01I
Cag05I
Cag03I
Cag06I
Cag05M
Cag10I
Cag07M
Cag08M
CaxCyxCcuv
CaxCy
Ccaras
Caulan
Ccuv
Cy GB
Cy05I
Cy09I
Cy01I
Cy04M
Cy01M
Cy03M
Cy08I
Cy02M
Cy02I
Cy07M
Cy08M
Cy04I
Cy06I
Cy09M
Cy10I
Cy05M
Cy03I
Cy07I
Cy06M
Cy10M
0.02
Figura 91 Arbore filogenetic realizat pe baza secvenelor ND4L, pentru cele dou genuri
analizate, prin metoda UPGMA
167
Cag03M
Cag04M
Cag02M
Cag01M
Cag10I
Cag09I
Cag08I
Cag07I
Cag06I
Cag05I
Cag04I
Cag03I
Cag02I
Cag01I
Cag05M
Cag06M
Cag07M
Cag08M
Cag09M
Cag10M
Caulan
CaxCy
Ccaras
CaxCyxCcuv
Ccuv
Cy GB
Cy01I
Cy02I
Cy03I
Cy04I
Cy05I
Cy06I
Cy07I
Cy08I
Cy09I
Cy10I
Cy01M
Cy02M
Cy03M
Cy04M
Cy05M
Cy06M
Cy07M
Cy08M
Cy09M
Cy10M
0.02
Figura 92 Arbore filogenetic realizat pe baza secvenelor ND4L, pentru cele dou genuri
analizate, prin metoda ME
168
Cag01I
Cag04I
Cag04M
Cag05M
Cag10I
Cag08I
Cag06M
Cag03I
Cag09M
Cag06I
Cag07M
Cag08M
Cag10M
Cag02I
Cag07I
Cag03M
Cag02M
Cag09I
Cag05I
Cag01M
CaxCyxCcuv
Caulan
CaxCy
Ccaras
Ccuv
Cy GB
Cy02M
Cy09M
Cy09I
Cy02I
Cy10I
Cy07I
Cy08M
Cy04M
Cy05M
Cy01I
Cy03M
Cy06I
Cy01M
Cy03I
Cy08I
Cy05I
Cy06M
Cy07M
Cy04I
Cy10M
5
Figura 93 Arbore filogenetic realizat pe baza secvenelor ND4L, pentru cele dou genuri
analizate, prin metoda MP
169
BIBLIOGRAFIE
1. ABILOCK MARIA, STEPHENSON F. H., 2001 - Mitochondrial DNA as a
Molecular Clock, In Mitochondrial DNA Sequencing Student Guide. Ed. Applied
Biosystems, p. 1 25.
2. ACKERFORS, H., 1989 A regional survey on the acvaculture sector in eastern
and northwestern Europe din Aquacult. dev. and coord. progr. ADCP. REP. p.
38 89.
3. ALVES M. J., COELHO M. M., COLLARES-PEREIRA M. J., 1997a The Rutilus
alburnoides complex (Cyprinidae): evidence for a hybrid origin. J. Zool. Syst.
Evol. Res., Nr. 35, p. 1 10.
4. ALVES M. J., COELHO M. M., COLLARES-PEREIRA M. J., DOWLING T. E.,
1977b Maternal ancestry of the Rutilus alburnoides complex (Teleostei,
Cyprinidae) as determined by analysis oh cytochrome b sequences. Evolution
Nr. 51, 1584 1592.
5. ANDERSON E., STEBBINS G. L., 1954 Hybridization as an evolutionary
stimuls, Evolution, Nr. 8, p. 378 388.
6. APETROAEI, MARIA, PRICOPE, F., 1998 Cercetri privind obinerea unor
hibrizi de salmonide din genitori cu perioade de reproducere diferite Lucrrile
Simpozionului Internaional AQUAROM '98 Galai, p. 322 323.
7. ARNOLD S. J., PFRENDER M. E., JONES A. G., 2001 The adaptative
landscape as a conceptual bridge between micro- and macroevolution, n
Genetica nr. 112 113, p. 9 32.
8. ATCHLEY W. R., FITCH W. M., BRONNER-FRASER M., 1994 Molecular
evolution of the MyoD family of transcription factors, Proc. Natl. Acad Sci., USA,
Nr. 91, p. 11522 11526. Atteson K., 1999 - The performance of the neighbor-
joining methods of phylogeneticreconstruction, n Algorithmica nr. 25, p. 251
278.
9. AUSUBEL, F. M., BRENT, R., KINGSTON R. E., MOORE D. D., SEIDMAN J.
G., SMITH J. A., STRUHL K., 1992 Short protocols in molecular biology, 3-rd
Edition, cap. 2 Preparation and analysis of DNA, Ed. by John Wiley & Sons,
Inc., p. 2-3 2-5.
10. AUSUBEL F. M., BRENT R., KINGSTON R. E., MOORE D. D., SEIDMAN J. G.,
SMITH J. A., STRUHL K., 1995. Current protocols in molecular biology, vol. 1,
cap. 2 Preparation and analysis of DNA. Phenol extraction and ethanol
precipitation of DNA, Ed by John Wiley & Sons, Inc., p. 2.1.1. 2.1.3.
11. BADER D., MORET B., YAN M., 2001 A linear-time algorithm for computing in-
version distance between signed permutations with an experimental study, n J.
Comput. Biol., nr. 8 (5), p. 483 491.
12. BAFNA V., PEVZNER P., 1995 - Sorting permutations by transpositions, n Proc.
6th Ann. ACM/SIAM Symp. Discrete Algs. (SODA'95). SIAM Press,
Philadelphia, p. 614 623.
170
13. BARNDORFF-NIELSEN O., 1983 On a formula for the distribution of the
maximum likelihood estimator, n Biometrika Nr. 70, p. 343-365.
14. BNRESCU P., 1964 Fauna Republicii Populare Romne Pisces-
Osteichthyes (Peti ganoizi i osoi), vol. XIII, , Editura Academiei Republicii
Populare Romne, Bucureti, p. 297-503
15. BNRESCU P., 1973 Some reconsiderations on the zoogeography of the
Euro-mediterranean freshwater fish fauna, Rev. Roum. Biol. Zool. Nr. 18, p.
257-264.
16. BNRESCU P., 1975 Orientri moderne n taxonomia i sistematica
animal. Probleme actuale de biologie I, , Editura Didactic i Pedagogic,
Bucureti, p. 5 20.
17. BNRESCU P., 1989 Zoogeography and history of the freshwater fish fauna
of Europe. In The freshwater fishes of Europe, vol. 1, Ed. J. Holeik, Wiesbaden:
AULA, p. 88-107.
18. BNRESCU P., 1992 Distribution and dispersal of freshwater animals in
North America and Eurasia. Zoogeography of fresh-waters: distribution and
dispersal of freshwater animals. n North America and Eurasia, vol. 2,.
Wiesbaden: AULA, p. 519-1091.
19. BNRESCU P., Coad B. W., 1991 Cyprinids of Eurasia n Cyprinid fishes
Systematics, biology and exploitation Ed. I. J.Winfield & J. S. Nelson,. London:
Chapman &Hall, p. 127-155.
20. BRA I. I., 1996 Vademecum n genetic, Editura Corson, Iai, p.136 138.
21. BEERLI P, FELSENSTEIN J., 1999 Maximum-likelihood estimation of
migration rates and effective population numbers in two populations using a
coalescent approach, n Genetics, Nr. 152, p. 763 773.
22. BENDER M., GE D., HE S., HU H., PINTER R., SKIENA S., SWIDAN F., 2004 -
Improved bounds on sorting with length-weighted reversals, n: Proc. 15th Ann.
ACM/SIAM Symp. Discrete Algs. (SODA'04). SIAM Press, Philadelphia, p. 912
921.
23. BENSCH S., HASSELQUIST D., 1999 Phylogeographic population structure of
great reed warblers: an analysis of mtDNA control region sequences. Biol. Jour.
Linn. Soc. Nr. 66, p. 171 185.
24. BERNATCHEZ L., 2001 The evolutionary history of brown trout (Salmo trutta
L.) inferred from phylogeographic, nested clade, and mismatch analyses of
mitochondrial DNA variation, n Evolution, nr. 55(2), p. 351 379.
25. BERREBI P., 1995 Speciation of the genus Barbus in the north mediterranean
basin: recent advances from biochemical genetics. Biol. Conserv., Nr. 72, p.
237 249.
26. BERREBI P., KOTTELAT M., SKELTON P., RAB P., 1996 Systematics of
barbus: state of the art and heuristic comments Folia Zool., Nr. 45, p. 5 12.
27. BERREBI P., KRAIEM M. M., DOADRIO I., EL-GHARBI S., CATTANEO-
BERREBI G., 1995 Ecological and genetic differentiation of Barbus callensis
populations (Teleostei, Cyprinidae) in Tunisia. J. Fish. Biol., Nr. 47, p. 850
864.
28. BIDWELL C. A., CHRISMAN C. L., LIBEZ G. S., 1985 Aquaculture, 51, (1), p.
25 33.
29. BILLARD R., 1980 L`tang et l`agriculture des eaux I.N.R.A., Publ. Paris, pag.
15 28.
30. BIRKY W. C., 2001 The inheritance of genes in mitochondria and chloroplasts:
Laws, Mechanisms and models. n Annu. Rev. Genet., Nr. 35, p. 125 148.
171
31. BLOOMER P., IMPSON N. D., 2000 Mitochondrial DNA differentiation in the
critically endangered berg river redfin. Journal of Heredity, Nr. 91, p. 122 127.
32. BOESIGER E., 1970 L`hybridation facteur de l`volution, Science, Progrs,
Dcouverte, 3426, p. 30 35.
33. BOGOESCU C., DABIJA A., SANIELEVICI E., 1980 Atlas zoologic, Editura
Didactic i Pedagogic, Bucureti, p. 112 137.
34. BONGERS A. B. J., VELD E. P. C., ABO-HASHEMA K., BREMMER I. M.,
EDING E. H., KOMEN J., RICHTER C. J. J., 1994 Aquaculture, 122, 2/3, p.
119 133.
35. BOORE J., COLLINS T., STANTON D., DAEHLER L., BROWN W., 1995
Deducing the pattern of arthropod phylogeny from mitochondrial DNA
rearrangements., Nature nr. 376, p. 163 165.
36. BOORE J., BROWN W., 1998 - Big trees from little genomes: Mitochondrial
gene orderas a phylogenetic tool, n Current Opinion in Genet and
Development, nr. 8 (6), p. 668 674.
37. BOTEZ SANDA, 1967 Ce sunt hibrizii?, Editura tiinific, Bucureti p.32 66.
38. BOURQUE G., PEVZNER P., 2002 - Genome-scale evolution: reconstructing
gene orders in the ancestral species, n Genome Research nr. 12, p. 26 36.
39. BRAWLEY SUSAN , 1999 Submission and retrieval of an aligned set of nucleic
acid sequences J. Phycol. Nr. 35, p. 433 437.
40. BRUNO W. J., 2000 Weighted Neighbor Joining: A Fast Approximation to
Maximum-Likelihood Phylogeny Reconstruction, n Mol. Biol. Evol., nr. 17(1), p.
189-197.
41. BRUNO W. J., SOCCI N. D., HALPERN A. L., 2000 Weighted neighbor joining:
A likelihood-based approach to distance-based phylogeny reconstruction, n
Mol. Biol. Evol., nr. 17 (1), p. 189 197.
42. BRYANT D., 2000 The complexity of calculating exemplar distances. n: Sanko
D., Nadeau J. (Eds.), Comparative Genomics: Empirical and Analytical
Approaches to Gene Order Dynamics, Map Alignment, and the Evolution of
Gene Families. Kluwer Academic Pubs. Dordrecht, Netherlands, p. 207 212.
43. BRYANT D., WADDELL P., 1998 Rapid evaluation of least-squares and
minimum-evolution criteria on phylogenetic trees, n Mol. Biol. Evol., nr. 15 (10),
p. 1346 1359.
44. BUNI TH., 1971 Atlasul petilor din apele R.S.R. Romnia, Edit. Ceres,
Bucureti, p. 7 50.
45. CARAIMAN GH., 1982 Creterea intensiv a puilor de crap (Cyprinus carpio)
n condiiile eutrofizrii dirijate a heleteielor n anul 1981, Bulet. de cercetri
piscicole, Anul IV (XXXV), Nucet Dmbovia, Nr. 1 2, p. 35 36.
46. CARBONARI M, SBARIGIA D, CIBATI M, FIORILLI M., 1993 Optimization of
PCR performance Department of Clinical Immunology, University of Rome La
Sapienza, Italy. Trends Genet. Nr. 9(2), p. 42 43.
47. CARMONA J. A., SANJUR O., DOADRIO I., MACHORDOM A., VRIJENHOEK
R., 1997 Hybridojenetic reproduction and maternal ancestry of polyploid
european fish: the Tropidophoxinellus alburnoides complex. n Genetics Nr.
146, p. 983 993.
48. CASTRESANA J., 2000 Selection of conserved blocks form multiple
Alignments for their use in phylogenetic analysis. Mol. Biol. Evol. Nr. 17 (4), p.
540 552.
49. CAVALI-SFORZA L. L., EDWARDS A. W. F., 1964 Analysis of human
evolution. n Proc. 11th Intl. Cong. Genet., Pergamon, New York, p. 923 933.
172
50. CAVALI-SFORZA L. L., EDWARDS A. W. F., 1967 Phylogenetic analysis:
Models and estimation procedures. Am. J. Hum. Genet., Nr. 19, p. 233 257.
51. CAVENDER T., COBURN M., 1992 Phylogenetic relationships of North
American Cyprinidae, n Systematics, historical ecology, andNorth American
freshwater fishes (Editat de R. Mayden), p. 293 327, Stanford University
Press.
52. CHANDRASEKHARAN U. M., SANKER S., GLYNIAS M. J., KARNIK S. S.,
HUSAIN A., 1996 Angiotensisn II-forming activity in a reconstructed ancestral
chymase. Science Nr. 271, p. 502 505.
53. CHANG Y. S., HUANG F. L., LO T. B., 1994 The complete nucleotide
sequence and gene organization of carp (Cyprinus carpio) mitochondrial
genome, J. Mol. Evol., Nr. 38, p. 138 155.
54. CHARLESWORTH D., 1981 The cost of meiosis with alternation of sexual and
asexual gnerations, J. Theor., Biol., 87, p. 517 528.
55. CHAUDHURI P., DAS S., 2002 Swords: a statistical tool for analysing large
DNA sequences. J. Biosci, vol. 27, nr. 1, p. 1 6.
56. CHEN X. L., YUE P. Q., LIN R. D., 1984 Major groups within the family
Cyprinidae and their phylogenetic relationships, Acta Zootaxon. Sin.; Nr. 9, p.
424 440.
57. CHEN S. J., DILL K. A., 2000 RNA folding energy landscapes, PNAS, Nr. 2, p.
646 651.
58. CHERFAS N. B., 1975 Investigation of radiation-induced diploid gynogenesys
in the carp Cyprinus carpio L.. Experiment son obtaining the diploid gynogenetic
progeny in mass quantities. Genetika, Nr. 11 (7), p. 78 86.
59. CHERFAS N. B., GOMELSKY B. I., EMELYANOVA O. V., RECOUBRATSKY A.
V., 1994 Induced diploid gynogenesis and polyploidy in crucian carp
Carassius auratus gibelio (Block) x common carp Cyprinus carpio L. Hybrids,
Aquaculture Research Issue, vol. 25 nr. 9; p.943 955.
60. CHERFAS N. B., HULATA G., GOMELSKY B. I., BEN-DOM N., PERETZ Y.,
1995 Chromosome set manipulation in the common carp (Cyprinus carpio),
Aquaculture, 129 (1-4), p. 271 281.
61. CHERFAS N. B., HULATA G., KOZINSKY O., 1993 Gynogenesis in common
carp IV Growth, phenotypic variation and gonad differentiation in normal and
methyltestosterone treated homozygous clones and F1 hybrids. 2. Timing of
heat shock during the first cleavage. Aquaculture, 111, (1 4); 271 281.
62. CHOU P. Y., FASMAN G. D., 1978 Prediction of the secondary structure of
proteins from their amino acid sequence. Adv. Enzymol., nr. 47, p. 45-148.
63. CHOURROUT, D., CHVASSNE, B., GYYOMARD, R., 1986 Lamelioration
genetique des poissons, din La recherche nr. 180, vol. 17, 1028 1038.
64. CLAYTON D. A., 1982 Replication of animal mitochondrial DNA. n Cell Nr. 28,
p. 693 705.
65. COCOLIN L., D`AGARO E., MANZANO M., LANARI D., COMI G., 2000 Rapid
PCR-RFLP method for the identification of marine fish fillets. n Journal of Food
Science, vol 65, nr. 8, p. 1315 1317.
66. COELHO M. M., 1992 Genetic differentiation in the Iberian Cyprinids
Chondrostoma polylepis Steinchdaner, 1885 and Ch. willkommii Steinchdaner
1866, Arch. Hydrobiol. Nr. 125, p. 487 498.
67. COELHO M. M., BRITO R. M., PACHECO T. R., FIGUEIREDO D., PIRES A. M.,
1995 Genetic variation anddivergence of L. pyrenaicus and L. caroliterlii
(Pisces, Cyprinidae). J. Fish Biol., Nr. 47, p. 243 258.
173
68. COSNER M., JANSEN R., MORET B., RAUBESON L., WANG L., WARNOW T.,
WYMAN S., 2000 A new fast heuristic for computing the breakpoint phylogeny
and experimental phylogenetic analyses of real and synthetic data. n: Proc. 8th
International Conf. on Intelligent Systems for Mol. Biol. p. 104 115.
69. CRISTEA M., 1991 Genetica ecologic i evoluia, Ed. Ceres, Bucureti, p. 24
36.
70. DANZMANN R. G., GHARBI K., 2001 Gene mapping in fishes: a means to an
end, n Genetics, nr. 111, p. 3 23.
71. DAY W., 1983 Computationally di_cult parsimony problems in phylogenetic
systematics, n Journal of Theoretical Biology nr. 103, p. 429 438.
72. DAYHOFF M. O., SCHWARTZ R. M., ORCUTT B. C., 1978 A model of
evolutionary change in proteins, In Atlas of protein sequence and structure (M.
O. Dayhoff, ed.), National Biomedical Research Foundation , Silver Spring ,
MD., p. 345 352.
73. DESPER R., GASCUEL O., 2004 Theoretical Foundation of the Balanced
Minimum Evolution Method of Phylogenetic Inference and Its Relationship to
Weighted Least-Squares Tree Fitting n Mol. Biol. Evol., vol 21, nr. 3, p. 587 -
598.
74. DILL W., 1988 The inland fisheries of Israel, din The Israeli gomn. of Aquac.,
Bamidgeh, nr. 403, p. 75 104.
75. DOADRIO I., 1990 Phylogenetic relationships and classification of west
palearctic species of the genus Barbus (Osteichthyes, Cyprinidae). Aquat.
Living Resour. Nr. 3, p. 265-282.
76. DOBZHANSKY TH., 1970 Genetics of the evolutionary process, Columbia
Univ. Press, New York, p. 391 393.
77. DOBZHANSKY TH., AYALA F. J., STEBBINS L. G., VALENTINE J. W., 1977
Evolution, W. H. Ferman and Comp., San Francisco, p. 72 75.
78. DOBZHANSKY TH., BOESIGER E., 1968 Essais sur l`volution, Masson et
CieEditeurs, Paris, p. 61.
79. ECK R. V., DAYHOFF M. O., 1966 Atlas of protein sequence and structure
National Biomedical Research Foundation, (abstract).
80. EDWARDS A. W. F., CAVALLI-SFORZA L. L., 1963 The reconstruction of
evolution. n Heredity Nr. 18, p. 553.
81. EFRON B., 1982a Maximum likelihood and decision theory, n Annals of
Statistics, Nr.10, p. 340-356.
82. EFRON B., 1982b The jackknife, the bootstrap and other resampling plans,
Society for Industrial and Applied Mathemathics, Philadelphia, PA., p. 38.
83. EFRON B., TIBSHIRANI R. J., 1993 An introduction to the bootstrap. Ed.
Chapman & Hall, New York, p. 193 274.
84. EL-MABROUK N., 2000 Genome rearrangement by reversals and insertions-
deletions of contiguous segments, n Proc. 11th Ann. Symp. Combin. Pattern
Matching Vol. 1848 of Lecture Notes in Computer Science. Springer Verlag, p.
222 234.
85. EMINI E. A., HUGHES J., PERLOW D., BOGER J., 1985 Induction of hepatitis
A virus-neutralizing antibody by a virus-specific synthetic peptide. n J. Virology
Nr. 55, p. 836 839.
86. FEIDER Z., GROSSU V. AL., GYURKO T., POP V., 1964 Zoologia
vertebratelor,; Editura Didactic i Pedagogic, Bucureti, p.182-253.
87. FELSENSTEIN J., 1981 Evolutionary trees from DNA sequences: A maximum
likeli-hood approach, n J. Mol. Evol. nr. 17, p. 368 376.
174
88. FELSENSTEIN J., 1981 Numerical methods for inferring evolutionary trees.
Quart. Rev. Biol., Nr. 57, p. 379 404.
89. FINK S. V., FINK W. L., 1996 Interrelationships of Ostariophysan fishes, n
Interrelationships of fishes, Editat de M. L. J. Stiassny, L. R. Parenti i G. D.
Johnson, , San Diego, CA: Academic Press, p 209 250.
90. FITCH W. M., 1967 Evidence suggesting a non-random character to nucleotide
replacements in naturally occuring mutations. J. Mol. Biol., Nr. 26, p. 499 507.
91. FITCH W. M., 1971 Toward defining the course of evolution: Minimum change
for a specific tree topology. Syst. Zool. Nr. 20, p. 406 416.
92. FITCH W. M., 1977 On the problem of discovering the most parsimonious tree.
American Naturalist nr. 111, p. 223 257.
93. FOWLER J., COHEN L., JARVIS P., 2000 Practical statistics for field biology,
Second Edition, Ed. John Wiley & Sons Ltd., England p. 186-207.
94. FUJIKAWA N., NAKAYAMA I., ONOZATO H., 1993 Ultraviolet induced
androgenesis in Nile tilapia, Oreochromis niloticus (L.), and hybrid Nile blue
tilapia, O. aureus (Steindachner) Bull. Nat. Res. Inst. of Aquaculture, nr. 22, p.
11 21.
95. GALLUT CYRIL, 1998 Codage de l`ordre des genes du genome mitochondrial
animal en vue d]une analyse phylogenetique. n DEA Biodiversit, p. 1 35.
96. GARNIER J., OSGUTHORPE D. J., ROBSON B., 1978 Analysis of the
accuracy and implications of simple method for predicting the secondary
structure of globular proteins. Jour. Mol. Biol., nr. 120, p. 97-120.
97. GASCUEL O., 1997 BIONJ: An improved version of the NJ algorithm based on
a simple model of sequence data, n Mol. Biol. Evol. Nr. 14 (7), p. 685 695.
98. GASCUEL O., 2000 On the Optimization Principle in Phylogenetic Analysis
and the Minimum-Evolution Criterion n Mol. Biol. Evol., vol.17, nr.3, p. 401 -
405.
99. GERBER ANNE, LOGGINS R., KIMAR S., DOWLING T. E., 2001 Does
nonneutral evolution shepe observed patterns of DNA variation in Animal
mitochondrial genomes?. Annu. Rev. Genet., Nr. 35, p. 539 566.
100. GERVAI J., MARIAN T., KRASZNAI Z., NAGY A., CSANYI V., 1980
Occurence of aneuploidy in radiation gynogenesis of carp, J. Fish. Biol., 16 (4),
435 439.
101. GOLOVINSKAIA K. A., 1968 Genetics and selection of fish and artificial
gynogenesis of the carp, Cyprinus carpio. n T. V. R. Pillay, Proc. World
Symposium on warm water Pond Fish Culture, Nr. 44, vol. 4, p. 215 222.
102. GOJOBORI T., LI W. H, GRAUR D., 1982 Patterns of nucleotide substitution in
pseudogenes and functional genes. J. Mol. Evol., Nr. 18, p. 360 369.
103. GOMELSKY B. I., CHERFAS N. B., HULATA G., PERETZ Y., BEN N., 1993
Chromosome set manipulation in common carp Cyprinus carpio, Aquaculture
Symposium of the carp, Budapest, Hungary, 6 9 sept, abstract.
104. GOODWIN R. L., BAUMANN H., BERGER F. G., 1996 Patterns of divergence
during evolution of 1-proteinase inhibitors in mammals. Mol Biol Evol. Nr. 13, p
346 358.
105. GORGAN D. L., APETROAEI MARIA, BRA I. I., 2000 - Variabilitatea fenotipic
la specii ale genului Salmo, n Genetic i Evoluionism, vol. 4, p.99 110,
Editura Corson, Iai.
106. GORGAN D. L., BRA I. I., 2002 The content in total nucleic acid at Cyprinus
carpio L. and Carassius carassius L. species, An. t. ale Univ. Al. I. Cuza,
seciunea II, a. Genetic i Biologie Molecular, Tom III, p. 62 65, Iai.
175
107. GORGAN D. L., BRA I. I., 2003 The nucleic acid content at Cyprinus carpio
L. and Carassius auratus gibelio Bloch., An. t. ale Univ. Al. I. Cuza, Genetic
i Biologie Molecular, Tom IV, p. 119 123, Iai.
108. GORGAN D. L., 2004a Stabilirea secvenei nucleotidice a citocromului b la
Carassius auratus gibelio Bloch., Acta Ihtyologica Nr.1, sub tipar.
109. GORGAN D. L., 2004b Stabilirea secvenei nucleotidice a ND4L la Carassius
auratus gibelio Bloch. i Cyprinus carpio L., n Studii i cercetri, Biologie, Serie
nou, vol. IX, Universitatea din Bacu, p. 103 106.
110. GORGAN D. L., CMPEANU S. C., OLTEANU ZENOVIA, 2004c Determinarea
cantitii totale de ADN la Carassius auratus gibelio Bloch, sub tipar.
111. GORGAN D. L., CMPEANU S. C., GHERASIM SORINA RALUCA, 2004d
Comparative researches about total DNA quantity from three different organs
from Carassius auratus gibelio Bloch and Cyprinus carpio L., sub tipar.
112. GORGAN D. L., SANJUAN L. A., COMENSAA S. A., BRA I. I., 2004e The
D-loop sequence determination from Carassius auratus gibelio Bloch. species,
An. t. ale Univ. Al. I. Cuza, Genetic i Biologie Molecular, Tom V, p. 103
106, Iai.
113. GORGAN D. L., CMPEANU MIRELA MIHAELA, 2004f ND4L nucleotide
sequence compare for different species of Carassius genera, sub tipar.
114. GRANT V., 1977 Organismic evolution, W. H. Ferman and Comp., San
Francisco, p. 418.
115. GUINDON S., GASCUEL O., 2003 PHYML: a simple, fast, and accurate
algorithm to estimate large phylogenies by maximum likelihood. n Syst. Biol.
Nr. 52 (5), p. 696 704.
116. GUSTAFSSON J. P., STEBBINS G. L., AYALA F. J., 1986 Genetics,
Development and evolution, Plenum Press, New York (abstract).
117. HALL T. A., 1999 BioEdit: a user-friendly biological sequence alignment editor
and analysis program for Windows 95/98/ NT. n Nucleic Acids Symp. Ser. Nr.
41, p.9598.
118. HARTIGAN J. A., 1973 Minimum evolution fits to a given tree. Biometrics Nr.
29, p. 53 65.
119. HARTMAN T., 2003 A simpler 1.5-approximation algorithm for sorting by
transpositions. n: Proc. 14th Ann. Symp. Combin. Pattern Matching, Vol. 2676
of Lecture Notes in Computer Science. Springer Verlag, p. 156 169.
120. HARTMAN T., SHARAN R., 2004 A 1.5-approximation algorithm for sorting by
transpositions and transreversals. n: Proc. 4th Internationall Workshop Algs. in
Bioinformatics. Vol. 3240 of Lecture Notes in Computer Science. Springer
Verlag, p. 50 61.
121. HASEGAWA M., KISHINO H., YANO T., 1985 dating of the human-ape
splitting by a molecular clock of mitochondrial DNA. J. Mol. Evol., nr. 22, p. 160
174.
122. HEARD S., 1996 Patterns in phylogenetic tree balance with variable and
evolvingspeciation rates. Evol. Nr. 50, p. 2141 2148.
123. HENDY M. D., PENNY D., 1989 A framework for the quantitative study of
evolutionary trees, Sysyt. Zool. Nr. 38, p. 297 309.
124. HICKERSON M. J., ROSS J. R. P., 2001 postglacial population history and
genetic structure of the northern clingfish (Gobbiesox maeandricus), revealed
from mtDNA analysis. n Marine Biology nr. 138, p. 407 419.
125. HIGGINS D. G., SHARP P.M., (1989). Fast and sensitive multiple sequence
alignments on a microcomputer. CABIOS, Vol. 5, Nr. 2:, p. 151-153.
176
126. HIGGINS D. G., 1994 Clustal V: Multiple alignment of DNA and protein
sequences. n Methods Mol. Biol., Nr. 25, p. 307 318.
127. HILLIS D. M., LARSON A., DAVIS S. K., ZIMMER ELIZABETH, 1996 - Nucleic
Acids III: Sequencing, n Molecular systematics, 2nd ed., Sinauer Assoc.,
Sunderland MA, Chapter 9, p. 318 370.
128. HOLLEBECQ M. G., CHOURROUT D., WOHLFARTH G., BILLARD R., 1986
Diploid gynogenesis induced by heat shock after fertilization with the UV-
irradiated sperm of common carp, Aquaculture, 54, p. 69 76.
129. HORVATH L., ORBAN L., 1995 Genome and gene manipulation in common
carp, Aquaculture, 129, (1-4), p. 157 183.
130. HOULE D., MEZEY J., GALPERN P., 2002 Interpretation of the results of
common principal components analysis, n Evolution, nr. 56(3), p. 433 440.
131. HOWES G. J. 1991 - Systematics and biogeography: an overview In Cyprinid
fishes: Systematics, biology and exploitation, Ed. I. J.Winfield & J. S. Nelson,.
1991. London: Chapman &Hall, p. 1-33.
132. HULATA G., 2001 - Genetic manipulations in aquaculture: a review of stock
improvement by classical and modern technologies, n Genetica, nr. 111, p. 155
173.
133. HUSON, D., SMITH, K., WARNOW, T., 1999 Correcting large distances for
phylogenetic reconstruction. n Proc. 3rd International Workshop Alg.
Engineering. Vol. 1668 of Lecture Notes in Computer Science. Springer Verlag,
p. 273 286.
134. HUSSAIN M. G., CHATTERGI A., Mc ANDREW B. J., JOHNSTONE R., 1991
Triploidy induction in Nile tilapia, Oreochromis niloticus L. using pressure, heat
and cold shocks n Theory of Applicable Genetics, 81, p. 6 12.
135. HUXLEY J., 1974 Evolution the modern synthesis; Third Edition, Baker, Allen
et Unwin Ltd, p. 565 566.
136. IGUCHI K., YAMAMOTO G., MATSUBARA N., NISHIDA M., 2003
Morphological and genetic analysis of fish of a Carassius complex (Cyprinidae)
in Lake Kasumigaua with reference to the taxonomic status of two all-female
triploid morphs. Biol. J. Linn. Soc., London, Nr. 79, p. 351 357.
137. IJIRI K., EGAMI N., 1980 Hertwig effect caused by UV-irradiation of sperm of
Oryazis latipes (Teleost) and its photoreactivation, Mut. Res., 69, p. 241 248.
138. IMSIRIDOU A., ZALDIVAR J. M., 1999 Methodology and formats for genetic
identification of fish species. Joint Research Centre, p. 1 36.
139. INGRAM V. M., 1963 The hemoglobins in genetics and evolution. Columbia
University Press, New York (abstract).
140. JAMESON B. A., WOLF H., 1988 The antigenic index: a novel algorithm for
predicting antigenic determinants. CABIOS vol. 4, p. 181 186.
141. KARAKOUSIS Z., MACHORDOM A., DOADRIO I., ECONOMIDIS P.S., 1995
Phylogenetic relationships of Barbus peloponensis Valenciennes, 1842
(Osteichthyes: Cyprinidae from Greece and other speciei of barbus as revealed
by allozyme electrophoresis. Biochem, System. Ecol., Nr. 23, p. 39 45.
142. KARPLUS P. A., SCHULTZ G. E., 1985 Prediction of chain flexibility in
proteins. n Naturwissenschaften, nr. 72, p. 212 213.
143. KAVUMPURATH S., PANDIAN T. J., 1994 Induction of heterozygous and
homozygous diploid gynogenesis in Betta splendens (Regan) using hydrostatic
pressure, Aquaculture and Fisheries Management, Aquaculture Research
Issue, Nr. 25, (1), p. 133 143.
177
144. KIDD K. K., SGARAMELLA-ZONTA L. A., 1971 Phylogenetic analysis:
Concepts and methods. Am. J. Hum. Genet. Nr. 23, p. 235 252.
145. KIMURA M., OHTA T., 1972 On the stochastic model for estimation of
mutational distancebetween homologous proteins, J. Mol. Evol. Nr. 2, p. 87
90.
146. KIRPICHNIKOV V. S., 1973 On Karyotype Evolution in Cyclostomata and
Pisces, Ichthyologia, Nr. 5/1, p. 55 77.
147. KIRPICINIKOV V. S., 1987 Genetische Grunglagen der Fischzuchtung, Veb.
Deut. Land. Berlin (abstract).
148. KOBAYASI H., 1971 A cytological study on gynogeneis of the triploid ginbuna
(Carassius auratus langdorfi), Zool. Mag., 80, 9, p. 316 322.
149. KOBAYASI H., NAKANO K., NAKAMURA M., 1977 On the Hybrids, 4n
Ginbuna (Carassius auratus langsdorfii) x Kinbuna (Carassius auratus), and
their chromosomes. Bulletin of the Japanese Society of Scientific Fisheries, Nr.
43/1, p. 31 37.
150. KOBAYASI H., OCHI H., TAKEUCHI N., 1973 Chromosome studies in the
genus Carassius: Comparison of C. auratus grandoculis, C. auratus buergeri
and Carassius auratus langsdorfii. Japanese Journal of Ichthyology, Nr. 20 (1),
p. 83 88.
151. KOCHER T. D., THOMAS W. K., MEYER A., EDWARDS S. V., PAABO S.,
1989, Dynamics of mitochondrial DNA evolution in animals: amplification and
sequencing with conserved primers,.. Proc. Nati., Acad. Sci. USA, Nr. 86, p.
6196 6200.
152. KOCHER T. D., WILSON A. C., 1991 Sequence evolution of mitocondrial DNA
in humans and chimpanzees: Control region and protein coding region. In
Evolution of life,. Springer-Verlag, New York. p. 391 413.
153. KOMEN J., DUYNHOVER J., RICHTER C. J. J., HUSMAN E. A., 1989
Gynogenesis in common carp (Cyprinus carpio L.). I. Effects of genetic
manipulation of sexual products and incubation of eggs, Aquaculture, 69, p. 227
239.
154. KREISER B. R., MITTON J. B., WOODLING J. D., 2001 Phylogeography of
the plains killifish Fundulus Zebrinus, n Evolution, nr. 55(2), p. 339 350.
155. KUMAR S., 1996 A stepwise algorithm for finding minimum evolution trees, n
Mol. Biol. Evol., nr. 13 (4), p. 584 593.
156. KUMAR S., TAMURA K., JAKOBSEN I.B., NEI M., 2001 MEGA2: molecular
evolutionary genetics analysis software. n Bioinformatics, Nr. 17, p. 1244
1245.
157. KUMAR S., GADAGKAR S. R., 2000 Efficiency of the neighbor-joining method
in reconstructing deep and shallow evolutionary relationships in large
phylogenies. J. Mol. Evol. Nr. 51, p 544 553.
158. KYTE J., DOOLITTLE R. F., 1982 A simple method for displaying the
hydropathic character of a protein. Jour. Mol. Biol., nr. 157, p. 105 132.
159. LARGET B., SIMON D., KADANE J., 2002 Bayesian phylogenetic inference
from animal mitochondrial genome arrangements. n J. Royal Stat. Soc. B Nr.
64 (4), p. 681 694.
160. LARHAMMAR D., RISINGER C., 1994 Molecular genetic aspects of tetraploidy
in the common carp Cyprinus carpio. Mol. Phylogenet. Evol. Nr. 3, p. 59 68.
161. LEFEBVRE J. F., EL-MABROUK N., TILLIER E., SANKO D., 2003 - Detection
and validation of single gene inversions. n: Proc. 11th International Conf. on
178
Intelligent Systems for Mol. Biol., vol. 19 of Bioinformatics. Oxford U. Press, p.
i190 I196.
162. LEVIN D. A., 1979 Hybridization an evolutionary perspective, Dowden,
Hutchinson & Rose, Inc. Stroudsburg, Pennsylvania (abstract).
163. LEWIN B., 1987 Genes III (Third Edition). John Wiley & Sons, New York,
Chichester, Brisbane, Toronto, Singapore, 226 237.
164. LEWIS J., WOLPERT L., 1979 Diploidy, evolution and sex, J. Theor. Biol., 78,
p.425 438.
165. LEWONTIN R. C., 1978 Adaptation, American Scientist, 239, p. 157 169.
166. LINDER C., MORET B., NAKHLEH L., WARNOW T., 2004 Network
(reticulated) evolution: Biology, models, and algorithms. Prezentare disponibil
la: compbio.unm.edu/papers.html.
167. LINHART O., KVASNICKA P., SLECHTOVA V., POKORNY J., 1986 Induced
gynogenesis by retention of the second polar body in tha common carp,
Cyprinus carpio L., and heterozigosity of gynogenetic progeny in trensferrin and
Ldh-B1 loci, Aquaculture, 54, p. 63 67.
168. LIOR D., BLUM S., FELDMAN W. M., LAVI U., HILLEL JOSSI, 2003 Recent
duplication of the common carp (Cyprinus carpio L.) genome as revealed by
analyses of microsatellite loci. Mol. Biol. Evol. Nr. 20 (9), p. 1425 1424.
169. LISKER R., ARMENDARES S., 2000 Introduccin a la Gentica Humana,
primera edicin Editorial El Manual Moderno Mxico D.F., p. 1 20.
170. LIU T., MORET B., BADER D., 2003 An exact, linear-time algorithm for
computing genomic distances under inversions and deletions. Tech. Rep., Univ.
of New Mexico, p. 31.
171. LUDWIG A., MAY B., DEBUS L., JENNECKENS I., 2000 Heteroplasmy in the
mtDNA control region of sturgeon, n Genetics, nr. 156 p. 1933 1947.
172. LUKOWICZ, M., 1980 Intensittistufen der modernen Aquakultur, din Intens.
Fisch, Moglichkeitem und Probleme der modernen Aqukultur, p. 56.
173. LUKOWICZ, M., 1985 Fischzucht in China, din Fisch. m. Teichwirt, 3,
(abstract).
174. LUSTUN V., VOICAN V., RDULESCU I., 1978 Dicionar piscicol, Editura
Ceres, Bucureti., p. 63.
175. MADDISON W., 1990 A method for testing the correlated evolution of two
binary characters: are gains or losses concentrated on certain branches of a
phylogenetic tree?. Evol. Nr. 44, 539 557.
176. MADDISON W., 1997 Gene trees in species trees. Syst. Biol. Nr. 46, p. 523
536.
177. MADDISON W., MADDISON D. R., 1992 MacClade: Analysis of phylogeny
and character evolution. Sinauer Associates, Sunderland, (abstract).
178. MAKEEVA A. P., VERIGIN B. V., 1974 Gibrid karpa sz belm tolsztolobikom.
Genetika, T. 10, Nr. 2, p. 73.
179. MARGOLIASH E., 1963 Primary structure and evolution of cytochrome c. Proc.
Natl., Acad. Sci. USA, Nr. 50, p. 672 679.
180. MRIN T., KRASZNAI Z., 1978 Comparative karyological investigations on
chinese carps, International seminary on Increasing the productivity of fishes by
selection and hybridisation, Szarvas, p. 79 97.
181. MARRON M., SWENSON K., MORET B., 2003 Genomic distances under
deletions and insertions. In: Proc. 9th Int'l Conf. Computing and Combinatorics.
vol. 2697 Lecture Notes in Computer Science, Springer Verlag, p. 537 547.
179
182. MARTIN A., 2001 The phylogenetic placement of Chondrichtyes: inferences
from analysis of multiple genes and implications for comparative studies, n
Genetica, nr. 111, p. 349 357.
183. MAS EVA, POZA J.; CIRIZA JESS 2001 Fundamento de la reaccin en
cadena de la Polimerasa. Revista Acuatic No. 15, Universidad de Zaragoza,
Espaa, p. 1 20.
184. MASUDA, H., K. AMAOKA, C. ARAGA, T. UYENO AND T. YOSHINO, 1984 The
fishes of the Japanese Archipelago Vol. 1.. Tokai University Press, Tokyo,
Japan. p. 57.
185. MATEI D., 1990 600 de ani de atestare a pisciculturii n Moldova (sec. XIV
XX) i 35 de ani de activitate tiinific n sprijinul produciei piscicole 1954
1989), Piscicultura Moldovei, Lucrrile S.C.P. Piscicol, Iai, vol.1, p. 15 17.
186. MATEI, D., 1985 Tehnologii de valorificare a potenialului trofic i piscicol al
lacurilor de acumulare, din Consf. pt. probl. pisc. i mec. ap. din sect. pisc., p.
23 30.
187. MATHER K., JINKS J. L., 1971 Biometrical Genetics, Chapman and Hall Ltd,
New Fetter Lane, London (abstract).
188. MATHEWS CHRISTOPHER 1999 Bioqumica segunda edicin MacGraw Hill
Espaa p. 94, 101-102, 114.
189. MATSUO T., OGAWA Y., KUMAMARU A., OCHI K., ADACHI Y., 2000
Complete nucleotide sequence of the Cytochrome b gene of channel catfish
Ictalurus punctatus and comparison of sequence homology among channel
catfish and other fishes, Mol. Biol.p 207 210.
190. MAXAM A. M., GILBERT W., 1977 A new method for sequencing DNA. Proc.
Natl. Acad. Sci. USA, Nr. 74, p. 560 564.
191. MAXIMILIAN C., IOAN DOINA MARIA, 1984 Dicionar de genetic, Editura
tiinific i Enciclopedic, Bucureti, p. 27.
192. MELTON T., 2002 Mitochondrial DNA, Mitotyping Technologies, p. 1 4.
193. MILLER-TAILLON PATRICIA, PIERNOT ELLEN, KWOK P. Y., 1999 Efficient
approach to unique single-nucleotide polymorphism discovery. Genom
Research Nr. 9, p. 499 505.
194. MINCIU DOINA-RODICA, BRA I. I., 1985 Studiul complementului
cromosomial la Pseudorasbora parva (Schlegel) (Pisces, Cyprinidae), Sem.
tiin. Progrese n ameliorarea i tehnologia creterii animalelor n sistem
intensiv, Timioara (abstract).
195. MINCIU, DOINA RODICA, 1991 Posibiliti de corelare a unor proteine
polimorfe cu anumii indici morfoproductivi la peti, Ecologia et Aquacultura
Limnica, Piatra Neam, Nr. 2(11), p. 195 200.
196. MIROL PATRCIA, GARCIA PERAL P., DULOUT N. F., 2004 Mitochondrial
variability in the D-loop of four equine breeds shown by PCR-SSCP analysis,
Ed. Sociedade Brasileira de Gennetica, p. 1 7.
197. MOAV R., HULATA G., WOHLFARTH G., 1975 Genetic differences between
the Chinese and European races of the common carp. I: Analysis of genotype-
enviroment interactions for growth rate. n Heredity Nr. 34, p. 323340.
198. MONOD J., FRANCOIS J., 1996, Biologa Molecular dcimo segunda edicin
Editorial Ciencia y Desarrollo Mxico D.F. p. 9 10.
199. MORET B., BADER D., WARNOW T., 2002 High-performance algorithm
engineering for computational phylogenetics. n J. Supercomputing, nr. 22, p.
99 - 111.
180
200. MORET B., ROSHAN U., WARNOW T., 2002 Sequence length requirements
for phylogenetic methods. n Proc. 2nd International Workshop Algs. in
Bioinformatics., vol. 2452 Lecture Notes in Computer Science, Springer Verlag,
p. 343 356.
201. MORET B., TANG J., WANG L. S., WARNOW T., 2002 Steps toward accurate
reconstructions of phylogenies from gene-order data. J. Comput. Syst. Sci. Nr.
65 (3), p. 508 525.
202. MORET B., TANG J., WARNOW T., 2005 Reconstructing phylogenies from
gene content and gene-order data. n: Gascuel, O. (Ed.), Mathematics of
Evolution and Phylogeny. Oxford University Press, p. 321 352.
203. MLLER S., 1989 Geschichte der Fiszucht in Europa, Teil VII. Einige wichtige
Etappen in der Entwicklung der Karpfenteichwirtschaft, Z. Binnenfisch D.D.R.,
Berlin, Nr. 36, p. 10 14.
204. MURAKAMI M., MATSUBA C., FUJITANI H., 2001 The maternal origins of the
triploid ginbuna (Carassius auratus langsdrfi); phylogenetic relationships within
the Carassius auratus taxa by partial mitochondrial D-loop sequnecing. Genes
Genet. Syst. Nr. 76 (1), p. 25 32 (abstarct).
205. NAGY A., RAJKI K., HORVATH L., CSANYI V., 1978 Investigation on carp
(Cyprinus carpio L.) gynogenesis. J. Fish. Biol., Nr. 13, p. 215 224 (abstract).
206. NAGY A., CSANYI V., BAKOS J., BERCSENYI, M., 1984 Utilization of
gynogenesis and sex-reversal in commercial carp breeding: growth of the first
gynogenetic hybrids. Aquacult. Hung., Nr. 4, p. 7 16.
207. NAKHLEH L., ROSHAN U., ST. JOHN K., SUN J., WARNOW T., 2001
Designing fast converging phylogenetic methods. n: Proc. 9th International
Conf. on Intelligent Systems for Mol. Biol., vol. 17 of Bioinformatics. Oxford U.
Press, p. S190 S198.
208. NAKHLEH L., MORET B., ROSHAN U., JOHN K. S., WARNOW T., 2002 The
accuracy of fast phylogenetic methods for large datasets. In: Proc. 7th Pacific
Symp. On Biocomputing. World Scientific Pub., p. 211 222.
209. NEE S., 2001 Inferring speciation rates from phylogenies, n Evolution, nr.
55(4), p. 661 668.
210. NEI M., 1986 Stochastic errors in DNA evolution and molecular phylogeny. n
Evolutionary perspectives and the new genetics. p. 133 - 147 Ed. Alan R. Liss,
New York.
211. NEI M., 1991 Relative efficiencies of different tree making methods for
molecular data. n Recent advances in phylogenetic studies of Dna sequences.
Oxford University Press, p. 133 147.
212. NEI M., 1996 Phylogenetic analysis in molecular evoutionary genetics. Annu.
Rev. Genet., Nr. 30, p. 371 403.
213. NEI M., TAJIMA F., 1983 Maximum likelihood estimation of the number of
nucleotide sbstitutions from restriction sites data. n Genetics, Nr. 105, p. 207
217.
214. NEI M., TAJIMA F., TATENO Y., 1983 Accuracy of estimated phylogenetic
trees from molecular data II. Genes frequency data. J. Mol. Evol. Nr. 19, p. 153
170.
215. NEI M., MILLER J.C, 1990 A simple method for estimating average number of
nucleotide substitutions within and between populations from restriction data. n
Genetics, nr. 125, p. 873-879.
181
216. NEI M., GU X., SITNIKOVA T., 1997 Evolution by the birth-and-death process
in multigene families of the vertebrate immune system. Proc. Natl. Acad Sci.
USA, Nr. 94, p. 7799 7806.
217. NEI M., KUMAR S., TAKAHASHI K., 1998 The optimization principle in
phylogenetic analysis tends to give incorrect topologies when the number of
nucleotides or amino acids used is small, n PNAS, nr. 95 (21) p. 12390 -
12397.
218. NEI M., KUMAR S., 2000 Molecular evolution and phylogenetics, Oxford
University Press.
219. NELSON G. J., 1994 Fishes of the world, Editat de Whilez, New York.
220. NICOLAU AURELIA, BREZEANU GH., CALOIANU I., BUNIA A., 1973
Reproducerea artificial i dezvoltarea la peti, Editura Academiei R.S.R.,
Bucureti (abstract).
221. NICOLESCU CARMEN, 2002 Types of gynogenetic carps obtained using
genetic manipulated gametes, An. t. ale Univ. Al. I. Cuza, seciunea II
Genetic i Biologie Molecular, Tom III, p.68 77, Iai.
222. NICOLESCU CARMEN, 1994 Das Studium der Wirksamkeit einiger Methoden
in der genetischen Inaktivierung der Karpfengameten, Analele Universitii
Valachia Trgovite, anul II, fascicola I, p. 101 111.
223. NICOLESCU CARMEN, 1996 Studiul genetic al unor forme de peti obinute
prin manipulri genetice (ginogenez, androgenez, poliploidizare, hibridare
interspecific) tez de doctorat (rezumat).
224. NICOLESCU CARMEN, 1997 Studiul eficienei unor tehnici n diploidizarea
meterialului genetic al gameilor la crap, Al XXII-lea Congres al Academiei
Romno Americane de tiine i Arte, 26 27 iunie 1997, vol. I, seciunea V
tiine medicale i biologie, p. 146 163.
225. NIXON C K., CARPENTER J. M., 2000 On the other phylogenetic
systematics, n Cladistics Nr. 16, p. 298 318.
226. NOGUSA S., 1960 A comparative study of the chromosomes in fishes with
particular considerations on taxonomy and evolution, Mem. Univ. Agr., nr. 3.,
Hyogo p. 1 62.
227. NORMAN A. J, PORTER A. H., 2001 Toward a new synthesis: population
genetics and evolutionary developmental biology, n Genetica, nr. 112 113, p.
45 58.
228. NU GH., BUNEAG C., 1977 Investigaii biochimice, Editura Didactic i
Pedagogic, Bucureti. p. 188 189.
229. OBRHELOVA, N. P., 1971 Vergleinchende osteologie der gattung Leuciscus
(Pisces) aus tertiaren schichten der nordlichen und westlichen CSSR,
Paleontolog. Abhandl. Nr. 4, p. 549-660.
230. OHNO S., 1970 Evolution by gene duplication. Springer Verlag, Berlin
(abstract).
231. OJIMA Y., HAYASHI M., UENO K., 1972 Cytogenetic studies in lower
vertebrates Karyotype and DNA studies in 15 Species of Japanese
Cyprinidae, Genetics, 476, p. 431 440, Japan.
232. OLSEN G., MATSUDA H., HAGSTROM R., OVERBEEK R., 1994 Fast
DNAmt: A tool for construction of phylogenetic trees of DNA sequences using
maximum likelihood. Computations in Applied Biosciences, nr. 10 (1), p. 41
48.
233. OPRESCU S., 1980 Introducere n citogenetica animal, Ed. tiinific,
Bucureti.
182
234. ORNDUFF R., 1979 Reproductive biology in relation to sistematics; Taxon, 18,
p. 121 133.
235. OWCZARZY R., VALLONE M. P., GALLO J. F., PANER T. M., LANE M. J.,
BENIGHT A. S., 1998 Predicting sequence-dependent melting stability of the
short duplex DNA oligomers. Ed. John Wiley & Sons, p. 217 239.
236. PBO S., 1990 amplifying ancient DNA In PCR protocols: A guide to
methods and applications, Eds. M. A. Tunes, D.H. Gelfand, J. J. Sninsky i T. J.
White, Academic Press San Diego, p. 159 166.
237. PAAVER T., 1983 Biochimiceskaia genetika karpa Cyprinus carpio L., Akad.
nauk Estonsk. S. S. R. Inst. Zool. Bot., p. 85 92.
238. PAGE R., 1998 Introduction to tree building, DEEB IBLS, University of
Glasgow, p. 1 5.
239. PAGE R., 1998 GeneTree: comparing gene and species phylogenies using
reconciled trees. Bioinf. Nr. 14 (9), p. 819 820.
240. PAGE R., CHARLESTON M., 1997 From gene to organismal phylogeny:
Reconciled trees and the gene tree/species tree problem. Mol. Phyl. Evol. Nr. 7,
p. 231 240.
241. PAGE R., CHARLESTON M., 1997 Reconciled trees and incongruent gene
and species trees. n: Mirkin, B., McMorris, F. R., Roberts, F. S., Rzehtsky, A.
(Eds.), Mathematical Hierarchies in Biology, vol. 37. American Math. Soc., p. 57
70.
242. PALUMBI S., 1996 Nucleic Acids II: The polymerase chain reaction, n
Molecular systematics, 2nd ed., Sinauer Assoc., Sunderland MA, Chapter 7, p.
205 317.
243. PALUMBI S. R., CIPRIANO F., HARE M. P., 2001 Predicting nuclear gene
coalescence from mitochondrial data: the three-times rule, n Evolution, nr.
55(5), p. 859 868.
244. PAMILO P., NEI M., 1998 Relationship between gene trees and species trees.
Mol. Biol. Evol. Nr. 5, p. 568 583.
245. PETRE A., NEGRUIU E., 1975 Genetic animal, Editura Didactic i
Pedagogic, Bucureti, p. 237 260.
246. PIONTKIVSKA H., ROONEY A. P., NEI M., 2002 Purifying selection and birth-
and-death evolution in the histone H4 gene family. n Mol. Biol. Evol. Nr. 19,
p.689-697.
247. POJOGA I., 1977 Piscicultura modern n apele interioare, Editura Ceres,
Bucureti, 34 58.
248. POJOGA I., 1977 Piscicultura, Editura Ceres, Bucureti, p. 15 33.
249. POJOGA I., NEGRIU R., 1988 Piscicultura practic, Editura Ceres, Bucureti,
p. 67.
250. POSADA D., CRANDALL KEITH, 1998 Modeltest: testing the model of DNA
substitution, n Bioinformatics applications note, vol. 14, Nr. 9, p. 817 818.
251. PRESCOTT L. M., Harley Johon P. 1999 Microbiologa cuarta edicin Editorial
MacGraw Hill Madrid Espaa p. 320-344.
252. QUILLET E., 1994 Survival growth and reproductive traits in mitotic
gynogenetic rainbow trout females, Aquaculture, 123, p. 223 237.
253. QUINTEIRO J., VIDAL R., MENDEY M. R., 2000 Phylogeny and
biogeographic history of hake (genus Merluccius), inferred from mitochondrial
DNA control region sequences. n Marine Biology, nr. 136, p. 163 174.
254. RAICU P, 1980 Genetica, , Editura Didactic i Pedagogic, Bucureti, p. 533
553.
183
255. RAICU P., TAISESCU ELENA, CRISTIAN ALEXANDRINA, 1972 Diploid
chromosome complement of the carp, n Cytologia, p. 37.
256. RAM J. L., RAM M. L., BALDOUN F. F., 1996 Identification of canned tuna and
bonito by sequence and restriction site analysis of polymerase chain rection
products of mitochondrial DNA. J. Agric. Food. Chem., Nr. 44, p. 2460 2467.
257. RANNALA B., YANG Z., 1996 Probability distribution of molecular evolutionary
trees: a new method of phylogenetic inference. J. Mol. Evol. Nr. 43, p. 304
311.
258. RJABOV I. N., 1975 Oszobennoszti embrional, no-licsinocsnogo razvitija
gibridov karpa (Cyprinus carpio L.) i koreszkoj vosztrobrjuski Hemiculter
eignmanni, Jordan et Metz., Vopr. Ihtiol., T. 15 vp. 3, (abstract).
259. ROKAS A., HOLLAND P. W. H., 2000 Rare genomic changes as a tool for
phylogenetics. Trends in Ecol. and Evol. Nr. 15, p. 454 459.
260. RGL, F., STEININGER, F. F., 1983 Vom Zarfall der Tethys zu Mediterran und
Paratethys. Die neogene palasgegraphie und palinspastik des zirkum-
mediterranen Raumes. 85A, Ann. Naturhist. Mus.Wien. p. 135-163.
261. RYMAN N., JORDE P. E., 2001 Statistical power when testing for genetic
differentiation. Mol. Ecol. Nr. 10, p. 2361 2373.
262. RZHETSKY A., NEI M., 1992 A simple method for estimating and testing
minimum evolution trees. Mol. Biol. Evol. Nr. 9, p. 945 967.
263. RZHETSKY A., NEI M., 1992 Statistical properties of the ordinary least
squares, generalized least-squares, and minimumevolution methods of
phylogenetic inference. J. Mol. Evol. Nr. 35, p. 367 375.
264. RZHETSKY A., NEI M., 1993 Theoretical foundation of the minimum-evolution
method of phylogenetic inference. Mol. Biol. Evol. Nr. 10, p. 1073 1095.
265. RZHETSKY A., NEI M., 1995 Tests of applicability of several substitution
models for DNA sequence data. Mol. Biol. Evol., Nr. 12, p. 131 151.
266. SACCONE C., ATTIMONELLI M., SBISA E., 1987 Structural elements highly
preserved during the evolution of the D-loop-containing region in vertebrate
mitochondrial DNA. J. Mol. Evol. Nr. 26, p. 205 211.
267. SAITOU N., IMANISHI M., 1989 Relative efficiencies of the Fitch-Margoliash,
maximum-parsimony, maximum-likelihood, minimum-evolution, and neighbor-
joining methods of phylogenetic reconstructions in obtaining the correct tree.
Mol. Biol. Evol. Nr. 6, p. 514-525.
268. SAITOU N., NEI M., 1987 The neighbor-joining method: A new method for
reconstructing phylogenetic trees. Mol. Biol. Evol. Nr. 4, p. 406 425.
269. SAMONTE I. E., PAGULAYAN R. C., MAYAER W. E., 2000 Molecular
phylogeny of Philippine freshwater sardines based on mitochondrial DNA
analysis. Journal of Heredity, Nr. 91, p. 247 253.
270. SANGER F., AIR G. M., BARELL B. G., BROWN N. L., COULSON A. R.,
FIDDES C. A., 1977 Nucleotide sequence of bacteriophage X174 DNA. In
Nature, Nr. 265, p. 687 695.
271. SANKO D., NADEAU J., 1996 Conserved synteny as a measure of genomic
distance. Disc. Appl. Math. Nr. 71, p. 247 257.
272. SCHPERKLAUS W., 1961 Lehrbuch der Teichwirtschaft, Aufl., Paul Perey,
Berlin, Hamburg, (abstract).
273. SCHULTZ R. J. 1967 Gynogenesis and triploidy in the viviparous fish
Poeciliopsis, Science, 157, p. 1564 1567.
274. SHELTON W. L., 1986 Control of sex in Cyprinids for aquaculture,
Aquaculture al Cyprinids, I.N.R.A., Paris.
184
275. SHEN S.C., 1993 Fishes of Taiwan Ed. Department of Zoology, National Taiwan
University, Taipei. p. 960.
276. SITNIKOVA T., RZHETSKY A., NEI M., 1995 Interior branch and bootstrap
tests of phylogenetic trees. Mol. Biol. Evol. Nr. 12, p. 319 333.
277. SNEATH P. H. A., SOKAL R. R., 1973 Numerical taxonomy. Ed. Freeman,
San Francisco CA. (abstract).
278. SNEDECOR, G. W., 1968 Metode statistice aplicate n cercetrile de
agricultur i biologie, Editura Didactic i Pedagogic, Bucureti, p. 37.
279. SOKAL R. R., MICHENER C. D., 1958 A statistical method for evaluating
systematic relationships. Univ. Kansas Sci. Bull. Nr. 28, p. 1409 1438.
280. SOKAL R. R., SNEATH P. H. A., 1963 Principles of numerical taxonomy.
Freeman, San Francisco CA. (abstract).
281. SOURDIS J., NEI M., 1988 Relative efficiencies of the maximum parsimony
and distance-matrix methods in obtaining the correct phylogenetic tree, n Mol.
Biol. Evol., nr. 5, p. 298 311.
282. SPIRIN A., 1958 Spektrofotometriceskoe opredelenie summarnovo kolicestva
nucleinovih kislot. Biohimia, p.656.
283. STAN TR., 1985 Piscicultura, lucr. practice, lito. I. A. Iai, p. 15 16.
284. STAN, T., PSRIN, B., 1996 Acvacultur, Universitatea Agronomic i de
Medicin Veterinar Ion Ionescu De la Brad, Iai, p 31.
285. STEBBINS G. L., 1969 The basis of progressive evolution, Univ. North
Carolina, Press, Chapel Hill (abstract).
286. STUART G. W., MOFFETT KAREN, LEADER J. J., 2001 A comprehensive
vertebrate phylogeny using vector representations of protein sequences from
whole genomes. Mol. Biol. Evol. p. 1 31.
287. SUCIU MARIA, POPESCU ALEXANDRINA, 1981 Lucrri practice de zoologie,
ediia a II-a, Editura Didactic i Pedagogic, Bucureti.
288. SUSKO E., INAGAKI Y., ROGER A. J., 2004 On Inconsistency of the
Neighbor-Joining, Least Squares, and Minimum Evolution Estimation When
Substitution Processes Are Incorrectly Modeled, n Mol. Biol. Evol., vol 21 nr. 9,
p. 1629 1642.
289. SWOFFORD D. L., BEGLE D. P., 1993 PAUP: Phylogentic analysis using
parsimony, ver. 3.1. users manual, Illinois Natural History Survey, Champaign,
p. 74 102.
290. TAISESCU ELENA, 1979 Studiul complementului cromosomial la unele specii
de peti din fauna rii noastre, Rez., Tez Dr., Fac. Biol., Univ. Bucureti
(rezumat).
291. TAKAHASHI K., NEI M., 2000 Efficiencies of fast algorithms of phylogenetic
inference under the citeria of Maximum-Parsimony, Minimum Evolution, and
Maximum Likelihood when a large number of sequences are used. Mol. Biol.
Evol. Nr. 17(8), p. 1251 1258.
292. TAKEZAKI N., NEI M., 1994 Inconsistency of the maximum parsimony method
when the rate of nucleotide substitution is constant. J. Mol. Evol. Nr. 39, p. 210
218.
293. TAKEZAKI N., 1998 The trees generated by distance methods of phylogenetic
reconstruction. Mol. Biol. Evol. Nr. 15, p. 727 737.
294. TAKEZAKI N., NEI M., 1996 Genetic distances and reconstruction of
phylogenetic trees from microsatellite DNA. n Genetics Nr., 144, p. 389 399.
185
295. TAKEZAKI N., GOJOBORI T, 1999 Correct and incorrect vertebrate
phylogenies obtained by the entire mitochondrial DNA sequences. Mol. Biol.
Evol. Nr. 16, p. 590 601.
296. TAMURA K., 1992 Estimation of the number of nucleotide substitution when
there are strong transition-trensversion and G+C content biases. Mol. Biol. Evol.
Nr. 9, p. 678 687.
297. TAMURA K., NEI M., 1993 Estimaton of the number of nucleotide substitutions
in the control region of mitochondrial DNA in humans and chimpanzees, Mol.
Biol. Evol., Nr. 10, p 512 526.
298. TANG J., MORET B., 2003 Phylogenetic reconstruction from gene
rearrangement data with unequal gene contents. n: Proc. 8th International.
Workshop on Algs. and Data Structures. Vol. 2748 of Lecture Notes in
Computer Science, Springer Verlag, p. 37 46.
299. TANG J., MORET B., CUI L., DEPAMPHILIS C., 2004 Phylogenetic
reconstruction from arbitrary gene-order data. n: Proc. 4th IEEE Symp. on
Bioinformatics and Bioengineering, IEEE Press, Piscataway, NJ, p. 592 599.
300. TATSUO O., Chaudhry M. S., Sohail B., Masatoshi Y., Nor A. H., Hideki E.,
Hisashi Y., Ryuichi M., 2004 - Phylogenetic position of the small Kashmir flying
squirrel, Hylopetes fimbriatus ( Eoglaucomys fimbriatus), in the subfamily
Pteromyinae, Can. J. Zool./Rev. Can. Zool. 82(8) p. 1336-1342.
301. TEROL J., MASCARELL ROSARIO, FERNANDEZ-PEDROSA VICTORIA,
PEREY A. M., 2002 Statistical validation of the identification of tuna species:
bootstrap analysis of mitochondrial DNA sequences. J. Agric. Food Chem., nr.
50, p. 963 969.
302. THOMPSON J.D., 1994 Nucleic Acids Research, Vol 22, p. 4673 - 4680.
303. VAITHILIMGAM G., RAMANA T., 1988 Technics for chromosome analisis, The
University of Texas Health Science Center at Dallas, Texas (abstract).
304. VAN VELLER M. G. P., KORNET D. J., ZANDEE M., 2000 Methods in
vicariance biogeography: assessment of implementation of assumption 0, 1 and
2, n Cladistics, Nr. 16, p. 319 345.
305. VARVARA M., ZAMFIRESCU ., NEACU P., 2001 Lucrri practice de
ecologie, Editura Univ. Al. I. Cuza Iai, p. 2 25.
306. VASCO A. D., CRANDALL A. K., FU Y. X., 2001 Molecular populations
genetics: coalescent methods based on summary statistics, p. 173 216.
307. VASZJILJEV V. P., MAKEEVA A. P., RJABOV I. N., 1975 O Triploidii Gibridov
Karpa sz Drugimi Predsztaviteljami Szemejsztva Cyprinidae. Genetika, T. XI,
No. 8 (abstract).
308. VOICAN V., LUSTUN L., RDULESCU I., 1975 Practica seleciei i
reproducerii la peti, Editura Ceres, Bucureti.
309. VOLCKAERT F. A. M., GALBUSERA P. H. A., HELLEMANS B. A. S., Van den
HAUTE, VANSTAEN D., OLLEVIER F., 1994 Gynogenesis in the African
catfish (Clanas gariepinus). I. Induction of meiogynognesis with thermal and
pressure shocks, Aquaculture, 128, p. 221 235.
310. YANG Y.P., WOMACK J. E., 1998 Parallel radiation hybrid mapping: a
powerful tool for high-resolution genomic comparison. Genome research, Nr. 8,
p. 731 736.
311. YANG Z., 1996 Maximum-likelihood model for combined analyses of multiple
sequence data, J. Mol. Evol. Nr. 42, p. 587 596.
312. YANG Z., 1996 Phylogenetic analysis using parsimony and likelihood methods.
J. Mol. Evol. Nr. 42, p. 294 307.
186
313. WAKELEY J., 1993 Substitution rate variation among sites in hypervariable
region I of human mitochondrial DNA, J. Mol. Evol. Nr. 37, p. 613 623.
314. WAKELEY J., 1994 Substitution rate variation among sites and the estimation
of transition bias, Mol. Biol. Evol., Nr. 11, p. 436 442.
315. WANG H. Y., LEE S. C., 2002 - Secondary structure of mitochondrial 12S rRNA
among fish and its phylogenetic applications. Mol. Biol. Evol., Nr. 19, p. 138
148.
316. WANG L. S., WARNOW T., 2001 Estimating true evolutionary distances
between genomes. n: Proc. 33rd Ann. ACM Symp. Theory of Comput. ACM
Press, New York, p. 637 646.
317. WANG L. S., JANSEN R., MORET B., RAUBESON L., WARNOW T., 2002
Fast phylogenetic methods for genome rearrangement evolution: An empirical
study. n: Proc. 7th Pacific Symp. on Biocomputing. World Scientific Pub., p.
524 535.
318. WANG L. S., WARNOW T., 2005 Distance-based genome rearrangement
phylogeny. n: Gascuel O. (Ed.), Mathematics of Evolution and Phylogeny.
Oxford University Press, p. 353 383.
319. WELCOMME R.L., 1988 International introductions of inland aquatic species,
Rome, FAO. (abstract).
320. WERNER S., 1979 Industrienmabige fischproduction, veb Deutscher
Lanswirtschaf sverlang, Berlin, D. D. R. (abstract).
321. WHEELER W., 2001 Homology and the optimization of DNA sequence data, n
Cladistics, Nr. 17, p. 5 11.
322. WILLIAMS G. C., 1966 Adaptation and natural selection. A critique of some
current. Evolutionary thought, Princeton Univ. Press. (abstract).
323. WILEY E. O., 1981 Phylogenetics: The theory and practice of phylogenetic
systematics. Ed. by Wiley, New York (abstract).
324. WILEY E. O., BROOKS D. R., SIEGEL-CAUSEY D., FUNK V. A., 1991 The
Compleat cladist: A primer of phylogenetic procedures. Museum of Natural
History, University of Kansas, Lawrence, (abstract).
325. WILLS C., 1981 Genetic variability, Clarendon Press, Oxford (abstract).
326. WILSON A. C., CARLSON S. S., WHITE T. J., 1977 Biochemical Evolution.
Annu. Rev. Biochem., Nr. 46, p. 573 639.
327. WOLF C., RENTSCH J., HUBNER P., 1999 PCR-RFLP analysis of
mitochondrial DNA: a reliable method for species identification. J. Agric. Food
Chem. Nr. 47, p. 1350 1355.
328. WOO-JAI L., CONROY JANET, HOWELL H. W., KOCHER T. D., 1995
Structure and evolution of teleost mitochondrial control regions. J. Mol. Evol.
(1995) Nr. 41, p. 54 66.
329. WU C., YE Y., CHEN R., 1986 Genome manipulation in carp (Cyprinus carpio
L.), Aquaculture, 54, p. 57 61.
330. ZARDOYA R., MEYER A., 1996 Phylogenetic performance of mitochondrial
protein-coding genes in resolving ralationships among vertebrate. Mol. Biol.
Evol. Nr. 13)7), p. 933 942.
331. ZARDOYA R., DOADRIO, I., 1998 Phylogenetic relationships of Greek
Cyprinidae: molecular evidence for at least two independent origins of the
Greek cyprinid fauna, sub tipar.(abstract).
332. ZARDOYA R., DOADRIO, I., 1998 Phylogenetic relationships of Iberian
cyprinids: systematic and biogeographical implications, Proc. R. Soc. Lond. B
Nr. 265, p. 1365-1372.
187
333. ZHANG H., OKAMOTO N., IKEDA Y., 1995 - Two c-myc genes from a tetraploid
fish, the common carp (Cyprinus carpio). n Gene Nr. 153, p. 231236.
334. ZHANG J., ROSENBERG H. F., NEI M., 1998 Positive Darwinian selection
after gene duplication in primate ribonuclease genes. Proc. Natl. Acad. Sci.
USA, Nr. 95, p. 3708 3713.
335. ZUCKERKANDL E., PAULING L., 1962 Molecular disease, evolution and
genetic heterogenity. In Horizons in biochem8istry,. Acad. Soc. New York. p.
189 252.