Sunteți pe pagina 1din 43

Universitatea de Stiinte Agricole si Medicina

Veterinara “Ion Ionescu de la Brad”, Iasi

Predictia valorii de
ameliorare a
reproducatorilor

Conf.dr. Maciuc Vasile


CURS.1.

1. Notiuni introductive
2. Elemente de calcul matricial

1. Ameliorarea este procesul de modificare dirijata a genofondului populatiilor de


animale domestice in directia utila omului. Modificarea bazei ereditare a populatiilor se
realizeaza prin interventia omului in procesul de schimbare a generatiilor, de reproductiei
a populatiilor. In acest context se poate defini ameliorarea ca process de organizare a
reproductiei populatiilor, in asa fel incat fiecare noua generatie sa fie mai buna decat cea
precedenta.
In functie de obiectivele urmarite in cresterea animalelor, omul hotaraste care
animale vor fi selectionate pentru a fi folosite la reproductiei si care animale vor fi
eliminate. Selectia practicata de om este un proces de descriminarea reproductiva
neintamplatoare a indivizilor. O etapa esentiala a selectiei artificiale o reprezinta
identificarea celor mai bune genotipuri.
Ideea de a folosi la reproductie cele mai bune animale este veche, fiindca indicata
de Varro cu 2000 ani i.e.n. Problema a fost reluata in timp de diferiti autori.
Aparitia si extinderea insamantarilor artificiale in primele decenii ale sec. 20, a
avut ca efect cresterea intensitatii selectiei taurilor, aceasta devenind cea mai eficienta
cale de obtinere a progresului genetic.
Primele procedee de evaluare genetica au avut in vedere reproducatorii masculi.
Cel mai simplu procedeu pentru cunoasterea valorii de ameliorare a unui reproducator se
bazeaza pe comparatiile de tipul mama-fiica (Indicele Hansson-Yapp). Aceasta varianta
este orientativa deoarce pe de o parte nu tine numarul descendentilor si de heritabilitatea
analizate, iar pe de alta parte nu se asigura comparabilitatea datelor intrucat
performantele mamelor sunt realizate in perioade diferite.

2
In 1932, Wright propune o metoda care elimina din neajunsurile Hansson-Yapp,
intrucat introduce in analiza si numarul de cupluri mama descendenti. Cu toate ca au luat
in considerare si parametrii geneticii, problema coparabilitatii performantelor mamelor si
ficelor a ramas nerezolvata.
Dupa utilizarea indicelui de selectie in ameliorarea plantelor de catre Smith
(1936), Hazel (1943) il extinde in domeniul ameliorarii animalelor. Aceasta teorie a stat
la baza dezvoltarii a numeroaselor sisteme de evaluare genetica a animaleor. Bazandu-se
pe aceasta teorie, Robertson si Rendel (1954) au propus metoda “compararii cu
contemporanii”. In scopul cresterii preciziei evaluarii genetice a reproducatorilor metoda
a fost perfectionata in diferite tari, in special in S.U.A. de catre cercetatorii de la
Universitatea Cornell, New York, realizandu-se mai multe variante ale acestei metode “
Cross contemporary comparison”; Paired contemporary comparison”, Maximum
likelihood comaprison”, “Modified contemporany compparison”, (Dickinson si colb
1976). Henderson 1963, 1973 degeneralizeaza teoria indicelui de selectie (B.L.P- Best
Linear Prediction- Cea mai buna predictie liniara), insa ii arata si limitele. Una dintre ele
se refera la consecintele generalizarii insamantarilor artificiale si anume distributia
neuniforma a descendentilor reproducatorilor in timp si in spatiu. Teoria indicelui de
selectie presupune cunoscuta media populatiei, ori in noile conditii create era nevoie sa se
cunoasca mediile pe ani, ferme si sezoane diferite.
In acesta situatie B.L.P nu poate fi folosit, motiv care l-a determinat pe Henderson
sa propuna in 1949 o noua procedura de avaluare genetica, numita B.L.U.P (Best Linear
Unibiased Prediction- Cea mai buna predictie liniara nedeplasata).
Volumul mare de date primare necesare de a fi prelucrat il determina pe
Henderson sa gaseasca o varianta de lucru mai usor de parcurs. Astfel, propune varianta
numita, “ Mixed Model Metodology” are conduce la rezultate B.L.U.P (1973. 1974). Din
punct de vedere matematic, metodologia modelului mixt nu este altceva decat o
combinatie intre indicele de selectie si metoda celor mai mici patrate.
Utilizarea B.L.U.P permite o evaluare simultana a efectelor genetice si a celor de
mediu. Din cauza limitelor, mijloacelor de calcul, primul model liniar rezolvat cu ajutorul
B.L.U.P a fost modelul “ tata”. Acest fapt a creat o oare care confuzie, de multe ori
punandu-se egalitatea intre B.L.U.P si modelul tata. Se vorbeste uneori de B.L.U.P. ceea

3
ce este inexact deoarece B.L.U.P. este o procedura statistica utilizata pentru rezolvarea
unui model.
In ultimii ani, o data cu aparitia unor calculatoare performante, a devenit posibila
aplicarea metodologiei B.L.U.P. unor modele animale individuale. Aceasta realizare este
remarcabila intrucat permite trecerea de la faza de modele operationale, la faza de modele
numite “ideale” astfel, a fost posibil sa se treaca de la modelarea la nivel de parinti ai
individului (modelul tata sau modelul tata-mama) la modelarea la nivel de individ (model
animal individual). Folosirea unui model animal individual permite eliminarea unor
ipoteze implicite sau explicite, impuse unor modele mai simple.
Probabil, modelul animal individual nu este decat o etapa catre alte sisteme de
evaluare genetica mai sofisticate.
Aferent celor expuse mentionam faptul ca obiectul ameliorarii este populatia si nu
individul. Dupa formarea individului baza sa ereditara nu mai poate fi schimbata .
Singura posibilitatea de modificare dirijata a bazei ereditare este interventia omului
inainte de formarea zigotului, iar o modificare in acest moment se refera la populatie si
nu la individ. Intervenind in procesul reproductiei populatiei, omul elimina de la
reproductie indivizii necorspunzatori nevilor sale. Eliminarea de indivizi este echivalenta
cu eliminarea de gene din populatie care, are ca efect imediat modificarea frecventei
genelor si a genotipurilor din populatia respectiva. De asemenea, productia medie pe cap
de animal depinde de baza ereditara si de mediu, iar productia globala, este o functie a
trei factori :
- potentialul genetic
- conditiile medii de exploatare
- numarul de animale aflate in exploatare
Calea de viitor a cresterii productiei totale este aceea a sporirii productiei medii pe
cap de animal realizata prin actiunea conjugata a ameliorarii si a exploatarii.

2. Elementele de calcul matricial

Matricea este un tabel de mxn elemente, dispuse in m linii si n coloane. Aceste


elemente pot fi expresii alfanumerice, expresii matematice sau alte matrice.

4
Elementele se scriu cu doi indici, dintre care primul indica numarul de ordine al liniei,
iar al doilea coloanei aij. De exemplu, factorii dintr-un experiment ce se desfasoara pe
baza a doua probe, supuse la trei tratamente, pot forma o matrice de genu:
⎛6 4⎞
⎜ ⎟
M = ⎜ 3 9 ⎟ , unde liniile reprezinta tratamentele, iar
⎜8 5⎟
⎝ ⎠
coloanele probele.
Perechea ordonata de numere {m, n}, da informatii asupra ordinului sau dimensiunii
si se numeste tipul matricei.
Cand numarul de linii este egal cu cel al coloanelor (m=n), matricea este denumita
matrice patrata, iar numarul m reprezinta ordinul matricei.
In grupa matricelor patrate se intalnesc urmatoarele tipuri: matrice nula, matrice
de identitate, matrice diagonala.
Matricea nula are toate elementele egale cu zero,
Matricea de identitate notata cu litera I sau In, contine elemente egale cu zero, cu
exceptia celor de pe diagonala principala, egala cu 1.
Matricea diagonala se aseamana cu matricea de identitate, cu exceptia elementelor
de pe diagonala principala, care pot fi diferite de unu, egale sau nu intre ele.
O matrice care contine o singura linie sau o singura coloana poarta numele de
matrice linie, respectiv matrice coloana sau vector linie, respectiv vector coloana.
In situatia cand o matrice contine drept elemente alte matrice, elementele
respective se numesc blocuri. Toate blocurile pozitionate pe aceiasi linine, respectiv
coloana sunt egale intre ele in ceea ce priveste numarul de linii, respectiv coloane.
Un termen des folosit in algebra matriceala este scalarul si este reprezentat in
general de un numar real. Scalarul poate fi definit si ca o matrice cu o linie si cu o
coloana (m=n=1)
Adunarea matricelor este asociativa: (A+B)+C = A+(B+C) si comutativa: A+B =
B+A
Diferenta dintre matrice este posibila daca se respecta dimensiunile in ceea ce
priveste numarul de linii si numarul de coloane (m=p si n=q).

5
Diferenta mai este definita si ca adunarea a doua matrice, una fiind in prealabil
inmultita cu -1: A+(-1)B
In unele modele matematice, poate fi necesar ca intre matrice sa se realizeze o
suma directa. Matricea care reprezinta suma va avea ca dimensiuni cumulul de linii si
coloane, iar sub aspect valoric nu se realizeaza o insumare a termenilor omologi
(aij+bij), ci o simpla aranjare, in cadrul diagonalei principale, a matricelor.
Produsul unei matice A cu un scalar k se face inmultind fiecare element al
matricei cu acest scalar.
Doua matrice A si B pot fi inmultite intre ele cand n=q, deci cand numarul
coloanelor primei matrice este egal cu numarul liniilor celei de a doua matrice.
Inmultirea matricelor este asociativa (AB)C=A(BC) si necomutaiva AB ≠ BA
Imultirea matricelor este distributiva (la dreapta sau la stanga), fata de adunarea
matricelor. (A+B)C=AC+BC, A(B+C)= AB+AC
Pentru inmultirea matricelor de dimensiuni mari se recomanda partitionarea
prealabila a acestora.
In metoda Kronecker se realizeaza produsul dintre un scalar si blocul matriceal.
Scalarul este reprezentat de fiecare element al matricei din stanga, iar blocul matriceal
de matricea din dreapta. O alta particularitate a acestei metode consta in faptul ca
fiecare produs intermediar scalar-bloc matriceal, va ocupa in matricea raspuns locului
corespunzator scalarului.

Semnul caracteristic este ‫٭‬.


Imnultirea matricelor prin metoda Hadamardse aseamana cu adunarea matricelor,
deosebirea constand in faptul ca elementele omoloage nu se aduna ci se inmultesc.
Transpusa unei matrice este o inversare a liniilor cu coloanele (liniile ajung
coloane si invers). Transpusa unui produs a doua sau a mai multe matrici este un produs
de transpuse a fiecarei matrice, in ordine inversa.
Trace (tr) se aplica matricilor patrate si reprezinta suma elementelor pe diagonala
principala.
Determinantul unei matrice este un scalar si este posibil sa se calculeze numai
pentru matricele patrate. Daca A este o matrice patrata, determinantul poate fi notat | A|.

6
Procedura pentru calcularea determinatului unui scalar (o matrice de 1x1) este
insusi scalarul.
Exemplu: A=5, |A|=5
Determinantul unei matrice 2x2 este obtinut prin diferenta dintre produsul
elementelor de pe diagonala principala si produsul elementelor de pe diagonala
secundara.
Exemple:
⎛ 3 4⎞
A = ⎜⎜ ⎟⎟ , |A|=3(1)-2(4)=-5
⎝2 1⎠
|A|= -5
Pentru calcularea a determinantului unui matrice de ordinul 3x3, sau mai mare se
poare folosi metoda complementului algebric.
In general, complementul algebric corespunzator elementului algebric aik, al
determinantului D, este expresia: Aik=(-1)i+k Dik, unde D este matricea rezultata in urma
reducerii liniei si coloanei corespunzatoare elementului matricealpentru care se
calculeaza complementul algebric.
Complementul algebric al elementului a22 se obtine prin reducerea liniei si
coloanei corespunzatoare elementului, urmat de produsul dat.
Rangul matricei este ordinul maxim al unui determinant diferit de zero extrax din
matricea A.
Matricea inversa notata A ֿ◌ ¹, a unei matrice patrate date este prin definitie o
matrice patrata cu proprietatea : AA −1 = A −1 A = I
O matrice admite inversa daca si numai daca este nesingulara adica determinantul
este ≠0.
Aij = (− 1)
i+ j
Se calculeaza cu ⋅ Dij , unde Dij este minorul corespunzator

elementului aij, adica determinantul obtinut suprimand in |A| linia i si coloana j.


Un sistem de ecuatii se numeste algebric, daca toate ecuatiile lui sunt algebrice.
Acest sistem este liniar, daca ecuatiile sunt de gradul intai.
Un sistem de ecuatii liniare are forma:

7
a11 x1 + a12 x 2 + ... + a1n x n = b1
a 21 x 2 + a 22 x 2 + ... + a 2 n x n = b2
−−−−−−−−−−−−−−−−−
a m1 x1 + a m 2 x 2 + ... + a mm x n = bn
Rezolvarea sistemelor de “n” ecuatii liniare cu “n” necunoscute se face folosind
urmatoarele metode.
1. Metoda Cramer
D xi
Xi = unde i=1,2....n si Dxi
D

2. Metoda Matriciala (a matricei inverse)


X = A −1 ⋅ B

3. Metoda eliminarii totale (Gauuss- Jordan) se duduce succesiv


( A | B ) ⇒ (A −1 A | A −1 ⋅ B ) ⇒ (I | X ) ( unde I este matricea de identitate de
ordinul n. Elementele necesare modelarii liniare.

8
CURS 2.
Elemente necesare modelarii liniare

1. Datele primare
2. Factori ficsi si factori aleatori
3. Clasificarea modelelor liniare
4. Exemple de modele liniare
Populatia este un sistem supraindividual care nu poate fi privit si studiat direct,
cum se face cu individul sau celula. Sistemele ca realitate obiectiva apar in procesul
cunoasterii, ele pot fi intelese, studiate, prin modelare. Modelarea este procesul de
studiere a comportamentului sistemelor reale cu ajutorul modelelor. Modelul reprezinta
forma simplificata a unui sistem real, pastrand insa ceea ce are el esential, din punct de
vedere a ceea ce se doreste a fi evidentiat.
In procesul cunosterii aceluiasi sistem i se pot asocia mai multe modele:
ƒ Modele materiale(machete, mulaje)
ƒ Modele grafice (schite, scheme, diagrame)
ƒ Modele matematice
A treia categorie de modele face obiectul acestui curs. Disciplina care se ocupa cu
modelarea matematica a sistemelor biologice se numeste biometrie, modele numindu-
se si modele biometrice.
Calitatea oricarei analize statistice este apreciata prin modelul ales sa descrie cel
mai bine datele primare, numite si observatii.
1. Datele primare (observatiile)
Dupa modelul de alcatuire a genotipului caracterele se grupeaza in doua categorii:
ƒ Caractere calitative- determinate de un genotip simplu, alcatuit dintr-o singura
pereche de gene alelice

9
ƒ Carctere cantitative- a caror aparitie este determinata de un genotip alcatuit din
mai multe perechi de gene alelice.
Majoritatea caracterelor importante din punct de vedere economic, prezinta diferente
de grad de manifestarein cadrul unei scari de valori, de la individ la individ. Aceste
variatii sunt denumite continue, iar caracterele care manifesta aceasta continuitate –
caractere cantitative.
De regula caracterele cantitative sunt exprimate prin valori care reprezinta
unitatile metrice in care a fost masurat caracterul considerat, sau rezultatul unei
numaratori (de ex. Kg de lapte, kg de lana, nr. purcei etc)
Valoarea care exprima manifestarea fenotipica a unui caracter cantitativ se
numeste performanta sau valoare fenotipica. Cunoasterea valorii fenotipice se
realizeaza prin control (masurare, cantarire, numarare). In cele mai multe cazuri,
performantele brute obtinute in urma controlului nu pot fi utilizate pentru ierarhizarea
animalelor, fiind necesara o prelucrare a lor in vederea eliminarii influnetei unor
factori interni si/sau externi. In urma corectiei valorii fenotipice se obtine informatia
fenotipica- materia prima de baza in predictia valorii de ameliorare.

2.Factorii ficsi si factorii aleatorii.

Valoarea fenotipica a unui caracter cantitativ este deteminata de factori cu efecte


cunoscute (tangibili) si factori cu efecte necunoscute (intangibili). Factorii cu efecte
cunoscute pot si fi grupati in:
ƒ Factori controlati
ƒ Factori necontrolati
Dintre factorii controlati , unii au efect principal asupra realizarii valorii fenotipice,
urmarind sa li se testeze semnificatia diferentelorcu privire la nivelurile incluse in
analiza (testul Fisher)
Acestia se numesc factori cu efect testat ca semnificatie. In unele situatii, efectul
acestor factori este mascat de efectul altorfactori, numiti secundari. Factorii cu efect
secundar nu se testeaza ca semnificatie, ei sunt tinuti sub control statistic, in scopul

10
micsorarii cotei de participare a variantei erorii la varianta valorii fenotipice, marind
astfel acuratetea rezultatelor experimentale, prin punerea in evidenta a efectului factorului
principal.
Exemplu: daca se studiaza semnificatia efectelor unro doze de variate de hormoni
de crestere asupra sporului mediu zilnic de crestere la taurine, modelul va trebui sa
cuprinda pe langa efectul tratamentului (factor principal) si alte efecte cum ar fi varsta
animalului, sexul, tipul de intretinere, dieta si rasa (efecte secundare). Ignorarea factorilor
secundari , denatureaza puternic interpretarea rezultatelor pentru factorul de interes
principal.
Din multimea factorilor doar un numar limitat poate fi controlat, uramand ca
influenta celorlati factori necontrolati sau necunoscuti sa se insumeze in componentul
eroare. Prin eroare se intelege efectul tuturor factorilor care nu au fost luati in analiza.
De exemplu cantitatea de lapte a unei vaci este influentata de potentialul ei
genetic, varsta la fatare, sezonul in care a fatat, durata repausului mamar.
Dintre factorii care afecteaza performanta unui individ, identificarea celor de
mediu este o etapa delicata. Ignorarea unora care au o influenta reale asupra performantei
duce la evaluari genetice deplasate. De exemplu, daca se omite corectie performantei
pentru efectul sezonului de fatare, considerand productia sa de lapte mai slaba ca fiind
datorata unui nivel genetic scazut. Clasamentul candidatilor la selectie va fi modificat,
conducand la erori in operatiunile de selectie. Un alt neajuns il constituie supraestimarea
preciziei evaluarii genetice.
Dimpotriva, includerea in analiza a unor factori fara importanta reala este de dorit
sa se evite, intrucat mareste riscul desconexiununii, ceea ce duce la scaderea preciziei
evaluarii genetice. Dixconexiunea este absenta de informatii care permite o comparatie
fiabila a candidatelor la selectie. Ea apare atunci cand se incearca evaluarea genetica a
animalelor di ferme diferite care functioneaza in circuit inchis, deci indivizii di fermele
respective nu au ascendenti comuni sau cand indivizii sunt di aceiasi ferma si
performantele nu sunt repartizate unitar in toate lunile anului.
In unele situatii, modelul contine si un efect al interactiunii genotip mediu. Astfel
se considera ca efectul lunii de fatare la vaci nu este acelasi pentru un an cu seceta sau un
an ploios, pentru o vaca aflata la a treia fatare. Ca urmare efectul lunii de fatare trebuie

11
definit pentru fiecare an si fiecare lactatie. Trebuie insa subliniat ca luarea in considerare
a instructiunilor GxM nejustificate diminueazaprecizia evaluarii genetice si sporeste
riscul disconexiunilor.
In analizile genetico-statistice factori sunt reprezentati prin litere latine mari: A,
B, C, etc, iar nivelurile lor cu litere latine mici. Astfel nivelurile potentiale ale factorului
A sunt notate prin simboluri a1, a2 a3,....ap. Daca p reprezinta multimea numerilor
respectiv nivelurilor, numarul real de niveluri inclusin experiment este notat cu p. Cand
p=P, deci toate nivelurile factorului sunt cuprinse in analiza, factorul P studiat este
considerat fix. Daca numarul real de niveluri cuprinse in experiment sunt alese dupa un
anumit criteriu, factorul analizat este tot fix, p=P efectiv. Daca nivelurile cuprinse in
experiment constituie o proba extrasa la intamplare dintr-o populatie de niveluri normal
distribuita, factorul studiat este considerat randomizat.

1. Clasificarea modelelor liniare.


Orice model liniar trebuie sa contina trei parti: ecuatia, valorile asteptate ale mediei
si variantelor efectelor randomizate, ipotezele modelului.
Ecuatia modelului liniar general poate fi scrisa sub forma:
Yi = ∑ Wij B j + ei unde:

ƒ Y1= valoarea observata


ƒ Wji= coeficientii constanti, cunoscuti,
ƒ B= parametrii necunoscuti,
ƒ ei = eroarea corespunzatoare valorii Yi sau in notatie matriciala

Y = W B + e : unde:
ƒ Y= vectorul observatiilor, de dimensiune Nx1, N-numarul de observatii,
ƒ W= matrice cu coeficienti cunoscuti
ƒ B= vector al efectelor necunoscute
ƒ e= vector al erorilor randomizate
Daca B este divizat in doi vectori, b si u, iar W este partitionat in doua matrice: X si Z,
ecuatia modelului liniar general poate fi scrisa sub forma:

12
Y = X b + Z u + e , in care:

ƒ e= vector al erorilor randomizate


ƒ Y= vectorul observatiilor,
ƒ X= matrice cu constante necunoscute,
ƒ p= numar de niveluri ale factorului fix
ƒ b= vector al efectelor fixe necunoscute
ƒ Z= matrice cu constante cunoscute
ƒ u= vector al efectelor randomizate

In ceea ce priveste criterii de calsificare a modelelor liniare avem:


1. Dupa rangul matricei W
ƒ Cazul rangului complet. Este cazul modelelor de regresie.
ƒ Cazul rangului necomplet se mai numesc si modele singulare,
situatie specifica modelelor folosite cu ANOVA( Analysis of
variance- analiza de varianta)
2. dupa natura valorilor
ƒ modele de analiza a variantei, cand constantele Wij iau valorile 1 sau 0
care au sensul de variabile indicator, aratand absenta sau prezenta
influnetei diferitilor factori bj asupra observatiilor facute.
ƒ Modele de analiza a regresiei, cand constantele wij descriu o multime
continua de valori
ƒ Modele de analiza a covariantei, cand o parte din constantele Wji sunt
variabile indicator si o alta parte descriu o multime continua de valori
3. dupa natura parametrilor necunoscuti:
ƒ modele cu efecte fixe (constante) modelul P I
ƒ modele cu efecte aleatorii modelul de tipul P II
ƒ modele mixte, sau modele de tipul P III, in care B Contine atat factori
ficsi (b), cat si factori aleatori (u).
4. dupa modul in care se desfasoara experientele:
ƒ model incrucisat, este modelul in care fiecare nivel al unui factor apare
impreuna cu toate nivelurile celorlalti factori din analiza

13
ƒ model ierarhic, unde fiecare nivel al unui factor apare impreuna numai
cu unele niveluri ale celuilalt factor. Factorii participanti pot fi la
randul lor ficsi, randomizati, sau pot apare impreuna.
5. dupa numarul factorilor luati in studiu:
ƒ modele monofactoriale
ƒ modele bifactoriale
ƒ modele polifactoriale
6. dupa numarul de observatii din celule:
ƒ modele cu o singura observatie in celula; cu un singur experiment
pentru toate combinatiile
ƒ modele echilibrate (balansate), in care se face acelasi numar de
observatii pentru toate combinatiile
ƒ modele neechilibrate (nebalansate) cu un numar inegal de observatii in
celula, difera de la celula la celula.
7. dupa capacitatea modelului de a descrie datele primare:
ƒ modelul adevarat, care realizeaza o descriere perfecta a datelor
ƒ modelul ideal este ales de catre specialist in asa fel incat sa se apropie
cat mai mult de modelul adevarat
ƒ modelul operational P este o versiune simplificata a modelului ideal si
se utilizeaza in analiza practica a datelor primare.

2. Exemple de modele liniare.


A. Modele liniare monofactoriale.
Modelul de tip I
Ecuatia: Yij= μ+αi+eij
ƒ Yij= valoarea observata;
ƒ μ = media populatiei
ƒ αi= efectul fix al factorului i,
ƒ eij= eroarea corespunzatoare observatiei j di proba i, care a
condus la valoarea Yij;
B. Modelul de tip II

14
Ecuatia Yij= μ+Ai+eij , unde:
ƒ Yij= vectorul observatiilor
ƒ μ = media populatiei
ƒ Ai= efectul randomizat al factorului
ƒ eij= eroarea corespunzatoare observatiei j di proba i, care a
condus la valoarea Yij;
C. Modele liniare bifactoriale. Modelul de tip I.
Yijk = μ+ai+bi +(abij) + eijk unde:
- abij interactiunea dintre cei doi factori, trebuei testata: daca este
nesemnificativa, modelul devine:

Yijk = μ+ai+bi +eijk

D. Modelul de tip III (Mixt)


ƒ Modelul mixt, primul factor este fix, al doilea este aliatoriu:
Yijk = μ+ai+Bj+ (aBj) +eijk

ƒ Model mixt, primul factor este aleator, al doilea este fix:

Yijk = μ+Ai+bj+ (Abij) +eijk


Relatiile valabile pentru modele cu factori incruscisati. Pentru modele ierarhice,
de exemplu modelelul de tip II, ecuatia modelului este:

Yijk = μ+Ai+Bj(i) +eij(i)k

15
CURS 3.
Predictia valorii de ameliorare si principiile valorii de
ameliorare
1. Principiile predictiei valorii de ameliorare
2. Predictia valorii de ameliorare prin metoda celor mai mici patrate
3. Predictia valorii de ameliorare prin metoda indicilor de selectie.
1. Genotipul individului este, deocamdata , imposibil de modificat dupa formarea
zigotului. Singura posibilitate practica de a realiza baza ereditara este aceea de a interveni
inaite de a se forma zigotul. Interventia se face la nivelul populatiei si nu la nivelul
individului, modificandu-se generatia urmatoare si nu cea actuala. Pentru a realiza o
imbunatatire genetica a populatie , trebuie sa se selectioneze in generatia curenta acele
animale care au cea mai mare valoare genetica reala pentru caracterele importante
economic. Valoarea genetica reala nu poate fi masurata direct pe animale, dar poate fi
dedusa din valorile fenotipice ale animalelor sau ale rudelor acestora.
Componentele valorii fenotipice (P) sunt valoarea genotipica (G) si valoarea datorata
mediului (M).
P= G+ M
Valoarea genotipica este determinata de efectul genelor si al interactiunilor
genetice intre genele care intra in genotipul caracterului respectiv.
Valoarea genotipica este determinata la randul ei de trei componenti cauzali,
valoarea de ameliorare (A), valoarea datorata dominantei (D), si valoarea datorata
epistazei:
G=A+D+I
Valoarea de ameliorare este suma efectelor medii ale genelor care controleaza
caracterul dat si pe care le are individul, insumarea fiind facuta pentru toate perechile de
alele, la fiecare locus si la toti locii.

16
Daca se are in vedere situatia de la un singur locus atunci G=A+D. Diferenta intre
valoarea genotipica si valoarea genetica aditiva este cunoscuta ca valoare datorata
dominantei. Valoarea de dominanta este suma interactiunilor intralocus, insumarea fiind
facuta pentru toti locii. In absenta acestor interactiuni G=A. Daca genotipul se refera la
mai multi loci valoarea genotipica poate sa contina si o valoare determinata de
interactiunea intre genele situate in loci diferiti, numita valoare datorata epistaziei(I).
Valoarea datorata epistaziei este suma valorilor create de interactiunile posibile intre
genele de doi,trei sau mai multi loci.
Valoarea datorata mediului este creata de toate celelalte surse care influenteaza
manifestarea caracterului respectiv.
La randul sau si mediul poate fi descompus in doua surse:
M=Mg+Ms unde:
Mg-efectul de mediu general , numit si permanent, determinat de acele conditii de mediu
comune fie mai multor performante masurate pe indici diferiti, fie performantelor
repetate pe acelasi individ;
Ms-efectul de mediu special, numit si temporar, asociat fiecarei performante repetate ale
aceluiasi individ sau fiecarei performante masurate pe indivizi diferiti.
Relatia poate fi scrisa:
P=A+D+I+Mg+Ms; in care elementele din partea dreapta sunt reciproc
necorelate. Fiind afectate si de mediul special, diferit de la un individ la altul,
performantele brute (P) nu sunt comparabile, de unde rezulta ca indivizii nu pot fi alesi la
reproductie sau productie direct pe baza acestora.
Daca P si componentele sale se exprima ca abatere de la medii, obtinem
urmatoarea relatie:

P ⋅ μ (P ) = A − μ ( A) + D − μ (D ) + I − μ (I ) + M g − μ (M g ) + M s − μ (M s )

Notand: Y=P
a =A- μ(A)
i =I- μ(I)
p=Mg- μ(Mg)
d=D- μ(D)

17
e=Ms- μ(Ms)
Modelul fundamental al geneticii cantitative poate fi rescris in termen de deviatii
de la medie:
Y= μ+a+d+i+p+e efectele a,d,i,p,e, au media zero si sunt necorelate.
In procesul de predictie a valorii de ameliorare intereseaza cunoasterea actiunii
aditive a genelor, componentul a trecand in componentul rest notat tot cu e tot ceea ce
este influenta genetica neaditiva sau influenta de mediu astefel ca relatia poate fi scrisa
pentru un individ i :
Yi= μ+ai+ei
Se constata ca orice valoare observata a unui individ i este suma a trei parti:
-media generala μ, comuna pentru toate observatiile
-deviatia de la media generala provocata de cea de a doua sursa de variatie(ai)
-deviatia de la media generala provocata de cea de a doua sursa de variatie(ei)
De regula, in componentul ei se include efectul tuturor factorilor care in general,
nu pot fi controlati.
Din definita valorii de ameliorare data in termeni de efecte medii, nu rezulta cum
se poate calcula efectiv aceasta valoare(nu se poate masura efectul mediu al genelor).Se
stie insa ca parintii transmit descendentei genele si nu genotipul lor, prin urmare, efectul
mediu al genelor parintilor determina valoarea genotipica medie a descendentelor.
Valoarea unui individ, apreciata, prin valoarea medie a descendentilor sai se numeste
valoare de ameliorare.
Daca un mascul este imperecheat cu un nr de femele luate la intamplare din
populatie , atunci valoarea sa de ameliorare va fi egala cu dublul mediei deviatiei
descendentilor sai de la media populatiei, deoarece masculul respectiv asigura numai
jumatate din gene la descendenti, cealalta jumatate venind la intamplare din populatie
prin femele.
Valoarea de ameliorare a unui individ (A) poate fi exprimata ca medie a valorilor
AT + AM
de ameliorare ale parintilor sai: A = , astfel ca performanta unui descendent
2
AT + AM
oarecare este : P = + D + I + Mg + Ms
2

18
Daca numarul partenerelor este sufficient de mare si au fost luate la intamplare
din populatie: D, I, Mg si Ms se anuleaza reciproc, ramanand in evidenta:
AT + AM
P= 0 + 0 + 0 + 0 ceea ce inseamna ca la nivel de populatie media valorilor
2
fenotipice este egala cu media valorilor de ameliorare.
Deci, valoarea de ameliorarea unui individ reprezinta de doua ori abaterea
descendentilor lui de la media populatiei:
( )
AT = 2 × p − μ nu e corect.

AT = 2 P − μ
Afirmatiea este valabila cand numarul descendentilor este infinit si partenerii reprezinta
insasi populatia, teoretic infinita.
Statistica matematica ajuta la aproximarea valorii de ameliorare reale, pe baza
unui numar finit de descendenti. Aprecierea are un caracter probabilistic in sensul ca pe
baza descendentilor obtinuti pana la un moment dat, este posibil sa se prevada valoarea
medie a viitorilor produsi.
Predictia valorii de ameliorare nu constituie un scop in sine, ea foloseste pentru
alegerea animalelor la reproductie si necesita cunoasterea urmatoarelor elemente :
-informatia sau informatiile fenotipice reprezentate de performanta proprie si
performantele diferitelor tipuri de rude
-relatiile genetice intre indivizi (coeficientii de inrudire)
-forma de distributie (repartitie) a valorilor de ameliorare (a) si a performatelor observate
(y)
-media populatiei (μ) pentru caracterul vizat. Constanta μ este o valoare comuna pentru
cele trei tipuri de medii: media valorilor fenotipice , μy; media valorilor genotipice μg; si
media valorilor genetice aditive μa.
-variantele si covariantele la nivel de populatie. Acestea stau la baza estimarii
parametrilor geneticii: heritabilitatea (h²), repetabilitatea (R) si corelatia genotipica (G).
In functie de cunoasterea acestor elemente exista trei posibilitati in vederea
predictiei valorii de ameliorare:
a. metoda celor mai mici patrate, cunoscuta sub denumirea de metoda BP( Best
Prediction= cea mai buna predictie)

19
b. metoda indicilor de selectie, cunoscuta sub denumirea de metoda BLP ( Best Linear
Prediction =cea mai buna predictie liniara);
c.metodologia BLUP, ( Best Linear Unbiased Prediction= cea mai buna predictie liniara
nedeplasata), o combinatie a primelor doua metode.
In lucrarile de ameliorare este intalnita frecvent situatia unei distributii inegale a
valorilor observate in cadrul diferitelor clase de factori luati in considerare. Estimarea
efectelor factorilor in aceasta situatie este posibila prin aplicarea metodei celor mai mici
patrate.
Metoda celor mai mici patrate se bazeaza pe unele din proprietatile mediei
aritmetice si anume :
-suma abaterilor valorilor observate Xi de la media aritmetica X̅̅ este egala cu zero
-suma patratelor abaterilor valorilor observate Xi de la media aritmetica X̅ este mai mica
decat suma patratelor abaterilor acelorasi valori, fata de oricare alta valoare Xk.
Principiul metodei in conditia ca suma abaterilor la patrat sa fie minima:

n 2

Q = ∑ (Yi − Yk ) → minim conditie ce este realizata pentru Yk = Y


i =1

Media in cadrul metodei celor mai mici patrate este o medie ajustata si rezultata in
urma prelucrarii datelor primare. Ajustarea este necesara deoarece observarea si
inregistrarea datelor primare este supusa erorilor aleatoare.
Obtinerea rezultatelor prin metoda celor mai mici patrate necesita parcurgerea
urmatoarelor etape:
-alegerea unui model matematic .Structura datelor experimentale conditioneaza
tipul modelului. De exemplu: cantitatea de lapte a unei vaci poate fi influentata de efectul
fermei si efectul genetic al tatalui. In acest caz ecuatia modelului este:

Yijk = μ+Fi+Tj +eijk


unde : Yijk – performanta vacii
μ – media populatie
Fi – efect fix al fermei
Tj – efect fix al taurului

20
eijk- efect aleator al altor factori
- obtinerea ecuatiilor normale. Acest lucru este posibil, aplicand conditia ca suma
abaterilor la patrat sa fie minima , derivarea partiala a expresie matematice a acestei
conditii in functie de media populatie si fiecare efect fix si egalarea acestor derivate
partiale cu zero.
Evaluarea reproducatorilor prin metoda celor mai mici patrate se face in ipoteza
ca T este fixat, ceea ce in practica nu este adevarat. Deoarece varianta erorilor evaluarii
genetice nu este minima , exista tendinta ca metoda celor mai mici patrate sa
supraevalueze sau sa subestimeze reproducatorii care au o cantitate mai redusa de
informatii. Inlaturarea acestui neajuns se face prin aplicarea metodologiei BLUP- model
mixt.
3.) Predictia valorii de ameliorare prin metoda indicilor de selectie.
Multa vreme predictia valorii de ameliorare s-a bazat pe utilizarea unui singur
caracter si a unei singure surse de informatii( performanta proprie). In practica insa ,
valoarea economica a animalelor depinde de mai multe caractere masurate pe acelasi
individ sau pe diferite rude. O solutie la aceasta problema o constituie BLP folosirea
indicelui de selectie.
Indicele de selectie este metoda folosita pentru predictia valorii de ameliorare a
unui animal, prin combinarea tuturor surselor de informatii disponibile( performante
proprii, ascendenti colaterali, descendenti) pentru unu sau mai multe caractere care intra
in obiectul selectie.
Utilizarea indicelui de selectie ( BLP) aplica anumite cerinte , cum ar fi:
- cunoasterea parametrilor de nivel( exemplu : media populatie)
- cunoasterea parametrilor de dispersie( variantele) respectiv parametri genetici( h², R, G)
- candidatii la selectie sa fie contemporani sau sa provina din grupe genetice similare.
Indicii de selectie pot fi grupati in doua categorii:
A. in selectia candidatilor pentru un singur caracter, folosind performantele proprii si ale
rudelor
B. in selectia candidatilor pentru doua sau mai multe caractere, considerate simultan,
folosind performantele proprii si ale rudelor.

21
Initial termenul de indice de selectie a fost propus pentru cazul selectie pe mai
multe caractere. F. Smith introduce acest criteriu in selectia plantelor( 1936) adoptat
ulterior la animale , de catre L. N. Hazel si J.L. Lush ( 1943) pentru un singur caracter.
Selectia pe mai multe surse de informatie a fost initiata inca din 1931 , de catre S. Wright
si L.N. Hazel deci inainte de a fi prezentata de Smith in ameliorarea plantelor.
In ambele cazuri ( un caracter sau mai multe caractere) indicele combina
informatia disponibila intro cifra globala care exprima in cel mai inalt grad valoarea de
ameliorare a candidatului la selectie. Aceasta valoare este folosita pentru acceptarea sau
respingerea candidatului de la reproductie.
Indicile de selectie pentru un singur caracter poate cumula informatii
provenite de la mai multe surse disponibile : performante proprii, ascendenti, colaterali,
descendenti, pentru acelasi caracter. El are denumiri diferite: indice de selectie
combinata; indice al valorii de ameliorare, indice de selectie familiala etc.
Indicele de selectie notat cu I, este o combinatie liniara intre performanta proprie
sau performantele rudelor, ponderate cu o serie de coeficienti de regresie partiala:
I = b1 P1 + b2 P2 +,.....,+bn Pn = b ' P in care: P1, P2, Pn reprezinta valorile
fenotipice ale aceluiasi character masurat pe candidatul la selectie sau pe rudele sale.
b1... bn reprezinta coeficientii de regresie ai genotipului catre fenotip.
Obtinerea coeficientilor de regresie partiala se face pe baza relatiei
b = c ' ⋅ v −1 in care : v este o matrice care contine variantele
si covariantele fenotipe , c este o alta matrice, care include covariantele dintre fiecare sura
de informatie din structura indicelui( Pi) si valoarea de ameliorare a candidatului la
selectie (A) pentru caracterul din obiectivul ameliorarii. Matricea c este un vector
coloana, de dimensiune n x 1.
Cateva exemple de indici de selectie sunt :
- indicele care include performanta proprie plus performanta medie a familiei de mama (
indicele Lush 1947)
- indicele care include performanta proprie, performanta proprie a familiei de mama si
performanta proprie a familiei de tata ( indicele Osborne)
- indicele care include performanta proprie , performanta medie a mamei pe trei fatari si
performanta medie a familiei de surori bune.

22
Indicele elaborat de Lush include suma celor doua componente: performanta
proprie si performanta medie a familiei.
Indicele de selectie Osborne care cumuleaza cele trei surse de informatii corelate
este urmatorul :
(
I = Aˆ = b A1P ⋅ (Pp ⋅ Pc ) + b A 1PFB ⋅ (PFB − PC ) + b AP SF P SF − PC
1
) in

care:
Pp = valoarea fenotipica a candidatului la selectie;

P FB = valoarea fenotipica medie a familiei de frati buni


P SF = valoarea fenotipica medie a familiei de semifrati .
b A1P = coeficientul de regresie partiala al genotipului candidatului la selectie fata de
propriul fenotip
b A PFB = coeficientul de regresie partiala al genotipului candidatului la selectie fata de

valoarea fenotipica medie a familiei de frati buni


b A PSF = coeficientul de regresie partiala al genotipului candidatului la selectie fata de

valoarea fenotipica medie a familiei de semifrati.


Cel de-al treilea indice are in vedere trei surse de informatie:
- performanta proprie
- performanta medie a mamei pe trei fatari
- performanta medie a familiei de surori bune
( ) (
I = Aˆ = b AP ⋅ (Pp − PC ) + b A PM A M − P C + b A PSF ⋅ P SF ⋅ Pc )

Indicele de selectie pentru doua sau mai multe caractere .

Hazel si Lush (1943), au introdus conceptul de genotip agregat sau global al


animalului care , reprezinta o valoare unica prin care se exprima in cel mai inalt grad
valoarea genotipica globala. In ipoteza existentei unei relatii de tip liniar intre fenotip si
genotip, valoarea de ameliorare globala (H), este suma valorilor de ameliorare ale
caracterelor din obiectivul ameliorarii( Ai) , ponderate prin importantele lor economice
relative(Vi).

23
H = v1 ⋅ A1 + v 2 ⋅ A2 + .... + v n An = ∑ vi Ai = v' A in care : A1...Am

reprezinta valorile de ameliorare ale celor “ m” caractere din obiectivul ameliorarii.


V1....Vm reprezinta valorile economice relative ale acelorasi caractere .
Formula indicelui de selectie pe mai multe carctere se scrie ca si in cazul selectiei
pe un singur caracter :
I = b1 ⋅ P1 + v 2 ⋅ P2 + .... + v n ⋅ Pn = ∑ bi Pi = b' P in care P1…Pn reprezinta

valorile fenotipice ale diferitelor caractere.


Indicele de selectie se calculeaza pentru fiecare candidat la selectie ca suma
performantelor sale( Pi) ponderate cu o serie de coeficienti (bi) estimati astfel incat sa
minimizeze diferenta dintre criteriul de selectie (I) si genotipul agregat (H).
Coeficientii de regresie ai genotipului catre fenotip se determina pe baza relatiei :
b = v'⋅c'⋅v −1
Eficienta indicelui de selectie se masoara prin corelatia dintre criteriul de selectie
(I) si genotipul agregat (H)

S x2 S
rI , H = 2
= I
SH SH

S i = s i2 = b'⋅v ⋅ b eroarea indicelui de selectie.

SH² este varianta genotipului agregat si se calculeaza analog variantei indicelui

S H = S H2 = V '⋅G ⋅ V
Castigul genetic asteptat asupra genotipului agregat H, prin selectia bazata pe
indicele I va fi DH = i ⋅ rI , H ∪ S H in care : i este masura intensitatii de selectie exprimata

in unitati de deviatie standard.


Progresul genetic partial , pentru fiecare caracter inclus in structura indicelui ,
poate fi estimat pe baza urmatoarei relatii
bi ⋅ C
DGi =
SI
Din combinarea diferitelor surse de informatie rezulta trei tipuri de indici de
selectie pe mai multe caractere:

24
- indicele de selectie care combina valorile fenotipice provenite de la doua sau mai multe
caractere masurate pe fiecare candidat la selectie
- indicele de selectie care combina valorile fenotipice provenite de la doua sau mai multe
caractere masurate pe rudele candidatului la selectie ( caractere limitate de sex)
- indici de selectie care combina valorile fenotipice provenite de la doua sau mai multe
caractere masurate atat pe candidatul la selectie cat si pe rudele sale , o combinatie a
primelor doua tipuri.
Primul tip de indice se utilizeaza pentru cazul caracterelor nelimitate de sex (
greutate vie , grosime strat slanina , talie etc) caracterele respective masurandu-se pe
fiecare candidat la selectie. Acest indice mai este numit si indice de selectie fenotipica.
In functie de repartizarea caracterelor in obiectivul selectiei ( genotipul agregat) si
in criteriul de selectie exista doua subvariante de indici:
-celeasi caractere incluse atat in genotipul agregat cat si in indicile de selectie ( selectie
directa)
- caracterele incluse in obiectivul selectiei pot diferi , total sau partial , fata de cele
incluse in structura indicelui ( selectie indirecta sau combinatie directa cu indirecta )
Prima subvarianta este folosita de Stefan Popescu Vifov (1971) la porcine iar
Gavrilet(1971) prezinta acest tip de indice la pasari ulterior si sub varianta a doua .
Indicele de selectie care combina valorile fenotipice provenite de la doua sau mai
multor caractere masurate pe rudele candidatului la selectie se foloseste in cazul
caracterelor limitate de sex( lapte, oua, prolificitate etc) sau cele referitoare la calitatea
carcasei singurele surse de informatie sunt cele asigurate de catre rudele candidatilor la
selectie. In acest caz, variabilele din structura genotipului agregat se refera la valorile de
ameliorare ale candidatilor , pentru caracterele din obiectivul selectiei.
Indicele de selectie care combina valorile fenotipice provenite de la doua sau mai
multe caractere masurate pe candidatul la selectie si pe rudele sale cumuleaza cele doua
surse de informatie.
Limitele indicelor de selectie:
1. indicii de selectie sunt valabili in ipoteza cunoasterii mediei si variantelor la nivel de
populatie. Se stie ca in conditii de mediu intamplator , la nivel de populatie, media
fenotipica coincide cu media valorilor genetice aditive.

25
2. in conditii practice , parametrii populatiei nu sunt cunoscuti . De asemenea folosirea
inegala a reproducatorilor masculi la insamantari artificiale duce la o distributie
nebalansata a descendentilor in spatiu( in ferme diferite).
3. in multe situatii structura variantelor si covariantelor nu este cunoscuta.
4. daca pentru fiecare candidat la selectie s-a observat un numar variabil de performante
proprii de fiecare data trebuie sa se recalculeze coeficientii indicelui.La porc , pasare s-a
impus limitarea sursei de informatie.
5.s-a constatat ca reproducatorii tineri pusi in competitie cu reproducatorii batrani sunt
sistematic dezavantajati.Asta , deoarece descendentii lor sunt comparati cu descendentii
celor mai buni reproducatori si care au un numar mare de descendenti.

26
CURS 4.
Predictia valorii de ameliorare prin metodologia BLUP

Tehnicile de evaluare genetica au evoluat constant in ultimele decenii sub


influenta simultana a progresului in statistica, informatica si genetica cantitativa. Teoria
clasica a indicilor de selectie considera efectele de mediu (efecte fixe) cunoscute fara
eroare. In cele mai multe cazuri insa efectele fixe au o influenta reala asupra
performantelor si nu sunt cunoscute fara eroare. De exemplu, fiicele taurilor aflati in
testare pot incheia testarea in ani si sezoane diferite, precum si in ferme diferite in
conditii de mediu diferite care afecteaza manifestarea fenotipica a caracterelor.
Dupa anul 1950 au fost accelerate studiile cu privire la perfectionarea metodelor
de evaluare genetica a animalelor. Un rol insemnat in dezvoltarea acestor metode l-a avut
“Scoala Cornell” (Universitatea Cornell, New York, SUA) sub conducerea lui Charles
Roy Henderson.
Procedura moderna de evaluare genetica a fost elaborata inca din anul 1949 de
catre Henderson sub denumirea” Maximum Likelitood Method metoda verosimilitatii
maxime “. Ea a fost modificata dupa anul 1965 primind numele de metoda BLUP si
perfectionata dupa anul 1974 intr-o varianta noua numita “ Mixed Model Method metoda
modelului mixt”.
Preocuparea centrala in procesul de predictie a valorii de ameliorare este
eliminarea pe cat posibil din performanta a efectelor negenetice. In termeni statistici
problema consta in estimarea simultana a constantelor pentru efectele fixe ( efecte de
mediu) si in predictia valorilor realizate ale variabilelor aleatoare ( valorile de ameliorare
ale animalelor). Solutia la aceasta problema este obtinerea “ Best Linear Unbiased
Estimates – BLUE- cei mai buni estimatori lineari nedeplasati pentru efectele fixe si
“Best Linear Unbiased Predictors- BLUP –cei mai buni predictori lineari nedeplasati”,
pentru efectele aleatoare ( incluzand valoarea de ameliorare).

27
Nedeplasarea solutiilor obtinute este o proprietate importanta , astfel ca in medie ,
efectele genetice nu sunt afectate de efectele fixe ( perioade si locuri diferite de testare ,
sexe , si varste diferite etc).
Aplicata initial ca un model simplu( model tata sau tata- bunic –matern),
metodologia BLUP este astazi din ce in ce mai mult folosita pentru modelele animale (
model animal individual si model animal redus) care permit evaluarea indivizilor pe baza
mai multor surse de informatie.
O populatie poate fi descrisa statistic prin doi indicatori de baza : media (μ),
numita si momentul de ordine I si varianta (σ²), cunoscuta sub numele de momentul de
ordine II. In general primul moment al lui Y (vectorul observatiilor ), notat cu X3 nu este
cunoscut , insa al doilea moment V= σ² se presupune a fi cunoscut. In acest context ,
valoarea de ameliorare( cel mai bun predictor liniar nedeplasat) se obtine din relatia :
( ~
)
uˆ = C '⋅V −1 Y − Xb unde

b = (X 'V −1 X ) ⋅ X 'V −1Y Acest predictor este acelasi ca si in cazul BLP cu


−1

~
exeptia ca b( presupus cunoscut fara eroare) este inlocuit cu b . Acesta este un estimator a
lui b , obtinut prin metoda celor mai mici patrate generalizate, fapt care la determinat pe
Henderson sa numeasca BLUP “indicele de selectie modificat pentru efecte fixe
necunoscute” b
~
()
Dintre toti predictorii nedeplasati BLUP are cea mai mica varianta a erorii. Din
punct de vedere matematic BLUP este o combinatie intre metoda celor mai mici patrate si
teoria indicelor de selectie. Comparativ cu metoda indicelor de selectie (BLP), noua
metodologie nu necesita cunoasterea mediei populatiei ( termenii de comparatie cum ar fi
mediile realizate pe combinatia de factori ferma-an-sezon), permitand estimarea ei
(BLUE), simultan cu predictia valorii de ameliorare ale candidatilor la
selectie(BLUP).Acronimele BLUP au urmatoarele semnificatii:
-Best= estimatorii si predictorii au varianta erorii minima , maximizand corelatia
dintre valoarea de ameliorare adevarata si valoarea de ameliorare calculata,
- Linear = valorile de ameliorare calculate sunt functii liniare ale valorilor
fenotipice

28
- Unbiased = valorile de ameliorare calculate sunt nedeplasate, in sensul ca
valoarea de ameliorare a unui animal nu este influentata de tipul de mediu in care acesta
performeaza.Ca rezultat , valorile de ameliorare calculate vor aproxima cat mai mult
posibil valorile de ameliorare adevarate( teoretice)
-Prediction = metodologia permite prognoza valorilor de ameliorare adevarate .
Procedura BLUP este valabila daca sunt intrunite urmatoarele ipoteze de lucru:
- valorile fenotipice si valorile de ameliorare sunt normal distribuite , implicit caracterele
sunt controlate de gene minore fiecare cu un efect mic
- relatia dintre valoarea fenotipica si valoarea de ameliorare este de tip liniar
- parametrii genetici ai populatiei de baza sunt cunoscuti ( sau elementele lor componente
variantele si covariantele)
A patra ipoteza de lucru necesara aplicarii BLP, respectiv cunoasterea mediei
populatiei nu este obligatoriu a fi cunoscuta in cazul BLUP, ea urmand a fi estimata din
datele existente in analiza , reprezentand efectul fix al modelului operational.
Obtinerea rezultatelor de tip BLUP se poate realiza in doua variante de lucru:
1. Varianta A, presupune parcurgerea a doua trepte de lucru:
-estimarea mediilor prin metoda celor mai mici patrate
-utilizarea metodei indicelor de selectie(BLP), in care valorile fenotipice sunt exprimate
ca abatere fata de aceste medii
2.Varianta B, presupune parcurgerea unei singure trepte de lucru
-obtinerea simultana atat a mediilor cat si a valorilor de ameliorare prin metodologia
BLUP model animal individual.Trebuie mentionat ca in practica se aplica direct varianta
B. Varianta A este pentru a arata legatura care exista intre modelele BLP si BLUP ,
BLUP fiind o generalizare a metodei BLP.
Prin obtinerea solutiilor BLUP se asteapta ca , in medie , valorile predictate si
deci cunoscute, sa fie egale cu valorile adevarate , dar necunoscute in analize reale, adica
M (û)=M(u).Ducrocq(1990) arata ca daca se extrag in mod repetat , la intamplare din
populatie, probe de indivizi din aceeasi marime si se predicteaza valoarea de ameliorare
aceasta este egala cu valoarea de ameliorare adevarata (u). Asa cum s-a spus BLUP este
o metodologie care combina indicele de selectie (BLP) cu metoda celor mai mici patrate

29
generalizate. Adesea se face confuzie vorbindu-se despre “ modelul BLUP”, insa nu este
corect deoarece BLUP este un procedeu statistic utilizat in analiza unui model .

~
b rezulta din :
( ~
( )
X 'V −1 X b = X 'V −1Y

(X 'V X )× (b~ ) = (X 'V X )(X 'V


−1 −1 −1
X ) ⋅ X 'V −1Y
−1

( X 'V X ) × (b~ ) = (X 'V Y )


−1 −1

Unde : X –matricea de incidenta a efectelor fixe;


V- matricea de variante/ covariante, V= ZGZ’+R
Z- matricea de incidenta a efectelor aleatoare
Z este o matrice al carei numar de linii si coloane este egal cu numarul de
observatii deci V are numarul de linii si coloane de ordin egal cu numarul de indivizi care
trebuie analizat. In acest context matricea V este dificil de inversat direct prin modelele
traditionale ceea ce face aproape imposibila evaluarea genetica in conditii practice,
folosind relatia mentionata mai sus.
In 1963 , henderson a aratat cum s-ar putea usura considerabil calculele. Se
presupune ca in modelul liniar : Y=Xb+Zu+e valorile genetice sunt analizate provizoriu
ca fixe si nu randomizate. In aceasta situatie : var(y)=V=R
Ecuatiile celor mai mici patrate generalizate pentru estimarea lui b si predictia lui
u se scriu prin extensia ecuatiei prezentate mai sus astfel :
~
⎡ X '⎤ −1 ⎡b ⎤ ⎡ X '⎤ −1
⎢ Y ' ⎥ R [ XZ ]⎢ ~ ⎥ = ⎢ Z ' ⎥ R Y
⎣ ⎦ ⎣u ⎦ ⎣ ⎦
De unde rezulta:
~
⎡ X ' R −1 X Z ' R −1 Z ⎤ ⎡b ⎤ ⎡ X ' R −1Y ⎤
⎢ ⎥⎢ ⎥ = ⎢ ⎥
⎣Z'R X
−1
Z ' R −1 Z ⎦ ⎣u~ ⎦ ⎣ Z ' R −1Y ⎦

Acest sistem de ecuatii se cunoaste sub numele de “ ecuatiile modelului mixt ale
lui Henderson- MME- Henderson’s Mixed Model Equation”, deoarece se considera
simultan efectele fixe si efectele aleatoare. Matricile inverse R‾¹ si G‾¹ sunt mai usor de
obtinut decat V‾¹.

30
Frecvent se emite ipoteza ca rezidualele modelului sunt distribuite conform unei
legi normale de repartitie cu media μ=0 si varianta σ², situatia in care var (e)=R=Iσ²e.
Pentru a simplifica sistemul se pot inmulti toate ecuatiile cu σ² ceea ce duce la
eliminarea matricei R‾¹ deoarece R‾¹R=I
~
⎡X ' X Z ' Z ⎤ ⎡b ⎤ ⎡ X ' Y ⎤
Rezulta: ⎢ −1 ⎥ ⎢ ~ ⎥
=⎢ ⎥
⎣ Z ' X Z ' Z + G ⎦ ⎣u ⎦ ⎣ Z ' Y ⎦

( )
Unde: G −1 = I σ e2 σ u2 iar daca se tine seama de inrudirile dintre animale atunci:
G‾¹=A‾¹( σe²/ σu²)
Matricea relatiilor genetice dintre indivizi (A)
Populatiile de animale se afla intr-o continua dimanica, mediile si variantele lor genetice
nu sunt statistice, ele se pot schimba in urma selectiei si consagvinizarii,
Animalele dintr-o populatie sunt inrudite intre ele , cauzele inrudirii lor fiind:
marimea limitata a populatiei si originea populatiei dintr-un numar mixt de stamosi.
Asemanarea genetica intre rude poate fi exprimata in trei moduri:
a) prin probabilitatea ca o gena luata la intamplare de la un individ sa fie identica prin
origine cu o gena luata la intamplare de la celalalt individ, indice numit coeficient de
consangvinizare, in sensul de inrudire.
b) prin corelatia dintre valorile de ameliorare ale indivizilor, care este estimata de
coeficientul de inrudire elaborat de Wright (1922). Metoda a fost revizuita de Henderson
(1976) pentru a putea fi programata pe computer
c) Prin analiza covariantei intre rude.
Formula completa a coeficientului de inrudire este:
n1+ n 2
⎛1⎞
∑ ⎜⎝ 2 ⎟⎠ ⋅ (1 + FA )
rxy =
(1 + FX ) ⋅ (1 + Fy )
Metoda sugereaza ca asemanarea genetica intre doi indivizi creste daca un stramos
comun al celor doi se repeta de mai multe ori, respectiv se poate ajunge la el pe mai
multe cai ale pedigreului. De asemenea, aceasta creste daca stramosul comun a fost
consangvinizat. Asemanarea genetica este diminuata daca indivizii respectivi au fost ei
insisi consangvinizati (Fx si Fy), pe alti stramosi decat stramosul comun.

31
rxy reprezinta corelatia dintre bazele ereditare ale indivizilor X si Y. Relatia poate fi scrisa

sub forma:
a xy cov⋅ xy
rxy = si deoarece rxy = rezulta a xy = rxy a xx ⋅ a yy unde:
a xx ⋅ a yy varx ⋅ vary

a xx = 1 + FX , iar a yy = 1 + FY

Daca Fx=Fy=0, atunci: a xy = rxx unde axy reprezinta relatia genetica dintre indivizi x si

y.
Metoda Wright nu se preteaza la computerizare motiv pentru care Henderson face
posibilaa obtinerea directa a inversei matricei A adica dezvoltata metoda recursiva care
presupune calcularea numai a numaratorului coeficientului de inrudire al lui Wright.
In procesul de derivare a sistemului de ecuatii pentru un model animal, la ecuatiile
efectelor aleatoare se adauga matricea A inversata. Asadar, metoda recursiva a lui
Henderson face posibila obtinera directa a inversei matricei A, chiar cand acesta are
dimensiuni foarte mari. Descoperirea acestei metode a constituit o realizare importanta in
ameliorarea animalelor, intrucat permiteutilizarea relatiilor de inrudire intre toti indivii
analizati.
Matricea relatiilor genetice dintre indivizi este elementul cheie in cadrul unui
model animal, permitand folosirea tuturor surselor de informatie pe o cale optima.
Dupa regula lui Hederson, A poate fi obtinut pe baza urmatoarelor relatii:
⎡ a11 a12 a13 a1n ⎤
⎢a a 22 a 23 a 2 n ⎥⎥
A = ⎢ 21
⎢− − − − ⎥
⎢ ⎥
⎣a n1 an2 a n3 a nn ⎦

Elementele aij, i, j = 1, n pot fi calculate folosind metoda Henderson. Animalele luate in


stadiu sunt numerotate ( de la 1 la n) si grupate in ordinea generatiilor astfel incat parintii
sa preceada descendentii lor .
Formulele stabilite:
1
a xx = 1 + aTxMx
-cand ambii parinti ai animalului x sunt cunoscuti: 2
a xy =
1
(a xTy + a xMy )
2

32
unde:

aTxMx- reprezinta relatia genetica aditiva intre tata lui x si mamalui x;


axTy – reprezinta relatia genetica aditiva dintre indiviudul x si mama lui y
- daca un singur parinte este cunoscut (de exemplu tatal):
a xx = 1
1
a xy = a xTy
2
- daca ambii parinti sunt necunoscuti:
a xx = 1
a xy = 0

Pentru a calcula A recursiv, indivizii trebuie sa fie grupati in ordinea generatiilor, ceea ce
inseamna ca descendentii trebuie sa fie precedati de parintii lor. Indivizii care nu au
parinti cunoscuti se considera ca fac parte dintr-o populatie de baza neinrudita si
neselectionata.
2. Inversa matricei relatiilor genetice dintre indivizi (A‾¹)
In procesul de derivare a ecuatiilor modelului mixt s-a constatat ca inversa relatiilor
genetice trebuie adaugata la ecuatiile efectelor aleatoare(Henderson1973). Pentru o lunga
perioada de timp , singura posibilitate de a obtine A‾¹ s-a bazat pe utilizarea metodelor
clasice ( de exemplu metoda Gauss).
Cand numarul animalelor de evaluat este foarte mare , matricea A‾¹ nu mai poate
fi obtinuta direct prin metodele clasice de inversare . In 1975 Henderson a descoperit ca
inversa lui A poate fi obtinuta direct dintr-o lista de pedigree. Aceasta descoperire a facut
posibila utilizarea metodelor animale in procesul de evaluare genetica.
A‾¹ poate fi formata folosind niste seturi de constante , pentru fiecare din cele trei
situatii posibile :
a. nici un parinte cunoscut
b. un singur parinte cunoscut
c. ambii parinti cunoscuti
Constantele folosite la construirea inversei matricei relatiilor genetice
Elementul lui A‾¹ Nici un parinte Un singur parinte Ambii parinti

33
cunoscut cunoscut cunoscuti
i,i individ 1 4/3 2
j,j tata 0 1/3‫٭‬ ½
k,k mama 0 0 ½
i; j=j; i tata fiu fiica 0 -2/3‫٭‬ -1
i; k=k ; i mama fiu 0 0 -1
fiica
j; k=k ;j tata mama 0 0 ½
Unde :
‫ ٭‬depinde care parinte este cunoscut ( i- individul, j- tatal lui i, k-mama lui i)
Sa luam urmatorul exemplu :
Individ Tata Mama
1 - -
2 - -
3 - -
4 1 2
5 3 4

Pentru a calcula A recursiv, indivizii trebuie sa fie precedati de parintii lor.


Indivizii care nu au parintii cunoscuti se considera ca fac parte dintr-o populatie de baza
neinrudita si neselectionata (animalele 1 si 2 in cazul prezentat).
Matricea relatiilor de inrudire ( conform formulelor prezentate) pentru cele 5
animale este :

⎡1,0 0 0,5 0,5 0,5 ⎤


⎢0 1,0 0 0,5 0,5 ⎥⎥

A = ⎢0,5 0 1,0 0,25 0,625⎥
⎢ ⎥
⎢0,5 0,5 0,25 1,0 0,625⎥
⎢⎣0,5 0,25 0,625 0,625 1,125 ⎥⎦

( )
Asadar, pentru exemplul nostru matricea inversa a relatiilor de inrudire A −1 intre cele 5
animale are urmatoarea structura:

34
⎡ 1,833 0,5 − 0,67 − 1 0 ⎤
⎢ 0,5 1,5 0 − 1 0 ⎥⎥

A −1 = ⎢− 0,67 0 1,833 0,5 − 1⎥
⎢ ⎥
⎢ −1 −1 0,5 2,5 − 1⎥
⎢⎣ 0 0 −1 − 1 2 ⎥⎦

De notat ca regulile lui Henderson se aplica numai pentru populatiile neconsangvinizate.


Pentru cele consangvinizate se pot folosi metodele lui Quaas-1976 sau Smith si Alloire-
1995.
Pentru populatiile consangvinizate regulile de dominanta (elementele matricei D) pot fi
stabilite direct pe baza relatiilor genetice aditive (A). Astfel, daca parintii lui K si M sunt
g si h respectiv i si j.
Inversa matricei A se calculeaza conform constantelor lui Henderson si pedigree-
ul schematic astfel :
4 1
+ a33 =
3 2
1 1 11
a11 = 1 + + = = 1,833 a = 2 + 1
3 2 6 44
2
1 = 2
a12 = a 55
2 a 23 = 0
2
a13 = − a 24 = −1
3
a 14 = −1 a 25 = 0
a15 = 0 1
a34 =
2
1
a 22 = 1 + a35 = −1
2
a 45 = −1

Elementele matricei D se obtin pe baza urmatoarei relatii :


a km = 0,25(a gi ⋅ a nj + a gj ⋅ a ni ) in care :

agi = coeficientul de inrudire intre tatal lui k si tatal lui n


anj = coeficientul de inrudire intre mama lui k si mama lui n
agj = coeficientul de inrudire intre mama lui k si tatal lui n
ani = coeficientul de inrudire intre mama lui k si tatal lui n.

35
Valorile agi , anj , agj , ani sunt elementele lui A.
Elementele matricei relatiilor de epistazie (I) se pot obtine in urma efectuarii
produsului Hadamart ( simbolizat cu #), adica prin inmultirea coeficientilor lui A ( aij),
element cu element astfel :
I = A ≠ A = aij ⋅ aij

Exemplu numeric : sa presupunem ca in analiza avem 4 animale , pe baza carora vom


stabili matricile coeficientilor de inrudire (A) , de dominanta (D) si de epistazie (I).
Datele primare sunt consemnate in tabelul de mai jos :
Individ Tatal Mama
1 0 0
2 0 0
3 1 2
4 1 2

Pe baza relatiilor stabilite de Henderson a fost obtinuta matricea coeficientilor de


inrudire (A):

⎡1,00 0 0,50 0,50⎤


⎢ 0 1,00 0,50 0,50⎥⎥
A=⎢
⎢0,50 0,50 1,00 0,50⎥
⎢ ⎥
⎣0,50 0,50 0,50 1,00 ⎦
Odata obtinuta A se usureaza estimarea coeficientilor matricilor D si I. De
exemplu , relatia de dominanta dintre animalele 3 si 4 este de 0,25, potrivit relatiei :
a34 = 0,25(a11 ⋅ a 22 + 0 ⋅ 0) = 0,25(1 ⋅ 1) = 0,25
In final D si I au urmatoarele structuri :

⎡1,00 0 0 0 ⎤ ⎡1,00 0 0,25 0,25⎤


⎢ 0 1,00 0 0 ⎥⎥ ⎢ 0 1,00 0,25 0,25⎥⎥
D=⎢ I =⎢
⎢ 0 0 1,00 0,25⎥ ⎢0,25 0,25 1,00 0,25⎥
⎢ ⎥ ⎢ ⎥
⎣ 0 0 0,25 1,00 ⎦ ⎣0,25 0,25 0,25 1,00 ⎦
Tipuri de modele biometrice ( prezentate ca aplicatii practice la seminarii):

36
I. Modelul tata sau a reproducatorului mascul :

-descendentii intretinuti in aceleasi conditii de mediu


-descendenti in diferite conditii de mediu
-model tata cu grupe genetice
-model tata cu repetabilitate
-model tata- bunic matern

II. Modelul animalului individual :

-candidatii la testare din aceeasi populatie


-modelul animal individual cu grupe genetice
-modelul animal individual cu repetabilitate
-modelul animal redus
-modelul tata-mama
-modelul animal individual pe mai multe caractere

III. Modelul mama si respectiv indicii de selectie.

37
CURS
Eficacitatea metodologiei B.L.U.P. Rezolvarea metodelor liniare prin
programare asistata pe calculator

3. Elementele care influenteaza aplicarea metodologiei B.L.U.P


ƒ Numarul de animale cuprinse in analiza, care poate influenta marimea
sistemului de ecuatii
ƒ Organizarea circuitului informatiei pentru a fi utilizata in deciziile de
selectie. Acesta circulatie a informatiei trebuie sa fie suficient de rapida si fiabila.
ƒ Nivelul insamantarilor artificiale in populatiile supuse evaluarii. Precizia
este mai mare atunci cand intre grupele de animale exista legaturi genetice. Lipsa
legaturilor genetice intre grupe de contemporani poate fi inlaturata prin folosirea
insamantarilor artificiale care permite obtinerea de semifrati.
ƒ Fiabilitatea informatiilor. Informatia genealogica contribuie la cresterea
preciziei selectiei in urma utilizarii metodologiei B.L.U.P. Daca acesta informatie contine
erori, castigul asteptatpoate fi diminuat sau chiar anulat.
ƒ Parametrii genetici utilizati, cu cat precizia acestora este mai mare
(depinde de metodologie) cu atat valoarea de ameliorare estimata va fi mai aproape de
adevar. Cea mai sigura metoda pentru estimarea parametrilor genetici este R.E.M.L
(Resticted Maximum Likelihood).
ƒ Valoarea economica a animalelor depinde de mai multe caractere.
Mijloacele informatice disponibile nu permit todeauna sa se lucreze cu astfel de modele.
O prima simplificare consta in analiza separata a fiecarui caracter (modele pentru un
singur caracter). O a doua simplificare consta in inlocuirea efectului “animal” din model
cu alte efecte cu numar de niveluri mai mic, de exemplu: model “tata” sau model
“mama”, insa o parte din proprietatile genetico statistice ale modelului animal sunt
pierdute.
4. Programare asistata pe calculator la rezolvarea metodelor liniare.
Datorita volumului mare de date si complexitatea crescanda a calculelor care trebuie
efectuate, ameliorarea genetica a animalelor pe zi ce trece este tot mai complexa.

38
Aplicarea in practica a conceptelor moderne de ameliorare genetica este limitata de
factorul computational. Acesta se reflecta in sacrificiul de precizie la care se recurge prin
simplificarea metodelor folosite, cat si in complexitatea programelor de calculator
utilizate. Teoria in ameliorare s-a dezvoltat mai rapid decat baza computationala pe care
aceasta o solicita.
Referitor la Terminologie se utilizeaza termenul “set program” pentru a desemna
faptul ca aplicatiile respective sunt in general constituite dintr-un grup de programe
numite module. Acestea excuta secvente separate de calcul din cadrul aceluiasi proces
computational.
De regula, intre aceste module exista o legatura in serie, datele de iesire de la unul
constituind date de intrare pentru unul sau mai multe alte module si asa mai departe. In
functie de scopul urmarit, anumite module sunt folosite sau nu, alte module putand fi
folosite in mod repetat. Organizarea acestui proces se face printr-un model principal, un
fel de manager al celorlalte, care controleaza logica procesului de calcul. Datele de
intrare ale acestui modul sunt furnizate de catre utilizator.
Ca principale obiective ale seturilor progamului din domeniul ameliorarii animalelor
se pot mentiona urmatoarele:
ƒ Estimarea componentilor variantei
ƒ Evaluarea genetica a animalelor
ƒ Construirea hartilor genetice
ƒ Organizarea si suport in exploatare si selectie
ƒ Crearea de facilitati pentru procesul de invatatmant si cercetare
In ceea ce priveste functionalitatea seturilor de programe intalnim:
a) seturi program cu grad redus de generalizare
ƒ programe noi, care ulterior pot fi modificate si completate, aceasta
marindu-le gradul de generalizare
ƒ programe de demonstreaza o noua metodologie
ƒ programe asa-numite “client”, constituie cu un scop precis, de regula
unic (programe de evaluare genetica la nivel rational)
b) seturi program cu grad mare de generalizare.
ƒ “comprehnsive,”, deosebit de complexe si utile (de ex. DMU sau

39
ABTK) care necesita utilizatori cu un nivel avansat de cunostinte.
ƒ “universale” sunt seturi program cu caracter comprehensiv, care insa
pot fi usor folosite si de catre utilizatori relativi neinstruiti (de ex. PEST).
Modelul matematic folosit pentru analiza datelor este dependent de natura
acestora. Particularitatile datelor sunt determinate in mare masura de particularitatile
speciei. Astfel, facilitatile oferite de seturile program reflecta speciile cu care autorii lor
s-au confundat. Acest aspect poate fi usor urmarit pe exemplele care insotesc programele
si cu care se verifica utilitatea si functionalitatea acestora.
Atributele cele mai importante ale modelelor sunt legate de prezenta in analiza a
unuia sau a mai multor caractere. Acestea pot fi masurate o singura data sau de mai multe
ori, in decursul vetii animalului.

Caracterele si modele utilizate la principalele specii de animale domestice:

Specificare Caractere Modele


Taurine lapte Productia: lapte, Un singur caracter cu
grasime%, grasime kg, repetabilitate sau mai
proteina %, proteina kg multe caractere cu sau
fara observatii lipsa,
parinti fantoma.
Taurine lapte Conformatie: talie, Multe caractere cu sau
constitutie, capacitate fara repetabilitate, fara
corporala, crupa, observatii lipsa, parinti
membrele, simetria fantona.
ugerului, plasarea si
marimea mameloanelor,
etc.
Taurine carne Greutate la nastere, spor Multe caractere cu
mediu zilnic, punctaj observatii lipsa, efect
conformatie, carne in matern

40
carcasa
Porcine Spor mediu zilnic, Un caracter sau mai multe
grosime star de slanina, caractere, cu observatii
consum specific lipsa, efectul lotului de
testare, consangvinizare.
Pasari pentru oua Nr. de oua, greutatea Mai multe caractere, cu
oului, greutatea observatii lipsa,
corporala, varsta la consangvinizare.
primul ou
Pasari pentru carne Viteza de crestere, Un caracter sau mai multe
conformatia corporala, caractere, observatii lipsa,
greutatea oului, caractere consagvinizare.
de reproductie

Tipul de analiza care se doreste a fi efectuat trebuie sa determine tipul de set de


programe ce urmeaza a fi utilizat. Se are in vedere specia cu care se lucreaza, modelul ce
urmeaza a fi aplicat, dimensiunea bazei de date ce trebuie prelucrata. Cu toate acestea,
gradul de generalizare si usurinta in folosire sunt criteriile cele mai utilizate la alegerea
unui set program pentru analize obisnuite. Contactul cu autorii setului de programe poate
fi un criteriu hotarator in alegerea acestuia. Algoritmul de calcul este partea cea mai
sensibila a unui set de programe. Eficienta algoritmului de calcul determina eficienta
setului program prin timpul, mai redus sau mai indelungat, necesar efectuarii calculelor.
In acest context se spune despre algoritmul de calcul ca reprezinta efectul de “gat de
sticla” pentru un set de programe.
In principal problema de calcul consta in obtinera solutiilor pentru ecuatiile
modelului mixt. Acesta se poate face prin inversarea blocului matricei din partea stanga a
sistemului de ecuatii si post inmultirea inversei astfel obtinute cu vectorul din partea
dreapta a sistemului de ecuatii. Acest procedeu este foarte limitat ca posibilitate de
aplicare atunci cand dimensiunile sistemului de ecuatii sunt mari. Rezolvarea acestei
probleme se face folosind algoritmi ce utilizeaza procedee de calcul iterative, care, pentru
programele folosite in ameliorare, sunt in principal urmatoarele:

41
ƒ Gauss-Seidel
ƒ Jacobi
ƒ “iteratii in baza de date”
Cele mai eficiente pentru un numar mare de ecuatii sunt “iteratii in baza de date”,
acestea fiind folosite chiar pentru o suta de mii si milioane de ecuatii.
a doua mare posibilitate de calcul o reprezinta obtinerea sumei elementelor de pe
diagonala inversei matricei din partea stanga a sistemului de ecuatii (trace-urma
matricei) pentru estimarea parametrilor prin metoda REML. Aceasta este o problema
chiar mai dificila decat prima, dar ea poate fi evitata prin folosirea altor metode de
estimare a parametrilor (ML). Rezolvarea se obtine folosind unul din urmatoarele
procedee matematice:
ƒ Eliminarea gaussiana
ƒ Factorizarea matricelor sparte
ƒ Absortia matricilor sparte
ƒ Inversa sparta
“Spargerea matricei” este o metoda prin care o matrice de dimensiuni mari este
rearanjata, folosind artificii matematice, pentru a se obtine o matrice echivalenta, dar de
dimensiuni reduse. Eficienta procedeelor care apeleaza la spargerea matricilor este
dependenta de matricea pentru care se aplica. Aceasta depinde la randul ei de numarul de
animale, numarul de efecte in model, numarul de caractere.
Majoritatea seturilor program includ unul sau mai multi algoritmi de calcul pentru
rezolvarea celor doua probleme amintite, bazandu-se pe biblioteci proprii (PEST) sa
publice programe (FSPAK pentru MTDFREML, JJA, ABTK, DMU)
Procedeele iterative fac posibila obtinera rezultatelor, dar implica un timp
indelungat de asteptare. Aceasta poate varia de la cateva ore pana la cateva saptamani sau
chiar luni de zile, in functie de elementele problemei de rezolvat.
Timpul de rulare poate fi redus prin renuntare la precizie. Precizia in cazul
procedeelor iterative se refera la criteriu de convergenta care trebuie atins pentru ca
solutiile sa fie considerate valabile. Criteriul de convergenta acceptat depinde de scopul
pentru care se efectueaza calculele si pot si foarte diferit pentru cercetare sau pentru
lucraru aplicative. De regula, se accepta drept criteriu de convergenta o diferenta intre

42
solutiile rezultate din ultima si penultima iteratie, mai mica decat 1% din media
performantelor inregistrate la caracterul respectiv. Alte criterii de convergenta mai
drastice se aplica in scopuri de cercetare si mai ales pentru demonstrarea unor
metodologii noi.
Seturile program cele mai avansate din punct de vedere constructiv si functional
sunt: DMU, PEST\VCE, DFREML, MTDFREML, JAA/MTC, ABTK, etc.
Exista versiuni modificate ale acestora care circula in diferite tari si asteapta sa fie
introduse in versiunile oficiale.
Perspectiva utilizarii in tara noastra a acestor seturi program este dependenta de
dotarea tehnica necesara si formarea de specialisti zootehnisti si informaticieni care sa
foloseasca aceste seturi program.

43

S-ar putea să vă placă și