Sunteți pe pagina 1din 296

10

CAPITOLUL 1.

EVENIMENTE ŞI PROBABILITĂŢILE LOR

Obiective :Însuşirea de către studenţi a conceptelor de eveniment , probabilitate


simplă şi condiţionată a evenimentelor .

Conţinut :

1.1 Eveninente
1.2 Probabilităţile evenimentelor
1.3 Probabilităţile condiţionate ale evenimentelor
1.4 Rezumat
1.5 Întrebări
1.6 Bibliografie

Cuvinte cheie : eveniment, probabilitate, probabilitate condiţionată

1.1. Evenimente

Un experiment este aleator dacă rezultatele sale nu pot fi prevăzute cu exactitate, fiind
sub influenţa întâmplării.
Exemple:
1) Apariţia unei feţe la aruncarea monezii;
2) Apariţia unei feţe la aruncarea zarului;
3) Apariţia unei bile albe la extragerea din urnă cu bile albe şi negre.
Totalitatea rezultatelor posibile ale unui experiment aleator se numeşte spaţiu de
evenimente elementare şi se notează cu Ω.
Mulţimea părţilor (submulţimilor) lui Ω se notează cu P(Ω).
Exemple:
1) La aruncarea monezii avem Ω = {stemă, ban};
2) La aruncarea zarului avem Ω = {1, 2, 3, 4, 5, 6};
Dacă mulţimea Ω este finită sau numărabilă (şir), orice submulţime A  Ω se numeşte
eveniment.
Dacă mulţimea Ω este nenumărabilă (de exemplu Ω = R), vom numi evenimente
numai submulţimile A  Ω a căror familie formează o σ – algebră K  P(Ω) care se
defineşte prin condiţiile:
1) Ω  К
2) Ai  К pentru i  I   Ai 
iI
3) A  К  CA  К
CA se numeşte eveniment contrar cu A şi se mai notează cu Ā.
Exemplu: Dacă A = “apariţia unei feţe pare la aruncarea zarului” atunci CA = “
apariţia unei feţe impare la aruncarea zarului”.
Ω ca eveniment, se numeşte evenimentul sigur iar CΩ = Ø se numeşte evenimentul
imposibil.
11

Incluziunea A  B se numeşte implicare a evenimentului B de către evenimentul A:


realizarea lui A determină realizarea lui B.
Exemplu. Dacă A = “apariţia feţei 6 la aruncarea zarului” şi B = “apariţia unei feţe
pare la aruncarea zarului” avem A  B.
Egalitatea A = B se numeşte echivalenţă a evenimentelor A şi B şi are loc dacă A  B
şi B  A.
Evenimentul B este elementar dacă A  B  A = Ø sau A = B.
Exemple
1) Apariţia unei anumite feţe la aruncarea unei monezi sau zar este eveniment
elementar;
2) Apariţia unei bile albe la extragerea din urnă a unei bile este eveniment elementar.
Dându-se două evenimente A şi B, reuniunea lor se notează cu A  B şi se citeşte
“A sau B” fiind un eveniment compus care se realizează dacă se realizează măcar unul dintre
evenimentele A, B.
Dându-se două evenimente A şi B, intersecţia lor se notează A  B şi se citeşte “A
şi B” fiind un eveniment compus care se realizează dacă ambele evenimente A, B se
realizează.
Exemplu
Fie A evenimentul că becul 1 funcţionează la un moment dat şi B evenimentul că
becul 2 funcţionează în acelaşi moment.
A  B este evenimentul că trece curentul prin circuitul paralel care conţine becurile
1 şi 2.
A  B este evenimentul că trece curentul prin circuitul serie care conţine becurile 1
şi 2.
Evenimentele A, B sunt incompatibile dacă nu se realizează simultan adică A  B =
Ø.
În caz contrar A şi B se numesc compatibile.
Exemple de evenimente incompatibile
1) Apariţia de feţe diferite la o aruncare cu moneda sau zarul;
2) Apariţia de culori diferite la extragerea unei bile din urnă.
Exemple de evenimente compatibile
1) Nimerirea unei ţinte de doi trăgători care ochesc asupra ei;
2) Funcţionarea la un moment dat a două becuri într-un circuit electric.

1.2. Probabilităţile evenimentelor

Fie К o σ - algebră de evenimente din P(Ω).


O funcţie P : К → R+ se numeşte probabilitate dacă:
1) P(Ω) = 1
 
2) P  Ai    PAi  pentru orice familie (Ai) i  I cu Ai  К, incompatibile câte
 iI  iI
două.
Tripleta {Ω, К, P} se numeşte câmp de probabilitate.
12

Fie p(i) numere negative de sumă 1 care se corespund bijectiv cu evenimentele


elementare ωi  Ω (i  N). Definim P(ωi) = p(i) şi pentru orice eveniment A  P(Ω) luăm
P  A    p(i) .
ωiA
Funcţia P astfel definită este probabilitate în sensul definiţiei de mai sus.
1
În particular dacă Ω = {ω1, …, ωm} şi pi   pentru orice i  {1, …, m} vom avea
m
nr. cazuri favorabile evenimentului A
P A 
nr.cazuri egal posibile
Aceasta este definiţia clasică a probabilităţii unui eveniment.
Exemple
1
1) Pstema    50% ;
2
1

2) P faţă dată la zar    16, 7% ;
6
3) Fie urna U cu 7 bile albe şi 3 bile negre.
7
P  bilă extrasă albă    70%
10
Definiţia clasică a probabilităţii nu se aplică dacă:
1) moneda este deformată;
2) zarul nu are feţele egale (este paralelipiped);
3) bilele din urnă nu au acelaşi diametru, căci în aceste cazuri evenimentele
elementare nu sunt egal posibile.
Evenimentele A şi B se numesc independente dacă
P(A  B) = P(A) . P(B) şi dependente în caz contrar.
Exemple de evenimente independente
1) Apariţiile unor feţe la aruncarea simultană a două monezi sau zaruri care nu se
ciocnesc;
2) Apariţiile unor feţe la două aruncări succesive a unei monezi sau zar;
3) Apariţiile a două bile la extrageri simultane din două urne diferite;
4) Apariţia a două bile albe la două extrageri succesive dintr-o urnă cu bila revenită.
Exemple de evenimente dependente
Apariţia a două bile albe la două extrageri succesive din urnă cu bila nerevenită.

Teorema 1.1.
Avem proprietăţile:
1) P(Ā) = 1 – P(A) pentru orice A  К;
2) P(A1  …  An) = [P(A1) + … + (An)] - [P(A1  A2) + … + P(An-1  An)] +… +
(-1)nP(A1  …  An) pentru orice evenimente A1, …, AnК
3) 0 < P(A) < 1 pentru orice A  К; P(Ø) = 0; P(Ω) = 1
4) P(A1  …  An) > P(A1) + … + (An) – n + 1 (Boole)
Demonstraţie
1) A  Ā = Ø şi A  Ā = Ω deci P(A  Ā) = P(Ω) = 1
deci conform axiomei 2) din definiţia probabilităţii :
P(A) + P(Ā) = 1 deci P(Ā) = 1 – P(A)
2) Vom demonstra egalitatea pentru n = 2 şi apoi aplicăm inductia după n.
13

Evenimentele A1 şi Ā1  A2 sunt incompatibile şi A1  (Ā1  A2) = A1  A2 deci


conform axiomei 2) a probabilităţii, avem:
P(A1) + P(Ā1  A2) = P(A1  A2) (1)
Evenimentele A1  A2 şi Ā1  A2 sunt incompatibile şi (A1  A2)  (Ā1  A2) = A2
deci conform axiomei 2) a probabilităţilor avem:
P(A1  A2) + P(Ā1  A2) = P(A2) (2)
Scăzând egalitatea (2) din (1) obţinem:
P(A1) - P(A1  A2) = P(A1  A2) – P(A2) sau :
P(A1  A2) = P(A1) + P(A2) - P(A1  A2) (3)
Dacă A şi B sunt incompatibile (A  B = Ø) din (3) reobţinem axioma 2) a
probabilităţii :
P(A1  A2) = P(A1) + P(A2) (4)
3) P(A) > 0 şi P(Ω) = 1 conform axiomei 1) a probabilităţii.
Dacă A1  A2 egalitatea (2) devine:
P(A1) + P(Ā1  A2) = P(A2) sau
P(A2) – P(A1) = P(Ā1  A2) > 0 deci
A1  A2 implică P(A1) < P(A2)
În particular A  Ω deci P(A) < P(Ω) = 1
De asemenea Ø = Ω deci conform punctului 1) avem P(Ø) = 1 – P(Ω) = 0
4) Vom demonstra inegalitatea pentru n = 2 apoi aplicăm inductia după n.
Avem P(A1  A2) = P(A1) + P(A2) – P(A1  A2) > P(A1) + P(A2) – 1 = P(A1) +
P(A2) - 2 + 1
Dacă A1, A2 sunt independente avem conform definiţiei egalitatea P(A1  A2) = P(A1)
.
P(A2). Q.E.D.
Exemple
1) Se aruncă 2 monezi care nu se ciocnesc.
Se cere:
a) Probabilitatea P1 să iasă 2 steme;
b) Probabilitatea P2 să nu iasă nici o stemă;
c) Probabilitatea P3 să iasă cel puţin o stemă.
Soluţie
Fie evenimentele:
1) A1 = “apariţia stemei pe prima monedă” şi A2 = “apariţia stemei pe a doua
monedă”
1 1 1
2) A1 şi A2 sunt independente deci P1 = P(A1  A2) = PA1   A 2     .
2 2 4
1 1 1
b) P2 = P(Ā1  Ā2) = P(Ā1) . P(Ā2) =   .
2 2 4
3
c) P3 = 1 – P2 = .
4
2) Se aruncă 2 zaruri care nu se ciocnesc.
Se cere:
a) Probabilitatea P1 să iasă o anumitä dublă;
b) Probabilitatea P2 ca suma punctelor să fie cuprinsă între 2 şi 4;
c) Probabilitatea P3 ca produsul punctelor să fie cuprins între 3 şi 5.
14

Soluţie
a) Fie A1 evenimentul că iese o faţă dată pe primul zar şi A2 evenimentul că iese
aceeaşi faţă pe al II-lea zar. Evenimentele A1, A2 sunt independente deci P1 = P(A1  A2) =
1 1 1
P(A1)  P(A2) =   ;
6 6 36
b) Avem 2 = 1 + 1; 3 = 1 + 2 = 2 + 1; 4 = 1 + 3 = 2 + 2 = 3 + 1 deci conform
6 1
definiţiei clasice a probabilităţii avem P2 =  ;
36 6
7
c) Avem 3 = 1 . 3 = 3 . 1; 4 = 1 . 4 = 2 . 2 = 4 . 1; 5 = 1 . 5 = 5 . 1 deci P3 = .
36
3) Se dau două urne U1 cu 7 bile albe şi 3 bile negre şi U2 cu 4 bile albe şi 6 bile negre.
Se extrage câte o bilă din fiecare urnă.
Se cere:
a) Probabilitatea P1 ca ambele bile să fie albe;
b) Probabilitatea P2 ca bilele să fie de aceeaşi culoare;
c) Probabilitatea P3 ca bilele să fie de culori diferite.
Soluţie
a) Fie evenimentele: A1 = “apariţia unei bile albe din urna U1” şi A2 = “apariţia unei
bile albe din urna U2”. Evenimentele A1 şi A2 sunt independente deci: P1 = P(A1  A2) =
7 4
P(A1) . P(A2) =   28% ;
10 10
b) Evenimentele A1  A2 şi Ā1  Ā2 sunt incompatibile deci
P2 = P[(A1  A2)  (Ā1  Ā2)] = P(A1  A2) + P(Ā1  Ā2) + P(A1) . P(A2) + + P(Ā1) .
7 4 3 6
P(Ā2) =     46%
10 10 10 10
c) P3 = 1 – P2 = 54%
4) Două becuri au probabilităţile de nedefectare :
P(A1) = 0.8; P(A2) = 0.9
Se cere:
a) Probabilitatea P1 ca prin circuitul serie al celor 2 becuri să treacă curentul;
b) Probabilitatea P2 ca prin circuitul paralel al celor 2 becuri să treacă curentul.
Soluţie
Evenimentele A1, A2 sunt compatibile şi independente.
a) P1 = P(A1  A2) = P(A1) . P(A2) = 0.8 x 0.9 = 72%;
b) P2 = P(A1  A2) = P(A1) + P(A2) – P(A1) . P(A2) = 0.8 + 0.9 – 0.72 = 98%
5) Doi ochitori lovesc o ţintă cu probabilităţile P(A1) = 0.7; P(A2) = 0.8
Se cere:
a) Probabilitatea P1 a lovirii ţintei dacă trag simultan amândoi asupra ei;
b) Probabilitatea P2 a lovirii ţintei dacă primul ochitor execută două focuri succesive
asupra ei;
c) Probabilitatea P3 a lovirii ţintei dacă al II-lea ochitor execută două focuri succesive
asupra ei.
Soluţie
A1, A2 sunt evenimente compatibile şi independente.
a) P1 = P(A1 A2) = P(A1) + P(A2) – P(A1) . P(A2) = 0.7 + 0.8 – 0.7 . 0.8 = 94%;
b) P2 = P(A1  A1) = P(A1) + P(A1) – (PA1) . P(A1) = 0.7 + 0.7 – 0.7 . 0.7 = 91%;
15

c) P3 = P(A2 A2) = P(A2) + P(A2) – P(A2) . P(A2) = 0.8 + 0.8 – 0.8 . 0.8 = 96%.
6) Un soi de grâu îndeplineşte condiţiile de calitate cu probabilităţile: P(MMB
standard) = 0.96; P(putere de germinare standard) = 0.97; P(umiditate standard) = 0.92
Se cere probabilitatea îndeplinirii standardelor pentru cele trei condiţii.
Soluţie. Condiţiile din enunţ sunt dependente deci P(A1  A2  A3) > P(A1) + P(A2) +
P(A3) – 3 + 1 = 0.96 + 0.97 + 0.92 – 2 = 0.85 = 85%.

1.3 Probabilităţile condiţionate ale evenimentelor

Pentru a descrie influenţa realizării unui eveniment A1 asupra realizării unui


eveniment A2 se foloseşte probabilitatea condiţionată.

Raportul

P A1  A 2 se numeşte probabilitatea lui A2 condiţionată de A1 şi se
P A 1 
notează PA1(A2) sau P(A2/A1).
Observăm că dacă A1 şi A2 sunt independente, avem :
P(A1  A2) = P(A1) . P(A2) deci P(A2) = P(A2).
De asemenea dacă A1 implică pe A2 (A1  A2) atunci A1  A2 = A1 deci P(A1  A2)
= PA1) aşa că PA1(A2) = 1.
Relaţia de definiţie P(A1  A2) = P(A1) . PA1(A2)
se extinde prin inductie după n:
P(A1  …  An) = P(A1) . PA1(A2) . . . PA1  …  An-1(An) (5)

Teorema 1.2. Dacă Ω = A1  … An cu A1, …, An  К şi Ai sunt incompatibile câte


două, pentru orice B  К avem :
1) (Formula probabilităţii totale):
P(B) = P(A1) . PA1(B) + … + P(An) . PAn(B) (6)
2) (Formula Bayes):
PAj  PAj B
PB Aj  (7)
PA1  PA1 B  ...  PA n   PAn B
pentru orice j = 1, …, n
Demonstraţie
1) Din relaţia Ω = A1  …  An rezultă:
B = (A1  B)  …  (An  B)
A1, …, An fiind incompatibile câte două şi A1  B, …, An  B vor fi incompatibile
câte două.
Din axioma 2) a probabilităţii rezultă:
P(B) = P(A1  B) + … + P(An  B)
Dar P(Aj  B) = P(Aj) . PAj(B) ; (j = 1, …, n)
deci rezultă relaţia (6) din enunt:
P(B) = P(A1) . PA1(B) + … + P(An) . PAn(B)
2)Avem:
PAj B P(Aj)  PAj (B)
PB Aj  
P(B) P(A1 )  PA1 (B)  ...  P(A n )  PAn (B)
; (j = 1, …, n) adică relaţia (7) din enunţ. Q . E . D.
16

Exemple
1) La o tombolă sunt 50 bilete din care 5 sunt câştigătoare. O persoană cumpără 3
bilete. Care este probabilitatea ca nici unul să nu fie câştigător?
Soluţie. Fie evenimentele Ai = “biletul la extragerea Nr.i a ieşit necâştigător” (i =
1,2,3).
Relaţia (5) se scrie:
45 44 43
P(A1  A2  A3) = P(A1) . PA1(A2) . PA1  A2(A3) =    72.7%
50 49 48
2) O urnă conţine 12 bile albe şi 8 bile negre.
Se extrag succesiv din urnă 3 bile cu bila nerevenită. Care este probabilitatea ca bilele
extrase să fie în ordine: albă, neagră, albă?
Soluţie. Fie evenimentul A1 = “prima bilă extrasă este neagră”; A2 = ” a doua bilä
extrasä este neagrä”; A3 = “a treia bilă extrasă este albă”.
Relaţia (5) se scrie:
12 8 11
P(A1  A2  A3) = P(A1) . PA1(A2) . PA1  A2(A3) =    15.4%
20 19 18
3) Se dau urnele U1 cu 12 bile albe şi 8 bile negre, U2 cu 10 bile albe şi 10 bile negre şi
U3 cu 6 bile albe şi 14 bile negre.
a) Se extrage o bilă dintr-o urnă. Care este probabilitatea ca ea să fie albă?
b) Se extrage o bilă dintr-o urnă şi se constată că este albă. Din ce urnă provine bila
extrasă?
Soluţie
Fie evenimentele Ai = “bila extrasă provine din urna Ui” (i = 1,2,3) şi B = “bila extrasă
este albă”.
a) Relaţia (6) se poate scrie:
P(B) = P(A1) . PA1(B) + P(A2) . PA2(B) + P(A3) . PA3(B) =
1 12 1 10 1 6 12 10 6 28
=           46.7%
3 20 3 20 3 20 60 60 60 60
b) Relaţia (7) se scrie pentru j = 1:
P(A1 )  PA1 (B)
12 28 12
PB (A1 )  :   42.8%
P(B) 60 60 28
10 6
Analog PB(A2) =  35.7 % ; PB(A3) =  21.5%
28 28
Deci este mai probabil că bila albă extrasă să provină din urna U1.
4) Se dau urnele U1 cu 12 bile albe şi 8 bile negre şi U2 cu 6 bile albe şi 14 bile negre.
Din U1 în U2 se transferă o bilă apoi se extrage o bilă din U2.
a) Care este probabilitatea ca bila extrasă din U2 să fie albă?
b) Ştiind că bila extrasă din U2 a fost albă, ce culoare avea bila transferată?
Soluţie. Fie evenimentele A1 = “bila transferată din U1 în U2 a fost albă”, A2 = “bila
transferată din U1 în U2 a fost neagră”; B = “bila extrasă din U2 este albă”.
a) Relaţia (6) pentru n = 3 se scrie:
P(B) = P(A1) . PA1(B) + P(A2) . PA2(B) =
17

12 7 8 6 84 48 132
=        31.4%
20 21 20 21 420 420 420
b) Relaţia (7) pentru j = 1 se scrie:
P(A1 )  PA1 (B) 84 132 84
PB(A1) =  :   63.6%
P(B) 420 420 132
48
Analog PB(A2) =  36.4% deci este mai probabil că bila transferată din U1 în
132
U2 a fost albă.
5) Trei boli la bovine au probabilităţile P(A1) = 0.45; P(A2) = 0.36; P(A3) = 0.19
Aceste boli modifică un parametru sanguin cu probabilităţile PA1(B)=0.23;
PA2(B)=0.41; PA3(B)=0.75
a) Care este probabilitatea ca o vacă bolnavă de una din cele trei boli să aibă
parametrul sanguin modificat?
b) La o vacă se constată că parametrul sanguin este modificat de una din cele trei
boli. Care din boli a provocat modificarea?
Soluţie
Fie evenimentele Ai = “vaca s-a îmbolnăvit de boala cu nr. i” (i = 1,2,3); B = “vaca are
parametrul sanguin modificat”.
a) Conform relaţiei (6) pentru n = 3 avem:
P(B) = P(A1) . PA1(B) + P(A2) . PB(A2) + P(A3) . PA3(B) = 0.45 . 0.23 + 0.36 . 0.41 +
.
0.19 0.75 = 0.1035 + 0.1476 +0.1425 = 39.36%
b) Relaţia (7) pentru j = 1 devine:
P(A1 )  PA1 (B) 0.1035
PB (A1 )    26.3%
P(B) 0.3936
0.1476 0.1425
Analog PB(A2) =  37.5% ; PB(A3) =  36.2% deci este
0.3936 0.3936
mai probabil că boala nr. 2 a modificat parametrul sanguin.

1.4 Rezumat
În acest capitol se prezintă definiţia unui eveniment , clasificarea evenimentelor şi exemple,
definiţia axiomatică şi clasică a probabilităţii , definiţia probabilităţii condiţionate , formulele
probabilităţii totale şi Bayes .

1.5 Întrebări
1. Ce este un eveniment şi ce operaţii se fac cu evenimente ?
2. Care este definiţia clasică a probabilităţii şi ce proprietîţi are probabilitatea ?
3. Cum se aplică formula probabilităţii totale şi formula Bayes la diagnosticul bolilor la
animale ?

1.6 Bibliografie
1.D.Ene , M.Drăghici, I.N. Alecu “ Statistică aplicată în agricultură “ Ed.Ceres,2003
2.M.Iosifescu şi col. “ Mică enciclopedie de statistică “ Ed.Ştiinţif.şi Enciclop,,1985
3. Anuarul statistic al României , 1990 -2003
18

CAPITOLUL 2.

VARIABILE, VECTORI ŞI PROCESE ALEATOARE

Obiective : Însuşirea de către studenţi a conceptelor de variabilă aleatoare şi indicatori


asociaţi , vector aleator şi indicatori asociaţi precum şi proces aleator ilustrat prin
lanţuri Markov finite . .

Conţinut :

2.1 Variabile aleatoare


2.2 Vectori aleatori
2.3 Procese aleatoare
2.4 Rezumat
2.5 Întrebări
2.6 Bibliografie

Cuvinte cheie : variabilă aleatoare , funcţie de repartiţie şi densitate de probabilitate,


media şi varianţa unei variabile aleatoare , funcţia caracteristică a unei variabile
aleatoare , vector aleator , covarianţa şi coeficientul de corelaţie liniară pentru un
vector aleator,proces aleator, lanţ Markov finit .

2.1. Variabile aleatoare

2.1.1 Densitatea de probabilitate şi funcţia de repartiţie a unei


variabile aleatoare

Fie spaţiul evenimentelor elementare Ω asociat unui eveniment aleator şi К  P(Ω) o


σ - algebră de evenimente incluse în Ω.
Fie mulţimea numerelor reale R şi σ - algebra mulţimilor boreliene B  P(R) adică
cea mai mică σ - algebră de submulţimi ale lui R care conţine toate intervalele din R.
Fie câmpul de probabilitate (Ω, К, P).

O variabilă aleatoare este o funcţie X: ΩR astfel că {ω / X(ω) B}К pentru orice
mulţime boreliană B  P(R).Dacă mulţimea valorilor variabilei aleatoare X este numărabilă
(şir finit sau infinit): x1, x2, …, xn, … atunci {X = xi} sunt evenimente şi cunoaşterea lui P(X
= xi) = f(xi) (i =1,2,3,…) permite calculul lui P(X  B) = f(xi) unde însumarea se face după
valorile lui i pentru care xi  B.
Funcţia xi  f(xi) (i  N) se numeşte densitatea de probabilitate a variabilei aleatoare
X.
Avem:
1  P()   f(x i )
iN
Dacă mulţimea valorilor variabilei aleatoare X este nenumărabilă, densitatea de
b
probabilitate este o funcţie reală f(x) > 0 astfel că P(a < X < b) = =  f(x)dx
a
19


În particular 1  P(  X   )   f(x)dx

În acest caz P(X  B)   f(x)dx
B
Observăm că orice constantă a  R este formal o variabilă aleatoare X cu valoarea a şi
P(X = a) = 1.
O variabilă aleatoare cu mulţimea valorilor numărabilă se numeşte discontinuă iar o
variabilă aleatoare cu mulţimea valorilor nenumărabilă se numeşte continuă.
Exemple de variabile aleatoare discontinue
1) Cu codificarea 1 = “stema”, 0 = “banul”, variabila aleatoare X: 0 1
½ ½
este asociată aruncării unei monezi;
2) La aruncarea unui zar avem variabila aleatoare X: 1 2 3 4 5 6
1/6 1/6 1/6 1/6 1/6 1/6

3) Se dă o urnă U cu 4 bile albe şi 6 bile negre. Se extrag n = 2 bile succesiv cu bila


revenită. Pot apare x = 0,1,2 bile albe deci avem variabila

aleatoare X: 0 1 2
9/25 12/25 4/25
Variabilele de la punctele 1) şi 2) se numesc uniforme deoarece toate valorile au
aceeaşi probabilitate (densitatea de probabilitate este funcţie constantă) iar variabila de la
punctul 3) nu este uniformă.
mx, x  [2;4]
4) Fie funcţia f(x)  
0 in rest
f(x) este densitatea de probabilitate a unei variabile aleatoare continue dacă
2 2
  4 4 2
 f(x)  1 şi f(x, y)  0 deci  mxdx  1 sau  mxdx  1 adică m. 1
 - 2 2
1
deci m  . Este vizibil că f(x) > 0.
6
Funcţia reală F(x) = P(X < x) se numeşte funcţia de repartiţie a variabilei aleatoare X.

Teorema 2.1. Avem proprietăţile:


1) F(x) ia valori în [0,1]; lim F(x) = 0; lim F(x)  1
x   x 
2) F(x) este o funcţie continuă la stânga:
lim F(x) = F(x0)
xx0
3) F(x) este funcţie crescătoare: x1 < x1  F(x1) < F(x2)
4) P(a < X < b) = F(b) – F(a)
P(X < b) = F(b)
P(a < X) = 1 – F(a)
Demonstraţie
1) Evident 0 < F(x) < 1 conform definiţiei lui F şi punctului 3) din teorema 1.1.
Fie şirul descrescător Xn cu limita -  şi evenimentele :
A0 = “X < x1”, Bn = < X < Xn-1” (n > 2).
20

Avem Bi  Bj = Ø pentru i  j şi A0 =  Bn deci


n2
P(A 0 )   P(Bn ) sau F(x1) = [F(x1) – F(x2)] + [F(x2) – F(x3)] + …+ +[F(x2) –
n2
F(x3)] + … + [F(xn) – F(xn+1)] + … adică F(x1) = F(x1) - lim F(x n ) aşa că
x n  

lim F(x n )  0 .
x n  
Relaţia lim F(x n )  1 se demonstrează în mod analog.
x n 
2) Fie şirul crescător xn cu limita x0.
Fie evenimentele A = “X < x0”; A0 = “X < x1”; An = “xn < X < xn+1” (nN).
Avem Ai  Aj = Ø pentru i  j şi A = A0  A1  A2  … An  … deci
P(A) = P(A0) + P(A1) + … + P(An) + …
adică F(x0) = F(x1) + [F(x2) – F(x1)] + … + [F(xn) – F(xn-1)] + …
adică F(x0) = lim F(x n ) deci F este continuă la stânga în x0.
xn x0
3) Fie evenimentele A = “X < x1”; B = “X < x2”.
Cum x1 < x2 rezultă A  B deci P(A) < P(B) aşa că F(x1) < F(x2) deci F este
crescătoare.
4) Fie evenimentele A = “X < a”;B = “X < b”;C = “a < X < b”. Avem A  C = Ø şi A
 C = B deci P(B) = P(A) + P(C) sau F(b) = F(a) + P(a < X < b).
Punând în această relaţie a = x0, b = x0 + ΔX avem P(x0 < X < x0 + ΔX) =
= F(x0 + Δx) – F(x0).
Cum F(x) este continuă la stânga, pentru ΔX  0 egalitatea precedentă devine: P(X =
x0) = 0.
În particular P(X = b) = 0 şi cum evenimentele a < X < b şi X = b sunt compatibile,
putem scrie P(a < X < b) = P(a < X < b) + P(X = b) =
= F(b) – F(a) + 0 = F(b) – F(a)
În fine P(X < b) = F(b) - lim F(x) = F(b) – 0 = F(b)
x
şi P(a < X) = 1 – P(X < a) = 1 – F(a) Q.E.D.
 x 1 ,........x n 
Dacă X este variabilă aleatoare discontinuă cu repartiţia   , ea are
p
 1 ,.......p n 
funcţia de repartiţie :

0 ,x < x1
P1 ,x1 < x < x2
F(x) = ………………..
P1 + … + pn-1, xn-1 < x < xn
1 , xn < x

Dacă X este variabilă aleatoare continuă cu densitatea de probabilitate f(x), X are


x
funcţia de repartiţie F(x)   f(t)dt .

21

Reciproc, avem F’(x) = f(x).


Pe graficul lui f(x), F(x) este aria de sub grafic aflată în stânga ordonatei lui x:

f(x)

F(x)

x
0 x
Exemple
1) Pentru variabila aleatoare discontinuă X cu repartiţia :

1 2 4 6 10
X: ave avem densitatea de probabilitate:
0.11 0.42 0.30 0.07 0.10

0.11 ,x=1
0.42 ,x=2
f(x) = 0.30 ,x=4
0.07 ,x=6
0.10 , x = 10 0 ,x<1
0 în rest 0.11 ,1<x<2
0.53 ,2<x<4
şi funcţia de repartiţie: F(x) = 0.83 ,4<x<6
0.90 , 6 < x < 10
1 , 10 < x

Avem P(1.5 < X < 7.4) = F(7.4) – F(1.5) = 0.90 – 0.11 = 69%
P(X < 5.8) = F(5.8) = 83%; F(3.4 < X) = 1 – F(3.4) = 1 – 0.53 = 47%
2) Pentru variabila aleatoare continuă X cu densitatea de probabilitate :
x x
 , x   2; 4 
f(x)   6 avem funcţia de repartiţie F(x)   f(t)dt
0 în rest 
x
Pentru x < 2 avem F(x)   0dt  0

x x
t t 1
Pentru 2 < x < 4 avem F(x)   dt   dt  (x 2  4) iar pentru
 6 2 6 12
x 4
t t
x > 4 avem  dt   dt  1
 6 2 6
22

1
P(2.3 < X < 3.6) = F(3.6) – F(2.3) = [(3.62  4)  (2.32  4)]  63.9% ;
12
1 2
P(X < 3) = F(3) = (3  4)  42.7%
12
1
P(2.5 < X) = 1 – F(2.5) = 1 - (2.52  4)  81.2%
12
Două variabilele aleatoare X1, X2 se numesc independente dacă
P(X1  B1 şi X2  B2) = P(X1  B1) . P(X2  B2)
În particular dacă X1, X2 sunt variabile aleatoare discontinue, X1, X2 sunt
independente dacă pentru orice x1, x2  R evenimentele “X1 = x1” şi X2 = x2” sunt
independente adică P(X1 = x1 şi X2 = x2) = P(X1 = x1) . P(X2 = x2)
Exemple
1) Aruncarea a două monezi sau zaruri care nu se ciocnesc, dau naştere la variabile
aleatoare independente;
2) Extragerea a câte unei bile albe din două urne dau naştere la variabile aleatoare
independente.
Între variabilele aleatoare independente se fac operaţiile aritmetice obişnuite.
Fie de exemplu variabilele aleatoare discontinue independente X şi Y cu repartiţiile
 x1 , ______ x m   y1 , ______ y n 
X :   ; Y :  
 p1 , ______ p m   q1 , ______ q n 
 i  1, .... m 
deci rij = P(X = xi şi Y = yj) = P(P(X = xi) . P(Y = yj) = pi . qj  
 j  1, .... n 
a
Dacă a  R, avem variabila aleatoare constantă a :  
1 
Vom avea variabilele aleatoare cu repartiţiile
 xi  a   ax i  X  x i /a 
X    ; aX :   ; :   (a  0)

 ip  p
 i  a  p 
 xa   xi  y j 
X a :  i  respectiv X  Y: ;
p  pi  q j 
 i   
 xi y j  X  x i /y j 
X Y :  ; :  (yj  0)
 p .q  Y  pi .q j 
 i j
Dacă X este variabilă aleatoare continuă cu densitatea de probabilitate f(x), atunci se
arată că variabila aleatoare Y = φ(X) unde φ este o funcţie bijectivă şi derivabilă, va avea
densitatea de probabilitate:
g(y) = f[φ-1(y)] . [ 1 (y) ]'
Exemplu
Se dă variabila aleatoare X cu densitatea de probabilitate :

x
f(x) = , x [0, 2]
2
0 , în rest
23

Se cere densitatea de probabilitate a variabilelor Y = 2X + 3;Y = e4X;Y = ln(X + 1)


Soluţie
y 3 1
a) Y  2X  3   1 (y)  ; [ -1 (y)]'  aşa că
2 2
y -3
, x [3; 7]
g(y) = 8
0 , în rest

lny 1
b) Y  e4X   1 (y)  ; [ -1 (y)]'  aşa că :
4 4y

lny
, y  [1; e8 ]
g(y) = 32y
0 , în rest

c) Y  ln(X  1)   1 (y)  e y  1; [ -1 (y)]'  e y deci

e 2y - e y
, y  [0; ln3]
g(y) = 2
0 , în rest

2.1.2 Indicatori numerici ai unei variabile aleatoare

În afară de funcţia de repartiţie F(x), variabila aleatoare X are şi următorii indicatori


numerici:

1) Media M(X) =  xf(x)dx


x i
Dacă X este discontinuă cu repartiţia X : (i N) atunci
pi
M(X) = xp
iN
i i

1
2) Mediana Me(X) este definită de relaţia: F(Me) 
2

3) Modul Mo(x) este punct de maxim pentru f(x)



2 2
4) Varianţa V(X) = M[(X – M(X)) ] =  [x  M(X)] f(x)dx


Dacă X este discontinuă cu repartiţia X : xi (i N) atunci


pi
24

V(X) =  [x i - M(X)]2 pi
iN
Observăm că eroarea pătratică totală :
SPA(x) =  (x  x i ) 2 pi este minimă pentru x = M(X) şi are valoarea minimă
i N
V(X).
5) Abaterea standard σ (X) =
V(X)
σ(X)
6) Coeficientul de variaţie c(X) =  100 (%)
M(X)
Exemple
1) Pentru variabila aleatoare discontinuă X cu repartiţia
 1 2 4 6 10 
X :  avem
 0.11 0.42 0.30 0.07 0.10 
M(X) = 1 x 0.11 + 2 x 0.42 + 4 x 0.30 + 6 x 0.07 + 10 x 0.10 = 3.57
Me(X) = 4; Mo(X) = 2
V(X) = (1 – 3.57)2 x 0.11 + (2 – 3.57)2 x 0.42 + (4 – 3.57)2 x 0.30 +
+ (6 – 3.57)2 x 0.07 + (10 – 3.57)2 x 0.10 = 6.3651
σ (X) = 6.3651  2.52
2.52
c(X) =  70.6%
3.57
2) Pentru variabila aleatoare continuă X cu densitatea de probabilitate :

x
, x [2; 4]
f(x) = 6 avem :
0 , în rest
 4 4
x 1 2 x3 4 1 3
M(X) =  xf(x)dx  x
2 6 dx   x dx  2 (4  23 )  3.11
62 18 18
x2  4
F(x) = pentru x  [2; 4] deci
12
x2  4 1
  Me(X)  10  3.16; Mo(X)  4 căci f(x) este crescătoare .
12 2

V(X)=
 4 4
2 x 1 3 2 2 2
 [x  M(X)] f(x)dx 2 (x  3.11)  6 dx  6 2 (x  6.22x  3.11 x) 
1  x4 x3 2
2 x  4
   6.22  11    0.6543; σ(X)  0.6543  0.81
6 4 3 2 2
25

0.81
c(X) =  26%
3.11
Proprietăţile mediei M(X) în raport cu operaţiile cu variabile aleatoare, sunt date de:

Teorema 2.2
Avem proprietăţile:
1) M(a) = a
2) M(X + a) = M(X) + a
3) M(aX) = aM(X)
4) M(X + Y) = M(X) + M(Y)
5) Dacă X, Y sunt independente, avem :
M(X . Y) = M(X) . M(Y)

Demonstraţie
Relaţiile rezultă prin calcul direct pentru variabile discontinue :
 x ... x m   y ... yn 
X : 1 ; Y : 1  şi se generalizează pentru variabile continue
 p1 ... p m   q1 ... q n 
folosind liniaritatea integralelor Q.E.D.
Proprietăţile variantei V(X) în raport cu operaţiile cu variabile aleatoare sunt date de:

Teorema 2.3
Avem proprietăţile:
1) V(a) = 0
2) V(X + a) = V(X)
3) V(aX) = a2V(X)
4) V(X) = M(X2) – M2(X)
5) X, Y = independente  V(X + Y) = V(X) + V(Y)
Demonstraţie
Relaţiile rezultă prin calcul direct (folosind şi teorema 2.2) pentru variabile
discontinue :
 x1 ... x m   y1 ... y n 
X : ;Y :  şi se generalizează pentru variabile continue folosind
 p1 ... p m   q1 ... q n 
liniaritatea integralelor Q.E.D.
Fie X o variabilă aleatoare cu media M(X) şi varianţa V(X) si fie ε > 0.
Dacă cunoaştem funcţia de repartiţie F(x) avem P(M(X) – ε < X < M(X) + ε) =
 
P X  M(x)  ε  FM(x)  ε   FM(x)  ε .
În caz contrar aplicăm inegalitatea Cebâşev valabilă pentru ε > σ (X), dată de:
Teorema 2.4
V(X)
P X  M(X)  ε   1 
ε2
Demonstraţie
 x1 , ........, x n 
Fie variabila aleatoare discontinuă X cu repartiţia X :  
 p1 , ........, p n 

Fie I = i/1  i  n, x i  M(X)  ε  deci :
26

n
P  X  M(X)  ε   1   P  x i  M(X)  ε  = 1   p i
i 1 iI
n
2 2
Avem V(X)    x i  M(X)  pi    x i  M(X)  pi  ε 2  p i aşa că:
i 1 iI iI

V(X)
1  1   p i  P X  M(X)  ε . Demonstraţia când X este variabilă
ε2 iI
aleatoare continuă se face la fel ca mai sus, înlocuind sumele cu integrale. Q.E.D.
Exemple
1) Se dă variabila aleatoare discontinuă X cu repartiţia :
 1 2 4 6 10 
X:  şi cu M(X) = 3.57; V(X) = 6.3651;
 0.11 0.42 0.30 0.07 0.10 
σ (X) = 2.52. Se cere o margine inferioară pentru P  X  3.57  3
Soluţie. Conform inegalităţii Cebâşev cu ε = 3 σ (X) avem:
V(X) 6.3651
P  X  3.57  3  1  2
 1  29.3% .
ε 9
2) Pentru variabila aleatoare continuă X cu densitatea de probabilitate
X
 , X   2; 4
f(X)   6 şi cu M(X) = 3.11;V(X) = 0.6543; σ (X) = 0.81
 0 , în rest
Se cere o margine inferioară pentru P X  3,11  1 .  
Soluţie. Conform inegalităţii Cebârşev cu ε = 1 > σ (X) avem:
V(X) 0.6543
P  X  3.11  1  1   1   34.6%
ε2 1
2.1.3 Funcţia caracteristică a unei variabile aleatoare

Un instrument puternic în studiul variabilelor aleatoare oferă funcţia caracteristică.


Fie X o variabilă aleatoare cu densitatea de probabilitate f(X) şi fie variabila aleatoare
complexă:
e itX  costX  sintX
Funcţia complexă de variabilă reală : (t) = M(eitX) = M(cos tX + isin tX)
se numeşte funcţie caracteristică a variabilei aleatoare X.
Dacä X este variabilä aleatoare discontinuä avem :
itx j
 (t )   e pj
jN

Dacä X este variabilă aleatoare continuă avem :



itx
 (t)  e f(x)dx .

În ambele cazuri φ(t) este funcţie continuă.
27

Teorema 2.5. Avem proprietăţile:


1) φ(0) = 1;  (t)  1;  (-t)   (t)
2) Dacă X are funcţia caracteristică φ(t) atunci aX are funcţia caracteristică φ(at).
3) Dacă X, Y sunt independente şi au funcţiile caracteristice φ1(t), φ2(t) atunci
variabila aleatoare X + Y are funcţia caracteristică φ1(t) . φ2(t).
4) Momentele de ordin k ale lui X sunt date de relaţiile:
 (k) (0)
M(X k )  ; (k  N)
ik
Demonstraţie
1) φ(0) = M(e0) = M(1) = 1

   
itx itx
 (t)   e f(x)dx   e f(x)dx   cos tx  i sin tx f(x)dx   f(x)dx  1
   
 itX
 (  t)  M(e )  M(cos tX - i sin tX)   (t)
2) Variabila aleatoare aX are funcţia caracteristică :

iatX i(at)x
M(e ) e f(x)dx   (at)

3) X + Y are funcţia caracteristică:
 (t)  M(eit(X Y) )  M(ei t X .eitY )  M(eit X ).M(ei t Y ) căci X, Y sunt
independente deci φ(t) = φ1(t) . φ2(t)
4) Derivăm funcţia caracteristică de k ori:
 
(k) k itx k k itx
 (t)   (ix) e f(x)dx  i xe f(x)dx deci
 

 (k) (0)  ik  k
 x f(x)dx  i M(X
k k
) Q.E.D.

Inversarea transformatei Fournier permite exprimarea în mod unic a densităţii de
probabilitate f(x) a variabilei aleatoare X cu ajutorul funcţiei caracteristice φ(t):
1  i t x
f(x)  e  (t)dt
2π 
Teorema 2.5 transferă proprietăţile lui φ(t) la f(x):

1) f(x) > 0;  f(x)dx  1

2) Dacă variabila aleatoare X are densitatea de probabilitate f(x), variabila aX are
densitatea af(x).
3) Dacă variabilele aleatoare independente X, Y au densităţile de probabilitate f1(x),
f2(x), atunci variabila aleatoare X+Y are ca densitate de probabilitate produsul de convoluţie
 
al lui f1(x), f2(x): f(x)   f(s)g(x  s)ds   f(x  s)g(s)ds
 
4) Momentele de ordin k ale variabilei aleatoare X sunt date de relaţia:
28


MX k
   x f(x)dx
k


Exemple
 1 2 4 
1) Fie variabila aleatoare discontinuă X cu repartiţia X: 
 0.1 0.6 0.3 
Să se afle funcţia caracteristică φ(t)
it 2it 4it
Soluţie.  (t)  e  0.1  e  0.2  e  0.3
2) Fie variabila aleatoare continuă X cu densitatea de probabilitate

x
 , x   2; 4
f(x)   6 Se cere funcţia caracteristică φ(t)
0 în rest
Soluţie

itx 14 itx 1 4 4 
 (t)   e f(x)dx   e xdx    x cos t x dx  i  x sin tx dx  
 62 6 2 2 
1

 2 1  4it e 4it  1  2it e 2it
6t

2.2. Vectori aleatori

2.2.1 Densitatea de probabilitate şi funcţia de repartiţie a unui vector aleator

Fie spaţiul euclidian Rn şi σ - algebra mulţimilor boreliene B  P(Rn) adică cea mai
mică σ - algebră de submulţimi ale lui Rn care conţine toate intervalele din Rn.
Fie câmpul de probabilitate (Ω, K, P).
Un vector aleator n – dimensional este o funcţie X = (X1, …, Xn): Ω  Rn astfel că
 
ω X(ω(  B  K pentru orice mulţime boreliană B  P(Rn).
Componentele X1, …, Xn sunt variabile aleatoare numite variabile marginale pentru
X.
Pentru simplificarea expunerii, vom prezenta cazu n = 2 adică vectorii aleatori
bidimensionali Z = (X, Y).
Dacă mulţimea valorilor vectorului aleator Z = (X, Y) este numărabilă (şir finit sau
infinit) vectorul aleator se numeşte discontinuu.
De exemplu daxă variabila aleatoare X ia valorile x1, ….., xm iar variabila aleatoare Y
ia valorile y1, …, yn, cunoaşterea lui rij = P(X = xi şi Y = yj) adică a densităţii de probabilitate
m n
a lui Z = (X, Y) cu 1    rij permite cunoaşterea repartiţiei vectorului aleator
i 1 j 1
discontinuu Z = (X, Y)
Repartiţia vectorului aleator discontinuu Z = (X, Y) se dă prin tabelul:
29

Y y1 ……………………… yn Suma linie


X
x1 r11 …………………….. r1n q1
. .
. .
. .
. .
xm rm1 ……………………...rmn qn

Suma coloană p 1 ……………………… p n 1

 x1 ___ x m  m
Variabila marginală X are repartiţia X :   media: M(X) xipi şi
 p1 ___ p m  i 1
m
2 2
varianţa: V(X)   x i p i  M(X)
i 1
 y1 ___ Yn  n

Variabila marginală Y are repartiţia Y :   media: M(Y) y jq j şi

 q1 ___ q n  j1
n
2 2
varianţa: V(Y)   y j q j  M(Y)
j 1
Exemplu. La tragerea la ţintă, orice lovitură este caracterizată de perechea (X, Y) unde
X este abaterea în direcţie faţă de centrul O al ţintei şi Y este abaterea în înălţime faţă de
centrul O al ţintei iar rij = P(X = xi şi Y = yj); i, j  N este probabilitatea ca o lovitură să aibă
abaterea în direcţie xi şi în înălţime yj.
Dacă mulţimea valorilor vectorului aleator Z = (X, Y) este nenumărabilă atunci
vectorul aleator se numeşte continuu şi densitatea sa de probabilitate este o funcţie reală
bd
f(x, y) > 0 astfel că P(a < X < b şi c < Y < d) =   f(x, y)dxdy .
ac
 
În particular 1  P(X  R si Y  R)    f(x, y)dxdy
-  
mx 2 y, x  2;4

Exemplu. Fie funcţia f(x, y)   y  1;3 şi f(x,y) este densitatea de
 0 in rest

 
probabilitate al vectorului aleator continuu Z = (X, Y) dacă   f(x, y)  1 şi f(x,y) > 0 deci
 
  4 3
2
  mx ydxdy  1 sau m  x 2 dx   ydy  1 deci
  2 1
30

56 3
m  4  1 aşa că m . Vizibil f(x,y) > 0.
3 224
Funcţia de repartiţie a vectorului aleator Z = (X, Y) este F(x, y) = P(X < x şi Y < y).
Ca şi în cazul variabilei aleatoare (teorema 2.1.) se demonstrează:

Teorema 2.6
Avem proprietăţile:
1) F(x, y) ia valori în [0; 1];

lim F(x, y)  lim F(x, y)  lim F(x, y)  1


x   y   (x, y)  (  ,  )
2) F este continuă la stânga în raport cu fiecare variabilă:
lim F(x, y)  F(x 0 , y) ; lim F(x, y)  F(x, y 0 )
xx y y
0 0

3) F este crescătoare în raport cu fiecare variabilă:


x1 < x2  F(x1, y) < F(x2, y)
y1 < y2  F(x, y1) < F(x, y2)
4) P[a < X < b şi c < Y < d] = [F(b,d) – F(a,d)] - [F(b,c) – F(a,c)]
P(X < b şi Y < d) = F(b,d)
P(a < X şi c < Y) = 1 – F(a,c)
Variabilele aleatoare X, Y care compun vectorul aleator Z = (X, Y) , au funcţiile de
repartiţie:
F1 (x)  lim F(x, y) şi F2 (y)  lim F(x, y)
y x 
Cunoscând densitatea de probabilitate f(x,y) a vectorului aleator X = (X,Y), funcţia sa
de repartiţie este dată de relaţia:
x y

F(x, y)    f(s, t)ds dt


 
Reciproc dacă F(x,y) este derivabilă de două ori în raport cu x, y avem densitatea de
probabilitate f(x,y) = F”xy(x,y). Variabilele X, Y vor avea densităţile de probabilitate:

f1 (x)   f(x, y)dy  F'1 (x)


f 2 (y)   f(x, y)dx  F' 2 (y)

Exemplu. Pentru vectorul aleator Z = (X, Y) cu densitatea de probabilitate
 3 2
 224 x y ; x  2,4

f(x, y)   y  1,3 avem funcţia de repartiţie
 0 in rest


31

x y x y x y
2 3 2 3 s3 x t 2 y
F(x, y)    f (s, t)ds d t    s tds d t   s ds  tdt   
   
14  
224 3  2 

 0 , x  2 sau y  1
 1

adică: F(x, y)   (x 3  23 )(y2  12 ) în rest
 448
 1 , x  y si y  3
Pe graficul suprafeţei z = f(x, y), densitatea de probabilitate f(x, y) este cota punctului
de abscisă x şi ordonată y iar funcţia de repartiţie F(x, y) este volumul de sub suprafaţa z =
f(x, y) aflat în semispaţiul Z > 0 şi în stânga planelor X = x şi Y = y.

Teorema 2.7
Variabilele aleatoare X, Y din componenţa vectorului aleator Z = (X, Y) sunt
independente dacă şi numai dacă F(x, y) = F1(x) . F2(y) sau dacă şi numai dacă f(x, y) = f1(x) .
f2(y)
Demonstraţie
X, Y sunt independente dacă şi numai dacă evenimentele “X < x” şi Y < y” sunt
independente dacă şi numai dacă P(X < x şi Y < y) = P(X < x) . P(Y < y) dacă şi numai dacă
F(x, y) = F1(x) . F2(y) de unde prin derivare parţială în raport cu x, y obţinem F”xy(x, y) =
F’1(x) . F’2(y) adică f(x, y) = f1(x) . f2(y). Q.E.D.

2.2.2 Indicatori numerici ai unui vector aleator

În afară de funcţia de repartiţie F(x, y), vectorul aleator Z = (X, Y) are şi următorii
indicatori numerici:
1) Vectorul medie M(Z) = (M(X), M(Y)) unde
 
M(X)   xf1 (x)dx; M(Y)   yf 2 (y)dy
 
 x1 ___ x m 
Dacă X, Y sunt discontinue, de exemplu dacă X :   şi
 p1 ___ p m 
 y1 ___ y n  m n
Y :   avem: M(X)   x i pi ; M(Y)   y jq j
 q1 ___ q n  i 1 j 1
C(X, X) C(X, Y)
2) Matricea de covarianţă : C(Z) 
C(Y, X) C(Y, Y)
Aici C(X, Y) este covarianţa variabilelor aleatoare X, Y dată de relaţia de definiţie:
C(X, Y) = M[(X – M(X) . (Y – M(Y)].
Dacă X, Y sunt discontinue, avem:
m n
C(X, Y)    (x i  M(X))  (y j  M(Y))  rij
i 1 j 1
unde rij = P(X = xi şi Y = yj)
Dacă X, Y sunt continue avem:
32

 
C(X, Y)    (x  M(X)  (y  M(Y))  f (x, y)dx dy
 
Este vizibil că C(X,Y) = C(Y,X)
De asemenea avem:
m 
C(X, X)  V(X)   (x i  M(X)) 2  p i   (x  M(X))  f1 (x)dx respectiv:
i 1 
n 
C(Y, Y)  V(Y)   (y j  M(Y)) 2  q j   (y  M(Y))  f 2 (y)dy
j 1 
Observăm că eroarea pătratică totală :
m n
SPA(x, y)   (x  x i )  pi   (y  y j )2  q j este minimă pentru x = M(X),
2

i 1 j1
y = M(Y), valoarea minimului fiind urma V(X) + V(Y) a matricii de covarianţă C(Z).
2) Funcţia de regresie Y = g(X)
În cazul vectorului aleator discontinuu Z = (X,Y) definim mediile condiţionate:
n
M c (x i )  M X  x i (Y)   y jrij se defineşte prin relaţiile: g(xi) = MX=xi (Y)
j 1
În cazul vectorului aleator continuu Z = (X,Y) definim mediile condiţionate:

Mc(xi) = MX=Xi(Y) =  yf(x, y)dy iar funcţia de regresie va fi:

g(x) = Mc(x)
4) Coeficientul de corelaţie liniară al variabilelor aleatoare X,Y este definit de
relaţia:
C(X, Y) C(X, Y)
ρ(X, Y)  
V(X)  V(Y) σ(X)  σ(Y)
Proprietăţile covarianţei C(X,Y) în raport cu operaţiile cu variabile aleatoare, sunt date
de:

Teorema 2.8
Avem proprietăţile:
1) C(a,b) = 0
2) C(X + a, Y + b) = C(X,Y)
3) C(aX, bX) = abC(X,Y)
1
4) C(X,Y) = M(X . Y) – M(X) . M(Y) = V(X  Y)  V(X)  V(Y)
2
5) Dacă X,Y sunt variabile aleatoare independente atunci C(X,Y) = 0 adică X,Y sunt
necorelate liniar.
Dacă X,Y sunt variabile aleatoare normale este adevărată şi reciproca.
Demonstraţie
Relaţiile 1) – 4) rezultă prin calcul direct, folosind teoremele 2.2 şi 2.3 şi definiţia lui
C(X,Y).Dacă X = Y, din teorema 2.8 reobţinem teorema 2.3.
Să demonstrăm punctul 5) din enunţ.
33

Dacă X,Y = variabile aleatoare independente, conform teoremelor 2.2 şi 2.3 avem
M(X . Y) = M(X) . M(Y) respectiv V(X + Y) = V(X) + V(Y) deci conform punctului 4) din
enunţ, avem C(X.Y) = 0 adică X, Y nu sunt corelate liniar. Reciproca pentru X, Y = variabile
aleatoare normale va fi demonstrată în teorema 3.10.
Dacă X, Y nu sunt variabile aleatoare normale, reciproca afirmaţiei de la punctul 5)
din enunţ, nu este adevărată: există variabile necorelate liniar care sunt dependente.
Exemplu
Pentru vectorul aleator discontinuu Z = (X, Y) cu repartiţia
Y 1 3 Suma p
X
1 0.4 0 0.4
2 0.1 0.5 0.6
Suma q 0.5 0.5 1

Avem C(X, Y) = 0 deşi:


0.1 = P(X = 2, Y = 1)  P(X = 2) . P(Y = 1) = 0.6 . 0.5 = 0.3 Q.E.D.
Proprietăţile coeficientului de corelaţie liniară ρ(X,Y) în raport cu operaţiile cu
variabile aleatoare sunt date de:

Teorema 2.9
Avem proprietăţile:
1) ρ(a, b) = 0
2) ρ(X + a, Y + b) = ρ(X,Y)
3) ρ(aX, bY) = ρ(X, Y)
4) ρ(X, Y)  1; ρ(X, Y)  1; dacă şi numai dacă X,Y sunt dependente funcţional
liniar: Y = aX + b
5) Dacă X, Y sunt variabile aleatoare independente atunci ρ(X, Y) = 0 adică X, Y
sunt necorelate liniar.
6) Dacă X, Y sunt variabile aleatoare normale, este adevărată şi reciproca.
Demonstraţie
Relaţiile 1) – 3) rezultă prin calcul direct, folosind teoremele 2.3, 2.8 şi definiţia lui
C(X, Y)
ρ(X, Y) = . Din relaţiile 2) – 3) rezultă:
V(X)  V(Y)
 X  M(X) Y - M(Y) 
ρ(X, Y)  C , 
 σ(X) σ(Y) 
Relaţia 5) din enunţ rezultă din relaţia 5) a teoremei 2.8 şi din definiţia lui ρ(X, Y).
Să demonstrăm punctul 4) din enunţ.
Avem V[ σ (Y) . X - σ (X) . Y] > 0, relaţie în care folosim teoremele 2.2, 2.3, 2.8 şi
obţinem: σ 2(X) . σ 2(Y) - σ (X) . σ (Y) . C(X,Y) > 0 sau
C(X, Y)
1
σ(X)σ(Y)
În mod analog relaţia V[ σ (Y) . X + σ (X) . Y] > 0 conduce la relaţia ρ(X, Y) > - 1
deci ρ(X, Y)  1
Dacă ρ(X, Y)  1 să arătăm că Y = aX + b.
Fie funcţia E(a, b) = M[(Y – aX – b)2]
Folosind teoremele 2.2, 2.3, 2.8, avem:
34

E(a, b) = V(Y) + a2V(X) – 2a ρ(X, Y) . σ (X) σ (Y) + [M(Y) – aM(X) - b]2


Pentru a minimiza funcţia E(a, b), anulăm derivatele sale parţiale în raport cu a, b:
E' a  2aV(x)  2ρρX, Y)  σ(X)σ(Y)  2M(X)  M(Y)  aM(X)  b  0

E' b  2M(Y)  aM(X)  b
cu soluţia:

σ(Y)
a  ρ(X, Y) ; b  M(Y)  aM(X)
σ(X)

2
Valoarea minimului este E min  [1  ρ (X, Y)]  V(Y) .
Dacă ρ(X, Y)  1 avem Emin = 0 adică: M(Y – aX – b) = 0 deci Y = aX + b
Reciproc, dacă Y = aX + b să arătăm că ρ(X, Y)  1
Avem
C(X, aX  b) aV(X) 1
ρ(X, Y)  ρ(X, aX  b)    1
V(X)  a 2 V(X)
V(X)  V(aX  b) a
deoarece C(X,aX + b) = M[X(aX + b)] – M(X) . M(aX + b) =
= aM(X2) – aM2(X) = aV(X)
Dacă a > 0 avem ρ(X, aX + b) = 1 iar dacă a < 0 avem ρ(X, aX + b) = -1
a se numeşte coeficientul de regresie liniară iar b se numeşte termenul liber al
regresiei.
Exemplu
Fie vectorul aleator discontinuu Z = (X, Y) cu repartiţia:

Y 1 2 0 Suma p
X
1 0.5 0.1 0 0.6
2 0 0 0.4 0.4
Suma q 0.5 0.1 0.4 1

Să se calculeze M(Z), C(Z), Y = g(X), ρ(X, Y) şi coeficienţii regresiei liniare a, b.


Soluţie
 1 2  are media M(X) = 1.4
Variabila X:  şi varianţa V(X) = 0.2
 0.6 0.4 
 1 2 3  are media M(Y) = 1.9
Variabila Y:  şi varianţa V(Y) = 0.89
 0.5 0.1 0.4 
Vectorul medie este M(Z) =( 1.4; 1.9)
Avem covarianţa C(X, Y) =( 1 – 1.4) . (1 – 1.9) . 0,5 + (1 – 1.4) . (2 – 1.9) . 0.1 + (2 – 1.4)
.
(2 – 1.9) . 0.4 = 0.44
Matricea de covarianţă va fi:
35

 0.24 0.44 
C(Z)   
 0.44 0.89 
Avem mediile condiţionate:
MX=1(Y) = 1 . 0.5 + 2 . 0.1 + 3 . 0 = 0.7
MX=2(Y) = 1 . 0 + 2 . 0 + 3 . 0.4 = 1.2
deci funcţia de regresie Y = g(X) are forma tabelară: x g(x)
1 0.7
2 1.2
Avem coeficientul de corelaţie liniară
C(X, Y) 0.44
ρ(X, Y)    0.96
V(X)  V(Y) 0.24  0.89
Coeficientul de regresie este:
σ(Y) 0.89
a  ρ(X, Y)   0.96  1.85
σ(X) 0.24
Termenul liber al regresiei este: b = M(Y) – aM(X) = 1.9 – 1.85 . 0.24 = 1.46

2.3. Procese aleatoare

2.3.1 Lanţuri Markov finite

O funcţie aleatoare este o funcţie de variabila nealeatoare t notată cu X(t), care pentru
fiecare valoare fixată t0 a lui t, este variabilă aleatoare X(t0).
Exemplu X(t) = tX.
Pentru t = 1 avem variabila aleatoare X(1) = X iar pentru t = 2 avem variabila
aleatoare X(2) = 2X.
Secţiune a unei funcţii aleatoare X(t) este variabila aleatoare X(t0) deci funcţia
aleatoare este o mulţime {X(t)} de variabile aleatoare care depind de parametrul t.
Realizarea (traiectoria, funcţia de sondaj) a unei funcţii aleatoare X(t) este funcţia
nealeatoare de t în care variabila aleatoare X ia o valoare dată într-o experienţă concretă.
Exemplu. Pentru X(t) = tX dacă în prima experienţă avem X = 5 atunci prima
realizare este x1(t) = 5t iar dacă în a II-a experienţă avem X = 2 atunci a doua realizare este
x2(t) = 2t.
Deci o funcţie aleatoare este mulţimea tuturor realizărilor sale posibile.
Un proces aleator este o funcţie aleatoare X(t) în care variabila t este timpul.
În acest sens, producţia agricolă vegetală şi zootehnică sunt procese aleatoare.
Dacă t ia un şir de valori t0, t1, … tn, … atunci procesul aleator este un şir aleator
{X(t0), X(t1), … X(tn), …} numit şi lanţ aleator.
Un exemplu remarcabil de şir aleator este lanţul Markov finit.
Fie t  {0, 1, …, n} şi variabilele aleatoare X(0), X(1), …, X(n). Stările lanţului finit
sunt numerele reale x0, x1, … xn.
Dacă realizarea evenimentului X(k) = xj nu depinde decât de realizarea evenimentului
precedent X(k – 1) = xi pentru orice i, j, k  {0, 1, …, n} lanţul finit se numeşte lanţ Markov
cu un număr finit de stări.
36

Probabilitatea p (0)i = P(X(0) = xi) se numesc probabilităţi iniţiale iar probabilităţile pij
(k) = P(X(k) = xj X(k  1)  x i ) se numesc probabilităţi de trecere din starea xi în starea
xj.
Se presupune că lanţul Markov este omogen adică probabilităţile de trecere nu depind
de k deci pij(k) = pij. Fie M = (pij) matricea pătratică a probabilităţilor de trecere de ordin n +
n
1. Avem p
j0
ij  1.
Fie Pij(m) probabilitatea ca să trecem din starea xi în starea xj după m paşi.

Avem Pij (1) = p ij. Fie M(m)= (pij(m)) ,m  N deci M(1) = M.


Fie A evenimentul că după m paşi sistemul trece din starea xi în starea xj deci P(A) = pij(m) să
fie Br evenimentele că după s paşi sistemul trece din starea xi în
starea xr(0 < r < n) deci P(Br) = pir(s).
PBr(A) este probabilitatea condiţionată a realizării lui A dacă s-a realizat Br adică după
m – s paşi sistemul trece din starea xr în starea xj deci PBr(A) = prj(m-s).
Formula probabilităţii totale din teorema 1.2 are forma:
n
P (A )   P(B r )  PB r (A) adică
r 0
n
Pij (m)   Pir ( s ) Prj (m  s )
r 0
relaţie numită egalitatea Markov.
Pentru m=2 ;s = 1 egalitatea Markov devine:
n
Pij (2)   Pir (1) Prj (1)
r 0
Sub formă matricială avea: M(2) =M.M = M2
Pentru m=3 ;s=2 egalitatea Markov devine:
n
Pij (3)   Pir (2)Prj (1)
r 0
sau matricial M(3) = M(2) . M = M3
În general M (m) = Mm
Dacă cunoaştem vectorul de lungime n + 1 al probabilităţilor iniţiale

V0  p (00) , ..., p (0)
n 
şi matricea M = (pij) de ordin n + 1 a probabilităţilor de trecere
atunci după m paşi situaţia lanţului Markov este dată de produsul V0M(m) = V0 Mm .
Exemplu
O fermă comercializează un produs pentru agricultură împreună cu alte două firme.
Firma are iniţial o pondere pe piaţa produsului de 45% iar celelalte firme au ponderile
de 25% şi respectiv 30% deci V0 = (0.45, 0.25, 0.30).
Preferinţele cumpărătorilor pentru produs de la cele trei firme sunt relativ stabile şi
date de matricea:
 0.80 0.10 0.10 
M   0.35 0.50 0.15 
 0.10 0.15 0.75 
 
37

Se cere evoluţia ponderilor pe piaţă ale celor trei firme după m = 6 etape de vânzare.
Soluţie
V0 M6 = (0.50; 0.19; 0.31)
deci produsul de la firma 1 este în creştere, cel al firmei 2 în scădere iar cel al firmei 3
este staţionar.

2.3.2 Indicatori ai unui proces aleator

Procesului aleator X(t) i se asociază noţiunile:


1) Densitatea de probabilitate a procesului aleator X(t) este dată de relaţia:

P( X( t )  [ x, x  Dx]
f (x, t )  lim iar funcţia de repartiţie a procesului
DX  0 Dx
aleator X(t) este F(x, t) = P(X(t) < x).
2) Media procesului aleator X(t) dată de relaţia x(t) = M[X(t)] este funcţia
nealeatoare de t, care pentru fiecare valoare fixată t 0 a lui t, este egală cu media variabilei
aleatoare X(t0).
3) Varianţa procesului aleator X(t) dată de relaţia Vx(t) = V[X(t)] este funcţia
nealeatoare de t, care pentru valoarea fixată t0 a lui t, este egală cu varianţa
variabilei aleatoare X(t0).
Pentru procesele aleatoare X(t), Y(s) se defineşte:
4) Funcţia de corelaţie dată de relaţia
Cxy(t, s) = M[(X(t) - x(t)) . (Y(s) - y(s))]
este funcţia nealeatoare de t şi s care pentru fiecare valoare fixată t0 a lui t
şi s0 a lui s , este egală cu covarianţa variabilelor aleatoare X(t0) şi Y(s0).
5) Funcţia de corelaţie normată dată de relaţia
C xy (t , s)
 xy (t , s)  ,
Vx (t )Vy ( s )
este funcţia nealeatoare de t şi s care pentru fiecare valoare fixată t0 a lui t şi s0 a lui s,
este egal cu coeficientul de corelaţie liniară ale variabilelor aleatoare X(t0) şi Y(s0).
Caz particular: Y = X, S = t + τ
În acest caz funcţia Cxy(t,s) se numeşte funcţie de autocorelaţie a procesului aleator
X(t) şi este dată de relaţia:
C x ( t , )  M( X ( t )   x ( t ))  ( X ( t  )   x ( t  ))
Avem Vx(t) = Cx(t,0).
Funcţia de corelaţie normată se va numi funcţie de autocorelaţie normală şi este dată
C x ( t , )
de relaţia:  x ( t , ) 
Vx ( t )Vy ( t  )
Un proces aleator X(t) este staţionar dacă media sa nu depinde de t (este constantă):
μx(t) = μx şi funcţia sa de autocorelaţie nu depinde de t ci numai de τ: Cx(t, τ) = Cx(τ).
În acest caz Vx(t) = Cx(t, 0) = Cx(0) deci varianţa este constantă: Vx(t) = Vx.
Funcţia de covariaţie a procesului aleator staţionar X(t) este:
R x ()  MX (t )  X( t  )
2
Avem Rx(τ) = Cx(τ) +  x deci pentru μx = 0 avem Rx(τ) = Cx(τ).
38

Exemple de procese aleatoare staţionare


1) X(t) = U cos Ωt + W sin Ωt.
Aici Ω este frecvenţa constantă iar U, W sunt variabile aleatoare necorelate cu M(U) =
M(W) = 0 şi V(U) = V(W) = V
U
Fie amplitudinea aleatoare A  U 2  W 2 şi faza aleatoare   arctg .
W
Procesul aleator capătă forma: X ( t )  A sin( ωt  φ)
Avem  x ( t )  0 aşa că C x ( t , )  R x ( t , )  MX ( t )  X ( t  ) 
= M( U cos ωt  W sin ωt )  ( U cos ω( t  τ)  W sin( t  τ))  V cos ωτ deci
Rx (t, τ) nu depinde de t ci de τ aşa că procesul este staţionar.
n
2) X ( t )   U j cos ω j t  W j sin ω j t (1)
j 1
unde ωi sunt frecvenţe constante; Uj, Wj, sunt variabile aleatoare necorelate cu M(Uj) = M(Wj)
= 0 şi V(Uj) = V(Vj) = Vj
Avem ca mai sus:
n
R x ( t , )   Vj cos ω j  deci şi acest proces aleator este staţionar.
j 1
Formula (1) a procesului aleator X(t) se numeşte descompunere spectrală a lui X(t).
n
Avem VX ( t )    V j deci graficul cu punctele (ωj, Vj) se numeşte spectru discret
j 1
pentru X(t).

3) X ( t )   U j cos ω j t  W j sin ω j t
j 1
Presupunem că (ωi) iN formează o progresie aritmetică cu raţia
π πj
deci ω j  (j  N)
T T
 πj
Ca şi mai sus avem Rx ( τ )   Vj cos τ (2)
j1 T

Pentru τ = 0 cu Rx(0) = V[X(t)] rezultă V[X(t)] =  Vj (j  N).
j 1
Din relaţia (2) rezultă că Rx(τ) este periodică cu perioada 2T dezvoltată în serie
Fourier de cosinusuri.
Coeficienţii Fourier au forma:
1 T πj
Vj   R x ( τ) cos τdτ (j  N) (3)
T T T
πj
Dar Cx(τ) este funcţie pară şi ω j  aşa că avem:
T
39

2T
Vj   R x (τ) cos ω j τdτ (j  N)
T0
Funcţia (ωj, Vj) defineşte spectrul discret al procesului aleator staţionar de la punctul
π
3) cu liniile spectrale de înălţime Vj echidistante (distanţa între 2 linii vecine este ).
T
4) Fie T   deci /T 0 .
În acest caz spectrul discret devine spectru continuu şi Vj devine spectru continuu ca
funcţie de ω: Vx = Sx(ω).
Densitatea spectrală Sx(ω) a procesului aleator staţionar X(t) este transformata
Fournier a funcţiei de covariaţie Rx(τ):
1 
S x ( ω)   R x ( τ)e  iωτ dτ (4)
2π  
Reciproc:

R x ( τ)   S x (ω)e iωτ dω (5)

Sub formă reală avem:
1
S x (ω)   R x ( τ )cosω τ dτ (6)
π0
şi reciproc:

R x ( τ)   Sx (ω)cosω τ dω (7)
0
Pentru τ = 0 avem Rx(0) = Vx iar Sx(ω) este funcţie pară odată cu Rx(τ) deci relaţia (7)
ne dă:
 
Vx  2  S x (ω)dω   S x (ω)dω (8)
0 
deci în adevăr, Sx(ω) este densitatea spectrului Vx ca funcţie de ω.
Exemplu
τ
Fie procesul aleator X(t) cu funcţia de covariaţie Rx(τ) = 1  pentru τ  2 .
2
Se cere densitatea spectrală Sx(ω) a procesului.
Soluţie
Avem conform relaţiei (6):
1 2 τ sin 2 ω
S x (ω)   1   cos ω τ dτ 
π 0 2  πω 2
Funcţia δ(t) a lui Dirac este definită de relaţia

 δ(t )f (t )dt  f (0) unde f(x) este o funcţie reală continuă pe R.

40

0 , t  ε

Dacă δ ε ( t )   1
 ,t ε
 2ε
0 , t  0
rezultă δ(t) = lim δ ε ( t )  
ε 0  ,t0
1  iωt 
iω t
Avem şi relaţia: δ( t )  e dω e dω  2 πδ( t )
2 π 
de unde

Procesul aleator staţionar X(t) se numeşte zgomot alb dacă are densitatea spectrală
constantă: Sx(ω) = S.
Conform formulei (5) avem funcţia de covariaţie:

R x ( τ)  s  e iωt dω  2 πsδ( t )

De aici rezultă că pentru zgomotul alb avem Rx(τ) = 0 pentru τ  0 deci în acest caz
variabilele aleatoare X(t), X(t + τ) sunt necorelate pentru orice τ  0.
În încheierea acestei secţiuni prezentăm o clasă importantă de procese aleatoare
staţionare.
Procesul aleator staţionar X(t) este ergodic dacă caracteristicile sale, găsite prin media
mulţimii realizărilor coincid cu caracteristicile sale găsite prin media în raport cu t a uneia din
realizările sale x(t), unde t  [0, T] cu T suficient de mare.
În acest caz avem:
1t
μ x  lim  X( t )dt
T  T 0

1 Tτ
C x ( τ)  lim  X( t ) X( t  τ)dt  μ 2 x
T  T  τ 0
Exemplu
Procesul aleator X(t) = A sin (ωt +φ) unde φ este fază aleatoare, este ergodic.

2.4 Rezumat

În acest capitol se prezintă noţiunea de variabilă aleatoare pentru care se descrie funcţia de
repartiţie şi densitatea de probabilitate, media , varianţa şi funcţia caracteristică .
Deasemenea se prezintă noţiunea de vector aleator pentru care se descrie covarianţa şi
coeficientul de corelaţie liniară. În încheiere se prezintă noţionea de proces aleator cu
accent pe lanţul Markov finit .

2.5 Întrebări
1.Enumeraţi proprietăţile funcţiei de repartiţie şi densităţii de probabilitate a unei variabile
aleatoare .
2. Enumeraţi proprietăţile mediei şi varianşei unei variabile aleatoare .
3. Enumeraţi proprietăţile covarianţei şi coeficientului de corelaţie liniară pentru
pentru un vector aleator .
4. Descrieţi un lanţ Markov finit .
41

2.6 Bibliografie

1.D.Ene , M.Drăghici, I.N. Alecu “ Statistică aplicată în agricultură “ Ed.Ceres,2003


2.M.Iosifescu şi col. “ Mică enciclopedie de statistică “ Ed.Ştiinţif.şi Enciclop,,1985
3. Anuarul statistic al României , 1990 -2003
42

CAPITOLUL 3

VARIABILE ALEATOARE CLASICE ŞI LEGI-LIMITĂ

Obiective : Însuşirea de către studenţi a principalelor variabile aleatoare clasice


discontinue şi continue precun şi a legilor-limită .

Conţinut :

3.1 Variabile aleatoare discontinue


3.2 Variabile aleatoare continue
3.3 Legi-limită
3.4 Rezumat
3.5 Întrebări
3.6 Bibliografie

Cuvinte-cheie : variabila binomială , Poisson , exponenţială,normală , hi


patrat,Student,Fisher,
vectorul aleator normal .

3.1. Variabile aleatoare discontinue

3.1.1. Variabila binomială

Variabila aleatoare binominală este variabilă aleatoare cu un număr finit de valori


având ca model schema bilei revenite. Această schemă este un caz particular al unei scheme
mai generale, numită schema lui Poisson care constă în următoarele:
Se dau n urne: U1 cu a1 bile albe şi b1bile negre, Un cu an bile albe şi bn bile negre. Se
extrag n bile, câte una din fiecare urnă (extrageri independente). Probabilitatea de a extrage o
bilă albă din urna Uj este : pj =(aj / (aj +bj ) iar probabilitatea de a extrage o bilă neagră din
urna Uj este qj = 1- pj (1j n).

Teorema 3.1.
Probabilitatea ca din n bile să obţinem k bile albe (k=0,1,….,n) şi restul negre, este
coeficientul lui tk în produsul (p 1t+q1)….(pnt +qn) este :
Pn ,k   pi1 ...pik qik 1 ....qin
Demonstraţie
Fie Aj evenimentul extrageii unei bile albe din urna Uj şi Äj evenimentul extragerii
unei bile negre din urna Uj (1jn).
Obţinerea a k bile albe şi n-k bile negre când se extrage câte o bilă din fiecare din cele
n urne, constă în realizarea unui eveniment de forma:
An,k = Ai1…..Aik A ik+1….. A in
unde i1,….., in este o permutare a indicilor 1,…n. Cum evenimentele Aj, A j sunt
independente câte două, avem:
P(An,k)=pi1….pikqik+1….qin
Evenimentele An,k fiind incompatibile câte două, probabilitatea Pn,k a obţinerii a k bile
albe şi n-k bile negre în schema Poisson, va fi:
Pn,k = pi1….pikqik+1…..qin
43

pentru toate permutările i1,..in ale indicilor 1,….,n adică chiar coeficientul lui tk în produsul
(p1t+q1)….(pnt+q n) Q.E.D.
Schema lui Poisson se aplică când se urmăreşte ca în experimente independente să
apară de k ori un eveniment A, dacă se cunosc probabilităţile diferite de realizare a sa în cele
n experimente.
Schema bilei revenite se obţine ca un caz particular din schema lui Poisson când
urnele U1,…,Un au un conţinut identic în bile albe şi negre:
a1=…..=an= a şi b1=….bn=b
În aces caz extragerea simultană a câte unei bile din cele n urne identice U cu a bile
albe şi b bile negre este echivalentă cu extragerea succesivă a n bile dintr-o singură urnă U cu
a bile albe şi b bile negre, punând bila înapoi în urnă după fiecare extragere, pentru ca urna
U să fie identică la fiecare din cele n extrageri succesive.
Avem p1=…..=p n=p şi q 1=….q n=q=1- p, deci Pn,k este coeficientul lui tk în produsul
(pt+q)…(pt+q)=(pt+q)n adică:

Pn,k = Cnkp kqn-k ; (k=0,1,…,n)

Schema bilei revenite se aplică când se urmăreşte ca în n repetări independente ale


unui experiment, să apară de k ori un eveniment A, dacă se cunoaşte probabilitatea sa de
realizare în acel experiment.
Aruncările repetate de monezi şi zaruri se supun schemei bilei revenite, dând naştere
la evenimente independente.
Formula combinărilor este:
n(n  1)...(n  k  1) n!
Cnk  (kn )    Cnn k
1.2...k k !(n  k )!
Funcţii EXCEL pentru aranjamente,permutări şi combinări :
a) Aranjamente de n obiecte luate cîte k :
Ank=n(n-1)…(n-k+1)= n! / (n-k)!
Funcţia EXCEL : = PERMUT(n,k)
b) Permutări de k obiecte:
Pk = 1.2….k = k!
Funcţia EXCEL : = FACT(k)
c) Combinări de n obiecte luate cîte k :
Cnk = ( nk ) = Ank / Pk = n!/ k!(n-k)!
Funcţia EXCEL : = COMBIN(n,k)

Dacă n şi k au valori mari, factorialele se calculează aproximativ cu formula Stirling:


n
n !  2 n .( )n
e
În concluzie variabila binomială B(n,p) are densitatea de probabilitate:
f(k)= Cnkpkq n-k ; (k=0,1,…,n) (1)

Calculul lui f(k) se face mai comod prin formulele recurente:


f(0) = q n (k=0)
n  k 1 p
f (k )  f (k  1). . (k  1,2,..., n)
k q

Funcţia de repartiţie binomială este :


44

k
F (k )   Cnh p h q n  h
h 0
Funcţie EXCEL : = BINOMDIST(k,n,p,L)
Pentru L = FALSE avem densitatea de repartiţie binomială f(k) iar pentru
L = TRUE avem funcţia de repartiţie binomială F(k) .
Funcţia caracteristică este  (t )  ( peit  q) n
 ' (0)
Din teorema 2.5 rezultă M ( X )   np şi
i
 "(0)
M (X 2 )  2
 n 2 p 2  npq aşa că V(X) = M(X2)-M2(X) =npq.
i
Modul Mo(X) satisface relaţia np-q≤Mo(X) ≤np+q.

Teorema 3.2
Dacă X,Y sunt variabile binomiale independente de tip B(n1,p) şi respectiv B(n2,p),
atunci X + Y este variabilă binomială de tip B(n1+n2,p).
Demonstraţie
Conform teoremei 2.5 , X+Y are funcţia caracteristică
(peit+q)n1.(peit+q)n2 =(peit +q)n1+n2 deci X+Y este variabilă binomială B(n1+n2,p) Q.E.D.
Valorile f(k) din formula (1) se obţin prin calcul direct pentru n<30 iar pentru n≥30
variabila binomială se poate aproxima cu cea normală (Teorema 3.14 (Moivre-Laplace) de
mai jos).
Observăm că f(k) din formula (1) este termenul general al dezvoltării binomului
1=(q+p)n, de unde şi denumirea de variabilă binomială.
Dacă urna U are a1 bile de culoarea 1,…,am bile de culoarea m şi extragem succesiv n
bile cu bila revenită, dorim să apară k1 bile de culoarea 1,…,km bile de culoarea m, deci
avem variabila aleatoare polinomială cu densitatea de probabilitate:
n!
f (k1 ,...km )  p1k1 ... pm km
k1 !...km !
(k1,…,km=0,1,….n; k1+…+km=n)
Pentru m=2 reobţinem variabila aleatoare binominală.
Exemple:
1) Se aruncă o monedă de n=5 ori. Care este probabilitatea să apară stema de k=2 ori ?
Soluţie
Aruncările succesive ale monedei sunt independente deci se supun legii binomiale.
1 1
Acum p  , q  1  p  , n  5, k  2 deci conform relaţiei (1) avem:
2 2
1 1 5.4 1 5
f (2)  C52 ( ) 2 ( )3  . 5   31.2%
2 2 1.2 2 16
Funcţii EXCEL : = BINOMDIST(2,5,0.5,FALSE) = 31.2%
= BINOMDIST(2,5,0.5,TRUE) =50%
5
Numărul mediu de bile albe va fi: M(X)=np=  2.5 bile albe şi abaterea standard a
2
1 1 5
numărului de bile albe va fi  ( x)  npq  5.    1.1 bile albe.
2 2 2
2) Se aruncă un zar de n=4 ori. Care este probabilitatea să apară faţa nr. 6 de k=2 ori?
45

Soluţie
Aruncările succesive ale zarului sunt independente deci se supun legii binomiale.
1 5
Avem p  , q 1 p  , n  4, k  2 deci conform relaţiei (1) avem:
6 6
1 5 4.3 52 52 25
f (2)  C42 ( ) 2 ( ) 2  . 4  3   11.6%
6 6 1.2 6 6 216
Funcţii EXCEL : = BINOMDIST(2,4,1/6,FALSE) = 11.6%
= BINOMDIST(2,4,1/6,TRUE) =98.4%
4
Numărul mediu de feţe nr. 6 apărute va fi M ( x )  np   0.7 bile iar abaterea
6
20 5
standard a numărului de feţe nr.6 apărute va fi  ( x )  npq = =  0.7 bile
36 3
3) Se dă o urnă U cu a=6 bile albe şi b = 14 bile negre. Se extrag succesiv n=4 bile cu
bila revenită. Care este probabilitatea să obţinem k=2 bile albe ?
Soluţie
6 14
Avem p  , q  1  p  , n  4, k  2 deci conform formulei (1) avem:
20 20
6 14 4.3 32.7 2
f (2)  C 4 2 ( ) 2 ( ) 2  .  26.5%
20 20 1.2 104
Funcţii EXCEL : = BINOMDIST(2,4,0.3,FALSE) = 26.5%
= BINOMDIST(2,4,0.3,TRUE) =91.6%

3.1.2. Variabila hipergeometrică

Variabila aleatoare hipergeometrică este variabila aleatoare cu un număr finit de valori


având ca model schema bilei nerevenite.
Fie o urnă U cu a bile albe şi b bile negre din care se extrag succesiv n bile fără
revenirea în urnă a bilei după fiecare extragere (extrageri dependente). Cele n bile pot fi
extrase şi simultan.
Schema bilei nerevenite se aplică la controlul calităţii produselor, deoarece cu
convenţia bilă albă=obiect bun şi bilă neagră=rebut, rebuturile nu se mai întorc în urnă după
extragere.

Teorema 3.3.
Probabilitatea ca din n bile extrase să apară k bile albe (k=0,1,…,n) în cadrul schemei
bilei nerevenite este:
Cak .Cbnk
Pn ,k 
Canb
Demonstraţie:
Din a bile albe se pot forma Cak grupe distincte de câte k bile albe în fiecare grupă iar
din b bile negre se pot forma Cbn-k grupe distincte cu n-k bile negre în fiecare grupă.
Extragerea culorilor albă şi neagră fiind independente, numărul cazurilor favorabile în
schema bilei nerevenite este Cka.Cbn-k. Din a+b bile se pot forma Ca+bn grupe distincte cu n bile
46

în fiecare grupă, deci numărul cazurilor egal posibile în schema bilei nerevenite este Ca+bn.
Cak .Cbn  k
Conform definiţiei clasice a probabilităţii avem: Pn ,k  Q.E.D.
Canb
În concluzie, densitatea de probabilitate a variabilei hipergeometrice H(a,b,n) este:
Cak .Cbn  k
f (k ) 
Can b
Un calcul comod pentru f(k) se face cu formulele de recurenţă:
Can a (a  1)....( a  n  1)
f (0)  n  ; (k  0)
Ca b (a  b)(a  b  1)....(a  b  n  1)

(a  k  1)(n  k  1)
f (k )  f (k  1). ; (k  1,2,......n)
(b  n  k ).k
Funcţia de repartiţie hipergeometrică este :
k
Cah .Cbn h
F (k )  
h0 Canb

Funcţie EXCEL : = HYPGEOMDIST(k,n,a,a+b)


n 1
Avem M(X)=np; V(X)=npq (1  )
a  b 1
Dacă a+b∞, variabilele binomială şi hipergeometrică au aproximativ aceeaşi
repartiţie.
Dacă urna U are a1 bile de culoarea 1,…, am bile de culoarea m, extragem succesiv cu
bila nerevenită n bile (extragerile pot fi şi simultane).
Dorim să apară k1 bile de culoarea 1,…, km bile de culoarea m, deci avem variabila
hipergeometrică cu m stări cu densitatea de probabilitate:
Cak11 ...Cakmm
f (k1 ,...., km )  n
Ca1 b1 .... am bm
(k1 ,...., km  0,1,...., n; k1  ....  km  n)
Exemplu. Într-un incubator sunt 1000 ouă din care 5 % neeclozionate. Se extrag
simultan n=100 ouă. Care este probabilitatea ca să găsim k=90 ouă eclozionate ?
Soluţie:
Avem schema bilei revenite cu a=950 ouă eclozionate şi b=50 ouă neeclozionate.
90 10
C950 .C50
Avem P100,90=
100
C1000
Funcţie EXCEL : = HYPGEOMDIST (90,100,950,1000) =1.4%
M(X)=np=100x0.95= 95 ouă eclozionate.
n 1
V(X)=npq( (1  )  100  0.95  0.05 (1-
a  b 1
100  1
 )  4.3 deci  ( x)  4.3  2.1 ouă eclozionate.
1000  1
47

3.1.3. Variabila Pascal

În schema bilei revenite, numărul de extrageri cu bila revenită este constant şi egal cu
n iar numărul de bile albe extrase k este variabil (k=0,1,…,n) ceea ce dă naştere variabilei
binomiale.
Dacă în schema bilei revenite, numărul de extrageri cu bila revenită este variabil şi
egal cu k iar numărul de bile albe extrase s este constant (k=s, s+1, s+2,…) se obţine variabila
Pascal sau variabila binomială negativă.
Densitatea de probabilitate a variabilei Pascal este
f(k)= Cks11 p s q k  s ; (k  s, s  1, s  2,..)
Funcţia de repartiţie Pascal este :
k
F (k )   Chs11 p s q h s
h s

Aici p este probabilitatea de a extrage o bilă albă şi q=1-p este probabilitatea de a


extrage o bilă neagră. Notaţie PA(s,p).
Densitatea f(k) se poate calcula mai comod cu formulele recurente:
f(s)=ps ; (k=s)
f(k)=f(k-1).(k-1)q ; (k=s+1,s+2, s+3,…)

Funcţie EXCEL : = NEGBINOMDIST(k,s,p)


Spre deosebire de variabila binomială, care are un număr finit de valori k=0,1,…,n,
variabila Pascal are un şir infinit de valori k=s,s+1,s+2,….
Pentru k=s+r avem:
f (r )  Cssr11 p s q r  Csr r 1 p s q r ; (r  0,1, 2...)

s este numărul de bile albe (succese) şi r=k-s este numărul de bile negre (eşecuri) din k
extrageri independente cu bila revenită.
f ( r )  Csr r 1 p s q r este termenul general al dezvoltării în serie pentru ps(1-q)-s=1,
r r r
deoarece ( 1) C  s  C s  r 1 . Din această cauză, variabila Pascal se cheamă variabilă
binomială negativă.
it s it  s
Funcţia caracteristică a variabilei Pascal este  (t )  ( pe ) .(1  qe )
De aici rezultă conform teoremei 2.5. că
 '(0) q  "(0) sq ( sq  1) sq
M (X )   s ; M(X 2 )  2  2
, aşa că V ( X )  M ( X 2 )  M 2 ( X )  2 .
i p i p p
s 1 sq
Avem şi  Mo( X ) 
p p

Teorema 3.4.
Dacă X,Y sunt variabile Pascal de tip PA (s1,p) şi respectiv PA(s2,p) atunci X+Y este
variabilă Pascal de tip PA (s1+s2,p).
Demonstraţie
X+Y are conform teoremei 2.5. funcţia caracteristică
 (t )  1 (t ) 2 (t )  ( peit ) s1 .(1  qeit )  s1 .( peit ) s2 .(1  qeit )  s2  ( peit ) s1  s2 .(1  qeit )  s1  s2
deci X + Y este variabilă Pascal de tip PA(s1+s2,p) Q.E.D.
48

În particular, pentru s=1 obţinem variabila aleatoare geometrică PA(1,p) unde


f(k)=pq k-1este probabilitatea unei bile albe din k extrageri succesive cu bila revenită
(k=1,2,3,…).
Avem  (t )  peit (1  qeit )1 ; M ( X )  q / p;V ( X )  q / p 2
Exemplu:
Fie evenimentul că apar s=10 steme după k=100 aruncări ale unei monede. Care este
probabilitatea acestui eveniment ?
Soluţie
Avem: S=10; k=100; p=1/2; q=1-p=1/2 deci
9 1 10 1 1
f (100)  C99 .( ) .( ) 90  C99
9
. 100 =0 %
2 2 2
Funcţie EXCEL : = NEGBINOMDIST (10,100,0.5)=0%
Media numărului de aruncări k pentru a apare s=10 steme este
1/ 2 1/ 2
M ( X )  10  10 aruncări iar V ( X )  10  20 deci  (x)  20  4.5 aruncări.
1/ 2 1/ 2

3.1.4. Variabila Poisson

Variabila aleatoare Poisson este variabilă cu un şir infinit de valori cu densitatea de


probabilitate:
 k 
f ( x)  e ; ( k  0,1, 2,...)
k!
Notaţie: PO()
f(k) se calculează recurent astfel:
f(0)=e ; (k=0)

f(k)  f (k  1). ; (k=1,2,3,…)
k
Funcţia de repartiţie Poisson este :
k
 h 
F (k )   e
h 0 h !
Funcţie EXCEL : = POISSON(k,λ,L)
Pentru L = FALSE avem densitatea de repartiţie Poisson f(k) iar pentru
L=TRUE avem funcţia de repartiţie F(k) .
it
Funcţia caracteristică este  (t )  e ( e 1) de unde conform teoremei 2.5. rezultă:
 '(0)  " (0)
M (X )    ; M(X 2 )  2   2  
i i
2 2
deci V(X)  M(X )-M (X)  

Teorema 3.5.
Dacă X,Y sunt variabile Poisson de tip PO ( ) respectiv PO(atunci X+Y este
variabilă Poisson de tip PO
49

Demonstraţie
Conform teoremei 2.5. X+Y are funcţia caracteristică
it it it
 (t )  1 (t ) 2 (t )  e1 ( e 1) .e2 ( e 1)  e( 1 2 )( e 1) deci X+Y este variabilă Poisson de tip
PO( Q.E.D.

Teorema 3.6.
Variabila Poisson se obţine din variabila binomială dacă n∞,p0 şi np =
Demonstraţie
Avem :
(np ) k 1 k  1 (1  p ) n  k 
Cnk p k q n  k  (1  )....(1  ). care tinde catre e
k! n n (1  p )k k!
1 k 1
deoarece (1- )...(1  )  1, (1  p ) k  1 şi (1-p)n  [(1  p )1/ p ] np  e  .
n n
Rezultă că modelul aproximativ al variabilei Poisson este schema bilei revenite
aplicată unei urne foarte bogate iar cu foarte puţine bile albe şi din care se extrag succesiv cu
bila revenită un număr de n foarte mare de bile. Din acest motiv variabila Poisson se mai
numeşte variabila evenimentelor rare.
Repartiţia Poisson se găseşte des în agricultură: numărul gemenilor, numărul
animalelor cu tare genetice şi numărul celulelor iradiate cu particule  sunt evenimente
rare.
Exemplu
Numărul mediu de miei la 100 oi este de 120 miei, Care este probabilitatea ca o oaie
să fete 2 miei ?
Soluţie
1.2 2 1.2
Avem  =1.2 şi k=2 deci f (2)  e  21.7 %.
2!
Funcţii EXCEL : = POISSON(2,1.2,FALSE)=21.7%
= POISSON(2,1.2,TRUE) = 87.9%

3.2. Variabile aleatoare clasice continue

3.2.1. Variabila uniformă

Variabila aleatoare uniformă  are densitatea de probabilitate :


f(x) =1, x [0;1]
f(x) =0, în rest
e it  1
Funcţia caracteristică este  (t )  şi conform teoremei 2.5. avem:
it
 ' (0) 1  '' (0) 1 1
M(X)=  ; M ( X 2 )  2  deci V(X)  M(X 2 )-M 2 (X) 
i 2 i 3 12
Valorile x 0,1 ale lui γ se numesc numere aleatoare şi se tabelează sau se
generează cu calculatorul (funcţia RND).
Cu ajutorul variabilei uniforme γ , se pot genera valorile oricărei variabile aleatoare
prin metoda Monte Carlo (Secţiunea 4.1. de mai jos).
50

3.2.2. Variabilele putere şi PARETO


A) Variabila aleatoare putere are densitatea de probabilitate
  1
f ( x)  x pentru x  [0, a]
a
x 
Funcţia de repartiţie este F ( x )  ( ) cu x  [0; a]
a
 
Avem M ( X )  .a;V ( X )  .a
 1 (  1)2 .(  2)
Variabila putere este un caz particular al variabilei Gama generalizate din această
secţiune, punctul 3.2.6.
B) Variabila aleatoare Pareto are densitatea de probabilitate
 a  1
f ( x)  ( ) unde x  [a,]
a x
Funcţia de repartiţie va fi :
a a a2
F ( x )  1  ( ) unde x  [a,  ]. Avem M(X)  ; V(X) 
x  -1 ( -1)( -2)

3.2.3. Variabilele exponenţială, Weibull, Erlang

A) Variabila exponenţială E(λ) are densitatea de probabilitate:


f(x) = λ e - λ x ; (x≥0)
Funcţia de repartiţie este F(x) = 1-e - λ x
Funcţie EXCEL : = EXPONDIST(x,λ,L)
Pentru L=FALSE avem densitatea de probabilitate exponenţială f(x)
iar pentru L=TRUE avem funcţia de repartiţie F(x) .
it 1
Funcţia caracteristică este φ(t)= (1  ) , deci conform teoremei 2.5. avem

 ' (0) 1  '' (0) 2 1
M (X )   şi M(X2)= 2  2 deci V(X)  M(X 2 )-M 2 (X)  2
i  i  
Variabila exponenţială îşi găseşte aplicaţii în fiabilitatea maşinilor agricole (Secţiunea
4.2. de mai jos).
Variabila exponenţială admite următoarele generalizări:
B)
Dacă X este variabilă exponenţială E(λ) atunci Y=Xα este variabilă Weibull cu
densitatea de probabilitate :

f ( x)   x 1 e  x , ( x  0)

F ( x)  1  e  x .
este funcţia de repartiţie .
Funcţie EXCEL : = WEIBULL(x,α, 1/(λ1/α ), L)
Pentru L=FALSE avem densitatea de probabilitate WEIBULL f(x)
iar pentru L=TRUE avem funcţia de repartiţie WEIBULL F(x) .
Avem:
 1
( )
M (X )   ;V ( X )  1 (   2 )  ( (  1)) 2 
 1/  1/     
51

Avem funcţia Gama :



 ( x)   t x 1et dt
0

cu proprietăţile :
1) Γ(1)=1; Γ(1/2)= ;
2) Γ(n+1) = n!;
3) Γ(x+1) = x Γ(x)

C) Dacă X1,….Xn sunt variabile aleatoare exponenţiale, independente câte două şi


toate de parametru λ, atunci X=X1+…+Xn este variabilă Erlang cu densitatea de
probabilitate :
n
f ( x)  x n 1e   x ;( x  0)
(n  1)!

n 1 (x ) j
  .x
Funcţia de repartiţie este F ( x )  1  e .
j 0 j!

Funcţia caracteristică este:


it  ' (0) n
 (t )  (1  )  n deci conform teoremei 2.5. avem M(X)  
 i 
'' 2
 (0) n  n n
M(X2)= 2  deci V(X)=M(X2) – M2(X)=
2
2
i 
Variabila exponenţială şi generalizările ei Weibull şi Erlang, sunt cazuri particulare ale
variabilei Gama generalizate din această secţiune, punctul 3.2.6

3.2.4 Variabila normală

( x   )2
1 
2 2
Variabila normală are densitatea de probabilitate: f ( x)  e ,x R
2

care are graficul :


52

 2t 2
it 
Funcţia caracteristică este  (t )  e 2
deci conform teoremei 2.5. avem:
 '(0)  '' (0)
M (X )    ; M ( X 2 )  2   2   2 deci V(X)  M ( X 2 )  M 2 ( X )   2
i i
Variabila normală X are notaţia X=N(μ, σ).
Din graficul densităţii de probabilitate f(x) a variabilei normale se confirmă cele 2 legi
ale erorilor accidentale, găsite de Gauss:
1) Legea simetriei: Numărul valorilor care se abat sub media μ este egal cu numărul
valorilor care se abat peste media μ;
2) Legea concentrării: Abaterile mici de la media μ sunt numeroase iar abaterile
mari de la media μ sunt rare.
Dacă pe verticala lui μ lăsăm să cadă boabe de cereale, boabe de nisip sau pietricele ,
acestea se ciocnesc şi se rostogolesc formând o grămadă care are în secţiune verticală profilul
de curbă normală de mai sus.

Teorema 3.7
Dacă X1, X2 sunt variabile aleatoare normale de tip N(μ1,1) şi respectiv N(μ2,2),
independente între ele, atunci variabila aleatoare a1X1+a2X2 este o variabilă aleatoare normală
de tip N(a11+a2 μ2 ; (a1212+a2222)1/2).

Demonstraţie
Variabila aleatoare a1X1+a2X2 are conform teoremei 2.5. funcţia caracteristică:
a12 12 t 2 a22 22 t 2 ( a12  12  a 22  22 ) t 2
ia1 1t  ia2 2 t  i ( a1 1  a2  2 ) t 
2 2 2
1(a1t1)2(a2t2)= e .e =e

deci a1X1+a2X2 este variabilă aleatoare normală de tip N(a1μ1+a2μ2; a12 12  a22 22 ) Q.E.D.

Pentru μ=0, =1 obţinem variabila aleatoare normală redusă U=N(0,1) cu densitatea
1 u2 / 2
de probabilitate f(u)= e şi cu graficul:
2
53

Legătura între variabila normală X=N(μ, ) şi variabila normală redusă U=N(0,1) este
x
dată de relaţia U  respectiv X = μ+U.

Funcţia de repartiţie a variabilei normale reduse U=N(0,1) este
t2
1 u 
F (u )  2
2
  e dt

Valorile lui F(u) pentru u ≥0 se găsesc în tabela 1 din Anexă iar pentru u <0 avem:
F(u)=1-F(-u).
Graficul lui F(u) are forma:

Avem F(u /2) = P(u<u/2 )=1-/2 si P(u<u/2)=1-.

Funcţia EXCEL : = NORMDIST(u) dă funcţia de repartiţie normală redusă F(u) .


u2 5
1 
Pentru F(u) avem şi formula aproximativă F (u )  1  e 2
. aiW i ; (u≥0) unde
2 i 1

1
W cu p=0.2316419 respectiv a1=0.3193815;a2=-0.3565638; a3=1.781478; a4=-
1  pu
1.821256; a5=1.330274
Teorema 3.8
Dacă X este variabilă N(μ,) avem:
b a
P ( a  X  b)  F ( )  F( )
 
Demonstraţie:
X 
Relaţia rezultă din teorema 1.3 punctul 4 cu substituţia U  .

 
În particular pentru a = μ-ε, b= μ+ ε şi ţinând cont că F (  )  1  F ( ) relaţia din
 
enunţ capătă forma:

P( X     )  2 F ( )  1 Q.E.D.

Exemplu
54

Greutatea la livrare a porcilor Landrace de 8 luni este variabila normală N(100 kg; 5 kg). Se
cere probabilitatea ca greutatea porcilor de 8 luni să fie cuprinsă între 98 kg şi 106 kg ?
Soluţie:
106  100 98  100
F( )  F( )  F (1.2)  F (0.4)  F (1.2)  1  F (0.4) 
P(98≤X≤106)= 5 5
 0.8849  0.6554  1  54%.
Funcţii EXCEL : = NORMDIST(1.2) =0.8849 şi = NORMDIST(-0.4)=
=0.3446

3.2.5. Variabilele Hi Patrat, Student, Fisher

A) Variabila Hi Patrat (2)

Dacă X1,….,Xn sunt variabile aleatoare N(0,1) independente câte două, atunci
2 2 2
variabila X definită de relaţia: X  X 1  ....  X n se numeşte variabilă hi pătrat (X2) cu
n grade de libertate.
Ea are densitatea de probabilitate:
1
f ( x)  n x n / 2 1 e x / 2 ;( x  0)
n
2 2 ( )
2
n

Funcţia caracteristică este φ(t)=(1-2it) 2
deci conform teoremei 2.5. avem
 '(0)  "(0)
M(X)=  n; M ( X 2 )  2  n 2  2n aşa că :
i i
2 2
V(X)=M(X )-M (X)=2n

Teorema 3.9
Dacă X1, X2 sunt variabile hi patrat cu n1 grade de libertate respectiv n2 grade de
libertate, atunci X1+X2 este variabilă hi patrat cu n1+n2 grade de libertate.
Demonstraţie
Conform teoremei 2.5. variabila aleatoare X1+X2 are funcţia caracteristică
n1 n2 n1  n2
  
 (t )  (1  2it ) 2 .(1  2it ) 2  (1  2it ) 2 deci este variabilă hi patrat cu n1+n2 grade de
libertate. Q.E.D.
Variabila hi pătrat cu n grade de libertate este un caz particular al variabilei Gama
generalizate din această secţiune, punctul 3.2.6
Dacă X este variabilă hi pătrat cu n grade de libertate (n≥30) atunci variabila
2 (U  2n  1) 2
2 X  2 n  1  U unde U = N (0,1) de unde rezultă că variabila X 
2
este aproximativ variabilă hi pătrat cu n grade de libertate pentru n≥30.
2 2 2
Valorile lui  date de relaţia P(    )   se obţin din tabela 3 din Anexă.
Funcţia EXCEL : = CHIINV(P,GL) dă valoarea χα2 pentru care
2
P(   2 )  

B) Variabila Student (t)


55

Dacă X1 este variabilă N (0,1) şi X2 este variabilă hi pătrat cu n grade de libertate, X1 ,


X1
X2 fiind independente între ele, atunci Y  se numeşte variabilă Student (t) cu n
X2
n
grade de libertate.
Ea are densitatea de probabilitate :
n 1
( ) n 1
2 x2 
f ( x)  (1  ) 2
n n
 n ( )
2
n
Avem M(X) = 0; V(X) =
n2

Valorile lui t/2 şi t date de relaţiile P(t>t/2) = P(t>t)=, se obţin din tabela 2 din
Anexă . Pentru n ≥30 variabila Student este bine aproximată de variabila normală N(0,1).

Funcţia EXCEL : = TINV(P,GL) dă valorile t/2 pentru care P(t>t/2)=α

C) Variabila Fisher (F)

Dacă X1, X2 sunt variabile hi pătrat cu n1 respectiv n2 grade de libertate, independente


X1 X 2
între ele, atunci Y= : se numeşte variabilă Fisher (F) cu (n1,n2) grade de libertate.
n1 n2
1
Evident este tot variabilă Fisher cu (n2,n1) grade de libertate.
Y
Densitatea de probabilitate este:
n + n2
n ( 1 ) n1 1 n n
n1 21 2 2
n1  1 2 2
F(X) = ( ( ) . x .(1  x) ; (x≥0)
n2 n n n2
( 1 ) ( 2 )
2 2
n2 2n 22 (n1  n 2 -2)
Avem M(X) = ; V(X) 
n2  2 n1 (n2  2) 2 ( n2  4)

Variabilele normală redusă, hi pătrat, Student sunt cazuri particulare ale variabilei
Fisher X cu (n1,n2) grade de libertate astfel:
- Variabila U este X cu n1  1; n2  
- Variabila hi pătrat este X cu n1  n;n2  
- Variabila Student este X1/2 cu n1=1;n2=n.

Valorile critice F≥1 date de relaţia P(F>F)= pentru =5%, 1 %;


0.1 % se obţin din tabelele 4-6 din Anexă .
Funcţia EXCEL : = FINV(P,GL1,GL2) dă valorile Fα pentru care
P(F>F)=
Valorile critice din tabelele 1-6 ale Anexei , sunt legate prin relaţiile:
56

U / 2  F ;1, ; 2 ,n  n.F ;n, ;


t / 2;n  F ;1,n

Pe grafic aceste valori au forma:

3.2.6. Variabila Gama generalizată

Variabila Gama generalizată are densitatea de probabilitate:




 
f ( x)  x 1e   x , x0

( )

f(x)=0 , în rest

 1
( )
1 
Avem M(X) = .
1 /  (  )

 2  1 2
(
) ( ( ))
1  
V(X)= 2 /  [  ]
   2
( ) (( ))
 
Pentru =n avem funcţia de repartiţie:

( x  ) j

n 1
F ( x)  1  e x .
j 0 j!
Cazuri particulare
57

Caz 1) Pentru =1 obţinem variabila Gama cu densitatea de probabilitate:

  /   1   x
f ( x)  x e ,x  0

( )

f ( x)  0, x  0
 
M ( X )  ;V ( X )  2
 

Subcazuri
1a) Pentru 1 obţinem variabila exponenţială cu
1 1 it
f ( x)   e   x ( x  0) şi M(x)  , V(x)  2 ;  (t )  (1  )1 ; F(x)  1-e-  x
  
1b) Pentru n1 obţinem variabila Erlang cu
n n n it
f ( x)  x n 1e  x (x  0) si M(X)  ;V ( X )  2 ;  (t)  (1- )  n
(n  1)!   
n 1 j
( x)
F ( x )  1  e  x .
j 0 j!

n 1
1c) Pentru   ,   ,   1 obţinem variabila hi pătrat cu n grade de
2 2
n x -n
1 1 
libertate cu f ( x)  .x 2
.e , ( x  0) şi M(X)  n; V(X)  2n;  (t)  (1-2it)
2 2
n/2 n
2 . ( )
2

Caz 2) pentru =2 obţinem variabila Rayleigh generalizată


  1
2 ( )
2 2 1 2
cu f ( x)  x 1e   x ; (x  0) şi M(X)  1 .
 
( )  2 ( )
2 2

  2)  1 2
( ) ( ( ))
1 2 2
V (X )  [  ]
  
( ) (( )) 2
2 2

Subcazuri
2a) Pentru obţinem variabila Rayleigh cu
2 1  1 
f ( x)  2 xe  x ,(x  0) şi M(X)  1/2 . ; V(X)  (1  )
 2  4
58

2b) Pentru =2, obţinem variabila Maxwell


3/ 2
4 2 2 1 3 4
cu f ( x)  x 2 e   x ,(x  0) şi M(X)  ;V ( X )  (  )
   2 

Caz 3) Pentru  obţinem variabila Weibull cu


 1
( )
 1   x
 1  2  1 2
f ( x)   x e ,(x  0) şi M(X) = 1/
; V(X)  1/ [( )  ( ( )) ]
   

Caz 4) Pentru ∞ obţinem variabila putere cu f ( x)   x 1 , x   0, a 
a
x  
F ( x)  ( ) şi M(X)  a ; V(X)  .a
a  1 (  1) 2 .(  2)

(vezi punctul 3.2.2. A din această secţiune)

Funcţia EXCEL : = GAMMA(x,α,1/λ,L) dă variabila aleatoare GAMA din


Cazul 1) . Pentru L=FALSE avem densitatea de probabilitate GAMA f(x) iar pentru
L=TRUE avem funcţia de repartiţie GAMA F(x) .

3.2.7 VECTORUL ALEATOR NORMAL

Vectorul aleator normal Z = (X,Y) are densitatea de probabilitate:


1 ( x  1 ) 2 ( y   2 ) 2 x  1 y   2
 [  2  . ]
1 2(1  )2
 12  22 1 2
f ( x, y )  e
2 1 2 1   2

Funcţia caracteristică este:


1
i ( 1t1  2t2 ) ( 12t12  22t 22  2  1 2t1t2 )
 (t1 , t2 )  e 2

Aici X = N ( 1 ,  1 ), Y  N ( 2 ,  2 ) şi    (X,Y)
Avem vectorul medie M(Z) = ( 1 ; 2 ) şi matricea de covarianţă
  12  1 2 
C(Z) =  2 
  2 1  2 
Graficul lui z= f(x,y) este o suprafaţă în spaţiu în formă de clopot cu deschiderea în
1
jos, cu vârful clopotului în punctul: M ( 1 ;  2 ; )
2 1 2 1   2

Dacă 1  2  0 şi  1   2  1 obţinem vectorul aleator normal redus W = (U,V)


cu densitatea de probabilitate:
1
 [u 2  v 2  2 uv ]
1 2(1  2 )
f (u, v)  e
2
2 1  
59

1 
Avem M(W) = ( 0; 0); C(W) =  
 1
Dacă Z = (X, Y) cu
X  N ( 1 ,  1 ), Y  N( 2 , 2 ) iar W  (U,V) cu U  V  N (0,1) avem relaţiile de legătură:
X  1 Y- 2
U ; V
1 2
Am văzut în teorema 2.8 punctul 5) că în general variabilele necorelate liniar pot fi
dependente.

Teorema 3.10
Dacă variabilele aleatoare normale X, Y sunt necorelate liniar, ele sunt independente.
Demonstraţie
Dacă variabilele normale sunt necorelate liniar avem   0 deci:
1 x  1 2 y   2 2
1  [(
1
) (
2
) ]
f ( x, y )  e 2 
2 1 2
1 x   1 )2 1 y  2 2
1  (
1 1  (
2
)
 e 2 . e 2  f1 ( x) f 2 ( y )
2 1 1 2 2
deci conform teoremei 2.7. rezultă că X, Y sunt variabile aleatoare independente. Q.E.D.

3.3 LEGI LIMITĂ

3.3.1. Legea numerelor mari a lui Cebâşev

Teorema 3.11

Fie X1,……, Xn variabilele aleatoare independente câte două, cu abaterile standard


X  .....  X n
mărginite de T. Dacă X = 1 atunci pentru orice   0 avem:
n
lim P(│X-M(X) │<)=1
n∞

Demonstraţie
Deoarece X1,…Xn sunt independente câte două, conform teoremei 2.2. avem:
M ( X 1 )  ...  M ( X n )
M(X)=
n
iar conform teoremei 2.3, avem:
V ( X 1 )  ...  V ( X n ) nT 2 T 2
V(X) =  2 
n n n
Aplicând inegalitatea Cebâşev din teorema 2.4, avem:

V (X ) T
P(│X-M(X)│<)≥1- 2
 1  2  P
 n
Dar lim P  1 deci lim P( X-M(X)   )  1
n n 
60

Din expresia lui P rezultă numărul minim de variabile aleatoare care asigură evenimentului
│X-M(x)│<) o probabilitate de realizare superioară lui P şi anume:

T2
n . Q.E.D.
 2 (1  P )

Legea numerelor mari a lui Cebâşev arată că media unui număr mare de variabile
aleatoare independente câte două şi cu abateri – standard mărginite, îşi pierde caracterul de
variabilă aleatoare, stabilindu-se în jurul mediei sale.
În particular, media a n măsurători independente ale unei însuşiri cantitative X se
stabilizează , când volumul măsurătorilor creşte.
Exemplu:
Câte măsurători trebuie făcute pentru ca greutatea ouălelor să fie cuprinsă între 49 g şi
51 g cu o încredere de cel puţin 99 %, dacă toleranţa maximă admisă la greutatea ouălelor este
T=1g ?
Soluţie:
12
Avem T = 1 g, =1g, P =0.99 deci n =  100 măsuratori.
1 0.01

3.3.2 Legea numerelor mari a lui Bernoulli

1 0
Dacă în legea numerelor mari a lui Cebâşev luăm variabilele aleatoare X1=….=Xn = 
p q
X 1  ...  X n
,independente câte două, X= ia valori de forma k/n = f şi M(X) = p; V(X) =
n
pq≤T2 deci relaţia:
V (X )
P(│X-M(X)<)≥ 1  de mai sus devine:
2
pq
P(│f-p │<)≥1-  P
n 2
Cum lim P = 1 rezultă:
n∞
lim P(│f-p │<)=1 deci am demonstrat :
n∞

Teorema 3.12.
Dacă A este un eveniment cu probabilitatea de realizare p iar f = k/n este frecvenţa de
realizare a acestui eveniment de k ori în n experienţe independente, atunci pentru orice  > 0
avem:
lim P(│f-p│<)=1
n∞

Din expresia lui P rezultă numărul minim de experienţe independente care asigură
evenimentului │f-p│< o probabilitate de realizare superioară lui P:
61

p(1  p)
n 2
 (1  P )

Legea numerelor mari a lui Bernoulli arată că frecvenţa f de apariţie a unui eveniment
în n experienţe independente care este în fond media a n valori a unei însuşiri calitative X, se
stabilizează în jurul probabilităţii p de realizare a evenimentului.
Prin urmare, în cazul unui număr mare de experienţe independente, probabilitatea p
(constantă şi cunoscută înaintea experienţelor) începe să fie confirmată de frecvenţa f
(variabilă şi cunoscută după experienţe).
Exemplu:
Care este numărul minim de aruncări ale unei monezi pentru ca frecvenţa de apariţie a
stemei să fie cuprinsă între 45 % şi 55 % cu o încredere de cel puţin 90 % ?

Soluţie:
Avem p = 1/2 = 50 %; =5 % = 0.05, P = 90 % = 0.90
P(1  p) 0.5(1  0.5)
deci n=   1000 aruncări
 2 (1  P ) 0.052.(1  0.90)

3.3.3. Teorema limită centrală

Teorema 3.13. (Leapunov)

Dacă X1,…..,Xn sunt variabile aleatoare independente şi suma lor X=X1+….+Xn


satisface condiţia:
3 3
M ( X1  M ( X 1 ) )  ....  M ( X n  M ( X n ) )
lim 0
n   ( X )3
X  M (X )
atunci funcţia de repartiţie a variabilei aleatoare normate tinde către funcţia de
 ( x)
repartiţie F(x) a variabilei normale reduse N (0,1) când n∞ . (fără demonstraţie)
Cu alte cuvinte, dacă valorile a n variabile aleatoare independente , vor fi mici în
raport cu suma lor, atunci această sumă are o repartiţie normală când n∞.
1 0
Dacă în teorema 3.13. luăm variabilele aleatoare independente X1=….=Xn = 
p q
deci X = X1+….+Xn este variabilă binomială, condiţia din enunţul teoremei 3.13 este
îndeplinită deoarece M(Xi) = pq aşa că M (│Xi-M(Xi)│3) sunt finite şi egale între ele deci:
n
3
 [M ( X
i 1
i  M ( X i ) )] 3
nM ( X i  p ) M ( Xi  p )
3

  0
 ( X )3 ( npq )3 n p 3 q3
pentru n ∞ deci rezultă:

Teorema 3.14 (Moivre-Laplace)


Dacă X este o variabilă binomială cu media M(X) = np şi varianţa V(X) = =npq cu
q=1-p, atunci funcţia de repartiţie a variabilei aleatoare normate
62

X  M ( X ) X  np
 tinde către funcţia de repartiţie F a variabilei normale reduse N(0,1)
 (X ) npq
când n ∞.
Cu alte cuvinte, probabilitatea ca un eveniment A să se realizeze în n experienţe
independente de un număr de ori cuprins între a şi b este aproximativ egală cu:
b  np a  np
F( )  F( ) când n ≥30
npq npq
Valorile lui F(u) pentru u ≥0 sunt date de tabela 1 din Anexă iar pentru
u <0 avem F(u) = 1-F(-u).
Exemplu:
Într-o urnă se află 600 bile albe şi 400 bile negre. Se extrag n = 200 bile cu bila
revenită. Se cere probabilitatea ca numărul X de bile albe extrase să fie cuprins între 100 şi
140 bile albe.
Soluţie: Avem: p=6/10 ; q=4/10 ; n=200 ; a=100 ;b=140
deci:
6 6
140  200. 100  200.
P(100  X  140)  F ( 10 )  F ( 10 ) 
6 4 6 4
200. . 200. .
10 10 10 10
 F (2.9)  F (2.9)  2.F (2.9)  1  2  0.9981  1  99.6%

3.4 Rezumat

În acest capitol se prezintă variabilele aleatoare clasice discontinue între care remarcăm
variabilele binomială şi Poisson ,variabilele aleatoare continue între care remarcăm variabilele
exponenţială , normală , hi patrat ,Student şi Fisher precum şi vectorul aleator normal.
Capitolul se încheie cu legile limită : Cebâşev , Bernoulli şi teorema limită-centrală.

3.5 Întrebări

1. Unde se aplică variabilele discontinue binomială şi Poisson ?


2. Unde se aplică variabilele continue exponenţială , normală , hi patrat ,Student şi Fisher ?
3. Ce importanţă practică au legile-limită Cebâşev şi Bernoulli ?

3.6 Bibliografie

1.D.Ene , M.Drăghici, I.N. Alecu “ Statistică aplicată în agricultură “ Ed.Ceres,2003


2.M.Iosifescu şi col. “ Mică enciclopedie de statistică “ Ed.Ştiinţif.şi Enciclop,,1985
3. Anuarul statistic al României , 1990 -2003
63

CAPITOLUL 4.

APLICAŢII ALE VARIABILELOR ALEATOARE CLASICE

Obiective : Însuşirea de către studenţi a conceptelor de simulare , fiabilitate,ritm de


defectare, sistem cu cerere şi servire aleatoare şi parametrii săi de intrare/ieşire.

Conţinut :
4.1 Simularea variabilelor aleatoare clasice prin metoda Monte Carlo
4.2 Fiabilitatea maşinilor agricole
4.3 Sisteme cu cerere şi servire aleatoare
4.4 Rezumat
4.5 Întrebări
4.6 Bibliografie

Cuvinte cheie :simulare , fiabilitate,ritmul defectării,sistem cu cerere şi servire


aleatoare cu aşteptare mixt şi cu refuz

4.1 Simularea variabilelor aleatoare clasice prin metoda Monte Carlo

În multe probleme practice intervin însuşiri cantitative cu caracter aleator; pe baza


datelor experimentale relativ la o asemenea însuşire cantitativă se poate găsi şi testa variabila
aleatoare clasică a valorilor însuşirii studiate.
Anumite însuşiri dependente de însuşirile cantitative cu caracter aleator, se pot calcula
ca valori medii cu ajutorul metodei Monte Carlo prin simularea pe calculator a n valori ale
variabilei aleatoare interesate.
Fie o însuşire cantitativă X cu caracter aleator pentru care dorim să determinăm
valoarea x0.
Dacă X este o variabilă aleatoare cu media μ = x0 şi varianţa σ 2, pentru m suficient de
mare, Sm = x1 + … + xm (suma celor m valori ale variabilei aleatoare X, simulate pe
calculator) este variabilă aleatoare normală N (m μ; mσ ) aşa că avem:
 x  ...  x m  ε
P 1  x 0  ε   2F   1 de unde rezultă
 m   σ 
x  ...  x m ε
x0  1 cu precizia ε şi probabilitatea 2F   1 unde F este
m σ
funcţia de repartiţie N(0, 1) (vezi teorema 3.8)
Cea mai importantă variabilă aleatoare care necesită simularea pe calculator este
variabila uniformă γ din secţiunea 3.2.1.
Există tabele cu valori ale variabilei γ (numere subunitare pozitive cu cifre aleatoare)
precum şi procedee de obţinere cu calculatorul a valorilor lui γ(funcţia RND).
Simularea altor variabile aleatoare clasice se face cu ajutorul variabilei uniforme γ
astfel:
Alegem în mod aleator (la întâmplare) m valori ale variabilei uniforme γi[0,1] şi
luăm x = xi dacă F(xi) = γi (i = 1, …, m) unde F(x) este funcţia de repartiţie a variabilei
aleatoare X.
Dacă X este variabilă aleatoare discontinuă cu un număr finit de valori, cu repartiţia:
64

 x ___ x n 
X :  1  din relaţia F(xi) = γi (i = 1, …, m) rezultă că vom lua:
p
 1 ___ p n 

xi = x1 dacă 0 < γi < p1


xi = x2 dacă p1 < γi < p1 + p 2
…………………………………….
xi = xk dacă p1 + … + pk-1 < γi < p1 + … + pk
……………………………………………………….
xi = xn dacă p1 + … + pn-1 < γi < 1
Dacă X este variabilă aleatoare discontinuă cu un şir infinit de valori, din condiţia 0 <

pi < 1 şi  p i  1 rezultă că numai pentru un număr finit de valori xi avem pi > ε cu 0 < ε < 1
i 1
deci vom lua în calcul numai aceste valori.
Dacă X este variabilă aleatoare continuă, din relaţia F(xi) = γi (i = 1, …, m) rezultă xi
ca funcţie de γi.
Exemple
Alegem în mod aleator (la întâmplare) m = 10 numere aleatoare γi : 0.72; 0.11; 0.65;
0.98; 0.23; 0.47; 0.55; 0.30; 0.05; 0.82; să se genereze câte 10 valori pentru variabilele
binomială, Poisson, exponenţială şi normală, calculând şi media acestor valori simulate.
Soluţie
a) Fie variabila binomială X cu parametrii n = 4; p = 0.4
 0 1 2 3 4 
Variabila X are repartiţia: X : 
 0.1296 0.3456 0.3456 0.1536 0.0256 
deci vom lua:

xi = 0 dacă 0 < γi < 0.1296


xi = 1 dacă 0.1296 < γi < 0.4752
xi = 2 dacă 0.4752 < γi < 0.8208
xi = 3 dacă 0.8208 < γi < 0.9744
xi = 4 dacă 0.9744 < γi < 1

Pentru valorile γi din enunţ, avem valorile simulate xi = 2; 0; 2; 4; 1; 1; 2; 1; 0; 2 cu


media simulată xs  1.5 în timp ce media reală este M(X) = np = 0.6
b) Fie variabila Poisson cu parametrul λ = 0.2; cu ε = 0.0001 variabila Poisson X
trunchiată la valorile xi pentru care pi > ε,
 0 1 2 3 4 
va fi: X :   deci vom lua:
 0.8187 0.1637 0.0164 0.0011 0.0001 

xi = 0 dacă 0 < γi < 0.8187


xi = 1 dacă 0.8187 < γi < 0.9824
xi = 2 dacă 0.9824 < γi < 0.9988
xi = 3 dacă 0.9988 < γi < 0.9999
xi = 4 dacă 0.9999 < γi < 1

Pentru valorile γi din enunţ avem valorile simulate xi = 0; 0; 0; 1; 0; 0; 0; 0; 0; 1 cu


media simulată xs  0.2 în timp ce media reală este λ = 0.2
65

c) Fie variabila exponenţială X cu parametrul λ = 3.


Funcţia de repartiţie este F(X) = 1 – e -λx deci vom avea 1 – e-3xi = γi de unde
ln(1  γ i )
xi   .
3
Pentru valorile γi din enunţ, avem valorile simulate xi = 0.42; 0.04; 0.35; 1.30; 0.09;
1
0.21; 0.27; 0.12; 0.02; 0.57 cu media simulată xs  0.339 în timp ce M(X) =  0.333

d) Fie variabila normală X cu parametrii μ = 3; σ = 0.5
Xμ
Fie U  deci X = μ + σ .U
σ
Variabila U este variabilă N(0, 1) cu funcţia de repartiţie F(u) în tabela 1 din Anexă.
Vom lua F(xi) = γi.
Pentru F(ui) = γi > 0.5 vom folosi tabela 1 pentru ui > 0 iar pentru F(ui) = γi < 0.5 avem
ui < 0 deci folosim relaţia F(- ui) = 1 – F(ui) = 1 – γi > 0.5 deci obţinem pe ui > 0 din tabela 1
cu ajutorul lui 1 – γi > 0.5.
Pentru valorile γi din enunţ, avem valorile simulate u i = 1.23; 0.38; 2.06; -0.07; 0.13;
-0.52; -1.65; 0.92.
Valorile simulate xi ale lui X se obţin din relaţia xi = 3 + 0,5 . ui deci vom avea: xi =
3.29; 2.39; 3.19; 3.03; 2.63; 2.97; 3.07; 2.74; 2.18; 3.46 cu media simulată xs  2.895 în timp
ce M(X) = 3.

4.2. Fiabilitatea maşinilor agricole

Fie T variabila aleatoare pozitivă a timpului de funcţionare fără defecţiuni a unui


element constructiv al unei maşini agricole.
Notăm cu F(t) funcţia de repartiţie şi cu f(t) densitatea de probabilitate a variabilei
aleatoare T.
Fiabilitatea elementului constructiv considerat este probabilitatea funcţionării lui fără
defecţiuni în intervalul de timp [0, t] adică:
R(t) = P(T > t) = 1 – F(t)
Teorema 2.1. se transcrie pentru R(t) astfel:
1) R ia valori între 0 şi 1; R(0) = 1; lim R (t )  0 ;
t 

2) R este continuă la stânga: lim R(t )  R(t0 ) ;


t t0

3) R este funcţie descrescătoare: t1 < t2  R(t1) > R(t2);


4) P(a < T < b) = R(a) – R(b);P(T< b) =
=1– R(b) ; P(a < T) = R(a). R(t)
Graficul fiabilităţii are forma:

Ritmul defectării unui element constructiv 1


este densitatea de probabilitate de defectare a sa
la momentul t, condiţionată de faptul că
funcţionarea sa a fost fără defecţiuni în intervalul
[0, t] adică:

0 t
66

P( T  t ) ( t  T  t  Δt )
λ( t )  lim
Δt  0 Δt

P(T  t  Δt ) R ( t  Δt )
Avem P( T  t ) ( t  T  t  Δt )  1  1 deci:
P (T  t ) R (t )
P( T  t ) ( t  T  t  Δt ) R ( t  Δt )  R ( t ) 1
  deci trecând la limită
Δt Δt R (t )
pentru Δt  0 obţinem:
t
 λ (s ) ds
R ' (t ) f (t )
λ( t )    . Reciproc, avem: R(t)  e0
R ( t ) 1  F( t )
Graficul ritmului de defectare are forma:

λ (t)

II
I IIIII III

0 tr tu t

Avem trei perioade în evoluţia funcţionării unui element constructiv în timp:


I) Perioada de rodaj [0; tr] în care apar un număr mare de defecte de fabricaţie;
II) Perioada de viaţă utilă [tr; tu] în care ritmul de defectare este scăzut şi
constant;
III) Perioada de uzură fizică [tu; +] în care ritmul de defectare creşte din nou
datorită uzurii fizice.
În prezent multe elemente constructive nu mai ating perioada de uzură fizică datorită
înlocuirii lor, fiind uzate moral.
Timpul mediu de funcţionare fără defecţiuni al unui element constructiv se numeşte
durabilitatea elementului şi este media variabilei aleatoare T adică:

M (T)   R ( t )dt
0
Exemple
 λt
1) T = variabilă exponenţială (secţiunea 3.2.3) deci F(t) = 1  e aşa că
 λt
R(t)  e ; λ(t) = λ; M(T) = 1
Acest caz se întâlneşte în perioada II) de viaţă utilă când λ(t) = constant.
Conform teoremei 4.1 de mai jos, dacă probabilitatea funcţionării fără defecţiuni a
unui element constructiv într-un interval de timp de lungime t, nu depinde de funcţionarea
67

anterioară a elementului ci numai de lungimea t a intervalului de timp, atunci T este variabilă


exponenţială.
 λt α
2) T = variabilă Weibull (secţiunea 3.2.3.B) deci F( t )  1  e aşa că:
 1

 λt α  
R(t)  e ; λ( t )  αλt α 1 ; M (T )  
1
 
 
În cazul 0 < α < 1, λ(t) descreşte (cazul elementelor cu defecte de fabricaţie multe da
care se uzează lent); în cazul α = 1 avem λ(t) = λ = constant adică cazul 1) al fiabilităţii
exponenţiale de mai sus; în cazul α > 1, λ(t) creşte (cazul elementelor cu defecte de fabricaţie
puţine dar care se uzează rapid).
t  s  2
1 
2 2
3) T = variabilă normală (secţiunea 3.2.4) deci F (t )  e cu valori
2 
T μ
în tabela 1 din Anexa, după transformarea U  .
σ
f (t )
Rezultă R(t) = 1 – F(t); λ( t )  ; M(T) = μ
1  F( t )
(t   )2
1 
2 2
Aici f (t )  e este densitatea de probabilitate a variabilei aleatoare
2
normale N(;).
Dacă două elemente constructive independente între ele, au fiabilităţile R1(t), R2(t)
atunci legându-le în serie avem un element compus cu fiabilitatea R(t) = R1(t) . R2(t) iar
legându-le în paralel, avem un element compus cu fiabilitatea R(t) = R1(t) + R2(t) – R1(t) .
R2(t).
Exemplu
Două elemente constructive independente ale unui tractor au fiabilităţile exponenţiale
R1(t) = e - 0.5t; R2(t) = e - 1.5t. Să se calculeze fiabilitatea elementului compus din cele 2
elemente precedente în montaj serie şi paralel.
Soluţie
Pentru montajul serie avem Rs(t) = e-0,5t . e-1,5t = e-2t deci λs(t) = 2;
1
M s (T )   0.5 .
2
R ' p (t )
Pentru montajul paralel avem Rp(t) = e-0,5t + e-1,5t – e-2t deci  p (t )   şi
R p (t )

Mp(T) = R
0
p (t )dt .

4.3 Sisteme cu cerere şi servire aleatoare


68

Variabilele aleatoare Poisson şi exponenţială apar împreună în următoarea teoremă


fundamentală:

Teorema 4.1
Dacă producerea unor evenimente în timp verifică condiţiile:
1) Probabilitatea producerii unui număr de k evenimente într-un interval de timp de
lungime t, este funcţie numai de k şi t;
2) Numărul evenimentelor produse într-un interval de timp de lungime t este
independent de numărul evenimentelor produse în orice alt interval de timp de lungime t,
disjunct de primul;
3) Într-un interval de timp arbitrar de mic, nu se poate produce mai mult de un
eveniment, atunci:
4) Variabila aleatoare X(t) a numărului de evenimente produse în orice interval de
timp de lungime t, este o variabilă Poisson cu media λt (λ = numărul mediu de evenimente
produse în unitatea de timp, adică:

P X ( t )  k  
λt k e  λt
k!
5) Variabila aleatoare T(t) a intervalelor de timp între producerea a două evenimente
1
consecutive este o variabilă exponenţială cu media adică:
λ
PT  t   1  e  λt
Demonstraţie
Fie Pk(t) = P(X(t) = k) (k = 0, 1, 2, …)
Conform condiţiilor 1) – 3) ale ipotezei, în intervalul de timp [t; t + Δt] avem:
Pk(t + Δt) = Pk(t).[1 - λ Δt – O(Δt)] + Pk-1(t).[ λ Δt + O(Δt)] + Pk-i(t). . P>i(Δt).O(Δt)
unde P>i(Δt) = O(Δt) este probabilitatea de a se produce mai mult de i evenimente în
O  t 
intervalul de timp [t; t + Δt] iar lim  0.
t 0 t
Rezultă:
Pk (t  t )  Pk (t ) O ( t )
  Pk (t )   Pk 1 (t )  deci pentru Δt  0 obţinem:
t t
P’k(t) = λ[Pk-1(t) – Pk(t)]
Pentru k = 0 obţinem P’0(t) = - λP0(t) = e-λt deci t este variabilă exponenţială cu funcţia
de repartiţie P(T < t) = F(t) = 1 – e- λt şi concluzia 5) este demonstrată.
Pentru k = 1 avem P’1(t) = λ[P0(t) – P1(t)] = - λP1(t) + λe-λt şi cum
λt  λt
P1(0) = 0 rezultă P1 ( t )  e .
1!
λt 2  λt
Pentru k = 2 obţinem în mod analog P2 (t )  e deci prin inducţie
2!
λt k  λt
matematică rezultă: Pk (t )  e aşa că X(t) este variabilă Poisson şi concluzia 4) este
k!
demonstrată. Q.E.D.
Variabila aleatoare X(t) este de fapt proces aleator Poisson (vezi secţiunea 2.3).
Un sistem cu cerere şi servire aleatoare se compune din următoarele elemente:
1) Fluxul de cereri: se presupune că cererile sunt aleatoare şi independente între ele.
69

Numărul mediu de cereri în unitatea de timp se numeşte intensitatea fluxului de


1
cereri şi se notează cu λ. Intervalul de timp mediu între două cereri consecutive este .
λ
Numărul total al cererilor poate fi finit sau infinit, ele pot sosi individual sau în grup.
Dacă cererile care nu sunt servite la sosirea lor, aşteaptă să fie servite mai târziu, avem
sistem cu aşteptare; dacă cererile care nu sunt servite la sosirea lor părăsesc sistemul fără a fi
servite, sistemul este cu pierderi.
Părăsirea sistemului se face deoarece cererea nu poate aştepta (sistem cu refuz) sau
poate aştepta un timp limitat sau şirul de aşteptare are un număr finit de locuri (sistem mixt).
2) Staţiile de servire: avem s > 1 staţii dispuse în serie sau paralel. Disciplina
sistemului este modul cum sunt servite cererile. Ea poate fi naturală (primul venit este primul
servit) sau cu prioritate.
3) Fluxul de serviri: se presupune că servirile sunt aleatoare şi independente între ele.
Numărul mediu de serviri în unitatea de timp se numeşte intensitatea fluxului de
1
serviri şi se notează cu μ. Intervalul de timp mediu între două serviri este .
μ
λ ρ
Raportul ρ  se numeşte factorul de servire al unei staţii iar ρ*  se numeşte
μ s
factorul de servire al sistemului.
Pentru a nu forma şiruri de aşteptare de lungime infinită, trebuie să avem ρ < 1
respectiv ρ* < 1.
Servirea poate fi făcută individual sau în grup.
Parametrii principali ai sistemului cu cerere şi servire aleatoare sunt:
a) Probabilitatea pk (k = 0, 1, 2, …) a existenţei a k cereri în sistem (în şirul de
aşteptare şi în curs de servire);
b) Numărul mediu U de cereri în sistem;
c) Timpul mediu de aşteptare W în sistem;
d) Numărul mediu L de staţii ocupate;
e) Probabilitatea Pr de a refuza cereri;
f) Probabilitatea Pt de a aştepta în sistem un timp superior lui t.
Vom presupune că numărul de cereri în unitatea de timp este o variabilă Poisson iar
timpul între două serviri consecutive este o variabilă exponenţială (vezi teorema 4.1).

4.3.1 Sisteme cu aşteptare cu s staţii(cu şir de aşteptare de lungime N=  )

Teorema 4.2
În condiţiile 1) – 3) ale teoremei 4.1 avem:
a) Probabilitatea existenţei a k cereri în sistem este p k (k = 0, 1, 2, …) unde:
1
 ρ ρ s 1 ρs 1 
p 0  1   ...    
 1! (s  1)! s! 1  ρ * 
ρk
 p0; (k  1, 2, ..., s)
 k!
pk   k
 ρ p ; (k  s  1, s  2, ...)
 s! s k - s 0
70

b) Numărul mediu de cereri în sistem este:


ρs ρ*
Uρ   p0
s! (1  ρ*) 2
c) Timpul mediu de aşteptare în sistem este:
U
W
λ
d) Numărul mediu de staţii ocupate este L = ρ
e) Probabilitatea de a refuza cereri este Pr = 0
f) Probabilitatea de a aştepta în sistem un timp superior lui t este:
ρs 1
Pt   p 0 e  μst (1 ρ*)
s! 1  ρ *
Demonstraţie
Ca şi în teorema 4.1, probabilităţile Pk (k = 0, 1, 2, …) satisfac sistemul recurent de
ecuaţii liniare:
 p0   p1

   j   p j   p j 1   j  1  p j 1 ; (j  1, ..., s-1)

   s  p j   p j 1  s  p j 1 ; (j  s, s  1, ...)
din a cărui rezolvare rezultă formulele de la punctul a).
b) U = 0 . p0 + 1 . p 1 + … + np n + … deci rezultă formula de la punctul b).
c) Evident.
d) Numărul mediu de staţii neocupate este:
sp0 + (s – 1) p1 + … + (s-j)pj + … + 1 . ps-1 = s – ρ deci L = ρ
e) Evidentă
f) Probabilitatea ca o cerere să aştepte este:
ρs
pa = p s + ps+1 + … = p0
s!(1  ρ*)
Probabilitatea ca o cerere să aştepte în sistem un timp cel puţin egal cu t este:
Pt  e stμ (1 ρ*)  p a adică formula de la punctul f). Q.E.D.
În particular pentru s = 1 avem ρ* = ρ deci formulele precedente capătă forma
simplificată:
a) p0 = 1 – ρ; pk = ρk(1 – ρ) (k = 1, 2, …)
b) U = ρ/(1 – ρ); c) W = U/ λ; d) L = ρ
- t μ(1 – ρ)
e) Pr = 0; f) Pt = ρe

4.3.2 Sisteme mixte cu s staţii (cu şir de aşteptare de lungime finită N)

Teorema 4.3
În condiţiile teoremei 4.1 avem:
a) Probabilitatea existenţei a k cereri în sistem este p k (k = 0, 1, 2, …,s + N) unde:
N 1 1
   s 1  s 1    * 
p0  1   ...    
 1! ( s  1)! s ! 1  * 

71

k
 k ! p0 ; (k  1, 2, ...,s)
pk   k
  p ; (k  s  1,s  2, ...,s  N)
 s !s k  s o
b) Numărul mediu de cereri în sistem este:
U = 0 . p0 + 1 . p1 + … + (s + N) ps +N adică:
s 1  ( N  1)(  *) N  N (  *) N 1 
U    p0  * 2
 s (  *) N 
s!  (1   *) 
U
c) Timpul mediu de aşteptare în sistem este: W 
λ
d) Numărul mediu de staţii ocupate este:
(1 . p 1 + … + s . p s) + s(ps+1 + … + pN) adică:
   s 1  s 1  (  *) N 
L   1   ...    p0
 1! (s  1)! s ! 1   * 
e) Probabilitatea de a refuza cereri este:
s
Pr = p S+N adică Pr  (  *) N  p0
s!
f) Probabilitatea ca o cerere să aştepte în sistem un timp superior lui t, este:
1 s  N  st (  st ) N 1 
Pt   p0 e  st 1    *     * ( *) N   ...  ( *) N 1  ( *) N  
1   * s!    1! ( N  1)! 
În particular pentru s = 1 avem ρ* = ρ deci formulele precedente capătă forma
simplificată:
1 ρ ρ k (1  ρ)
a) p 0  ; pk  ; (k  1, ..., N  1) ;
1  ρ N2 1  ρN2

ρ 1  ( N  2)ρ N 1  ( N  1)ρ N  2
b) U   ;
1 ρ 1  ρN2

U 1  ρ N 1 ρ N 1  ρ N  2
c) W  ; d) L  ρ ; e) Pr  ;
λ 1  ρ N 2 1  ρ N2

e  μt  μt μt N 1 N 1 
f) Pt  ρ
1  ρN2
 N
1 ρ 
1!
 N

ρ  ρ  ... 
N  1!
ρ   ρN   
 
Pentru N   cazul II) se reduce la cazul I).
Pentru N = 0 cazul II) se reduce la cazul III).

4.3.3 Sistem cu refuz cu s staţii(cu şir de aşteptare de lungime N=0)

Teorema 4.4
În condiţiile teoremei 4.1 avem:
a) probabilitatea existenţei a k cereri în sistem este p k (k = 0, 1, …, s) unde:
72

1
  s 
p0  1   ... 
 1! s ! 
k
pk  p0 ; (k  1,2, ..., s)
k!
b) Numărul mediu de cereri în sistem este:
 s 1
U  p0
s!
c) Timpul mediu de aşteptare în sistem este:
U
W
λ
d) Numărul mediu de staţii ocupate este:
   s 1 s 1 
L   1   ...    p
 1!  s  1 ! s ! 1   *  0
e) Probabilitatea de a refuza cereri este:
s
Pr  p0
s!
f) Probabilitatea ca o cerere să aştepte în sistem un timp superior lui t este:
1 s
Pt   p0 e   st
1  * s!
În particular pentru s = 1 avem ρ* = ρ deci formulele precedente capătă forma
simplificată:
1   U 1
a) p0  ; p1  ; b) U  ; c) W  ; d) L  ;
1  1  1   1- 2
 
e) Pr  ; f) Pt  e t
1  1 2
Exemple
1) La un depozit en-gros de legume fructe sosesc în medie ρ = 36 maşini pe zi şi sunt
servite în medie μ = 12 maşini pe zi. Dacă depozitul are s = 4 echipe de servire, se cer:
a) Probabilitatea p5 a existenţei a 5 maşini în sistem;
b) Numărul mediu U de cereri în sistem;
c) Timpul mediu W de aşteptare în sistem;
d) Numărul mediu L de echipe de servire ocupate;
e) Probabilitatea Pr de a refuza cereri;
f) Probabilitatea P0.5 de a aştepta în sistem cel puţin ½ de zi.
Soluţie
Avem un sistem de aşteptare cu s = 4 staţii.
  3
Avem λ = 36; μ = 12; s = 4 deci:    3;  *    0.75  1; t  0.5
 S 4
1
  2 3 4 5 1  5
a) p0  1         0.071; p 5   p0  3.6%
 1! 2! 3! 4! 5! 1   *  5!4
5 *
b) U     p0  4.7 cereri în sistem
5! 1   * 2
73

U
c) W   0.13 zile

d) L = ρ = 3 echipe de servire ocupate

e) Pr = 0 de refuz cereri
s 1
f) Pt    p0 e  st (1  *)  0.14%
s! 1   *

2) La un tomograf cu s = 1 aparat sosesc în medie λ = 8 solicitanţi pe zi şi sunt serviţi


în medie μ = 10 solicitanţi pe zi.
Lungimea şirului de aşteptare în sistem este de N = 5 bonuri. Se cere:
a) Probabilitatea p2 a existenţei a două cereri în sistem;
b) Numărul mediu U de cereri în sistem;
c) Timpul mediu W de aşteptare în sistem;
d) Numărul mediu L de staţii ocupate;
e) Probabilitatea Pr de a refuza cereri;
f) Probabilitatea P0.5 ca o cerere să aştepte în sistem mai mult de o ½ zi.
Soluţie
Avem un sistem mixt cu s = 1 staţie.

Avem λ = 8; μ = 10; s = 1 deci    0.8  1 , t = 0.5, N = 5

1 
a) p0  N 1
 0.27; p 2 = ρ2 . p0 = 17.3%
1 
N 1 N 2
 1   N  2     N  1 
b) U    0.8 cereri în sistem
1  1   N 2
U
c) W   0.1 zile

1   N 1
d) L    0.75 staţii ocupate
1   N 2
 N 1   N  2
e) Pr   6.6%
1   N 2
N 1

e  t t  t  
f) Pt   1           ... 
N N
  N 1   N    8.8%
1   N 2
 1! 4! 
3) La o centrală telefonică cu s = 2 numere sosesc în medie λ = 160 apeluri pe zi şi
sunt servite în medie μ = 100 apeluri pe zi.
Se cer:
a) Probabilitatea p4 a existenţei a 4 cereri în sistem,
b) Numărul mediu U de cereri în sistem,
c) Timpul mediu W de aşteptare în sistem,
d) Numărul mediu L de staţii ocupate,
e) Probabilitatea Pr de a refuza cereri,
f) Probabilitatea P0.01 ca o cerere să aştepte în sistem un timp superior lui 0.01 zile.
Soluţie
Avem un sistem cu refuz.
74


Avem λ = 160; μ = 100; ρ = 1.6;  *   0.8  1 , t = 0.01
s
1
 2 
a) p0  1     0.2577
 2 
ρ4
p 4  p 0  7%
4!
3
b) U    p0  1.4 cereri în sistem
3!
U
c) W   0.009 zile

 2 1 
d) L   1    p0  3.7 staţii
 2! 1   * 
ρ2
e) Pr  p 0  33%
2!
1 s
f) P0.01   p0 e  st  22.3%
1   * s!

4.4 Rezumat

În acest capitol se prezintă simularea variabilelor aleatoare cu metoda Monte-Carlo,


noţiunile de fiabilitate , ritm de defectare , fiabilitate exponenţială şi Weibull,sisteme cu
cerere şi servire aleatoare cu aşteptare , mixte şi cu refuz precum şi parametrii lor de
intrare/ieşire .

4.5 Întrebări

1 Cum se simulează valorile variabilelor aleatoare discrete şi continue prin metoda Monte-
Carlo ?
2. Ce sunt fiabilitatea şi ritmul de defectare al unei maşini agricole ?
3. Care sunt parametrii de intrare/ieşire ai unui sistem cu cerere şi servire aleatoare cu
aşteptare , mixt şi cu refuz ?

4.7 Bibliografie

1. D.Ene , M.Drăghici, I.N.Alecu “ Statistică aplicată în agricultură” Ed. Ceres , 2003


2. M.Iosifescu şi col. “ Mică enciclopedie de statistică”, Ed.Ştiinţif. şi Enciclop.,1985
3. Anuarul statistic al României , 1990-2003
75

CAPITOLUL 5.

CULEGEREA ŞI PRELUCRAREA DATELOR DE SONDAJ

Obiective : Însuşirea de către studenţi a tehnicilor de sondaj, a calculului şi


interpretării indicatorilor de sondaj de repartiţie şi evoluţie , precum şi a
calculului şi interpetării indicilor statistici .

Conţinut :

5.1 Populaţii statistice şi sondaje


5.2 Indicatori de sondaj de repartiţie
5.3 Indicatori de sondaj de evoluţie
5.4 Rezumat
5.5 Întrebări
5.6 Bibliografie

Cuvinte cheie : populaţie statistică , sondaj simplu repetat şi nerepetat,sondaj


stratificat tipic,proporţional şi optim , indicatori de sondaj de repartiţie / evoluţie ,
indici staistici individuali şi sintetici .

5.1. Populaţii statistice şi sondaje

Populaţia statistică este o mulţime de exemplare care aparţin aceleiaşi familii şi care
fac obiectul cercetării statistice.
Cercetarea statistică poate fi completă sau exhaustivă (pentru toate exemplarele
populaţiei) de tip referendum sau recensământ sau poate fi parţială sau selectivă de tip
sondaj (eşantion, probă, sondaj de opinie) (pentru o parte reprezentativă din exemplarele
populaţiei).
Exemple de populaţii statistice în agricultură: plantele unei culturi într-o parcelă,
animalele unei ferme zootehnice, maşinile agricole care deservesc o suprafaţă arabilă, fermele
vegetale sau zootehnice dintr-un judeţ, unităţile de prelucrare a produselor agricole (mori,
fabrici de ulei, zahăr, produse lactate, mezeluri, abatoare, etc.), magazinele care
comercializează produse alimentare, reţeaua de case de agroturism, reţeaua de unităţi de
alimentaţie publică, etc.
Fiecare exemplar al populaţiei statistice are o serie de însuşiri cantitative
(măsurabile) sau calitative (atributive) notate X, Y, Z, … sau X1, X2, …, Xn pe care le vom
numi în continuare şi caractere.
Pentru populaţiile statistice din agricultură, însuşirile admit şi alte clasificări:
- după natură: însuşiri biologice, tehnologice, economice, ecologice;
- după modul de exprimare numerică: însuşiri bivalente (0 sau 1), întregi şi reale
(fracţionare);
- după modul de apreciere: însuşiri primare (numai măsurabile) şi însuşiri
derivate (măsurabile sau calculabile);
- după gradul de generalitate: însuşiri individuale (proprii fiecărui element al
populaţiei) şi colective (proprii unor grupe de elemente ale populaţiei).

Exemple de însuşiri individuale:


- talia plantei;
76

- suprafaţa foliară a plantei;


- greutatea şi densitatea plantei;
- dimensiunile fructelor;
- greutatea şi densitatea fructelor;
- numărul de boabe din fruct;
- dimensiunile boabelor;
- greutatea şi densitatea boabelor;
- conţinutul în substanţe nutritive al fructelor sau boabelor.
Exemple de însuşiri individuale la animale:
- înălţimea la greabăn;
- înălţimea la crupă;
- lungimea corpului;
- circumferinţa toracică;
- greutatea şi densitatea corpului;
- dimensiunea organelor interne (ficat, inimă, rinichi, creier, etc.);
- greutatea şi densitatea organelor interne;
- greutatea şi densitatea produselor zootehnice (lapte, grăsime şi proteină în lapte,
carne, etc.);
- conţinutul în substanţe nutritive al produselor zootehnice.
Însuşirile individuale precedente devin colective dacă se însumează pentru plantele
unei culturi de pe o parcelă dată sau pentru animalele dintr-o fermă zootehnică dată.
Menţionăm şi următoarele însuşiri colective:
- Consumul de resurse (forţă de muncă, forţă mecanică, energie, îngrăşăminte, apă,
furaje, medicamente etc.) pentru o societate agricolă (vegetală, zootehnică, de prelucrare
produse agricole, de comercializare produse alimentare, de agroturism) într-un ciclu de
producţie;
- Costul resurselor pe unitate de resursă pentru o societate agricolă într-un ciclu
de producţie;
- Cheltuielile cu resurse (consumuri înmulţite cu costurile) însumate pentru o
societate agricolă într-un ciclu de producţie;
- Cheltuielile neproductive (TVA, taxe, impozite etc.) ale unei societăţi agricole
într-un ciclu de producţie;
- Producţii fizice principale şi secundare ale unei societăţi agricole într-un ciclu
de producţie;
- Preţurile de vânzare ale producţiilor fizice principale şi secundare pe unitate,
pentru o societate agricolă într-un ciclu de producţie;
- Veniturile (producţii fizice înmulţite cu preţurile de vânzare) însumate pentru o
societate agricolă într-un ciclu de producţie;
- Profitul (venitul din care se scad cheltuielile totale cu resursele cât şi cele
neproductive) realizat de societatea agricolă într-un ciclu de producţie;
- Rata profitului (profitul împărţit la cheltuielile totale) realizată de societatea
agricolă într-un ciclu de producţie.
Pentru comparaţia între ele, însuşirile colective se raportează la un exemplar, lungime,
suprafaţă, volum, greutate, timp, unitate bănească, etc.) obţinând însuşiri medii.

Exemple: consumul mediu de motorină pe ha, consumul mediu de furaje pe cap de


vacă, profitul mediu pe lună al unei unităţi de agroturism, etc.
În agricultură, omul nu poate controla în totalitate factorii de producţie sau de vânzare
a produselor agricole, de aceea însuşirile precedente sunt parţial sau total sub influenţa
77

întâmplării (hazardului) fiind de fapt în fiecare moment, variabile aleatoare iar în timp,
procese aleatoare (vezi cap. 2).
Acţiunea întâmplării asupra însuşirilor (caracterelor) în agricultură se concretizează în
variabilitatea valorilor acestora în spaţiu, timp, structură, etc. variabilitatea poate fi
accidentală (involuntară) sau sistematică(cu o cauză precisă).
Variabilitatea accidentală este presupusă a fi o variabilă normală cu media 0 şi
abaterea – standard σ (vezi cap. 3)

Exemple de surse de variabilitate:


- variabilitatea genotipică a plantelor şi animalelor;
- condiţiile pedoclimatice;
- atacul buruienilor, bolilor şi dăunătorilor;
- conjunctura economică (raport ofertă/cerere) pe piaţa produselor agroalimentare.
Fie o populaţie statistică de volum N pe care dorim să o studiem din punct de vedere al
însuşirii (caracterului) X pe care o posedă exemplarele populaţiei.
Din cauza volumului mare N al populaţiei, nu vom face măsurători complete în toată
populaţia ci vom extrage o parte reprezentativă din exemplarele populaţiei, numită sondaj
(eşantion, probă) pe care vom face măsurători relativ la însuşirea (caracterul) X.
n
Volumul sondajului se notează cu n iar raportul (%) se numeşte cotă de
N
reprezentare sau factor de sondaj.

Exemplu
Pe un ha cu porumb există N = 75.000 plante recoltabile din care extragem un sondaj
de n = 75 plante reprezentative.
n 75
Cota de reprezentare este   1 : 1000 plante.
N 75000
Un sondaj se poate efectua în două feluri:
I. Static: se fac măsurători simultane la un moment dat pe n exemplare extrase
din populaţie obţinându-se astfel repartiţia în spaţiu a însuşirii X analizată prin datele de
sondaj.
II. Dinamic: se fac măsurători consecutive în n momente de timp succesive pe
acelaşi exemplar al populaţiei statistice, obţinându-se astfel evoluţia în timp a însuşirii X
analizată prin datele de sondaj.
Tehnica de efectuare a unui sondaj, depinde de compoziţia populaţiei în raport cu
însuşirea X.
Avem situaţiile:
a) Populaţia este omogenă în raport cu însuşirea X adică orice valoare a lui X este în
mod egal probabil proprie fiecărui exemplar al populaţiei.
În acest caz se efectuează un sondaj simplu repetat sau nerepetat.
Sondajul simplu repetat se efectuează prin extragerea suscesivă a exemplarelor din
populaţie şi revenirea în populaţie a fiecărui exemplar după măsurarea însuşirii X (schema
bilei revenite). Avantajul acestui tip de sondaj este că extragerile din populaţie sunt
independente iar dezavantajul este că la controlul calităţii produselor, orice exemplar chiar
dacă este rebut, trebuie întors în populaţie.
Sondajul simplu nerepetat se efectuează prin extragerea simultană a exemplarelor din
populaţie şi revenirea acestora în populaţie (dacă nu sunt rebuturi) după efectuarea tuturor
măsurătorilor pe ele relativ la însuşirea X (schema bilei nerevenită).
78

Dezavantajul acestui tip de sondaj este că extragerile din populaţie sunt dependente.
Dacă volumul de sondaj n este relativ mare rezultatele obţinute prin sondajul simplu repetat
sau nerepetat sunt aproximativ aceleaşi.
b) Populaţia este neomogenă în raport cu însuşirea X dar se poate împărţi în k
straturi omogene în raport cu X, volumul straturilor fiind N1, … Nk. Evident avem N1 + …+
Nk = N. În acest caz se efectuează un sondaj stratificat care constă în k sondaje simple,
repetate sau nerepetate, din straturi cu volumele de sondaj din straturi n1, …, nk. Evident avem
n1+ …+ nk = n.
Prezentăm câteva tipuri de sondaj stratificat:
n
a. Sondaj tipic: n1  ...  n k  ;
k
n1 n n N N
b. Sondaj proporţional:  ...  k  deci n1  n 1 ,..., n k  n k
N1 Nk N N N
n1 n n
c. Sondaj optim:  ...  k  deci
N1 1 N k k  N i i
N1σ1 N σ
n1  n ,..., n k  n k k
 N iσi  N iσi
Aici σ 1, … σ k sunt abaterile standard ale exemplarelor din straturi în raport cu
caracterul X ca variabilă aleatoare (vezi cap. 2).
N
Observăm că pentru N1 = …= Nk = sondajul tipic şi cel proporţional coincid iar
k
pentru σ 1 = …= σ k = σ sondajul proporţional şi cel optim coincid.
N1 N
În cazul unei populaţii infinite  p1 ,..., k  p k deci pentru tipurile de sondaj
N N
stratificat precedent, avem:
n
a. Sondaj tipic: n1 = … = nk = ;
k
b. Sondaj proporţional: n1 = np1, …, nk = npk
p1σ1 p σ
c. Sondaj optim: n1  n ,..., n k  n k k .
 piσi  pi σ i
Exemplu
O turmă de ovine de volum N = 1000 capete are structura N1 = 700 mioare, N2 = 250
miei, N3 = 50 berbeci.
Pentru analiza însuşirii X = lungimea firului de lână efectiv din sondaj de n = 60
ovine. Ştiind că abaterile – standard în straturi sunt σ 1 =1 cm; σ 2 = 0.8 cm şi σ 3 = 2 cm, se
cer volumele de sondaj din straturi pentru diferite tipuri de sondaj stratificat.
Soluţie
a) Pentru sondajul tipic n1 = n / 3 =20 mioare; n2 = n / 3 =20miei; n3= n / 3 =20
berbeci;
700
b) Pentru sondajul proporţional n1 = 60   42 mioare,
1000
250
n2 = 60   15 miei şi n3 = n – n1 – n2 = 3 berbeci;
1000
79

c) Pentru sondajul optim Ni σ i = 700x1 + 250 x 0.8 + 50x2 =1000 aşa că: n1 =
700  1 250  0.8
60   42 mioare; n2 = 60   12 miei şi n3 = n – n1 – n2 = 6 berbeci.
1000 1000

5.2 Indicatori de sondaj de repartiţie

5.2.1 Cazul sondajului de volum mic (n < 30)

În acest caz datele nu se grupează în clase de valori, prelucrarea la statistică


reducându-se la calculul următorilor indicatori statistici:
I. Media de sondaj

X  MX 
 xi
n
Media de sondaj este centrul de greutate al datelor de sondaj x1, …, xn fiind cea
mai apropiată de ansamblul valorilor: SPA(x) = (x1 – x)2 +…+ (xn – x)2 este minimă pentru
x = x.
Aici SPA este prescurtarea pentru suma patratelor abaterilor.

Calităţi ale mediei


a) Este o valoare mărginită: X [x min; x max];
b) Nivelează diferenţele între valori: suma abaterilor valorilor de sondaj faţă de
media lor este zero (xi - X ) = 0;
c) Este reprezentantul întregului pachet de date de sondaj: suma valorilor de
sondaj este media lor înmulţită cu numărul lor (xi = n . X ).
Defecte ale mediei
d) Prin nivelare, media nu dă informaţii despre variabilitatea datelor de sondaj.
Acest defect se remediază prin folosirea indicatorilor statistici de variabilitate între
care cităm abaterea standard S şi coeficientul de variabilitate c ,care vor fi prezentaţi mai
jos.
5) Media este legată de o unitate de măsură deci nu permite comparaţii între caractere.
X max  X
Pentru comparaţii se poate folosi media procentuală Xp   0;1.
X max  X min
6) Media este sensibilă la valori de sondaj mult mai mici sau mult mai mari ca restul
datelor de sondaj.
Acest defect se remediază fie eliminând aceste valori din rândul datelor de sondaj ca
valori străine fie folosind mediana prezentată mai jos.
7) Media este sensibilă la codificarea datelor. Conform teoremei 2.1 orice operaţie
aritmetică efectuată cu datele de sondaj, trebuie efectuată şi asupra mediei de sondaj.
Dacă sondajul a fost stratificat, datele de sondaj au forma:
x11, …, x1,n1 extrase din stratul 1 şi cu media de sondaj X 1
-----------------------------------------------------------------------
Xk1, …, Xk,nk extrase din stratul k şi cu media de sondaj X k.
Volumul sondajului stratificat este n = n1 + … + nk iar media de sondaj X a
n1 X 1  ...  nk X k
sondajului stratificat este medie ponderată: X
n1  ...  nk
80

Media de sondaj de la punctul 1) se mai numeşte şi medie aritmetică de sondaj.


Se folosesc în anumite cazuri şi alte medii:
1
- media geometrică: X g  x1 x 2 ...x n  n de unde
log X1  ...  log X n
log X g 
n
1 1
 ... 
1 X Xn
- media armonică:  1
Xa n

1
 X12  ...  X 2n 2
- media pătratică: X 2   
 n 
 
Avem X a ≤ X g ≤ X .
Dacă X1,…,Xn sunt depuse în celulele A1:An din coloana A în EXCEL
media X este dată de funcţia EXCEL scrisă în celula B1 : = AVERAGE(A1: An) ,
media geometrică X g este dată de funcţia EXCEL scrisă în celula B2 : = GEOMEAN
(A1:An) iar media armonică X a este dată de funcţia EXCEL scrisă în celula B3 : =
HARMEAN (A1:An) .

II. Mediana Me este acea valoare faţă de care jumătate din numărul valorilor de
sondaj sunt mai mici ca ea şi cealaltă jumătate din numărul valorilor de sondaj sunt mai mari
ca ea.
Aranjăm datele de sondaj în ordine crescătoare: x1 < x2 < … < xn.
1  
Dacă n = număr par avem Me  x k  x k 1  iar dacă n = număr impar avem
2  2 2 

Me  X k 1 .
2
Mediana Me este mai stabilă faţă de media X la valori de sondaj foarte mici faţă de
restul valorilor de sondaj, deoarece ia în calcul numărul de valori de sondaj nu şi mărimea
valorilor de sondaj.
În plus, SMA(X) = X1  X  ...  X n  X este minimă pentru X = Me.
Aici SMA este prescurtarea pentru suma modulelor abaterilor. Mediana primei
jumătăţi a datelor de sondaj crescătoare, se numeşte cuartila întâia Q1 . Me = Q2. Analog Q3
pentru a doua jumătate a datelor .

Dacă X1,…,Xn sunt depuse în celulele A1:An din coloana A în EXCEL,


mediana Me este dată de funcţia EXCEL scrisă în celula B4 :
= MEDIAN (A1:An) sau de funcţia EXCEL scrisă în celula B4 :
= QUARTILE (A1:An , 2 ) , quartila Q1 este dată de funcţia EXCEL
scrisă în celula B5 : = QUARTILE (A1:An , 1) iar quartila Q3 este dată
de funcţia EXCEL scrisă în celula B6 : = QUARTILE (A1:An , 3).

Media şi mediana au fost indicatori de poziţie pentru datele de sondaj.


81

Urmează indicatori de variabilitate pentru datele de sondaj.

III. Varianţa (dispersia)


2
 X 
2  xi   n 
VS 2

 x i  X     este variaţia pătratică totală SPA =
n 1 n 1
(xi - X )2 raportată la numărul gradelor de libertate GL = n – 1.
Datele de sondaj X1, …, Xn sunt independente dar satisfac o relaţie de dependenţă:
xi = n . X şi de aceea avem GL = n – 1 .
IV. Abaterea - standard
2
S  x i  X  este principalul indicator valoric al variabilităţii fiind o abatere
n 1
mijlocie a datelor de sondaj faţă de media lor X .
Calităţi ale abaterii-standard
1) Abaterea standard este mărginită (cuprinsă între abaterea minimă amin şi cea
maximă amax a datelor de sondaj faţă de media lor X .
Defecte ale abaterii-standard
2) Abaterea standard S este legată de o unitate de măsură (aceeaşi ca şi pentru media
X ) deci nu permite comparaţii între caractere.
Pentru comparaţii se poate folosi abaterea standard procentuală
a max  S
Sp   0;1.
a max  a min
3) Abaterea standard este sensibilă la înmulţirea sau împărţirea datelor de sondaj
conform teoremei 2.2.
4) Abaterea standard singură nu poate aprecia intensitatea variabilităţii datelor de
sondaj.

Dacă X1,…,Xn sunt depuse în celulele A1:An din coloana A în EXCEL


, variaţia pătratică totală SPA este dată de funcţia EXCEL scrisă în celula B7 : = DEVSQ
(A1 : An) , varianţa V este dată de funcţia EXCEL scrisă în celula
B8 : = VAR (A1:An) iar abaterea-standard S este dată de funcţia EXCEL scrisă
În celula B9 : = STDEV (A1:An ).
Valorile Ui = (Xi - X )/ S se numesc reduse sau normate. Avem :
M(Ui) = 0 şi V(Ui)= 1. Funcţia EXCEL pentru calculul valorilor reduse
are forma = STANDARDISE ( Xi , X , S ).
V. Coeficientul de variabilitate
S
c  100 este principalul indicator procentual al variabilităţii datelor de sondaj în
X
jurul mediei la X . El măsoară variabilitatea datelor luând ca unitate de măsură nu unitatea de
măsură a caracterului X ci media de sondaj X .
Calităţi ale coeficientului de variabilitate
82

a min
1) Coeficientul de variabilitate c este o valoare mărginită (cuprins între  100
X max
a max
şi  100 ).
X min
2) Coeficientul de variabilitate c nu are unităţi de măsuri, deci permite comparaţii
între caractere.
3) Coeficientul de variabilitate c poate aprecia cu ajutorul unor praguri intensitatea
variabilităţii datelor de sondaj în jurul mediei lor.
În raport de valorile coeficientului de variabilitate c avem cazurile:
a) Coeficientul de variabilitate c are o valoare mică. În acest caz variabilitatea datelor
de sondaj este mică, omogenitatea este mare şi media X este foarte bună;
b) Coeficientul de variabilitate c are o valoare mijlocie. În acest caz variabilitatea
datelor de sondaj este mijlocie, omogenitatea lor este mijlocie şi media X este bună;
c) Coeficientul de variabilitate c are o valoare mare. În acest caz variabilitatea datelor
este mare, omogenitatea este mică şi media X este satisfăcătoare.
De exemplu pentru agricultură cazurile precedente au forma:
a) c < 10%; b) c  (10%; 20]; c) c > 20%.
În cazul c) se pune problema existenţei unei cauze sistematice pentru variabilitatea
mare a datelor de sondaj.

Exemplu
Fie o populaţie statistică de plante de porumb la recoltarea pe suprafaţa de 1 ha cu
volumul populaţiei N = 75000 plante recoltabile.
Fie X = greutatea boabelor pe plantă la recoltare (g).
Efectuăm un sondaj de n = 10 plante reprezentative deci cota de reprezentare este
n
 1 : 7500 plante.
N
Datele de sondaj se aranjează în
ordine crescătoare în tabelul alăturat. Xi X i- X (Xi- X )2 Xi  X
Avem indicatorii de sondaj: S
500
I) X  50 g/plantă
10 40 -10 100 -1.43
II) Me = [48; 51] deci 42 -8 64 -1.14
Me = 49.5 g/plantă 45 -5 25 -0.71
448 45 -5 25 -0.71
III) S2   49.8 g 2
10  1 48 -2 4 -0.29
IV) S  49.8  7 g / plantă 51 1 1 0.14
7 54 4 16 0.57
V) C  14% 57 7 49 1.00
50 58 8 64 1.14
5.2.2. Cazul sondajului de volum 60 10 100 1.43
mare (n > 30) 500 0 448 -
83

În acest caz se face gruparea datelor de sondaj în clase de valori astfel: se fixează
numărul k de clase de valori care nu trebuie să fie nici prea mic, deoarece se şterg trăsături
esenţiale ale datelor de sondaj, nici prea mare, deoarece se pun în evidenţă trăsături
neesenţiale ale datelor de sondaj.
Acest număr k de clase de valori se poate calcula cu una din formulele k < 5 log n, k =
1 + 3.322 log n sau se folosesc recomandabil orientative de mai jos.

Volum sondaj (n) Nr. clase de valori (k)


30 – 40 5
41 – 60 6
61 – 80 7
81 – 100 8
101 – 125 9
126 – 150 10
151 – 175 11
176 – 200 12
201 – 400 13
401 – 600 14
601 – 800 15
801 – 1000 16
1001 – 2000 17
2001 – 3000 18
3001 – 4000 19
4001 – 5000 20
X max  X min
Lungimea unei clase de valori este  .
nr. clase de valori k
Centrul clasei de valori Ci , notat cu xi, este mijlocul clasei adică media aritmetică a
valorilor extremităţilor clasei Ci.
Centrul clasei xi aproximează toate valorile de sondaj în clasa Ci, fiind reprezentantul
acestor valori.
Frecvenţa absolută ni a valorilor de sondaj într-o clasă de valori Ci este numărul
datelor de sondaj care cad în clasa respectivă, valori aproximate prin centrul clasei xi.
Frecvenţa relativă (procentuală)fi a valorilor de sondaj într-o clasă de valori Ci este
ni
fi  . Alături de frecvenţele precedente se pot folosi frecvenţele cumulate calculate
n
astfel:
Frecvenţele absolute cumulate:
n*i = n1 + n2 + … + ni (1 < i < n)
Frecvenţele relative cumulate:
f*i = f1 + f2 + … + fi (1 < i < n)
Datele grupete se pot prezenta grafic prin histograme în raport cu sistemul de axe (Ci,
ni), poligonul frecvenţelor în raport cu sistemul de axe (xi, ni) şi respectiv cumulata în raport
  *
cu sistemul de axe  xi  ; ni  .
 2 
Toate aceste operaţii de grupare, tabelare şi reprezentare grafică se pot face cu
programul C1GRUP sau cu EXCEL.
84

Pentru datele de sondaj grupate, indicatorii de sondaj de la punctele 5.2 I) – V) capătă


forma:
I) Media de sondaj:
1 k k
X   n i x i   fi x i
n i 1 i 1
II) Mediana de sondaj:

Me se determină grafic cu ajutorul cumulatei fiind abscisa de pe axa xi 
2
* n
corespunzătoare ordonatei n i  ;
2

III) Modul de sondaj:


Clasa modală Mo este acea clasă Ci cu ni maxim. Modul Mo se determină grafic în clasa
modală cu ajutorul histogramei :
85

Spre deosebire de media X care dă tendinţa centrală a datelor de sondaj ,modul Mo dă


tendinţa sa principală ,numindu-se din acest motiv , valoare dominantă sau principală.
Există date de sondaj cu mai multe moduri(plurimodale).
Dacă datele de sondaj negrupate X1,…,Xn sunt depuse în celulele A1: An din
coloana în EXCEL şi cel puţin două din aceste valori sunt egale ,modul Mo este
dat de funcţia EXCEL scrisă în celula B10 : = MODE (A1:An ).

IV) Abaterea standard de sondaj:

1 k 2 n k 2
S  n X
i i  X   fi Xi  X
n 1i1 n 1i1
Datorită grupării în clase de valori şi a aproximării valorilor dintr-o clasă cu centrul
2
clasei xi, S suferă o eroare care se înlătură prin corecţia Sheppard S '  S 2  unde l este
12
lungimea claselor de valori.
V) Coeficientul de variabilitate de sondaj:
S
c  100
X
VI) Coeficientul de asimetrie de sondaj:
3
1 k X X  1 k 3
A   ni  i    niU i
n i 1  S  n i 1

Acest coeficient evaluează deplasarea pe orizontală a poligonului frecvenţelor faţă de


graficul funcţiei de repartiţie N( X , S) conform figurii :

VII) Coeficientul de boltire de sondaj:

4
1 k X X  1 k 4
B   ni  i    niU i
n i 1  S  n i 1

Acest coeficient evaluează deplasarea pe verticală a poligonului frecvenţelor faţă de


graficul funcţiei de repartiţie N( X , S) conform figurii :
86

Dacă datele de sondaj negrupate X1,…,Xn sunt depuse în celulele A1:An


din coloana A în EXCEL, coeficientul de asimetrie ajustat(numit skewness):

n2
Skew  .A
(n  1)(n  2)
este dat de funcţia EXCEL scrisă în coloana B11 : = SKEW(A1:An)
iar coeficientul de boltire ajustat(numit Kurtozis) :

n 2 (n  1) 3(n  1)2
Kurt  .B 
(n  1)(n  2)(n  3) (n  2)(n  3)
este dat de funcţia EXCEL scrisă în coloana B12 : = KURT(A1:An).

Se numeşte structură de date cu k componente ansamblul de numere


f1,…,fk care îndeplinesc condiţiile :
0≤ fi ≤ 1 (1≤ i ≤ k ) şi f1 +…+ fk = 1
(f1,…,fk) se numeşte vectorul structurii .

Exemple
1)Frecvenţele relative f1,…,fk ale datelor de sondaj de volum mare,grupate în clasele de
valori C1,…,Ck cu centrele de clase x1,…,xk definesc structura sondajului pe clase de
valori .
2) Fie k ramuri ale unei unităţi economice şi fie C1,…,Ck cheltuielile totale
(productive şi neproductive) anuale ale ramurilor.Cheltuielile totale anuale
ale întregii unităţi sunt C = C1+…+Ck
Numerele f1=C1/ C ,…,fk = C1/ C definesc structura de cheltuieli a unităţii pe ramuri .
In mod analog , fie V1,…,Vk veniturile totale anuale ale ramurilor şi fie
V = V1+…+Vk total anual al unităţii .
Numerele f1 = V1/ V ,…, fk = Vk/ V definesc structura de venituri a
unităţii pe ramuri .
Concentrarea unei structuri de date este tendinţa de creştere a ponderii
fi a unei componente în detrimentul celorlalte,inclusiv micşorarea numărului k de
componente .
Concentrarea structurii este maximă dacă fi = 1 şi fj = 0 pentru j≠ i.
Diversificarea structurii de date este tendinţa de egalizare valorică a
ponderilor f1,…,fk ale celor k componente ale structurii, inclusiv prin mărirea numărului k de
componente .
87

Diversificarea structurii este maximă dacă f1=…= fk = 1/k .


Media valorilor f1,…,fk este f‾ = 1/k iar abaterea-standard a valorilor
f1,…,fk este :

S
f i 1
deoarece  f i  1
k 1
Pentru concentrarea maximă avem S= 1 / (k)1/2 iar pentru diversificarea
maximă avem S = 0 .
Abaterea-standard corectată :


k  fi 2  1
S  k .S   [0;1]
k 1
este un indicator al concentrării structurii pe componente şi se poate exprima în
procente.
Entropia structurii este dată de relaţia :

k
H   f .og
i=1
i f
2 i

Valorile lui - f.log2f se pot lua din tabela 16 din Anexă .


Avem H=0 pentru concentrarea maximă şi H= log2 k pentru diversificarea maximă .
Entropia ajustată :

k
1
H    fi .og 2 fi
og 2 k i 1

este indicator al diversificării structurii pe componente şi se poate


exprima în procente .
Fie două structuri de date cu vectorii de structură (f1,…,fk) şi (g1,…,gk)
Mediile lui f1,…,fk şi respectiv g1,…,gk sunt f = g = 1/k .
Legătura între cele două structuri se măsoară prin coeficientul de corelaţie
liniară dat de teorema 10.2 :
k  f i gi  1
R  [1;1]
(k  f i 2  1)(k  g i2  1)
Conform teoremei 10.1, coeficientul de regresie liniară între cele două
structuri are forma :
k  fi gi  1
B1 
k  fi 2  1
iar termenul liber al regresiei este :
88

2
1  B1  f i   fi g i
B0  g  B1 . f  
k k  fi 2  1
Conform teoremei 2.9, dacă | R | =1 avem legătura funcţională liniară între
cele două structuri ,dată de relaţia : g = B0 + B1.f
Avem R=1 dacă B1>0 şi R=-1 dacă B1<0 .
Dacă R = 0 ,cele două structuri nu sunt corelate liniar .
Exemplu
Dacă (f1,…,fk) este structura de venituri sau cheltuieli a unei unităţi
economice în anul de bază şi (g1,…,gk ) este structura de venituri sau cheltuieli a aceleiaşi
unităţi în anul curent , R măsoară gradul de stabilitate
a structurii în timp .
Dacă caracterul X are numai valori întregi, datele de sondaj de volum mare (n > 30) se
pot grupa pe valori distincte Xi cu frecvenţele absolute ni sau se poate alege un număr de
clase k astfel ca lungimea l a claselor să fie număr întreg deci şi limitele claselor să fie numere
întregi.
Exemplu
Fie o populaţie statistică de plante de porumb la recoltare de pe 1 ha cu volumul
populaţiei N = 75000 plante recoltabile. Pentru a studia greutatea boabelor pe plantă X în
grame, efectuăm un sondaj reprezentativ de n = 50 plante deci cota de reprezentare
n 50
  1 : 1500 plante.
N 75000
Date de sondaj în grame:
50; 45; 40; 48; 47; 53; 49; 56; 58; 60; 42; 48; 49; 51; 54; 53; 46; 49; 48; 46; 55; 59;
52; 44; 48; 43; 49; 51; 50; 52; 44; 55; 43; 49; 47; 50; 54; 56; 59; 49; 48; 51; 50; 51; 47; 46;
42; 53; 51.
Să se grupeze datele în k = 5 clase de valori, să se reprezinte grafic histograma,
poligonul frecvenţelor, cumulata şi să se calculeze indicatorii statistici de la punctul I) – VII).
Soluţie
Numărul de clase este k = 5 , lungimea unei clase de valori este :
60  40
  4g .
5
Clase Centre clase Frecvenţe ni Frecvenţe n*i Frecvenţe Frecvenţe f*i
Xi fI
Sub 44 g 42 g 5 plante 5 plante 0.10 0.10
[44 – 48 g) 46 9 14 0.18 0.28
[48 – 52 g) 50 21 35 0.42 0.70
[52 – 56 g) 54 9 44 0.18 0.88
peste 56 g 58 6 50 0.12 1.00
Graficele sunt:

Histograma :
89

Poligonul frecvenţelor :

Cumulata :
90

I) Media de sondaj:
1
X   5  40  9  46  21  50  9  54  6  58   50.16 g/plantă
50
II) Mediana de sondaj Me = 50 g
III) Modul de sondaj Mo = 50 g
IV) Abaterea standard de sondaj:
1 2 2 2 2 2
S 5 42 50.16  9 46 50.16  21 50  50.16  9 54  50.16  6 58 50.16  =
49  
4
= 4.5 g/plantă. Corecţia Shepard: S '  S 2   4.46 g
12
4.5
V) Coeficientul de variabilitate de sondaj: C  9%
50.16
VI) Coeficientul de asimetrie de sondaj:
1  3 3 3 3 3
A 5 42 50.16 9 4650.16 21 5050.16 9 5450.16 6 5850.16  ==0.008
3 
504.5 
VII) Coeficientul de boltire de sondaj:

1  4 4 4 4 4
B 5 4250.16 9 4650.16  21 5050.16 9 5450.16 6 5850.16  =2.41
4 
504.5 
VIII) Coeficientul de concentrare de sondaj:


5  0.102  0.182  0.42 2  0.182  0.122   1
S   28.6 %
5 1
Desigur indicatorii X , Me, S, c puteau fi calculaţi şi din cele n = 50 valori de sondaj
înainte de gruparea datelor.
Dacă X este însuşire calitativă (atributivă), facem convenţia:
91

1, Exemplarul i are însuşirea X


xi  
0, în rest
Efectuăm un sondaj de volum n deci datele de sondaj vor fi un număr de n cifre egale
cu 0 sau cu 1. Fie k numărul cifrelor Xi = 1 (1 < k < n). Media de sondaj devine
k
f  0;1 , numindu-se frecvenţă de sondaj.
n
Indiferent de volumul de sondaj n, datele de sondaj se împart în 2 clase:
C = {xi/xi = 1} cu k valori şi C = {xi/xi = 0} cu n – k valori.
Exemplu
Într-un miniincubator avem o populaţie statistică de N = 1000 ouă. Efectuăm un
sondaj reprezentativ de n = 50 ouă şi găsim k = 6 ouă neeclozionate. Să se calculeze frecvenţa
de sondaj a ouălor neeclozionate.
Soluţie
k 6
f   12%
n 50
Exemple de însuşiri calitative (atributive) în agricultură
- ecloziune ouă culoare, culoare ouă, rezistenţa la manipulare ouă;
- viabilitate purcei sugari, pui de o zi;
- stare de gestaţie la animale;
- stare de profitabilitate a unei societăţi agricole.

5.3. Indicatori de sondaj de evoluţie

5.3.1. Cazul măsurătorilor simple în timp

Fie o populaţie statistică pe care o studiem din punct de vedere al însuşirii cantitative
X.
Dacă însuşirea X ia valori întregi, datele unui sondaj extras din populaţie la
momentele de timp t1, t2, …, tn sunt valori instantanee x1, …, xn măsurate în acele momente
de timp.
Dacă însuşirea X ia valori reale, datele unui sondaj extras din populaţie în intervalele
de timp [t1, t2), [t2, t3), …, [tn-1, tn] sunt valori medii x1, …, xn măsurate în acele intervale de
timp cu lungimile t2-t1, t3-t2, …, t n – t n – 1 .
Exemplu
X = efectivul anual de vaci al unei ferme zootehnice se măsoară prin valori instantanee
(la 31 decembrie al anului calendaristic).
X = producţia anuală de lapte al vacilor dintr-o fermă zootehnică se măsoară prin
valori medii pe perioada 1 ianuarie – 31 decembrie a anului calendaristic sau pe perioada
medie de lactaţie normală de 308 zile.
Măsurătorile sunt echidistante dacă t2–t1 = t3–t2 = … = tn-tn-1 şi neechidistante în caz
contrar.
Exemplu de măsurători echidistante
Producţia de lapte a vacilor se controlează echidistant din 28 în 28 zile astfel că într-o
lactaţie normală de 308 zile se efectuează 11 controale ale producţiei de lapte.
Prezentarea grafică a datelor de sondaj de evoluţie instantanee se face prin poligonul
valorilor în raport cu axele (ti, xi) iar a datelor de sondaj de evoluţie se face prin cronograma
în raport cu axele ([ti, ti+1), xi).
92

Indicatori statistici de sondaj de evoluţie

I) Media cronologică
Dacă X se măsoară prin valori instantanee x1, …, xn la momentele de timp t1, …, tn
avem:
x t  t1   x 2 t 3  t 2   ...  x n 1 t n  t n 1 
(1) X C  1 2
t n  t1
Dacă X se măsoară prin valori medii x1, …, xn în intervalele de timp [t1, t2), [t2, t3), …,
[tn-1, tn] avem:
x1  x 2
t 2  t1   x 2  x 3 t 3  t 2   ...  x n 1  x n t n  t n 1 
(2) X m  2 2 2
t n  t1
În cazul măsurătorilor echidistante în timp, avem t2 - t1 = t3 – t2 =, …,= t n – t n – 1 = d
şi t n – t1 = (n – 1 ).d deci :

X1  X 2  ...X n 1
(3) X C  respectiv:
n 1

X1 X
 X 2  ...  X n 1  n
(4) X m  2 2
n 1
II) Ritmul mediu valoric(absolut) de evoluţie
Abaterile valorice ale datelor de sondaj consecutive sunt D1 = X2 – X1, …,
Dn – 1 = X n – X n – 1 . Ritmul mediu valoric de evoluţie al datelor de sondaj va fi:

(5) D 
x 2  x1 t 2  t1   x 3  x 2 t 3  t 2   ...  x n  x n 1 t n  t n 1 
t n  t1

În cazul măsurătorilor echidistante avem t2 = t1 + r, t3 = t1 + 2r, …, tn = t1 + (n – 1)r


deci:
X n  X1
(6) D 
n 1
Valorile aşteptate ale datelor de sondaj de evoluţie formează progresia aritmetică cu
raţia D:
X1, X1 + D, …, X1 + (n – 1)D
Aceste valori aşteptate X1 + j.D se apropie de cele observate Xj atunci când
caracterul X evoluează numai crescător sau numai descrescător în timp şi abaterile
valorice ale datelor de sondaj consecutive D1 ,…,D n – 1 sunt toate pozitive sau toate
negative şi apropiate între ele ca valoare (caracterul X evoluează liniar în timp).
In caz contrar se ajustează aceste abateri valorice D1,…,D n – 1 cu o funcţie de regresie
neliniară în raport cu timpul ca în secţiunea 10.3
Pe durata a m perioade de timp, variaţia valorică a caracterului X va fi
93

P
P = x1 + (m – 1)D – x1 = (m – 1) D deci X variază valoric cu cantitatea P. în m  1
D
perioade de timp.
Dacă notăm x1 + … + xm = Q avem:

mm  1
mX1  D  Q de unde
2
D  2X1  D  2X1   8DQ
m
2D
adică numărul de perioade de timp în care se acumulează cantitatea finală Q a
caracterului X respectiv în care se consumă cantitatea iniţială Q a caracterului X.

III) Ritmul mediu procentual(relativ) de evoluţie


Abaterile procentuale ale datelor de sondaj consecutive sunt:
X X X
I1  2 , I 2  3 , ..., I n - 1  n
X1 X2 X n 1
Ritmul mediu procentual de evoluţie a datelor de sondaj va fi:
1
 X t2 t1  X t3 t2  Xn 
t n  t n  1 t t
n 1
2 3
(7) I        ...    
 X 1   X2   X n1  
Dacă logaritmăm relaţia precedentă, obţinem:

(8) log I 
 logX 2  log X 1  t2  t1   ...   logX n  log X n 1  tn  tn 1 
tn  t1
deci logaritmul lui I este ritmul mediu valoric de evoluţie al valorilor de sondaj
logaritmate.
Dacă măsurătorile sunt echidistante avem:
t2 - t1 = t3 – t2 = … = t n – t n – 1 = d iar tn – t1 = (n – 1).d deci avem :
log X n  log X 1
log I  adică :
n 1
1
 X  n1
(9) I   n 
 X1 
Valorile aşteptate ale datelor de sondaj de evoluţie formează o progresie geometrică cu
raţia I: X1, X1.I, …, X1 .I n – 1
Aceste valori aşteptate X1.Ij se apropie de cele observate Xj atunci când
caracterul X evoluează numai crescător sau numai descrescător în timp şi abaterile
procentuale ale datelor de sondaj consecutive, notate cu I1,…,I n – 1 sunt toate
supraunitare sau toate subunitare şi apropiate între ele ca valoare (caracterul X are o
evoluţie exponenţială în timp ).
In caz contrar se ajustează aceste abateri procentuale I1,…,I n – 1 cu o funcţie de
regresie neliniară in raport cu timpul ca în secţiunea 10.3
Pe durata a m perioade de timp variaţia procentuală a lui X va fi
X I m 1 log P
P 1  I m 1 deci X variază procentual cu valoarea P în m   1 perioade de timp.
X1 log I
94

I m 1
Dacă notăm X1 + … + Xm = Q avem: X 1  Q de unde
I 1
 Q 
log  I  1  1
 X1 
m adică numărul de perioade de timp în care se acumulează
log I
cantitatea finală Q a valorilor caracterului X respectiv în care se consumă cantitatea iniţială Q
a valorilor caracterului X.
Exemplu
Fie X = greutatea porcilor la îngrăşat (kg).
Fie ti vârsta în zile a porcilor.
Se fac n = 10 controale echivalente din 28 în 28 zile.

ti 28 56 84 112 140 168 196 224 252 280

xi(g/zi) 3 12 26 42 60 78 94 107 117 120

Se cer X , D, I.
Soluţie
1 1
X 1  X 2  ...  X n 1  X n
X  2 2  66.4 kg
n 1
X  X1 log X n  log X 1
D n  13 kg; log I   0.178 deci I = =100.178 =1.57
n 1 n 1

5.3.2. Cazul măsurătorilor multiple în timp

Fie o populaţie statistică pentru care studiem evoluţia caracterului X.


Extragem m exemplare independente din populaţie pe care măsurăm caracterul X în n
momente de timp t1, …, tn.
Datele de sondaj au forma:

Timp t1 t2 …………….……..tn Medii cronologice


Nr. X Ci
1 x11 x12 …………………x1n X C1
2 x21 x22 …………………x2n X C2
… ……………………………. …
m xm1 xm2 ……………….. xmn
X Cm
Medii de X 1 X 2 ….………… X n X
sondaj X j XC
Pentru repartiţia caracterului X în sondajul cu m exemplare avem la momentul tj
1 m
media de sondaj X j   x ij ; (1 < j < n).
m i 1
Pe întreaga perioadă de timp [t1, t n] avem indicatorii globali:
- media cronologică globală :
95

1 1
XC   X1  X 2 t 2  t1   ...  1 X n 1  X n t n  t n 1 
t n  t1  2 2 
- ritmul mediu valoric global:
1
D X 2  X1 t 2  t1   ...  X n  X n 1 t n  t n 1 
t n  t1
- ritmul mediu procentual global I unde :
1
log I   log X 2  log X 1   t2  t1   ...   log X n  log X n 1   tn  tn 1  
tn  t1  
Pentru evoluţia caracterului X în timp avem pentru exemplarul de sondaj numărul i
media de evoluţie:
1 1 1
X Ci    X i1  X i 2  t 2  t 1   ...  X i, n 1  Xin t n  t n 1 
t n  t1  2 2 

; (1 < i < m).


Pe ansamblul întregului sondaj avem indicatorii de sondaj globali:
1 m
- media de sondaj globală: X   X Ci
m i 1
1 m
- abaterea – standard de sondaj globală: S   X Ci  X 2
m  1 i 1
S
- coeficientul de variabilitate de sondaj global: C   100 (%)
X
Exemplu
X = greutatea porcilor la îngrăşat (kg).
Fie tj numărul de zile trecute de la data fătării porcilor până la data controlului
numărul j.
Se fac n = 10 controale echidistante de 28 zile la m = 5 porci. Data de sondaj:

Medii
tj 28 56 84 112 140 168 196 224 252 280 cronologice
Repetiţia C X Ci
1 3 12 26 42 60 78 94 104 117 120 66.4
2 3 13 27 43 61 78 94 106 115 118 66.4
3 3 12 25 41 59 77 94 109 118 122 66.4
4 4 13 27 43 61 77 92 104 112 115 65.4
5 3 12 25 41 59 78 96 111 121 125 67.4
Medii sondaj 3.2 12.4 26 42 60 77.6 94 107.4 116.6 120
X =66.4
Xj X C=66.4
Pe baza datelor din tabel şi a mediilor de la capetele de tabel să le calculeze indicatorii
de repartiţie şi evoluţie globali.
96

Soluţie
X1 X
 X 2  ...  X n 1  n
Media cronologică globală: X C  2 2  66.4 kg.
n 1
X n  X1
Ritmul mediu valoric global: D  13 kg.
n 1
log X n  log X 1
Ritmul mediu procentual global: log I   0.175
n 1
deci I = 100.175 = 1.49
1
Media de sondaj globală: X 
n

X C1  ...  X C n  66.4 kg. 
Abaterea standard de sondaj globală:
1  2 2
S
n 1   
X C1  X  ...  X C n  X  0.47 kg 
S
Coeficientul de variabilitate de sondaj global: C   100  0.7%
X

5.3.3. Indicatori de evoluţie pe grupe

Dacă datele de sondaj de evoluţie sunt numeroase, ele pot fi grupate în clase de valori
pe perioade mai mari de timp.
De exemplu măsurătorile zilnice se pot grupa pe săptămâni câte 7 sau pe decade, sau
pe luni câte 30 sau pe trimestre câte 90, etc.
Fie datele de sondaj de evoluţie x1, …, x n culese la momentele de timp t1, …, t n unde
n este un număr relativ mare.
n
Dacă m este un divizor al lui n şi p  grupăm datele de evoluţie în clasele: C1 =
m
{x1, …, xm}, C1 = {xm + 1, …, x 2 m}, …,Cp = {x(p – 1 ) m + 1, …, x p m}
Indicatorii de sondaj de evoluţie ai claselor se numesc indicatori de evoluţie pe
grupe.
Pentru clasele Cj = {x i + 1, …, x i + m} cu i = 0, m, 2m, …, (p-1)m şi
i
j  1 1,2,..., p cu valori de sondaj culese la momentele t i + 1, …, t i + m avem:
m
- Mediile pe grupe:

1 1 1
XC j    xi 1  xi2  ti 2  ti 1   ...   xi m1  xim  tim  ti m1 
ti  m  ti 1  2 2 

- ritmurile medii valorice pe grupe Dj :

1
Dj    xi  2  xi 1  ti 2  ti 1   ...   xi m  xi m 1  ti  m  ti m 1  
ti  m  ti 1 

- ritmurile medii procentuale pe grupe Ij unde :


97

1
log I j   log xi 2  log xi 1  ti 2  ti 1   ...   log xim  log xi m1  ti m  tim1  
tim  ti1 
Exemplu
Fie X = greutatea zilnică a puilor de carne (g).
Avem date de sondaj în n = 49 zile date mai jos.
Să se grupeze datele pe săptămâni (câte 7) şi să se calculeze indicatorii de sondaj de
evoluţie pe grupe .
Date de sondaj: C1 = {2.4; 9.3; 20.8; 36.4; 56.2; 79.8; 107.1}
C2 = {137.9; 172.1; 209.4; 249.7; 292.7; 338.3; 386.3}
C3 = {436.4; 488.6; 542.6; 598.1; 655.1; 713.3; 722.5}
C4 = {832.5; 893.1; 954.1; 1015.3; 1076.5; 1137.5; 1198.1}
C5 = {1258.1; 1317.2; 1375.4; 1432.2; 1487.7; 1541.4; 1593.3}
C6 = {1643.1; 1690.5; 1735.4; 1777.6; 1816.8; 1852.9; 1885.5}
C7 = {1914.6; 1939.7; 1960.8; 1977.6; 1989.9; 1997; 2000}
Indicatorii de evoluţie pe grupe ai celor 7 clase de greutăţi, grupate pe săptămâni sunt
date de tabelul:
Săptămâna X Cj Dj Ij
(j, j+m-1)
[1 – 7] 42.875 17.45 0.633
[8 – 14] 254.883 41.40 0.426
[15 - 21] 596.192 47.68 0.395
[22 - 28] 1015.300 60.93 0.387
[29 - 35] 1429.933 55.87 0.381
[36 - 42] 1772.917 40.40 0.375
[43 - 49] 1970.450 14.23 0.370
TOTAL X =1011.454 D=41.62g I=0.422

Dacă X este însuşire calitativă (atributivă) şi efectuăm un sondaj de evoluţie, cu


convenţia:
1, exemplarul are la momentul t i însuşirea X
xi  
0, în rest
datele de sondaj vor avea forma unui şir de cifre 0 şi 1.
Media cronologică se va numi frecvenţa medie de sondaj de evoluţie, notată cu
1 n
f c  [0, 1] şi se va calcula cu formula f c   X i , fiind vorba de valori
n i 1
instantanee.

5.3.4 Indici statistici

În secţiunea precedentă am văzut că pentru un caracter X cu valorile diferite X0 , X1


putem calcula :
- variaţia absolută : D(X)=X1 – X0 ;
- variaţia relativă : I(X)=X1 / X0
- variaţia procentuală : R(X)=D(X) / X0 .
În limbaj economic diferenţa D se numeşte spor : X1=X0 +D(X) , raportul I se
numeşte indice : X1=X0 . I(X) iar mărimea R se numeşte ritm : X1=X0 +X0.R(X) .
Variaţia relativă este superioară celei absolute deoarece nu are unităţi de măsură iar
98

variaţia procentuală se calculează uşir pe baza celei relative : R(X)=I(X) – 1 .

I. În multe situaţii întâlnim caractere Z compuse din produse ale altor caractere X,Y :
Z=X.Y cu valori diferite : Z0=X0.Y0 respectiv Z1=X1.Y1 .
Exemple:
- Cheltuielile cu o resursă = consumul de resursă x costul unităţii de resursă ;
- Venitul din vânzarea unui produs agricol = producţia fizică x preţul de vânzare ;
- Venitul dim muncă = productivitatea muncii(venit pe muncitor) x nr. muncitori .
În acest caz putem calcula :
D(Z)=Z1- Z0 ; I(Z)= Z1/ Z0 ; R(Z)=D(Z) / Z0 .
Avem relaţiile :
I(Z)=I(X.Y)=I(X).I(Y) ; R(Z)=R(X.Y)=I(X).I(Y)-1
Avem şi mărimile :
- produsul mediu : PM(Z) = Z0 = X0.Y0
- produsul marginal : PD(Z) = (X1- X0).(Y1 – Y0) = D(X).D(Y)
- elasticitatea produsului : EP(Z) = PD(Z) / PM(Z) = R(X).R(Y)

II. În multe situaţii întâlnim caractere Z compuse din rapoarte(rate) ale altor caractere
X,Y : Z=X /Y cu valori diferite : Z0=X0 / Y0 respectiv Z1=X1 / Y1 .
Exemple:
- Rata profitului = Profit / Cheltuieli ;
- Costul unităţii de produs = Cheltuieli cu produsul / Producţia fizică ;
- Rata şomajului = Număr şomeri / Număr persoane active .
În acest caz putem calcula :
D(Z)=Z1 - Z0 ; I(Z)= Z1/ Z0 ; R(Z)=D(Z) / Z0 .
Avem relaţiile :
I(Z)=I(X /Y)=I(X) / I(Y) ; R(Z)=R(X / Y)=I(X) /I(Y)-1
Avem şi mărimile :
- rata medie : PM(Z) = Z0 = X0 / Y0
- rata marginală : PD(Z) = (X1- X0) / (Y1 – Y0) = D(X) / D(Y)
- elasticitatea ratei : EP(Z) = PD(Z) / PM(Z) = R(X) / R(Y)

Indicii statistici sunt numere relative rezultate din compararea valorilor unui indicator
statistic la diferite momente de timp,în locuri diferite sau în categorii diferite în raport cu un
criteriu.
Indicii calculaţi la momente diferite de timp, se numesc indici ai dinamicii.
Indicii calculaţi în locuri diferite, se numesc indici teritoriali.
Indicii calculaţi în categorii diferite în raport cu un criteriu,se numesc indici calitativi.
În calculul indicilor se aleg două momente de timp/locuri/categorii :
1) Momentul de timp/locul/categoria de bază (de referinţă) , notată cu 0 .
2) Momentul de timp/locul/categoria curentă ,notată cu 1
Pentru elemente omogene se calculează indici elementari(individuali) iar
pentru elemente neomogene se calculează indici sintetici (de grup) .
Calităţi şi defecte ale indicilor
1. Sunt mărimi mărginite pozitive.
2. Nu au unităţi de măsură deci se pot compara între ei.
3. Nu sunt sensibili la înmulţirea şi împărţirea datelor.
4. Indicii sintetici se pot calcula numai pentru cheltuieli şi venituri .
Exemplul 1
99

Fie trei resurse R1 (motorină în litri/ha ) , R2 (îngrăşăminte chimice NPK în Kg/ha ) şi R3


(apă de irigaţie în m3/ha ).
Baza este anul 2000 iar anul curent este anul 2003.
Qi (unităţi de resursă/ha ) este consumul de resursă Ri ,Ci (lei/unitate de resursă ) este
costul resursei Ri iar CHi=Qi .Ci (milioane lei/ha) este suma cheltuită cu resursa Ri .

Consumuri Qi Costuri Ci Cheltuieli CHi= QiCI


Resurse
Bază Curent Bază Curent Qi0Ci0 Qi0Ci1 Qi1Ci0 Qi1Ci1
Qi0 Qi1 Ci0 Ci1
R1 120 110 12000 18000 1.44 2.16 1.32 1.98
R2 210 220 6000 8000 1.26 1.68 1.32 1.76
R3 1000 800 300 500 0.30 0.50 0.24 0.40
Total 18300 26500 3.00 4.34 2.88 4.14

A. Indici individuali :
- pentru consumuri :
IQ (R1) =Q11 / Q10 =110 / 120 = 0.92
IQ (R2) = Q21 / Q20 = 220 / 210 = 1.05
IQ (R3) = Q31 / Q30 = 800 / 1000 = 0.80
IQ = [IQ(R1). IQ(R2). IQ(R3)]1 / 3 = 0.916

- pentru costuri :
IC (R1 ) = C11 / C10 = 18000 / 12000 = 1.50
IC (R2) = C21 / C20 = 8000 / 6000 = 1.33
IC (R3) = C31 / C30 = 500 / 300 = 1.60
IC = [IC(R1). IC(R2). IC(R3)]1 / 3 = 1.494

- pentru cheltuieli :
ICH (R1) = (Q11C11) / (Q10C10) = 1.98 / 1.44 = 1.375
ICH (R2) = (Q21C21) / (Q20C20) = 1.76 /1.26 = 1.40
ICH (R3) = (Q31C31) / (Q30C30) = 0.40 /0.30 = 1.33
ICH = [ICH(R1). ICH(R2). ICH(R3)]1 / 3 = 1.368

A) Indici sintetici pentru cheltuieli ca indici agregaţi :


1) Indicele total :
IT (CH)= (ΣQi1Ci1) / (ΣQi0Ci0) = 4.14 / 3.00 = 1.38
2) Indicele Laspeyres :
- pentru consumuri :
IL(Q) = (ΣQi1Ci0) / (ΣQi0Ci0) = 2.88 / 3.00 = 0.96
- pentru costuri :
IL(C) = (ΣQi0Ci1) / (Qi0Ci0) = 4.34 / 3.00 = 1.45
3) Indicele Paasche :
- pentru consumuri :
IP(Q) = (ΣQi1Ci1) / (Qi0Ci1) = 4.14 / 4.34 = 0.95
- pentru costuri :
IP(C) = (Qi1Ci1) / (Qi1Ci0) = 4.14 /2.88 = 1.44
4) Indicele Englewood :
- pentru consumuri :
100

IE(Q) = [ΣQi1(Ci0 + Ci1) ] / [ΣQi0(Ci0 + Ci1) ] = ( ΣQi1Ci0+ ΣQi1Ci1) / (ΣQi0Ci0 + ΣQi0Ci1)


= (2.88 + 4.14 ) / (3.00 + 4.34 ) = 0.96
- pentru costuri :
IE(C) = [Σ(Qi0+ Qi1)Ci1] / [Σ(Qi0 + Qi1)Ci0] = ( ΣQi0Ci1+ ΣQi1Ci1) / (ΣQi0Ci0 + ΣQi1Ci0)
=(4.34 + 4.14) / (3.00 +2.88) = 1.44
5) Indicele Sidgwik – Drobisch :
- pentru consumuri :
ISD(Q) = [ IL(Q) + IP(Q) ] /2 = (0.96 +0.95) / 2 = 0.955
- pentru costuri :
ISD(C) = [ IL(C) + IP(C) ] /2 = (1.45 + 1.44) / 2 = 1.445
6) Indicele Fisher :
- pentru consumuri :
IF(Q) = [ IL(Q).IP(Q) ]1/2 = 0.955
- pentru costuri :
IF(C) = [ IL(C).IP(C) ]1/2 = 1.455

Observaţii :
i) Indicele Laspeyres este medie aritmetică ponderată a indicilor individuali I(Ri) cu
ponderile : Ui = (Qi0Ci0) / ( ΣQi0Ci0) deci Σ Ui = 1.
- pentru consumuri :
IL(Q) = Σ IQ(Ri).Ui
- pentru costuri :
IL(C) = Σ IC(Ri).Ui
ii) Indicele Paasche este medie armonică ponderată a indicilor individuali I(Ri)
cu ponderile : Vi = (Qi1Ci1) / (Σ Qi1Ci1) deci ΣVi = 1 :
- pentru consumuri :
[ 1 / IP(Q) ] = Σ [ 1 / IQ(Ri ) ]. Vi
- pentru costuri :
[ 1 / IP(C) ] = Σ [ 1 / IC(Ri ) ]. Vi
iii) Indicele total este produsul indicilor Laspeyres şi Paasche :
IT (CH)= IL(Q).IP(C) = IL(C).IP(Q)

B) Indicii sintetici pentru cheltuieli ca rapoarte de medii :


7) Indicele cu structură variabilă :
ISV = [ (ΣQi1Ci1) / (ΣCi1) ] : [ (ΣQi0Ci0) / (ΣCi0) ] = (4.14 / 26500) : (3.00 / 18300) =
0.95
8) Indicele cu structură fixă :
ISF = [ (ΣQi1Ci1) / (ΣCi1) ] : [ (ΣQi0Ci1) / (ΣCi1) ] = (4.14 / 26500) : (4.34 / 26500) =
0.95
9) Indicele variaţiei structurii :
IVS = [ (ΣQi0Ci1) / (ΣCi1) ] : [ (ΣQi0Ci0) / (ΣCi0) ] = (4.34 / 26500) : (3.00 / 18300) = 1

Observaţii :
iv) Pentru indicii 7) - 9) avem relaţia : ISV = ISF.IVS
v) Cu notaţiile Wi0 = Ci0 / (ΣCi0) deci ΣWi0 = 1 respectiv Wi1 = Ci1 / (ΣCi1) deci ΣWi1 = 1 ,
indicii 7) - 9) capătă forma de indici agregaţi :
ISV = (ΣQi1Wi1) / (ΣQi0Wi0) analog cu indicele total IT de la punctul 1)
ISF = (ΣQi1Wi1) / (ΣQi0Wi1) analog cu indicele Paasche IP(Q) de la punctul 3)
IVS = (ΣQi0Wi1) / (ΣQi0Wi0) analog cu indicele Laspeyres IL(C) de la punctul 2)
101

Cheltuielile CH sunt un indicator complex bifactorial de forma CH=Q.C


Variaţia cheltuielilor în timp este absolută :Δ(CH)=ΣQi1Ci1 - ΣQi0Ci0
sau relativă : IT(CH) = (ΣQi1Ci1) / ΣQi0Ci0
Aceste variaţii absolute sau relative , se pot descompune în componente cu
metoda restului/câtului nedescompus .
Variaţiile absolute sunt :
Δ(CH)=ΣQi1Ci1 - ΣQi0Ci0 = 1.14
Δ(Q)=ΣQi1Ci0 - ΣQi0Ci0 = - 0.12
Δ(C)=ΣQi0Ci1 - ΣQi0Ci0 = 1.34
Δ(Q∩C)=( ΣQi1Ci1 - ΣQi1Ci0 ) - ( ΣQi0Ci1 - ΣQi0Ci0 ) = - 0.08
Verificare : Δ(CH) = Δ (Q) + Δ (C) + Δ ( Q∩C )

Coeficienţii de importanţă pentru repartizarea restului nedescompus


Δ ( Q∩C ) în mod proporţional cu influenţa independentă a factorilor ,vor fi:
α (Q) = Δ(Q) / (Δ(Q) + Δ( C )) = - 0.098
α (C) = Δ(C) / (Δ(Q) + Δ( C )) =1.098
deci α(Q) + α ( C ) = 1
Recalculăm variaţiile absolute astfel :
Δ*(Q) = Δ(Q) + α(Q).Δ(Q∩C) = - 0.11
Δ*(C) = Δ(C) + α(C).Δ(Q∩C) = 1.25
Verificare : Δ(CH) = Δ*(Q) + Δ*(C)

Variaţiile relative sunt :


IT (CH) = (ΣQi1Ci1)/ (ΣQi0Ci0)= 1.38
IL (Q) = (ΣQi1Ci0 )/ (ΣQi0Ci0 )= 0.96
IL (C ) = (ΣQi0Ci1 )/ (ΣQi0Ci0 )= 1.45
I(Q∩C) = (ΣQi1Ci1 / ΣQi1Ci0) : (ΣQi0Ci1 / ΣQi0Ci0) = IP (C) /IL( C) = 0.993
Verificare : IT(CH) = IL(Q) . IL(C) .I(Q∩C)
Coeficienţii de importanţă pentru repartizarea cîtului nedescompus I(Q∩C)
în mod proporţional cu influenţa independentă a factorilor vor fi :
β(Q) = ( log IL(Q) ) / (log IL(Q)+ log IL(C)) = - 0.126
β(C) = ( log IL(C) ) / (log IL(Q)+ log IL(C)) =1.126
deci β(Q)+β(C) = 1
Recalculăm variaţiile relative astfel :
I*L(Q) = IL(Q).[I(Q∩C)]β(Q) = 0.961
I*L(C) = IL(C).[I(Q∩C)]β(C) = 1.438
Verificare : IT(CH) = I*L(Q). I*L(C)
Metoda poate fi aplicată şi indicatorilor complecşi trifactoriali ,
tetrafactoriali , etc.

Exemplul 2
Fie trei produse : T1(Grâu) ; T2(Porumb) ; T3(Floarea soarelui).
Baza este anul 2000 iar anul curent este 2003.
Yi este producţia fizică a produsului Ti (Kg/ha) , Di este preţul de vânzare al unităţii de
producţie fizică a produsului Ti (lei/kg) iar Vi=Yi.Di este venitul obţinut din vânzarea
produsului Ti (milioane lei/ha).

Producţii Yi Preţuri vânzare Venituri Vi=YiDI


Produse Di
102

Bază Curent Bază Curent Yi0Di0 Yi0Di1 Yi1Di0 Yi1Di1


Yi0 Yi1 Di0 Di1
T1 3000 3500 2000 4000 6 12 7 14
T2 5000 6000 2500 4000 12.5 20 15 24
T3 1800 2000 10000 12000 18 21.6 20 24
T O T A L 14500 20000 36.5 53.6 42 62

A) Indici individuali :
- pentru producţii :
IY(T1) = Y11 / Y10 = 3500/3000 = 1.17
IY(T2) = Y21 / Y20 = 6000/5000 = 1.20
IY(T3) = Y31 / Y30 = 2000/1800 = 1.11
IY = [IY(T1). IY(T2). IY(T3)]1 / 3 = 1.159

- pentru preţuri de vânzare :


ID(T1) = D11 / D10 = 4000/2000 = 2.00
ID(T2) = D21 / D20 = 4000/2500 = 1.60
ID(T3) = D31 / D30 = 12000/10000 = 1.20
ID = [ID(T1). ID(T2). ID(T3)]1 / 3 = 1.566

- pentru venituri :
IV(T1) = Y11D11 / Y10D10 = 14/6 = 2.33
IV(T2) = Y21D21 / Y20D20 = 24/12.5 = 1.92
IV(T3) = Y31D31 / Y30D30 = 24/18 = 1.33
IV = [IV(T1). IV(T2). IV(T3)]1 / 3 = 1.814

B) Indici sintetici pentru venituri ca indici agregaţi :


1) Indicele total :
IT(V) = (ΣYi1Di1) / (ΣYi0Di0) = 62/36.5 = 1.70
2) Indicele Laspeyres :
- pentru producţii :
IL (Y) = (ΣYi1Di0) / (ΣYi0Di0) = 42/36.5 = 1.15
- pentru preţuri de vînzare :
IL (D) = (ΣYi0Di1) / (ΣYi0Di0) = 53.6/36.5 = 1.47
3) Indicele Paasche :
- pentru producţii :
IP (Y) = (ΣYi1Di1) / (ΣYi0Di1) = 62/53.6 = 1.48
- pentru preţuri de vînzare :
ID = (ΣYi1Di1) / (ΣYi1Di0) = 62/42 = 1.48
4) Indicele Englewood :
- pentru producţii :
IE(Y) = [ΣYi1(Di0 + Di1) ] / [ΣYi0(Di0 + Di1) ] = ( ΣYi1Di0+ ΣYi1Di1) / (ΣYi0Di0 +
ΣYi0Di1) = (42+62)/(36.5+53.6) = 1.15
- pentru preţuri de vînzare :
IE(Y) = [ΣYi1(Di0 + Di1) ] / [ΣYi0(Di0 + Di1) ] = ( ΣYi1Di0+ ΣYi1Di1) / (ΣYi0Di0 + ΣYi0Di1)
= (53.6+62)/(36.5+42) = 1.47
5) Indicele Sidgwik – Drobisch :
- pentru producţii :
ISD(Y) = [ IL(Y) + IP(Y) ] / 2 = 1.155
103

- pentru preţuri de vînzare :


ISD(D) = [ IL(D) + IP(D) ] / 2 = 1.475
6) Indicele Fisher :
- pentru producţii :
IF(Y) = [ IL(Y) . IP(Y) ]1/2 = 1.155
- pentru preţuri de vînzare :
IF(D) = [ IL(D) . IP(D) ]1/2 = 1.475

C) Indici sintetici pentru venituri ca rapoarte de medii :


7) Indicele cu structură variabilă :
ISV = [ (ΣYi1Di1) / (ΣDi1) ] : [ (ΣYi0Di0) / (ΣDi0) ] = (62/20000) : (36.5/14500) = 1.23
8) Indicele cu structură fixă :
ISF = [ (ΣYi1Di1) / (ΣDi1) ] : [ (ΣYi0Di1) / (ΣDi1) ] = (62/20000) : (53.6/20000) = 1.16
9) Indicele variaţiei structurii :
IVS = [ (ΣYi0Di1) / (ΣDi1) ] : [ (ΣYi0Di0) / (ΣDi0) ] = (53.6/20000) : (36.5/14500) = 1.06
Verificare : ISV = ISF. IVS

Veniturile V sunt un indicator complex bifactorial de forma V = Y.D


Variaţia veniturilor în timp este absolută :Δ(V)=ΣYi1Di1 - ΣYi0Di0
sau relativă : IT(V) = (ΣYi1Di1) / ΣYi0Di0
Aceste variaţii absolute sau relative , se pot descompune în componente cu
metoda restului/câtului nedescompus .
Variaţiile absolute sunt :
Δ(V)=ΣYi1Di1 - ΣYi0Di0 = 25.5
Δ(Y)=ΣYi1Di0 - ΣYi0Di0 = 5.5
Δ(D)=ΣYi0Di1 - ΣYi0Di0 = 17.1
Δ(Y∩D)=( ΣYi1Di1 - ΣYi1Di0 ) - ( ΣYi0Di1 - ΣYi0Di0 ) = 2.9
Verificare : Δ(V) = Δ (Y) + Δ (D) + Δ ( Y∩D )

Coeficienţii de importanţă pentru repartizarea restului nedescompus


Δ ( Y∩D ) în mod proporţional cu influenţa independentă a factorilor ,vor fi:
α (Y) = Δ(Y) / (Δ(Y) + Δ( D )) = 0.357
α (D) = Δ(D) / (Δ(Y) + Δ( D )) =0.643
deci α(Y) + α ( D ) = 1
Recalculăm variaţiile absolute astfel :
*
Δ (Y) = Δ(Y) + α(Y).Δ(Y∩D) = 2.143
Δ*(D) = Δ(D) + α(D).Δ(Y∩D) = 3.857
Verificare : Δ(V) = Δ*(Y) + Δ*(D)

Variaţiile relative sunt :


IT (V) = (ΣYi1Di1)/ (ΣYi0Di0)= 1.699
IL (Y) = (ΣYi1Di0 )/ (ΣYi0Di0 )= 1.151
IL (D ) = (ΣYi0Di1 )/ (ΣYi0Di0 )= 1.468
I(Y∩D) = (ΣYi1Di1 / ΣYi1Di0) : (ΣYi0Di1 / ΣYi0Di0) = IP (D) /IL( D) = 1.005
Verificare : IT(V) = IL(Y) . IL(D) .I(Y∩D)

Coeficienţii de importanţă pentru repartizarea cîtului nedescompus I(Y∩D)


în mod proporţional cu influenţa independentă a factorilor vor fi :
β(Y) = ( log IL(Y) ) / (log IL(Y)+ log IL(D)) = 0.267
β(D) = ( log IL(D) ) / (log IL(Y)+ log IL(D)) =0.733
104

deci β(Y)+β(D) = 1
Recalculăm variaţiile relative astfel :
I*L(Y) = IL(Y).[I(Y∩D)]β(Y) = 1.152
I*L(D) = IL(D).[I(Y∩D)]β(D) = 1.473
Verificare : IT(V) = I*L(Y). I*L(D)

Metoda poate fi aplicată şi indicatorilor complecşi trifactoriali ,


tetrafactoriali , etc.

Exemplul 3
Fie trei societăţi comerciale : S1(Vegetală) ; S2(Zootehnie) ;S3(Procesare produse
agrozootehnice).
Baza este anul 2000 iar anul curent este 2003.
NI este numărul de muncitori în ramura Si , Pi este productivitatea muncii în ramura Si
(milioane lei venit/muncitor) iar Wi=Ni.Pi este venitul din forţa de muncă în ramura Si
(milioane lei/an).

Nr. muncitori Ni Productivităţi Venituri Wi =NiPi


Societ. Pi
Comer. Bază Curent Bază Curent Ni0Pi0 Ni0Pi1 Ni1Pi0 Ni1Pi1
Ni0 Ni1 Pi0 Pi1
S1 10 8 10 15 100 150 80 120
S2 15 12 6 7 90 105 72 84
S3 20 16 10 12 200 240 160 192
T O T A L 26 34 390 495 312 396

A) Indici individuali :
- pentru număr de muncitori :
IN(S1) = N11/N10 = 8/10 = 0.80
IN(S2) = N21/N20 = 12/15 = 0.80
IN(S3) = N31/N30 = 16/20 = 0.80
IN = [IN(S1). IN(S2). IN(S3)]1 / 3 = 0.800

- pentru productivităţi :
IP(S1) = P11/P10 = 15/10 = 1.50
IP(S2) = P21/P20 = 7/6 = 1.17
IP(S3) = P31/P30 = 12/10 = 1.20
IP = [IP(S1). IP(S2). IP(S3)]1 / 3 = 1.281

- pentru venituri :
IV(S1) = N11P11/N10P10 = 120/100 = 1.20
IV(S2) = N21P21/N20P20 = 84/90 = 0.93
IV(S3) = N31P31/N30P30 = 192/200 = 0.96
IW = [IW(S1). IW(S2). IW(S3)]1 / 3 = 1.024

B) Indici sintetici pentru venituri ca indici agregaţi :


1) Indicele total :
IT (W)= (ΣNi1Pi1) / (ΣNi0Pi0) = 396/390 = 1.02
2) Indicele Laspeyres :
105

- pentru numărul de muncitori :


IL (N) = (ΣNi1Pi0) / (ΣNi0Pi0) = 312/390 = 0.80
- pentru productivităţi :
IL (P) = (ΣNi0Pi1) / (ΣNi0Pi0) = 495/390 = 1.27
3) Indicele Paasche :
- pentru numărul de muncitori :
IP (N) = (ΣNi1Pi1) / (ΣNi0Pi1) = 396/495 = 0.80
- pentru productivităţi :
IP (P)= (ΣNi1Pi1) / (ΣNi1Pi0) = 396/312 = 1.27
4) Indicele Englewood :
- pentru numărul de muncitori :
IE(N) = [ ΣNi1(Pi0 + Pi1) ] / [ ΣNi0(Pi0 + Pi1) ] = ( ΣNi1Pi0+ ΣNi1Pi1) / (ΣNi0Pi0 + ΣNi0Pi1)
= (312+396)/(390+495) = 0.80
- pentru productivităţi :
IE(P) = [ Σ(Ni0+Ni1)Pi1 ] / [ Σ(Ni0 + Ni1)Pi0 ] = ( ΣNi0Pi1+ ΣNi1Pi1) / (ΣNi0Pi0 + ΣNi1Pi0) =
(495+396)/(390+312) = 1.27
5) Indicele Sidgwik – Drobisch :
- pentru numărul de muncitori :
ISD(N) = [ IL(N) + IP(N) ] / 2 = 0.80
- pentru productivităţi :
ISD(P) = [ IL(P) + IP(P) ] / 2 = 1.27
6) Indicele Fisher :
- pentru numărul de muncitori :
IF(N) = [ IL(N) . IP(N) ]1/2 = 0.80
- pentru productivităţi :
IF(P) = [ IL(P) . IP(P) ]1/2 = 1.27
C) Indici sintetici pentru venituri ca rapoarte de medii :
7) Indicele cu strucutură variabilă :
ISV = [ (ΣNi1Pi1) / (ΣPi1) ] : [ (ΣNi0Pi0) / (ΣPi0) ] = (396/34) : (390/26) =0.776
8) Indicele cu structură fixă :
ISF = [ (ΣNi1Pi1) / (ΣPi1) ] : [ (ΣNi0Pi1) / (ΣPi1) ] = (396/36) : (495/36) = 0.80
9) Indicele variaţiei structurii :
IVS = [ (ΣNi0Pi1) / (ΣPi1) ] : [ (ΣNi0Pi0) / (ΣPi0) ] = (495/34) : (390/26) = 0.97
Verificare : ISV = ISF . IVS

Veniturile din forţa de muncă W sunt un indicator complex bifactorial de forma W = N.P
Variaţia veniturilor în timp este absolută :Δ(W)=ΣNi1Pi1 - ΣNi0Pi0
sau relativă : IT(V) = (ΣNi1Pi1) / ΣNi0Pi0
Aceste variaţii absolute sau relative , se pot descompune în componente cu
metoda restului/câtului nedescompus .
Variaţiile absolute sunt :
Δ(W)=ΣNi1Pi1 - ΣNi0Pi0 = 6
Δ(N)=ΣNi1Pi0 - ΣNi0Pi0 = - 78
Δ(P)=ΣNi0Pi1 - ΣNi0Pi0 = 105
Δ(N∩P)=( ΣNi1Pi1 - ΣNi1Pi0 ) - ( ΣNi0Pi1 - ΣNi0Pi0 ) = - 21
Verificare : Δ(W) = Δ (N) + Δ (P) + Δ ( N∩P )

Coeficienţii de importanţă pentru repartizarea restului nedescompus


Δ ( N∩P ) în mod proporţional cu influenţa independentă a factorilor ,vor fi:
α (N) = Δ(N) / (Δ(N) + Δ( P )) = - 2.889
106

α (P) = Δ(P) / (Δ(N) + Δ( P )) = 3.889


deci α(N) + α ( P ) = 1
Recalculăm variaţiile absolute astfel :
*
Δ (N) = Δ(N) + α(N).Δ(N∩P) = - 17.331
Δ*(P) = Δ(P) + α(P).Δ(N∩P) = 23.331
Verificare : Δ(W) = Δ*(N) + Δ*(P)

Variaţiile relative sunt :


IT (W) = (ΣNi1Pi1)/ (ΣNi0Pi0)= 1.015
IL (N) = (ΣNi1Pi0 )/ (ΣNi0Pi0 )= 0.8
IL (P) = (ΣNi0Pi1 )/ (ΣNi0Pi0 )= 1.269
I(N∩P) = (ΣNi1Pi1 / ΣNi1Pi0) : (ΣNi0Pi1 / ΣNi0Pi0) = IP (P) /IL( P) = 1
Verificare : IT(W) = IL(N) . IL(P) .I(N∩P)

Coeficienţii de importanţă pentru repartizarea cîtului nedescompus I(N∩P)


în mod proporţional cu influenţa independentă a factorilor vor fi :
β(N) = ( log IL(N) ) / (log IL(N)+ log IL(P)) = - 16.167
β(P) = ( log IL(P) ) / (log IL(N)+ log IL(P)) =17.167
deci β(N)+β(P) = 1
Recalculăm variaţiile relative astfel :
I*L(N) = IL(N).[I(N∩P)]β(N) = 0.8
I*L(P) = IL(P).[I(N∩P)]β(P) = 1.269
Verificare : IT(W) = I*L(N). I*L(P)
Metoda poate fi aplicată şi indicatorilor complecşi trifactoriali ,
tetrafactoriali , etc.
Momentul de bază din exemplele precedente , notat cu 0 ,poate fi înlocuit cu un loc de bază
sau cu o categorie de bază în raport cu un criteriu.
Deasemenea momentul curent din exemplele precedente, notat cu 1 , poate fi înlocuit cu un
loc curent sau cu o categorie curentă în raport cu un criteriu. Indicii precedenţi satisfac
anumite condiţii , numite teste ale indicilor , prezentate în lucrarea “Mică enciclopedie de
statistică”, pag. 227-230.
Vom descrie în încheiere modul de calcul al indicelui preţului de consum(IPC) pe baza
indicelui sintetic Laspeyres.
I.Nomenclatorul de produse şi servicii conţine trei grupe :
a) Produse alimentare
b) Produse nealimentare
c) Servicii
Fiecare grupă conţine mai multe subgrupe,fiecare subgrupă conţine mai multe produse şi
fiecare produs conţine mai multe sortimente.În total nomenclatorul conţine circa 2000
sortimente.
Exemplu: În grupa produselor alimentare avem de exemplu subgrupa carne şi produse din
carne în care avem de exemplu produsul carne de porc în care avem de exemplu sortimentul
pulpă de porc cu os.
II.Nomenclatorul de localităţi conţine 68 centre de culegere şi înregistrare a preţurilor/tarifelor
în fiecare din cele 41 judeţe (Municipiul Bucureşti are 6 centre pentru cele 6 sectoare şi
unul pentru sectorul agricol Ilfov;Timişoara,Constanţa,Cluj,Braşov au câte 3 centre,etc.)
III.Nomenclatorul de magazine şi pieţe alimentare şi nealimentare, precum şi unităţi
prestatoare de servicii pentru înregistrarea preţurilor / tarifelorpe sortimentele de la punctul I.
IV.Periodicitatea înregistrării preţurilor /tarifelor este săptămânală pentru mărfuri alimentare,
blunară pentru mărfuri nealimentare şi servicii şi lunară pentru cele supravegheate(pâine,
benzină,transport CFR , etc).
Etape de calcul:
1)Se calculează preţul/tariful mediu lunar PMjk pentru fiecare sortiment j din cele 2000 şi pentru
107

fiecare centru de culegere k din cele 68.


2)Se calculează preţul/tariful mediu lunar PMj pentru fiecare sortiment j din cele 2000 şi pentru
toate cele 68 centre de culegere , atât pentru momentul bază(0) cât şi pentru momentul curent(1).
3)Se calculează indicele individual de preţ Ij = PMj(1) / PMj(0) pentru fiecare sortiment j din cele
2000 .
4)Se calculează indicii la nivel de produs,subgrupă,grupă printr-un indice Laspeyres cu
coeficienţii de ponderare în perioada de bază :Uj(0) pe sortiment , Up(0) pe produs , Us(0) pe
subgrupă , Ug(0) pe grupă :

 pe produs : I p =
 I j  U(0)j   I j  U(0)j ;
 U(0)j U (0)
p
(0)
I  U
p p I p  U p(0)
 pe subgrupă : Is = (0)
 ;
U p U (0)
s
(0) (0)

 pe grupă : Ig =
I  U  I  U
s s s s
;
(0) (0)
U s U g
(0)

5) Calculul IPC : IPC =


I U g g
(0)
U g

IPC se utilizează în aprecierea inflaţiei,în politica monetară şi fiscală(masa monetară,rata


dobânzii), în stabilirea drepturilor băneşti(salarr,pensii,alocaţii,burse)pentru menţinerea puterii
de cumpărare, a salariului real şi a veniturilor reale ale populaţiei .

5.4 Rezumat

În acest capitol se prezintă tehnicile de sondaj în populaţii statistice omogene şi neomogene,


calculul şi interpretarea indicatorilor de sondaj de repartiţie şi evoluţie precum şi calculul şi
interpretarea indicilor statistici individuali şi sintetici .

5.5 Întrebări

1.Clasificaţi sondajele în populaţii statistice omogene şi neomogene .


2. Ce semnificaţie au indicatorii de sondaj de repartiţie ?
3. Ce semnificaţie au indicatorii de sondaj de evoluţie ?
4. Ce semnificaţie au indicii statistici individuali şi sintetici ?

5.6 Bibliografie

1.D.Ene , M.Drăghici, I.N. Alecu “ Statistică aplicată în agricultură “ Ed.Ceres,2003


2.M.Iosifescu şi col. “ Mică enciclopedie de statistică “ Ed.Ştiinţif.şi Enciclop,,1985
3. Anuarul statistic al României , 1990 -2003
108

CAP.6

ANALIZA STATISTICĂ A UNUI CARACTER

Obiective : Însuşirea de către studenţi a metodei intervalelor de încredere pentru


estimaţii / teste parametrice (medii, abateri-standard şi probalilităţi) în una şi două
populaţii normale .

Conţinut :

6.1 Estimaţii / teste parametrice în populaţii normale


6.2 Estimaţii / teste pentru parametrii  ,  ai unui caracter cantitativ într-o populaţie
normală
6.3 Estimaţii / teste pentru parametrul p al unui caracter calitativ într-o populaţie
normală
6.4 Estimaţii / teste pentru parametrii 2 - 1, 2 / 1 ai unui caracter cantitativ în două
populaţii normale
6.5 Estimaţii / teste pentru parametrul p2 – p1 al unui caracter calitativ în două populaţii
normale
6.6 Rezumat
6.7 Întrebări
6.8 Bibliografie

Cuvinte cheie : estimaţie corectă şi absolut corectă ,ipoteză simplă / compusă unilaterală
şi bilaterală ,funcţia de putere a testului , interval de încredere , diferenţă limită .

6.1 ESTIMAŢII/TESTE PARAMETRICE ÎN POPULAŢII


NORMALE

Fie o populaţie statistică de volum N, care este normală N(μ,σ) în raport cu


însuşirea X.
Efectuăm un sondaj de n valori independente x1, .....,xn care au media de sondaj
 xi şi abaterea standard de sondaj S  1  
2
X 
n n 1
 xi  X .

X şi S se schimbă de la un sondaj la altul, fiind variabile aleatoare independente


cu următoarele medii şi varianţe:
Pentru sondajul simplu repetat avem:
2
 
1) M X   ; V X   n
;
2
2 2 2 
2) M(S )=σ ; V(S )= ;
2n
   
Rezultă de aici M X   ; lim V X  0 , deci X este o estimaţie absolut
n 
corectă pentru μ.
De asemenea M(S2)=σ2; lim V ( S 2 )  0 deci S este o estimaţie absolut corectă
n 
pentru σ.
109

Pentru sondajul simplu nerepetat avem:


2 2
3) M( X )=μ; V X   n

N
;

N 2 
4) M(S2)=  2 ; V(S2)=  ;
N 1 2n 2 N
 
Rezultă de aici că M( X )=μ; lim V X  0 , deci şi în acest caz X este estimaţie
n 

N
absolut corectă pentru μ. De asemenea M(S2)= 2; lim V ( S )  0 , deci S este
N 1 n 

estimaţie corectă pentru σ.


Pentru populaţii infinite (N→∞), expresiile precedente în cazul sondajului simplu
repetat de la punctele 1), 2) coincid cu cele din cazul sondajului nerepetat de la punctele
3), 4). Dacă X este însuşire calitativă, X =f (frecvenţa valorii X în sondaj) se schimbă de
p (1  p)
la un sondaj la altul şi M(f)=p; V(f)= deci f este o estimaţie absolut corectă
n
pentru p.
În cazul sondajului stratificat se efectuează sondaje simple (repetate sau
nerepetate) de volume n1,......,nk (n1+........+nk=n) din straturile numărul 1,.........,k de
volume N1,......,Nk ; (N1+.......+Nk=N), găsindu-se mediile de sondaj din straturi X 1,......,
X k.
n x1        nk x k
5) Media sondajului stratificat va fi: X  1
n
1 k N 2 2
 
6) În cazul sondajelor simple repetate din straturi avem: V X  2  i i ;
N  1 ni
7) În cazul diferitelor tipuri de sondaj stratificat înlocuim pe ni în relaţiile 5)-7)
astfel:
n
a) Pentru sondajul tipic: ni  , (i=1,.....,k) ;
k
N
b) Pentru sondajul proporţional: ni  n i , (i=1,......,k) ;
N
N i i
c) Pentru sondajul optim: ni  n k , (i=1,.........,k) ;
 N i i
i 1

În cazul sondajului stratificat optim avem V( X )=minim.


N
8) Dacă populaţia este infinită, i  pi , deci indiferent dacă sondajele simple în
N
straturi sunt repetate sau nerepetate avem:
k
pi2 i2
 
V X 
ni
.
 1
Trebuie rezolvate două probleme:
I. Estimarea lui μ şi σ prin intervale de încredere pe baza lui X şi S;
II. Testarea de valori concrete μ0 şi σ0 pentru μ şi σ pe baza lui X şi S.

O ipoteză statistică este o presupunere asupra parametrilor unor variabile


aleatoare ce caracterizează anumite populaţii statistice.
110

Fie variabila aleatoare X cu densitatea de probabilitate y=f(x,θ), unde θ este un


parametru care poate lua valorile θ0, θ1, θ2,.....
Ipoteza H: θ=θ0 se numeşte ipoteza nulă iar ipoteza H :θ=θi (i=1,2,......) se
numeşte ipoteza alternativă.
Ipotezele în care se specifică valorile parametrului θ se numesc ipoteze simple iar
cele în care nu se specifică valorile lui θ, se numesc ipoteze compuse.
De exemplu ipoteza nulă H:θ=θ0este ipoteză simplă în timp ce ipoteza alternativă
H :θ≠θ0 este ipoteză compusă bilaterală iar ipotezele H =θ›θ0 şi H :θ‹θ0 sunt ipoteze
compuse unilaterale.
O ipoteză H asupra lui θ poate fi adevărată sau falsă iar decizia noastră asupra lui
H poate fi de asemenea că H este adevărată sau falsă.
Probabilităţile combinaţiilor acestor situaţii sunt date în tabelul alăturat:
Decizia H este H este falsă
despre H  adevărată
Ipoteza
H 

H este
adevărată 1-α α

H este falsă β 1-β

 se numeşte eroare de ordin I sau nivel de semnificaţie al testului,


β se numeşte eroare de ordin II.
În controlul statistic al calităţii şi fiabilităţii (Cap. 8), α se numeşte riscul
furnizorului iar β riscul beneficiarului.
Se poate arăta că dacă α scade, atunci β creşte şi invers, iar dacă volumul de
sondaj n creşte atunci α şi β scad. Mai observăm şi faptul că α pentru ipoteze compuse
unilaterale este α/2 pentru ipoteze compuse bilaterale deci în continuare vom considera
numai ipoteze compuse bilaterale.
Fie vectorul sondajului x=(x1, ......... ,xn) şi mulţimea vectorilor de sondaj
W Rn astfel că avem probabilitatea condiţionată PH(x  W)=α dacă ipoteza H este
adevărată. W se numeşte zonă critică iar complementara sa W zonă de acceptare a
ipotezei H.
Fie ipoteza nulă H:θ=θ0 faţă de ipoteza alternativă H :θ=θ1.
Probabilitatea de respingere a lui H ca funcţie de θ, se numeşte funcţia de putere
a testului şi se notează Π(W,θ)=Pθ(x W).
Evident avem: Π(W,θ0)=α ; Π(W,θ1)=1-β .
Funcţia de putere a testului Π(W,θ) permite determinarea probabilităţii 1-β ca
testul să sesizeze o anumită diferenţă între θ0 şi θ1 şi reciproc ea permite calcularea
diferenţei maxime între θ0 şi θ1 pe care o poate sesiza testul cu o anumită putere 1-β la
un anumit prag de semnificaţie α.
Exemplu: pentru ipoteza nulă H:μ=μ0 faţă de ipoteza alternativă
H :μ>μ0 funcţia de putere a testului are graficul:
111

Pentru ipoteza nulă H:μ=μ0 faţă de ipoteza alternativă H :μ≠μ0 funcţia de putere
a testului are graficul:

Testul cu funcţia de putere Π(W, θ)=maximă, se numeşte cel mai puternic test.
Se demonstrează:

Lema Neyman-Pearson
Testul ipotezei nule H:θ=θ0 faţă de ipoteza alternativă simplă H :θ=θ1 este cel
mai puternic test dacă zona critică W a testului satisface condiţia:
f ( x,  0 ) f ( x,  0 )
 k dacă x W şi  k dacă x  W .
f ( x, 1 ) f ( x,  1)

6.2 ESTIMAŢII / TESTE PENTRU PARAMETRII μ, σ


AI UNEI ÎNSUŞIRI CANTITATIVE ÎNTR-O
POPULAŢIE NORMALĂ

Fie o populaţie statistică normală N(μ, σ) faţă de însuşirea cantitativă X.


112

Fie un sondaj simplu repetat de n valori independente x1, ...... ,xn extras din
populaţie.
Fie X media de sondaj şi S abaterea standard de sondaj (vezi secţiunea 5.2)
Teorema 6.1
X 
Mărimea t n este variabilă Student cu n-1 grade de libertate.
S
Demonstraţie
x1, ...... ,xn fiind valori de sondaj independente extrase dintr-o populaţie normală
N(μ,σ) faţă de însuşirea cantitativă X, se poate arăta cu teoremele 2.2, 2.3, 3.7 că
1 1
X  x1        x n este o variabilă normală cu media:
n n
1 1 1 1
M ( X )  M ( x1 )        M ( x n )             şi varianţa:
n n n n

1 1 1 2 1 2 2
V (X )  V ( x1 )        V ( x n )            .
n2 n2 n2 n2 n
X 
Mai departe, n fiind variabilă N(0,1) şi conform teoremei 6.2 de mai

jos,
n  1S 2 fiind variabilă χ2 cu n-1 grade de libertate, variabila
2
n  1S 2
X  2 X 
t n  n este variabilă Student cu n-1 grade de libertate.
 n 1 S
Q.E.D.
Din teorema 6.1 rezultă:
P (t 2  t  t 2 )  1   ,adică intervalul de încredere pentru μ:
S
1  
P    X    / 2 ; X    / 2   1   unde   / 2 
n
t / 2 este diferenţa limită.

Reciproc, dându-se δα / 2 , avem mărimea probei :

2
 S 
n .t / 2 
  / 2 

Din tabela 2 din Anexă , conform relaţiei P  t t / 2    , pe linia a n-1 grade de
libertate şi coloanele α= 0.05; 0.01 şi 0.001 găsim valorile critice
t2.5% ; t0.5% ; t0.05% cu ajutorul cărora găsim trei intervale de încredere pentru μ de
forma:

1)   [ X   2.5% ; X   2.5% ]
cu încrederea 95% ;
113

2)  [ X   0.5% ; X   0.5% ]


cu încrederea de 99% ;
3)   [ X   0.05% ; X   0.05% ]
cu încrederea de 99.9% .

Ipoteza H:μ=μ0 se acceptă dacă  0   X   2.5% ; X   2.5%  şi se respinge în caz


contrar astfel:
a)    0 semnificativ dacă totuşi:
 0   X   0.5% ; X   2.5%    X   2.5% ; X   0.5%  ;
b)    0 distinct semnificativ dacă totuşi:
 0   X   0.05% ; X   0.5%    X   0.5% ; X   0.05%  ;
c)    0 foarte semnificativ dacă:  0  X   0.05% sau  0  X   0.05% .

Teorema 6.2
Mărimea  2 
n  1S 2 este variabilă hi pătrat cu n-1 grade de libertate.
2
Demonstraţie:
2 2
2  n  1 S 2 x X  xn  X  xi  X
Avem   2
  1           şi cum ui  sunt
       
variabile N(0,1), independente câte două, χ2 este variabilă hi pătrat cu n-1 grade de
x X x X
libertate (căci avem relaţia de dependenţă 1    n  0 ) Q.E.D.
 
Din teorema 6.2 rezultă:
 2  n  1 S 2 2

P          1   adică intervalul de încredere
 1 2 2 2 

pentru σ:
  
  n 1 n 1  
2 P     2 S ; 2 S    1   .
     
1 
  2 2 

Reciproc, dându-se :

n 1 n 1
2
.S   ' / 2 şi 2
.S   '' / 2
 / 2 1 / 2

rezultă :

2 2
 '    '' 
n1    / 2  .2 / 2  1 şi n2    / 2  .12 / 2  1
 S   S 
114

deci mărimea probei este n = max { n1 ; n2 }

Din tabela 3 din Anexă ,conform relaţiei P  2   2    , pe linia a n-1 grade de


libertate şi pe coloanele α=0.05; α=0.01; α=0.001 găsim valorile  2  iar pe coloanele 1-
1
2
2
α=0.95; 1-α=0.99; 1-α=0.999 găsim valorile  cu ajutorul cărora găsim trei intervale de

2
încredere pentru σ de forma:
 n 1 n 1 
1)   2
.S ; 2
.S 
  0.025%  0.975% 
cu încrederea de 95% ;
 n 1 n 1 
2)   2
.S ; 2
.S 
  0.005  0.995 
cu încrederea de 99% ;

 n 1 n 1 
3)   2
.S ; 2
.S 
  0.0005  0.9995 
cu încrederea de 99.9%.
 n 1 n 1 
Ipoteza H:σ=σ0 se acceptă dacă:  0   2 S ; 2
S  şi se respinge în caz contrar
  0.025  0.975 
după cum urmează:
a)    0 semnificativ dacă totuşi:
 n 1 n 1   n 1 n 1 
 0   2 S; 2
S   2
S; 2
S ;
  0.005  0.025    0.975  0.995 
b)    0 distinct semnificativ dacă totuşi:
 n 1 n 1   n 1 n 1 
 0   2 S; 2
S    2
S ; 2
S ;
  0.0005  0.005    0.995  0.9995 
c)    0 foarte semnificativ dacă:
n 1 n 1
0  2
S sau  0  2
S.
 0.0005  0.9995
Exemplu:
Fie X greutatea viţeilor (kg). Dintr-un sondaj de n=50 viţei găsim X =64.9kg;
S=2.33kg.
a) Se cer intervale de încredere cu riscurile α=5%; 1%; 0.1% pentru μ şi testerea
ipotezelor H:μ=65kg; H:μ=67kg.
b) Se cer intervale de încredere cu riscurile α=5%; 1%; 0.1% pentru σ şi testarea
ipotezelor H:σ=2.5kg; H:σ=3.3kg.

Soluţie:
a) Pe linia a n-1=49GL şi coloanele α=0.05; α=0.01; α=0.001 găsim în tabela 2 din
Anexă, valorile critice t2.5%=2.01; t0.5%=2.68; t0.05%=3.50 deci înlocuind în
formula (1) găsim intervalele de încredere pentru μ:
115

1)   [64.2 Kg ;65.6 Kg ]

2)  [64 Kg ;65.8Kg ]

3)   [63.8Kg ;66 Kg ]

cu încrederile de 95 % ; 99 % ; 99.9%.

De exemplu pentru intervalul mic cu 1-α=95% avem concluzia:


Greutatea medie necunoscută μ a tuturor viţeilor din care fac parte cei 50 din
sondaj, este cuprinsă între 64.2kg şi 65.8kg cu o încredere de 95%.
Există semiriscul 2.5% ca această medie μ să fie mai mică ca 64.2kg atunci când
cei 50 viţei ai sondajului au fost aleşi cei mai performanţi ca greutate.
Concluzia este simetrică pentru μ>65.8kg.
Ipoteza H:μ=65kg se acceptă deoarece 65 64.2;65.6 iar ipoteza H:μ=67kg se
respinge (μ≠67kg foarte semnificativ căci 67>66).

b) Pe lina a n-1=49GL şi coloanele 1   0.999; 0.995; 0.975 găsim în tabela 2 din
2

Anexă : χ20.999=24.70; χ20.995=27.99; χ20.975=32.36 iar pe coloanele  0.025;
2
0.005; 0.001 găsim:
χ20.025=71.42; χ20.005=79.49; χ20.001=86.70
deci înlocuind în formula (2), găsim intervalele de încredere pentru σ:

1)  [2 Kg ;2.9 Kg ]
cu o încredere de 95 %;
2)  [1.9 Kg ;3.2 Kg ]
cu o încredere de 99%;

3)  [1.8Kg ;3.4 Kg ]


cu o încredere de 99.9%.

De exemplu pentru intervalul mic cu 1-α=95% avem concluzia:


Abaterea standard σ necunoscută a greutăţii tuturor viţeilor din care fac parte cei
50 viţei ai sondajului, este cuprinsă între 2kg şi 2.9kg cu încrederea de 95%.
Există semiriscul 2.5% ca această abatere standard σ să fie mai mică ca 2 Kg
atunci când cei 50 viţei ai sondajului au fost aleşi cei mai neomogeni ca greutate.
Concluzia este simetrică pentru cazul σ>2.9kg.
Ipoteza H:σ=2.5kg se acceptă deoarece 2.5  2;2.9 iar ipoteza H:σ=3.3kg se
respinge( σ≠3.3kg distinct semnificativ deoarece 3.3  3.2;3.4 ).

6.3 ESTIMAŢII / TESTE PENTRU PARAMETRUL p


AI UNEI ÎNSUŞIRI CALITATIVE ÎNTR-O
POPULAŢIE NORMALĂ

Fie o populaţie statistică normală în care însuşirea calitativă X are probabilitatea


de apariţie p. Efectuăm un sondaj simplu repetat de n valori independente x1, ........ ,xn
unde:
116

xi = 1 dacă exemplarul i are însuşirea X


xi = 0 în rest
Dacă k din cele n exemplare de sondaj au valoare 1, media de sondaj X devine
k
frecvenţa de sondaj f  (0 ≤ k ≤ n).
n
Teorema 6.3
f p
Pentru n→∞, mărimea u  este variabilă normală redusă N(0.1).
p1  p 
n
Demonstraţie:
k este valoare a unei variabile binomiale iar
k 1 1
M ( f )  M    M (k )  np  p şi
n n n
k 1 1 p 1  p 
V ( f )  V    2 V (k )  2 np1  p   deci conform teoremei limită
n n n n
f  M(f ) f p
centrală 3.14 din secţiunea 3.3, variabila normată u   este
( f ) p1  p 
n
variabilă normală redusă N(0.1) când n→∞.Q.E.D.
Din teorema 6.3 rezultă:
 
P  u   u  u    1   adică intervalul de încredere pentru p:
 2 2 

(3) 
P p  f    2 ; f    2   1  
f 1  f 
unde   2  u 2 este diferenţa limită.
n

Reciproc , dându-se δα / 2 , avem mărimea probei :

2
u 
n  f (1  f ).   / 2 
  / 2 
Din tabela 1 din Anexă , conform relaţiei: P  u  u 2   1  
avem u2.5%=1.96; u0.5%=2.58; u0.05%=3.29 deci trei intervale de încredere pentru p de
forma:
1) p  [ f   2.5% ; f   2.5% ]
cu încrederea de 95%;
2) p  [ f   0.5% ; f   0.5% ]
cu încrederea de 99%;
3) p  [ f   0.05% ; f   0.05% ]
cu încrederea de 99.9%.
Ipoteza H:p=p0 se acceptă dacă p0   f   2.5% ; f   2.5%  şi se respinge în caz
contrar astfel:
a) p≠p0 semnificativ dacă totuşi:
117

p0   f   0.5% ; f   2.5%    f   2.5% ; f   0.5%  ;


b) p≠p0 distinct semnificativ dacă totuşi:
p0   f   0.05% ; f   0.5%    f   0.5% ; f   0.05%  ;
c) p≠p0 foarte semnificativ dacă:
p0  f   0.05% sau p0  f   0.05%
Exemplu:
Fie X= ecloziunea ouălelor de găină la incubator. Se face un sondaj simplu repetat
de n=1600 ouă, găsindu-se frecvenţa ouălelor eclozionate f=95%. Se cer intervalele
de încredere pentru probabilitatea p de ecloziune pentru toate ouălele din care fac
parte cele 1600 din sondaj şi să se testeze ipotezele H:p=96% şi H:p=90%.
Soluţie:
Avem u2.5%=1.96; u0.5%=2.58; u0.05%=3.29 deci formula (3) dă intervalele de
încredere pentru p:
1) p  [93.5%;96.5%]
cu o încredere de 95%;
2) p  [93.1%;96.8%]
cu o încredere de 99%;
3) p  [92.7%;97.2%]
cu o încerede de 99.9% .

De exemplu pentru intervalul mic cu 1-α=95% avem concluzia:


Probabilitatea necunoscută p a ecloziunii pentru toate ouăle din care fac parte cele
1600, este cuprinsă între 93.5% şi 96.5% cu o încredere de 95%.
Există semiriscul 2.5% ca această probabilitate să fie mai mică de 93.5% atunci
când sondajul celor 1600 ouă a fost ales cel mai performant în ceea ce priveşte
ecloziunea.
Pentru p>96.5% concluzia este simetrică.
Ipoteza H:p=96% se acceptă deoarece 96%  93.5%;96.5% iar ipoteza
H:p=90% se respinge (μ≠90% foarte semnificativ deoarece 90%<92.7%)

6.4 ESTIMAŢII/TESTE PENTRU PARAMETRII μ2 – μ1,


σ2 / σ1 AI UNEI ÎNSUŞIRI CANTITATIVE ÎN DOUĂ
POPULAŢII NORMALE

Fie două populaţii statistice normale N(μ1, σ1) şi respectiv N(μ2, σ2) faţă de
caracterul cantitativ X.
Extragem un sondaj simplu repetat de n1 exemplare din prima populaţie cu n1
valori de sondaj independente X11, X12, ..... , X 1n1 şi calculăm media de sondaj
1 n1 1 n1 2
X1  
n1 i 1
X 1i respectiv abaterea standard de sondaj: S 1  
n1  1 i 1

x1i  X 1 .

Extragem un sondaj simplu repetat de n2 exemplare din a II-a populaţie,cu n2 valori de


sondaj independente X21,X22,..... , X 2n2 şi calculăm media de sondaj:
n2
1
X2 
n2
X
i 1
2i
118

si respectiv abaterea-standard de sondaj :


1 n2 2
S2 
n2  1 i 1

 x2i  X 2  .

Fie S 
n1  1S12  n2  1S 22
n1  n2  2
2 2 2
 S12 S 22   1  S1  1  S 22  
şi n*     :
        deci
 n1 n2   n1  1  n1  n 2  1  n2  

min n1  1; n2  1  n*  n1  n 2  2 .
Teorema 6.4

Dacă σ1=σ2 mărimea t 



X 2  X 1    2  1  
este variabilă Student cu n1+n2-2
1 1
S 
n1 n2
grade de libertate.
Dacă 1  2 mărimea :

( X 2  X 1 )  (  2  1 )
t
S12 S22

n1 n2
este aproximativ variabilă Student cu n* grade de libertate .
Demonstraţie:
X 2  X 1 este variabilă normală cu media :
     
M X 2  X 1  M X 2  M X 1   2  1
2
  22
şi varianţa V  X  X   V  X  V  X  
2 1 2 1
1

n 1 n2
deoarece cele două sondaje se presupun independente deci şi X 1 , X 2 sunt variabile
aleatoare independente.

Rezultă că u 

X 2  X 1    2  1  
este variabilă N(0;1). Înlocuind pe
 12  22

n1 n2

σ1=σ2 cu S, conform teoremei 6.1, t


X 2
este o variabilă

 X 1    2  1 
1 1
S 
n1 n2
Student cu n1+n2-2 grade de libertate. Cea de-a doua afirmaţie din enunţ o admitem fără
demonstraţie Q.E.D.
Din teorema 6.2 rezultă: P  t 2  t  t 2   1   adică intervalul de
încredere pentru μ2-μ1:

  
P  2  1   X 2  X 1   2 ; X 2  X 1   
   2 
  1

119

1 1
unde   2 S   t 2 este diferenţa limită.
n1 n2
Din tabela 2 din Anexă, conform relaţiei P  t  t 2    găsim tα/2 cu n1+n2 -2
GL pentru α=5%; 1%; 0.1% deci trei intervale de încredere pentru μ2-μ1 cu încrederile
1-α=95%; 99%; 99.9%:

1)  2  1  [( X 2  X 1 )   2.5% ; ( X 2  X 1 )   2.5% )]

cu încrederea de 95%;

2) 2  1  [( X 2  X 1 )   0.5% ; ( X 2  X 1 )   0.5% ]


cu încrederea de 99%;

3)  2  1  [( X 2  X 1 )   0.05% ; ( X 2  X 1 )   0.05% ]
cu încrederea de 99.9% .
Ipoteza H:μ1=μ2 se acceptă dacă şi numai dacă :

   
0   X 2  X 1   2.5% ; X 2  X 1   2.5%  şi se respinge în caz contrar.

În cazul sondajelor dependente de volum n1=n2=n vom forma diferenţele
1 n 1 n
d1=x21-x11, ..... ,dn=x2n – x 1n şi vom calcula d  
n i 1
d i şi Sd   
n  1 i 1
 2
di  d .

Intervalul de încredere cu riscul α pentru μ2 – μ1 va avea forma:



P  2  1   d    2 ; d    2   1  
S
unde   2  d t 2 este diferenţa limită.
n
Din tabela 2 din Anexa conform relaţiei P  t  t 2    găsim tα/2 pentru n-1
GL pentru α=5%; 1%; 0.1% deci trei intervale de încredere pentru μ2-μ1 ca mai sus.
Ipoteza H:μ1=μ2 se verifică ca mai sus.
Teorema 6.5
2 S2
Mărimea F  22 : 22 este variabilă Fisher cu (n1-1;n2-1) grade de libertate.
 1 S1
Demonstraţie:
Conform teoremei 6.2  1  2 n1  1S12
este variabilă hi pătrat cu n1-1 GL iar
 12
2 n2  1S 22  12  22  22 S 22
 
2 este variabilă hi pătrat cu n2-1 GL deci F  :  :
 22 n1  1 n 2  1  12 S12
este variabilă Fisher cu (n1-1; n2-1) GL.Q.E.D.
Din teorema 6.5 retultă P0  F  F   1   adică intervalul de încredere

pentru 2 :
1
  S 
(5) P 2  0; 2 F    1   .
  1  S1 
120

Din tabelele 4, 5, 6 din Anexă , conform relaţiei PF  F    găsim F


pentru (n1-1; n2-1) GL pentru α=5%; 1%; 0.1% deci trei intervale de încredere pentru
2
cu încrederile 1-α=95%; 99%; 99.9%:
1
2 S
1)  [0; 2 . F5% ]
1 S1

cu încrederea de 95%;

2 S
2)  [0; 2 . F1% ]
1 S1
cu încrederea de 99%;

2 S
3)  [0; 2 . F0.1% ]
1 S1
cu încrederea de 99.9% .
 S 
Ipoteza H:σ1=σ2 se acceptă dacă 1  0; 2 F5%  şi se respinge în caz contrar
 S1 
astfel:
S2
1. σ2 >σ1 semnificativ dacă totuşi 1  F1% ;
S1
S2
2. σ2 >σ1 distinct semnificativ dacă totuşi 1  F0.1% ;
S1
S2
3. σ2 >σ1 foarte semnificativ dacă 1  F0.1% .
S1

Notă. Numerotăm populaţiile 1 şi 2 astfel ca S2  S1.


Exemplu:
X= greutatea viţeilor (kg). Populaţia 1: Brună. Populaţia 2: Bălţată cu negru. Se
cântăresc n1=20 viţei din populaţia 1, găsind X 1  60.1kg şi S1=2.5kg. Se cântăresc
n2=30 viţei, găsind X 2  62.2kg şi S2=2.8kg.
a) Să se găsească intervale de încredere pentru μ2-μ1 cu riscuri α=5%; 1%; 0.1% şi
să se testeze ipoteza H:μ1=μ2.
b) Să se găsească intervae de încredere pentru σ2/σ1 cu riscuri α=5%; 1%, 0.1% şi să
se testeze ipoteza H:σ1=σ2.

Soluţie:

a) În ipoteza σ1=σ2 care va fi verificată la punctul b), calculăm:

S
n1  1S12  n2  1S 22 adică S=2.42kg.
n1  n2  2
121

Din tabela 2 din Anexă, pe linia a 20+30-2=48GL şi coloanele lui α=0.05; 0.01;
1 1
0.001 găsim: t2.5%=2.01; t0.5%=2.68; t0.05%=3.50 . Mărimea   2  S   t 2
n1 n2
devine:
δ2.5%=0.7∙2.01=1.41;
δ0.5%=0.7 ∙2.68=1.88;
δ0.05%=0.7 ∙3.50=2.45 .
Din formula (2) avem intervalele de încredere pentru μ2-μ1 cu încrederile 1-
α=95%; 99%; 99.9%:

1)  2  1  [1.69 Kg ;3.51Kg ]
cu o încredere de 95%;

2) 2  1  [0.22 Kg ;3.98 Kg ]


cu o încredere de 99%;

3)  2  1  [0.35Kg ; 4.55 Kg ]
cu o încredere de 99.9% .

De exemplu pentru intervalul mic cu 1-α=95% avem concluzia:


Diferenţa greutăţii medii a viţeilor μ2-μ1 necunoscută, pentru toţi viţeii Bălţată cu
negru din care fac parte cei 20 faţă de toţi viţeii Brună din care fac parte cei 30, este
cuprinsă între 1.69kg în favoarea viţeilor Bălţată cu negru şi 3.51kg în favoarea viţeilor
bălţată cu negru , cu o încredere de 95%.
Există semiriscul 2.5% ca această diferenţă μ2-μ1 să fie mai mică de 1.69kg în
favoarea rasei bălţată cu negru , atunci când primul sondaj a fost ales cel mai
neperformant iar în al doilea sondaj cel mai performant.O concluzie simetrică pentru
μ2-μ1>3.51kg.
Ipoteza H:μ1=μ2 se respinge căci 0  2  1  1.69;3.51 .
b) Pentru (20-1; 30-1) GL din tabelele 4, 5, 6 ale Anexei , găsim F5%=2.00;
S2
F1%=2.68; F0.1%=3.73 aşa că F va avea valorile: 1.58; 1.83; 2.16 deci
S1
avem intervalele cu încrederile 1-α=95%; 99%; 99.9%:

1) 2  [0;1.58]
1
cu încrederea de 95%;

2) 2  [0;1.83]
1
cu încrederea de 99%;

3) 2  [0; 2.16]
1
cu încrederea de 99.9% .
De exemplu pentru intervalul mic cu 1-α=95% avem concluzia:
122

2
Raportul abaterilor standard al tuturor viţeilor bălţată cu negru din care
1
provin cei 30 de viţei faţă de toţi viţeii brună din care provin cei 20 viţei este cuprins
între 0 şi 1.88 ori în favoarea rasei bălţată cu negru.
Există semiriscul 2.5% ca acest raport să fie mai mare de 1.58 ori în favoarea
bălţatei cu negru, atunci când sondajul 1 a fost ales cel mai omogen iar al II-lea cel mai
omogen.
Ipoteza H:σ1=σ2 se acceptă deoarece 1 0;1.58 . Această ipoteză a stat la baza
calculelor de la punctul a).

6.5 ESTIMAŢII / TESTE PENTRU PARAMETRUL


p2 – p1 Al UNEI ÎNSUŞIRI CALITATIVE ÎN DOUĂ POPULAŢII NORMALE

Fie două populaţii statistice normale în care însuşirea calitativă X apare cu


probabilităţile p1 şi p2.
Efectuăm două sondaje simple repetate de volume n1 şi n2. Fie k1 exemplare din
primul sondaj în care însuşirea X are valoarea 1 şi k2 exemplare din al doilea sondaj în
k
care însuşirea X are valoarea 1 deci avem frecvenţele de sondaj f1  1 respectiv
n1
k
f2  2 .
n2
n f  n2 f 2
Frecvenţa sondajelor reunite este f  1 1 .
n1  n2
Teorema 6.6
Pentru n1, n2 →∞, u 
 f 2  f1    p 2  p1  este variabilă normală redusă
p1 1  p1  p 2 1  p 2 

n1 n2
N(0,1).
Demonstraţie:
k1 şi k2 sunt valori ale unor variabile binomiale iar
k  1 1
M  f 1   M  1   M k1    n1 p1  p1
 n1  n1 n1
şi analog M  f 2   p 2 aşa că M  f 2  f1   M  f 2   M  f1   p 2  p1 .
k  1 1 p 1  p1 
De asemenea V  f1   V  1   2 V k1   2 n1 p1 1  p1   1 aşa că
 n1  n1 n1 n1
p 1  p1  p 2 1  p 2 
V  f 2  f1   V  f 2   V  f1   1  .
n1 n2
Conform teoremei-limită centrală 3.14 din secţiunea 3.3, variabila normată:
u 2
 f  f 1   M  f 2  f1    f 2  f 1    p 2  p1 
  f 2  f1  p1 1  p1  p 2 1  p 2 

n1 n2
este variabilă normală redusă N(0,1). Q. E.D.
123

Din teorema 6.6 rezultă: P  u 2  u  u 2   1  deci un interval de


încredere pentru p2 – p1:


(6) P p2  p1   f 2  f1     2 ;  f 2  f1     2 
  1  

1 1
unde   2 f 1  f      u 2 este diferenţa limită.
 n1 n2 
Din tabela 1 din Anexă , conform relaţiei: P  u  u 2   1   găsim
u2.5%=1.96; u0.5%=2.58; u0.05%=3.29, deci trei intervale de încredere pentru p2-p1 cu
încrederile 1-α=95%; 99%; 99.9%:
1) p2  p1  [( f 2  f1 )   2.5% ; ( f 2  f1 )   2.5% ]
cu încrederea de 95% ;
2) p2  p1  [( f 2  f1 )   0.5% ; ( f 2  f1 )   0.5% ]
cu încrederea de 99%;
3) p2  p1  [( f 2  f1 )   0.05% ; ( f 2  f1 )   0.05% ]
cu încrederea de 99.9% .
Ipoteza H:p1=p2 se acceptă dacă : 0   f 2  f1    2.5% ;  f 2  f1    2.5%  . În caz
contrar ipoteza H se respinge după cum urmează:
a) p1 ≠p2 semnificativ dacă totuşi:
0   f 2  f1    0.5% ;  f 2  f1    2.5%    f 2  f1    2.5% ;  f 2  f1    0.5% 
b) p1 ≠p2 distinct semnificativ dacă totuşi:
0   f 2  f1    0.05% ;  f 2  f1    0.5%    f 2  f1    0.5% ;  f 2  f1    0.05% 
c) p1 ≠p2 foarte semnificativ dacă:
0   f 2  f1    0.05% sau 0   f 2  f1    0.05% .
Exemplu:
Fie X= ecloziunea ouălelor de găină la incubator. Se fac măsurători pe două rase de
găini, găsindu-se la primul sondaj de n1=3000 ouă din prima rasă, frecvenţa ouălelor
eclozionate f1=85% şi la al doilea sondaj de n1=2000 ouă din a doua rasă, frecvenţa
ouălelor eclozionate f2=90%.
Să se găsească intervale de încredere pentru diferenţa p1-p2 a probabilităţilor de
ecloziune pentru toate ouălele din care fac parte cele 3000 ouă din primul sondaj faţă de
toate ouălele din care fac parte cele 2000 ouă din al doilea sondaj şi să se testeze ipoteza
H:p1=p2 .
Soluţie:
n f  n2 f 2
Avem f  1 1  87% aşa că :
n1  n 2
 1 1 
  0.871  0.87 
2    u 2  0.0097u 2 . si cum u2.5%=1.96 ;
 3000 2000 
u0.5%=2.58; u0.05%=3.29 rezultă δ2.5%=1.9%; δ0.5%=2.5%; δ0.05%=3.2%.
Avem intervale de încredere pentru p2-p1 cu încrederile 1-α=95%, 99%; 99.9% :
1) p2  p1  [3.1%; 6.9%]
cu încrederea de 95%;
124

2) p2  p1  [2.5%; 7.5%]
cu încrederea de 99%;
3) p2  p1  [1.8%;8.2%]
cu încrederea de 99.9% .
De exemplu pentru intervalul mic cu 1-α=95% avem concluzia:
Diferenţa necunoscută p2-p1 a probabilităţilor eclozionării pentru toate ouălele din
care fac parte cele 2000 din rasa de găini nr. 2 faţă de toate ouălele din care fac parte cele
3000 ale rasei de găini nr. 1 este cuprinsă între 3.1% şi 6.9% în favoarea rasei nr.2, cu o
încredere de 95%.
Există semiriscul ca această diferenţă să fie mai mică de 3.1% în favoarea rasei nr. 2,
atunci când sondajul din rasa de găini nr. 1 a fost cel mai neperformant iar sondajul din
rasa de găini nr. 2 a fost cel mai performant sub aspectul ecloziunii ouălelor.
Ipoteza H:p1=p2 se respinge deoarece 0  p 2  p1  3.1%;6.9% şi anume p1 ≠p2
foarte semnificativ deoarece 0<1.8%.

6.6 Rezumat

În acest capitol se prezintă conceptele de estimaţie corectă şi absolut corectă a


parametrilor pentru una sau două populaţii(medii , abateri-standard şi probabilităţi) ,de
ipoteză statistică simplă sau compusă , unilaterală sau bilaterală.
Se prezintă metoda de estimare prin intervale de în credere pentru parametrii
precedenţi .

6.7 Întrebări

1. Ce este o estimaţie corectă respectiv absolut corectă al unui parametru din populaţie ?
2. Ce este o ipoteză statistică simplă sau compusă , unilaterală sau bilaterală ?
3. Ce este funcţia de putere a testului ?
4. Ce este un interval de încredere ?

6.8 Bibliografie

1.D.Ene , M.Drăghici, I.N. Alecu “ Statistică aplicată în agricultură “ Ed.Ceres,2003


2.M.Iosifescu şi col. “ Mică enciclopedie de statistică “ Ed.Ştiinţif.şi Enciclop,,1985
3. Anuarul statistic al României , 1990 -2003
125

CAPITOLUL 7.

TESTE NEPARAMETRICE ÎN POPULAŢII

Obiective : Însuşirea de către studenţi a testelor de concordanţă şi dependenţă a


caracterelor , de acurateţe a sondajului şi normalitate a unei populaţii în raport cu un caracter.

Conţinut :

7.1 Testul hi patrat de concordanţă


7.2 Testul hi patrat de dependenţă a două caractere X , Y
7.3 Testele de acurateţe a sondajului
7.4 Testul normalităţii unei populaţii ăn raport cu un caracter
7.5 Rezumat
7.6 Întrebări
7.7 Bibliografie

Cuvinte cheie : concordanţă a probabilităţilor cu valori ipotetice, independenţă a două


caractere, tabele de contingenţă , acurateţe a unui sondaj , normalitate a unei populaţii în
raport cu un caracter .

7.1 TESTUL HI PATRAT DE CONCORDANŢĂ

7.1.1. Cazul unei populaţii normale

Fie o populaţie normală în raport cu însuşirea (caracterul) X a exemplarelor sale şi fie


un sondaj de volum mare (n > 30) cu datele de sondaj independente şi grupate în clasele de
valori C1, …, Ck cu centrele de clase x1, …, xk şi frecvenţele valorilor în clase n1, …, nk (n1 +
… + nk = n).
Dacă există ni < 5, clasele cu aceste frecvenţe se grupează cu clasele vecine pentru a
avea ni > 5. Forma poligonului frecvenţelor observate în sistemul de axe (xi, ni) arată că X
( 0)
este o variabilă aleatoare clasică (cap. 3) cu frecvenţele aşteptate n 'i  np i unde

p (i 0)  PX  Ci  ; (i = 1, …, k).
(0 ) ( 0)
Dorim să verificăm ipoteza H : p1  p1 ,..., p k  p k a concordanţei
( 0)
probabilităţilor pi cu valorile ipotetice p i ; (i = 1, …, k).

Teorema 7.1
Pentru n  , mărimea:
2

2  
k
 ni  n 'i 
 n
2
k f i  pi(0) 
i 1 n 'i i 1 pi(0)
este variabilă hi patrat cu k – 1 grade de libertate.
126

Demonstraţie:
Valorile n1, …, nk sunt pentru n  , valori ale unor variabile aleatoare Poisson
' (0 ) (0 )
(secţiunea 3.1.) independente, cu mediile şi varianţele egale cu n1  np1 ,..., n k deci
n1  np1(0) n k  np (k0)
variabilele normate u1  ,..., u k  sunt variabile independente între
np1(0) np (k0)
ele cu media 0 şi varianţa 1.
Conform teoremei limită centrală 3.14, pentru n  , variabilele aleatoare
independente între ele, u1, …, u k tind către variabila normală redusă N(0, 1) deci la limită,
mărimea:
' 2
2
k
  u   2
k n  n 
i i
 n
k f i  pi(0) 
este variabilă hi patrat cu k – 1 grade de
i
i 1 i 1 ni' i 1 pi(0)
libertate (se pierde un grad de libertate datorită relaţiei de dependenţă n1 +… + nk = n.
Uneori numărul de grade de libertate este mai mic decât k – 1: dacă X este variabilă
binomială sau Poisson avem k – 2 grade de libertate, datorită relaţiei de dependenţă n1 + … +
nk = n, n1 x1 + … +nkxk = n . x iar la variabila X = N(0,1) avem k – 3 grade de libertate,
datorită relaţiilor de dependenţă n1 + … + nk = n, n1x1 + … + nkxk = n . x , n1(x1 - x )2 + … +
nk(xk - x )2 = (n – 1) . S2 . Q.E.D.
Din teorema 7.1 rezultă testul hi patrat de concordanţă într-o populaţie normală:
Comparăm mărimea:
k  f  p
i 
2 (0)
2
k
 ni  n 'i  i
   n
i 1 n 'i i 1 pi(0)
2 2 2
cu variabile critice  0.05 ;  0.01 ;  0.001 extrase în tabela 6 pe linia a k – 1 grade de
libertate.
( 0)
Dacă  2   0.05
2
, H se acceptă deci pi concordă cu valorile ipotetice p i .
În caz contrar H se respinge după cum urmează:
( 0)
2 2 2
a) Dacă   0.05 ; 0.01  atunci pi  p i semnificativ;
( 0)
b) Dacă  2    0.01
2 2
;  0.001  atunci pi  p i distinct semnificativ.
( 0)
c) Dacă  2   0.001
2
atunci pi  p i foarte semnificativ

Exemplu:
Încrucişând după schema alăturată un soi
de porumb de floricele P1 cu boabe albe şi netede P1 P2
cu un soi P2 cu boabe albastre şi zbârcite, s-au
obţinut în generaţia F2 665 boabe albastre şi netede
210 boabe albastre şi zbârcite, 240 boabe albe şi
F1
netede şi 85 boabe albe şi zbârcite. B1 B2
Să se testeze raportul de segregare 9 : 3 : 3:1
al combinaţiilor de caractere precedente.
F2
Soluţie.
Numărul total de boabe este n = 665 + 210 + 240 + 85 = 1200.
Frecvenţele aşteptate sunt n’i = n . p i
127

9
n’1 = 1200 . boabe albastre şi netede
16
3
n’2 = 1200 . boabe albastre şi zbârcite
16
9
n’3 = 1200 . boabe albe şi netede
16
1
n’4 = 1200 . boabe albe şi zbârcite
16
9 3 1
Avem ipoteza H : p1  , p 2  p3  , p 4 
16 16 16
2
k
 ni  n 'i 
2   devine pentru k = 4:
i 1 n 'i
2 2 2 2
2  665  675  210  225  240  225 85  75
      3.48
675 225 225 75

Din tabela 3 pe linia k – 1 = 3 GL şi coloanele α = 0.05; 0.01; 0.001 găsim:


2 2 2
 0.05  7.81;  0.01  11.34;  0.001  16.30
2 2
Cum   3.84   0.05  7.81 rezultă că ipoteza H se acceptă deci se confirmă
raportul de segregare 9 : 3 : 3 : 1.

În cazul însuşirii X calitative, avem două clase : C în care însuşirea X este prezentă
cu frecvenţa n1 = nf şi C în care X este absentă cu frecvenţa n2 = n(1-f).
Avem frecvenţele aşteptate n’1 = np şi n’2 = n(1-p) aşa că:
2 2 2
2  n1  n '1   n2  n '2  n  f  p 
    cu k = 2 – 1 = 1 GL. De aici rezultă testul
n '1 n '2 p 1  p 
hi patrat al ipotezei H : p = p0 faţă de alternativa H : p  p0:
2
2
n  f  p0 
Se compară:   cu valorile critice:
p0 1  p0 
2 2 2
 0.05  3.84;  0.01  6.63;  0.001  10.80 pentru 1 GL extrase din tabela 3 din
Anexă şi se ia decizia ca mai sus.

Exemplu
Fie X = leucoza vacilor. Într-o fermă cu n = 100 vaci s-a găsit f = 2%. Să se testeze
ipoteza H : p = 1% faţă de H : p  1%
Soluţie. Pentru n = 100; f = 0.02; p0 = 0.01 găsim:
2
 0.02  0.01
 2  100. 2
 1.01   0.05  3.84 deci se acceptă ipoteza H : p = 1% a incidenţei
0.011  0.01
leucozei pentru toate vacile din care provin cele n = 100.
128

7.1.2. Cazul a două populaţii normale

Fie două populaţii normale în raport cu însuşirea X şi fie două sondaje independente
de volume n1, n2 > 30, extrase din cele două populaţii.
Grupăm datele de sondaj în aceleaşi clase C1, …, Ck cu centrele de clase x1, …, xk şi
frecvenţele observate ale valorilor în clase n11, …, n1k (n11 + … + n1k = n1) şi respectiv n21, …,
n2k (n21 + … + n2k = n2). Fie fi = n1i /n1 si gi =n2i /n2 .
Verificăm ipoteza H : p11 = p21, …, p1k = p2k faţă de ipoteza H : p21, …, p1k  p2k.

Teorema 7.2.
Pentru n1, n2   mărimea:
2 2
2
k
 n1i n2  n2i n1  k
 fi  gi 
   n1n2 
i 1 n1 n2  n1i  n2 i  1 n1 f i  n2 g i

este variabilă χ2 cu k – 1 GL.

Demonstraţie:
Reunim cele două sondaje deci avem frecvenţele observate ale valorilor în clasele
reunite:
n11 + n21, …, n1k + n2k şi volumul de sondaj reunit n1 + n2.
Frecvenţele aşteptate ale valorilor în clase pentru cele două sondaje, au forma:
n1i  n 2i n1i  n 2i
n1' i  n1 ; n '2i  n 2 i  1,..., k 
n1  n 2 n1  n 2
2 2

Vom avea 12  


k n
1i  n1' i 
;  22  
k n
2i  n2' i 
deci conform
i 1 n1' i i 1 n2' i
teoremei 7.1 pentru n1, n2   mărimea  2  12   22 este variabilă χ2 cu k- 1
2 2
k
 n1i n2  n2i n1  k
 fi  g i 
GL şi are forma:  2    n1n2  Q.E.D.
i 1 n1 n2  n1i  n2 i  n1 f i  n2 g i
i 1

Din teorema 7.2 rezultă testul hi patrat de concordanţă a probabilităţilor în cele


două populaţii :
Comparăm mărimea χ2 din enunţul teoremei 7.2 cu valorile critice χ20.05,χ20.01, χ20.001
extrase din tabela 3 din Anexă pe coloanele α=0.05;0.01;0.001 şi linia a k+1 GL.
Dacă  2   0.05
2
, H se acceptă deci pi, qi concordă între ele (I = 1, …, k).
În caz contrar H se respinge după cum urmează:
a) Dacă  2    0.05
2 2
;  0.01  atunci pi  qi semnificativ;
b) Dacă  2    0.01
2 2
;  0.001  atunci pi  qi distinct semnificativ;
c) Dacă  2   0.001
2
atunci pi  qi foarte semnificativ.

Exemplu:
Fie X = greutatea în viu a porcilor la 8 luni (kg). Se cântăresc porcii din două loturi de
n1 = 50 porci respectiv n2 = 60 porci se grupează datele în k = 5 clase de valori şi se obţine
tabelul:
129

Ci n1i n2i
Sub 102 kg 5 7
[102; 104) 9 11
[104; 106) 20 18
[106; 108) 7 16
peste 108 kg 9 8

Soluţie Avem:
2 2 2
2  5  60  7  50   9  60  11  50   20  60  18  50 
    
50  60   5  7  50  60   9  11 50  60   20  18 
2 2
.
 7  60  6  50   9  60  8  50 
   1.63
50  60   7  6  50  60   9  8 
Din tabela 3 din Anexă ,pe linia 5 – 1 = 4 GL şi coloanele α = 0.05; 0.01; 0.001 extragem
2 2 2
valorile critice  0.05  9.49;  0.01  13.28;  0.001  18.50 .
Avem  2  1.63   0.05
2
 9.49 deci se acceptă ipoteza H : p1i = p2i pentru toţi porcii
care fac cei n1 = 50 faţă de toţi porcii din care fac parte cei n2 = 60.

Dacă X este însuşire calitativă, fie f1, f2 frecvenţele de sondaj ale însuşirii calitative
X în două sondaje de volume n1, n2 > 30 şi fie p1, p2 probabilităţile lui X în cele două
populaţii din care provin cele două sondaje. În acest caz primul sondaj se împarte în două
clase: C1 în care însuşirea calitativă X este prezentă cu frecvenţa n11 = n1f1 şiC1 în care X
este prezentă cu frecvenţa n12 = n1(1 – f1). În mod analog, al doilea sondaj se împarte în două
clase: C2 în care X este prezentă cu frecvenţa n21 = n2f2 şiC2 în care X este absentă cu
frecvenţa n22 = n2(1 – f2).
2 2
2  n11n2  n21 n1   n12 n2  n22 n1 
   devine:
n1n2  n11  n21  n1n2  n12  n22 
2
n1n2  n1  n2  f1  f 2 
2  care pentru n1, n2   este
 n1 f1  n2 f 2  n1 1  f1   n2 1  f 2  
variabilă χ2 cu k – 1 = 1 GL.
De aici rezultă testul hi patrat al ipotezei H : p1 = p2 faţă de alternativa
H : p1  p2:
Se compară χ2 de mai sus cu valorile critice:  0.05 2 2
 3.84;  0.01 2
 6.63;  0.001  10.80
pentru k – 1 = 1 GL extrase din tabela 6 din Anexa.
Dacă  2   0.05
2
se acceptă ipoteza H : p1 = p2.
În caz contrar, H se respinge după cum urmează:
a) Dacă  2    0.05
2 2
;  0.01  ,atunci p1  p2 semnificativ;
b) Dacă  2    0.01
2 2
;  0.001  , atunci p1  p2 distinct semnificativ;
c) Dacă  2   0.001
2
, atunci p1  p 2 foarte semnificativ.

Exemplu
Fie X = leucoza la vaci.
Frecvenţa leucozei într-un grajd cu n1 = 100 vaci este f1 = 1% iar în al doilea grajd tot
cu n2 = 100 vaci, este f2 = 2%.
130

Să se testeze ipoteza H : p1 = p2 a egalităţii probabilităţilor leucozei în cele două


populaţii de vaci din care provin cele două sondaje.

Soluţie:
2
2
100  100  100  100    0.01  0.02  2
   0.34   0.05  3.84
100  0.01  100  0.02 100  0.99  100  0.98 
pentru k – 1 = 1 GL deci se acceptă ipoteza H : p1 = p2.

7.2. TESTUL HI PATRAT DE INDEPENDENŢĂ A DOUĂ CARACTERE X,Y

Fie o populaţie normală în raport cu două însuşiri X, Y.


Fie un sondaj de n > 30 exemplare estrase din populaţie pe care măsurăm caracterele
X, Y obţinând n > 30 perechi de valori (x, y) pe care le grupăm în h clase după X şi k clase
după Y. această grupare o poate face programul C2GRUP.
Clasele după X, notate C1, …, Ch au centrele de clase x1, … xh iar clasele după Y,
notate D1, …, Dk au centrele de clase y1, …, yk.
Dacă nij este frecvenţa observată a perechilor (x, y) cu x  Ci, y  Dj, alcătuim tabela
de contingenţă h x k:

Y D1 Dk Sume
X linii
C1 n11 n1k s1



Ch nh1 nhk sh
Sume t1 …………………...tk n
coloane

Dacă însuşirile X, Y sunt independente, avem P(xCi şi yDj) = P(xCi) . (yDj)


nqi rj
adică pij = qi .rj de unde npij  .
n
Dar n.pij = n’ij şi n.q i = si; n.rj = tj deci frecvenţele aşteptate n’ij ale perechilor (x, y) cu
si t j
x  Ci şi y  Dj vor fi date de relaţia nij'  ; (i = 1, …, h; j = 1, …, k) şi se vor trece în
n
tabela de contingenţă h x k în dreapta lui nij în paranteze.
Verificăm ipoteza H : X, Y = independente faţă de alternativa
H : X, Y  dependente.
Ca şi teorema 7.1 se demonstrează:

Teorema 7.3
h k (n  n' ) 2
2 ij ij
   '
este variabilă hi patrat cu (h – 1) (k – 1) GL.
i 1 j 1 nij
De aici rezultă testul hi patrat de independenţă al însuşirilor X, Y într-o populaţie
normală:
131

Comparăm pe χ2 din enunţul teoremei 7.3 cu  0.05 2 2


;  0.01 2
;  0.001 extrase din tabela 3 a
.
Anexei,pe linia a (h – 1) (k – 1) GL şi deci avem:
Dacă  2   0.05
2
se acceptă ipoteza H : X, Y = independente. În caz contrar respingem
ipoteza H după cum urmează:
a) Dacă  2    0.05
2 2
;  0.01  , X, Y sunt dependente semnificativ;
b) Dacă  2    0.01
2 2
;  0.001  , X, Y sunt dependente distinct semnificativ;
c) Dacă  2   0.001
2
, X, Y sunt dependente foarte semnificativ.
Dacă X este însuşire cantitativă şi Y este însuşire calitativă avem tabele de
contingenţă hx2 iar dacă X, Y sunt însuşiri calitative avem tabele de contingenţă 2x2.

Exemplul 1
Fie X = înălţimea la greabăn a viţeilor (cm) şi Y = greutatea viţeilor (kg). Se face un
sondaj de n = 50 viţei şi perechile de date obţinute se clasifică după X, Y în h = k = 3 clase de
valori obţinând tabela de contingenţă 3x3:

Clase Y Viţei slabi Viţei mijlocii Viţei graşi Suma linie

Clase X
Viţei scunzi 20(12.5) 5(7.5) 0(5) 25
Viţei potriviţi 10(5) 10(6) 5(4) 20
Viţei înalţi 0(2.5) 0(1.5) 5(1) 5
Suma coloană 25 15 10 n = 50

Să se testeze ipoteza H : X, Y = independente faţă de alternativa H : X, Y =


dependente

Soluţie
si t j
Frecvenţele aşteptate n’ij din paranteze au fost calculate cu relaţia nij' 
n
25  25
De exemplu n11'   12.5
50
2 2 2 2 2
 20  12.5  5  7.5  0  5  5  10  10  6 
Avem  2      
12.5 7.5 5 10 6
2 2 2 2
 5  4   0  2.5   0  1.5   5  1
     35.8
4 2.5 1.5 1
Din tabela 3 a Anexei, pe linia cu (h – 1)(k – 1) = (3 – 1)(3 – 1) = 4 GL şi coloanele α
2 2 2
= 0,05; 0,01; 0,001 găsim valorile critice:  0.05  9.49;  0.01  13.28;  0.001  18.50 .
Cum  2  35.8   0.001
2
rezultă că H se respinge deci X, Y sunt dependente foarte
semnificativ.

Exemplul 2

Fie X = culoare ou găină; Y = greutate ou găină. Se efectuează un sondaj de n = 60


ouă care se grupează în h = 2 clase X (ouă albe şi ouă bej) şi k = 3 clase Y obţinând tabela de
contingenţă 2x3:
132

Clase Y Ouă uşoare Ouă mijlocii Ouă grele Sume linii

Clase X
Ouă albe 10(7.5) 15(15) 5(7.5) 30
Ouă bej 5(7.5) 15(15) 10(7.5) 30
Suma coloană 15 30 15 n = 60

2 2 2 2 2 2
10  7.5 15  15  5  7.5  5  7.5 15  15 10  7.5
2     
 3.33 
7.5 15 7.5 7.5 15 7.5
Din tabela 3 a Anexei, pe linia cu (h – 1)(k – 1) = (2 – 1)(3 – 1) = 2 GL şi coloanele α
2 2 2
= 0.05; 0.01; 0.001 avem valorile critice:  0,05  5.99;  0.01  9.21;  0.001  13.80
Cum  2  3.33   0.05
2
 5.99 , ipoteza H se acceptă deci X, Y sunt independente.

Exemplul 3

Fie X = leucoza vacilor, Y = tratament pentru leucoză vaci, se face un sondaj într-o
fermă cu n = 100 vaci, datele obţinute se clasifică după X, Y şi se obţine tabela de
contingenţă 2x2:

Clase Y Vaci tratate Vaci netratate Sume linii

Clase X
Vaci vindecate 88(81) 2(9) 90
Vaci nevindecate 2(9) 8(1) 10
Suma coloană 90 10 n = 100

2 2 2 2
2  88  81  2  9  2  9 8  1
      60.5
81 9 9 1
Din tabela 3 a Anexei , pe linia a (h – 1)(k – 1) = (2 – 1)(2 – 1) = 1 GL şi coloanele α
2 2 2
= 0.05; 0.01; 0.001 găsim valorile critice  0.05  3.84;  0.01  6.63;  0.001  10.80 ;
Cum  2  60.5   0.001
2
 10.80 , H se respinge deci X, Y sunt dependente foarte
semnificativ.

7.3 TESTELE DE ACURATEŢE A SONDAJULUI

7.3.1 Testul valorilor de sondaj străine

Fie un sondaj de volum mic (n < 30) extras din populaţie şi fie x1, …, xn datele de
sondaj relativ la însuşirea X, scrise în ordine crescătoare : x1 < x2 < … < xn.
Dacă x1 este valoare de sondaj mult mai mică ca restul datelor de sondaj, ea poate avea
o influenţă mare asupra mediei X (vezi secţiunea 5.2) fiind suspectată ca valoare străină,
deci trebuie eliminată din sondaj.
133

X  X1
Acest lucru se testează prin comparaţia valorii a 1  cu valorile critice a10%;
S
a5%; a1% extrase din tabela 12 din Anexă, pe linia lui n.
Ipoteza H : X1 nu e valoare străină de populaţie, se acceptă dacă a < a10%.
În caz contrar H se respinge astfel:
a) Dacă a1  [a10%; a5%), X1 este valoare străină semnificativ;
b) Dacă a1  [a5%; a1%), X1 este valoare străină distinct semnificativ;
c) Dacă a1 > a1%, X1 este valoare străină foarte semnificativ.
După eliminarea lui X1, testul se poate repeta ca mai sus pentru X2 < X , etc.
Dacă Xn este valoare mult mai mare ca restul datelor de sondaj, ea poate avea o
influenţă mare asupra mediei X (vezi secţiunea 5.2) fiind suspectată ca valoare străină, deci
trebuie eliminată din sondaj.
Xn  X
Acest lucru se testează prin comparaţia valorii a n  cu valorile critice a10%;
S
a5%; a1% extrase din tabela 12 din Anexă, pe linia lui n.
Decizia asupra ipotezei H : Xn este valoare străină de populaţie, se ia ca mai sus pentru
X1 .
După eliminarea lui Xn, testul se poate repeta ca mai sus pentru X n – 1 > X , etc.
Pentru sondaje de volum mare (n > 30) influenţa valorilor X1 sau Xn asupra medie X
este mică.

Exemplu
Fie X = greutatea viţeilor (kg). Se cântăresc n = 10 viţei, găsindu-se greutăţile în ovine
crescătoare: 40; 60; 61; 62; 63; 64; 64; 68; 80.
Să se testeze dacă X1 = 40 kg şi X10 = 80 kg sunt valori străine.

Soluţie. Avem X = 63 kg; S = 9.8 kg.


X  X 1 63  40 X  X 80  63
a1    2.35; a10  10   1.73
S 9.8 S 9.8

Din tabela 12 din Anexă, pentru n = 10 avem valorile critice a10% = 2.16; a5% = 2.29;
a1% = 2.54.
Cum a1  [a5%; a1%), X1 = 40 kg este valoarea străină de populaţie distinct
semnificativ.
Cum a10 < a10%, X10 = 80 kg nu este valoare străină de populaţie.
Eliminând valoarea străină X1 = 40 kg recalculăm media pentru X2, …, X10 şi găsim
'
X  65.5kg (cu 2,5 Kg mai mare ca X = 63 kg) şi S’ = 5.98 kg (cu 3.82 kg mai mică decât
S = 9.8 kg).

7.3.2 Testul caracterului aleator al datelor de sondaj

Se calculează varianţa de repartiţie:


2
S 2

 X i  X  şi varianţa de evoluţie:
n 1
134

2
D 2

 X1  X i 1  pentru datele de sondaj aşezate în ordine crescătoare :
n 1
X1 < X2 < … < Xn.
D2
Dacă n < 25 calculăm M  şi îl comparăm cu valorile critice
S2
m1% < m5% < M5% < M1% extrase din tabela 13 din Anexă, pentru valorile lui n.
Dacă M  [m5%; M5%] ,datele de sondaj extrase din populaţie au caracter aleator.
În caz contrar datele de sondaj au caracter nealeator după cum urmează:
a) Dacă M  [m1%; m5%)  (M5%; M1%] atunci datele de sondaj au caracter nealeator
semnificativ;
b) Dacă M < m1% sau M > M1%, datele de sondaj au caracter nealeator distinct
semnificativ;
D2  n2 
c) Dacă n > 25, M  1  este variabilă normală N 0;  deci putem
2S 2  n 2
 1 
 
aplica testul u:
 D2  n2
calculăm u  1  2  : şi îl comparăm pe u cu u 0.05 = 1.96;
 2 S  n  n  1
2

u 0.01 = 2.58; u 0.001 = 3.29


Decizia se ia astfel:
Dacă u < 1.96 datele de sondaj au caracter aleator. În caz contrar avem cazurile:
a) 1.96 < u < 2.58 deci datele de sondaj au caracter nealeator semnificativ;
b) 2.58 < u < 3.29 deci datele de sondaj au caracter nealeator distinct semnificativ;
c) u > 3.29 deci datele de sondaj au caracter nealeator foarte semnificativ.
Exemplu
Fie X = greutatea viţeilor (kg). Se cântăresc n = 10 viţei găsindu-se greutăţile: 60; 60;
60; 61; 61; 62; 63; 66; 67; 70.
Să se testeze caracterul aleator al acestor date de sondaj extrase din populaţie.
Soluţie
630
Avem tabelul de calcul cu X   63kg
10

Xi Xi - X Xi – Xi-1 (Xi - X )2 (Xi – Xi-1)2


60 -3 - 9 -
60 -3 0 9 0
60 -3 0 9 0
61 -2 1 4 1
61 -2 0 4 0
62 -1 1 1 1
63 0 1 0 1
66 3 3 9 9
67 4 2 16 4
70 7 2 49 4
630 - - 110 20
135

110
Varianţa de repartiţie este S2   12.22 iar varianţa de evoluţie este
9
220 D2
D   2.22 deci M  2  0.18
9 S
Din tabela 13 din Anexă, pe linia n = 10 avem m1% = 0.75; m5% = 1.06; M5% = 2.94;
M1% = 3.25.
Cum M = 0.18 < m1% = 0.75 datele de sondaj au caracter nealeator distinct
semnificativ deci sondajul trebuie repetat.

7.4 Testul normalităţii unei populaţii în raport cu un caracter

Testarea normalităţii unei populaţii statistice în raport cu o însuşire X a exemplarelor


sale este extrem de importantă deoarece conform teoremei limită centrală 3.13, pentru n  
orice variabilă aleatoare devine normală iar pe de altă parte metodele statisticii biologice se
aplică cu succes numai populaţiilor normale. Testarea normalităţii populaţiei revine la
verificarea ipotezei H : “Populaţia este normală faţă de însuşirea X” faţă de alternativa
H : “Populaţia nu este normală faţă de însuşirea X”.
7.4.1 Cazul sondajului de volum mic (n < 30)

În acest caz aranjăm datele de sondaj în ordine crescătoare X1 < X2 < … < Xn,
calculăm media de sondaj X şi abaterea – standard S apoi normăm datele de sondaj Xi prin
Xi  X
schimbarea de variabile u i  .
S
În presupunerea că datele de sondaj sunt egal probabile, valorile de sondaj normate
u1, …, u n se pot privi ca o variabilă aleatoare uniformă:
 u1 , ..., u n 
U : 
1 , ..., 1 
 cu M(U) = 0; σ (U) = 1 şi cu funcţia de repartiţie empirică:
 n n 
0 , j0

Fe U j    j n , 1  j  n-1
1 ,jn

Testarea normalităţii populaţiei în raport cu însuşirea X revine la comparaţia funcţiei
de repartiţie empirică Fe cu funcţia de repartiţie N(0, 1) notată cu F şi cu valori în tabela 1 din
Anexă.
Vom extrage din tabela 1 valorile F(u i) ţinând cont că pentru ui < 0 avem F(ui) = 1 –
F(-ui) apoi vom apela la testul Massey care constă în următoarele:

Calculăm d  max Fe  u j   F  u j  şi îl comparăm cu valorile critice d 5%, d10% din


1 j  n

tabela 14 din Anexă.


Decizia are forma:
Dacă d < d 5%, populaţia este normală faţă de însuşirea X.
În caz contrar avem cazurile:
a) Dacă d  [d 5%; d1%), populaţia este nenormală semnificativ faţă de X;
136

b) Dacă d > d1%, populaţia este nenormală distinct semnificativ faţă de X.

Exemplu

Fie X = greutatea viţeilor (kg).


Datele de sondaj de la n = 10 viţei, aranjate în ordine crescătoare ,sunt 60, 61; 62; 63;
64; 65; 65; 66; 68; 70.
Să se testeze normalitatea populaţiei din care provin aceste date, faţă de X.

Soluţie

Avem Xi = 644 deci media de sondaj X 


 Xi  64,4kg . Avem (Xi - X )2 =
n
86.40 deci avem abaterea standard de sondaj
2

S
 X i X
 3.1 Kg.
n 1
Avem tabelul:

Xi Xi  X F(ui) Fe(ui) Fe u i   Fu i 


ui 
S
60 -1.42 0.08 0.10 0.02
61 -1.10 0.14 0.20 0.06
62 -0.77 0.22 0.30 0.08
63 -0.45 0.33 0.40 0.07
64 -0.13 0.45 0.50 0.05
65 0.19 0.58 0.60 0.02
65 0.19 0.58 0.70 0.12 = Max
66 0.52 0.70 0.80 0.10
68 1.16 0.88 0.90 0.02
70 1.81 0.96 1.00 0.04

F(u i) s-au calculat din tabela 1 al Anexei, astfel: F(-1.42) = 1 – F(1.42) = 1 – 0.92 =
008. Mai departe pentru argumente pozitive avem de exemplu F(0.19) = 0.58 etc.
Avem d = 0.12 iar pentru n = 10 din tabela 14 din Anexă, avem d 0.05 = 0.130; d0.10 =
0.156. Cum d = 0.12 < d0.05 , populaţia din care provine sondajul este normală faţă de X.

7.4.2 Cazul sondajului de volum mare (n > 30)

7.4.2.1 Testul hi patrat pentru normalitate

În acest caz cele n date de sondaj X1, …, Xn se grupează în k clase de valori de


X max  X min
lungime   , notate:
k
C1 = (-, l1), C2 = [l1, l2), …, Ck = [lk-1, + ).
Aceste clase au centrele de clase x1, …, xk şi frecvenţele absolute observate în clase
egale cu n1, …, nk (n1 + …+ nk = n).
Testarea normalităţii populaţiei din care provine sondajul faţă de X, se va face cu
ajutorul testului hi patrat de concordanţă din secţiunea 7.1.1 unde frecvenţele aşteptate n’i se
137

vor calcula fie pe baza densităţii de probabilitate f(u) fie pe baza funcţiei de repartiţie N(0, 1)
cu valori în tabela 1 din Anexă.
Fie probabilităţile de apartenenţă a valorilor de sondaj în clase, notate cu pi = P(X 
Ci) ; (i = 1, …, k).
Evenimentele X  Ci sunt independente câte două iar frecvenţele absolute aşteptate n’i
sunt valori medii ale frecvenţelor absolute observate ni deci avem n’i = npi (i = 1, …, k).
Valorile probabilităţilor pi sunt date de:

Teorema 7.4
u2
1 
2
a) Dacă f este densitatea de probabilitate N(0, 1) cu expresia f (u )  e , avem:
2
  Xi  X 
pi  f  ; (i = 1, …, k)
S  S 
u t2
1 
b) Dacă F este funcţia de repartiţie N(0, 1) cu expresia F (u )  e 2
dt şi cu
2 
valori în tabela 1 din Anexă, avem:
  X 
p1  F  1 
 S 
j  X    j 1  X 
pj  F   F  ; (j = 2, …, k-1)
 S   S
   
  X 
pk  1  F  k 
 S 
Demonstraţie
a) Densitatea de probabilitate a variabilei normale N( X , S) este
2
 x X 
1 
2S 2 x X
f(x)= e ; cu schimbarea de variabilă u  ea devine
2 S S
u2
1 1 2  1
 e   f (u ) unde f(u) este densitatea de probabilitate N(0, 1) definită în
S  2  S
enunţ şi cu f(-u) = f(u).
2
 Xi  X 
1    Xi  X 
Avem pi  P  X  Ci   
2
2S
e  f  ; (i = 1, …, k).
2 S S  S 
b) Conform teoremei 2.1 avem:
j  X    j 1  X 
p j  P   j 1  X   j   F   F  ; (j = 1, …, k)
 S   S
   
  X 
Avem ℓo = -  aşa că F  0   F     0 deci din relaţia precedentă rezultă:
 S 
  X 
p1  F  1 .
 S 
138

  X 
De asemenea avem ℓk = +  aşa că F  k   F     1 deci din relaţia
 S 
  X 
precedentă rezultă: pk  1  F  k 1  Q.E.D.
 S 
Exemplu

Fie X = greutatea viţeilor (kg). Cântărind n = 50 viţei, s-au grupat greutăţile lor în k =
5 clase şi s-au calculat X = 64.9 kg, S = 2.3 kg. Să se testeze normalitatea populaţiei din care
provine sondajul fată de X.

Soluţie
Dacă ℓi este marginea dreaptă a claselor Ci ,avem tabelul:

Ci Xi ni i  X   X  pi n’i=npi
F i 
S  S 
Sub 62 kg 61 7 -1.24 0.1075 0.1075 5.37
[62; 64) 63 10 -0.39 0.3483 0.2408 12.04
[64; 66) 65 18 0.47 0.6808 0.3325 16.62
[66; 68) 67 9 1.33 0.9082 0.2274 11.37
peste 68 kg 69 6  1.0 0.0918 4.59

  X 
În coloana F  i  din tabela 1 din Anexă, avem F(- 1.24) = 1 – F(1.24) =
 S 
=1 – 0.8925 = 0.1075 în timp ce F(0.47) = 0.6808 etc.
pi se calculează conform relaţiilor de la punctul b) al teoremei 7.4 astfel:
  X   2  X   1  X 
p1  F  1   0.1075; p 2  F  F   0.3483  0.1075  0.2408 etc.,
 S   S   S 
  X 
p5  1  F  4   1  0.9082  0.0918
 S 
2

 2
k n
i  ni' 
devine:  2  7  5.37 
2


10  12.04 
2


18  16.62 
2


i 1 ni' 5.37 12.04 16.62
2 2
 9  11.37   6  4.59
   1.89 .
11.37 4.59
Din tabela 3 din Anexă, pe linia a k – 1 = 4 GL şi coloanele α = 0.05; 0.01; 0.001
2 2 2
găsim valorile critice:  0.05  9.49;  0.01  13.28;  0.001  18.50
2
χ2 = 1.89 <  0.05  9.49 deci populaţia din care provine sondajul este normală faţă
de X.

7.4.2.2 Testele asimetriei şi boltirii pentru normalitate

Testarea normalităţii populaţiei faţă de însuşirea X se mai poate face pentru sondaje de
volum mare (n > 30) şi cu ajutorul coeficienţilor de asimetrie şi boltire ale căror valori critice
sunt date în tabela 9.
139

3
Coeficientul de asimetrie este A 
 n i X i  X  şi dă gradul de asimetrie pe
nS3
n
orizontală al poligonului frecvenţelor relative observate f i  i faţă de curba normală
n
N( X ,S) adică poziţia relativă a tendinţei centrale dată de media X faţă de tendinţa
dominantă dată de modul M0 (vezi secţiunea 5.2.2)
4
Coeficientul de boltire este B 
 n i X i  X  şi dă gradul de concentrare pe
nS 4
n
verticală a poligonului frecvenţelor relative observate f i  i faţă de curba normală
n
N( X , S) (vezi secţiunea 5.2.2).
Avem B > 1.

Testarea normalităţii pe orizontală a populaţiei faţă de caracterul X se face cu ajutorul


coeficientului de asimetrie A care se compară cu valorile critice A0.05 şi A0.01 pentru valoarea
lui n, extrase din tabela 9 din Anexă .
Dacă A  A0.05 populaţia este normală pe orizontală.
În caz contrar avem cazurile:
a) A0.05  A  A0.01 deci populaţia este nenormală pe orizontală semnificativ;
b) A  A0.01 deci populaţia este nenormală pe orizontală district semnificativ.
Testarea normalităţii populaţiei pe verticală faţă de caracterul X se face cu ajutorul
coeficientului de boltire B care se compară cu valorile critice B0.99 < B0.95 < B0.05 < B0.01
pentru valoarea lui n, extrase din tabela 9 .
Dacă B  [B0.95; B0.05], populaţia este normală pe verticală.
În caz contrar avem cazurile:
a) Dacă B  [B0.99; B0.95) sau B  (B0.05; B0.01], populaţia este nenormală
semnificativ pe verticală.
b) Dacă B < B0.99 sau B > B0,01, populaţia este nenormală distinct semnificativ pe
verticală.

Exemplu

Fie X = greutatea viţeilor (kg)


Avem un sondaj de n = 50 viţei cu media X = 64.9 kg, abaterea standard S = 2.3 kg.
Datele se grupează în k = 5 clase de valori Ci cu centrele de clasă Xi şi frecvenţele absolute în
clase ni:

Ci Xi ni
Sub 62 61 kg 7
[62 – 64) 63 10
[64 – 66) 65 18
[66 – 68) 67 9
peste 68 kg 69 6
140

Avem:
1  3 3 3 3 3
A 7 61  64.9 10 63  64.9  18 65  64.9  9 67  64.9  6 69  64.9  
3  
50  2.3 
 0.02

1  4 4 4 4 4
B 7 61 64.9 10 63  64.9 18 65  64.9  9 67  64.9  6 69  64.9  
4  
50 2.3 
 2.46
Din tabela 9 a Anexei , pentru n = 50 avem valorile critice A0.05 = 0.533; A0.01 =
0.787
Avem A = 0.02 < A0.05 = 0.533 deci populaţia din care a fost extras sondajul ,este
normală pe orizontală.
Din tabela 9 a Anexei , pentru n = 50 avem valorile critice B0.99 = 1.95; B0.95 = 2.13
respectiv B0.05 = 4.01; B0.01 = 4.92
Avem B = 2.46  [B0.95; B0.05] deci populaţia din care a fost extras sondajul, este
normală pe verticală.

7.5 Rezumat

În acest capitol se prezintă testul hi patrat de concordanţă , de independenţă a două


caractere X , Y , de acurateţe (absenţa valorilor străine şi caracterul aleator) pentru sondaj
şi de normalitate a unei populaţii în raport cu un caracter.

7.6 Întrebări

1. Cum de aplică testul hi patrat de concordanţă în genetica mendeliană ?


2. Cum se folosesc tabelele de contingenţă în testarea independenţei a două caractere?
3. Cum se testează absenţa valorilor străine din sondaj şi caracterul aleator al acestuia?
4. Cum se testează normalitatea unei populaţii în raport cu un caracter?

7.7 Bibliografie

1.D.Ene , M.Drăghici, I.N. Alecu “ Statistică aplicată în agricultură “ Ed.Ceres,2003


2.M.Iosifescu şi col. “ Mică enciclopedie de statistică “ Ed.Ştiinţif.şi Enciclop,,1985
3. Anuarul statistic al României , 1990 -2003
141

CAPITOLUL 8.

TESTE ALE CONTROLULUI CALITĂŢII


SI FIABILITĂŢII IN AGRICULTURĂ

Obiectice : Însuşirea de către studenţi a tehnicilor de control statistic al calităţii produselor


agricole şi al fiabilităţii maşinilor agricole în cursul procesului de producţie şi la recepţie
(control simplu şi secvenţial)

Conţinut :

8.1 Controlul statistic de calitate în cursul procesului de producţie


8.2 Controlul statistic de calitate la recepţie
8.3 Rezumat
8.4 Întrebări
8.5 Bibiliografie

Cuvinte cheie : fişe de control, control simplu,control secvenţial,însuşire cantitativă ,


însuşire calitativă , fiabilitate .

Produsele agricole de origine vegetală sau animală sunt destinate în principal


consumului uman,consumului zootehnic şi ca materie primă pentru industrie .
Produsele de consum uman pot fi consumate direct(alimente proaspete)
sau după prelucrare/conservare(făină,mălai,zahăr,ulei,brânzeturi,mezeluri,
băuturi,etc).
Calitatea alimentelor destinate consumului uman este un complex de însuşiri
fizice,chimice,biologice şi estetice care trebuie îndeplinite faţă de anumite baremuri
(standarde) astfel ca să asigure la nivel optim nevoile omului.
Aceleasi cerinţe se impun şi pentru produsele de consum zootehnic (furaje proaspete
sau prelucrate/conservate).
Materiile prime pentru industrie(alimentară,textilă,energetică,cosmetică,etc )privesc
standarde de calitate asupra capacităţii de prelucrare sau conservare în vederea satisfacerii la
nivel optim a cerinţelor ca produse finite (alimente,îmbrăcăminte,încălţăminte,biogaz,produse
fitofarmaceutice si cosmetice,etc).
Maşinile agricole pentru producţia vegetală sau zootehnică trebuie să aibă capacităţi
funcţionale şi de economicitate privind combustibilii conform unor standarde care să le
permită amortizarea cheltuielilor de fabricaţie şi obţinerea de profit în urma utilizării lor .
Cel mai important indicator de calitate al masinilor agricole este siguranţa lor în
funcţionare(fiabilitatea) care trebiue să îndeplinească bareme de timp privind funcţionarea
fără defecţiuni la exploatarea în condiţii reale .
Controlul calităţii produselor agricole şi a fiabilităţii masinilor agricole are caracter
oficial si cheltuielile necesare acestui control se amortizează prin vandabilitatea crescută pe
piaţa internă şi mai ales cea externă.
Controlul calităţii si fiabilităţii în agricultură se face în toate etapele procesului de
producţie cât şi la recepţia produselor sau masinilor agricole.
Acest control poate fi exhaustiv(pentru toate produsele sau masinile) sau selectiv
(prin sondaj) .
Utilitatea statisticii în controlul calităţii şi fiabilităţii rezultă din faptul că agricultura
este un domeniu de predilecţie al acţiunii întâmplării(hazardului)
142

prin variabilitatea genetică a plantelor sau animalelor şi prin variabilitatea condiţiilor de


mediu în care acestea trăiesc.
Astfel orice însuşire cantitativă (măsurabilă) sau calitativă(atributivă) X este o
variabilă aleatoare în jurul standardului de calitate.
Timpul T de funcţionare fără defecţiuni al unei maşini agricole este tot o variabilă
aleatoare calitativă în jurul standardului de calitate.
Dacă X este însuşire cantitativă(măsurabilă) trebuie ca M(X)=μ şi V(X)<W2 iar dacă
X este însuşire calitativă(atributivă) trebuie ca frecvenţa sa de apariţie relativă fn(X) să tindă
către probabilitatea P.

8.1 CONTROLUL STATISTIC DE CALITATE ÎN CURSUL


PROCESULUI DE PRODUCŢIE

Fie X o caracteristică de calitate care poate fi cantitativă(măsurabilă) sau


calitativă(atributivă).
În cursul procesului de producţie în agricultură,asupra caracretisticii X acţionează o
multitudine de factori care provoacă asupra valorilor lui X variaţii accidentale(cu cauze
necontrolabile) şi variaţii sistematice(cu cauze controlabile).
Obiectul controlului de calitate este în acest caz,supravegherea variaţiilor sistematice şi
eliminarea lor prin corecţii aduse procesului de producţie.
De fapt caracteristica de calitate X este un proces aleator Xt ; 0≤ t ≤DS unde DS este
durata unei serii în agricultură ( DS = durata perioadei de vegetaţie la plante şi DS = durata
unui ciclu de exploatare a animalelor ).
Realizările Xi , i= 0,1,2,… ale lui Xt se presupun a fi variabile aleatoare normale
N(μ,σ) ,independente câte două.
Împărţim intervalul de timp [ 0; DS ] în m subinrtervale de timp egale :
[ t0 = 0 ; t1) , [ t1; t2 ],…,[ tm-1; t m = DS ] şi efectuăm la momentele de timp t1 , t2 ,…, tm= DS ,
m sondaje toate de volum n ,obţinând datele de sondaj :
x11,x12,…,x1n la momentul t1;
x21, x22,…,x2n la momentul t2 ;
………………………………
xm1 ,xm2,…, xmn la momentul tm .
a) Dacă X este însuşire cantitativă(măsurabilă) , din datele de sondaj calculăm mediile
sondajelor :

1 n
xi   xij
n j 1
abaterile-standard de sondaj:

1 n
si   ( xij  xi ) 2
n  1 j 1
precum şi media totală :
1 m n
x  xij
mn i 1 j 1
respectiv abaterea-standard totală :

m n
1
s  ( xij  x)2
mn  1 i 1 j 1
143

Fie xi,min = m i n xij ; xi,max = m a x xij deci avem amplitudinile


1≤j≤n 1≤j≤n
de sondaj ai = xi,max – xi,min .

b) Dacă X este însuşire calitativă(atributivă) avem xij = 1 dacă obiectul


numărul j din sondajul numărul i este rebut şi xij = 0 în caz contrar deci
n
di  
j 1
x ij

va fi numărul de rebuturi în sondajul numărul i iar :


m n
d   
i  1 j  1
x ij

Dacă populaţia este de volum N , raportul f = n/N se numeşte factor de sondaj.


Mărimea lui f şi cadenţa luării probelor m depind de rapiditatea apariţiei variaţiilor
sistematice şi de costul luării probelor .
Pentru caracteristica de calitate X controlăm doi parametri : M care ne Indică tendinţa
centrală şi D care ne indică împrăştierea valorilor lui X.
Pentru aceasta se construiesc intervalele de încredere IM pentru M şi ID pentru D .
În controlul propriuzis, dacă o valoare M i a lui M cade în afara intervalului IM sau dacă o
valoare Di a lui D cade în afara intervalului ID ,se aduc corecţii procesului de producţie .
Intervalele de încredere IM şi ID au forma : [ LCI ; LCS ] cu încrederea 1 – α şi riscul α.
LCI se numeşte limita de control inferioară pentru X iar LCS se numeşte limita de
control superioară pentru X .
Aceste limite se prezintă grafic pe fişele de control al calităţii de forma :

8.1.1 Cazul unei însuşiri cantitative

În acest caz în rolul lui M vom lua mediile de sondaj xi sau medianele de sondaj Mei iar
în rolul lui D vom lua abaterile-standard de sondaj si sau amplitudinile de sondaj ai
Avem de verificat prin control al calităţii , ipoteza H: μ= μ0 faţă de alternativa Ĥ: μ≠ μ0
respectiv H: σ= σ0 faţă de alternativa H: σ> σ0 .

a) Fişa de control pentru medie(fişa X )


144

Mediile sondajelor x1,…,xm sunt variabile aleatoare normale N(μ0, σ0/√n ) deci vom
lua :

0 0
LCI ( x)  0  u / 2 ; LCS ( x)  0  u / 2 (1)
n n

Dacă μ0 nu este cunoscut , se aproximează cu xˉ iar dacă σ0 nu este


cunoscut ,se aproximează cu s .
De regulă se ia uα/2 =3 deci 1- α = 99.865% şi α=0.135% .

b)Fişa de control pentru abaterea-standard (fişa s) .

Mărimile (n-1)si2 / σ02 sunt variabile aleatoare χ2 cu n-1 GL deci vom lua :

12 / 2 2 / 2
LCI ( s)  . 0 ; LCS ( s)  . 0 (2)
n 1 n 1
Pentru controlul calităţii abaterii-standard se foloseşte numai LCS .

În locul fişei de control b) pentru abaterea-standard se poate folosi :


b) Fişa de control pentru amplitudine ( fişa R)

Amplitudinea unui sondaj de volum n , notată a = xmax – xmin este variabilă aleatoare
deci este variabilă aleatoare şi raportul w = a/σ .
Mediaw are valorile date de tabela 15 din Anexă.
Un estimator al lui σ este σˆ= a /w deci limitele de control pentru medie din relaţiile
(1) devin :
a a
LCI ( x)  x  3  ; LCS ( x)  x  3  (3)
n w n w
Notăm :

3
 
nw
cu valori în tabela 15 din Anexă, deci limitele de control pentru medie devin :

LCI ( x)  x   .a ; LCS ( x)  x   .a (4)

Din relaţia a = wσ rezultă σ(a) = σ(w). σ şi cum σ nu se cunoaşte, va fi


estimat de σˆ = a / w aşa că un estimator pentru σ(a) va fi σˆ(a) = σ(w).a / w
deci limitele de control pentru a capătă forma :

 ( w)  ( w)
LCI (a )  a  3. .a ; LCS ( a )  a  3. .a (5)
w w

Cu notaţiile :
145

 ( w)  (w)
D1  1  3. ; D2  1  3.
w w

care au valori în tabela 15 din Anexă, limitele de control pentru a ,capătă forma:

LCI (a )  D1 .a ; LCS(a)=D2 .a (6)

Exemplu

Fie X greutatea puilor de carne la 40 zile.

Luăm m = 10 sondaje în 10 serii diferite , a câte n = 4 valori fiecare şi obţinem datele de


sondaj din tabelul următor:

Nr. Date sondaj xij Xi,min xi xi,max ai si

Sondaj

1 1000;1100;1050;1010 1000 1040 1100 100 45.46

2 950;980;1030;1000 950 990 1030 80 33.67

3 1100;1020;1010;990 970 1010 1050 80 33.67

4 970;1020;1000;990 990 1030 1100 110 48.30

5 1100;1030;990;960 960 1020 1010 140 60.55

6 1020;1010;1050;1000 1000 1020 1050 50 21.60

7 970;1010;990;1030 970 1000 1030 60 25.82

8 980;990;1010;1100 980 1020 1100 120 54.77

9 1040;1020;1030;910 910 1000 1040 130 60.55

10 970;990;1020;1020 970 1000 1020 50 24.49

TOTAL xmin= x = Xmax= a= s=

910 1013 1100 92 40.84

Pentru n =4 , din tabela 15 din Anexă, avem δ = 0.729 deci relaţiile (4) devin:

LCI(x ) = 1013 – 0.729x92 = 945.932

LCS(x ) = 1013 + 0.792x92 = 1080.68


Toate valorile xi sunt între aceste limite deci X corespunde la controlul
calităţii în cursul procesului de producţie , ca tendinţă centrală a valorilor.
Pentru n = 4 , din tabela 15 din Anexă avem D1 = 0 ; D2 = 2.282 deci relaţiile (6) devin :
146

LCI(a) = 0 ; LCS(a) = 2.282x92 = 209.944


Niciuna din valorile ai nu depăşeşte pe LCS(a) deci X corespunde la
controlul calităţii în cursul procesului de producţie ,ca împrăştiere a valorilor.

În cazul măsurătorilor individuale ,volumele sondajelor sunt egale cu 1


şi limitele de control pentru cele m valori individuale xi vor fi:

am am
LCI ( x)  x  3. ; LCS ( x)  x  3. (7bis)
w w

Aici w se culege din tabela 15 din Anexă pentru n = 2 iar am este
media diferenţelor succesive aim =| x i – x i – 1 | numite amplitudini mobile.

Exemplu

X = producţia zilnică de lapte de vacă(litri/zi) în a 28-a zi de la fătare

(controlul Nr. 1). Avem m=10 sondaje a câte n=1 vaci fiecare cu producţiile xi :

xI 9.5 10 10.4 9.9 11 10.7 10.5 12.4 11.7 10.9 x =

10.8

|xi-xi-1| - 0.5 0.4 0.5 1.1 0.3 0.2 1.9 0.7 0.8 am=

0.71

Din tabela 15 din Anexă , pentru n=2 valori în amplitudinile mobile , avem

w =1.128 deci :

LCI(x)=10.8 – 3 .(0.71/1.128)=8.91
LCS(x)=10.8 + 3 .(0.71/1.128)=12.69

Toate cele 10 producţii individuale sunt între limitele precedente, deci


caracteristica X corespunde calităţii .

8.1.2 Cazul unei însuşiri calitative

În acest caz vom avea un singur parametru M în rolul căruia vom lua fie numărul di de
exemplare-rebut din sondajul nr. i , fie frecvenţa rebuturilor fi = di / n din sondajul
nr. i ; (i=1,2,…,m).
d i este variabilă binomială adică :

P(d i = k) = Cnk p 0k (1- p0) n – k

unde p0 este proporţia rebuturilor în cursul procesului de producţie .


Avem de verificat ipoteza H : p = p 0 faţă de alternativaH: p>p 0 .
147

Fie k1(α) cel mai mare număr natural pentru care avem :

k1 ( )
k 
P(d  k1 ( ))  C n p0k (1  p0 ) n k  1 
k 0 2

Fie k2(α) cel mai mare număr natural pentru care avem :

n

P(d  k2 ( ))   Cnk p0k (1  p0 ) n k  1 
k  k2 ( ) 1 2
Avem :

LCI(d) = k1(α) ; LCS(d) = k2(α) (7)

Din păcate , limitele (7) implică calcule laborioase deaceea pentru n ≥40
şi p0 ≤0.1 , variabila binomială poate fi aproximată cu variabila normală.

a) Fişa de control pentru frecvenţa rebuturilor (fişa p )

Un estimator pentru p0 este fi = d i /n unde di este numărul rebuturilor


din sindajul nr. i de volum n .
Avem :
M(fi)= p0 şi V(fi)=p0(1- p0)/n
deci limitele de control pentru p 0 vor fi :

p0 (1  p0 ) p (1  p0 )
LCI ( p0 )  p0  3. ; LCS ( p0 )  p0  3. 0 (8)
n n

Cum p0 nu se cunoaşte , se aproximează cu :


1 m 1 m 1 m n
f   i mn 
m i 1
f 
i 1
d i   xij
mn i 1 j 1

aşa că limitele de control pentru p0 devin :


f (1  f ) f (1  f )
LCI ( p0 )  f  3. ; LCS ( p0 )  f  3. (9)
n n

Dacă LCI(p 0) < 0 , luăm LCI(p0) = 0 .


Exemplu
X = starea de ecloziune a ouălelor de găină în a 18-a zi de incubaţie.
Se efectuează m = 10 sondaje a câte n = 100 ouă în 10 serii de incubaţie, găsindu-
se numărul di de ouă neeclozionate în aceste sondaje şi frecvenţele de rebut fi :
Nr. 1 2 3 4 5 6 7 8 9 10 TOTAL
Sond
di 3 5 2 0 4 7 8 3 2 6 d=4

fi 0.03 0.05 0.02 0 0.04 0.07 0.0 0.03 0.02 0.06 f=0.04
8
148

Avem f = 0.04 deci din relaţiile (9) obţinem :

0.04  0.96
LCI ( p0 )  0.04  3  0.04  0.059  0 deci LCI(p 0 )  0
100
0.04  0.96
LCS ( p0 )  0.04  3  0.04  0.059  0.099  0.10
100
b)
Se observă că toate valorile fi nu depăşesc limita superioară LCS(p0) deci X corespunde
la controlul calităţii în cursul procesului de producţie ca proporţie a rebuturilor .

b)Fişa de control pentru numărul rebuturilor (fişa C )

În acest caz numărul di al rebuturilor într-un sondaj de volum n poate fi considerată


variabilă Poisson cu media şi varianţa λ , deci limitele de control
pentru d au forma :

LCI (d )    3  ; LCS ( d )    3  (10)


Cum λ nu se cunoaşte , îl aproximăm cu :
1 m
d  di
m i1

deci limitele precedente capătă forma :

LCI (d )  d  3 d ; LCS (d )  d  3 d (11)


Dacă LCI(d) <0 luăm LCI(d) = 0 .

Exemplu

Pentru exemplul anterior avem d= 4 aşa că :


LCI (d )  4  3 4  2 deci LCI(d)=0
LCS(d)=4+3 4  10
Niciuna din valorile di din cele 10 sondaje nu depăşeşte pe LCS(d)
deci X corespunde la controlul calităţii în cursul procesului de producţie
ca număr de rebuturi.

8.2 CONTROLUL STATISTIC DE CALITATE LA RECEPŢIE

D
Fie un lot de N produse din care D au defecte şi fie p  proporţia acestor defecte.
N
149

Efectuăm un control selectiv al calităţii produselor astfel:extragem din lot un sondaj de


n
n produse (factorul de sondaj este ) şi le controlăm, găsind  produse defecte.
N
Dacă δ  c , lotul se acceptă ca fiind corespunzator calităţii X controlate,iar dacă
δ  c , lotul se respinge ca fiind necorespunzator calităţii X controlate.In lotul respins se
înlocuiesc produsele defecte cu altele bune.
Probabilitatea de acceptare a lotului ca funcţie de p (proporţia produselor defecte în
intregul lot) se notează cu L(p) şi se numeste caracteristica operativă a controlului de
calitate.
Graficul său are forma:

α  1  Lp 0  este eroarea de ordin I, adică probabilitatea respingerii unui lot cu


defecte putine,deci este riscul furnizorului.
β  Lp1  este eroarea de ordin II, adică probabilitatea acceptării unui lot cu defecte
multe,deci este riscul beneficiarului.
p 0 se va numi calitate de acceptare, iar p1 calitate limită admisă.
Controlul calitatii revine deci la verificarea ipotezei H : p  p 0 faţă de alternativa
H : p  p1 .
c
Evident L  p   P  δ  c    P  δ  d  .
d 0

In plus valoarea medie pentru volumul n de sondaj este: n  n  L  p   N 1  L  p   .


Observăm că pentru p=0 avem n  n ,iar pentru p=1 avem n  N .
 este variabilă hipergeometrică deoarece obiectele controlate deja (între care pot fi şi
rebuturi) nu se mai întorc în populaţie,de aceea avem:
d n d
C dD  CnNdD C N p  C N1 p 
P δ  d    .
C DN C NN p
150

δ δ D
Prin calcul rezultă că ca variabila aleatoare,are media M    şi varianţa
n n N
 δ  1 N  n D  N  D δ
V     2
deci este o estimaţie absolut corectă pentru proporţia
 n  n N 1 N n
D
reală p  de produse defecte ale lotului,deoarece:
N
δ D δ
M   ,iar lim V    0 .
 n N n 
n
Pentru , daţi, trebuie să aflăm pe n şi c astfel ca:
L  p 0   1  α; L  p1   β ,
adică:
c C dNp1  C nN1d p0 

d 0 C NNp0
 1 α ;

c CdNp1  CnN1dp1 

d 0 C NNp1
β.

Aceste ecuaţii în raport cu n şi c sunt foarte greu de rezolvat datorită calculelor cu


combinări.In unele cazuri variabila hipergeometrică poate fi inlocuită cu variabila
binomială,Poisson sau normală.
n
1)Dacă este mult mai mic ca 1,avem:
N
c
nd
L  p    Cdn  p d 1  p 
d 0
încât n si c satisfac ecuaţiile:
c n d
d d
C n  p  1  p 0 
0  1 α;
d 0
c
d n d
C n  p1d  1  p1  β.
d 0

n
2)Dacă p şi sunt mult mai mici ca 1, avem:
N
c
λd
L  p     e λ
d  0 d!

n
unde λ  n  p  D , deci n şi c satisfac ecuaţiile:
N
d
c
 n  p 0   n p 0

d 0 d!
e  1 α ;
d
c
 n  p1 
  e n p1  β .
d 0 d!
3)Dacă n este foarte mare, avem:
 c  np 
L p  F  ,
 np 1  p  
 
151

unde F este funcţia de repartiţie N(0,1) cu valori in tabela 1 a Anexei,aşa că n şi c


satisfac ecuaţiile:
 c  np 
0
F   1 α ;
 np0 1  p0  
 
 c  np 
1
F  β.
 np1 1  p1  
 

Prezentăm mai departe două tipuri de control al calităţii şi fiabilităţii: controlul simplu
şi controlul secvenţial.

8.2.1 Controlul unei însuşiri cantitative

8.2.1.1 Controlul simplu al unei însuşiri cantitative

Fie Tmax limita superioară admisă pentru valorile însuşirii cantitative(măsurabile)


X.
Pentru ,  şi p 0 , p1 daţi, trebuie să găsim volumul sondajului n şi pragul de
acceptare c al lotului la controlul calităţii.
Lotul este acceptat dacă la sondajul efectuat găsim media X  Tmax  cσ .
Această condiţie se mai scrie: X  μ   Tmax  μ   cσ sau:
Xμ T μ 
n   max  c n .
σ  σ 
Dar proporţia de produse defecte este:
T μ Tmax  μ
p  1  F  max , aşa că  Up .
 σ  σ
Xμ
Aşadar lotul se acceptă dacă: n   Up  c n .
σ
Pentru p  p 0 obţinem:
X μ 
P  
n  U p0  c n   1  α ,
 σ 
iar pentru p  p1 obţinem:
X  μ 
P 
n  U p1  c  n  β.
 σ 
Xμ
Conform demonstraţiei teoremei 6.1 din secţiunea 6.2, n
σ
este variabilă N(0,1),deci avem : 
U α  U p0  c  
n; U1β  U p1  c  n
Ţinând cont că: U1β   Uβ , am demonstrat:

Teorema 8.1

In cazul testului simplu al controlului calităţii avem:


152

2
 U α  Uβ  U α  U p1  Uβ  U p0
n   ;c  (1)
 Up  Up  U α  Uβ
 0 1 

Dacă =necunoscută, luăm  S, deci c rămâne neschimbat,iar n creşte de


2
 c 
1   ori.
 2
Dacă Tmin este limita inferioară admisă pentru valorile lui X, lotul este
acceptat dacă la sondajul efectuat găsim media:
X  Tmin  c  σ , ceea ce duce la aceleaşi valori ca mai sus pentru n şi c.
Fie T limita (superioară sau inferioară) pentru valorile lui X.
 T  μ0   T  μ1 
Fie 1  F   p0 ; F    p1 , aşa că:
 σ   σ 
μ 0  T  U p0  σ; μ1  T  U p1  σ
T  μ0 μ T
deoarece U p0  ; U p1  1
σ σ
Verificarea ipotezei H : p  p 0 faţă de alternativa H : p  p1 devine: H : μ  μ0
faţă de alternativa H : μ  μ1 iar valorile din teorema 7.1 devin:

  U α  Uβ  σ   U α  μ1  U β  μ 0    U α  U β  T
n ; c  (2)
 2T   σ 0  σ1   σ   U α  Uβ 

Exemple:

1)Se controlează X=greutatea unui lot de pui livraţi(kg) pentru care limita inferioară
de calitate este Tmin = 1kg. Dacă se ştie că  = 0.1kg şi se dau =3%; =7%;
p0  1%; p1  4% , să se determine volumul n al sondajului şi limita de acceptare
Tmin  c  σ pentru media de sondaj X .
Solutie:
Din tabela 1 a Anexei, obţinem F  U 3%   97%  0.9700 deci
U3%  1.88; F  U 7%   93%  0.9300 deci U 7%  1.48; F  U1%   99%  0.9900 deci
U1%  2.33; F  U 4%   96%  0.9600 deci U 4%  1.75.
Din relaţiile de mai sus obţinem: μ0=0.767 Kg ; μ1=1.175 Kg.
Înlocuind aceste valori în relaţia (1) găsim:
n=34; c=2 deci Tmin  cσ  1.2kg .
Lotul se acceptă dacă dintr-un sondaj de n=34 de pui livraţi,greutatea medie al
acestora este de cel puţin 1.2 kg.

2)Se controlează X=grosimea stratului de grăsime la greabăn al porcilor livraţi(cm)


pentru care limita superioară de calitate este Tmax  4cm .
153

Dacă se ştie că =0.1 cm şi se dau =5%; =10%; p0  2%; p1  7% , să se


determine volumul sondajului n şi limita de acceptare Tmax  c  σ pentru media de sondaj
X.
Solutie:
Din tabela 1 din Anexă obţinem ca în exemplul anterior:
U5%  1.65; U10%  1.28; U 2%  2.06; U 7%  1.48 ;
Din formulele precedente obţinem : μ0=3.794 cm; μ1=4.148 cm.
Din formula (1) rezultă: n=12; c=1.7; Tmax  cσ  3.83 cm.
Lotul se acceptă dacă într-un sondaj de n=12 porci,grosimea medie a stratului de
grăsime la greabăn nu depăşeste 3.83 cm.

8.2.1.2 Controlul secvenţial al unei însuşiri cantitative

In acest caz volumul n al sondajului nu se mai determină în prealabil,ci se face


controlul în lot,produs cu produs,până la acceptarea sau respingerea lotului la controlul de
calitate.
In acest fel,dacă p este mult mai mic ca p 0 (lot foarte bun) sau mult mai mare ca
p1 (lot foarte prost),volumul n de sondaj este mult mai mic ca în cazul sondajului simplu.
Fie Tmax limita superioară admisă pentru valorile însuşirii cantitative X şi fie μ 0 , μ1
 T  μ0   T  μ1 
definite de relaţiile: 1  F  max   p 0 ; F  max   p1 ,
 σ   σ 
de unde rezultă: μ 0  Tmax  U p0  σ; μ1  Tmax  U p1  σ .
Controlul de calitate revine a la verifica ipoteza H : μ  μ 0 faţă de alternativa
H : μ  μ1 .
Fie Pn 0 probabilitatea de a obţine valorile de sondaj x1 ,..., x n în cazul în care este
adevarată ipoteza H şi Pn1 probabilitatea de a obţine valorile x1 ,..., x n în cazul în care
este adevarată ipoteza alternativă H .
Avem cazurile:

β P 1 β
1)  n1  , în care caz se continuă măsurătorile;
1  α Pn 0 α
P β
2) n 1  , în care caz se ia decizia acceptării ipotezei H : μ  μ 0 ;
Pn 0 1  α
P 1 β
3) n 1  , în care caz se ia decizia acceptării ipotezei alternative H : μ  μ1 .
Pn 0 α
Populaţia fiind presupusă normală şi datele de sondaj independente,avem:
2 2
  x i μ 0    x i μ1 
1  2 1  2
Pn 0  n
e 2σ şi Pn 1  n
e 2σ
,
 2π  σ   
2π  σ
de unde rezultă:
154
2 2
  x i  μ 0     x i μ 1 
Pn 1 2σ 2
e .
Pn 0
Pn 1 μ1  μ 0  n  μ 0  μ1  
aşa că avem: ln  2  x i  
Pn 0 σ  2 
Cu notaţiile:

μ 0  μ1 σ2 β σ2 1- β
a ; b0  ln  0 ; b1  ln > 0 (3)
2 μ1  μ 0 1  α μ1  μ 0 α

cazurile 1)-3) de mai sus,prin logaritmare în baza e,duc la :

Teorema 8.2
Avem cazurile:
1) a.n  b 0   x i  a.n  b1 , în care caz se continuă măsuratorile;
2)  x i  a.n  b 0 , în care caz se acceptă ipoteza H : μ  μ0 ;
3)  x i  a.n  b1 , în care caz se acceptă ipoteza alternativa H : μ  μ1 .
Practic, se reprezintă grafic dreptele x  a.n  b 0 şi x  a.n  b1 ,
în sistemul de axe cu abscisa n şi ordonata x i şi se continuă măsuratorile până când
punctul de coordonate n ; x  i trece prin una din zonele 2 sau 3:

Tmax fiind limită superioară pentru X, acceptarea ipotezei H duce la acceptarea


lotului la controlul calităţii, deci zona 2 este zona de acceptare a lotului,în timp ce acceptarea
ipotezei alternative duce la respingerea lotului la controlul calităţii,deci zona 3 este zona de
respingere a lotului. Dacă Tmin este limită inferioară pentru X ,situaţia este inversă.
Exemple:
155

1)X=greutatea porcilor la livrare(kg) limitată inferior.Dacă se dau =5%;=2% şi se


ştie că =5 kg,să se verifice ipoteza H : μ  100kg faţă de H : μ  110kg prin control
secvenţial.
Solutie:
Avem μ 0  100kg; μ 1  110kg; σ  5kg; α  5%; β  2% ,deci conform formulelor (3)
obţinem: a  105kg; b 0  9.65; b1  7.44 .
Tabelul de calcul cu datele de sondaj x i şi sumele x i este:
n xi 105n-9.65 x 1    x n 105n+7.44
1 107 95.35 107 112.44
2 103 200.35 210 217.44
3 109 305.35 319 322.44
4 96 410.35 415 427.44
5 103 515.35 518 532.44
6 105 620.35 623 637.44
7 100 725.35 723 742.44

După n=7 măsuratori,avem  x i  a.n  b 0 , deci se acceptă H,aşa că lotul se


respinge la controlul calităţii deoarece X este limitată inferior.

2)X=grosimea stratului de grăsime la greabăn pentru porci(cm) limitată superior.


Dacă se dau =6%;=9% şi se ştie că =1 cm,să se verifice ipoteza H : μ  3cm faţă
de alternativa H : μ  4cm , prin control secvenţial.
Solutie:

Avem μ 0  3cm; μ 1  4cm; σ  1cm; α  6%; β  9% , deci conform formulelor (3)


obţinem: a  3.5cm; b 0  2.35; b1  2.72
Tabelul de calcul cu datele de sondaj x i şi sumelor x i ,este:
x 1    x n
n xi 3.5n-2.35 3.5n+2.72

1 3.6 1.15 3.6 6.22


2 4.1 4.65 7.7 9.72
3 3.1 8.15 10.8 13.22
4 3.0 11.65 13.8 16.72
5 3.8 15.15 17.6 20.22
6 2.9 18.65 20.5 23.72
7 2.6 22.15 23.1 27.22
8 3.0 25.65 26.1 30.72
9 2.7 29.15 28.8 34.22

Dacă n=9 măsurători,avem  x i  a.n  b 0 , deci se acceptă H,


aşa că lotul se acceptă la controlul calităţii deoarece X este limitată superior.
156

8.2.2 Controlul unei însuşiri calitative

8.2.2.1 Controlul simplu al unei însuşiri calitative

Pentru α, β, p 0 , p1 daţi,trebuie să găsim volumul n al sondajului şi pragul de


acceptare c al lotului la controlul de calitate.
Lotul este acceptat dacă la sondajul efectuat găsim numărul de rebuturi δ  c .
1 2
Se poate arăta că p   p cu 2(c+1) grade de libertate.
2n
1 2 1 2
Pentru p  p 0 avem 1α  p 0 , iar pentru p  p1 avem β  p1 , de unde
2n 2n
rezultă :

Teorema 8.3
2 β2
Avem n  1α  cu 2(c+1) grade de libertate.
2p 0 2p1
In concluzie vom căuta pentru câte grade de libertate (egale cu 2(c+1)) avem:
12α β2
 , deci găsim pe c, apoi din teorema 8.3 găsim pe n.
p0 p1

Exemplu:

X=ecloziunea unui lot de ouă de găină în a 18-a zi de incubaţie.


Dacă se dau α  5%; β  5%; p 0  3%; p 1  6% , se cere volumul sondajului n şi
pragul de acceptare c al lotului la controlul calităţii.
Solutie:
2 2
 0.95  0.05 2 2
Trebuie să avem:  sau 3 0.95   0.05 , egalitate care se realizează
0.03 0.06
2 2
pentru 2(c+1)=19 GL ,pentru că în acest caz avem  0.95  10.12;  0.05  30.14 .
10.12
Rezultă că c=9 şi n   167 .
2  0.03
Lotul se acceptă dacă dintr-un sondaj de n=167 de ouă ,cel mult c=9 ouă sunt
neeclozionate.

8.2.2.2 Controlul secvenţial al unei însuşiri calitative

1, dacă al i-lea produs din sondaj este defect faţă de însuşirea X

Fie: x i  
0, în caz contrar

deci dacă x i sunt independente, x i este variabilă binominală de parametri
p  P x i   1 şi n.
Controlul de calitate revine la verificarea ipotezei H : p  p 0 faţă de alternativa
H : p  p1 .
In cazul nostru avem:
157

nk n k
Pn 0  Ckn p k0 1  p 0  ; Pn 1  Cnk p1k 1  p1  ,

unde k   xi este numărul produselor din sondaj care sunt rebuturi faţă de însuşirea
calitativă X.
k n k
P p   1  p1  Pn 1 p   1  p1 
Avem n 1   1    ,deci: ln  k .ln  1    n  k  .ln  .
Pn 0  p 0   1  p0  Pn 0  p0   1  p0 
Dându-se  şi , respectiv p 0 , p1 avem cazurile:
β P 1 β
1)  n1  , în care caz se continuă măsurătorile;
1  α Pn 0 α
P β
2) n 1  , în care caz se decide că H : p  p 0 este adevarată;
Pn 0 1  α
P 1 β
3) n 1  , în care caz se decide că alternativa H : p  p1 este adevarată.
Pn 0 α
Cu notatiile:
1  p0 β 1 β
ln ln ln
1  p1 1 α ;b  α
a ;b  (4)
p1 1  p 0  0 p1 1  p 0  1 p1 1  p 0 
ln ln ln
p 0 1  p1  p 0 1  p1  p 0 1  p1 

cazurile 1)-3) de mai sus prin logaritmare în baza e,conduc la :

Teorema 8.4

Avem cazurile:
1) a.n  b 0  k  a.n  b1 , în care caz se continuă masuratorile;
2) k  a.n  b 0 , în care caz se acceptă ipoteza H;
3) k  a.n  b1 , în care caz se acceptă alternativa H .
Practic,se reprezintă grafic dreptele x  a.n  b0 şi x  a.n  b1 în sistemul de axe cu
abscisa n şi ordonata k   xi şi se continuă măsurătorile până când punctul de
coordonate (n,k) trece în una din zonele 2 sau 3.
Acceptarea ipotezei H duce la acceptarea lotului la controlul calităţii,deci zona 2 este
zona de acceptare a lotului în timp ce acceptarea alternativei H duce la respingerea lotului la
controlul de calitate,deci zona 3 este zona de respingere a lotului.

Exemplu:

X=viabilitatea puilor de găină in vârstă de o zi.


Se dau =4%;=6%.
Să se verifice ipoteza H:p<10% faţă de alternativa H : p  90% prin controlul
secvenţial.
Solutie:
158

Avem α  0.04; β  0.06; p 0  0.1; p1  0.9 , deci conform formulelor (4) obţinem:
a  0.5; b 0  0.63; b1  0.72 .
Tabelul de calcul cu datele de sondaj x i şi sumele k   x i , este:

n xi 0.5n-0.63
k  x1    x n 0.5n+0.72

1 0 -0.13 0 1.22
2 1 0.37 1 1.72
3 1 0.87 2 2.22
4 0 1.37 2 2.72
5 0 1.87 2 3.22
6 1 2.37 3 3.72
7 0 2.87 3 4.22
8 0 3.37 3 4.72

După n=8 pui controlaţi se acceptă ipoteza H,deci lotul se acceptă la controlul calităţii.

8.2.3 Controlul fiabilităţii maşinilor agricole

8.2.3.1 Controlul simplu al fiabilităţii maşinilor agricole

Dacă pentru produsele agricole destinate consumului este important controlul statistic
al calităţii lor in raport cu diferite însuşiri X, măsurabile sau atributive, pentru maşinile
agricole este important controlul statistic al siguranţei în functionare sau al fiabilitatii lor.
Definiţia fiabilităţii a fost dată în secţiunea 4.2
Fiabilitatea este o însuşire calitativă(atributivă) pentru care p 0 şi p1 sunt înlocuiţi
cu T0 (timpul mediu de funcţionare fără defecţiuni acceptat), respectiv T1 (timpul mediu
de funcţionare fără defecţiuni limită admis),deci trebuie verificată ipoteza H : t  T0
faţă de alternativa H : t  T1 , unde avem T 0 >T1 spre deosebire de p 0  p1 la
însuşirile X atributive.
In cadrul testului simplu al controlului fiabilităţii, pentru α;β; T0 ;T1 daţi,trebuie găsite
numărul de defecţiuni acceptate c şi timpul de acceptare t c al lotului la controlul fiabilităţii.
Lotul este acceptat dacă:
a)timpul de funcţionare până la apariţia a c defecţiuni este t  t c sau
b)numărul de defecţiuni apărute în timpul de funcţionare t c este k  c.
In caz contrar lotul se respinge la controlul fiabilităţii.
2t
Se poate arăta că t  2c cu 2(c+1) grade de libertate.
p
2t c 2t
Pentru t  T0 avem: T0  2
, iar pentru t  T1 avem: T1  2c , de unde
1α β
rezultă:

Teorema 8.5
T T
Avem t c  0 12α  1  β2 cu 2(c+1) grade de libertate.
2 2
159

Vom căuta în tabela 3 din Anexă ,pentru câte grade de libertate, adică 2(c+1), avem
2 2
T0 1 α  T1  β , deci obţinem pe c, apoi din teorema 8.5 obţinem pe t c .

Exemplu:

Pentru controlul fiabilităţii unor maşini agricole de împrăştiat îngrăşăminte chimice, se


dau α  5%;β  5%; T0  160 ore; T1  80 ore.
Să se determine numărul c de maşini defecte acceptat şi timpul de acceptare t c la
controlul fiabilităţii.
Solutie:
2 2 2 2
Trebuie să avem T0 12α  T1  β2 , adică 160  0.95  80  0.05 sau 2  0.95   0.05
ceea ce se întamplă pentru 2(c+1)=40 GL.
2 2
In acest caz  0.95  26.51;  0.05  55.76 .
160
De aici rezultă că c=19; t c  26.51  2120 ore.
2
In concluzie,lotul se acceptă dacă timpul de funcţionare până la defectarea a 19 maşini
este de cel puţin 2120 ore sau dacă numărul de maşini care s-au defectat după 2120 ore de
funcţionare este de cel putin 19 maşini.
In caz contrar,lotul se respinge la controlul fiabilităţii.

8.2.3.2 Controlul secvenţial al fiabilităţii maşinilor agricole

Dorim să verificăm ipoteza H : t  T0 faţă de alternativa H : t  T1 , unde


T0>T1 .
t este timpul de funcţionare fără defecţiuni al unei maşini,iar datele de sondaj privind
funţionarea sa fără defecţiuni sunt: t 1 , , t n .
Conform teoremei 4.1 , probabilitatea de a avea k defecţiuni într-un interval de timp de
k
 λ  t   λ t
lungime t,este: P  k   e .
k!
k
t
  t
1 
Cu λ  avem: P  k     e  .
 k!
 este timpul mediu între apariţia a două defecţiuni consecutive.
Fie Pn 0 probabilitatea de a obţine datele de sondaj t 1 , , t n în cazul că ipoteza
H este adevarată şi Pn 1 probabilitatea de a obţine datele de sondaj t 1 , , t n în cazul
că alternativa H este adevarată. Avem:
k k
 t   t 
  t   t
T  T1  e T1 ,
Pn 0   o  e T0 ; Pn 1  deci:
k! k!
k 1 1
Pn 1  T0   t  T1  T0 
  e ,
Pn 0  T1 
160

Pn 1 T 1 1
de unde: ln  k .ln o  t    .
Pn 0 T1  T1 T0 
Avem cazurile:
β P 1 β
1)  n1  , în care caz se continuă măsurătorile;
1  α Pn 0 α
P β
2) n 1  , în care caz se acceptă ipoteza H;
Pn 0 1  α
P 1 β
3) n 1  , în care caz se acceptă ipoteza alternativa H .
Pn 0 α
1 1 β 1β
 ln ln
T T0
Cu notatiile: a  1 ; b 0  1  α ; b1  α (5)
T0 T0 T0
ln ln ln
T1 T1 T1
prin logaritmare in baza e,cazurile 1)-3) de mai sus conduc la :

Teorema 8.6

Avem cazurile:
1) a.t  b0  k  a.t  b1 , în care caz se continuă măsurătorile;
2) k  a.t  b 0 , în care caz se acceptă ipoteza H;
3) k  a.t  b1 , în care caz se acceptă ipoteza alternativă H .

Practic,se reprezintă grafic dreptele x  a.t  b 0 şi x  a.t  b1 , în sistemul de


axe cu abscisa t şi ordonata k   t i şi se continuă măsurătorile până când punctul de
coordonate (t,k) trece prin una din zonele 2 sau 3.
Zona 2 este zona de acceptare al lotului la controlul fiabilităţii,iar zona 3 este zona de
respingere al lotului la controlul fiabilităţii.

Exemplu:

Pentru controlul fiabilităţii unor staţii pentru epurarea dejecţiilor la porci, avem
=5%;=10%.
Să se verifice ipoteza H: t>4 luni faţă de alternativa H : t  1 lună prin control
secvenţial.
Soluţie:
Avem α  5%;β  10%; T0  4; T1  1 , deci conform formulelor (5) găsim:
a  0.54; b 0  1.62; b1  2.08 .
Tabelul de calcul cu datele de sondaj t i şi sumele k   ti ,este:
161

t ti 0.54t-1.62 k  t1    tn 0.54t+2.08

1 0 -1.08 0 2.62
2 1 -0.54 1 3.16
3 0 0 1 3.70
4 0 0.54 1 4.24
5 1 1.08 2 4.78
6 0 1.62 2 5.32
7 0 2.16 2 5.86

Se acceptă ipoteza H: t>4 luni după t=7 luni de funcţionare deci lotul de staţii de
epurare se acceptă la controlul calităţii.

8.3 Rezumat

În acest capitol se prezintă controlul statistic al calităţii în cursul procesului de producţie


prin fişe de control al unei însuşiri cantitative respectiv calitative .
Se prezintă controlul simplu şi secvenţial al controlului statistic de recepţie pentru
însuşiri cantitative, caliative şi fiabilitate.

8.4 Întrebări

1. Ce fişe de control se folosesc pentru controlul calităţii în cursul procesului de


fabricaţie?
2. În ce constă controlul simplu al calităţii la recepţie ?
3. În ce constă controlul secvenţial al calităţii la recepţie ?
4. În ce caz controlul sevcenţial este preferat controlului simplu ?

8.5 Bibliografie

1.D.Ene , M.Drăghici, I.N. Alecu “ Statistică aplicată în agricultură “ Ed.Ceres,2003


2.M.Iosifescu şi col. “ Mică enciclopedie de statistică “ Ed.Ştiinţif.şi Enciclop,,1985
3. Anuarul statistic al României , 1990 -2003
162

CAPITOLUL 9

ANALIZA VARIANŢEI ŞI PLANURI EXPERIMENTALE ÎN AGRICULTURĂ

Obiectice : Însuşirea de către studenţi a puternicului aparat al analizei varianţei mono şi


polifactoriale în populaţii omogene şi neomogene (planuri experimentale).

Conţinut :

9.1 Analiza varianţei monofactorială nebalansată în populaţii omogene


9.2 Analiza varianţei bifactorială completă nebalansată în populaţii omogene
9.3 Analiza varianţei bifactorială ierarhică nebalansată în populaţii omogene
9.4 Planuri experimentale în populaţii neomogene
9.5 Rezumat
9.6 Întrebări
9.7 Bibliografie

Cuvinte cheie : analiza varianţei nebalansată completă / ierarhică, model cu efecte fixe /
aleatoare,componente de varianţă,blocuri complete randomizate, patrate şi dreptunghiuri latine.

9.1 ANALIZA VARIANŢEI MONOFACTORIALĂ NEBALANSATĂ


ÎN POPULAŢII OMOGENE

În populaţia statistică luăm ca obiect de studiu un caracter măsurabil Y faţă de care


exemplarele populaţiei au media .
Fie un alt caracter X asociat cu exemplarele populaţiei, caracterul X având m variante
(doze, nivele, tratamente) notate X(1) ,..........X(m).
Caracterul X se numeşte factor şi constituie un criteriu de clasificare a populaţiei în m
subpopulaţii (straturi ) ce corespund variantelor X(1) ,..........X(m), mediile pe subpopulaţii relativ
la caracterul Y fiind  (1) ,..........  (m).
Diferenţele x(i)=(i)- se numesc efecte principale ale lui X în subpopulaţii.
m
Avem  x (i)= 0
i1

Subpopulaţiile se presupun normale cu mediile  (1) ,..........  (m) şi aceeaşi varianţă


σ2(E) în raport cu caracterul Y.
Extragem în mod întâmplător din subpopulaţii, m sondaje (probe, eşantioane) de volume
p(1) ,.......... p(m).
m
Volumul de sondaj total este pT =  p( j ) .
j 1

Datele relative la Y, din aceste sondaje le numim repetiţii (replicate) şi le notăm cu Y(i,j)
(i=1,......., m; j=1,.........., p(i)).
Forma generală a modelului liniar este:
Y(i, j)= +x (i)+e(i, j)
163

unde e(i, j) sunt variabilele aleatoare normale, independente câte două, cu media zero şi varianţa
σ2(E).
Orice variantă X(i) a lui X trebuie să modifice pe (i) nu şi pe σ.
Această condiţie se verifică prin ipoteza H: σ (1)2=..........= σ (m)2 faţă de
alternativa Ĥ: σ (1)2≠.........≠ σ (m)2 cu ajutorul testului Bartlett:
1 p (i )
Fie mediile de sondaj în cadrul variantelor
MY (i)   Y (i, j) şi varianţele de
p(i) j 1

sondaj în cadrul variantelor:


p (i )
1
SY(i)2=  [Y (i, j)  MY (i)] 2 (1 i  m)
p (i )  1 j 1
m
1
Varianţa erorii este: 2
S E= 
pT  m i 1
( p(i)  1) SY (i) 2
Fie:
m
1 1 1
C=1+ [  m
]
3(m  1) i 1 p(i)  1
 ( p(i)  1)
i 1
Marimea:
m
1
2B= [ ( p(i)  1) ln S2E-  ( p(i)  1) SY(i)2]
C i 1

este o variabilă 2 cu m-1 grade de libertate.


Se extrag din tabela 3 din Anexă, valorile critice 20.05; 20.01; 20.001 cu m-1 GL şi se
compară 2B cu aceste valori critice.
Dacă 2B20.05 atunci se acceptă ipoteza H: σ(1)2=..........= σ (m)2.

În caz contrar avem cazurile :


1) 20.05≤2B20.01 în care caz se acceptă Ĥ deci σ(1)2......... σ(m)2 diferă semnificativ între ele ;
2) 20.01≤2B20.001 în care caz se acceptă Ĥ deci σ(1)2......... σ(m)2 diferă distinct semnificativ
între ele;
3) 2B20.001 în care caz se acceptă Ĥ deci σ(1)2......... σ(m)2 diferă foarte semnificativ între ele.

În cazul balansat p(1) =.........= p(m) = p; pT = mp şi ipoteza


H: σ(1) =..........= σ (m)2
2
faţă de alternativa Ĥ: σ(1)2≠........≠ σ(m)2 se verifică cu
testul Cochran:

Fie SY2max =max SY(i)2


1im
Calculăm : Q=SY2max/(SY(1)2+.......+SY(M)2) şi extragem din tabelele Cochran, valorile
critice Q0.05 şi Q0.01 pentru m variante şi p-1 GL.
Dacă Q Q0.05 se acceptă ipoteza H: σ(1)2=..........= σ (m)2.
În caz contrar avem cazurile :
1) Q0.05≤QQ0.01 deci se acceptă Ĥ adică σ(1)2......... σ (m)2 diferă semnificativ între ele;
164

2) QQ0.001 deci se acceptă Ĥ adică σ(1)2......... σ(m)2 diferă distinct semnificativ între ele.

După modul de alegere al subpopulaţiilor, avem două tipuri de modele :


a) Modele cu efecte fixe:

În acest caz experimentatorul fixează valorile variantelor X(1) ,..........X(m) şi împarte


populaţia în m subpopulaţii ce se vor asocia cu X(1) ,..........X(m).
Mediile (i) sunt constante, efectele principale x(i)=(i)- sunt de asemenea constante.
Avem : M(Y(i,j))= (i)
M(x (i))= x (i) (1≤i≤m)
M(e(i,j))=0 (1≤j≤p(i))
respectiv:
V(Y(i,j))= σ 2(E)
V(x (i))= M(2 x (i))- M(x (i))2=2x (i)- 2x (i)=0
V(e(i,j))= M(e2x (i))- M(e(i,j))2= σ 2(E)- σ 2(E)=0

Ipoteza care se verifică este H:  (1)=..........=  (m) =  faţă de alternativa Ĥ: 


(1)≠.........≠  (m) )≠  sau sub altă formă H: x (i)=0 faţă de alternativa Ĥ: x (i) ≠ 0.
Modelul cu efecte fixe se aplică când numărul m de variante este mic şi permite ca
aceleaşi variante să fie utilizate din nou dacă experienţa se repetă.
Exemplu:
X=îngrăşăminte, apă, energie la plante respectiv furaje,sex, perioada de îngrăşare la
animale.

b) Modelul cu efecte aleatoare:

Experimentatorul alege în mod aleator valorile variantelor X(1),........,X(m), iar cele m


subpopulaţii se aleg în mod aleator din mulţimea subpopulaţiilor posibile, urmând a fi asociate
în mod aleator cu variantele X(1),........,X(m).
Mediile  (i) sunt variabile aleatoare normale cu media  şi varianţa σ 2(x), iar efectele
principale x (i)= (i)- sunt tot variabile aleatoare normale cu media 0 şi varianţa σ 2(x).
Avem:
M(Y(i,j))= 
M(x (i))= 0 unde : (i=1,......,m) şi (j=1,.......,p(m))
M(e(i,j))=0

respectiv:

V(Y(i,j))= V(x (i))+ σ 2(E)


V(x (i))= M(2 x (i))- M(x (i))2= σ 2(x)-0= σ 2(x)
V(e(i,j))= M(e2x (i))- M(e(i,j))2= σ 2(E)-0= σ 2(E).

Aici x este variabila aleatoare:


165

  1, ......,  x m 
 x   x 
 p1, ......., pm  
m
cu media M(x)=  p(i)x(i)=0 şi varianţa σ 2(x).
i1

Ipoteza care se verifică este H: σ(x)=0 faţă de alternativa


Ĥ: σ(x) ≠0.
Modelul cu efecte aleatoare se aplică când numărul m de variante X este mare (poate fi şi
infinit ), dar numai n din ele sunt alese în experiment. Aceleaşi variante nu pot fi utilizate din
nou dacă experienţa se repetă.
Exemplu:
X=tata sau mama în încrucişarea plantelor şi animalelor.

În cazul ambelor modele, datele împreună cu calculele de sume şi medii pe variante şi pe


total, se trec în tabelul de mai jos:

RepetiţiiY→ Y(i,j) Medii pe Media totală


VarianteX ↓ variante
X(1) Y(1,1),......, Y(1,p(1)) MY(1)
. . .
. . . MYT
. . .
. . .
X(m) Y(m,1),..., Y(m,p(m)) MY(m)

m
Notaţie : pT=  p (i )
i 1
Calcule:

a) SPA şi GL:
m p (i ) m p (i )
SPAT=  [Y(i,j)-MYT]2=  Y(i,j)2-S2T/pT cu GLT=pT-1
i 1 j 1 i 1 j 1
m m
SPAX=  p(i)[MY(i)-MYT]2=  S(i)2/p(i)-S2T/pT cu GLX= m-1
i1 i1
m p (i )
SPAE=  [Y(i,j)-MY(i)]2=SPAT-SPAX cu GLE=GLT-GLX=pT-m
i 1 j 1

b) S2:
S2X=SPAX/(m-1); S2E=SPAE/(pT-m)
c)F:
FX=S2 X/S2E1 cu [m-1; pT-m]GL

Rezultatele de la punctele a)-c) se trec în tabelul sintetic de analiză a


varianţei:
166

Sursa de SPA GL S2 F
variaţie
X SPAX m-1 S2 X FX
E SPAE pT-m S2 E -
T SPAT pT –1 - -

Raportul Fisher FX se compară cu valorile critice F0.05; F0.01; F0.001 extrase din tabelele
4,5,6 din Anexă pentru perechile de grade de libertate corespunzătoare şi se acceptă sau se
respinge ipoteza formulată mai sus.

Conform teoremei 9.1 de mai jos, avem:

1)Pentru modelul cu efecte fixe:


1 m
M(S2X)= [ p(i)2 x (i)]+ σ 2(E)
m 1 i 1
M(S2E)= σ 2(E)
Avem estimatorii: σ* 2(E)= S2E; σ* 2(E)=(S2X-S2E)/a(1,1)
1 m
unde a(1,1)= [ p(i)2x (i)]
m 1 i 1

2)Pentru modelul cu efecte aleatoare:


m
1
M(S2X)= [pT-(1/pT)  p2(i)] σ 2(x)+ σ 2(E)
m1 i 1
M(S E)= σ 2(E)
2

Avem estimatorii:
σ *2(E)= S2(E); σ *2(X)= (S2X-S2E)/a(1,1),
m
1
unde a(1,1)= [pT-(1/pT).  p2(i)]
m1 i 1

În cazul balansat avem:

p(1)=.........=p(m)=p; pT=mp şi
p m 2
a(1,1)=   x (i), pentru modelul cu efecte fixe;
m1 i1
şi
a(1,1)=p, pentru modelul cu efecte aleatoare;

Modelul cu efecte fixe este ilustrat de desenul:


167

Modelul cu efecte aleatoare este ilustrat de desenul:

Teorema 9.1

a) Pentru modelul cu efecte fixe, avem:


1 m
M(S2X)= [ p(i)2x (i)]+ σ 2(E)
m 1 i 1
M(S2E)= σ 2(E)

b) Pentru modelul cu efecte aleatoare, avem:


m
1
M(S2X)= [pT-(1/pT).  p2(i)] σ 2(x)+ σ 2(E)
m1 i 1
M(S E)= σ 2(E)
2

Demonstraţie:

Avem: Y(i, j)= +x (i)+e(i, j)


p (i ) p(i)
S(i)=  Y(i, j)=p(i)+p(i)x (i)+  e(i, j)
j 1 j1

aşa că:
(1) S2(i)/p(i)=
168

1 p(i) p(i) p(i)


=p(i)2+p(i)2x (i)+ [ e(i, j )] 2+2[p(i)x (i)+  e(i, j)+ +x (i)  e(i, j)]
p (i ) j 1 j1 j1
2 2 2
Avem M(p(i) x (i))=p(i)M( x (i))=p(i) x (i), pentru efecte fixe,
şi
M(p(i)2x (i))=p(i)M(2 x (i))= p(i)σ2(x), pentru efecte aleatoare.

Deasemenea :
M(2p(i))x(i)=2p(i)M(x(i))=2p(i)x(i), pentru efecte fixe,
şi:
M(2p(i))x(i)=2p(i)M(x(i))=0, pentru efecte aleatoare.

Atât pentru efecte fixe cât şi pentru efecte aleatoare, avem:


p(i) p(i) p(i) p(i) p(i)
M[(  e(i,j) ]=M[  e (i,j)+2  e(i,h)e(i,k)]=  M[e2(i,j)]+
2 2

j1 j1 h1 k 1 j1


p(i) p(i)
+2  M[e(i,h)].M[e(i,k)]=p(i)σ2(E) deoarece e(i,j) sunt variabile aleatoare independente între
h1 k 1

ele şi independente faţă de x(i), cu media 0 şi varianţa σ 2(E).


Deasemenea avem:
p(i) p(i)
M[(  e(i,j)]=  M[e(i,j)]=0
j1 j1

În cazul efectelor fixe, din relaţia (1) rezultă:


M[S2(i)/p(i)]=p(i)2+p(i)2 x (i)+2p(i)x (i)+ σ 2(E), de unde :
m m m
M[  S2(i)/p(i)]=pT.2+  p(i)2x(i)+2  p(i)x(i)+mσ2(E)
i 1 i 1 i 1
m
Dar  p(i)x(i)=0,aşa că:
i 1
m m
(2) M[  S2(i)/p(i)]=pT.2+  p(i)2x(i)+m σ2(E).
i 1 i 1
În cazul efectelor aleatoare, din relaţia (1) rezultă:
M[S2(i)/p(i)]=p(i)2+p(i) 2(x)+ 2(E), de unde:
m
(3) M[  S2(i)/p(i)]=pT.2+pT. σ 2(x)+m σ 2(E).
i 1
Mai departe:
m p (i ) m m p (i )
ST=  Y(i,j)= pT.+  p(i)x(i)+  e(i,j) deci :
i 1 j 1 i 1 i 1 j 1

m m p (i ) m
(4) S2T/pT=pT.2+(1/pT)[  p(i)x(i)]2+(1/pT)[  e(i,j)]2+2{[  p(i)x(i)]+
i 1 i 1 j 1 i 1
m p (i ) m m p (i )
+ [  e(i,j)]+ (1/pT)[  p(i)x(i)].[  e(i,j)]}
i 1 j 1 i 1 i 1 j 1
169

Ca şi mai sus, în cazul efectelor fixe avem:


m m m
M(S2T/pT)=pT.2+(1/pT)[  p(i)x(i)]2+2  p(i)x(i)+σ2 (E) şi cum:  p(i)x(i)=0
i 1 i 1 i 1
rezultă:
(5) M(S2T/pT)=pT.2+2(E)
În cazul efectelor aleatoare, avem:
m
(6) ) M(S2T/pT)=pT.2+(1/pT)[  p2(i)] σ 2(x)+ σ 2(E)
i 1
deoarece:
m m p(i) p(i) m
M[  p(i)x(i)]=M[  p (i) x(i)+2  p(h)p(k)x(h)x(k)]= =[  p2(i)]σ2(x)
2 2

i 1 i 1 h1 k 1 i 1
Folosind perechile de relaţii (2), (5) pentru efectele fixe, găsim:
m m m
M(SPAX)=M(  S2(i)/p(i)-S2T/pT)=M(  S2(i)/p(i)-M(S2T/pT)= =  p(i)2x(i)+(n-1)σ
i 1 i 1 i 1
2
(E) aşa că:
(7)
SPAX 1 m
M(S2X)=M( )=  p(i)2x(i)+ σ 2(E)
n 1 m  1 i 1

Folosind perechile de relaţii (3) şi (6) pentru efectele aleatoare, găsim :


1 m
M(SPAX)=[ pT-  p2(i)] σ 2(x)+(m-1) σ 2(E), aşa că:
pT i1
(8)

m
1 1
M(S2X)= [pT-  p2(i)] 2(x)+
m 1 pT i 1
2 2 2
Un calcul similar cu cel 
precedent, aplicat pentru:
m p (i ) m
SPAE=  Y2(i,j)-  S2(i)/p(i) dă atât pentru efecte fixe cât şi pentru efecte
i 1 j 1 i 1

aleatoare:
M(SPAE)=(pT-m) σ 2(E), de unde:
(9)
M(S2E)= σ 2(E)
Q.E.D.

Un indicator statistic asemănător cu coeficientul de corelaţie liniară din secţiunea 10.1 şi


cu raportul de corelaţie neliniară din secţiunea 10.3, este indicele de corelaţie definit astfel:
Ic= 1  SPAE / SPAT
170

Teorema 9.2

Indicele de corelaţie Ic are proprietăţile:


1) 0Ic1
2) X, Y= independente  X, Y= necorelate(Ic=0)
3) X, Y= dependente funcţional (Y=f(x)) dacă şi numai dacă Ic=1.

Demonstraţie:

1)Ic= 1  SPAE / SPAT = SPAX / SPAT 0. Cum SPAX  SPAT


rezultă 0Ic1.

2)X, Y= independente  MY(i) nu depinde de X(i), deci sunt egale între ele adică
MY(i)=MY (i=1,.....,m) aşa că SPAX =0 ,deci Ic=0, adică X, Y=necorelate.
3)X, Y= dependente funcţional (Y=f(x)) dacă şi numai dacă lui X(i) îi corespunde un
singur Z(i) adică Y(i,j) sunt egale între ele pentru orice j=1,....., p deci Y(i,j)=MY(i) (j=1,.......,
p) aşa că SPAX=SPAT ceeace are loc dacă şi numai dacă Ic=1. Q.E.D.

Raportul Fisher FX=[SPAX/SPAE] : [(m-1)/(pT-m)] capătă forma FX=[Ic2/(1-Ic2)]


:[(m-1)/(pT-m)] , deci verificarea ipotezei HX: (1)=.......= =(m)= faţă de alternativa ĤX:
(1)≠....... ≠(m) ≠ se reformulează astfel :
HX:ηc=0 faţă de HX: ηc≠0, unde ηc este indicele de corelaţie în populaţie împărţită în m
subpopulaţii cărora li se aplică X(1),........., X(m).
2 2
În plus AX=Ic ; AE=1-Ic , proprietate pe care o are şi coeficientul de corelaţie liniară
r şi raportul de corelaţie neliniară Rc.
În cazul respingerii ipotezei HX: (1)=......= (m)= , se poate stabili în cazul balansat
(p(1)=,........., p(m)) prima variantă X(i) a lui X cu influenţă semnificativă asupra variaţiei
lui Y astfel:
Aranjăm mediile pe variante în ordine crescătoare :
MY(i1),.........,MY(im) (i1, .........., im1, ......, m) şi presupunem că MY(it) este
media variantei –martor X(1).(it1, ......, m).
Fie Δ(h,t)=│MY(ih)-MY(it)│, (h=1,......., m;h≠t)
Se calculează amplitudinea teoretică a diferenţelor de medii:
A=max-min=(S2E/p)1/2T, unde T este amplitudinea studentizată Tukey obţinută din
tabelele 7,8 ale Anexei, pentru numărul m al mediilor şi numărul de grade de libertate ale erorii
GLE.
Fiecare diferenţă faţă de martor Δ(h,t); (h=1,......., m;h≠t), care depăşeşte pe A0.05 primeşte
o steluţă de semnificaţie, iar dacă depăşeşte pe A0.01 primeşte a doua steluţă de semnificaţie.
Un test asemănător cu testul Tukey este testul Duncan, precum şi testul diferenţei –
limită:
/2=(i)- (j)=(2S2E/p)1/2t/2; GLE

Exemplu:
X=proteină digestivă (PD) în raţia vacilor cu lapte ; Y=producţia lunară de lapte (litri)
într-o anumită lună a ciclului de lactaţie .
Luăm m=3 variante ale factorului X:
171

X1(1100g/zi) (doza-martor); X2(1200g/zi); X3(1300g/zi).


Aceste variante le aplicăm la câte p=4 repetiţii ale factorului Y.
Avem tabelul cu date:

Repet.Y → Y(i,j) Mediile pe variante Media totală


Variante X ↓
X1 300;314;306;308 MY(1)=307
X2 330;338;342;350 MY(2)=340 MYT=338
X3 366;362;370;370 MY(3)=367

Verificăm ipoteza H: σ(1)2=σ(2)2=σ(3)2, faţă de alternativa :


H: σ(1)2≠ σ(2)2≠ σ(3)2,cu testul Cochran:

SY(1)2=33.33; SY(2)2=69.33; SY(3)2=14.66;


69.33
Avem Q= =0.5910
33.33  69.33  14.66
Din tabelele pentru m=3 variante X şi p-1=3GL avem valorile critice Q0.05=0.8709;
Q0.01=0.9423;
Avem Q Q0.05, deci se acceptă ipoteza H: σ (1)2= σ (2)2= σ (3)2

Etape de calcul:

a) SPA şi GL:
m p
SPAT=  [Y(i,j)-MYT]2 =7576 cu GLT=mp-1=11GL
i 1 j 1
m
SPAX=p  [MY(i,j)-MYT]2=7224 cu GLX=m-1=2GL
i 1
SPAE=SPAT-SPAX=352 cu GLE=11-2=9GL
b) S2:
SPAX 7576 SPAE 352
S2X=   3612 ;S2E=   39.11
GLX 2 GLE 9
c) F:
3612
FX= S2X /S2E   92.35 cu (2;9) GL
39.11
Din tabelele Fisher 4,5,6 din Anexă, găsim valorile critice pentru (2;9) GL : F0.05=4.26;
F0.01=8.02; F0.001=16.39.
Cum FX F0.001 se acceptă ipoteza Ĥ adică (1), (2), (3), diferă foarte semnificativ între
ele adică influenţa variaţiei factorului X asupra variaţiei factorului Y este foarte semnificativă aşa
că F=92.35***.

Tabelul de analiză a variaţiei sintetic este:


172

Sursă de Variaţii Grade de Variante(S2) Rapoarte


variaţie Pătratice(SPA) libertate(GL) Fisher(F)
X 7224 2 3612 92.35***
E 336 9 39.11 -
T 7560 11 - -
Indicele de corelaţie este Ic = SPAX / SPAT =0.977*** şi este foarte semnificativ.

Testul Tukey

Calculăm triunghiul diferenţelor de medii pe variantele lui X:

Diferenţe de medii
307 340 367
367 60** 27** -
 340 33** - -
307 - - -

Din tabelele Tukey 7,8 din Anexă,pentru m=3 medii şi GLE=9 găsim T0.05=3.95;
T0.01=5.43 aşa că avem amplitudinile aşteptate:
A0.05= 39.11 / 4 X3.95=12.35
A0.01= 39.11 / 4 X5.43=16.98
Cele trei diferenţe din tabelul precedent depăşesc pe A0.01, deci sunt distinct semnificative
adică (1), (2), (3), diferă distinct semnificativ dauă câte două.
Aportul variaţiei lui X la variaţia lui Y egală cu 100%,este AX=IC2=95.5%.
Aportul variaţiei erorii la variaţia lui Y este AE=1-AX=4.5%

Calculele precedente privitoare la analiza varianţei monofactorială balansată


în populaţii omogene, pot fi făcute în EXCEL astfel :
Depunem în foaia de calculNr.1 în blocul de celule A1:C5 astfel :

A B C
1 X1 X2 X3
2 300 330 366
3 314 338 362
4 306 342 370
5 308 350 370

Deschidem fereastra TOOLS în care activăm opţiunea DATA ANALYSIS . Aici


activăm opţiunea ANOVA:SINGLE FACTOR în care declarăm blocul de
celule cu date A1:C5
Rezultatele se găsesc fie în foaia de calcul Nr. 2 ,fie tot în foaia de calcul Nr.1, prin
declararea ca celule de rezultate , a altor celule decât cele din blocul de date A1:C5
173

9.2 ANALIZA VARIANŢEI BIFACTORIALĂ COMPLETĂ


NEBALANSATĂ ÎN POPULAŢII OMOGENE

În populaţia statistică luăm ca obiect de studiu un caracter măsurabil Z faţă de care


exemplarele populaţiei au media .
Fie alte două caractere X,Y asociate cu exemplarele populaţiei, caracterul X având m
variante (doze, nivele, tratamente) notate X(1),...,X(m), iar caracterul Y având n variante
(doze, nivele, tratamente) notate Y(1),...,Y(n).
Caracterele X, Y se numesc factori şi constituie criterii de clasificare dublă a populaţiei în
mn subpopulaţii (straturi) ce corespund perechilor de variante (X(i), Y(j)), mediile pe
subpopulaţii relativ la caracterul Z fiind (i,j) (i=1,........, m; j=1,........,n).
Diferenţele (X,Y)(i,j) = (i,j)- se numesc efecte principale ale perechii de factori
m n
(X,Y) în subpopulaţii. Avem 
i 1 j 1
(X,Y)(i,j)=0

Subpopulaţiile se presupun normale cu mediile (i,j) şi aceeaşi varianţă 2(E) în


raport cu caracterul Z.
Extragem în mod întâmplător din subpopulaţii mn sondaje (probe, eşantioane) de volume
p(i,j) (i=1,......., m; j=1,.......n).
Datele reletiv la caracterul Z, din aceste sondaje le numim repetiţii, (replicate) şi le
notăm cu Z(i,j,k) (i=1,........., m; j=1,......., n; k=1,.......,p(i,j)).
Forma generală a modelului liniar este:

Z(i,j,k)= +X(i)+ Y(j)+X.Y(i,j)+e(i,j,k)

unde e(i,j,k) sunt variabile aleatoare normale, independente două câte două cu media 0 şi
varianţa 2(E).
Reunim toate subpopulaţiile care corespund variantei X(i) fixate pentru orice j=1,....., n.
Exemplarele din această reuniune vor avea faţă de caracterul Z media:
n
X(i)=(1/n).  (i,j), iar efectul principal al variantei X(i) este :
j 1
m
X(i)=X(i)- . Avem 
i 1
X(i)=0.

În mod analog se reunesc subpopulaţiile ce corespund variantei Y(j) fixate pentru orice
i=1,......., m.
m
Exemplarele din această reuniune au faţă de caracterul Z, media Y(j)=(1/m).  (i,j),
i 1

iar efectul principal al variantei Y(j) este: Y(j)= Y(j)-.


n
Avem j 1
Y(j)=0.

Cantitatea:
X.Y(i,j)= (i,j)-X(i)-Y(j)+ se numeşte efectul principal al interacţiunii variantei
X(i) cu varianta Y(j).
După modul de alegere al subpopulaţiilor după X şi Y, avem trei tipuri de modele :
174

a) Model cu efecte fixe

În acest caz ambii factori X, Y definesc efecte constante X(i), Y(j), X.Y(i,j).
Ipotezele care se verifică sunt:
1) HX: X(1)=...........=X(m)= faţă de alternativa HX: X(1)≠...........≠X(m)≠
 sau sub altă formă: HX: X(i)=0 faţă de alternativa HX: X(i) ≠0.
2) HY: Y(1)=...........=Y(n)=  faţă de alternativa HY:Y(1)≠...........≠Y(n)≠  sau
sub altă formă: HY: Y(j)=0 faţă de alternativa: HY: Y(j) ≠0.
3) HX.Y: (i,j)= X(i)+ Y(j) faţă de alternativa HX.Y: (i,j) ≠ X(i)+ Y(j) sau
sub altă formă: HX.Y: X.Y(i,j)=0 faţă de alternativa: HX.Y: X.Y(i,j) ≠0.

b) Model cu efecte aleatoare :

În acest caz ambii factori definesc efecte aleatoare : X(i) sunt variabile aleatoare N(0;
 (X)), Y(j) sunt variabile aleatoare N(0; 2(Y)), iar X.Y(i,j) sunt variabile aleatoare N(0;
2

2(X.Y)).

Ipotezele care se verifică sunt:


1) HX: 2(X)=0 faţă de HX: 2(X) ≠0
2
2) HY:  (Y)=0 faţă de HY: 2(Y) ≠0
3) HX.Y: 2(X.Y)=0 faţă de HX.Y: 2(X.Y) ≠0.

c) Modelul mixt:
În acest caz unul din factori, de exemplu X, este cu efecte fixe, iar cel de-al doilea Y este
cu efecte aleatoare.
Efectele X(i) sunt constante şi ipoteza care se verifică este:
1) HX: X(i)=0 faţă de HX: X(i) ≠0
Efectele Y(j) sunt variabile aleatoare de tip N(0; 2(Y)) şi ipoteza care se verifică este :
2) HY: 2(Y)=0 faţă de HY: 2(Y) ≠0
Efectele X.Y(i,j) sunt variabile aleatoare de tip N(0; 2(X.Y)) şi ipoteza care se verifică
este:
3) HX.Y: 2(X.Y)=0 faţă de HXY: 2(X.Y) ≠0.

În cazul celor trei modele, datele împreună cu calculele de sume si medii ale repetiţiilor pe
variante (X,Y), X, Y şi pe total se trec în tabelul care urmează:
175

Repet.Z Medii pe Medii pe Medii pe Media


Variante Z(i,j,p(i,j)) Variante Variante Variante Totală
(X,Y)  (X,Y) X Y

(X(1),Y(1)) Z(1,1,1),…,Z(1,1,p(1,1)) MZ(1,1)


…………. ………………………. ………. MZX(1) MZY(1)
(X(1),Y(n)) Z(1,n,1),…,Z(1,n,p(1,n)) MZ(1,n)
…………. ……………………….. ………. ………. ……… MZT
(X(m),Y(1)) Z(m,1,1),…,Z(m,1,p(m,1)) MZ(m,1)
………….. ……………………….. ……….. MZX(m) MZY(n)
(X(m),Y(n)) Z(m,n,1),…,Z(m,n,p(m,n)) MZ(m,n)

Notaţii:

q=numărul de celule (i, j) nevide;


m n n m
pT=  p(i,j);
i 1 j 1
px(i)= 
j 1
p(i,j); pY(j)= 
i 1
p(i,j)

CALCULE:

a) SPA şi GL:

m n p (i , j ) m n p (i , j )
SPAT=   [Z(i,j,k)-MZT]2=   Z2(i,j,k)-S2T/pT cu GLT=pT-1 grade de
i 1 j 1 k 1 i 1 j 1 k 1

libertate;
m n m n
SPA(X,Y)=  p(i,j)[MZ(i,j)-MZT]2=  S2(i,j)/p(i,j)-S2T/pT cu GL(X,Y)=q-1 grade
i 1 j 1 i 1 j 1

de libertate;
m m
SPAX=  px(i)[MZX(i)-MZT]2=  S2X(i)/px(i)-S2T/pT cu GLX=m-1 grade de
i 1 i 1
libertate;
n n
SPAY=  PY(j)[MZY(j)-MZT]2=  S2Y(j)/pY(j)-S2T/pT cu GLY=n-1 grade de
j 1 j 1

libertate;
m n m n
SPAX.Y=  p(i,j)[MZ(i,j)-MZx(i)-MZY(j)+MZT]2=  S2(i,j)/p(i,j)-
i 1 j 1 i 1 j 1
m n

 S2X(i)/px(i)-  S2Y(j)/pY(j)+S2T/pT=SPA(X,Y)-SPAX-SPAY cu GLX.Y=q-m-n+1=GL(X,Y)-


i 1 j 1

GLX-GLY grade de libertate;


m n p (i , j ) m n p (i , j ) m n
SPAE=   [Z(i,j,k)-MZ(i,j)]2=   Z2(i,j,k)-  S2(i,j)/p(i,j)=SPAT-
i 1 j 1 k 1 i 1 j 1 k 1 i 1 j 1

SPA(X,Y) cu GLE=pt-q=GLT-GL(X,Y) grade de libertate.


176

b) S2 :

S2X=SPAX/(m-1); S2Y=SPAY/(n-1); S2X.Y=SPAXY/(q-m-n+1);


S2E=SPAE/(pT-q)

c) F:

FX=S2X/S2E1 cu [m-1;pT-q]GL
2 2
FY=S Y/S E1 cu [n-1;pT-q]GL
2 2
FX.Y=S X.Y/S E1 cu [q-m-n+1;pT-q]GL

Rezultatele de la punctele a)-c) se trec în tabelul sintetic de analiză a varianţei:

Sursa de SPA GL S2 F
variaţie
X SPAX m-1 S2 X FX
2
Y SPAY n-1 SY FY
X.Y SPAX.Y q-m-n+1 S2X.Y FX.Y
2
E SPAE pT-q SE -
T SPAT pT-1 - -
Rapoartele Fisher FX, FY, FX.Y se compară cu valorile critice F0.05; F0.01; F0.001 extrase
din tabelele 4,5,6 din Anexă, pentru perechile de grade de libertate corespunzătoare şi se acceptă
sau se resping ipotezele formulate mai sus.

Printr-un calcul asemănător cu cel din teorema 9.1 obţinem relaţiile:

(1) M(S2X)=a(1,1).2()+a(1,2).2()+a(1,3).2()+2(E)
(2) M(S2Y)=a(2,1).2()+a(2,2).2()+a(2,3).2()+2(E)
(3) M(S2X.Y)=a(3,1).2()+a(3,2).2()+a(3,3).2(.)+2(E)
(4) M(S2E)= 2(E)
unde:
1 1 m
a(1,1)= [ pT  ( p2X(i))]
m 1 pT i 1
m n
1 1 1 n
a(1,2)= [ ( p2(i,j))- ( p2Y(j))]
m  1 i 1 p X (i ) j 1 pT j 1
m n
1 1 1 m n 2
a(1,3)= [ ( p2(i,j))- ( p (i,j))]
m  1 i 1 p X (i ) j 1 pT i1 j1

1 n 1 m
1 m
a(2,1)= [ ( p2(i,j))- ( p2X(j))]
n  1 j 1 pY ( j ) i 1 pT i 1
177

1 1 n
a(2,2)= [ pT  ( p2Y(i))]
n 1 pT j 1
1 n 1 m
1 m n
a(2,3)= [ ( p2(i,j))- ( p2(i,j))]
n  1 j 1 pY ( j ) i 1 pT i1 j1

n 1
a(3,1)= - a (2, 1)
q  m  n 1
m 1
a(3,2)= - a (1, 2)
q  m  n 1
1 m
1
n
a(3,3)= [ pT   ( p2(i,j))-
i 1 p X ( i ) j 1
q  m  n 1
n m
1 m n

 ( p2(i,j))+ 1 ( p2X(j))]


j 1 pY ( j ) i 1 pT i 1 j 1

Cu aceşti coeficienţi alcătuim tabelul componentelor de varianţă:

M(S2) 2(X) 2(Y) 2(X.Y) 2(E)


M(S2X) a(1,1) a(1,2) a(1,3) 1
M(S2Y) a(2,1) a(2,2) a(2,3) 1
M(S2X.Y) a(3,1) a(3,2) a(3,3) 1
M(S2E) 0 0 0 1

Avem estimatorii:
*2(E)=S2E

 *2  X   S 2 X  S 2E 
  1  2 
 *2   *2 Y  2
  A  S Y  S E 
 * 2  S 2  S 2 
 X .Y  X Y    X .Y E

 a(1,1) a(1,2) a(1,3) 


 
unde A=  a (2,1) a(2,2) a (2,3) 
 a(3,1) a (3,2) a(3,3) 
 
În cazul balansat avem:

p(i,j)=p; pT=mnp; pX(i)=np; pY(j)=mp; q=mn


178

Tabelul sintetic de analiza varianţei are forma:


Sursa de SPA GL S2 F
variaţie
X SPAX m-1 S2 X FX
Y SPAY n-1 S2 Y FY
X.Y SPAX.Y (m-1)(n-1) S2X.Y FX.Y
E SPAE mn(p-1) S2 E -
T SPAT Mnp-1 - -

Tabelul cu componentele de varianţă are forma particulară:


M(S2) 2(X) 2(Y) 2(X.Y) 2(E)
2
M(S X) np 0 p 1
M(S2Y) 0 mp p 1
2
M(S X.Y) 0 0 p 1
2
M(S E) 0 0 0 1
Un caz particular al analizei varianţei completă balansată este cel în care p=1, deci avem
câte o singură repetiţie ataşată fiecărei perechi de variante (X(i), Y(j)).
În acest caz avem T=(X,Y), iar E are GLE=0 grade de libertate, deci vom lua E=X.Y, deci
SPAE=SPA(XY)-SPAX-SPAY şi GLE=GL(X,Y)-GLX-GLY.

Tabelul sintetic de analiza varianţei are forma:

Sursa de SPA GL S2 F
Variaţie
X SPAX m-1 S2 X FX
Y SPAY n-1 S2 Y FY
E SPAE (m-1)(n-1) S2 E -
T SPAT mn-1 - -

Tabelul cu componentele de varianţă are forma:


M(S2) 2(X) 2(Y) 2(E)
M(S2X) n 0 1
2
M(S Y) 0 m 1
2
M(S E) 0 0 1

Exemplu:

Fie X=proteina digestibilă în raţia porcilor la îngrăşat şi Y= unităţile nutritive în raţia


porcilor la îngrăşat şi Z=sporul lunar în greutate (kg)al porcilor la îngrăşat.
Luăm m=3 variante X=X1(250g/zi); X2(275g/zi); X3(300g/zi) şi n=2 variante
Y=Y1(2.5UN) şi Y2(3UN).Pentru fiecare combinaţie de variante (X,Y) luăm câte p=2 repetiţii Z.
Avem tabelul cu date:
179

Repet Z
Medii pe Medii pe Medii pe Media
Z(i,j,p(i,j)) Variante variante X variante Y Totală
Variante (X,Y) (X,Y)

(X1, Y1) 14; 14.2 MZ(1, 1)=14.1

MZY(1)=15.17

(X1, Y2) 15.2; 15.6 MZ(1, 2)=15.4 MZX(1)=14.75

(X2, Y1) 15; 15.4 MZ(2, 1)=15.2

MZT=15.67

(X2, Y2) 16; 16.2 MZ(2, 2)=16.1

MZX(2)=15.65

(X3, Y1) 16.1; 16.3 MZ(3, 1)=16.2


MZY(2)=16.17

(X3, Y2) 16.9; 17.1 MZ(3, 2)=17 MZX(3)=16.60


180

Etape de calcul :

a) SPA şi GL:

m n p
SPAT   [ Z (i, j , k )  MZ T ] 2  10.2268 cu GL T =mnp-1=11GL
i 1 j 1 k 1
m n
SPA( X ,Y )  p  [MZ (i, j )  MZT ] 2  9.9868 cuGL ( X ,Y ) =mn-1=5GL
i 1 j 1
m
SPAX  np  [ MZ X (i )  MZ T ]  6.8468 cu GL X =m-1=2GL
i 1
n
SPAY  mp  [ MZ Y ( j )  MZ T  1.9200 cu GL Y =n-1=1GL
j 1

SPAX Y  SPA( X ,Y )  SPAX  SPAY  1.2200 cu


GL X Y  GL( X ,Y )  GL X  GLY  2GL
SPAE  SPAT  SPA( X ,Y )  0.2400 cu GL E  GLT  GL( X ,Y )  6GL

b) S2 :

SPA X SPAY
S X2   3.4234; S Y2   1.9200
GL X GLY
SPA X Y SPAE
S X2 Y   0.61; S E2   0.04
GL X Y GLE

c) F:

S X2
FX  2  85.585 cu (2;6) GL
SE
SY2
FY  2  48 cu (1;6) GL
SE
S X2 Y
FX Y  2  15.25 cu (2;6) GL
SE
Din tabelele Fisher 4,5,6 din Anexă ,găsim valorile critice pentru (2;6) GL : F0.05  5.14 ;
F0.01  10.92 ; F0.01  27 ;
181

Cum FX  F0.001 se acceptă ipoteza H adică  X (1),  X (2),  X (3) diferă foarte
semnificativ între ele adică influenţa variaţiei lui X asupra variaţiei lui Z este foarte semnificativă
deci Fx  85.585 * * * .

Cum F0.01  FX Y  F0.001 se acceptă ipoteza H adică influenţa variaţiei interacţiunii X  Y


asupra variaţiei lui Z este distinct semnificativă deci FX Y  15.25 * * .
Din tabelele Fisher 4,5,6 din Anexă, găsim valorile critice pentru (1,6) GL : F0.05=5.99,
F0.01  13.74; F0.001  35.51.
Cum FY  F0.001 se acceptă ipoteza H deci Y (1), Y (2) diferă foarte semnificativ
între ele adică influenţa variaţiei lui Y asupra variaţiei lui Z este foarte semnificativă deci
FY  48 * * * .

Tabelul sintetic de analiza varianţei este :

Sursa de Variaţii Grade de Varianţe Rapoarte Fisher


Variaţie pătratice libertate (GL) (S 2 ) (F)
(SPA)
X 6.8468 2 3.4234 85.585***
Y 1.9200 1 1.9200 48***
X Y 1.2200 2 0.6100 15.25**
E 0.2400 6 0.400 -
T 10.2268 11 - -
Indicii de corelaţie sunt:
SPAX SPAY
Ic ( X )   0.818*** ; I c (Y )   0.433*** ;
SPAT SPAT
SPAX Y
I c ( X .Y )   0.345**.
SPAT

Aporturile variaţiilor lui X,Y, X  Y la variaţia lui Z,socotită egală cu


100 %, sunt:
SPAX SPAY
AX   66.9%; AY   18.8%; AX Y  11.9%.
SPAT SPAT
Aportul variaţiei erorii la variaţia lui Z este:
AE  1  AX  AY  AX Y  2.4%.

Testele Cochran şi Tukey se efectuează ca în secţiunea 9.1.

Calculele precedente privitoare la analiza varianţei bifactorială completă


balansată în populaţii omogene cu p repetiţii în celulă, pot fi făcute în EXCEL astfel :
Depunem în foaia de calcul Nr.1 datele în blocul de celule A1:D5 asfel :
182

A B C D
1 X1 X2 X3
2 Y1 14 15 16.1
3 14.2 15.4 16.3
4 Y2 15.2 16 16.9
5 15.6 16.2 17.1

Deschidem fereastra TOOLS în care activăm opţiunea DATA ANALYSIS


Aici activăm opţiunea ANOVA:TWO-FACTOR WITH REPLICATION
în care declarăm blocul de celule cu date A1:D5 şi numărul p=2 de repetiţii
(replicate).
Rezultatele se găsesc fie în foaia de calcul Nr. 2 ,fie tot în foaia de calcul Nr.1, prin
declararea ca celule de rezultate , a altor celule decât cele din blocul de date A1:D5

9.3 ANALIZA VARIANŢEI BIFACTORIALĂ IERARHICĂ


NEBALANSATĂ ÎM POPULAŢII OMOGENE

În populaţia statistică luăm ca obiect de studiu un caracter măsurabil Z faţă de care


exemplarele populaţiei au media μ. Fie alte două caractere X, Y asociate cu exemplarele
populaţiei în mod ierarhizat. Caracterul X are m variante (doze, nivele, tratamente) notate
X(1),…….,X(m) şi în cadrul fiecărei variante X(i), caracterul Y are subvariabilele
Y(i,1),…..,Y(i,n(i)).
Caracterele X, Y se numesc factori ierarhizaţi şi constituie criterii de clasificare
succesivă, mai întâi în m subpopulaţii care corespund variantelor X(1),……,X(m), fiecare din
aceste subpopulaţii se împarte la rândul ei în subsubpopulaţii care corespund subvariantelor
Y(i,j).
Mediile pe subpopulaţii relativ la caracterul Z sunt μ(1),……., μ(m) iar mediile pe
subsubpopulaţii relativ la Z sunt:
μ (1,1),……, μ(1,n(1))
………………………
μ(m,1),……, μ(m,n(m)).

Efectele principale ale factorului X sunt  X (i )   (i )   ,


iar efectele principale ale factorului Y sunt  Y (i, j )   (i, j )   (i ) .
m m n( m )
Avem 
i 1
X (i )  0;  
i 1 j 1
Y ( i , j )  0.

Subpopulaţiile după X se presupun normale cu mediile μ(i) şi aceeaşi varianţă  2 ( E ) iar


subsubpopulaţiile după Y în cadrul lui X se presupun normale cu mediile μ(i,j) şi aceeaşi varianţă
 2 ( E) .
m
Extragem în mod întâmplător din subpopulaţii m   n(i ) sondaje (probe, eşantioane) de
i 1
volume p(i,j) ; (i=1,…….,m),(j=1,…….,n(m)).
183

Datele relative la Z din aceste sondaje, le numim repetiţii (replicate) şi le notăm cu


Z(i,j,k) (i=1,…..,m; j=1,…..,n(m)); k=1,…..,p(m,n(m))).
Forma generală a modelului liniar ierarhizat este :
Z (i, j , k )     X (i )   Y (i, j )  e(i, j, k )
unde e(i,j,k) sunt variabile aleatoare normale cu media 0 şi variaţia  2 ( E ) .
Ca şi la analiza variaţiei bifactorială completă din secţiunea 9.1.2, modelul poate fi cu
efecte fixe, cu efecte aleatoare sau mixt dar în cazul ierarhic lipseşte interacţiunea X  Y .
a) În cazul modelului cu efecte fixe verificăm ipotezele:
1) H X :  (1)  ..........   (m)   faţă de H X :  (1)  ..........   ( m)   ;
2) H Y :  (i, j )   (i ) faţă de H Y :  (i, j )   (i ) .

b) În cazul modelului cu efecte aleatoare verificăm ipotezele:


1) H X :  2 ( X )  0 faţă de H X :  2 ( X )  0;
2) H Y :  2 (Y )  0 faţă de H Y :  2 ( Y )  0.

În toate cazurile, datele împreună cu calculele de sume şi medii de repetiţii pe variante,


subvariante şi total, se trec în următorul tabel:
184

Repetiţii Z
Z(i,j,p(i,j)) Medii pe Medii Media
Subvar. pe Totală
X Y Var.
Variante X
Y
(X(1), Y(1,1) Z(1,1,1),…………………,Z(1,1,p(1,1)) MZY (1,1)
. .
. . MZ X (1)
. .
. MZY (1, n(1))
(X(1), Y(1,n(1)) Z(1,n(1),1),………,Z(1,n(1),p(1,n(1)))
. . . .
. . . .
. . . .
MZ T
(X(m), Y(m,1)) Z(m,1,1),………………..,Z(m,1,p(m,1)) MZY (m,1)
. . .
. . .
. . . MZ X (m)
. . .
. . .
X(m), Y(m,n(m)) Z(m,n(m),1),……,Z(m,n(m),p(m,n(m))) MZY (m, n(m))
185

Notaţii:
m n(i ) n(i ) m
pT   p (i, j ); p x (i )   p(i , j ); nT   n(i ).
i 1 j 1 j 1 i 1

Calcule:

a) SPA şi GL:

m n (i ) p (i, j )
2
m n(i ) p (i , j )
2 S 2T
SPAT    [ Z (i, j , k )  MZ T ]    Z ( i, j , k )  cu
i 1 j 1 k 1 i 1 j 1 k 1 pT
GLT  pT  1 grade de libertate;
m
S 2 X (i ) S 2 T
2
m
SPAX   p X (i )[ MZ X (i )  MZT ]    cu GL X  m  1
i 1 i 1 p X (i ) pT
grade de libertate;
m n (i ) m n (i )
S 2 Y (i , j ) m S 2 X (i )
SPAY  p (i, j )[ MZ Y (i , j )  MZ X (i )] 2    cu
i 1 j 1 i 1 j 1 p (i , j ) i 1 p X (i )

GLY  nT  m grade de libertate;


m n (i ) p (i , j )
2
m n (i ) p ( i , j )
2
m n (i )
S 2 Y (i, j )
SPAE    [ Z (i, j, k )  MZ Y (i, j )]   Z (i, j, k )  
i 1 j 1 k 1 i 1 j 1 k 1 i 1 j 1 p (i, j )

= SPAT  SPAX  SPAY cu GLE  pT  nT  GLT  GLX  GLY

b) S2 :
SPAX 2 SPAX 2 SPAE
S2X  ; S Y  ; S E 
m 1 nT  m; pT  nT
c) F:
2
S X S 2Y
FX  2  1 cu [m  1; nT  m]GL; FY  2 cu [ nT  m; pT  m]GL .
S Y S E 1
Datele de la punctele a)-c) se trec în tabelul:

Sursa de SPA GL S2 F
Variaţie
X SPAX m-1 S2X FX
Y SPAY nT  m S 2Y FY
E SPAE pT  nT S 2E -
T SPAT pT  1 - -

Rapoartele Fisher FX , FY se compară cu valorile critice F0.05 ; F0.01 ; F0.001 extrase din
tabelele 4,5,6 din Anexă, pentru perechile de grade de libertate corespunzătoare şi se acceptă
sau se resping ipotezele formulate mai sus.
186

Printr-un calcul asemănător cu cel din teorema 9.1 obţinem relaţiile:


1) M ( S 2 X )  a (1,1) 2 ( X )  a (1,2) 2 ( Y )   2 ( E )
2) M ( S 2 X )  a(2, 2) 2 ( Y )   2 ( E )
3) M (S 2 X )   2 ( E )
unde:
1 1 m 2
a (1,1)  [ pT  ( p X (i))];
m 1 pT i1
1 m
1 n (i ) 2 1 m n (i ) 2
a(1, 2)  [ ( p (i, j ))  ( p (i, j )];
m  1 i1 pX (i ) j 1 pT i1 j 1
1 m
1 n (i ) 2
a(2, 2)  [ pT   ( p (i, j ))].
nT  m i 1 p X (i ) j 1

Cu aceşti coeficienţi alcătuim tabelul componentelor de varianţă:

M (S 2 )  2 ( X )  2 ( Y )  2 (E )

M (S 2 X ) a(1,1) a(1,2) 1

M (S 2 Y ) 0 a(2,2) 1

M (S 2 E ) 0 0 1

Avem estimatorii:
 *2 ( E )  S 2 E ;
*2 SY2  S E2
 (Y ) 
a(2, 2)
S 2  a (1, 2) *2 ( Y )  S 2 E
 *2 ( X )  X
a (1,1)

În cazul balansat avem: p(i,j)=p; p X (i )  np; n(i)=n; nT=mn; pT  mnp.


Tabelul cu componentele de varianţă are forma:

M (S 2 )  2 ( X )  2 ( Y )  2 (E)
M (S 2 X ) np p 1
M (S 2
Y ) 0 p 1
M (S 2 E ) 0 0 1
187

Exemplu

Fie X=genotip vier; Y=genotip scroafă şi Z=greutatea la fătare a purceilor (Kg); luăm
m=2 variante X  X 1 (martor ), X 2 (elită) şi luăm n=2 subvariante Y pentru fiecare variantă
X: Y11 (martor), Y12 (elită) respectiv Y21 (martor), Y22 (elită).
Pentru fiecare variantă X şi fiecare subvariantă Y luăm câte p=3 repetiţii Z (purcei
rezultaţi din încrucişarea variantelor paterne cu subvariantele materne). Avem tabelul cu date:

Repetiţii Z Medii pe Medii pe Media


Z(i,j,k) Subvariante Variante Totală
Variante X Y X
Y
( X 1 , Y11 ) 0.9; 1; 1.1 MZ Y (1,1)  1 MZ X (1)  1.05
( X 1 , Y12 ) 1; 1.1; 1.2 MZ Y (1,2)  1.1 MZ T  1.15
( X 2 , Y21 ) 1.2; 1.2; 1.2 MZ Y (2,1)  1.2 MZ X ( 2)  1.25
( X 2 , Y22 ) 1.1; 1.4; 1.4 MZ Y (2,2)  1.3

Etape de calcul:

a) SPA şi GL:
m n p
SPAT   [ Z (i, j , k )  MZ T ] 2  0.25 cu GLT =mnp-1=11 GL;
i 1 j 1 k 1
m n
SPAY  p  [MZ Y (i, j )  MZ X (i )]2  0.03 cu GLY =m(n-1)=2 GL;
i 1 j 1
m
SPA X  np  [ MZ X (i)  MZ T ]2  0.12 cu GL X =m-1=1 GL;
i 1

SPAE  SPAT  SPAX  SPAY  0.10 cu GLE  GLT  GLX  GLY  8GL .

b)S2 :
SPAX SPAY SPAE
S2X   0.1200; S 2 Y   0.0150; S 2 E   0.0125.
GL X GLY GLE

c)F:
S2X
FX   8 cu (1;2) GL
S 2Y
S 2Y
FY  2  1.2 cu (2;8) GL
S E
Din tabelele Fisher 4,5,6 din Anexă,pentru (1;2) GL avem valorile critice
F0.05  18.51; F0.01  98.5; F0.001  998.5.
Cum FX  F0.05 rezultă că influenţa variaţiei lui X asupra variaţiei lui Z este
nesemnificativă.
Din tabelele Fisher 4,5,6 din Anexă,pentru (2;8) GL avem valorile critice F0.05  4.46;
F0.01  8.65; F0.001  18.41.
188

Cum FY  F0.05 rezultă că influenţa variaţiei lui Y asupra variaţiei lui Z este
nesemnificativă.

Tabelul sintetic de analiză a varianţei este:

Sursa de Variaţii Grade de Varianţe Rap.


Variaţie pătratice Libertate (S )2 Fisher
(SPA) (GL) (F)
X 0.12 1 0.1200 8

Y 0.03 2 0.0150 1.2

E 0.10 8 0.0125 -

T 0.25 11 - -

Indicii de corelaţie sunt:


SPAX SPAY
Ic ( X )   0.693 ; I c ( y)   0.500 .
SPAT SPAX
Aporturile variaţiei lui X, Y, E la variaţia lui Z egală cu 100%,vor fi:
SPAX SPAY SPAE
AX   48%; AY   12%; A E   40%.
SPAT SPAT SPAT

9.4 PLANURI EXPERIMENTALE ÎN POPULAŢII NEOMOGENE

9.4.1 PLANUL BLOCURILOR COMPLETE RANDOMIZATE

În secţiunile 9.1-9.3 s-a presupus că populaţia este omogenă în raport cu însuşirea


cantitativă Y luată în studiu.
Populaţia omogenă s-a împărţit în mod aleator în m subpopulaţii omogene asociate
cu variantele X1,…,Xm . Din fiecare subpopulaţie s-au extras
în mod aleator blocurile de repetiţii Y1j,…Ymj care corespund variantelor X1,…,
Xm . Din acest motiv aranjamentul folosit se numeşte plan complet randomizat.
Dacă populaţia este neomogenă, presupunem că se poate împărţi în l subpopulaţii,
omogene în raport cu însuşirea Y luată în studiu.
Materialul experimental va fi şi el neomogen fiind constituit din l sondaje din cele l
subpopulaţii, fiecare sondaj fiind format din m repetiţii corespunzător celor m variante ale
unei alte însuşiri X asociată populaţiei, notate X(1),...,X(m).
Fiecare din cele l sondaje omogene de câte m repetiţii, îl vom numi bloc. Blocurile se
numesc complete dacă conţin exact atâtea repetiţii câte variante are factorul X şi anume m.
Blocurile se numesc randomizate deoarece în fiecare bloc se aplică în mod aleator câte o
variantă a factorului X pentru fiecare repetiţie a blocului.
Exemple de blocuri naturale: sex, soi, rasă, hibrid, exemplar, loc, perioadă de timp,
etc.
189

Desemnăm fiecare repetiţie printr-o casuţă în care notăm varianta aplicată X(i) şi
răspunsul repetiţiei Y(i;j). Un mod posibil de randomizare se asigură prin permutări circulare
ale variantelor de la un bloc la altul după schema:

B(1) X(1) X(2) X(m)


Y(1;1) Y(2;1) Y(m;1)
B(2) X(m) X(1) X(m-1)
Y(m;2) Y(1;2) Y(m-1;2)
………………………………………………………………………

B(l) X(m-l+2) X(m-l+3) X(m-l+1)


Y(m-l+2;l) Y(m-l+3;l) Y(m-l+1;l)

Răspunsurile Y(i;j) se rearanjează în tabelul de mai jos pentru a fi prelucrat prin


analiza varianţei bifactorială completă (cu factori X,B) balansată, cu o repetiţie în fiecare
celulă (p(i;j) = 1).

Repetiţii Y Yi j Medii pe Medii pe Media


variante blocuri Totală
Variante (X,B) X B
(X(1);B(1)) Y(1;1) MYX(1) MYB(1)
  . .
(X(1);B(l)) Y(1;l) . .
  . . MYT
(X(m);B(1)) Y(m;1) . .
. .
 
MYX(m) MYB(l)
(X(m);B(l)) Y(m;l)

Etape de calcul:

a) SPA şi GL
m l 2

SPA T    Y  i;j -MYT  cu GLT = ml-1 grade de liberatate;


i=1 j=1
m
SPA X  l [MYX (i)-MYT ]2 cu GLX = m-1 grade de liberatate;
i=1
l
SPA B  m[MYB (j)-MYT ]2 cu GLB = l-1 grade de liberatate;
j=1

SPA E  SPA T -SPA X -SPA B


cu GLE = GLT-GLX-GLB = (m-1)(l-1) grade de libertate;
b) S2:
SPA X 2 SPA B 2 SPA E
S2X  ; SB  ; SE 
m-1 l -1  m-1 l -1
c) F:
190

S2X
FX   1 cu [m-1;(m-1)(l-1)]GL
S2E
S2B
FB   1 cu [l-1;(m-1)(l-1)]GL
S2E
Valorile precedente se trec în tabelul sintetic de analiză a varianţei:
Sursa de SPA GL S2 F
Variaţie
X SPAX m-1 S2 FXX
B SPAB l-1 S 2 FB
B
E SPAE (m-1)(l-1) S 2 -
E
T SPAT ml-1 - -

Valorile FX şi FB se compară cu valorile critice F0.05, F0.01 şi F0.001 extrase din tabelele
4,5,6 din Anexă, pentru perechile de grade de libertate corespunzătoare.
Se acceptă sau se resping ipotezele:

1) H X :μ X (1)  …  μ X  m   μ faţă de alternativa:


H X :μ X (1)  … μ X  m   μ
2) H B :μ B (1)  …  μ B  l   μ faţă de alternativa:
H B :μ B (1)  … μ B  l   μ
Exemplu:

X = proteina digestibilă în raţia porcilor (g/zi)


Y = sporul lunar în greutate al porcilor (Kg)
Populaţia este neomogenă în raport cu Y dar se poate împărţi în l = 2 blocuri
omogene: B1(Landrace) şi B2(Marele Alb).
Luăm m = 3 variante X: X1(250 g/zi); X2(275 g/zi) şi X3(300 g/zi) deci fiecare
bloc va conţine câte m = 3 repetiţii (bloc complet). În fiecare bloc variabilele X se distribuie
în mod aleator (bloc randomizat):
B(1) X(1) X(2) X(3)
15 17 19
X(3) X(1) X(2)
B(2) 20 14 18
Datele precedente se rearanjează pe variante (X,B) în tabelul:

Repetiţii Y Yi j Medii pe Medii pe Media


Variante (X,B) Variante X Blocuri B totală
(X1;B1) 15
(X1;B2) 14 MYX(1) = 14.5
(X2;B1) 17 MYB(1) = 17
(X2;B2) 18 MYX(2) = 17.5 MYT = 17.165
(X3;B1) 19 MYB(2) = 17.33
(X3;B2) 20 MYX(3) = 19.5
191

Etape de calcul:

a) SPA şi GL:

SPAT = 26.833 cu GLT = 5 GL;


SPAX = 25.333 cu GLX = 2 GL;
SPAB = 0.166 cu GLB = 1 GL;
SPAE = SPAT-SPAX-SPAB = 1.334 cu GLE = GLT-GLX-GLB = 2 GL;
b) S2:
SPA X SPA B SPA E
S2X   12.667; S2B   0.166; S2E   0.667
GLX GL B GL E

c) F:
S2X
FX   19 cu (2 ; 2) GL
S2E
S2B 1 S2E
FB  2  1 deci   9.02 cu (2 ; 1) GL
SE FB SB2
Din tabelele Fisher 4,5,6 din Anexă,pentru (2 ; 2) GL avem valorile critice F0.05 = 19,
F0.01 = 99 şi F0.001 = 999.
Cum F0.05 = FX < F0.01 influenţa variaţiei lui X asupra variaţiei lui Y este semnificativă,
aşadar FX = 19*.
Cum FB < 1 influenţa variaţiei blocului B asupra variaţiei lui Y este nesemnificativă.

Tabelul sintetic de analiză a variaţiei este:


Sursa de Variaţii Grade de Varianţe Rapoarte
Variaţie pătratice (SPA) libertate Fisher
(GL) (S2) (F)
X 25.333 2 12.667 19 *
B 0.166 1 0.166 4.02
E 1.334 2 0.667 -
T 26.833 5 - -
Indicii de corelaţie sunt:
SPA X SPA B
Ic ( X )   0.972*; Ic ( B)   0.079
SPA T SPA T
Aporturile variaţiei lui X, B şi E la variaţia lui Y egală cu 100%,sunt:

SPA X SPA B
AX   94.4%; A B   0.6%
SPA T SPA T
A E  1-A X -A B  5%

Calculele precedente privitoare la analiza varianţei bifactorială completă balansată cu


câte o repetiţie în celulă , pot fi făcute în EXCEL astfel :
Depunem în foaia de calcul Nr.1 datele în blocul de celule A1:D3 astfel :
192

A B C D
1 X1 X2 X3
2 B1 15 17 19
3 B2 14 18 20

Deschidem fereastra TOOLS în care activăm opţiunea DATA ANALYSIS. Aici


activăm opţiunea ANOVA:TWO-FACTOR WITHOUT REPLICATION în care declarăm
blocul de celule cu date A1:D3
Rezultatele se găsesc fie în foaia de calcul Nr. 2 ,fie tot în foaia de calcul Nr.1 ,prin
declararea ca celule de rezultate,a altor celule decât cele din blocul de date A1:D3

9.4.2 PLANUL BLOCURILOR COMPLETE RANDOMIZATE


ÎN MAI MULŢI ANI(LOCURI)

Dacă planul blocurilor complete randomizate din secţiunea 9.3.1 se aplică în mai mulţi
ani (locuri) pe lângă factorul X apare şi factorul Y (an/loc) deci avem o analiză trifactorială
completă (X,Y,B) balansată cu o repetiţie în celulă: p(i;j;k) = 1.
Fie m numărul variantelor lui X şi n numărul variantelor lui A şi l numărul blocurilor
B. Fiecare variantă (X(i);Y(j)) se aplică în mod randomizat fiecărei repetiţii a blocului Bk,
dând răspunsul Z(i;j;k).
De exemplu randomizarea se poate face prin permutări circulare ale variantelor în
blocuri conform schemei:
B(1) (X(1);Y(1)) . (X(m);Y(n))
Z(1;1;1) . Z(m;n;1)
B(2) (X(m);Y(n)) . (X(m-1);Y(n-1))
Z(m;n;2) . Z(m-1;n-1,2)
………. ……………… …………. ……………..
B(l) (X(m-l+2);Y(m-l+2)) . (X(m-l+1);Y(m-l+1))
Z(m-l+2;m-l+2;l) . Z(m-l+1;m-l+1;l)
Datele se rearanjează în tabelul:

Repetiţii Z Z(i;j;k) Medii pe Medii pe Medii pe Media


variante Variante Variante totală
Variante (X,A,B) X,Y X Y
(X(1);Y(1);B(1)) Z(1;1;1) MZX,Y(1;1) MZX(1) MZY(1)
  . . .
(X(m);Y(1);B(1)) Z(m;1;1) . . .
  . . . MZT
(X(m);Y(n);B(1)) Z(m;n;1) . . .
. . .
 
MZX,Y(m;n) MZX(m) MZY(n)
(X(m); Y(n);B(l)) Z(m;n;l)
Etape de calcul:
a) SPA şi GL:
m n l 2

SPA T    Z  i;j;k  -MZT  cu GLT = mnl-1 grade de liberatate;


i=1 j=1 k=1
m n
SPA X,Y   l [MZ X,Y  (i;j)-MZT ]2 cu GL(X,Y) = mn-1 grade de liberatate;
i=1 j=1
193

m
SPA X  nl [MZX (i)-MZT ]2 cu GLX = m-1 grade de liberatate;
i=1
n
SPA Y  ml [MZY (j)-MZT ]2 cu GLY = n-1 grade de liberatate;
j=1

SPA X.Y  SPA  X,Y  -SPA X -SPA Y cu GLX.Y = GL(X,Y)-GLX-GLY =


= (m-1)(n-1) grade de libertate;
l
SPA B  mn [MZB (k)-MZT ]2 cu GLB = l-1 grade de liberatate;
k=1
SPA E  SPA T -SPA  X,Y  -SPA B cu GLE = GLT-GL(X,Y)-GLB =
= (mn-1)(l-1) grade de libertate;

b) S2:
SPA X 2 SPA Y 2 SPA  XY  SPA B 2 SPA E
S2X  ; SY  ; S XY   ; SB2  ; SE 
m-1 n-1  m-1 n-1 l -1  mn-1 l -1
c) F:
S2X
FX  2  1 cu [m-1;(mn-1)(l-1)]GL
SE
S2Y
FY   1 cu [n-1;(mn-1)(l-1)]GL
S2E
S2XY 
F XY    1 cu [l-1;(m-1)(l-1)]GL
S2E
S2B
FB   1 cu [l-1;(mn-1)(l-1)]GL
S2E
Valorile precedente se trec în tabelul sintetic de analiză a varianţei:
Sursa de SPA GL S2 F
Variaţie
X SPAX m-1 S2 FX
X
Y SPAY n-1 S 2 FY
Y
(XY) SPA(XY) (m-1)(n-1) S 2 F(XY)
 XY 
B SPAB l-1 S2B FB
E SPAE (mn-1)(l-1) S2E -
T SPAT mnl-1 - -

Valorile FX, FY, FX.Y şi FB se compară cu valorile critice F0.05, F0.01 şi F0.001 extrase din
tabelele 4,5,6 din Anexă, pentru perechile de grade de libertate corespunzătoare.
Se acceptă sau se resping ipotezele:
194

1) H X :μ X (1)  …  μ X  m   μ faţă de alternativa:


H X :μ X (1)  …  μ X  m   μ
2) H Y :μ Y (1)  …  μ Y  n   μ faţă de alternativa:
H Y :μ Y (1)  …  μ Y  n   μ
3) H X.Y :μ  X,Y  (i;j) - μ X  i  - μ Y  j  μ  0 faţă de alternativa :
H X.Y :μ (X,Y) (i;j)- X  i  -μ Y  j  μ  0
4) H B:μ B (1)  …  μ B  l   μ faţă de alternativa:
H B :μ B (1)  …  μ B  l   μ

Exemplu:
X = îngrăşăminte chimice NPK la cultura grâului
Y = producţia de grâu (quintale/ha)
Populaţia este neomogenă în raport cu Y dar se poate împărţi în l = 2 blocuri
omogene: B1(Cernoziom) şi B2(Brun roşcat de pădure), iar experienţa durează n = 2 ani
climatici consecutive (Y = factor de climă).
Luăm m = 3 variante X: X1(100 Kg/ha); X2(140 Kg/ha) şi X3(180 Kg/ha). Fiecare bloc
va conţine câte mn = 6 repetiţii (bloc complet).
În fiecare bloc variabilele X şi A se distribuie în mod aleator (bloc randomizat):

B(1) X1;Y1 X2;Y2 X3;Y1 X1;Y2 X2;Y1 X3;Y2


25 28 32 24 27 31
B(2) X3;Y2 X1;Y1 X2;Y2 X3;Y1 X1;Y2 X2;Y1
30 23 27 31 22 28

Datele precedente se rearanjează pe variante (X, A şi B) în tabelul:


Repetiţii Y Y1 Medii pe Medii pe Medii pe Medii pe Media
variante variante Variante blocuri totală
Variante (X,Y) X Y B
(X,A,B)
(X1;Y1;B1) 25 MY(X,Y)(1;1) MZX(1) = MZY(1) = MZB(1) = MZT =
(X2;Y2;B1) 28 = 24 = 23.5 = 27.67 = 27.83 = 27.33
(X3;Y1;B1) 32 MY(X,Y)(2;1) MZX(2) = MZY(2) = MZB(2) =
(X1;Y2;B1) 24 = 27.5 = 27.5 = 27 = 26.83
(X2;Y1;B1) 27 MY(X,Y)(3;1) MZX(3) =
(X3;Y2;B1) 31 = 31.5 = 31
(X3;Y2;B2) 30 MY(X,Y)(1;2)
(X1;Y1;B2) 23 = 23
(X2;Y2;B2) 27 MY(X,Y)(2;2)
(X3;Y1;B2) 31 = 27.5
(X1;Y2;B2) 22 MY(X,Y)(3;2)
(X2;Y1;B2) 28 = 30.5

Etape de calcul:

a) SPA şi GL:
195

SPAT = 120.667 cu GLT = 11 GL;


SPA(X,Y) = 114.667 cu GL(XY) = 5 GL;
SPAX = 112.667 cu GLX = 2 GL;
SPAY = 1.347 cu GLY = 1 GL;
SPAX.Y = SPA(X,Y)-SPAX-SPAY = 0.653
cu GLX.Y = GL(X,Y)-GLX-GLY = (m-1)(n-1) = 2 GL;
SPAB = 3 cu GLB = 1 GL;
SPAE = SPAT-SPA(X,Y)-SPAB = 3 cu GLE = GLT-GL(X,Y)-GLB = 5 GL;

b) S2:
SPA X SPA Y SPA XY 
S2X   56.334; S2Y   1.347; S2XY    0.327;
GLX GLY GL  XY 
SPA B SPA E
S2B   3; S2E   0.6
GL B GL E

c) F:
2
SX
FX  2
 93.89 cu (2 ; 5) GL
SE
2
SY
FY  2
 2.245 cu (1 ; 5) GL
SE

S2X.Y
FX.Y   0.545 cu (1 ; 5) GL
S2E
S2B
FB = =5 cu (1 ; 5) GL
S2E
Din tabelele Fisher 4,5,6 din Anexă ,pentru (2 ; 5) GL avem valorile critice F0.05 =
5.79, F0.01 = 13.27 şi F0.001 = 37.12
Cum FX > F0.001 influenţa variaţiei lui X asupra variaţiei lui Y este foarte
semnificativă, aşadar FX = 93.89 **.
Din tabelele Fisher 4,5,6 din Anexă,pentru (1 ; 5) GL avem valorile critice F0.05 =
6.61, F0.01 = 16.26 şi F0.001 = 47.18
Cum FY < F0.05 influenţa variaţiei climei Y asupra variaţiei lui Y este nesemnificativă.
Cum FX.Y < 1 influenţa variaţiei interacţiunii X.Y asupra variaţiei lui Y este
nesemnificativă.
Cum FB < F0.05 influenţa variaţiei solului B asupra variaţiei lui Y este nesemnificativă.
Tabelul sintetic de analiză a varianţei este:
Sursa de Variaţii Grade de Variaţie Rapoarte
Variaţie pătratice Libertate Fisher
(SPA) (GL) (S2) (F)
X 112.667 2 56.334 93.89***
Y 1.347 1 1.347 2.245
X.Y 0.653 2 0.327 0.545
B 3 1 3 5
E 3 5 0.6 -
T 120.667 11 - -
Indicii de corelaţie sunt:
196

SPA X SPA Y
Ic ( X )   0.966***; Ic (Y )   0.106;
SPA T SPA T
SPA X.Y SPA B
Ic ( X .Y )   0.074; Ic ( B)   0.158
SPA T SPA T
Aporturile variaţiei lui X, Y, X.Y, B şi E la variaţia lui Y egală cu 100%, sunt:
SPA X SPA Y SPA X.Y
AX   93.4%; A Y   1.1%; A X.Y   0.5%;
SPA T SPA T SPA T
SPA B
AB   2.4%; A E  1-A X -A Y -A X.Y -A B  2.6%
SPA T

9.4.3 PLANUL BLOCURILOR COMPLETE RANDOMIZATE


SUBDIVIZATE

Populaţia este neomogenă în raport cu însuşirea cantitativă Z, dar se poate împărţi în l


straturi omogene în raport cu Z, materialul experimental neomogen de volum ml se împarte în
l blocuri omogene, fiecare bloc conţinând m repetiţii iar în fiecare bloc se aplică în mod
randomizat câte o variantă X(1), …, X(m) a lui X pentru fiecare repetiţie a blocului.
Mai departe, fiecare căsuţă a blocului se împarte în n subblocuri omogene şi în fiecare
subbloc se aplică în mod randomizat câte o variantă Y(1), …, Y(n) a lui Z pentru fiecare
repetiţie a subblocului. Numărul total de repetiţii este mnl.
În experimentele cu culturi agricole, blocurile se numesc parcele mari iar subblocurile
se numesc parcele mici (subdivizate).
Schema planului blocurilor subdivizate, în care randomizarea variantelor X şi Y se
face prin permutări circulare ale variantelor în cadrul blocurilor şi subblocurilor, este dată mai
jos.
Răspunsurile Z(i;j;k) se rearanjează în tabelul de mai jos pentru a fi prelucrate prin
analiza varianţei bifactorială completă balansată (X,B) cu p(i;j) = 1 medii în celulă (la nivel de
blocuri) şi prin analiza varianţei bifactorială completă balansată (X,Y) cu p(i;j) = n repetiţii în
celulă (la nivel de subblocuri).
197

B(1;1) . B(1;m)

(X(1);Y(1)) . (X(1);Y(n)) . (X(m);Y(1)) . (X(m);Y(n))


B(1) . . .
Z(1;1;11) . Z(1;n;1.1) . Z(m;1;1.m) . Z(m;n;1.m)
. . .

B(2;1) . B(2;m)

(X(m);Y(n)) . (X(m);Y(n-1)) . (X(m-1);Y(n)) . (X(m-1);Y(n-1))


B(2) . . .
Z(m;n;2.1) . Z(m;n-1;2.1) . Z(m-1;n;2.m) . Z(m-1;n-1;2.m)
. . .

B(l;1) . B(l;m)

(X(m-l+2);Y(n-l+2)) . (X(m-l+2);Y(n-l+1)) . (X(m-l+1);Y(n-l+2)) . (X(m-l+1);Y(n-l+1))


B(l) . . .
Z(m-l+2;n-l+2;l.1) . Z(m-l+2;n-l+1;l.1) . Z(m-l+1;n-l+2;l.m) . Z(m-l+1;n-l+1;l.m)
. . .
198

Repetiţii Z Z(i,j,h,k) Medii pe Medii pe Medii pe Medii pe Medii pe Media


Variante Variante Variante variante variante totală
Variante (X,Y) (X,B) X Y B
(X,Y,B)
(X1;Y1;B11) Z(1;1;11)
 
(X1;Yn;B11) Z(1,n,11) MZ(X,Y)(1,1) MZ(X,B)(1,1) MZX(1) MZY(1) MZB(1)
  . . . . .
. . . . .
(Xm;Y1;B1m) Z(m;1;1m)
. . . . .
 
. . . . . MZT
(Xm;Yn;B1m) Z(m,n,1m)
. . . . .
  . . . . .
(Xm-l+2;Yn-l+2;Bl1) Z(m-l+2; n-l+2;l1) . . . . .
  MZ(X,Y)(m,n) MZ(X,B)(m,l) MZX(m) MZY(n) MZB(l)
(X m-l+2;Yn-l+1;Bl1) Z(m-l+2; n-l+2;l1)
 
(Xm-l+1;Yn-l+2;Blm) Z(m-l+1; n-l+2;lm)
 
(X m-l+1;Yn-l+1;Blm) Z(m-l+1; n-l+1;lm)
199

Etape de calcul:

a) SPA şi GL:
m n l 2

SPA T    Z  i;j;k  -MZ T  cu GLT = mnl-1 grade de liberatate;


i=1 j=1 k=1
m n
SPA XY   l  [MZ XY  (i;j)-MZT ]2 cu GL(X,Y) = mn-1 grade de liberatate;
i=1 j=1
m l
SPA X,B  n [MZ X,B (i;k)-MZ T ]2 cu GL(X,B) = ml-1 grade de liberatate;
i=1 k=1
m
SPA X  nl  [MZX (i)-MZT ]2 cu GLX = m-1 grade de liberatate;
i=1
n
SPA Y  ml  [MZ Y (j)-MZT ]2 cu GLY = n-1 grade de liberatate;
j=1

SPA X.Y  SPA  X,Y  -SPA X -SPA Y cu GLX.Y = GL(X,Y)-GLX-GLY =


= (m-1)(n-1) grade de libertate;
l
SPA B  mn [MZB (k)-MZT ]2 cu GLB = l-1 grade de liberatate;
k=1

SPA E =SPA T -SPA  X,Y  -SPA B cu GLE = GLT-GL(X,Y)-GLB =


= (mn-1)(l-1) grade de libertate;
SPA E1  SPA  X,B -SPA X -SPA B numită eroare în blocuri cu
GL E1 = GL(X,B)-GLX-GLB = (m-1)(l-1) grade de libertate;
SPA E 2  SPA E -SPA E1 numită eroare în subblocuri cu
GL E2  GL E -GL E1  m  n  1 l  1 grade de libertate;

b) S2:
SPA X 2 SPA Y 2 SPA X.Y SPA B
S2X  ; SY  ; S X .Y  ; S2B  ;
m-1 n-1  m-1 n-1 l -1
SPA E1 SPA E 2
S2E1  ; S2E2 
 m-1 l -1 m  n-1 l -1

c) F:
S2X
FX  2  1 cu [m-1;(m-1)(l-1)]GL
SE1
S2Y
FY   1 cu [n-1;m(n-1)(l-1)]GL
S2E2
S2X.Y
FX .Y   1 cu [(m-1)(n-1);m(n-1)(l-1)]GL
S2E 2
S2B
FB   1 cu [l-1;(m-1)(l-1)]GL
S2E1
200

Valorile precedente se trec în tabelul sintetic de analiză a varianţei:

Sursa de SPA GL S2 F
variaţie
X SPAX m-1 S2X FX
Y SPAY n-1 S2Y FY
XY SPAX.Y (m-1)(n-1) S2X.Y FX.Y
B SPAB l-1 S2B FB
E1 SPA E1 (m-1)(l-1) S2E1 -
E2 SPA E2 m(n-1)(l-1) S2E2 -
T SPAT mnl-1 - -
Valorile FX, FY, FX.Y şi FB se compară cu valorile critice F0.05, F0.01 şi F0.001 extrase din
tabelele 4,5,6 din Anexă,pentru perechile de grade de libertate corespunzătoare.
Se acceptă sau se resping ipotezele:
1) H X :μ X (1)  …  μ X  m   μ faţă de alternativa
H X :μ X (1)  …  μ X  m   μ
2) H Y :μ Y (1)  …  μ Y  n   μ faţă de alternativa
H Y :μ Y (1)  …  μ Y  n   μ
3) H X.Y :μ X.Y (1;1)  …  μ X.Y  m; n   μ faţă de alternativa
H X.Y :μ X.Y (1;1)  …  μ X.Y  m; n   μ
4) H B :μ B (1)  …  μ B  l   μ faţă de alternativa H B :μ B (1)  …  μ B  l   μ
Exemplu:
X = îngrăşăminte cu azot (Kg/ha)
Y = îngrăşăminte cu fosfor (Kg/ha)
Z = producţia de grâu (quintale/ha)
Populaţia este neomogenă dar se parte în l = 2 blocuri: B1(Cernoziom) şi B2(Brun
roşcat de pădure), şi în fiecare bloc se aplică randomizat câte o variantă X.
Blocurile se împart în n = 2 subblocuri pe care se cultivă randomizat câte un soi de
grâu Y: Y1(martor) şi Y2(elită).
La nivel de blocuri vom lua m = 3 variante X: X1(100 Kg N/ha); X2(140 Kg N/ha) şi
X3(180 Kg N/ha), iar la nivel de subblocuri vom lua n = 2 variante Y: Y1(50 Kg P/ha) şi
Y2(80 Kg P/ha). Blocurile conţin m = 3 subblocuri, deci sunt complete, iar subblocurile
conţin n = 2 repetiţii, deci sunt complete.
B11 B12 B13
B1 (X1;Y1) (X1;Y2) (X2;Y1) (X2;Y2) (X3;Y1) (X3;Y2)

22 25 27 28 30 34

B21 B22 B23


B2 (X3;Y2) (X3;Y1) (X1;Y2) (X1;Y1) (X2;Y2) (X2;Y1)

31 30 24 20 27 26
201

Datele precedente se rearanjează pe variante (X,Y,B) în tabelul de mai jos:

Repetiţii Z Z(i,j,k) Medii pe Medii pe Medii pe Medii pe Medii pe Media


variante variante Variante variante blocuri Totală
Variante (XY) (XB) X Y B
(X,Y,B)
(X1;Y1;B11) 22 MZ(X,Y)(1;1) MZ(X,B)(1;1) MZX(1) = MZY(1) = MZB(1) = MZT =
(X1;Y2;B11) 25 = 21 = 23.5 = 22.75 = 25.83 = 27.67 = 27
(X2;Y1;B12) 27 MZ(X,Y)(1;2) MZ(X,B)(1;2) MZX(2) = MZY(2) = MZB(2) =
(X2;Y2;B12) 28 = 24.5 = 22 = 27 = 28.17 = 26.33
(X3;Y1;B13) 30 MZ(X,Y)(2;1) MZ(X,B)(2;1) MZX(3) =
(X3;Y2;B13) 34 = 26.5 = 27.5 = 31.25
(X3;Y2;B21) 31 MZ(X,Y)(2;2) MZ(X,B)(2;2)
(X3;Y1;B21) 30 = 27.5 = 26.5
(X1;Y2;B22) 24 MZ(X,Y)(3;1) MZ(X,B)(3;1)
(X1;Y1;B22) 20 = 30 = 32
(X2;Y2;B23) 27 MZ(X,Y)(3;2) MZ(X,B)(3;2)
(X2;Y1;B23) 26 = 32.5 = 30.5
202

Etape de calcul:

a) SPA şi GL:

SPAT = 172 cu GLT = 11 GL;


SPA(X,Y) = 164 cu GL(X,Y) = 5 GL;
SPA(X,B) = 150 cu GL(X,B) = 5 GL;
SPAX = 144.5 cu GLX = 2 GL;
SPAY = 16.4268 cu GLY = 1 GL;
SPAX.Y = SPA(X,Y)-SPAX-SPAY = 3.0732 cu GLX.Y = 2 GL;
SPAB = 5.3868 cu GLB = 1 GL;
SPAE = SPAT-SPA(X,Y)-SPAB = 2.6132 cu GLE = GLT-GL(X,Y)-GLB = 5 GL;
SPA E1  SPA  X,B -SPA X -SPA B  0.1132 cu GL E1 = GL(X,B)-GLX-GLB = 2GL;
SPA E1 este numită eroare în blocuri din analiza varianţei bifactorială completă balansată
(X,B) cu p(i;j) = 1 medii în celulă (la nivel de blocuri).
SPA E2  SPA E -SPA E1  2.5 cu GL E2 =GL E -GL E1  3GL
SPA E2 este numită eroare în subblocuri din analiza varianţei bifactorială completă
balansată (X,Y) cu p(i;j) = 2 repetiţii în celulă (la nivel de subblocuri).
SPA X SPA Y SPA X.Y
S2X   72.25; S2Y   16.4268; S2X.Y   1.5366;
m -1 n -1  m -1 n  1
b)S2:
SPA B SPA E1 SPA E2
S2B   5.3868; S2E1   0.0566; S2E2   0.8333
l -1  m -1 l  1 m  n -1 l  1
c) F:
2
S
FX  2X  642.67 cu (2 ; 2) GL
SE1
S2Y
FY   145.11 cu (1 ; 3) GL
S2E2
S2X.Y
FX.Y  2  13.57 cu (2 ; 3) GL
SE
S2B
FB  2  6.46 cu (1 ; 2) GL
SE1
Din tabelele Fisher 4,5,6 din Anexă,pentru (2 ; 2) GL avem valorile critice F0.05 = 19, F0.01
= 99 şi F0.001 = 999. Cum F0.01 < FX > F0.001, influenţa variaţiei lui X asupra variaţiei lui Z este
distinct semnificativă, aşadar FX = 642.67**.
Din tabelele Fisher 4,5,6 din Anexă,pentru (1 ; 3) GL avem valorile critice F0.05 = 10.13,
F0.01 = 34.12 şi F0.001 = 167. Cum F0.01 < FY > F0.001, influenţa variaţiei lui Y asupra variaţiei lui Z
este distinct semnificativă, aşadar FY = 145.11**.
Din tabelele Fisher 4,5,6 din Anexă,pentru (2 ; 3) GL avem valorile critice F0.05 = 9.55,
F0.01 = 30.82 şi F0.001 = 148.50. Cum F0.05 < FX.Y > F0.01, influenţa variaţiei interacţiunii X.Y
asupra variaţiei lui Z este semnificativă, deci FX.Y = 13.57*.
203

Din tabelele Fisher 4,5,6 din Anexă,pentru (1 ; 2) GL avem valorile critice F0.05 = 18.51,
F0.01 = 98.50 şi F0.001 = 998.50. Cum FB < F0.05, influenţa variaţiei blocului asupra variaţiei lui Z
este nesemnificativă.
Tabelul sintetic de analiză a varianţei este:
Sursa de Variaţii Grade de Varianţe Rapoarte
Variaţie Pătratice Libertate Fisher
(SPA) (GL) (S2) (F)
X 144.5 2 72.25 642.67**
Y 16.4268 1 16.4268 145.11**
X.Y 3.0732 2 1.5366 13.57*
B 5.3868 1 5.3868 6.46
E1 0.1132 2 0.0566 -
E2 2.5 3 0.8333 -
T 172 11 - -
Indicii de corelaţie sunt:
SPA X SPA Y
Ic ( X )   0.917**; I c (Y )   0.309**;
SPA T SPA T
SPA X.Y SPA B
Ic ( X .Y )   0.134*; I c ( B)   0.177
SPA T SPA T
Aporturile variaţiei lui X, Y, X.Y, B, E1 şi E2 la variaţia lui Z egală cu 100%,sunt:
SPA X SPA Y SPA X.Y
AX   84%; A Y   9.5%; A X.Y   1.8%;
SPA T SPA T SPA T
SPA B SPA E1 SPA E2
AB   3.1%; A E1   0.07%; A E2   1.53%
SPA T SPA T SPA T

9.4.4 PLANUL PATRATELOR ŞI DREPTUNGHIURILOR LATINE

Un pătrat latin l x l ( l  2) este un aranjament de l2 litere latine mari în formă de pătrat


cu laturile de l litere astfel că pe fiecare linie şi pe fiecare coloană a pătratului fiecare literă
apare odată şi numai odată.

Exemple:

Pătrat 2 x 2 Pătrat 3 x 3 Pătrat 4 x 4

A B A B C A B C D
B A C A B D A B C
B C A C D A B
B C D A
Două sau mai multe pătrate latine l x l se pot alipi după linii sau după coloane dând
naştere la un dreptunghi latin.
204

Exemple:

A B A B C D
B A B A D C
C D
D C
Planul în

Planul în pătrate latine rezultă din combinarea a două planuri în blocuri complete
randomizate, blocurile primului plan fiind liniile pătratelor iar blocurile celui de al doilea
plan fiind coloanele pătratelor.
Numărul l al repetiţiilor fiecărui bloc-linie este egal cu numărul repetiţiilor fiecărui bloc-
coloană şi este divizor al numărului m al variantelor factorului X.
Randomizarea variantelor factorului X, notate cu X(1), …, X(m) puse în locul literelor
latine, se asigură prin faptul că în fiecare pătrat latin fiecare variantă a lui X se aplică odată şi
numai odată repetiţiei din fiecare linie şi din fiecare coloană.
Desemnăm fiecare repetiţie printr-o căsuţă în care notăm varianta aplicată X(i) şi
răspunsul la ea Y(i;j;k).
Randomizarea este asigurată prin permutări circulare ale variantelor de la o linie (coloană)
la alta conform structurii pătratului latin. Rezultatele se valorifică prin analiza varianţei
trifactorială completă (X,L,C) cu p(i;j;k) = 1 repetiţii în celulă.

C(1) C(2) C(l)

L(1) X(1) X(2) X(m)


Y(1;1;1) Y(2;1;2) Y(m;1;l)
L(2) X(m) X(1) X(m-1)
Y(m;2;1) Y(1;2;2) Y(m-1;2;l)

L(l) X(2) X(3) X(1)


Y(2;l;1) Y(3;l;2) Y(1;l;l)

Din pătratele sau dreptunghiurilor latine, datele se rearanjează pe variante (X,L,C) în


tabelul:
Repetiţii Y  Y(i,j,k) Medii pe Medii pe Medii pe Media
variante linii coloane totală
Variante (X,L,C)  X L C
(X(1);L(1);C(1)) Y(1;1;1)
  MYX(1) MYL(1) MYC(1)
(X(m);L(1);C(1)) Y(m;1;1) . . .
  . . . MYT
(X(m);L(l);C(1)) Y(m;l;1) . . .
. . .
 
MYX(m) MYL(l) MYC(l)
(X(m); L(l);C(l)) Y(m;l;l)
205

Etape de calcul:

a) SPA şi GL:
m l l 2

SPA T    Y  i;j;k  -MYT  cu GLT = ml-1 grade de liberatate;


i=1 j=1 k=1
m
SPA X  l  [MYX (i)-MYT ]2 cu GLX = m-1 grade de liberatate;
i=1
l
SPA L  m [MYL (j)-MYT ]2 cu GLL = l-1 grade de liberatate;
j=1
l
SPA C  m [MYC (k)-MYT ]2 cu GLC = l-1 grade de liberatate;
k=1

SPA E  SPA T -SPA X -SPA L -SPA C cu GLE = GLT-GLX-GLL-GLC =


= (l-1)(m-2) grade de libertate;

b) S2 :
SPA X 2 SPA L 2 SPA C 2 SPA E
S2X  ; SL  ; SC  ; SE 
m-1 l -1 l -1  l -1 m-2 
c) F:
2
SX
FX  2
 1 cu [m-1;(l-1)(m(l+1)-2)]GL
SE
2
SL
FL  2
 1 cu [l-1;(l-1)(m(l+1)-2)]GL
SE
2
S C
FC   1 cu [l-1;(l-1)(m(l+1)-2)]GL
2
S E
Mărimile precedente se trec în tabelul sintetic de analiză a varianţei:

Sursa de SPA GL S2 F
variaţie
X SPAX m-1 S2X FX
L SPAL l-1 S2L FL
C SPAC l-1 S2C FC
E SPAE (l–1)[m( l–1)-2] S2E -
T SPAT ml2-1 - -

Valorile FX, FL şi FC se compară cu valorile critice F0.05, F0.01 şi F0.001 extrase din tabelele
4,5,6 din Anexă, pentru perechile de grade de libertate corespunzătoare.

Se acceptă sau se resping ipotezele:


206

1) H X :μ X (1)  …  μ X  m   μ faţă de alternativa H X :μ X (1)  …  μ X  m   μ


2) H L :μ L (1)  …  μ L  l   μ faţă de alternativa H L :μ L (1)  …  μ L  l   μ
3) H C :μ C (1)  …  μ C  l   μ faţă de alternativa H C :μ C (1)  …  μ C  l   μ

În compararea a două planuri experimentale se foloseşte eficienţa relativă.


Fisher:

e % 

S2E2 GL E2  1  : S  GL  1
2
E1 E1

 GL E2  3  GL  3
E1

unde S2E1 şi S2E2 sunt varianţele erorilor celor două planuri experimentale iar GL E1 şi GL E2
sunt gradele de libertate ale acestora.

Exemplu:

X = proteina digestibilă în raţia porcilor la îngrăşat (g/zi)


Y = sporul lunar în greutate al porcilor (Kg)
Populaţia este neomogenă în raport cu Y dar se poate împărţi în l = 2 blocuri-linie:
L1(Landrace) şi L2(Marele Alb) şi în l = 2 blocuri-coloană: C1(vârstă 6 luni) şi C2(vârstă 7 luni).
Luăm m = 4 variante X: X1(250 g/zi); X2(270 g/zi); X3(290 g/zi) şi X4(310 g/zi).
Datele se trec în două pătrate latine care prin alipire după linii/coloane, constituie un
dreptunghi latin:

C1 C2 C1 C2
L1 X1 X2 L1 X3 X4
10 12 13 14
L2 X2 X1 L2 X4 X3
12 12 15 16

Datele precedente se rearanjează pe variante (X,L,C) în tabelul:

Repetiţii Z Z1 Medii pe Medii pe Medii pe Media


variante linii coloane Totală
Variante X L C
(X,L,C)
(X1;L1;C1) 10 MYX(1) =11
(X1;L2;C2) 12
(X2;L1;C2) 12 MYX(2) =12 MYL(1) = MYC(1) =
(X2;L2;C1) 12 = 12.25 = 12.5 MYT = 13
(X3;L1;C1) 13 MYX(3) =14.5 MYL(2) = MYC(2) =
(X3;L2;C2) 16 = 13.75 = 13.5
(X4;L1;C2) 14 MYX(4) = 14.5
(X4;L2;C1) 15
207

Etape de calcul:

a) SPA şi GL:
SPAT = 26 cu GLT = 7 GL;
SPAX = 19 cu GLX = 3 GL;
SPAL = 4.5 cu GLL = 16 GL;
SPAC = 2 cu GLC = 1 GL;
SPAE = SPAT-SPAX-SPAL-SPAC = 0.5 cu GLE = GLT-GLX-GLL-GLC = 2 GL;

b) S2 :
SPA X SPA L SPA C SPA E
S2X   6.33; S2L   4.5;S2C   2; S2E   0.25
GLX GLL GLC GLE

c) F:
2
SX
FX  2
 25.32 cu (3 ; 2) GL
SE
2
SL
FL  2
 18 cu (1 ; 2) GL
SE
2
SC
FC  2
 8 cu (1 ; 2) GL
SE

Din tabelele Fisher 4,5,6 din Anexă,pentru (3 ; 2) GL avem valorile critice F0.05 = 19.6,
F0.01 = 99.17 şi F0.001 = 999.20.
Cum F0.05 = FX < F0.01 influenţa variaţiei lui X asupra variaţiei lui Y este semnificativă,
aşadar FX = 25.32*.
Din tabelele Fisher 4,5,6 din Anexă,pentru (1 ; 2) GL avem valorile critice F0.05 =
18.51,F0.01 = 98.50 şi F0.001 = 998.50
Cum FL, FC < F0.05 influenţa variaţiei lui L şi C asupra variaţiei lui Y este
nesemnificativă.
Tabelul sintetic de analiză a varianţei este:

Sursa de Variaţii Grade de Variaţie Rapoarte


variaţie Pătratice Libertate Fisher
(SPA) (GL) (S2) (F)
X 19 3 6.33 25.32*
L 4.5 1 4.5 18
C 2 1 2 8
E 0.5 2 0.25 -
T 26 7 - -
Indicii de corelaţie sunt:
SPA X SPA L SPA C
Ic ( X )   0.855*; Ic ( L)   0.416; Ic (C )   0.277
SPA T SPA T SPA T
Aporturile variaţiei lui X, L, C şi E la variaţia lui Y egală cu 100%,sunt:
208

SPA X SPA L
AX   73.1%; A L   17.3%
SPA T SPA T
SPA C
AC   7.7%; A E  1-A X -A L -A C  1.9%
SPA T

În exemplul rezolvat în secţiunea 9.3.1 (planul blocurilor complete randomizate) am găsit


2
S  0.667 cu n1 = 2 GL iar în exemplul de mai sus (planul pătratelor latine) am găsit
E1

S2E2  0.25 cu n2 = 2 GL deci:

e % 

S2E2 GL E2  1  : S  GL  1  2.4  240%
2
E1 E1

 GL E2  3  GL  3
E1

Aşadar planul pătratelor latine este de 2.4 ori mai eficient ca planul blocurilor complete
randomizate.

9.5 Rezumat

În acest capitol se prezintă analiza varianţei mono şi bifactorială (completă şi ierarhică)


nebalansată în populaţii omogene. Se prezintă şi planurile experimentale(blocuri complete
randomizate,patrate şi dreptunghiuri latine) în populaţii neomogene care se valorifică prin
analiza varianţei polifactorială balansată .

9.6 Întrebări

1. Care este ideea fundamentală a analizei varianţei?


2. Prin ce se deosebeşte analiza varianţei bifactorială completă ce cea ierarhică ?
3. Cum se asigură randomizarea în planurile experimentale ?
4. Ce este eficienţa relativă Fisher a două planuri experimentale ?

9.7 Bibliografie

1.D.Ene , M.Drăghici, I.N. Alecu “ Statistică aplicată în agricultură “ Ed.Ceres,2003


2.M.Iosifescu şi col. “ Mică enciclopedie de statistică “ Ed.Ştiinţif.şi Enciclop,,1985
3. Anuarul statistic al României , 1990 -2003
209

CAPITOLUL 10.

CORELAŢIA ŞI REGRESIA ÎNTRE DOUĂ CARACTERE

Obiective : Însuşirea de către studenţi a conceptelor de corelaţie şi regresie între două


caractere , liniară , reductibilă la liniară şi neliniară precum şi tehnicilor de prognoză
efectuate pe baza lor .

Conţinut :

10.1 Corelaţia şi regresia liniară


10.2 Corelaţii şi regresii reductibile la cea liniară
10.3 Corelaţii şi regresii neliniare
10.4 Rezumat
10.5 Întrebări
10.6 Bibliografie

Cuvinte cheie :covarianţă, coeficient de corelaţie liniară, coeficienţi de regresie liniară,


raport de corelaţie neliniară, coeficienţi de regresie neliniară,cross-corelaţie şi autocorelaţie.

Măsura cantitativă a influenţei variaţiei unui factor controlat X asupra variaţiei


factorului Y, se numeşte corelaţie între X şi Y iar funcţia care stabileşte dependenţa
cantitativă a lui Y şi X se numeşte funcţie de regresie a lui Y după X.
Din populaţie se aleg n exemplare pe care se măsoară însuşirile cantitative X şi Y
obţinând perechile de date de sondaj (x1, y1), …, (xn, yn).
Se reprezintă grafic în raport cu axele Ox, Oy punctele de coordonate (x1, y1), …, (xn,
yn) obţinând un nor de puncte în planul Oxy. După forma acestui nor de puncte funcţia de
regresie poate fi liniară (rectilinie) sau neliniară (curbilinie). Norul de puncte se poate
reprezenta grafic cu produsele informatice EXCEL şi TCWIN.

10.1 CORELAŢIA ŞI REGRESIA LINIARĂ

10.1.1 Cazul observaţiilor perechi (xi, yi)

Din datele de sondaj calculăm următorii indicatori statistici de sondaj:

a) Indicatorii de sondaj proprii fiecărui caracter:


I) Mediile de sondaj:
1 1
MX= X   X i ; MY = Y   Yi ;
n n
II) Varianţele de sondaj:
1
S2X   X i  X 2 ; S2Y  1  Yi  Y 2 ;
n 1 n 1
III) Abaterile standard de sondaj:
210

SX  S2X ; SY  S2Y ;

IV) Coeficienţii de variabilitate de sondaj :

SX SY
CX  .100(%); CY  .100(%)
X Y
Definiţiile, calităţile şi defectele acestor indicatori proprii au fost date în secţiunea 5.2.
b) Indicatorii de sondaj de legătură între caractere:

1
V) Covarianţa de sondaj: S XY 
n 1
 X i  X Yi  Y ;
Covarianţa de sondaj este o măsură a legăturii statistice a caracterelor X, Y fiind o
medie a produselor între abaterile valorilor de sondaj Xi faţă de X şi abaterile valorilor de
sondaj Yi faţă de Y .
Calităţi:
1) Covarianţa SXY are o valoare mărginită fiind cuprinsă în intervalul [-SXSY; + SXSY].
Dacă SXY > 0; Xi, Yi cresc sau scad simultan iar dacă SXY < 0; când Xi cresc, Yi scad şi
reciproc.
Dacă SXY = 0; Xi, Yi nu sunt corelate liniar.
2 2
Observăm că SXX = S X ; SYY = S Y .
Defecte:
2) Covarianţa SXY are unităţi de măsură egală cu produsul unităţilor de măsură ale lui
X şi Y deci nu permite comparaţii între perechile de caractere.
3) Covarianţa SXY este sensibilă la înmulţirea şi împărţirea datelor (secţiunea 2.2).
4) Covarianţa de sondaj SXY singură nu poate aprecia intensitatea legăturii statistice
între caracterele X, Y.

VI) Coeficientul de corelaţie liniară de sondaj


S XY
R (vezi teorema 10.2 de mai jos)
S X  SY
Acest coeficient este o măsură standardizată a legăturii statistice între caracterele X, Y
Calităţi (vezi secţiunea 2.2):
1) Coeficientul R este standardizat: R  [-1; 1];
2) Coeficientul R nu are unităţi de măsură deci permite comparaţii între perechile de
caractere;
3) Coeficientul R nu este sensibil la codificarea datelor;
4) Coeficientul R poate aprecia intensitatea legăturii statistice a caracterelor X, Y
(vezi teorema 10.2, punctul 3).

Dacă X1,…,Xn sunt depuse în celulele A1:An din coloana A în EXCEL iar
Y1,…,Yn sunt depuse în celulele B1:Bn din coloana B , atunci covarianţa Sxy
este dată de funcţia EXCEL scrisă în celula C1 : = COVAR((A1:An),(B1:Bn))
iar coeficientul de corelaţie liniară R este dat de funcţia EXCEL scrisă în
celula C2 : = CORREL((A1:An),(B1:Bn))
Valorea lui Sxy poate fi obţinută în EXCEL şi prin deschiderea ferestrei TOOLS
211

în care activăm opţiunea COVARIANCE în care declarăm celulele A1:An ,


B1:Bn în care se găsesc datele. Valoarea lui Sxy se obţine fie în foaia de calcul Nr.2 fie tot în
foaia de calcul Nr.1 în care se găsesc datele ,prin declararea ca celule de rezultate a altor
celule decât cele din blocul de date A1:Cn .
Coeficientul de corelaţie liniară R se obţine exact ca şi Sxy , dacă în DATA
ANALYSIS activăm opţiunea CORRELATION .
Uneori mai importante decât valorile Xi, Yi ale însuşirilor X, Y sunt rangurile lor în
ordonarea după mărime.
În cazul însuşirilor X, Y calitative se cunosc numai asemenea ranguri în clasificarea
după un anumit criteriu.
Notăm cu d diferenţa rangurilor a două însuşiri X, Y ale aceluiaşi exemplar,
coeficientul de corelaţie a rangurilor într-un sondaj de n perechi de ranguri, capătă forma:
6(d12  ...  d n2 )
R  1
n (n 2  1)
Privind perechea de caractere X, Y ca un vector Z = (X, Y), acesta are indicatorii de
sondaj:
1) Vectorul – medie de sondaj: M(Z) = ( X , Y )
2) Matricea de covarianţă de sondaj:
 S2X SXY 
C( Z)   
S 2 
 YX SY 
3) Matricea de corelaţie liniară de sondaj:
1 R 
L( Z )  
R 1 
VII) Coeficienţii de regresie liniară de sondaj:
 SXY
 daca regresia este cu termen liber (B0  0)
B1   S2X
 X Y / X daca regresia este fara termen liber (B  0)
 i i  i 0
Y  B1  X daca regresia este cu termen liber (B 0  0)
B0  
0 daca regresia este fara termen liber (B0  0)

Intre coeficientul de corelaţie liniară R şi coeficientul de regresie B1 există


relaţia :
B1= R.(SY/SX)

Coeficienţii B1 şi B0 de sondaj sunt o măsură a legăturii bijective a caracterelor X, Y


dată de ecuaţia Y = B0 + B1X.
Aceasta reprezintă grafic dreapta de regresie care trece prin centrul de greutate ( X ,
Y ) al norului de puncte căci Y = Y + B1(X - X ).
În legătura de tip statistic între X, Y se poate asocia o valoare a lui X cu mai multe
valori ale lui Y şi o valoare a lui Y poate corespunde cu mai multe valori ale lui X.
În legătura de tip funcţional între X, Y, nu se poate asocia o valoare a lui X cu mai
multe valori ale lui Y dar o valoare a lui Y poate corespunde cu mai multe valori ale lui X.
212

În legătura de tip bijectiv între X, Y fiecare valoare a lui X se asociază cu o valoare


unică a lui Y şi fiecare valoare a lui Y corespunde unei valori unice a lui X(corespondenţă
1-1).
Legătura din tabelul:
xi 2 3 3 4 5 6
yi 8 10 11 14 14 20

este de tip statistic căci lui x = 3 i se asociază y = 10 şi y = 11 iar y = 14 se corespunde cu x =


4 şi x = 5.
Legătura din tabelul:
xi 1 2 3 4 5 6
yi 8 10 11 14 14 20

este de tip funcţional căci y = 14 se corespunde cu x = 4 şi x = 5.

Legătura din tabelul:


xi 1 2 3 4 5 6
yi 8 10 11 14 15 20

este de tip bijectiv deoarece fiecare x este unic asociat cu un y unic.


ΔY
Coeficientul de regresie B1 este egal cu deci B1 este valoarea marginală cu
ΔX
care creşte sau scade Y când X creşte cu o unitate.
Termenul liber al regresiei B0 este valoarea- martor a lui Y când X = 0.

Calităţi
1) Coeficienţii B0, B1 au valori mărginite:
 Sy Sy   Sy Sy 
B1    ;  ; B 
0  Y   X ; Y   X
 SX SX   SX SX 

Defecte
2) B0 şi B1 au unităţi de măsură deci nu permit comparaţii între perechi de caractere;
3) B0 este sensibil la codificarea datelor iar B1 la înmulţirea şi împărţirea datelor;
4) Prognoza valorilor Y făcută pe baza dreptei de regresie Y = B0 + B1X este
aproximativă.

Dacă X1,…,Xn sunt depuse în celulele A1:An din coloana A în EXCEL iar
Y1,…,Yn sunt depuse în celulele B1:Bn din coloana B , atunci coeficientul de regresie liniară
B1 este dat de funcţia EXCEL scrisă în celula C3 : = SLOPE((A1:An),(B1:Bn)) iar termenul
liber al regresiei B0 este dat de funcţia EXCEL scrisă în celula C4 : =
INTERCEPT((A1:An),(B1:Bn))
Pentru prognoza valorii Y(0) = B0 + B1.X(0) se foloseşte funcţia EXCEL scrisă
În celula C5 : = FORECAST (X(0) , (A1:An),(B1:Bn)).
Fundamentarea afirmaţiilor din secţiunea 10.1 se bazează pe teoremele care urmează:
213

Teorema 10.1
1) Dreapta de regresie Y = B0 + B1X are coeficienţii daţi de relaţiile:
 S XY
 2 pt. B0  0
B1   S X
 X Y / X 2 pt. B  0
 i i  i 0

2) Lăţimea fâşiei de încredere este:

 n  1 1  R 2 
  SY  t ; n - 2 GL
2 n  n  2 2

Demonstraţie
1) Dacă regresia este cu termen liber (B0  0) vom minimiza variaţia reziduală cu
necunoscutele B0, B1:
SPAY.X = (y1 – B1x1 – B0)2 + … + (yn – B1xn – B0)2 = minim
(metoda celor mai mici pătrate)
Anulând derivatele parţiale ale lui SPAY.X în raport cu B1, B0, obţinem sistemul de
ecuaţii normale cu necunoscutele B1, B0:
B1  x i2  B0  x i   x i y i

B1  x i  nB 0   y i
S
Eliminând B0 între cele două ecuaţii normale, găsim B1  XY , apoi din a II-a
S2X
ecuaţie normală împărţită cu n, găsim B0 = Y -B1. X
 
Ecuaţia dreptei de regresie se scrie Y  Y  B1 X  B1  X adică
Y - Y = B1(X - X ) deci dreapta de regresie Y = B0 + B1X trece prin centrul de
greutate ( X , Y ) al norului de puncte {(xi, yi) ; (i = 1, …, n}.
Dacă regresia este fără termen liber (B0 = 0) avem variaţia reziduală minimă:
SPAY.X = (y1- B1x1)2 + … + (yn – B1xn)2 = minim.
Anulând derivata lui SPAY.X în raport cu B1, găsim ecuaţia normală necunoscuta B1:
B1  X i2   X i Yi de unde B1   X i Yi /  X i2 .
σ 2Y X
2) Avem M(Y – B0 – B1X) = M(Y) – B0 – B1M(X) = 0 şi V(Y – B0 – B1X) =
n
Y  B0  B1X
deci variabila normată n este variabilă N(0, 1).
σ YX
 n  2  SY2 X
Variabila 2
este variabilă 2 cu n – 2 GL, independentă de variabila N(0, 1)
 Y X

Y  B0  B1X
notată n . De aici rezultă că :
σ YX
214

 n  2  SY2 X
Y  B0  B1 X  Y2 X Y  B0  B1 X
t n:  n este variabilă student cu n –
 Y X n2 SY  X
2 GL.


De aici rezultă: P t  t  t
2 2
  1   adică intervalul de încredere pentru
Y – B0 – B 1X:
P  Y   B0  B1 X    ; B0  B1 X       1  
  2 2

S
unde    Y  X t / 2;( n  2)GL este diferenţa limită.
2 n
Ţinând cont de demonstraţia teoremei 10.2 avem:

SPAY  X 1  R   SPAY 1  R   n  1  SY
2 2 2
2
SY X    deci avem
n2 n2 n2

 n  1 1  R 2 
   SY  t / 2;( n 2)GL
2 n  n  2

Graficul dreptei de regresie cu fâşia de încredere δ α are forma:


2

Y D+
D
D
Y
D- D-

0 X X

Aici dreptele D+, D, D- au ecuaţiile


D +: Y = B0 + B1X + δ α
2
D: Y = B0 + B1X

D-: Y = B0 + B1X - δ α Q.E.D.


2
215

Teorema 10.2
S XY
1) Coeficientul de corelaţie liniară este dat de relaţia: R  ;
S X  SY
2
2) Aporturile variaţiei lui X, E la variaţia lui Y sunt A X  rXY ; AE = 1-AX
R
3) t  n  2 este variabilă Student cu n – 2 grade de libertate.
1  R2

Demonstraţie
S
1) Dacă B1  XY ; B0 = Y - B1 . X se verifică prin calcul relaţia:
S2X
2 2
 Yi  Y    B1X i  B0  Y    Yi  B1X i  B0 2 adică:

SPAY = SPAR + SPAY.X (1)


cu n – 1 = 1 + (n – 2) grade de libertate.
Grafic variaţiile pătratice din relaţia (1) au forma :

Definim coeficientul de corelaţie liniară R astfel:

SPAY  X
R  1 (2)
SPAY
216

deci conform relaţiei (1) avem:

R
SPAR

B X  B Y 
1 i 0
2
SPAY  Y  Y  i

S
şi înlocuind pe B1  XY ; B0 = Y - B1 X
S2X
S XY
(conform teoremei 10.1) rezultă prin calcul: R 
S X  SY
Observăm că:
2
 SPAXY 
SPAY  X  1  R 2   SPAY   1    SPAY adică:
 SPAX  SPAY 
SPA 2XY
SPA Y  X  SPA Y  (3)
SPA X
3) Ţinând cont de relaţia (2) relaţia (1) se scrie: SPAY  R 2 .SPAY  1  R 2  .SPAY
sau 1  R 2  1  R 2 
aşa că AX = R2 (numit şi determinaţie) este aportul în procente al variaţiei lui X la
variaţia lui Y şi AE = 1 – R2 este aportul în procente al variaţiei tuturor factorilor
necontrolaţi (numiţi Eroare) la variaţia lui Y.
Întreaga variaţie a lui Y este egală cu 100%.
2
SPA Y  Yi  Y 
3) Avem varianţa totală a lui Y: S2Y   , varianţa
GL Y n 1
2

regresiei liniare a lui Y după X: 2


S 
SPAY

B X 1 i  B0  Y 
şi varianţa reziduală
R
GLY 1
2
SPA Y  X  Yi  B1X i  B0 
a lui Y faţă de X: S 2Y  X  
GL Y  X n2
S R2
Rezultă variabila Fisher FX  cu (1; n – 2)GL.
SY2 X
SPAY  X 1  R  SPAY
2
SPAR R 2  SPAY
Dar S R2   şi SY2 X   deci
1 1 n2 n2

R2 1
avem: F  2
: cu (1; n-2) GL şi conform secţiunii 3.2
1 R n  2
R
t F  n2 este variabilă Student cu n – 2 GL.
1  R2
217

B1
Avem : t  n2 Q.E.D.
SY2
 B12
S X2

SY S
Avem B1  R de unde R  B1 X aşa că valorile Yai calculate din dreapta de
SX SY
regresie Y = Y + B1(X - X ) conform relaţiei:

Yai = Y + B1(Xi - X ) ; (i = 1, …, n) (4)

se numesc valori aşteptate ale lui Y.


Valorile Yci calculate conform relaţiei:

Yci = Yi – B1(Xi - X ) = Y + (Yi – Yai)) ; (i = 1, …, n) (5)

se numesc valori corectate ale lui Y.

Teorema 10.3

1) Pentru valorile aşteptate Ya = (Ya1, …, Yan) avem:

Media Ya  Y ; Varianţa SYa2  B12  S X2  R 2  SY2 ; Covarianţa SX,Ya = SXY;


Coeficientul de corelaţie liniară RX,Ya = 1

2) Pentru valorile corectate Yc = (Yc1, …, Ycn) avem:

Media Yc  Y ; Varianţa SYc2  SY2  B12  S X2  (1  R 2 )  SY2 ; Covarianţa SX,Yc = 0;


Coeficientul de corelaţie liniară RX,Yc = 0

Demonstraţie
 
1) Ya  M (Ya )  M Y  B1 X  X   Y  B1  M X  X  Y
   
   
SYa  V  Ya   V Y  B1 X  X   B1 .V X  X  B12 .V ( X )  R 2  V (Y )  R 2  SY2
2
 
2

S X ,Ya  C  X , Ya   M  X  Ya   M ( X )  M (Ya)  M [ X Y  B1 ( X 2  X  X )]  X  Y 
C( X ,Y )
 XY  B1  M ( X 2 )  M 2 ( X )   X  Y  B1  V ( X )   V ( X )  S XY
V (X )
C ( X , Ya ) B1  V ( X )
RX ,Ya   1
V ( X )V (Ya ) V ( X )  B12 .V ( X )

2) Yc  M (Yc)  M [Y  (Y  Ya)]  Y  M (Y )  M (Ya)  Y  Y  Y  Y


Avem Yc  Ya  Y  Y deci V (Yc)  V (Ya)  V (Y ) aşa că
2
V (Yc)  V (Y )  V (Ya )  V (Y )  B  V ( X ) 1
218

S (Y )
Dar B1   ( X , Y )  deci B12  V ( X )   2 ( X , Y )  V (Y )
S(X )
aşa că V (Yc)  1   2 ( X , Y )   V (Y )  1  R 2   SY2
S X ,Yc  C ( X , Yc)  C  X , Y  (Y  Ya)   C  X , Y  Ya   C ( X , Y )  C ( X , Ya)  S XY  S XY  0
C ( X , Yc)
RX ,Yc   ( X , Yc)   0 . Q.E.D.
V ( X ).V (Yc)

În continuare vom aborda estimaţii/teste pentru corelaţia şi regresia liniară în


populaţie.

Teorema 10.4

1) Intervalul de încredere pentru coeficientul de corelaţie liniară necunoscut ρxy


în populaţia din care provine sondajul, are forma
P(ρxy  [ δ α ; δ'α ]) = 1 – α unde
2 2
2 u / n 3
(1  R)  (1  R )e 2

  2u / n  3
şi
2
(1  R)  (1  R)e 2

2 u / n 3
(1  R )  (1  R)e 2

 '  2u / n  3
2
(1  R)  (1  R)e 2

2) Intervalul de încredere pentru coeficientul de regresie liniară necunoscut β1 în


populaţia din care provine sondajul, are forma:
P(β1  [β1 - δ α ; β1 + δ'α ]) = 1 – α unde
2 2
2
1  R SY
    t / 2;( n 2)GL
2 n  2 SX

Intervalul de încredere pentru termenul liber necunoscut β0 al regresiei liniare în


populaţia din care provine sondajul, are forma:
 
P β 0   B 0  δ α ; B 0  δ α    1  α unde
 
 2 
2 

2
1  R   n  1 S
2 2
X  n X  S
  Y t
   / 2;( n  2) GL
2 n  n  2 SX

(Fără demonstraţie)

Coeficientul de corelaţie liniară de sondaj R este variabil de la un sondaj la altul în


jurul coeficientului de corelaţie liniară necunoscut  în populaţie.
219

2
1- 
Se arată că: M ( R)   ; V(R)  deci lim V ( R)  0 aşa că R este
n n

o estimaţie absolut corectă a lui .

1) Testul ipotezei H:  = 0 faţă de alternativa H :   0 se face pe baza teoremei


10.2 punctul 3) astfel:
R
Din relaţia t  n  2  t rezultă:
1  R2 2

t
2
R  R / 2
t  n  2
2

Valorile critice R pentru α = 0.05; 0.01; 0.001 şi n – 2 GL sunt date de tabela 10 din
2
Anexă.
Decizia asupra ipotezei H se ia astfel:
Dacă R  R0.025 ipoteza H se acceptă:  = 0 deci X, Y nu sunt corelate liniar în
populaţie.
În caz contrar avem cazurile:
a) R0.025  R  R0.005 deci X, Y sunt corelate liniar semnificativ;
b) R0.005  R  R0.0005 deci X, Y sunt corelate distinct semnificativ;
c) R  R0.0005 deci X, Y sunt corelate liniar foarte semnificativ.

2) Testarea ipotezei H: ρ = 0 faţă de alternativa H : ρ  0 este echivalentă conform


S
relaţiei B1  R Y cu testarea ipotezei H : β1 = 0 faţă de alternativa H: β1 0 făcută pe baza
SX
B1
relaţiei: t  n  2 care se compară cu valorile critice t0.05; t0.01; t0.001 cu n – 2
2
SY 2
 B1
S X2
GL , extrase din tabela 2 din Anexă.

Decizia se ia ca la punctul 1).

3) Testul ipotezei H : ρ = ρ0 faţă de alternative H : ρ  ρ0 se face cu transformata


1 1 R
Fisher : z  ln .
2 1 R
 1 1  1  1 1  ρ0
Se arată că z este variabilă normală N  ln ;  deci cu z 0  ln
 2 1   n-3  2 1  ρ0
rezultă că: u = (z – z0) n  3 este variabilă N(0,1).
Din tabela 11 din Anexă, obţinem transformatele Fisher z al lui R şi z0 al lui ρ0 şi
calculăm pe u din relaţia precedentă şi îl comparăm cu u0.025 = 1.96; u0.005= 2.58; u0.0005 = 3.29
Decizia se ia ca la punctul 1).
Valorile z din tabelul 11 din Anexă se obţin şi cu funcţia EXCEL := FISHER ( R ) .
220

4) Testul ipotezei H: ρ’= ρ” faţă de alternativa H : ρ’ ρ” pe baza a două sondaje de


n1 perechi de valori (xi, yi) respectiv n2 perechi de valori (xi, yi), extrase din două populaţii
1 1 R'  1 1  ' 1 
normale, se bazează pe faptul că z '  ln este variabilă N  ln ;  iar
2 1 R '  2 1  ' n  3 
 1 
1 1 R"
z "  ln este variabilă:
2 1 R"

 1 1  ρ" 1
N ln ;  (z’, z” = independente) deci z’ – z” este variabilă
 2 1  ρ" n 2  3 
 1 1  z'z"
N 0;   aşa că u  este variabilă N(0, 1).
 n1 - 3 n 2  3  1 1

n1  3 n 2  3
Din tabela 11 din Anexă, obţinem transformatele Fisher z’ şi z” ale lui R’, R” apoi
calculăm pe u din relaţia precedentă şi îl comparăm cu valorile critice u0.025=1.96; u0.005=2.58;
u0.0005=3.29
Decizia se ia ca la punctul 1).

Exemple

1) Fie X = înălţimea la greabăn a viţeilor (cm) şi Y = greutatea în viu a viţeilor (kg).


Populaţia este formată din N = 100 viţei din care extragem un sondaj de
n = 10 viţei, pe care măsurăm înălţimea la greabăn şi greutatea, obţinând datele de
sondaj:

xi 70 68 71 72 69 66 70 67 71 72
yi 55 54 56 60 54 50 56 53 56 58

Se cere semnificaţia lui R, diagrama aporturilor şi dreapta de regresie


Y=B0+B1X + δ0.025 cu prognoză pentru x = 75 cm.

Soluţie
Se reprezintă grafic norul de puncte cu coordonatele (xi, yi) cu unul din produsele
informatice EXCEL ,TCWIN .
Forma alungită a norului de puncte indică o dependenţă liniară. Deoarece pentru talia
X = 0 avem greutatea Y = 0, regresia este fără termen liber.

Calcule:

a) Indicatorii de sondaj proprii fiecărui caracter

Mediile: MX= X 
 xi  696  69.6 cm
n 10

MY= Y 
 yi  552  55.2 kg
n 10
Abaterile – standard:
221

SX 
 x i X  
38.40
 4.27  2.07 cm
n 1 10  1
2

SY 
 y i Y  
67.60
 7.51  2.74 kg
n 1 10  1

Coeficienţii de variabilitate:

2.07 2.74
CX   100  3% ; CY   100  5%
69.6 55.2

b) Indicatorii de sondaj de legătură între caractere:

Covarianţa S XY 
 xi X  y  Y   47.80  5.31 cm x kg
i

n 1 10  1

Coeficientul de corelaţie liniară de sondaj:

S XY 5.31
R   0.938
S X  SY 2.07  2.74

Valorile critice din tabela 10 din Anexă, pentru 10 – 2 = 8 GL sunt:


R0.05 = 0.632; R0.01=0.765; R0.001 = 0.872
Deoarece R = 0.936 > R0.001 = 0.872 corelaţia liniară între X, Y pentru toţi viţeii din
care provin cei 10, este foarte semnificativă aşa că R= 0.936***
AX = R2 = 88%; AE = 1 – Ax = 12%

AE = 12%

Variaţia totală a lui Y = 100%

Ax = 88%

Concluzie: 88% din variaţia lui Y este datorată variaţiei lui X, restul de 12% se
datoreşte variaţiei altor factori necontrolaţi numiţi Eroare.
Pentru coeficientul de corelaţie liniară necunoscut ρ între X, Y în populaţie, avem
intervalele de încredere:
[0.801; 0.982] cu încrederea de 95%;
[0.688; 0.989] cu încrederea de 99%;
[0.504; 0.994] cu încrederea de 99.9%.

Intervalul cel mai mic [0.801; 0.982] cu încrederea de 95% are următoarea
interpretare:
222

Coeficientul de corelaţie necunoscut ρ între talia şi greutatea tuturor viţeilor din care
fac parte cei 10 ai sondajului, este cuprins între 0.801 şi 0.982 cu o încredere de 95%.
Există semiriscul 2.5% ca acest coeficient ρ să fie mai mic ca 0.801 atunci când
sondajul extras din populaţie a fost intens corelat liniar (în sondaj sunt viţei scunzi şi slabi
respectiv viţei înalţi şi graşi).
În mod analog există semiriscul 2.5% ca, coeficientul ρ să fie mai mare ca 0.982
atunci când sondajul extras din populaţie a fost slab corelat liniar (în sondaj sunt viţei de
toate categoriile: scunzi şi slabi, scunzi şi graşi, înalţi şi slabi, înalţi şi graşi).
Ipoteza H : ρ = 0.9 se acceptă deoarece ρ = 0.9  [0.801; 0.911].

Coeficienţii de regresie liniară de sondaj:

B1 
x y
i 38467 0.793 kg crestere greutate
i


2
x 48480
i 1 cm crestere talie
B0 = 0 kg (regresie fără termen liber).

Pentru coeficientul de regresie liniară necunoscut β1 între X şi Y în populaţie, avem


intervalele de încredere:
[0.676; 0.911] cu încrederea de 95%;
[0.622; 0.965] cu încrederea de 99%;
[0.530; 1.057] cu încrederea de 99.9%.

Ţinând cont de relaţia : 1= .(Y/X) intervalul cel mai mic [0.676; 0.911] cu
încrederea de 95% are următoarea interpretare:
Coeficientul de regresie liniară necunoscut β1 între X şi Y în populaţia din care
provine sondajul este cuprins între 0.676 şi 0.911 cu încrederea de 95%.
Există semiriscul 2.5% ca acest coeficient β1 să fie mai mic de 0.676 atunci când
sondajul extras din populaţie a fost intens corelat liniar sau variabilitatea caracterului Y
raportată la variabilitatea caracterului X este relativ mare în populaţie.
În mod analog există semiriscul 2.5% ca acest coeficient β1 să fie mai mare ca 0.911
atunci când sondajul extras din populaţie a fost slab corelat liniar sau variabilitatea
caracterului Y raportată la variabilitatea caracterului X este relativ mică în populaţie.
Ipoteza H : β1 = 0.7 se acceptă deoarece β1 = 0.7  [0.676; 0.911].
 n  1 1  R 2 
Relaţia:     SY  t / 2;( n 2)GL
2 n  n  2

10  1 1  0.9382 
devine:     2.74  2.31  0.736
2 10 10  2 
Ecuaţia dreptei de regresie cu fâşia de încredere Y  B0  B1 X    devine Y =
2
0.793X + 0.736.
Cu ajutorul acestei ecuaţii se pot face prognoze cu asigurarea de 95% astfel:
Pentru X = 75 cm avem valorile aşteptate:
60.211 kg (Maxima)
Ya = 0.793 x 75 + 0.736 = 59.475 kg (Media)
59.739 kg (Minima)
Pentru talia viţeilor Xa = 75 cm ,ne aşteptăm ca greutatea viţeilor din care provine
sondajul să fie cuprins între [58.739 kg; 60.211 kg] cu o încredere de 95%.
223

Există semiriscul 2.5% ca această greutate să fie sub 58.739 kg atunci când sondajul a
fost ales performant ca greutate.
În mod analog există semiriscul 2.5% ca această greutate să fie peste 60.211 kg atunci
când sondajul a fost ales neperformant ca greutate.
 X  75 cm
Ipoteza H :  a se acceptă deoarece Ya = 60 kg [58.739; 60.211].
 Ya  60 kg
Valorile aşteptate Ya ale lui Y se calculează cu relaţia Ya = 0.793X iar valorile
corectate Yc ale Y sunt date de relaţia:
Yc  Y   Y  Ya 
Avem tabelul:

xi yi yai Δyi=yi-yai yci  y  yi

70 55 55.54 - 0.54 54.66


68 54 53.96 0.04 55.24
71 56 56.34 - 0.34 54.86
72 60 57.13 2.87 58.07
69 54 54.75 - 0.75 54.45
66 50 52.37 - 2.37 52.83
70 56 55.54 0.46 55.66
67 53 53.16 - 0.16 55.04
71 56 56.34 - 0.34 54.86
72 58 57.13 0.87 56.07

Calculele precedente privitoare la regresia liniară pot fi fi făcute în EXCEL astfel :


Valorile X1,…,Xn se înscriu în celulele A1:An din coloana A iar
valorile Y1,…,Yn se înscriu în celulele B1 :Bn din coloana B a foii de calcul Nr.1
Deschidem fereasta TOOLS în care activăm opţiunea DATA ANALYSIS . Aici
activăm opţiunea REGRESSION în care declarăm celulele A1 :An şi B1 :Bn unde
se află datele.
Rezultatele regresiei liniare se găsesc fie în foaia de calcul Nr.2,fie tot în foaia de calcul Nr.1
cu date ,prin declararea ca celule de rezultate a altor celule decât cele din blocul de date A1:Cn
.
2) a) Să se testeze ipoteza H : ρ = 0.9 faţă de alternativa H : ρ  0.9 pentru exemplul
1 1 R
1) cu transformata Fisher: z  ln .
2 1 R
Soluţie
Transformata Fisher din tabela 11 din Anexă, pentru R = 0.938 este z = 1.7220 iar
transformata Fisher din tabela 11 din Anexă, pentru ρ0 = 0.9 este z0 = 1.4722
u  z  z 0  n  3 devine u = 0.66
Cum u  0.66  u0.025  1.96 , ipoteza H: ρ=0.9 se acceptă.
b) Dintr-o populaţie de viţei se extrage un sondaj de n1 = 10 viţei pe care se măsoară
talia X la greabăn în cm şi greutatea Y în kg găsindu-se R’=0.938. Din a II-a populaţie de
viţei se extrage un al II-lea sondaj de n2= 17 viţei şi se găseşte R”=0.865. Să se testeze ipoteza
H : ρ’ = ρ” în cele două populaţii faţă de alternativa H : ρ’  ρ”
224

Soluţie
Prin R’= 0.938 avem din tabela 11 din Anexă, transformata Fisher z’= 1.7220 iar
pentru R”= 0.865 din aceeaşi tabelă, avem transformata Fisher z”=1.3132

z ' z " 1.7220  1.3132


Avem u    3.04 .
1 1 1 1
 
n1  3 n2  3 7 14

Cum u = 3.04  [2.58; 3.29] rezultă că ρ’  ρ” distinct semnificativ.


3) În exemplul 1) cei 10 viţei ocupă următoarele ranguri în ordine descrescătoare după
talie la greabăn X şi greutate Y:

ti 6 8 3 1 7 10 5 9 4 2
gi 6 8 4 1 7 10 5 9 3 2
di 0 0 1 0 0 0 0 0 1 0
d i2 0 0 1 0 0 0 0 0 1 0
6 d i2
Coeficientul de corelaţie a rangurilor R  1  devine R = 0.988 cu 10 – 2 =
n  n 2  1
8 GL.
Valorile critice pentru n – 2 = 8 GL din tabela sunt R0.05 = 0.632; R0.01 = 0.765;
R0.001 = 0.872.
Cum R = 0.988 > R0.001 = 0.872, corelaţia rangurilor după talie şi greutate a tuturor
viţeilor din care fac parte cei 10, este foarte semnificativă.

10.1.2 Cazul observaţiilor multiple (xi, yij)

Există cazuri când pentru caracterul Y avem observaţii multiple deci datele de sondaj
au forma:

xi yij yi
x1 y11 _________y1p y1
x2 y21 _________y2p
.
y2
. .
. .
xn yn1 _________ynp .
yn

În acest caz se poate face corelaţia şi regresia liniară între valorile xi şi mediile y i şi
pe de altă parte se poate face analiza varianţei monofactorilaă balansată între valorile xi şi
valorile yij.
Variaţia totală a valorilor Y este:
n p
SPAY   yij  Y
i 1 j 1
  cu np – 1 GL

Variaţia regresiei între X şi Y este:


225

n 2

SPAR  p B0  B1 X i  Y
i 1
 cu 1 GL

Variaţia abaterilor de la regresie este:


n
2
SPAA  p  yi  B0  B1 xi  cu n – 2 GL
i 1
Variaţia intraclase (datorată erorii) este:
n p
SPA E    y ij  y i  2 cu n(p-1) GL
i 1 j 1
Se verifică prin calcul relaţia:
(6) SPAY = SPAR + SPAA + SPAE

cu np-1 = 1 + (n – 2) + n(p – 1) GL.

Prin însumarea două câte două, variaţiile din membrul II dau:

Variaţia interclase (datorată lui X) este:


n
SPAX = SPAR + SPAA = p  y i  y  cu 1 + (n – 2) = n-1 GL
i 1
Variaţia reziduală a regresiei între X şi Y este:
n p
  y ij  B0  B1x i 
2
SPAY.X = SPAA + SPAE = cu (n - 1) + n(p - 1)
i 1 j 1
= (np-2) GL
Coeficientul de corelaţie liniară R între valorile xi şi y i se calculează cu formula (2)
din teorema 10.2 astfel:
SPAY  X SPAR
R  1  (7)
SPAY SPAY

Indicele de corelaţie din analiza variaţiei (cap. 8.1) are forma:

SPAE SPAX
Ic  1   (8)
SPAY SPAY

Rezultă de aici:
SPAR = R2 . SPAY cu 1 GL
SPAY.X = (1 – R2) . SPAY cu np – 2 GL
respectiv:
SPAX =Ic2 . SPAY cu n – 1 GL
SPAE = (1 – Ic2) . SPAY cu n(p – 1) GL
De asemenea:
SPAA = (Ic2 – R2) . SPAY cu n – 2 GL
Prin împărţire cu SPAY, relaţia (6) devine:
1 = R2 + (Ic2 – R2) + (1 – Ic2) (9)
2 2 .
Din relaţia SPAA = (Ic – R ) SPAY rezultă: 0 < R < Ic (10)
226

Reunind teorema 2.9 din secţiunea 2.2 şi teorema 9.2 din secţiunea 9.1,
obţinem:

Teorema 10.5

În cazul observaţiilor multiple (xi, yij ) avem proprietăţile:


1) 0 < R < Ic < 1
R = Ic dacă şi numai dacă xi şi yij sunt dependente funcţional liniar
( y i = B0 + B1xi)
2) X, Y = independente  X, Y = necorelate liniar (R = 0)
3) X, Y = independente  X, Y = necorelate (Ic = 0)
4) X, Y = dependente funcţional liniar (Y = B0 + B1X) dacă şi numai dacă R = 1
5) X, Y = dependente funcţional liniar dacă şi numai dacă Ic = 1.

Fie  indicele de corelaţie în populaţia din care face parte sondajul.


Avem trei ipoteze relativ la populaţia din care face parte sondajul:

a) Ipoteza HX : η = 0 faţă de alternativa H X : η  0 se testează prin analiza variaţiei


(cap. 8.1) cu ajutorul raportului Fisher:
S2 n 1 I2 n 1
FX  X2 :  c 2: cu [n – 1; n(p – 1)] GL
S E n ( p  1) 1  I c n( p  1)

b) Ipoteza HR : ρ = 0 faţă de alternativa H R : ρ  0 se testează cu ajutorul raportului


Fisher:
S2 1 R2 1
FR  2R :  2
: cu [1; np – 2] GL
SY  X np  2 1  R np  2
R
De aici rezultă că tR  FR  np  2
1  R2

c) Ipoteza HA : ρ = η faţă de alternativa H A : ρ  η se testează cu ajutorul


raportului Fisher:

S A2 n2 I c2  R 2 n2
FA  2 :  2
: cu [n – 2; n(p – 1)] GL
S E n( p  1) 1  I c n ( p  1)
Ecuaţia dreptei de regresie între valorile xi şi y i cu fâşia de încredere se stabileşte ca
secţiunea 10.1.1 pe baza relaţiei: y = B0 + B1x + δ α
2
S
unde B1  XY2 ; B0  Y -B1  X ;
SX
( n  1)(1  R 2 )
   SY  t / 2;( n 2) GL
2 n( n  2)
227

Exemplu
Fie X = proteina digestibilă (kg) în raţia vacilor de lapte; Y = producţia lunară de lapte
(hectolitri). Avem n = 8 variante de proteină digestibilă aplicate la câte p = 3 vaci cu lapte.
Date de sondaj:

Xi Yij Yi Yai Y i
1 4.5; 4.5; 4.8 4.6 5.361 -0.761
1.05 5; 5; 5.3 5.1 5.629 -0.529
1.10 5.4; 5.3; 5.5 5.4 5.897 -0.497
1.15 6; 5.9; 6.1 6.0 6.165 -0.165
1.20 6.3; 6.3; 6.6 6.4 6.433 -0.033
1.25 6.9; 7; 7.1 7.0 6.701 0.299
1.30 7.5; 7.4; 7.6 7.5 6.969 0.531
1.35 7.9; 8.1; 8 8.0 7.237 0.763

Avem MX= 1.175 kg PD; MY=6.25 hectolitri lapte pe lună.


Regresia este fără termen liber (B0=0 pentru X=0) deci

B1 
 X i Yi  59.775  5.361 .
 X i2 11.15
Valorile aşteptate sunt yai  B1 .xi şi sunt înscrise în coloana patru a tabelului precedent.
8 3
Avem SPAY   ( yij  Y ) 2  30.452
i 1 j 1
8
SPAR=3  ( ya i  Y ) 2  8.384
i 1
8
SPAA= 3 ( y i  yai )2  6.254
i 1
8 3
SPAE =  ( yij  yi )2  15.814
i 1 j 1

Rezultă SPAX=SPAR+SPAA=14.638 şi
SPAY.X=SPAA+SPAE=22.068
SPAR SPAX
Rezultă R=  0.525; I c   0.693
SPAY SPAY

Testele ipotezelor
a) HX:=0 faţă de HX:  ≠0

I c2 n 1
FX= 2
:  2.112 cu (7;16)GL
1  I c n ( p  1)

Din tabelele 4,5,6 din Anexă, avem valorile critice pentru (7;16) GL astfel:
F0.05=2.66; F0.01=3.04;F0.001=6.50
Cum FX<F0.05 , se acceptă ipoteza Hx:  = 0

b) HR: = 0 faţă de HR: ≠0


228

R2 1
FR= 2
:  8.371 cu [1;22] GL
1  R np  2

tR= FR =2.893 cu 22 GL
Din tabela Student 2 din Anexă,avem pentru 22 GL, valorile critice t0.05=2.07;
t0.01=2.82; t0.001=3.79. Cum tR  [t0.01; t0.001] ipoteza HR: = 0 se respinge deci ≠
0 distinct semnificativ.

c) HA: =  faţă de H A :   

I c2  R 2 n  2
FA  :  1.050
1  I c2 np  1
cu (6;16) GL.
Din tabelele Fisher 4,5,6 din Anexă, pentru (6;16) GL ,avem valorile critice
F0.05=2.74; F0.01=4.20; F0.001=6.81
Cum FA<F0.05 ipoteza HA: =  se acceptă.
Funcţia de regresie este Y=B1X adică y=5.361X.
2 1 n
Avem S Y =  (Y i  Y )2  0.93
n i1
Lăţimea fâşiei de încredere cu =0.05 este
(8  1)(1  0.5252 )
2.5 % =  0.964  2.45  0.768
8(8  2)
deci Y=0.5361X 0.768

10.1.3 Cross - corelaţia şi autocorelaţia seriilor de timp

În secţiunile a) şi b) caracterele X,Y au fost măsurate în acelaşi moment de timp dând


la sondajul de repartiţie (x1,y1),…., (xn,yn) pentru vectorul aleator Z=(X,Y).
Dacă măsurătorilor sunt efectuate succesiv în timp la momentele t=1,2,…,n obţinem
sondajul de evoluţie (x1,y1),….,(xn,yn) pentru procesul aleator Z(t) = (X(t), Y(t)).
Valorile consecutive în timp (x1,…,xn) respectiv (y1,….,yn) se numesc şi serii de timp
pentru caracterele X,Y.
Uneori mai importantă decât corelaţia perechilor (xi,yi) este cross-corelaţia
perechilor (xi, yi+1).
Astfel resursa X aplicată la plante sau animale în momentul t=i are efect asupra valorii
producţiei Y la momentul următor t’=i+1.

Exemple
1) X=precipitaţii în săptămâna t=i
Y = talia plantei în săptămâna următoare t’=i+1

2) X=cantitatea de proteină digestibilă în raţia vacilor cu lapte în ziua t=i


Y=producţia zilnică de lapte în ziua următoare t’=i+1

Exemplu
X=proteina digestibilă în raţia unei vaci cu lapte (g/zi) în 11 zile consecutive
Y=producţia zilnică de lapte (litri/zi) în 11 zile consecutive.
229

Date de sondaj:
Xi 1000 1020 1040 1060 1080 1100 1120 1140 1160 1180 1200
Yi 9.6 9.6 9.7 9.8 9.9 9.9 9.9 10.1 10.3 10.4 10.6
Yi+1 9.6 9.7 9.8 9.9 9.9 9.9 10.1 10.3 10.4 10.6 -

Aplicând corelaţia şi regresia liniară între valorile (xi, yi+1) pentru primale n=10 zile,
obţinem:
Mediile: MX=1090 g/zi ; MY’=10.02 l/zi
Abaterile standard: SX=60.553 g/zi; SY,=0.322 l/zi
Covarianţa: SXY,=18.889 g x l/zi
Coeficientul de cross-corelaţie liniară: R=0.967
Coeficienţii de cross-regresie liniară:
B0=4.405; B1=0.005
Lăţimea fâşiei de încredere 2.5% =0.063;
Ecuaţia de cross-regresie este :Yt+1=B0+B1.Xt /2

Autocorelaţia pentru caracterul Y este corelaţia între valorile yi la momentul t=i şi


valorile yi+1 la momentul t’=i+1.
Astfel valoarea producţiei yi+1 la momentul t’=i+1 depinde atât de valoarea
resursei xi la momentul anterior t=i cât şi de valoarea producţiei yi la momentul anterior
t=i.
De exemplu, producţia de lapte yi+1 în ziua t’=i+1 depinde atât de cantitatea de
proteină digestibilă xi în ziua precedentă t=i (cauză externă) cât şi de producţia de lapte yi în
ziua precedentă t=i (cauză internă).
Exemplu
Prin corelaţia şi regresia liniară a valorilor (yi, yi+1) din exemplul precedent, obţinem:
Mediile: Y = 9.92 l/zi Y ’ = 10.02 l/zi
Abaterile standard:
SY = 0.274 l/zi; SY’ =0.322 l/zi
Autocovarianţa SYY’ = 0.086
Coeficientul de autocorelaţie liniară:
R=0.976
Coeficienţii de autoregresie liniară:
B0=-1.367; B1=1.148
Lăţimea fâşiei de încredere :  2.5%=0.054
Ecuaţia de autoregresie Yt+1 = B0+B1.Yt    / 2

10.2 CORELAŢII ŞI REGRESII REDUCTIBILE LA CEA LINIARĂ

Funcţia de regresie y=f(x) se reduce la regresia liniară dacă există schimbările de


variabile x=φ(u), y=ψ(v) prin care funcţia de regresie y=f(x) devine liniară:V=B0+B1U
Uneori valorile lui x şi/sau y trebuie codificate pentru ca după schimbările de
variabile x=φ(u) şi/sau y=ψ(v) valorile U, V să nu fie exagerat de mari sau de mici.
De exemplu codificaea lui x[xmin; xmax] în xc[a,b] se face cu funcţia:
ba a.x max  b.x min
xc= .x 
x max  x min x max  x min
230

unde a şi b se aleg astfel ca [φ(a), φ(b)] să aibă limite moderate ca mărime.


Vom analiza câteva cazuri uzuale:

10.2.1 Corelaţia şi regresia putere

Această funcţie are forma: Y=eB0.XB1 .


Cu schimbările U=lnX; V=lnY avem V=B0+B1U

Exemplu

X=cheltuielile de producţie anuale ale unei asociaţii agricole (milioane lei);


Y=profitul anual al aceleiaşi asociaţii (milioane lei);
Date de sondaj:
Xi 500 540 600 660 690 740 800 900
Yi 140 155 170 180 185 190 210 230
Ui=lnXi 6.215 6.292 6.397 6.492 6.537 6.607 6.685 6.802
Vi=lnYi 4.941 5.009 5.093 5.169 5.205 5.261 5.323 5.417

Corelaţia şi regresia liniară de la punctul 10.1.1 aplicată perechilor de valori (Ui,Vi) dă


rezultatele (cu B0=0):
B0=0; B1=0.799; R=0.993***
Valorile critice ale lui R pentru 8-2=6GL extrase din tabela 10 din Anexă sunt
R0.05=0.707; R0.01=0.834; R0.001=0.925 deci corelaţia putere în populaţia din care provine
sondajul este foarte semnificativă.
Avem tabelul cu valorile Xi, valorile observate Yi, valorile aşteptate Yai şi diferenţele
Yi=Yi-Yai:

Xi Yi Yai Yi
500 140 143.34 -3.34
540 155 152.43 2.47
600 170 165.81 4.19
660 180 178.93 1.07
690 185 185.40 -0.40
740 190 196.06 -6.06
800 210 208.66 1.34
900 230 229.25 0.75

10.2.2 Corelaţia şi regresia de saturaţie

Această funcţie are forma: Y=B1e-X+B0 .


Cu schimbările U=e-X; V=Y , avem V=B0+B1U

Exemplu:

X= proteină digestibilă în raţia unei vaci cu lapte (kg/zi)


Y= producţia lunară de lapte (hectolitri).
Date de sondaj:
231

Xi 1 1.05 1.1 1.15 1.2 1.25 1.3 1.35


Yi 4.5 4.9 5.4 5.8 6.1 6.3 6.4 6.4
Ui=e-Xi 0.368 0.350 0.333 0.317 0.301 0.287 0.273 0.259
Vi=Yi 4.5 4.9 5.4 5.8 6.1 6.3 6.4 6.4

Corelaţia şi regresia liniară de la punctul 10.1.1, aplicată perechilor de valori (Ui,Vi)


dă rezultatele: B0=11.476; B1=-18.5;R=-0.971***.
Valorile critice ale lui R din tabela 10 din Anexă,pentru 8-2=6GL sunt R0.05=0.707;
R0.01=0.834; R0.001=0.925, deci corelaţia de saturaţie în populaţia din care provine sondajul
este foarte semnificativă.
Avem tabelul cu valorile Xi, valorile observate Yi, valorile aşteptate Yai şi diferenţele
Yi=Yi-Yai:

Xi Yi Yai Yi
1 4.5 4.67 -0.17
1.05 4.9 5.00 -0.10
1.1 5.4 5.32 0.08
1.15 5.8 5.62 0.18
1.2 6.1 5.90 0.20
1.25 6.3 6.18 0.12
1.3 6.4 6.43 -0.03
1.35 6.4 6.68 -0.28

10.2.3 Corelaţia şi regresia logistică

Această funcţie are forma Y=1/(B1eX+B0) .


Cu schimbările U=eX; V=1/Y avem V=B0+B1U.

Exemplu:
X= îngrăşăminte NPK (t/ha)
Y= producţia de grâu (t/ha)
Date de sondaj:
Xi 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35
Yi 2 2.3 2.8 3.6 3.9 4.1 4.2 4.2
Xi
Ui=e 1 1.051 1.105 1.162 1.221 1.284 1.350 1.419
Vi=1/Yi 0.500 0.435 0.357 0.278 0.256 0.244 0.238 0.238
Corelaţia şi regresia liniară de la punctul 10.1.1, aplicată perechilor de valori (Ui,Vi) dă
rezultatele: B0=1.059; B1=-0.618;R=-0.893**
Valorile critice ale lui R pentru 8-2=6GL, extrase din tabelele 4,5,6 din Anexă, sunt
R0.05=0.707; R0.01=0.834; R0.001=0.925, deci corelaţia logistică în populaţia din care provine
sondajul, este distinct semnificativă.
Avem tabelul cu valorile Xi, valorile observate Yi, valorile aşteptate Yai şi diferenţele
Yi=Yi-Yai
232

Xi Yi Yai Yi
0 2 2.27 -0.27
0.05 2.3 2.44 -0.14
0.1 2.8 2.66 0.14
0.15 3.6 2.93 0.67
0.2 3.9 3.28 0.62
0.25 4.1 3.76 0.33
0.3 4.2 4.44 -0.24
0.35 4.2 5.48 -1.28

10.2.4 Corelaţia şi regresia de concentraţie

Această funcţie are forma Y=B1Xae-X+B0, unde a este abscisa concentraţiei maxime
pentru Y.
Cu schimbările U= Xae-X; V=Y obţinem V=B0+B1U

Exemplu:
X= timp (minute scurse de la momentul aplicării unui vaccin pentru purcei )
Y= concentraţia în sânge al vaccinului (0/00)
a= 5 minute.

Date de sondaj:
Xi 1 2 3 4 5 6 7 8
Yi 0.4 0.9 1.5 1.8 2 1.7 1.4 0.8
Ui=X5e-Xi 0.368 4.33 12.10 18.76 21.06 19.27 15.33 10.99
Vi=Yi 0.4 0.9 1.5 1.8 2 1.7 1.4 0.8
Corelaţia şi regresia liniară de la punctul 10.1.1, aplicată perechilor de valori (Ui,Vi) dă
rezultatele (cu B0=0):
B0=0; B1=0.095; R=0.936***
Valorile critice ale lui R din tabelete 4,5,6 din Anexă,pentru 8-2=6GL sunt
R0.05=0.707; R0.01=0.834; R0.001=0.925,deci corelaţia de concentraţie în populaţia din care
provine sondajul, este foarte semnificativă.
Avem tabelul cu valorile Xi, valorile observate Yi, valorile aşteptate Yai şi diferenţele
Yi=Yi-Yai.

Xi Yi Yai Yi
1 0.4 0.04 0.36
2 0.9 0.41 0.49
3 1.5 1.15 0.35
4 1.8 1.79 0.01
5 2 2.01 -0.01
6 1.7 1.84 -0.14
7 1.4 1.46 -0.06
8 0.8 1.05 -0.25
233

10.2.5 Corelaţia şi regresia liniară pe porţiuni

Fie datele de sondaj (x1,y1) ,…,(xn,yn) aranjate astfel că x1≤…≤xn .


Împărţim intervalul [x1;xn] în k subintervale, nu neapărat egale între ele,de forma : x1 =
L0 <…< Lk-1 < Lk = xn .
Fie nj numărul valorilor xi în subintervalul [Lj-1;Lj) unde j =1,2,…,k.
Dacă notăm nj* = n1+n2+…+nj şi luăm n0*=0 rezultă nk*=n şi
valorile xi din subintervalul [Lj-1;Lj) sunt :
Alegerea numărului k de subintervale şi a limitelor lor,o facem
xn , xn ,..., xn
j 1 1 j 1  2 j

astfel că pentru orice j=1,2,…,k , perechile de valori :

( xn ; yn ),..., ( xn ; yn )


j 1 j 1 j j

să fie corelate liniar deci coeficientul lor de corelaţie Rj să fie


semnificativ adică restricţia y = fj(x) a funcţiei de regresie y = f(x)
la intervalul [Lj-1;Lj) să fie liniară : y = fj(x) =B0j + B1j.x pentru
orice j = 1,2,…,k .
Se spune că în acest caz funcţia de regresie este liniară pe porţiuni:

 B01  B11 .x   1 , x  [L 0 ; L1 ) 
 B  B .x   , x  [L1 ; L2 ) 
 02 12 2
y 
................................................... 
 B0 k  B1k .x   k , x  [L k-1 ; Lk ) 

Exemplu
X= densitatea plantelor de porumb-boabe(mii plante/ha)
Y= producţia de porumb-boabe(tone/ha)
Date de sondaj de la n = 11 loturi a 1000 m2 :

xi 50 54 58 62 66 70 74 78 82 86 90
yi 4 4.3 4.9 5.6 5.9 6 5.7 5 4.2 3 2

Să se ajusteze aceste date prin corelaţia şi regresia liniară pe


porţiuni cu k = 2 subintervale : [50;74) şi [74;90].
Soluţie:
Pentru xє[50;74) cu n1= 6 perechi de valori (xi ; yi ) avem coeficientul de corelaţie liniară
R1 = 0.9795
Din tabela 10 din Anexă pentru n1 – 2 = 4 GL avem valorile critice: R0.05 = 0.811 ; R0.01
= 0.917 ; R0.001 = 0.974
Cum R1 = 0.9795 > R0.001 =0.974 , corelaţia liniară pe subintervalul xє[50;74) este foarte
semnificativă .
Pe acest subinterval avem funcţia de regresie liniară :
y = - 1.4143 + 0.1086x ± 0.212

Pentru xє[74;90] cu n2 = 5 perechi de valori (xi;yi) avem coeficientul de corelaţie liniară


R2 = - 0.9948
234

Din tabela 10 din Anexă , pentru n2 – 2 =3 GL avem valorile

critice : R0.05 =0.878 ; R0.01 = 0.990 ; R0.001 = 0.999

Cum R0.01 = 0.990 < | R2 | = 0.9948 < R0.001 = 0.999 , corelaţia

liniară pe subintervalul xє[74;90] este distinct semnificativă .

Pe acest subinterval avem funcţia de regresie liniară :

y = 23.25 - 0.235x ± 0.254

Valorile observate xi , yi , valorile aşteptate yai calculate cu cele două funcţii de regresie
liniară pe subintervale şi diferenţele Δyi =yi – yai sunt date de tabelul :

xi yi yai Δyi
50 4 4.014 - 0.014
54 4.3 4.449 - 0.149
58 4.9 4.883 0.117
62 5.6 5.317 0.287
66 5.8 5.751 0.049
70 6 6.186 - 0.186
74 5.7 5.860 - 0.160
78 5 4.920 0.080
82 4.2 3.980 0.220
86 3 3.040 - 0.040
90 2 2.100 - 0.100

Dacă s-ar fi corelat valorile iniţiale în număr de n = 11 perechi de valori (xi;yi) am fi


obţinut coeficientul de corelaţie liniară R = - 0.446
Din tabela 10 din Anexă pentru n – 2 = 9 GL avem valorile critice:
R0.05 =0.602 ; R0.01 = 0.735 ; R0.001 = 0.847
Cum | R | = 0.446 < R0.05 = 0.602 rezultă că corelaţia liniară pentru
N = 11 perechi de valori iniţiale (xi;yi) este nesemnificativă.

10.3 CORELAŢII ŞI REGRESII NELINIARE

Am văzut în capitolul 3 că două variabile aleatoare independente X,Y sunt necorelate


liniar sau prin negaţie două variabile X, Y corelate liniar sunt dependente.Reciproca nu
este în general adevărată, adică există variabile X,Y dependente, care nu sunt corelate liniar,
dar pot fi corelate neliniar.
În cazul corelaţiei şi regresiei neliniare a variabilelor X,Y forma norului de puncte
(xi,yi) (i=1,....., n) indică o anumită formă a funcţiei de regresie Y=f(X,B0, B1,........., Bd-1),
unde B0, B1,........., Bd-1 sunt d parametri necunoscuţi ai funcţiei de regresie.
Parcurgem următoarele etape:

a)Calculul parametrilor de regresie B0, B1,........., Bd-1 se face ca şi în cazul regresiei


liniare, prin metoda celor mai mici pătrate (vezi teorema 10.1):
Vom minimiza variaţia reziduală:
235

SPAY.X =[y1-f(x1, B0, B1,....., Bd-1)]2+............+[yn- f(xn, B0, B1,....., Bd-1)]2=


=minim
Anulând derivatele parţiale ale lui SPAY.X în raport cu B0, B1,....., Bd-1 obţinem
sistemul de d ecuaţii normale cu d necunoscute : B0, B1,....., Bd-1:
SPAY . X SPAY . X
 0,................., 0
B 0 Bd  1
b) După calculul celor d parametri de regresie B0, B1,....., Bd-1, vom calcula raportul
de corelaţie neliniar Rc printr-o formulă asemănătoare cu formula (1) din demonstraţia
teoremei 10.2:
SPAY . X
Rc= 1  (1)
SPAY
Aici SPAY=  ( yi  Y ) 2 este varianţa totală a valorilor lui Y cu n-1 GL.
SPAY.X=  [yi-f(xi , B0, B1,....., Bd-1)]2 este varianţa reziduală a valorilor aşteptate
f(xi, B0, B1,....., Bd-1) ale lui Y faţă de valorile observate yi ale ale lui Y n-d grade de
libertate (d este numărul parametrilor B0, B1,....., Bd-1 ai regresiei)
Diferenţa SPAY-SPAY.X=SPAR se numeşte varianţa regresiei neliniare şi are n-1-
(n-d)=d-1GL
Ca şi în cazul teoremei 10,2 se arată că :

Rc2 d 1
F 2
: (2)
1  Rc n  d

este variabilă Fisher cu (d-1;n-d ) GL.


În cazul dreptei de regresie Y=B0+B1X avem d=2 parametrii necunoscuţi B0, B1, deci:

R2 1
F 2
: (3)
1 R n  2
R
este variabilă Fisher cu (1;n-2) GL, deci t= F  n2 este
2
1 R
variabilă Student cu n-2 GL ( punctul 3 al teoremei 10.2)
Deosebirea între R şi Rc este accea că R[-1;1], iar Rc[0;1]

10.3.1 Corelaţia şi regresia polinomială

Funcţia de regresie are forma :


Y=f(X, B0, B1,....., Bm)= B0+B1X+.....+ BmXm în care avem d=m+1, parametri de regresie
necunoscuţi B0, B1,....., Bm.
Sistemul cu d =m+1 ecuaţii normale cu necunoscutele B0, B1,....., Bm are forma:
236

Bm  xi2 m  ...  B1  xim 1  B0  xim   xim yi


.....................................................................
Bm  xim 1  ...  B1  xi2  B0  xi   xi yi
Bm  xim  ...  B1  xi  nB0   yi

 x1m x1m 1.............1


 
Notăm X=  ........................  de tip n x (m+1)
 xnm xnm 1.............1
 
 Bm 
 B 
XT este matricea transpusă a lui X, de tip (m+1) x n, B=  m1  este vectorul -
..........
 
 Bo 
 y1 
coloană de tip (m+1)x 1 al coeficienţilor de regresie polinomială, iar Y= .... este vectorul
 yn 
coloană de tip n x 1 pentru valorile lui Y.
Sistemul precedent capătă forma matricială:

XT.X.B=XT.Y

Dacă matricea simetrică XT.X de ordin m+1 este nesingulară (det(XT.X)0), sistemul
de ecuaţii normale are soluţie unică scrisă matricial:

B=(XT.X)-1.XT.Y

Cu d= m+1, raportul Fisher F capătă forma :


Rc2 m
Fp  2
: (4)
1  Rc n  m  1

cu (m; n-m-1) GL.

În cazul regresiei polinomiale fără termen liber (B0=0) ecuaţiile normale au forma:

Bm  xi2 m  ...  B1  xim 1   xim yi


.........................................................
Bm  xim 1  ...  B1  xi2   xi yi

Avem un sistem liniar de m ecuaţii cu m necunoscute B1,.........., Bm, deci


numărul parametrilor de regresie este d= m.
Cu d= m raportul Fisher capătă forma:

Rc2 m 1
Fp  2
: (5)
1  Rc n  m
237

cu (m-1;n-m)GL

Exemplu:

Fie X= cantitatea de azotat de amoniu (kg/ha) şi


Y= producţia de grâu (quintale/ha).
Avem un sondaj de volum n=10:

xi 0 30 60 90 120 150 180 210 240 270


yi 15 17 20 22 25 29 34 36 38 40

Folosim funcţia de regresie polinomială de grad m=3 având forma:


Y=Bo+B1X+B2X2+B3X3
Coeficienţii de regesie daţi de sistemul de ecuaţii normale au valorile :
B0=15.27849; B1=0.032527; B2=0.000653; B3=-0.0000016

Valorile xi, valorile observate yi , valorile aşteptate


yai =B0+B1 .xi +B2 xi 2 +B3 xi 3 şi diferenţele yi=yi-yai , sunt date de tabelul:

xi yi yai yi
0 15 15.28 -0.28
30 17 16.80 0.20
60 20 19.23 0.77
90 22 22.32 -0.32
120 25 25.80 -0.80
150 29 29.40 -0.40
180 34 32.88 1.12
210 36 35.97 0.03
240 38 38.40 -0.40
270 40 39.92 0.08

Variaţia totală este SPAY=742.4, iar variaţia reziduală este SPAY.X=3.025 aşa că
SPAY . X
raportul de corelaţie va fi : Rc= 1  =0.99796.
SPAY
Raportul Fisher Fp are forma (4) (regresia este cu termen liber) şi pentru n=10; m=3
capătă valoarea Fp=488.7 cu (3;6) GL.
Valorile critice Fisher din tabelele 4,5,6 din Anexă, cu (3;6) GL sunt: F0.05=4.76;
F0.01=9.78; F0.001=23.70.
Cum Fp=488.7 F0.001=23.70, corelaţia polinomială în populaţia din care provine
sondajul este foarte semnificativă.

10.3.2 Corelaţia şi regresia trigonometrică

Funcţia de regresie are forma:

Y=To+(S1sinx+ C1cosx)+..........+(Sksinkx+Ckcoskx), (k ≤ n/2)


238

în care avem 2k+1 parametri de regresie necunoscuţi T0, S1, C1,...., Sk,Ck.
Sistemul cu d= k+1 ecuaţii normale cu necunoscutele Y0, S1, C1,......., Sk,Ck dă
aceste valori astfel:

T0= MY
2 n 2 n
S1=  yi sin xi ; C1=  yi cos xi
n i1 n i1
...................................................……

2 n 2 n
Sk= 
n i 1
yi sin kxi ; Ck=  yi cos kxi
n i 1

Pentru a aduce date de sondaj xi în carcul trigonometric [0;2], vom înlocui pe xi


(n  1) xi  ( xn  nx1 ) 2
cu xci=  după ce în prealabil valorile xi au fost reordonate în
xn  x1 n
ordine crescătoare.

Dacă xi[x1;xn], atunci xci=[0;2] iar xcn=2


Dacă xi=x1+(i-1)r (xi sunt echidistante), atunci :
xc1=2/n, xc2=2(2/n),........, xcn=n(2/n)= 2.
Calculul raportului de corelaţie neliniar Rc se face cu formula (1) de mai sus.
Testarea corelaţiei trigonometrice în populaţia din care provine sondajul adică
varificarea ipotezei H: c=0 faţă de alternativa H: c 0 se face cu relaţia (2) de mai sus
în care F este variabilă Fisher cu (d-1; n-d) GL, unde d este numărul parametrilor de
regresie necunoscuţi T0, S1, C1,........, Sk, Ck, deci d=2k+1, aşa că F renotat cu Ft are forma :
Ft = [Rc2 / (1- Rc2 )] : [2k/(n-2k-1)] (6)
cu (2k ; n-2k-1 ) GL
Prin regresia trigonometrică se ajustează date cu caracter periodic (ciclic) mai ales
când x este timpul măsurat sezonier (în secunde , minute, ore, zile, săptămâni, luni, trimestre,
semestre, ani, decenii, secole, milenii).
De exemplu în cazul X=timpul, Y poate fi caracter meteorologic (precipitaţii, căldură,
lumină, secete, inundaţii, îngheţuri, grindină,etc.) sau geologic (cutremure, alunecări de teren)
sau biologic (cicluri de reproducţie şi lactaţie, serii la îngrăşat pentru animale domestice,
perioade de vegetaţie pentru plantele de cultură) sau economic (perioade de avânt economic şi
de recesiune).

Exemple :
1)X=timpul în luni
Y=temperatura medie lunară a aerului în perioada 1901-1990 la staţia meteo
Bucureşti-Filaret (0C).
Z=precipitaţiile medii lunare în perioada 1901-1990 la staţia meteo Bucureşti-Filaret
3
(m /ha).
239

Date de sondaj:
Luna X Temperatura Y Precipitaţii Z
1 -2.4 406
2 -0.3 340
3 5.2 374
4 11.6 444
5 16.9 681
6 20.6 860
7 22.8 578
8 22.3 512
9 17.8 391
10 11.8 411
11 5.5 485
12 0.4 411
a) Funcţia de regresie trigonometrică pentru temperatura medie lunară Y cu
k=2 armonice are coeficienţii:
T0=MY=11.01667 oC
S1= - 6.5409; C1= - 10.5161;
S2= - 0.4908; C2= - 0.5500.
Valorile echidistante xi, valorile din cerc xci = i.(2/12), valorile observate yi, cele
aşteptate yai = T0 + [s1.sin(xci) + c1.cos(xci)] + [s2.sin(2.xci) + c2.cos(2.xci)]
şi diferenţele yi=yi-yai sunt :

xi Xci Yi yai yi


1 0.5235989 -2.4 -2.06 -0.34
2 1.047198 -0.3 -0.06 -0.24
3 1.570797 5.2 5.03 0.17
4 2.094395 11.6 11.31 0.29
5 2.617994 16.9 17.00 -0.10
6 3.141593 20.6 20.98 -0.38
7 3.665192 22.8 22.69 0.11
8 4.188791 22.3 21.79 0.51
9 4.712390 17.8 18.11 -0.31
10 5.235988 11.8 12.12 -0.32
11 5.759587 5.5 5.33 0.17
12 6.283186 0.4 -0.05 0.45

Variaţia totală este SPAY=2381.04, variaţia reziduală este SPAY.X=1.148, deci raportul
de corelaţie trigonometrică dat de relaţia (1) va fi Rc=0.999759
Raportul Fisher este dat de relaţia (6) şi pentru n=12; k=2 capătă valoarea : Ft=3629
cu (4; 7)GL.
Valorile critice Fisher din tabele 4,5,6 din Anexă, cu (4;7)GL sunt F0.05=4.12;
F0.01=7.85; F0.001=17.19
Cum Ft=3629 F0.001=17.19, corelaţia trigonometrică în populaţia din care provine
sondajul, este foarte semnificativă.
Media de sondaj de evoluţie este :
240

Y1 Y
 Y2  ...  Yn1  n
MYc  2 n  12.10 C
n 1
Ritmul mediu valoric D = (Yn – Y1 ) / (n – 1 ) şi ritmul mediu procen-
tual I = ( Yn / Y1 )1/n nu sunt relevante (vezi exemplul b) care urmează).

b) Funcţia de regresie trigonometrică pentru precipitaţiile medii lunare Z cu k=5


armonice, are coeficienţii:
T0=491.0834 m3/ha
S1= -20.8963; C1= -145.0328;
S2= -26.7024; C2= 121.2500;
S3= 6.8334; C3= -40.6666;
S4= -25.8362; C4= 17.9168;
S5 = 19.2296 ; C5 = - 38.8806
Valorile echidistante xi, valorile din cerc xci = i.(2/ 12), valorile observate zi, valorile
aşteptate
5
zai  T0   [s j .sin( j.xci )  c j cos( j.xci )]
j 1

şi diferenţele zi=zi - zai sunt date de tabelul de mai jos.

xi xci zi zai zi


1 0.5235989 406 411.25 - 5.25
2 1.047198 340 334.75 5.25
3 1.570797 374 379.25 - 5.25
4 2.094395 444 438.75 5.25
5 2.617994 681 686.25 - 5.25
6 3.141593 860 854.75 5.25
7 3.665192 578 583.25 - 5.25
8 4.188791 512 506.75 5.25
9 4.712390 391 396.25 - 5.25
10 5.235988 411 405.75 5.25
11 5.759587 485 490.25 - 5.25
12 6.283186 411 405.75 5.25

Variaţia totală este SPAZ=3142985, variaţia reziduală este SPAZ.X=331, deci raportul
de corelaţie trigonometrică dat de relaţia (6) este : Rc==0.9999474
Raportul Fisher Ft dat de relaţia (1) ,pentru n=12, k=5 capătă valoarea Ft=950.9893
cu (10; 1) GL.
Valorile critice Fisher pentru (10;1) GL extrase din tabelele 4,5,6 din Anexă, sunt
F0.05=241.9; F0.01=6056; F0.001=605600
Cum F0.05 < Ft <F0.01, corelaţia trigonometrică în populaţia din care provine sondajul
este semnificativă.Media de sondaj de evoluţie este:

Z1 Z
 Z 2  ...  Z n1  n
MZ c  2 2  498.6 m3 / ha
n 1

Vom examina acum ritmurile valorice Dj = Xj+1 – Xj şi cele procentuale


241

Ij = Xj+1 / Xj de variaţie a precipitaţiilor lunare la Bucureşti în tabelul:

Xj XCj Zj Dj = Zj+1 – Zj Ij = Zj+1 / Zj


1 - 406 - -
2 0.5711987 340 -66 0.837
3 1.142397 374 34 1.100
4 1.713596 444 70 1.187
5 2.284795 681 237 1.534
6 2.855994 860 179 1.263
7 3.427193 578 -282 0.672
8 3.998391 512 -66 0.886
9 4.569590 391 -121 0.764
10 5.140789 411 20 1.051
11 5.711987 485 74 1.180
12 6.283186 411 -74 0.847

Din examinarea coloanei Dj se vede că ritmurile valorice de variaţie ale


precipitaţiilor lunare au şi valori pozitive şi valori negative,cu diferenţe mari
între valori, deci ritmul mediu de variaţie valorică D = (Zn – Z1)/(n – 1)
nu este relevant.
În acest caz ajustăm perechile de date ( Xj , Dj ) cu ajutorul funcţiei de regresie
trigonometrică :
5
Z  g ( X )  T0   [S j sin( jX )  C j cos( jX )]
j 1

cu coeficienţii :
T0 = 0.4545
S1 = 88.1767 ; C1 = - 9.2242
S2 = - 130.8601 ; C2 = - 30.5617
S3 = 35.6283 ; C3 = 11.4850
S4 = - 63.7047 ; C4 = 50.5501
S5 = 50.5501 ; C5 = 15.0625

Pentru a prognoza volumul de precipitaţii Zp pentru o valoare


X p  [ j; j  1]  [0;12]
vom folosi relaţia : Zp = Zj + g(XCp) cu XCp =Xp.(2 / 11)
Din examinarea coloanei Ij , se vede că ritmurile procentuale de variaţie
ale precipitaţiilor lunare au şi valori supraunitare şi valori subunitare,cu
diferenţe semnificative între valori , deci ritmul mediu de variaţie procen-
tuală I = ( Z n / Z1 )1/n nu este relevant .
In acest caz ajustăm perechile de date ( Xj ; Ij ) cu ajutorul funcţiei de
regresie trigonometrică :
5
Z  h ( X )  T0   [S j sin( jX )  C j cos( jX )]
j 1

cu coeficienţii :
T0 = 1.0292
S1 = 0.1698 ; C1 = - 0.0512
S2 = - 0.2464 ; C2 = - 0.0568
242

S3 = 0.0107; C3 = 0.0137
S4 = - 0.0789 ; C4 = - 0.1194
S5 = 0.0349 ; C5 = 0.0316
Pentru a prognoza volumul precipitaţiilor lunare Zp pentru o valoare
X p  [ j; j  1]  [0;12]
vom folosi relaţia : Zp = Zj . h( XCp ) cu XCp = Xp.(2 /11)

10.3.3 Corelaţia şi regresia polinomial-trigonometrică

Funcţia de regresie are forma:

y=[B0+B1x+.......+Bmxm]+[T0+S1sinx+C1cosx+........+Sksinkx+Ckcoskx]

a)Partea polinomială din prima paranteză pătrată din membrul doi, este neperiodică şi
se numeşte tendinţă (trend), coeficienţii B0, B1, ........, Bm, se stabilesc ca în secţiunea 10.3.1
de mai sus, prelucrând datele primare (xi, yi) (1 i  n).
Valorile aşteptate ale regresiei polinomiale sunt date de relaţia
yap i= B0+B1xi+.......+Bmxi m, iar ypi=yi-yapi.
Testarea ipotezei H: ρcp=0 faţă de alternativa H: ρcp0 adică a inexistenţei sau a
existenţei trendului polinomial în populaţia din care face parte sondajul, se face cu raportul
Fisher dat de relaţia (4) :
Fp=[Rcp2/(1-Rcp2 ]: [m/(n-m-1)], care are (m; n-m-1) GL.
Aici raportul de corelaţie polinomială Rcp are forma din relaţia (1):
SPAY . X
Rcp= 1  ,
SPAY
n n
cu SPAY=  ( yi  y ) 2 ;SPAY.X=  ( yi  yapi ) 2 .
i 1 i 1
b) Partea trigonometrică din a doua paranteză pătrată din membrul doi al funcţiei
de regresie de mai sus ,este periodică şi se numeşte parte ciclică sau sezonieră,
coeficienţii T0, S1, C1,........, Sk, Ck se stabilesc ca în secţiunea 10.3.2 de mai sus,
prelucrând datele reziduale (xi; ypi) de la regresia polinomială, unde ypi=yi-yapi
(1 i  n).
Valorile aşteptate ale regresiei trigonometrice sunt date de relaţia :
yati=T0+S1sin xi+C1cos xi+........+Sksin kxi+Ckcos kxi.
Diferenţele ypti = yp i – yati are forma ypti=yi-yap i - yati .
Valorile aşteptate ale regresiei polinomial-trigonometrice sunt:
yapti= yapi + yati , aşa că ypti=yi - yapti .
Testarea ipotezei H: ρct=0 faţă de alternativa H:ρct 0, adică a inexistenţei sau a
existenţei părţii ciclice în populaţia din care face parte sondajul, se face cu raportul Fisher dat
de relaţia (6) şi anume :
Ft=[(Rct)2/(1-(Rct)2 )]: [2k/(n-2k-1)] cu (2k; n-2k-1) GL.
Aici raportul de corelaţie trigonometrică are forma din relaţia (1) şi anume:
SPADY . X
Rct= 1 
SPADY
n
unde SPADY=  (ypi  ypi ) 2
i 1
243

n
şi SPADY.X=  (ypi  yati ) 2
i 1
Exemplul 1 :
X=timpul (zile trecute de la data fătării)
Y=producţia zilnică de lapte de vacă (litri/zi)
Date de sondaj:
xi 28 56 84 112 140 168 196 224 252 280 308
yi 15 18 20 21 22 19 16 12 8 4 2

a) Regresia polinomială:
Pentru funcţia polinomială alegem gradul m=3, deci y= B0+B1x+B2x2+B3x3.
Sistemul de 4 ecuaţii normale are ca soluţii coeficienţii de regresie:
B0=7.61776; B1=0.28246; B2=- 0.00166; B3=0.0000022.
Valorile echidistante xi, valorile în cerc xci = i.(2 / 11), valorile observate yi, valorile
aşteptate yapi = B0+B1 .xi +B2 xi 2 +B3 xi 3 ale regresiei polinomiale şi diferenţele yp i=yi-
yap i se găsesc în tabelul de mai jos.
Avem SPAY=478.182; SPAY.X=5.481, deci Rcp=0.994252 cu (3; 7)GL.
Valoarea Fisher este Fp=201.22, iar valorile critice din tabelele 4,5,6 din Anexă,
pentru (3;7) GL sunt: F0.05=4.35; F0.01=8.45; F0.001=18.77
Cum Fp=201.22F0.001=18.77, corelaţia polinomială este foarte semnificativă în
populaţia din care provine sodajul.

b) Regresia trigonometrică :
Perechile de valori (xi; ypi) din tabelul de mai jos se prelucrează cu regresia
trigonometrică cu k=2 armonice, deci: yp=S0+(S1sinx+C1cosx)+(S2sin2x+C2cos2x.)
Conform secţiunii 10.3.2 de mai sus, avem coeficienţii de regresie trigonometrică:
T0=0.00000217
S1= -0.0548; C1= -0.2158;
S2= 0.3089; C2= 0.7362;
Valorile aşteptate ale regresiei polinomial-trigonometrice
yapti =[ B0+B1 .xi +B2 xi 2 +B3 xi 3 ] + [ T0 +s1.sin(xci) +c1.cos(xci)+
+ s2.sin(2.xci)+c2.cos(2.xci)]
şi diferenţele ypti=yi-yapti se găsesc în tabelul de mai jos:

xi yi xci yapi yp i Yapti ypti


28 15 0.5711987 14.27 0.73 14.65 0.35
56 18 1.142397 18.61 -0.61 18.22 -0.22
84 20 1.713596 20.92 -0.92 20.10 -0.10
112 21 2.284795 21.49 -0.49 21.18 -0.18
140 22 2.855994 20.62 1.38 21.27 0.73
168 19 3.427193 18.60 0.40 19.61 -0.61
196 16 3.998391 15.71 0.29 16.09 -0.09
224 12 4.569590 12.24 -0.24 11.71 0.29
252 8 5.140789 8.49 -0.49 7.74 0.26
280 4 5.711987 4.75 -0.75 4.62 -0.62
308 2 6.283186 1.30 0.70 1.82 0.18

Avem SPADY=5.481; SPAY.X=1.702, deci Rct=0.8302674 cu (4; 6)GL.


244

Valoarea Fisher este Ft=3.328, iar valorile critice din tabelele 4,5,6 din Anexă, pentru
(4; 6) GL sunt F0.05=4.53; F0.01=9.15; F0.001=21.92.
Cum Ft=3.328F0.05=4.53, corelaţia trigonometrică este nesemnificativă în populaţia
din care provine sondajul.
Media de sondaj de evoluţie este :
Y1 Y
 Y2  ...  Yn 1  n
MYc  2 2  14.85 litri lapte/zi
n 1
Ritmul mediu valoric D = (Yn – Y1 ) / (n – 1 ) şi ritmul mediu procentual
I = ( Yn / Y1 )1/n nu sunt relevante (vezi exemplul b) din secţiunea 10.3.2 de mai sus).

Exemplul 2:
X= timpul (zile trecute de la data ecloziunii ouălelor de găină)
Y=greutate pui broiler (grame)
Date de sondaj:
xi 0 7 14 21 28 35 42 49 56
yi 21 92 213 378 580 791 1005 1220 1432

a) Regresia polinomială :
Luăm m=3, deci:
B0=19.74748; B1=6.16912; B2=0.63531; B3= - 0.0052885
Valorile echidistante xi, valorile în cerc xci = i.(2/9), valorile observate yi, valorile
aşteptate yap i = B0+B1 .xi +B2 xi 2 +B3 xi 3 ale regresiei polinomiale şi diferenţele
ypi=yi-yap i se găsesc în tabelul de mai jos.
SPAY=2057641; SPAY.X=108; Rcp=0.9999738 cu (3; 5)GL;
Fp=31804.948***
F0.05=5.41; F0.01=12.06; F0.001=33.20<Fp
Corelaţia polinomială în populaţia din care provine sondajul este foarte
semnificativă.

b) Regresia trigonometrică :
Luăm k=2 armonice, deci:
T0= - 0.00007354;
S1= -0.4810; C1= -0.7903;
S2=4.0881; C2=1.6168
Valorile aşteptate ale regresiei polinomial-trigonometrice
yapti =[ B0+B1 .xi +B2 xi 2 +B3 xi 3 ] + [ T0 +s1.sin(xci) +c1.cos(xci)+
+ s2.sin(2.xci)+c2.cos(2.xci)]
şi diferenţele ypti=yi-yapti se găsesc în tabelul de mai jos:

SPAy=107.72; SPAy.x=16.90; Rct=0.9182102 cu (4; 4)GL;


Ft=5.374; F0.05=9.28; F0.01=29.46; F0.001=141.10
Ft < F0.05 deci corelaţia trigonometrică este nesemnificativă în populaţia din care
provine sondajul.
Media de sondaj de evoluţie este :
245

Y1 Y
 Y2  ...  Yn 1  n
MYc  2 2  625.7 g
n 1

Ritmul mediu valoric D = (Yn – Y1 ) / (n – 1 ) şi ritmul mediu procentual


I = ( Yn / Y1 )1/ n nu sunt relevante (vezi exemplul b) din secţiunea 10.3.2 de mai sus).

Tabelul final cu rezultate este :

xi xci yi yapi ypi yapti ypti


0 0.6981318 21 19.75 1.25 23.14 -2.14
7 1.396264 92 92.25 -0.25 91.52 0.48
14 2.094395 213 216.12 -3.12 211.75 1.25
21 2.792527 378 380.49 -2.49 379.68 -1.68
28 3.490659 580 574.47 5.53 579.25 0.75
35 4.188791 791 787.18 3.83 790.72 0.28
42 4.886923 1005 1007.72 -2.72 1005.14 -0.14
49 5.585055 1220 1225.22 -5.22 1221.18 -1.18
56 6.283186 1432 1428.80 3.20 1429.62 2.38

10.3.4 Corelaţia şi regresia cu polinoame ortogonale

Funcţia de regresie are forma:


y=B0P0(x)+ B1P1(x)+.........+ BmPm(x), unde Pi (x) (0 i  m) sunt polinoame de grad
cel mult m. Pentru Pi (x)=xi obţinem regresia polinomială.
Coeficienţii necunoscuţi B0,B1,.........,Bm se găsesc din condiţia de minimizare a
variaţiei reziduale:
SPAY.X=[y1-B0P0(x)-B1P1(x1)-..........-BmP m(x1)]2+...........+[yn-B0P0(xn)- B1P1(xn)-
..........- BmPm(xn)]2=minim.
Anulând derivatele parţiale ale lui SPAY.X în raport cu B0,B1,.........,Bm găsim sistemul
de ecuaţii normale:
n n n n
B0  P02 ( xi )  B1 P0 ( xi ) P1 ( xi )  ...  Bm P0 ( xi ) Pm ( xi )   yi P0 ( xi )
i 1 i 1 i 1 i 1
n n n n
B0  P1 ( xi ) P0 ( xi )  B1 P12 ( xi )  ...  Bm P1 ( xi ) Pm ( xi )   yi P1 ( xi )
i 1 i 1 i 1 i 1
......................................................................................................
n n n n
B0  Pm ( xi ) P0 ( xi )  B1 Pm ( xi ) P2 ( xi )  ...  Bm Pm2 ( xi )   yi Pm ( xi )
i 1 i 1 i 1 i 1
Polinoamele P0(x), P1(x),.........., Pm(x) se aleg ortogonale, adică:
n

 P (x )P (x )  0 ;
i 1
s i
t i
(s, t=0, 1,........., m)

deci din sistemul precedent obţinem foarte uşor coeficienţii necunoscuţi


B0,B1,.........,Bm:
246

n n n

 yi P0 ( xi )
i 1
 yi P1 ( xi )
i 1
 y P (x )
i 1
i m i
B0= n
, B1= n
, . . . , Bm= n
, (1 i  n). (1)
2 2 2
P
i 1
0 ( xi ) P
i 1
1 ( xi ) P
i 1
m ( xi )

Un alt avantaj al polinoamelor ortogonale este acela că valoarea lui B1 nu este afectată
de valoarea lui B0, valoarea lui B2 nu este afectată de valorile lui B0 şi B1, ........., valoarea lui
Bm nu esta afectată de valorile lui B0, B1, .........., Bm-1, deci adăugarea de noi coeficienţi Bj
menţine valorile coeficienţilor deja calculaţi şi micşorează variaţia reziduală SPAY.X, deci
SPAY . X
măreşte raportul de corelaţie neliniară: Rc= 1  .
SPAY
Tot ortogonale sunt şi funcţiile trigonometrice 1, sinx, cosx,...........,sin kx, cos kx, în
număr de m=2k+1 folosite în corelaţia şi regresia trigonometrică din secţiunea 10.3.2:
Dacă fi(x), fj(x)1, sinx, cosx,...........,sinkx, coskx avem
 02 fi(x)fj(x)=0 (i j)
şi în regresia trigonometrică valoarea lui Bi nu este influenţatăde valorile lui
B0,B1,.........,Bi-1 (0 i  2k), deci calculul unor noi coeficienţi de regresie trigonometrică
păstrează valorile coeficienţilor gata calculaţi şi măreşte gradul de precizie al regresiei
trigonometrice.
O clasă concretă de polinoame ortogonale este dată prin relaţiile de recurenţă:
P0(x)=1; P1(x)=x-MX;
n n
 
  x j P r 1 ( x j )   Pr21 ( x j )
j 1
Pr 2 ( x)   x  n  .Pr 1 ( x)  j 1 Pr ( x) ,
n
 2  2
  Pr 1 ( x j )   Pr ( x j )
 j 1  j 1

(r=0, 1,............, m-2)


(j=1, 2, ........, n)

De aici rezultă grad Pr (x)= r.


Pentru relaţiile (1) sunt necesare n.(m+1) valori: P0(xi), P1(xi),.........., Pm(xi) (i=1,.....,
n), care se calculează prin recurenţă astfel:

P0(xi)=1; P1(xi)=xi-MX;

n n
 
  x j P r 1 ( x j )   Pr21 ( x j )
j 1
Pr 2 ( xi )   xi  n  .Pr 1 ( xi )  j 1 Pr ( xi ) ,
n
 2  2
  Pr 1 ( x j )   Pr ( x j )
 j 1  j 1

(1 i, j n), (r=0, 1,............, m-2)

Caz particular :

Pentru m=1 avem B0=MY; B1=


 y ( x  X )   ( y  Y )( x  X ) , adică chiar
i i i i
2 2
 (x  X )
i  (x  X ) i

coeficienţii de regresie liniară între două caractere stabiliţi în secţiunea 10.1


247

10.4 Rezumat

În acest capitol se prezintă corelaţia şi regresia liniară , unele corelaţii şi regresii reductibile
la cea liniară precum şi corelaţiile şi regresiile neliniare exemplificate prin corelaţiile şi
regresiile polinomială, trigonometrică , polinomial-trigonometreică. şi cu polinoame
ortogonale .

10.5 Întrebări

1. Ce sunt coeficientul de corelaţie liniară şi coeficienţii de regresie liniară ?


2. Ce sunt raportul de corelaţie neliniară şi coeficienţii de regresie neliniară ?
3. Ce este autocorelaţia şi cross-corelaţia seriilor de timp ?
4. Ce avantaje prezintă corelaţia şi regresia polinomial-trigonometrică ?

10.6 Bibliografie

1.D.Ene , M.Drăghici, I.N. Alecu “ Statistică aplicată în agricultură “ Ed.Ceres,2003


2.M.Iosifescu şi col. “ Mică enciclopedie de statistică “ Ed.Ştiinţif.şi Enciclop,,1985
3. Anuarul statistic al României , 1990 -2003
248

CAPITOLUL 11

CORELAŢIA ŞI REGRESIA ÎNTRE M + 1 CARACTERE

Obiective : Însuşirea de către studenţi a conceptelor de corelaţie şi regresie liniară multiplă


liniară,liniarizabilă şi neliniară precum şi analiza componentelor principale în corelaţia liniară
multiplă .

Conţinut :

11.1 Corelaţia şi regresia liniară multiplă pentru cazul a 3 caractere


11.2 Corelaţia şi regresia liniară multiplă pentru cazul a m+1 caractere
11.3 Analiza componentelor principale în corelaţia liniară multiplă
11.4 Corelaţia şi regresia neliniară multiplă pentru cazul a m+1 caractere
11.5 Rezumat
11.6 Întrebări
11.7 Bibliografie

Cuvinte cheie : coeficienţi de corelaţie şi regrtesie liniară multiplă , total şi parţiali,


componente reduse şi principale , aporturi totale şi parţiale.

11.1 CORELAŢIA ŞI REGRESIA LINIARĂ MULTIPLĂ PENTRU CAZUL A


3 CARACTERE

Fie X, Y, Z trei caractere ale exemplarelor unei populaţii. Efectuăm un sondaj de n


exemplare din populaţie şi obţinem triplete de valori (xi,yi,zi) (i=1,…,n).
Reprezentând în spaţiul R3 faţă de sistemul de axe 0xzy cele n triplete se vor
corespunde cu n puncte în spaţiu care vor forma un nor. După forma acestui nor, funcţia de
regresie va fi liniară (norul are formă turtită ca o scoică) sau neliniară (norul are altă formă
decât în cazul liniar).
Din datele de sondaj (xi,yi,zi) (i=1,…,n) calculăm următorii indicatori statistici de
sondaj:
a) 
Vectorul mediilor: X ,Y , Z unde:
1 1 1
X  MX 
n
 xi , Y  MY   yi , Z  MZ   zi
n n
 S2X SXY SXZ 
 
b) Matricea simetrică de covarianţă: S   SYX SY2 SYZ 
S 2 
 ZX SZY SZ 
1 1 1 2
unde varianţele sunt: S2X =
n-1
  
xi  X ; SY2 =
n-1
 
yi  Y ; SZ2 = n-1
 
zi  Z 
iar covarianţele sunt:
1 1 1
S2XY =
n-1
   
xi  X yi  Y ; S2XZ =
n-1
  
xi  X zi  Z ; SYZ2
= n -1
 
 yi  Y zi  Z ; 
c) Matricea simetrică de corelaţie liniară:
249

 1 RXY RXZ 
T   RYX 1 RYZ 
R RZY 1 
 ZX
S S S
unde RXY  XY   -1;1 ; R XZ  XZ   -1;1 ; R YZ  YZ   -1;1
SX  SY SX  SZ SY  SZ
Funcţia de regresie liniară multiplă are forma: Z  B0  B1 X  B2 Y unde coeficienţii de
regresie liniară multiplă B0, B1, B2 sunt daţi de:

Teorema 11.1

1) Planul de regresie Z  B0  B1 X  B2Y are coeficienţii B1, B2 ca soluţii ale sistemului


 B S2  B2 S XY  S XZ
liniar:  1 X 2
iar B0  Z  B1 X  B2 Y
 B1S XY +B2 SY  SYZ
Dacă regresia este fără termen liber (B0=0) B1 şi B2 sunt soluţiile sistemului liniar:
 B1  xi2  B2  xi yi   xi zi
 2
 B1  xi yi  B2  yi   yi zi

 n  1 1  RZ2. XY 
2) Lăţimea fâşiei de încredere este     SZ  t ; (n 3)GL unde RZ . XY
2 n  n  3 2

este definit în teorema 11.2


Demonstraţie:

1) Dacă regresia este cu termen liber (B0=0) vom minimiza variaţia reziduală cu
necunoscutele B0, B1, B2:
2 2
SPA Z  XY   z1  B1 x1  B2 y1  B0      zn  B1 xn  B2 yn  B0   minim.
Anulând derivatele parţiale ale lui SPA Z.XY în raport cu B1, B2, B0, obţinem sistemul de ecuaţii
normale cu necunoscutele B1, B2, B0:
 B1  xi2  B2  xi yi  B0  xi   xi zi
 2
 B1  xi yi  B2  yi  B0  yi   yi zi
B
 1  xi  B2  yi  nB0   zi

Din a 3-a ecuaţie avem: B0 


 zi  B  xi  B  yi şi înlocuim în primele două ecuaţii pe
1 2
n n n
 B S2  B2 S XY  S XZ
B0, după împărţirea ambilor membri cu n-1 obţinem:  1 X 2
de unde rezultă B1
 B1S XY +B2 SY  SYZ
şi B2.
Dacă regresia este fără termen liber (B0=0) vom minimiza variaţia reziduală cu necunoscutele
B1 şi B2:
250

2 2
SPA Z.XY   z1  B1 x1  B2 y1      zn  B1 xn  B2 yn   minim.
Anulând derivatele parţiale ale lui SPA Z.XY în raport cu B1 şi B2, găsim sistemul de ecuaţii
 B1  xi2  B2  xi yi   xi zi
normale cu necunoscutele B1 şi B2:  2
 B1  xi yi  B2  yi   yi zi
Prin rezolvarea acestui sistem găsim pe B1 şi B2.

2) Avem M(Z-B0 -B1X-B2Y)=M(Z)-B0-B1M(X)-B2M(Y)=0 şi


 Z2 . XY  Z-B0 -B1X-B2 Y 
V  Z-B0 -B1 X-B2 Y   deci variabila normată n
n  Z . XY
este variabilă N(0,1).
 n  3 S2Z . XY
Variabila este variabila hi pătrat cu n-3 GL, independentă de variabila N(0,1)
 Z2 . XY
 Z-B0 -B1X-B2 Y 
notată cu n . De aici rezultă că:
 Z . XY
 Z-B0 -B1 X-B2 Y   n  3 S2Z . XY Z-B0 -B1 X-B2 Y
t n: 2
 n este
 Z . XY  Z . XY SZ . XY
n 3
variabilă Student cu n-3 GL.
De aici rezultă:


P t  t  t
2 2
  1   adică intervalul de încredere pentru Z-B -B X-B Y : 0 1 2

P  Z   B0 +B1 X+B2 Y-  ; B0 +B1X+B2 Y+   


  2 2 
S
unde    Z . XY  t ;( n 3)GL este diferenţa limită.
2 n 2

Ţinând cont de demonstraţia teoremei 11.2 avem:


SPA Z . XY 1  RZ . XY   SPA Z 1  RZ . XY   n  1 SZ
2 2 2

S2Z . XY    deci avem:


n3 n3 n 3
 n  1 1  RZ2. XY 
   SZ  t ; (n 3)GL
2 n  n  3 2

Graficul planului de regresie cu fâşia de încredere   are forma:


2
251

z P+
P -
z P

y
0
y
x
x
P + : Z  B0 +B1X+B2 Y+ 
2
+ -
Aici planele de regresie P , P şi P au ecuaţiile: P : Z  B0 +B1 X+B2 Y
P - : Z  B0 +B1X+B2 Y- 
2

Q.E.D.

Teorema 11.2

1) Coeficientul de corelaţie liniară multiplă total este dat de relaţia:


2 2
RZX  RZY  2 RZX RZY RXY
RZ . XY  2
1  RXY
Coeficienţii de corelaţie liniară multiplă parţiali sunt daţi de relaţiile:
RZX  RZY RXY RZY  RZX RXY
RZX .Y  ; R ZY . X 
1  RZY2 1  RXY2  1  RZY2 1  RXY2 
2) Aporturile variaţiei X,Y, interacţiunea X  Y şi E la variaţia lui Z sunt:
A  X,Y   RZ2 . XY ;
A X  A X,Y   A Y   RZ2. XY  RZY
2
;
A Y  A X,Y   A X    RZ2. XY  RZX
2
;
2 2
A XY  A  X,Y   A X  A Y  RZX  RZY  RZ2. XY ;
A E  1  A  X,Y   1  RZ2. XY
RZ2 . XY 2
3) F X,Y   2
: este variabilă Fisher cu [2; n-3] GL
1  RZ . XY n  3
RZX .Y RZY . X
tX  n  2 şi tY  n  2 sunt variabile Student cu n-2 GL.
2 2
1  RZX .Y 1  R ZY . X

Demonstraţie:
252

1) B0, B1, şi B2 sunt daţi de teorema 11.1, pct. 1); se verifică prin calcul relaţia:
n 2 n 2 n 2
z
j 1
j Z    B x +B y
j 1
1 j 2 j  B0  Z    z j 1
j  B1 x j  B2 y j -B0 

adică SPA Z  SPA R  SPA Z . XY cu n -1  2  (n - 3) GL (1)

Definim coeficientul de corelaţie liniară multiplă total:


SPA Z . XY
RZ . XY  1  (2)
SPA Z
2

deci conform relaţiei (1) avem: RZ . XY 


SPA R

  B x +B y  B
1 j 2 j 0 Z 
2
SPA Z
 z  Z  j

Înlocuind pe B1, B2 şi B0 daţi de teorema 10.1 pct. 1) în această expresie, rezultă prin calcul:
2 2
RZX  RZY  2 RZX RZY RXY
RZ . XY  2
.
1  RXY
 TXX TXY TXZ  matricea adjunctă a matricii de
*   corelaţie T, formată cu
Fie T   TYX TYY TYZ 
complemenţii algebrici ai
T TZY TZZ 
 ZX elementelor din T
det  T 
Rezultă RZ . XY  1  (3)
TZZ
Dacă B1, B2 şi B0 sunt daţi de teorema 11.1 punctul 1), se verifică prin calcul relaţia (cu
Y=constant):
2 2
z   B x  B y   z 2
i Z 1 i 2 0  B0  Z i  B1 xi  B2 y0  B0  (4)

SPA Z .Y  SPA RX  SPA Z . XY cu n - 2  1  ( n - 3) GL

Definim coeficientul de corelaţie liniară multiplă parţial (când Y=constant):

SPA Z . XY
RZX .Y  1  (5)
SPA Z .Y
2

deci conform relaţiei (3) avem: RZX .Y 


SPA RX

  B x +B y  B
1 i 2 0 0 Z 
2
SPA Z .Y
 z  Z  i

şi înlocuind pe B1, B2 şi B0 cu valorile lor din teorema 11.1 punctul 1), găsim prin calcul:
1  RZ2 . XY RZX  RZY RXY
RZX .Y  1  2
 (6)
1  RZY 1  R 1  R  2 2
ZY XY

TYZ
Cu ajutorul complemenţilor algebrici din T* avem: RZX .Y  
TYY  TZZ
253

RZX .Y  1  RZ . XY  1
Observăm că: 1  RZ2. XY  1  RZY
2
1  RZX2 .Y  de unde rezultă: RZX .Y  0  RZ . XY  RZY

În mod analog definim coeficientul de corelaţie liniară multiplă parţial:


(când X=constant):
SPA Z . XY
RZY . X  1  care după calcule capătă forma:
SPA Z . X
1  RZ2. XY RZY  RZX RXY
RZY . X  1  2

1  RZX 1  R 1  R 
2 2
ZX XY

LXZ
Cu ajutorul complemenţilor algebrici din L* avem: RZY . X  
LXX  LZZ
RZY . X  1  RZ . XY  1
Observăm că: 1  RZ2 . XY  1  RZX
2
1  R  de unde rezultă: R
2
ZY . X
ZY . X  0  RZ . XY  RZX

2) Ţinând cont de relaţia (2), relaţia (1) se scrie:


SPA Z  RZ2. XY SPA Z  1  RZ2. XY  SPA Z sau 1  RZ2. XY  1  RZ2. XY  aşa că
A  X,Y   RZ2. XY ; A E  1  RZ2. XY .
Ţinând cont de relaţia SPA Z .Y  1  RZY
2
 SPA Z precum şi de relaţiile (2) şi (4), relaţia (3)
devine: 1  RZY
2
 SPA Z  RZX2 .Y 1  RZY2  SPA Z  1  RZ2.XY  SPA Z adică:

.Y 1  RZY   1  RZ . XY 
2 2 2 2
1  RZY  RZX

.Y 1  RZY   RZ . XY  RZY  A  X,Y   A (Y)


2 2 2 2
deci A X  RZX

. X 1  RZX   RZ . XY  RZX  A  X,Y   A  X 


2 2 2 2
În mod analog rezultă relaţia: A Y  RZY
2 2
În fine: A XY  A  X,Y   A  X   A  Y   RZY  RZY  RZ2. XY şi A E  1  A X,Y  1  RZ2. XY
2

3) Avem varianţa totală: S2Z 


SPA Z

 z i Z  ,
GL Z n 1
2

varianţa regresiei totale: S 


SPA R
2

B x 1 i  B2 yi  B0  Z  şi
R
GL R 2
2

varianţa reziduală: S 2

SPA Z . XY

  z -B x
i 1 i  B2 yi  B0 
.
Z . XY
GL Z . XY n 3
S2R
Rezultă variabila Fisher F X,Y   cu (2; n-3) GL.
S2Z . XY
SPA Z . XY 1  RZ . XY  SPA Z
2
2 SPA R RZ2 . XY  SPA Z 2
Dar S R  şi SZ . XY   aşa că:
2 2 n3 n3
RZ2 . XY 2
F X,Y   2
: cu (2; n-3) GL
1  RZ . XY n  3
254

Avem varianţa parţială (când Y=constant): S2Z .Y 


SPA Z .Y

z i Z 
GL Z .Y n2
varianţa regresiei parţiale după X (când Y=constant):
2

S2RX 
SPA RX

 B x
1 i  B 2 y0  B 0  Z  şi
GL RX 1
2

varianţa reziduală : S 2

SPA Z . XY

  z -B x
i 1 i  B 2 y0  B 0 
.
Z . XY
GL Z . XY n3
S2RX
Rezultă variabila Fisher FX  cu (1; n-3) GL.
S2Z . XY
SPA Z . XY 1  RZX .Y  SPA Z .Y
2 2
2 SPA RX RZX .Y  SPA Z .Y 2
Dar: S RX  şi SZ . XY   aşa că:
1 1 n 3 n 3
2
RZX .Y 1 RZX .Y
FX  2
: cu (1; n-3) GL deci: tX  n  3 este variabilă Student
1  RZX .Y n  3 1  RZX2
.Y

cu n-3 GL.
RZY . X
În mod analog tY  n  3 este variabilă Student cu n-3 GL .
2
1  RZY .X

Q.E.D.

Între coeficienţii de corelaţie parţiali şi coeficienţii de regresie liniară multiplă există relaţiile:
S S
B1  RZX .Y  Z .Y ; B2  RZY . X  Z . X
S X .Y SY . X
care generalizează relaţia de la corelaţia liniară simplă între X şi Y:
S
B1  R  Y .
SX
Ecuaţia planului de regresie se poate scrie şi sub forma: 
Z  Z  B1 X  X  B2 Y  Y .   
În continuare vom aborda testele pentru corelaţia liniară multiplă în populaţie.

1) Coeficientul de corelaţie liniară multiplă total de sondaj RZ.XY este variabil de la un


sondaj la altul în jurul coeficientului de corelaţie total necunoscut ρZ.XY din populaţie.
Testul ipotezei H: ρZ.XY=0 faţă de alternativa H :  Z . XY  0 se face pe baza teoremei 11.2
punctul 3) astfel:
RZ2 . XY 2
Calculăm F X,Y   2
: cu (2; n-3) GL. Din tabelele 4,5,6 din Anexă, pentru (2; n-3)
1  RZ . XY n  3
GL extragem valorile critice F0.05; F0.01; F0.001 . Decizia asupra ipotezei H se ia astfel: dacă F(X,Y)
< F0.05 ipoteza H se acceptă: ρZ.XY =0 deci Z şi perechea (X,Y) nu sunt corelate liniar în
populaţie. În caz contrar avem cazurile:
a) F0.05 ≤ F(X,Y) < F0.001 deci Z şi (X,Y) sunt corelate liniar semnificativ.
b) F0.01 ≤ F(X,Y) < F0.001 deci Z şi (X,Y) sunt corelate liniar distinct semnificativ.
c) F(X,Y) ≤ F0.001 deci Z şi (X,Y) sunt corelate liniar foarte semnificativ.
255

2) Coeficienţii de corelaţie liniară multiplă parţiali de sondaj RZX.Y şi RZY.X sunt variabili de
la un sondaj la altul în jurul coeficienţilor de corelaţie parţiali necunoscuţi ρZX.Y şi respectiv
ρZY.X din populaţie.
Testul ipotezei H: ρZX.Y=0 faţă de alternativa H :  ZX .Y  0 se face pe baza teoremei 11.2
RZX .Y
punctul 3) astfel: se calculează tX  n  3 cu n-3 GL. Din tabela 2 din Anexă,
2
1  RZX .Y

pentru n-3 GL extragem valorile critice t0.025; t 0.0025; t0.0005


Decizia asupra ipotezei H se ia astfel: dacă tX < t0.025 , ipoteza H se acceptă: ρZX.Y=0 deci Z şi
X nu sunt corelate liniar în populaţie pentru Y=constant.
În caz contrar avem cazurile:
a) t0.025 ≤ tX < t0.0025 deci Z şi X sunt corelate liniar semnificativ când Y=constant
b) t0.0025 ≤ t X < t0.0005 deci Z şi X sunt corelate liniar dinstinct semnificativ când Y=constant
c) tX ≥ t0.0005 deci Z şi X sunt corelate liniar foarte semnificativ când Y=constant

Decizia asupra ipotezei H :  ZY . X  0 faţă de alternativa H :  ZY . X  0 se ia în mod asemănător


RZY . X
cu ajutorul lui tY  n  3 cu (n-3) GL.
2
1  RZY .X

Exemplu:

X = lungime carcasă porci (cm)


Y = grosime strat grăsime la greabăn (cm)
Z = greutate în viu porci (kg)
Date de sondaj de la n=10 porci:

xi 142 141 142 143 146 140 142 143 142 144
yi 3.8 3.3 4 4.1 4.4 3 3.9 4 3.7 4.2
zi 110 109 112 114 118 106 111 112 110 115

Să se calculeze şi să se testeze RZ.XY , RZX.Y , RZY.X , să se alcătuiască diagrama aporturilor şi să


se calculeze planul de regresie z  B1 x  B2 y   2.5% (regresie fără termen liber :B0 = 0 ) şi să se
efectueze prognoza lui Z pentru X = 150 cm; Y = 45 cm.

Soluţie:
1) 
Vectorul mediilor este X  142.5 cm; Y  3.84 cm; Z  111.7 Kg 
 S2X  2.722 S XY  0.622 S XZ  5.389 
 
Matricea de covarianţă este: S   SYX  0.622 SY2  0.176 SYZ  1.324 
 S  5.389 S  1.324 S2  11.344 
 ZX ZY Z 
 1 RXY  0.8989 RXZ  0.9697 

Matricea de corelaţie liniară: T   RYX  0.8989 1 RYZ  0.9373 
 R  0.9697 R  0.9373 1 
 ZX ZY 
256

Matricea de covarianţă S se calculează în EXCEL astfel :


Inscriem datele xi în celulele A1:A10 din coloana A ,datele yi în celulele B1: B10
din coloana B ,şi datele zi în celulele C1:C10 din coloana C , din foaia de calcul Nr.1
Deschidem fereastra TOOLS în care activăm opţiunea DATA ANALYSIS.
Aici activăm opţiunea COVARIANCE în care declarăm celulele A1:A10 , B1: B10
şi C1:C10 în care se găsesc datele .Matricea de covarianţă S se va obţine fie în foaia de calcul
Nr.2 ,fie tot în foaia de calcul Nr.1 unde se găsesc datele,prin declararea ca celule de rezultate
a altor celule decât cele din blocul de date A1: C10 .
Matricea de corelaţie liniară T se obţine exact ca şi S , dacă în DATA ANALYSIS activăm
opţiunea CORRELATION.
2 2
RZX  RZY  2 RZX RZY RXY
2) Coeficientul de corelaţie multiplă total: RZ . XY  2
devine
1  RXY
RZ2 . XY 2
RZ . XY  0.9812 F X,Y   2
: devine F X,Y   90.47 cu (2 ; 7) GL
1  RZ . XY n  3
Din tabelele 4,5,6 din Anexă, avem F0.05 = 4.74; F0.01 = 9.55; F0.001.= 21.69 pentru (2 ; 7) GL.
Avem F(X,Y) = 90.47 > F0.001 = 21.69 deci corelaţia liniară multiplă între greutatea în viu a
porcilor şi perechea de factori formată din lungimea carcasei şi grosimea stratului de grăsime la
greabăn, este foarte semnificativă deci RZ . XY  0.9812***
.
Coeficienţii de corelaţie multiplă parţiali:
RZX  RZY RXY
RZX .Y  devine R ZX .Y  0.8328
 ZY  XY 
1  R 2
1  R 2

RZY  RZX RXY


RZY . X  devine R ZY . X  0.4297
1  RZX2 1  RXY2 
RZX .Y
tX  n3 devine tX  3.98 cu 7 GL.
2
1  RZX .Y

RZY . X
tY  n3 devine tY  1.26 cu 7 GL.
2
1  RZY .X

Din tabela 2 din Anexă,pentru 7 GL găsim: t0.025 = 2.36; t 0.005 = 3.50; t0.0005.= 5.41
Cum t0.005 = 3.50 < tX < t0.005 = 5.41 corelaţia liniară parţială între greutatea în viu a porcilor
şi lungimea carcasei când grosimea stratului de grăsime este constantă, este distinct
semnificativă deci RZX .Y  0.8328**
Cum tY < t0.025 = 2.36, corelaţia liniară între greutatea în viu a porcilor şi grosimea stratului de
grăsime când lungimea carcasei este constantă, este nesemnificativă deci RZY . X  0.4297

Aporturi:
A  X,Y   RZ2 . XY  0.982  96.3%
A X  RZ2 . XY  RZY
2
 8.4%
A Y  RZ2 . XY  RZX
2
 2.2%
A XY  A  X,Y   A X  A Y  85.7%
A E  1  A X,Y   3.7%
257

Variaţia totală a greutăţii în viu a porcilor fiind considerată 100%, 8.4% din ea se datoreşte
variaţiei lungimii carcasei, 2.2% din ea se datoreşte variaţiei grosimii stratului de grăsime,
85.7% din ea se datoreşte variaţiei interacţiunii între lungimea carcasei şi grosimea stratului de
grăsime iar restul de 3.7% se datoreşte variaţiei altor factori necontrolaţi numiţi Eroare care au
fost relativ constanţi pentru cele 10 exemplare din sondaj.
3) Planul de regresie: Z  B1 X  B2 Y
(regesia este fără termen liber :B0=0)
B1 şi B2 sunt soluţiile sistemului liniar :
 B1  xi2  B2  xi yi   xi zi  203087  B1  5477.6  B2  159221
 2
adică  de unde:
 B1  x i yi +B2  yi   yi zi 5477.6  B1 +149.04  B2  4301.2
0.6441 Kg creştere greutate porc
B1 = când grosimea stratului de grăsime este constantă.
1 cm creştere lungime carcasă
5.1858 Kg creştere greutate porc
B2 = când lungimea carcasei este constantă
1 cm creştere lungime carcasă
 n  1 1  RZ2. XY 
Lăţimea fâşiei de încredere este:     SZ  t ; (n 3)GL
2 n  n  3 2

Pentru  = 5% din tabela 2 din Anexă, avem t0.005 = 2.36 pentru 7 GL aşa că 2.5% = 0.55 Kg.
Planul de regresie cu fâşia de încredere va fi: Z  0.6441X  5.1858Y  0.55 .
Prognoză pentru X = 70 cm; Z = 4.5 cm:
Valoarea aşteptată a lui Z va fi:
119.45 Kg (Minima)

Za   0.6441  70    5.1858  4.5   0.55  119.95 Kg (Media)
120.50 Kg (Maxima)

La o lungime a carcasei de 70 cm şi la o grosime a stratului de grăsime de 4.5 cm, ne aşteptăm
ca greutatea în viu a tuturor porcilor din care provin cei 10, să fie cuprinsă între 119.45 Kg şi
120.50 Kg cu o încredere de 95%. Există semiriscul 2.5% ca această greutate să fie mai mică
de 119.45 Kg atunci când cei 10 porci ai sondajului au fost aleşi cei mai performanţi ca
greutate.
În mod simetric, există semiriscul 2.5% ca această greutate să fie mai mare ca 120.50 Kg
atunci când cei 10 porci ai sondajului au fost aleşi cel mai puţin performanţi ca greutate.
În tabelul de mai jos se găsesc valorile xi, yi, valorile aşteptate zi, valorile aşteptate zai şi
diferenţele zi = zi – zai:

xi yi zi zai zi
62 3.8 110 111.173 -1.173
61 3.3 109 107.936 1.064
62 4 112 112.210 -0.210
63 4.1 114 113.373 0.627
66 4.4 118 116.861 1.139
60 3 106 105.736 0.264
62 3.9 111 111.692 -0.692
63 4 112 112.854 -0.854
62 3.7 110 110.655 -0.655
64 4.2 115 114.536 0.464
258

11.2 CORELAŢIA ŞI REGRESIA LINIARĂ MULTIPLĂ PENTRU CAZUL


A m+1 CARACTERE

Fie X(1), X(2),...,X(m),Y notaţiile pentru m+1 caractere ale exemplarelor unei populaţii.
Efectuăm un sondaj de n ansambluri de valori (x1i,x2i,...,xmi,yi) ; (i=1,…,n).
Din aceste date calculăm următorii indicatori statistici de sondaj:
1 n 1 n
a) 
Vectorul mediilor: X 1 ,..., X m ;Y unde X i =  xij ; Y =  yi
n i =1

n i =1
b) Matricea simetrică de covarianţă de ordin m+1:

 S2X1 S X1X 2 ...... S X1 X n S X1Y 


 
 S X 2 X1 S2X 2 ...... S X 2 X n S X 2Y 
S   ...... ...... ...... ......

...... 
 SX X SX n X 2 ...... S2X n S X nY 
 n 1 
 SYX SYX 2 ...... SYX n SY2 
 1

2 2
1 n 1 n
unde varianţele sunt: S2X i =  ij i Y n-1 
n-1 j 1
x  X ; 
S2
=
i 1

yi  Y   iar covarianţele sunt:

1 n 1 n
S2X i X j = 
 xik  X i
n -1 k 1
 
x jk  X j ; S2X iY = 
 xij  X i
n-1 j 1
 y j Y 
c) Matricea simetrică de corelaţie liniară de ordin m+1:

 1 RX 1 X 2 ...... RX1 X m RX1Y 


 
 RX 2 X1 1 ...... RX 2 X m RX 2Y 
T   ...... ...... ...... ...... ...... 
 
 RX m X 1 RX m X 2 ...... 1 RX m Y 
 
 RYX RYX 2 ...... RYX m 1 
 1

Funcţia de regresie liniară multiplă are forma: Y  B0  B1 X 1  ...  Bm X m .


Coeficienţii B0 , B1,...,Bm se obţin prin metoda celor mai mici pătrate:
n 2

Variaţia reziduală SPAY . X1 ,..., X m    y j  B0  B1 x1 j  ...  Bm xmj   minim . Anulând


j 1

derivatele parţiale ale variaţiei reziduale în raport cu B1,...,Bm,B0 obţinem:

n
2 x1 j ( y j  B0  B1 x1 j  ...  Bm xmj )  0
j 1

................................................................
n
2 xmj ( y j  B0  B1 x1 j  ...  Bm xmj )  0
j 1
n
2 ( y j  B0  B1 x1 j  ...  Bm xmj )  0
j 1
259

sau:

 n 2 n n n

 1 1j
B x  ...  B m  1 j mj
x x B 0  1j x   x1 j y j
j 1 j 1 j 1 j 1

................................................................................
 n n n n
 2 (6)
B
 1 j 1
x x
mj 1 j  ...  B m 
j 1
x mj  B 0 
j 1
x mj  j 1
xmj y j

 n n n

 1 1j
B x  ...  B m  mj x  n B 0   yj
 j 1 j 1 j 1

Acesta este sistemul de m+1 ecuaţii normale al regresiei liniare multiple cu m+1 necunoscute
B0, B1,…,Bm.
Fie matricea cu n linii şi m+1 coloane:
 B1 
 x11 x21 ...... xm1 1   
  
X= ...... ...... ...... ...... ...... şi fie vectorul-coloană al necunoscutelor B   
 Bm 
 x1n x2 n ...... xmn 1   
 B0 
 y1 
respectiv vectorul-coloană al termenilor liberi Y    
y 
 n

Sistemul (6) capătă forma matricială: X T  X  B=X T  Y (7)

Dacă rang  X T  X   m  1 adică det  XT  X   0


1
sistemul (7) are soluţia matricială: B=  X T  X   X T  Y
Sistemul (6) se poate aduce la forma:

 B1S2X1  B2S X 1 X 2  ...  Bm S X1 X m  S X1Y



........................................................
 2 (8)
 B1S X m X1  B2S X m X 2  ...  Bm S X m  S X mY

 B0  Y  B1 X1  ...  Bm X m

Pentru aceasta, se împarte ecuaţia ultimă din (6) cu n adică:

1 n 1 n 1 n
B1   1j
n j 1
x  ...  B m   mj 0 n 
n j 1
x  B 
j 1
yj (9)
n
Ecuaţia (9) se înmulţeste cu x
j 1
1j în ambii membri şi rezultatul se scade din prima ecuaţie a
n
sistemului (6) ,obţinând prima ecuaţie a sistemului (8),….., ecuaţia (9) se înmulţeşte cu x
j 1
mj
260

în ambii membri şi rezultatul se scade din a m-a ecuaţie a sistemului (6), obţinând a m-a ecuaţie
a sistemului (8).

În cazul regresiei fără termen liber (B0=0) sistemul de ecuaţii normale are forma:

n n n
 2
 1 1j
B x  ...  B m  1 j mj
x x   x1 j y j
j 1 j 1 j 1

.............................................................. (10)
 n n n
2
 B1  xmj x1 j  ...  Bm  xmj   xmj y j
 j 1 j 1 j 1

Matricea X0 are m linii şi n coloane , având forma:

 x11 x21 ...... xm1 


X 0 = ...... ...... ...... ......
 x1n x2 n ...... xmn 
 B1   y1 
Cu vectorii-coloană B     ; Y    
 
B  y 
 m  n

sistemul (10) capată forma matricială: X T0  X 0  B=X T0  Y


1
şi pentru det  X T0  X 0   0 , acest sistem are soluţia matricială: B=  X T0  X 0   X T0  Y
Ca şi în demonstraţia teoremei 11.1, se arată că lăţimea fâşiei de încredere este:

 n  1 1  RY2 X ,..., X
1 m
 S
  Y  t ; (n  m 1) GL (11)
2 n  n  m  1 2

unde RY2 X1 ... X m este definit mai jos în relaţia (13).


Fie Ti1 ,...,ik ;m1 valoarea minorului de ordin k+1 din matricea de corelaţie liniară R şi fie Ti1 ,...,ik
valoarea complementului algebric de ordin k din minorul precedent, format cu liniile si
coloanele i1, ,ik, unde i1 ,..., ik  1, 2,..., m .
Conform relaţiilor (2) si (3) definim coeficientul de corelaţie liniară multiplă total între Y
şi X i1 ,..., X ik astfel:

SPAY  X i ,..., X i Ti1 ,...,ik ;m 1


1 k
RY  X i ,..., X i  1   1 (12)
1 k
SPAY Ti1 ,...,ik

În particular pentru k =m avem coeficientul de corelaţie liniară multiplă total între Y şi


toate caracterele X1,…,Xm :
261

SPAY  X1 ,..., X m T1,...,m;m1


RY  X1 ,..., X m  1   1 (13)
SPAY T1,...,m

Ca şi în demonstraţia teoremei 11.2, testarea coeficientului de corelaţie liniară total în


populaţie adică verificarea ipotezei H : Y  X i ,..., X i  0 faţă de alternative H : Y  X i ,..., X i  0 se
1 k 1 k

face cu variabila Fisher:

RY2 X i ,..., X i k
F i1 ,...,ik   2
1 k
: cu  k ; n  k  1 GL (14)
1 R Y  X i1 ,..., X ik n  k 1
(k = 1,2,…,m).
Conform relaţiei (5) din demonstraţia teoremei (11.2), definim coeficientul de corelaţie
liniară multiplu parţial între Y şi X i1 ,..., X ik când restul de caractere X j1 ,..., X jm  k sunt
constanţi:
SPAY  X1 ,..., X m 1  RY2 X1 ,..., X m
RYX i ,..., X i  X j1 ,..., X jm  k  1  1 (15)
1 k
SPAY  X j ,..., X j 1  RY2 X j ,..., X j
1 mk 1 mk

Ca şi în demonstraţia teoremei 11.2, testarea coeficientului de corelaţie liniară parţial în


populaţie adică verificarea ipotezei: H : YX i ,..., X i  X j ,..., X j  0 faţă de alternativa
1 k 1 mk

H : YX i ,..., X i  X j1 ,..., X jm  k  0 se face cu variabila Fisher:


1 k

2
RYX i ,..., X i  X j1 ,..., X jm  k k
1 k
Fi1 ,...,ik   2
:
1 R YX i1 ,..., X ik  X j1 ,..., X jm  k n  m 1 ; (k = 1,2,…,m) (16)
cu  k ; n  m  1 GL

În continuare vom calcula aporturile variaţiei caracterelor X1,…,Xm şi interacţiunii


acestora la variaţia lui Y stabilite de ENE DUMITRU
în lucrările 42 şi 48 (vezi Bibliografia).
a) Calculăm aporturile totale ale variaţiei caracterelor X i1 ,..., X ik la variaţia lui Y cu
relaţia:
A X ,..., X  RY2 X i ,..., X i (17)
 i1 ik  1 k

Pe baza acestei relaţii calculăm 2m-1 aporturi totale:


C1m aporturi ale câte unui factor:
A  X1  ,..., A  X m 
C 2m aporturi ale ansamblurilor a 2 factori:
A  X1 ; X 2  ,..., A  X m 1 ; X m 
................................
C km aporturi ale ansamblurilor a k factori:
262

A  X1 ,..., X k  ,..., A  X m  k 1 ,..., X m 


.......................................
C mm  1 aporturi ale ansamblurilor a m factori:
A( X1 ,..., X m )
Cel de al 2m-lea aport total este aportul erorii:
A E  1- A  X1 ,..., X m 

b)Aporturile parţiale ale variaţiei factorilor X i1 ,..., X ik şi interacţiunilor lor când restul
factorilor X j1 ,..., X jm  k sunt constanţi, la variaţia lui Y ,vor fi date de relaţiile:

A X i ... X i    A X ,..., X 
1 k
  j1 jm  k  
  A X , X ,..., X  ...  A X , X ,..., X 
  i1 j1 jm k   ik j1 jm k  
(18)
  A X , X , X ,..., X  ...  A X , X X ,..., X 
  i1 i2 j1 jm  k   ik 1 ik j1 jm  k  
k 1
...   1  A X ,..., X 
  1 m 

În membrul drept al acestei relaţii, în prima paranteză pătrată avem C 0k  1 , aporturi totale cu
m-k factori, în a doua paranteză pătrată avem C1k aporturi totale cu m-k+1 factori, în a treia
paranteză pătrată avem Ck2 aporturi totale cu m-k+2 factori, etc., în ultima paranteză pătrată
avem C kk  1 aporturi totale cu m factori. În total în membrul drept al relaţiei (18) avem în cele
k+1 paranteze pătrate, un număr de 2k aporturi totale.
Mai departe avem:

A X1... X m  A ( X1 ,..., X m )   A X1  ...  AX m  


  A X1  X 2  ...  AX m 1 . X m  
...   A X1 ... X m 1  A X 2 ... X m 

adică:
A X 1... X m   A X 1   ...  A X m   
 
  A  X1 , X 2   ...  A  X m 1 , X m   
 
  A  X1 , X 2 , X 3   ...  A  X m 2 , X m 1 , X m    (19)
 
...  (1) m  A  X1 ,..., X m 1   A X 2 ,..., X m   
 
m 1  
(1) A
  X1 ,..., X m  
263

Pe baza relaţiilor (18) şi (19) calculăm 2m-1 aporturi parţiale în care se descompune
A  X1 ,..., X m  :
C1m aporturi parţiale, ale câte unui factor (k=1)cu relaţia (18):
A  X1  ,..., A  X m 
C 2m aporturi parţiale ale interacţiunilor a câte 2 factori (k=2) cu relaţia (18):
A  X1  X 2  ,..., A  X m 1  X m 
................................
C km aporturi parţiale ale interacţiunilor a câte k factori, cu relaţia (18):
A  X1... X k  ,..., A  X m  k 1 ... X m 
.......................................
C mm  1 aporturi parţiale ale interacţiunii celor m factori, cu relaţia (19):
A X1... X m
Cel de al 2m-lea aport este :
A E  1- A  X1 ,..., X m 
În final se întocmeşte diagrama aporturilor parţiale ale variaţiei factorilor X 1 ,..., X m şi a
interacţiunilor lor câte 2,3,…,m , la variaţia lui Y presupusă a fi egală cu 100%.

Exemplu:

X1 = talia plantei de porumb la recoltare (cm)


X2 = suprafaţa foliară a plantei de porumb la recoltare (cm2)
X3 = numărul de boabe pe plantă la recoltare
Y= greutatea boabelor pe plantă la recoltare

Date de sondaj de la n=10 plante:

x1 210 215 200 220 218 225 230 226 206 220
x2 2080 2100 2000 2150 2120 2210 2300 2230 2050 2160
x3 315 320 300 340 325 370 400 380 310 350
y 42 44 40 50 46 55 60 58 41 52

Se calculează:
1) Vectorul mediilor:

X 1  217 cm; X 2  2140 cm 2 ; X 3  341 boabe; Y  48.8 g; 


2) Matricea de covarianţă:
264

 S2X1  88.4444; S X1 X 2  821.1111; S X1 X 3  291.1111; S X1Y  64.5556 


 
 S X X  821.1111; S2X 2  8044.4440; S X 2 X 3  2933.3330; S X 2Y  635.5556 
S 2 1 
 S X 3 X1  291.1111; S X 3 X 2  2933.3330; S2X 3  1104.4450; SX 3Y  239.1111 
 S  64.5556; SYX 2  636.5560; SYX3  239.1111; SY2  52.8444 
 YX1

3) Matricea de corelaţie liniară:

 RX1 X1  1; RX1 X 2  0.9735; RX1 X 3  0.9314; RX1Y  0.9443 


 
 RX 2 X1  0.9735; RX 2 X 2  1; RX 2 X 3  0.9841; RX 2Y  0.9748 
T 
R  0.9314; RX 3 X 2  0.9841; RX 3 X 3  1; RX3Y  0.9898 
 X 3 X1 
 RYX  0.9443; RYX 2  0.9748; RYX 3  0.9898; RYY  1 
 1 

4) Calculul şi testarea coeficienţilor de corelaţie totali:

- bifactoriali:

TX1 X 2Y 
RY  X1 X 2  1  unde: 
TX 1X 2 

1 0.9735 0.9443 

TX1 X 2Y  0.9735 1 0.9748  0.002581 
0.9443 0.9748 1 

0 0.9735 
TX1 X 2   0.052298 
0.9735 1 

Rezultă RY.X1X2 =0.975012
Analog

TX1 X 3Y  0.002187 şi TX1 X 3  0.132494 deci R Y  X1 X 3  0.991712


Analog TX 2 X 3Y  0.0006397 şi TX 2 X 3  0.0315473 deci R Y  X 2 X 3  0.989809

- trifactorial:

TX 1X 2 X 3Y
RY  X1 X 2 X 3  1 
TX1 X 2 X 3

Dar TX 1X 2 X 3Y  det.  T   0.00000508


TX1 X 2 X 3  0.00094115  RY . X1 X 2 X3  0.997298
265

Testarea coeficienţilor de corelaţie totali:

- monofactoriali:

RYX 1  0.944*** ; R YX 2  0.975*** ; R YX 3  0.990*** cu 10-2  8 GL.

Valorile critice R pentru 8 GL din tabela 10 din Anexă,sunt 0.632; 0.765; 0.872 deci cei trei
2
coeficienţi sunt foarte semnificativi.

- bifactoriali:
RY  X1 X 2  0.971; R Y  X1 X 3  0.992; R Y  X 2 X3  0.894
RX2 i X j 2
F X , X   2
: cu  2; n-3 GL dă:
i j
1  RX i X j n  3
F X1 , X 2   57.733; F X1 , X 3   217.697; F X 2 , X 3   13.933 cu  2; 7 GL
Din tabelele 4,5,6 din Anexă, avem valorile critice F cu [2; 7] GL:
F0.05 = 19.35; F0.01 = 99.35; F0.0005 = 999.35 deci:

RY  X1 X 2  0.971* ; R Y  X1 X 3  0.992** ; R Y  X 2 X 3  0.894

- trifactoriali:

RY2 X1 X 2 X 3 3
RY  X1 X 2 X 3  0.977; F X1 , X 2 , X 3   2
:  333.834
1 R Y  X1 X 2 X 3 n4
Din tabelele 4,5,6 din Anexă, avem valorile critice Fα cu [3; 6] GL:
F0.05 = 8.94; F0.01 = 27.91;F0.001 = 132.8 deci:
RY  X1 X 2 X 3  0.997***

5) Calculul şi testarea coeficienţilor de corelaţie parţiali:

- monofactoriali:

1  RY2 X1 X 2 X 3
RYX 1 X 2 X 3  1   0.985 .
1  RY2 X 2 X 3
În mod analog RYX 2  X1 X 3  0.791 şi R YX 3  X1 X 2  0.946 toţi cu n-4=6 GL.

Din tabela 10 din Anexă, avem valorile critice R pentru 6 GL: R0.025 = 0.707; R0.005 =
2

0.834;R0.0005 = 0.925 deci: RYX 1 X 2 X 3  0.985 ; R YX 2  X1 X 3  0.791* şi R YX 3  X1 X 2  0.946***


***

- bifactoriali:
266

1  RY2 X1 X 2 X 3
RYX 1X 2  X 3  1  2
 0.837
1  RYX 3

În mod analog RYX 2  X1 X 3  0.937 şi R YX3  X1 X 2  0.972


Avem :

2
RYX k Xi X j 2
FX i . X j  2
: cu  2; n-4 GL
1 R YX k  X i X j n4
Din tabelele 4,5,6 din Anexă, avem valorile critice Fα cu [2; 6] GL: F0.05 = 19.33; F0.01 = 99.30;
F0.001 = 999.30
Rezultă :
FX1.X2 =7.02 ; FX1.X3 =21.58 ;FX2.X3 =51.33 cu (2;6) GL deci :
RYX 1 X 2 X 3  0.837; R YX 2  X1 X 3  0.937* şi R YX 3  X1 X 2  0.972*

6) Calculul aporturilor totale şi parţiale:


a) totale:
- monofactoriale:
2 2 2
A  X1   RYX 1
 0.891702; A  X 2   RYX 2
 0.950235; A X 3   RYX 3
 0.970704
- bifactoriale:
A  X1 , X 2   RY2 X1 X 2  0.950648; A X 1 , X 3   RY2 X 1 X 3  0.983494; A X 2 , X 3   RY2 X 2 X 3  0.979723
- trifactoriale:
A  X1 , X 2 , X 3   RY2 X1 X 2 X 3  0.994602
b) parţiale:
- monofactoriale:
A X 1  A X 2 , X 3   A  X1 , X 2 , X 3   0.014879  1.5%;
A X 2  A X1 , X 3   A  X1 , X 2 , X 3   0.011080  1.1%;
A X 3  A  X1 , X 2   A  X1 , X 2 , X 3   0.043954  4.4%

- bifactoriale :
A X 1 . X 2   A  X 3   A  X1 , X 3   A  X 2 , X 3   A  X1 , X 2 , X 3  
 0.011089  1.1%;
A X 1 . X 3   A  X 2   A  X1 , X 2   A  X 3 , X 2   A  X1 , X 2 , X 3  
 0.014466  1.4%;
A X 2 . X 3   A  X 1   A  X 2 , X1   A  X 3 , X1   A  X 1 , X 2 , X 3  
 0.047838  4.8%

- trifactorial:
A X 1 . X 2 . X 3  A  X1 , X 2 , X 3   A  X 1   A  X 2   A  X 3   A  X1 , X 2   A  X1 , X 3   A  X 2 , X 3  
 0.892426  89.3%
Aportul erorii:
A E  1  A( X1 , X 2 , X 3 )  0.00539798  0.5%
267

7) Calculul funcţiei de regresie liniară şi a fâşiei de încredere:

Y = B1X1+B2X2+B3X3 ± δα/2 (regresia este fără termen liber : B0 = 0 ).


B1, B2, B3 sunt soluţiile sistemului liniar:
n n n n
 2
 B1  x1 j  B2  x1 j x2 j  B3  x1 j x2 j   x1 j y j
 j 1 j 1 j 1 j 1

 n n
2
n n

 1 2 j 1j
B x x  B 2 2j x  B3 2j 3j
x x   x2 j y j
 j 1 j 1 j 1 j 1
 n n n n
 B1  x3 j x1 j  B2  x3 j x2 j  B3  x32 j   x3 j y j
 j 1 j 1 j 1 j 1

adică:

471686B1+4651190B2+742590B3=106477
4651190B1+45868400B2+7323800B3=1050040
742590B1+7323800B2+1172750B3=168560
0.4258 g creştere greutate boabe
de unde: B1 
1 cm creştere talie
când suprafaţa foliară şi numărul de boabe pe plantă sunt constante.
0.0644 g creştere greutate boabe
B2 
1 cm 2 creştere suprafaţă foliară
când talia şi numărul de boabe pe plantă sunt constante.
0.2761 g creştere greutate boabe
B3 
1 bob creştere nr. boabe pe plantă
când talia şi suprafaţa foliară sunt constante.

Lăţimea fâşiei de încredere este:

 n  1 1  RY2 X X X 
1 2 3
   SY  t ; (n  4) GL 
2 n  n  3 2

10  11  0.997 


  2.5%   52.844  2.45  0.49 g
10 10  3
Ecuaţia funcţiei de regresie liniară cu fâşia de încredere  2.5% este:
Y= 0.4258X1- 0.0644X2+0.2761X3 ± 0.49

Prognoză:
Pentru X 1  235 cm; X 2  2350 cm 2 ; X3  420 boabe avem greutatea aşteptată a boabelor pe
plantă:
268

 64.20 g  Minima 

Ya   0.4258  235    0.0644  2350    0.2761  420   0.49   64.69 g  Media 
 65.18 g  Maxima 

În tabelul de mai jos, se găsesc valorile x1i ,x2i,x3i ,valorile observate yi
valorile aşteptate yai şi diferenţele : Δyi = yi - yai :

x1i x2i x3i yi yai Δyi


210 2080 315 42 42.48 -0.48
215 2100 320 44 44.70 -0.70
200 2000 300 40 39.23 0.77
220 2150 340 50 49.14 0.86
218 2120 325 46 46.07 -0.07
225 2210 370 55 55.69 -0.69
230 2300 400 60 60.30 -0.30
226 2230 380 58 57.59 0.41
206 2050 310 41 41.33 -0.33
220 2160 350 52 51.25 0.75

11.3 ANALIZA COMPONENTELOR PRINCIPALE ÎN CORELAŢIA


LINIARĂ MULTIPLĂ

Fie X1 ,…,Xm m caractere cantitative fiecare din ele cu n valori de sondaj care
formează matricea de date cu m linii şi n coloane:
 x11  x1n 
X=     
x 
 m1  xmn 
Pe prima linie sunt datele de sondaj relative la X1, etc., pe ultima linie sunt datele de sondaj
relative la Xm. Fie:
1 n
X i   xij mediile de sondaj ; 1  i  m 
n j 1
2
1 n
2
S 
i 
 xij  X i
n  1 j 1
 varianţele de sondaj ; 1  i  m 

1 n
Sij2    
 xik  X i x jk  X j covarianţele de sondaj
n  1 k 1
Sij
şi Rij  coeficienţii de corelaţie liniară de sondaj( i,j =1,…,m).
Si S j
Fie matricea de corelaţie liniară de ordin m notată T   Rij 
1 i , j  m

Xi  Xi
şi U1 ,..., U m caracterele cantitative reduse date de relaţiile U i  deci
Si
U i  0, SU2 i = 1 şi R U iU j  RX i X j
Valorile de sondaj reduse dau matricea de ordin m de forma:
269

 u11  u1n 
U=     
u 
 m1  umn 

Fie 1  2  ...  m valorile proprii reale ale matricii simetrice de corelaţie T şi


 c11  c1n 
C=      matricea ortogonală  CT  C=E  care are pe coloane vectorii propii ce
c 
 m1  cmn 
corespund valorilor propii reale 1 , 2 ,..., m .
Componentele principale sunt caracterele V1 ,…, Vm a căror matrice de sondaj de forma:

 v11  v1n 
V=      este dată de relaţia: V=C T  U
v 
 m1  vmn 

Proprietăţi ale componentelor principale:

1) Mediile componentelor principale sunt nule:

1 n
Vi   vij  0 .
n j 1
m
În adevăr, vij   C ki ukj deci:
k 1
n
1 1 n m n
1 n  n
Vi  
n j 1
vij   cki ukj  cki    ukj    c jU k  0
n j 1 k 1 k 1  n j 1  k 1

2) Varianţele componentelor principale sunt egale cu valorile proprii de acelaşi


ordin:

1 n 2
SV2i   vij  i
n j 1
2
1 n 2 1 n 1 n  m 
n j 1
2
În adevăr, S   vij  Vi
Vi     vij2     cki ukj   i
n j 1 n j 1  k 1 
m m
căci  cki2  1 şi
k 1
c
k 1
c  0 (C este ortogonală).
ki kj

3) Covarianţele componentelor principale două câte două sunt nule


(componentele principale Vi sunt necorelate liniar):
SViV j  0 şi respectiv R ViV j  0 .
În adevăr,
270

1 n 1 n
SViV j 
n h1

 vih  Vi  v jh  V j    vih v jh 
n h1
1 n  m   m 
   
n h1  k 1
cki ukh     ckj u kh   0
  k 1 
m
căci c
k 1
c  0 (C este matrice ortogonală).
ki kj

4) Covarianţele componentelor reduse Ui cu componentele principale Vj,sunt date


de relaţiile:

SU iV j  cij  j .
În adevăr,
1 n 1 n 1 n m
SU iV j   uih  U i
n h 1
  v jh  Vj    ih jh n 
n h 1
u v 
h 1
u ih  ckj ukh ) 
(
k 1

1 m  n 
  ckj   uih ukh   cij  j
n k 1  h 1 

5) Coeficienţii de corelaţie liniară între componentele reduse Ui şi componentele


principale Vj, sunt daţi de relaţiile:
RU iV j  cij  j .

SU iV j cij   j
În adevăr, RU iV j  = =cij  j .
SU i  SV j 1  j

Fie F matricea pătratică de ordin m cu elementele


 1 0 

fij  cij  j deci F  C D unde D    .

0 m 
Cum C-1 T C=D adică CT T C=D,
rezultă:
FFT  C D  D T  C T  CDCT  T
(T este matricea de corelaţie între Xi şi X j ).

Putem renunţa la ultimele m-k valori propii dacă acestea sunt foarte mici faţă de restul
valorilor proprii deci matricea F pierde ultimele m-k coloane şi devine matricea de structură
F0 cu m linii şi k coloane.

Exemplu:
Sondaj de n = 10 porci Landrace la livrare;
X1 = înălţime la greabăn (cm);
X2 = lungime carcasă (cm);
X3 = greutate carcasă (kg);
X4 = grosime slănină la greabăn (cm);
271

X5 = greutate totală (kg).

Matricea datelor de sondaj cu m=5 linii (caractere) şi n=10 coloane (repetiţii) este:
Repetiţii→ 1 2 3 4 5 6 7 8 9 10
Caractere↓
x1 42 45 40 48 50 46 47 49 41 48
x2 56 59 55 61 65 59 60 64 56 63
x3 72 75 70 78 80 76 76 80 72 79
x4 3.6 3.7 3.5 3.7 4 3.7 3.8 3.9 3.5 3.8
x5 113 115 110 117 120 115 116 119 111 118

Să se efectueze analiza componentelor principale pentru aceste date.

Soluţie:

Se calculează:
Vectorul mediilor:

X 1  45.6 cm; X 2  59.8 cm; X 3  75.8 Kg; X 4  3.72 cm; X 5  115.4 cm 


Matricea de covarianţă:
 S12  12.267; S12  11.800; S13  12.244; S14  0.531; S15  11.400 
 2 
 S21  11.800; S2  12.178; S23  13.178; S24  0.538; S25  11.311 
S   S31  12.244; S32  12.178; S32  12.622; S34  0.527; S35  11.533 
 
 S41  0.531; S42  0.538; S43  0.527; S42  0.026; S45  0.513 
 S  11.400; S  11.311; S53  11.533; S54  0.513; S52  10.934 
 51 52

Matricea de corelaţie liniară:


 R11  1; R12  0.965; R13  0.984; R14  0.937; R15  0.984 
 R  0.965; R  1; R23  0.982; R24  0.952; R25  0.980 
 21 22

T   R31  0.984; R32  0.982; R33  1; R34  0.915; R35  0.982 


 
 R41  0.937; R42  0.952; R43  0.915; R44  1; R45  0.959 
 R  0.984; R  0.980; R  0.982; R54  0.959; R55  1 
 51 52 53 
Matricea valorilor de sondaj reduse este:
Repet. 1 2 3 4 5 6 7 8 9 10
Carac.
u1 -1.028 -0.171 -1.599 0.685 1.256 -0.144 0.400 0.971 -1.313 0.685
u2 -1.089 -0.229 -1.375 0.344 1.490 -0.229 0.057 1.204 -1.089 0.917
u3 -1.070 -0.225 -1.633 0.619 1.182 0.056 0.056 1.182 -1.070 0.901
u4 -0.741 -0.124 -1.359 -0.124 1.729 -0.124 0.494 1.112 -1.359 0.494
u5 -0.726 -0.121 -1.633 0.484 1.391 -0.121 0.181 1.089 -1.331 0.786
272

Valorile propii ale matricii simetrice T sunt:

1  4.857; 2  0.095; 3  0.034; 4  0.011; 5  0.003

Matricea ortogonală C care are pe coloane vectorii propii ai matricii simetriceT, este:

 0.449; 0.258; 0.641; 0.449; 0.345 


 0.449; 0.035; 0.730; 0.216; 0.466 

C   0.448; 0.495; 0.152; 0.044; 0.727 
 
 0.438; 0.829; 0.083; 0.152; 0.302 
 0.452; 0.023; 0.160; 0.852; 0.208 

Matricea de sondaj a componentelor principale V=CT·U va fi:


Repet. 1 2 3 4 5 6 7 8 9 10
Carac.
v1 -2.082 -0.390 -3.400 0.904 3.149 -0.135 0.529 2.485 -2.754 1.695
v2 0.235 0.064 0.179 -0.609 0.440 -0.149 0.272 0.020 -0.189 -0.263
v3 -0.123 -0.063 0.147 -0.162 0.096 -0.201 -0.275 0.170 0.211 0.200
v4 0.236 0.052 -0.094 0.025 -0.014 -0.094 -0.118 0.009 -0.055 0.053
v5 0.021 -0.008 -0.072 -0.078 -0.040 0.095 -0.017 0.072 0.047 -0.020

Matricea F a coeficienţilor de corelaţie liniară între componentele reduse Ui şi cele


principale Vj va fi:

 0.988; 0.081; 0.118; 0.046; 0.021


 
 0.990; 0.012; 0.134; 0.020; 0.028 
F   0.987; 0.151; 0.029; 0.008; 0.042 
 
 0.966; 0.256; 0.015; 0.017; 0.017 
 0.995; 0.007; 0.031; 0.089; 0.010 

Putem renunţa la ultimele 4 valori propii 2 , 3 , 4 şi 5 mult mai mici ca 1 deci matricea F
pierde ultimele 4 coloane şi devine matricea de structură F0 cu 5 linii şi o coloană:

 0.988  Pe această coloană sunt coeficienţii de corelaţie foarte semnificativi ai valorilor


 0.990  reduse U1 , U 2 , U 3 , U 4 şi U 5 cu componenta principală V1.
 
F0   0.987 
 
 0.966 
 0.995 
 

11.4 CORELAŢIA ŞI REGRESIA NELINIARĂ MULTIPLĂ


PENTRU CAZUL A M+1 CARACTERE
Fie X1 ,X 2 ,...,X m , Y notaţiile pentru m+1 caractere ale exemplarelor unei populaţii.
273

Efectuăm un sondaj de n ansambluri de valori  x1i , x2 i ,..., xmi , yi  ; 1  i  n  . Funcţia de


regresie neliniară multiplă are forma: Y  f  X 1 , X 2 ,..., X m ; B1 , B2 ,..., Bd 
unde B1,B2,…,Bd sunt d coeficienţi de regresie neliniară multiplă necunoscuţi care vor fi
determinaţi prin metoda celor mai mici patrate (variaţia reziduală a datelor de sondaj este
minimă):
n 2
SPAY  X 1 ,..., X m    y j  f  x1 j , x2 j ,..., xmj ; B1 , B2 ,..., Bd    minim.
j 1

Derivatele parţiale ale acestei variaţii reziduale în raport cu B1,B2,…,Bd trebuie să fie nule:
SPAY  X1 ,..., X m SPAY  X1 ,..., X m SPAY  X1 ,..., X m
 0,  0,...,  0,
B1 B2 Bd
Am obţinut sistemul de ecuaţii normale care este neliniar şi care furnizează pe B1,B2,…,Bd.
Raportul de corelaţie neliniară multiplă se calculează cu formula:
SPAY  X1 ,..., X m
Rc  1 
SPAY
Testarea acestui raport se face cu variabila Fisher:
2
 Rc  d 1
F 2
: cu  d -1; n  d  GL
1   Rc  nd
În unele cazuri corelaţia şi regresia neliniară multiplă se poate reduce la cea liniară
multiplă prin schimbări de variabile de forma:
X 1  1 U1  ,..., X m   m U m  ; Y   V 
deci funcţia de regresie neliniară multiplă
Y  f  X 1 , X 2 ,..., X m  devine V   0  1U1  ...   mU m
adică funcţia de regresie liniară multiplă.
Exemplu:
Fie X=cheltuielile materiale pentru cultura porumbului (milioane lei/ha);
Y=cheltuielile cu forţa de muncă pentru cultura porumbului (milioane lei/ha); Z=venitul din
cultura porumbului (milioane lei/ha).
Funcţia de regresie Douglas-Cobb de forma Z  A 0 X B1 Y B2 devine prin logaritmare:
lnZ  ln A0 +B1 ln X  B2 ln Y adică: W=B0 +B1U+B2V
Date de sondaj pe n=10 ani (preţuri comparabile):
xi 3 3.2 2.9 3.3 3.3 3.5 3.6 4 4.2 4.2
yi 0.5 0.6 0.5 0.6 0.7 0.9 1 1.2 1.2 1.4
zi 9 10 8 11 11 12 13 14 15 15
ln xi 1.099 1.163 1.065 1.194 1.194 1.253 1.281 1.386 1.435 1.435
=ui
ln yi -0.693 -0.511 -0.693 -0.511 -0.357 -0.105 0 0.182 0.182 0.336
=vi
ln zi 2.197 2.303 2.079 2.398 2.398 2.485 2.565 2.639 2.708 2.708
=wi

Folosind relaţiile din secţiunea 11.1 obţinem:



1) Vectorul mediilor: X  3.52 mil.lei/ha; Y  0.86 mil.lei/ha; Z  11.8 mil.lei/ha 
274

2) Matricea de covarianţă:
 SU2  0.0177; SUV  0.0498; SUW  0.0278 
 
S   SVU  0.0498; SV2  0.1478; SVW  0.0792 
 S  0.0278; S  0.0792; SW2  0.0457 
 WU WV

1 RUV  0.9735; RUW  0.0788 


3) Matricea de corelaţie: T   RVU  0.9735; 1 RVW  0.9633 
R  0.9788; RWV  0.9633; 1 
 WU 

4) Calculul şi testarea coeficienţilor de corelaţie liniară multiplă:


RW2 UV 2
a) Coeficientul total: RW UV  0.9798 , F(U,V )  2
:  84.02
1  RW UV n  3
Valori critice din tabelele 4,5,6 din Anexă cu [2; n-3] GL sunt:
F0.05=4.74; F0.01=9.55 şi F0.001=21.69 deci F(U,V)=84.02***
b) Coeficienţi parţiali: RWU V  0.6692 şi RWV U  0.1701
Valori critice R din tabela 10 din Anexă, pentru n-3 GL:
2
R0.025=0.666; R0.005=0.798 şi R0.0005=0.898 deci:
RWU·V=0.6682*** şi RWV·U =0.1701
5) Calculul aporturilor:
A U ,V   RW2 UV  96%;
AU  RW2 UV  RWV
2
 3.2%;
AV  RW2 UV  RWU
2
 0.2%;
AU V  A U ,V   AU  AV  92.6%;
A E  1  A U ,V   4%.
6) Coeficienţii de regresie multiplă:
B0=2.3887; B1=1.2616; B2=0.0014
Lăţimea fâşiei de încredere:
2
10  11  0.9798
 2.5%   0.0457  2.36  0.18 milioane lei .
10 10  3 
Tabelul cu valorile xi, yi, valorile observate zi, valorile aşteptate zai şi diferenţele
Δzi=zi-zai este:
xi yi zi zai Δzi
3 0.5 9 9.54 -0.54
3.2 0.6 10 10.35 -0.35
2.9 0.5 8 9.14 -1.14
3.3 0.6 11 10.76 0.24
3.3 0.7 11 10.77 0.23
3.5 0.9 12 11.60 0.40
3.6 1 13 12.02 0.98
4 1.2 14 13.73 0.27
4.2 1.2 15 14.61 0.39
4.2 1.4 15 14.61 0.39
275

Vom ilustra corelaţia şi regresia neliniară multiplă pe corelaţia şi regresia polinominală


cubică cu interacţiuni.
Funcţia de regresie polinominală cubică cu interacţiuni are forma:
m m m m
Y   B3i X i3   B2 ij X i X j   B1i X i  B0
i 1 i 1 j 1 i 1

Avem coeficienţii de regresie necunoscuţi B3i, B2ij, B1i şi B0 în număr egal cu


d=m+m2+m+1=(m+1)2.
Datele de sondaj au forma  x1l ,..., xml ; yl  ; 1  l  m  .
Ecuaţiile normale care dau coeficienţii de regresie necunoscuţi, vor avea forma:
m
 n  m m  n  m  n 
 B3i   xil3 xhl3    B2ij   xil x jl xhl3    B1i   xil xhl3  
i 1  l 1  i 1 j 1  l 1  i 1  l 1 
 n   n 
 B0   xhl3     xhl3 yl 
 l 1   l 1 
unde 1  h  m ;

m
 n 3  m m  n  m  n 

i 1
B3 i   il hl kl 
 l 1
x x x  
 i 1 j 1
B2 ij   il jl hl kl 
 l 1
x x x x   B1i   xil xhl xkl  
 i 1  l 1 
 n   n 
 B0   x hl x kl     xhl x kl yl  unde 1  h; k  m  ;
 l 1   l 1 

m n
 3  m m  n  m  n 
 B   x
i 1
3i
l 1
il xhl    B2ij   xil x jl xhl    B1i   xil xhl  
 i 1 j 1  l 1  i 1  l 1 
 n   n 
 B0   xhl     xhl yl  unde 1  h  m
 l 1   l 1 

m n
 3  m m  n  m  n 
 B   x
i 1
3i
l 1
il    B2ij   xil x jl    B1i   xil  
 i 1 j 1  l 1  i 1  l 1 
 n 
  n  B0    yl 
 l 1 

În total avem d=m+m2+m+1=(m+1)2 ecuaţii cu (m+1)2 necunoscute:


 B 211 ,...,B21m 
 B31 ,...,B3m  ;  .....................  ;  B11 ,...,B1m ; B0
 B ,...,B 
 2 m1 2 mm 

Sumele după l de la 1 la n din parantezele rotunde se calculează pe baza datelor de sondaj.


m  m  1 m 2  5m  2
Din cele d=(m+1)2 ecuaţii normale precedente, numai d   sunt
2 2
m  m  1
independente, iar sunt dependente de ele.
2
276

m  m  1 m  m  1
Din cele d=(m+1)2 necunoscute numai d  sunt diferite iar restul de sunt
2 2
egale între ele, datorită simetriei B2 ij  B2 ji ; 1  i; j  m  .

Raportul de corelaţie neliniară total se calculează cu formula cunoscută:


SPAY  X1 ,..., X m
Rc  1 
SPAY

Testarea acestui coeficient se face cu valoarea Fisher:


m 2  5m  2
2 1
 Rc  2  m 2  5m  2 m2  5m  2 
F 2
: 2
cu  ; n   GL
1   Rc  n  m  5m  2  2 2 
2

Exemplu:

X1=îngrăşământ chimic NPK (zeci Kg/ha)


X2=apă irigaţie (sute m3/ha)
Y=producţie de porumb (t/ha)
Date de sondaj:

x1i x2i yi
0 0 3
5 10 4
5 15 4.8
5 20 6.3
10 10 5.8
10 15 6.7
10 20 7.4
15 10 8.5
15 15 9.2
15 20 9.4
20 10 9.7
20 15 9.9
20 20 10

Pentru prelucrarea datelor vom folosi programul REGCUB, calculul manual fiind
extrem de laborios.

Rezultate:

1) Vectorul mediilor:
277

x  11.54 sute Kg NPK/ha


y  13.85 sute m3 apă/ha
z  7.28 t porumb/ha

2)Coeficienţi de regresie liniară cubică cu interacţiuni:

B0  3 ; B11  0.5865; B12  0.1085;


B211  0.11064; B212  0.01334;
B221  0.01334; B222  0.000310;
B31  0.003155; B32  0.000310;
278

3) Tabelul cu valorile x1i, x2i, valorile observate yi, valorile aşteptate yai şi diferenţele Δyi
este:
x1i x2i yi Yai ΔyI
0 0 3 3 0
5 10 4 3.89 0.11
5 15 4.8 5.04 -0.24
5 20 6.3 6.97 0.13
10 10 5.8 5.82 -0.02
10 15 6.7 6.64 0.06
10 20 7.4 7.43 -0.03
15 10 8.5 8.56 -0.06
15 15 9.2 9.04 0.16
15 20 9.4 9.50 -0.10
20 10 9.7 9.73 -0.03
20 15 9.9 9.88 0.02
20 20 10 10.00 0

4) Raportul de corelaţie neliniară este:


0.13275
Rc  1   0.999
68.51685
2
m 2  5m
 Rc  2
Valoarea Fisher: F  2
: 2
1   Rc  n  m  5m  2
2
cu m=2 şi n=13 devine : F=356.6
Valorile critice din tabelele 4,5,6 din Anexă ,cu [7; 5] GL sunt:
F0.05=3.97; F0.01=7.46 şi F0.001=16.21 deci Rc=0.999***

11.5 Rezumat
În acest capitol se prezintă corelaţia şi regresia multiplă :liniară,liniarizabilă şi neliniară.
Se calculează aporturile factorilor şi analiza componentelor principale pentru corelaţia liniară
multiplă.

11.6 Întrebări
1.Ce sunt coeficienţii de corelaţie liniară multipli totali şi cum se testează ei ?
2. Ce sunt coeficienţii de corelaţie liniară multipli parţiali şi cum se testează ei ?
3. Ce sunt coeficienţii de regresie liniară multiplă ?
4. Prin ce se deosebesc rapoartele de corelaţie neliniară multiple de coeficienţii de
corelaţie liniară multipli ?

11.7 Bibliografie

1.D.Ene , M.Drăghici, I.N. Alecu “ Statistică aplicată în agricultură “ Ed.Ceres,2003


2.M.Iosifescu şi col. “ Mică enciclopedie de statistică “ Ed.Ştiinţif.şi Enciclop,,1985
3. Anuarul statistic al României , 1990 -2003
282

ANEXĂ CU TABELE STATISTICE

Tabel 1 Funcţia de repartiţie N(0;1) : F( uα/2 ) 1 – α/2


Tabel 2 Valorile Student t α/2 şi t α : P( | t | > t α/2 ) = P( t > t α ) = α
Tabel 3 Valorile hi patrat χα2 : P( χ2 > χα2 ) = α
Tabel 4 Valorile Fisher F0.05 : P( F> F0.05 ) = 0.05
Tabel 5 Valorile Fisher F0.01 : P( F> F0.01 ) = 0.01
Tabel 6 Valorile Fisher F0.001 : P( F> F0.001 ) = 0.001
Tabel 7 Amplitudinea studentizată Tukey T0.05
Tabel 8 Amplitudinea studentizată Tukey T0.01
Tabel 9 Valori critice ale asimetriei şi boltirii
Tabel 10 Valori critice Rα/2 ale coeficientului de corelaţie liniară R
Tabel 11 Transformarea Fisher z = 0.5 ln [(1 – R)/(1+ R )]
Tabel 12 Valori critice aα pentru testul valorilor de sondaj străine
Tabel 13 Valori critice mα şi Mα pentru testul caracterului aleator
al datelor de sondaj
Tabel 14 Valori critice dα pentru testul Massey al normalităţii prin
sondaj de volum mic
Tabel 15 Valori critice pentru fişe de control al calităţii
Tabel 16 Valorile lui - P.log2 P pentru calculul entropiei H
Tabel 17 Cursul mediu annual de schimb în perioada 1990-2003
Tabel 18 Suprafeţe cultivate (mii ha) în perioada 1990-2002
Tabel 19 Producţii vegetale (mii tone) în perioada 1990-2002
Tabel 20 Efective de animale (mii capete) în perioada 1990-2003
Tabel 21 Producţii zootehnice în perioada 1990-2002
Tabel 22 Baza tehnico-materială a agriculturii în perioada 1990-2002
283

TABEL 1 Functia de repartitie N(0;1) : F( U/2 ) = 1 - /2


U 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586

0.1 0.53983 0.54379 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57534

0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 O.60257 0.60642 0.61026 0.61409

0.3 0.61791 0.62172 0.62551 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173

0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.64838 0.68793

0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240

0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490

0.7 0.75803 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78523

0.8 0.78814 0.79103 0.79389 0.79673 0.79954 0.80234 0.80510 0.80785 0.81057 0.81327

0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83397 0.83646 0.83891

1.0 0.84134 0.84375 0.84613 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214

1.1 0.86433 0.86650 0.86864 0.87076 0.87285 0.87493 0.87697 0.87900 0.88100 0.88297

1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89616 0.89796 0.89973 0.90147

1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91308 0.91465 0.91621 0.91773

1.4 0.91924 0.92073 0.92219 0.92364 0.92506 0.92647 0.92785 0.92922 0.93056 0.93189

1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408

1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95448

1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327

1.8 0.96407 0.96485 0.96562 0.96637 0.96711 0.96784 0.96856 0.96926 0.96995 0.97062

1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670

2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169

2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574

2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899

2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158

2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361

2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520

2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643

2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736

2.9 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807

2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861

3.0 0.99865 0.99869 0.99874 0.99878 0.99882 0.99886 0.99889 0.99893 0.99897 0.99900

3.1 0.99903 0.99906 0.99910 0.99913 0.99916 0.99918 0.99921 0.99924 0.99926 0.99929

3.2 0.99931 0.99934 0.99936 0.99938 0.99940 0.99942 0.99944 0.99946 0.99948 0.99950

3.3 0.99952 0.99953 0.99955 0.99957 0.99958 0.99960 0.99961 0.99962 0.99964 0.99965

3.4 0.99966 0.99968 0.99969 0.99970 0.99971 0.99972 0.99973 0.99974 0.99975 0.99976

3.5 0.99977 0.99978 0.99978 0.99979 0.99980 0.99981 0.99981 0.99982 0.99983 0.99983

3.6 0.99984 0.99985 0.99985 0.99986 0.99986 0.99987 0.99987 0.99988 0.99988 0.99989

3.7 0.99989 0.99990 0.99990 0.99990 0.99991 0.99991 0.99992 0.99992 0.99992 0.99992

3.8 0.99993 0.99993 0.99993 0.99994 0.99994 0.99994 0.99994 0.99995 0.99995 0.99995

3.9 0.99995 0.99995 0.99996 0.99996 0.99996 0.99996 0.99996 0.99996 0.99997 0.99997
284
284

TABEL 2 Valorile Student t/2 si t : P(| t | > t/2 ) = P(t > t) = 
GL↓ → 0.40 0.25 0.10 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005
1 0.325 1.000 3.078 6.314 12.706 31.821 63.657 127.32 318.31 636.62
2 0.289 0.816 1.886 2.920 4.303 6.965 9.925 14.089 23.326 31.598
3 0.277 0.765 1.638 2.353 3.182 4.541 5.841 7.453 10.213 12.924
4 0.271 0.741 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610
5 0.267 0.727 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869
6 0.265 0.718 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959
7 0.263 0.711 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408
8 0.262 0.706 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041
9 0.261 0.703 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781
10 0.260 0.700 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587
11 0.260 0.697 1.363 1.796 2.201 2.718 3.106 3.497 4.025 4.437
12 0.259 0.695 1.356 1.782 2.179 2.681 3.055 3.428 3.930 4.318
13 0.259 0.694 1.350 1.771 2.160 2.650 3.012 3.372 3.852 4.221
14 0.258 0.692 1.345 1.761 2.145 2.624 2.977 3.326 3.787 4.140
15 0.258 0.691 1.341 1.753 2.131 2.602 2.947 3.286 3.733 4.073
16 0.258 0.690 1.337 1.746 2.120 2.583 2.921 3.252 3.686 4.015
17 0.257 0.689 1.333 1.740 2.110 2.567 2.898 3.222 3.646 3.965
18 0.257 0.688 1.330 1.734 2.101 2.552 2.878 3.197 3.610 3.922
19 0.257 0.688 1.328 1.729 2.093 2.539 2.861 3.174 3.579 3.883
20 0.257 0.687 1.325 1.725 2.086 2.528 2.845 3.153 3.552 3.850
21 0.257 0.686 1.323 1.721 2.080 2.518 2.831 3.135 3.527 3.819
22 0.256 0.686 1.321 1.717 2.074 2.508 2.819 3.119 3.505 3.792
23 0.256 0.685 1.319 1.714 2.069 2.500 2.807 3.104 3.485 3.767
24 0.256 0.685 1.318 1.711 2.064 2.492 2.797 3.091 3.467 3.745
25 0.256 0.684 1.316 1.708 2.060 2.485 2.787 3.078 3.450 3.725
26 0.256 0.684 1.315 1.706 2.056 2.479 2.779 3.067 3.435 3.707
27 0.256 0.684 1.314 1.703 2.052 2.473 2.771 3.057 3.421 3.690
28 0.256 0.683 1.313 1.701 2.048 2.467 2.763 3.047 3.408 3.674
29 0.256 0.683 1.311 1.699 2.045 2.462 2.756 3.038 3.396 3.659
30 0.256 0.683 1.310 1.697 2.042 2.457 2.750 3.030 3.385 3.646
40 0.255 0.681 1.303 1.684 2.021 2.423 2.704 2.971 3.307 3.551
50 0.255 0.679 1.299 1.676 2.009 2.403 2.678 2.937 3.261 3.496
60 0.254 0.679 1.296 1.671 2.000 2.390 2.660 2.915 3.232 3.460
70 0.254 0.678 1.294 1.667 1.994 2.381 2.648 2.899 3.211 3.435
80 0.254 0.678 1.292 1.664 1.990 2.374 2.639 2.887 3.195 3.416
90 0.254 0.677 1.291 1.662 1.987 2.368 2.632 2.878 3.183 3.402
100 0.254 0.677 1.290 1.660 1.984 2.364 2.626 2.871 3.174 3.390
 0.253 0.674 1.282 1.645 1.960 2.326 2.576 2.807 3.090 3.291
285

TABEL 3 Valorile hi patrat (2 ) : P (2 > 2 ) = 

GL↓ → 0.9995 0.995 0.975 0.05 0.025 0.01 0.005 0.001 0.0005

1 0.0639 0.0439 0.0398 3.84 5.02 6.63 7.88 10.83 12.12

2 0.001 0.01 0.05 5.99 7.38 9.21 10.60 13.82 15.20

3 0.02 0.07 0.22 7.81 9.35 11.34 12.84 16.27 17.73

4 0.06 0.21 0.48 9.49 11.14 13.28 14.86 18.47 20.00

5 0.16 0.41 0.83 11.07 12.83 15.09 16.75 20.51 22.10

6 0.30 0.68 1.24 12.59 14.45 16.81 18.55 22.46 24.10

7 0.48 0.99 1.69 14.07 16.01 16.48 20.28 24.32 26.12

8 0.71 1.34 2.18 15.51 17.53 20.09 21.96 26.12 27.87

9 0.97 1.73 2.70 16.92 19.02 21.67 23.59 27.88 29.67

10 1.26 2.16 3.25 18.31 20.48 23.21 25.19 29.59 31.42

11 1.50 2.60 3.92 19.68 21.92 24.72 26.76 31.26 33.14

12 1.93 3.07 4.40 21.03 23.34 26.22 28.30 32.91 34.82

13 2.30 3.57 5.01 22.36 24.74 27.69 29.82 34.53 36.48

14 2.70 4.07 5.63 23.68 26.12 29.14 31.32 36.12 38.11

15 3.11 4.60 6.87 25.00 27.49 30.58 32.80 37.70 39.72

16 3.54 5.14 6.91 26.20 28.85 32.00 34.27 39.25 41.31

17 3.98 5.70 7.56 27.59 30.19 33.41 35.72 40.79 42.88

18 4.44 6.26 8.23 28.87 31.53 34.81 37.16 42.31 44.43

19 4.91 6.84 8.91 30.14 32.85 36.19 38.58 43.82 45.97

20 5.40 7.43 9.59 31.41 34.17 37.57 40.00 45.31 47.50

21 5.90 8.03 10.28 32.67 35.48 38.93 41.40 46.80 49.01

22 6.40 8.64 10.98 33.92 36.78 40.29 42.80 48.27 50.51

CONTINUARE ÎN PAGINA URMĂTOARE


286

GL↓ → 0.9995 0.995 0.975 0.05 0.025 0.01 0.005 0.001 0.0005

23 6.92 9.26 11.69 35.17 38.08 41.64 44.18 49.73 52.00

24 7.45 9.89 12.40 36.42 39.36 42.98 45.56 51.18 53.48

25 8.00 10.52 13.12 37.65 40.65 44.31 46.93 52.62 54.95

26 8.54 11.16 13.84 38.89 41.92 45.64 48.29 54.05 56.41

27 9.09 11.81 14.57 40.11 43.19 46.96 49.64 55.48 57.86

28 9.66 12.46 15.31 41.34 44.46 48.28 50.99 56.89 59.30

29 10.23 13.12 16.05 42.56 45.72 49.59 52.34 58.30 60.73

30 10.80 13.79 16.79 43.77 46.98 50.89 53.67 59.70 62.16

40 16.91 20.71 24.43 55.76 59.34 63.69 66.77 73.40 76.09

50 23.46 27.99 32.36 67.50 71.42 76.15 79.49 86.66 89.56

60 30.34 35.53 40.48 79.08 83.30 88.38 91.95 99.61 102.69

70 37.47 43.27 48.76 90.53 95.02 100.42 104.21 112.32 115.58

80 44.79 51.17 57.15 101.88 106.63 112.33 116.32 124.84 128.26

90 52.28 59.20 65.65 113.14 118.14 124.16 128.30 137.21 140.78

100 59.90 67.33 74.22 124.34 129.56 135.81 140.17 149.45 153.17
TABEL 4 Valorile Fisher ( F0.05 ) : P ( F > F0.05 ) = 0.05
GL 1→ 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 
GL 2 ↓
1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 241.9 243.9 245.9 248.0 249.1 250.1 251.1 252.2 253.3 254.3
2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.41 19.43 19.45 19.45 19.46 19.47 19.48 19.49 19.50
3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.74 8.70 8.66 8.64 8.62 8.59 8.57 8.55 8.53
4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.91 5.86 5.80 5.77 5.75 5.72 5.69 5.66 5.63
5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.68 4.62 4.56 4.53 4.50 4.46 4.43 4.40 4.36
6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.00 3.94 3.87 3.84 3.81 3.77 3.74 3.70 3.67
7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.57 3.51 3.44 3.41 3.38 3.34 3.30 3.27 3.23
8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.28 3.22 3.15 3.12 3.08 3.04 3.01 2.97 2.93
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.07 3.01 2.94 2.90 2.86 2.83 2.79 2.75 2.71
10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.91 2.85 2.77 2.74 2.70 2.66 2.62 2.58 2.54
11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.79 2.72 2.65 2.61 2.57 2.53 2.49 2.45 2.40
12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.69 2.62 2.54 2.51 2.47 2.43 2.38 2.34 2.30
13 4.67 3.81 3.41 3.18 3.83 2.92 2.83 2.77 2.71 2.67 2.60 2.53 2.46 2.42 2.38 2.34 2.30 2.25 2.21
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.53 2.46 2.39 2.35 2.31 2.27 2.22 2.18 2.13
15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.48 2.40 2.33 2.29 2.25 2.20 2.16 2.11 2.07
16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.42 2.35 2.28 2.24 2.19 2.15 2.11 2.06 2.01
17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.38 2.31 2.23 2.19 2.15 2.10 2.06 2.01 1.96
18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.34 2.27 2.19 2.15 2.11 2.06 2.02 1.97 1.92
19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.31 2.23 2.16 2.11 2.07 2.03 1.98 1.93 1.88
20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.28 2.20 2.12 2.08 2.04 1.99 1.95 1.90 1.84
21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32 2.25 2.18 2.10 2.05 2.01 1.96 1.92 1.87 1.81
22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.23 2.15 2.07 2.03 1.98 1.94 1.89 1.84 1.78
23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 2.27 2.20 2.13 2.05 2.01 1.96 1.91 1.86 1.81 1.76
24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25 2.18 2.11 2.03 1.98 1.94 1.89 1.84 1.79 1.73
25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 2.16 2.09 2.01 1.96 1.92 1.87 1.82 1.77 1.71
26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.15 2.07 1.99 1.95 1.90 1.85 1.80 1.75 1.69
27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25 2.20 2.13 2.06 1.97 1.93 1.88 1.84 1.79 1.73 1.67
28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24 2.19 2.12 2.04 1.96 1.91 1.87 1.82 1.77 1.71 1.65
29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22 2.18 2.10 2.03 1.94 1.90 1.85 1.81 1.75 1.70 1.64
30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 2.09 2.01 1.93 1.89 1.84 1.79 1.74 1.68 1.62
40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 2.00 1.92 1.84 1.79 1.74 1.69 1.64 1.58 1.51
60 4.00 4.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.92 1.84 1.75 1.70 1.65 1.59 1.53 1.47 1.39
120 3.93 3.07 2.29 2.45 2.29 2.17 2.09 2.02 1.96 1.91 1.83 1.75 1.66 1.61 1.55 1.50 1.43 1.35 1.25
 3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88 1.83 1.75 1.67 1.57 1.52 1.46 1.39 1.32 1.22 1.00

287
TABEL 5 Valorile Fisher ( F0.01 ) : P ( F > F0.01 ) = 0.01

GL 1 → 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 
GL 2 ↓
1 4052 4999 5403 5625 5764 5859 5928 5982 6022 6056 6106 6157 6209 6235 6261 6287 6313 6339 6366
2 98.50 99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39 99.40 99.42 99.43 99.45 99.46 99.47 99.47 99.48 99.49 99.50
3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35 27.23 27.05 26.87 26.69 26.60 26.50 26.41 26.32 26.22 26.13
4 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 14.37 14.20 14.02 13.93 13.84 13.75 13.65 13.56 13.46
5 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.89 9.72 9.55 9.47 9.38 9.29 9.20 9.11 9.02
6 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.72 7.56 7.40 7.31 7.23 7.14 7.06 6.97 6.88
7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.47 6.31 6.16 6.07 5.99 5.91 5.82 5.74 5.65
8 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.67 5.52 5.36 5.28 5.20 5.12 5.03 4.95 4.46
9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.11 4.96 4.81 4.73 4.65 4.57 4.48 4.40 4.31
10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.71 4.56 4.41 4.33 4.25 4.17 4.08 4.00 3.91
11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54 4.40 4.25 4.10 4.02 3.94 3.86 3.78 3.69 3.60
12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4.16 4.01 3.86 3.78 3.70 3.62 3.54 3.45 3.36
13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 4.10 3.96 3.82 3.66 3.59 3.51 3.43 3.34 3.25 3.17
14 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94 3.80 3.66 3.51 3.43 3.35 3.27 3.18 3.09 3.00
15 8.68 6.36 5.42 4.89 4.36 4.32 4.14 4.00 3.89 3.80 3.67 3.52 3.37 3.29 3.21 3.13 3.05 2.96 2.87
16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3 .69 3.55 3.41 3.26 3.18 3.10 3.02 2.93 2.84 2.75
17 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.46 3.31 3.16 3.08 3.00 2.92 2.83 2.75 2.65
18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.37 3.23 3.08 3.00 2.92 2.84 2.75 2.66 2.57
19 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.43 3.30 3.15 3.00 2.92 2.84 2.76 2.67 2.58 2.49
20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.23 3.09 2.94 2.86 2.78 2.69 2.61 2.52 2.42
21 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40 3.31 3.17 3.03 2.88 2.80 2.72 2.64 2.55 2.46 2.36
22 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.12 2.98 2.83 2.75 2.67 2.58 2.50 2.40 2.31
23 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30 3.21 3.07 2.93 2.78 2.70 2.62 2.54 2.45 2.35 2.26
24 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17 3.03 2.89 2.74 2.66 2.58 2.49 2.40 2.31 2.21
25 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22 3.13 2.99 2.85 2.70 2.62 2.54 2.45 2.36 2.27 2.17
26 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18 3.09 2.96 2.81 2.66 2.58 2.50 2.42 2.33 2.23 2.13
27 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3.15 3.06 2.93 2.78 2.63 2.55 2.47 2.38 2.29 2.20 2.10
28 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12 3.03 2.90 2.75 2.60 2.52 2.44 2.35 2.26 2.17 2.06
29 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.09 3.00 2.87 2.73 2.57 2.49 2.41 2.33 2.23 2.14 2.03
30 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.84 2.70 2.55 2.47 2.39 2.30 2.21 2.11 2.01
40 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80 2.66 2.52 2.37 2.29 2.20 2.11 2.02 1.92 1.80
60 7.08 4.98 4.13 3.65 3.34 3.12 3.95 2.82 2.72 2.63 2.50 2.35 2.20 2.12 2.03 1.94 1.84 1.73 1.60
120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 2.47 2.34 2.19 2.03 1.95 1.86 1.76 1.66 1.53 1.38
 6.63 4.61 378 3.32 3.02 2.80 2.64 2.51 2.41 2.32 2.18 2.04 1.88 1.79 1.70 1.59 1.47 1.32 1.00

288
TABEL 6 Valorile Fisher ( F0.001 ) : P ( F > F0.001 ) = 0.001

GL 1 → 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 
GL 2 ↓
1 40532 50002 54042 56252 57642 58592 59292 59812 60232 60562 61072 61582 62092 62352 62612 62872 63132 63402 63662
2 998.5 999.0 999.2 999.2 999.3 999.3 999.4 999.4 999.4 999.4 999.4 999.4 999.4 999.5 999.5 999.5 999.5 999.5 999.5
3 167.0 148.5 141.1 137.1 134.6 132.8 131.6 130.6 129.9 129.2 128.3 127.4 126.4 125.9 125.4 125.0 124.5 124.0 123.5
4 74.14 61.25 56.18 53.44 51.71 50.53 49.66 49.00 48.47 48.05 47.41 46.76 46.10 45.77 45.43 45.09 44.75 44.40 44.05
5 47.18 37.12 33.20 31.09 29.75 28.84 28.16 27.64 27.24 26.92 26.42 25.91 25.39 25.14 24.87 24.60 24.33 24.06 23.79
6 35.51 27.00 23.70 21.92 20.81 20.03 19.46 19.03 18.69 18.41 17.99 17.56 17.12 16.89 16.67 16.44 16.21 15.99 15.75
7 29.25 21.69 18.77 17.19 16.21 15.52 15.02 14.63 14.33 14.08 13.71 13.32 12.93 12.73 12.53 12.33 12.12 11.91 11.70
8 25.42 18.49 15.83 14.39 13.49 12.86 12.40 12.04 11.77 11.54 11.19 10.84 10.48 10.30 10.11 9.92 9.73 9.53 9.33
9 22.86 16.39 13.90 12.56 11.71 11.13 10.70 10.37 10.11 9.89 9.57 9.24 8.90 8.72 8.55 8.37 8.19 8.00 7.81
10 21.04 14.91 12.55 11.28 10.48 9.92 9.52 9.20 8.96 8.75 8.45 8.13 7.80 7.64 7.47 7.30 7.12 6.94 6.76
11 19.69 13.81 11.56 10.35 9.58 9.05 8.66 8.35 8.12 7.92 7.63 7.32 7.01 6.85 6.68 6.52 6.35 6.17 6.00
12 18.64 12.97 10.80 9.63 8.89 8.38 8.00 7.71 7.48 7.29 7.00 6.71 6.40 6.25 6.09 5.93 5.76 5.59 5.42
13 17.81 12.31 10.21 9.07 8.35 7.86 7.42 7.21 6.98 6.80 6.52 6.23 5.93 5.78 5.63 5.47 5.30 5.14 4.97
14 17.14 11.78 9.73 8.62 7.92 7.43 7.08 6.80 6.58 6.40 6.13 5.85 5.56 5.41 5.25 5.10 4.94 4.77 4.60
15 16.59 11.34 9.34 8.25 8.57 7.09 6.74 6.47 6.26 6.08 5.81 5.54 5.25 5.10 4.95 4.80 4.64 4.47 4.31
16 16.12 10.97 9.00 7.94 7.27 6.81 6.46 6.19 5.98 5.81 5.55 5.27 4.99 4.85 4.70 4.54 4.39 4.23 4.06
17 15.72 10.66 8.73 7.68 7.02 6.56 6.22 5.96 5.75 5.58 5.32 5.05 4.78 4.63 4.48 4.33 4.18 4.02 3.85
18 15.38 10.39 8.49 7.46 6.81 6.35 6.02 5.76 5.56 5.39 5.13 4.87 4.59 4.45 4.30 4.15 4.00 3.84 3.67
19 15.08 10.16 8.28 7.26 6.62 6.18 5.85 5.59 5.39 5.22 4.97 4.70 4.43 4.29 4.14 3.99 3.84 3.68 3.51
20 14.82 9.95 8.10 7.10 6.46 6.02 5.69 5.44 5.24 5.08 4.82 4.56 4.29 4.15 4.00 3.86 3.70 3.54 3.38
21 14.59 9.77 7.94 6.95 6.32 5.88 5.56 5.31 5.11 4.95 4.70 4.44 4.17 4.03 3.88 3.74 3.58 3.42 3.26
22 14.38 9.61 7.80 6.81 6.19 5.76 5.44 5.19 4.99 4.83 4.58 4.33 4.06 3.92 3.78 3.63 3.48 3.32 3.15
23 14.19 9.47 7.67 6.69 6.08 5.65 5.33 5.09 4.89 4.73 4.48 4.23 3.96 3.82 3.68 3.53 3.38 3.22 3.05
24 14.03 9.34 7.55 6.59 5.98 5.55 5.23 4.99 4.80 4.64 4.39 4.14 3.87 3.74 3.59 3.45 3.29 3.14 2.97
25 13.88 9.22 7.45 6.49 5.88 5.46 5.15 4.91 4.71 4.56 4.31 4.06 3.79 3.66 3.52 3.37 3.22 3.06 2.89
26 13.74 9.12 7.36 6.41 5.80 5.38 5.07 4.83 4.64 4.48 4.24 3.99 3.72 3.59 3.44 3.30 3.15 2.99 2.82
27 13.61 9.02 7.27 6.33 5.73 5.31 5.00 4.76 4.57 4.41 4.17 3.92 3.66 3.52 3.38 3.23 3.08 2.92 2.75
28 13.50 8.93 7.19 6.25 5.66 5.24 4.93 4.69 4.50 4.35 4.11 3.86 3.60 3.46 3.32 3.18 3.02 2.86 2.69
29 13.39 8.85 7.12 6.19 5.59 5.18 4.87 4.64 4.45 4.29 4.05 3.80 3.54 3.41 3.27 3.12 2.97 2.81 2.64
30 13.29 8.77 7.05 6.12 5.53 5.12 4.82 4.58 4.39 4.24 4.00 3.75 3.49 3.36 3.22 3.07 2.92 2.76 2.59
40 12.61 8.24 6.60 5.70 5.13 4.73 4.44 4.21 4.02 3.87 3.64 3.40 3.15 3.01 2.87 2.73 2.57 2.41 2.23
60 11.97 7.76 6.17 5.31 4.76 4.37 4.09 3.87 3.69 3.54 3.31 3.08 2.83 2.69 2.55 2.41 2.25 2.08 1.89
120 11.38 7.32 5.79 4.95 4.42 4.04 3.77 3.55 3.38 3.24 3.02 2.78 2.53 2.40 2.26 2.11 1.95 1.76 1.54
 10.83 6.91 5.42 4.62 4.10 3.74 3.47 3.27 3.10 2.96 2.74 2.51 2.27 2.13 1.99 1.84 1.66 1.45 1.00

289
TABEL 7 Amplitudinea studentizată Tukey T(0.05)
c
m 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
GLE
5 3.64 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99 7.17 7.32 7.47 7.60 7.72 7.83 7.93 8.03 8.12 8.21
6 3.46 4.34 4.90 5.31 5.63 5.89 6.12 6.32 6.49 6.65 6.79 6.92 7.03 7.14 7.24 7.34 7.43 7.51 7.59
7 3.34 4.16 4.68 5.06 5.36 5.61 5.82 6.00 6.16 6.30 6.43 6.55 6.66 6.76 6.85 6.94 7.02 7.09 7.17
8 3.26 4.04 4.53 4.89 5.17 5.40 5.60 5.77 5.92 6.05 6.18 6.29 6.39 6.48 6.57 6.65 6.73 6.80 6.87
9 3.20 3.95 4.42 4.76 5.02 5.24 5.43 5.60 5.74 5.87 5.98 6.09 6.19 6.28 6.36 6.44 6.51 6.58 6.64
10 3.15 3.88 4.33 4.65 4.91 5.12 5.30 5.46 5.60 5.72 5.83 5.93 6.03 6.11 6.20 6.27 6.34 6.40 6.47
11 3.11 3.82 4.26 4.57 4.82 5.03 5.20 5.35 5.49 5.61 5.71 5.81 5.90 5.99 6.06 6.14 6.20 6.26 6.33
12 3.08 3.77 4.20 4.51 4.57 4.95 5.12 5.27 5.40 5.51 5.62 5.71 5.80 5.88 5.95 6.03 6.09 6.15 6.21
13 3.06 3.73 4.15 4.45 4.69 4.88 5.05 5.19 5.32 5.43 5.53 5.63 5.71 5.79 5.86 5.93 6.00 6.05 6.11
14 3.03 3.70 4.11 4.41 4.64 4.83 4.99 5.13 5.25 5.36 5.46 5.55 5.64 5.72 5.79 5.85 5.92 5.97 6.03
15 3.01 3.67 4.08 4.37 4.60 4.78 4.94 5.08 5.20 5.31 5.40 5.49 5.58 5.65 5.72 5.79 5.85 5.90 5.96
16 3.00 3.65 4.05 4.33 4.56 4.74 4.90 5.03 5.15 5.26 5.35 5.44 5.52 5.59 5.66 5.72 5.79 5.84 5.90
17 2.98 3.63 4.0 4.30 4.52 4.71 4.86 4.99 5.11 5.21 5.31 5.39 5.47 5.55 5.61 5.68 5.74 5.79 5.84
18 2.97 3.61 4.00 4.28 4.49 4.67 4.82 4.96 5.06 5.17 5.27 5.35 5.43 5.50 5.57 5.63 5.69 5.74 5.79
19 2.96 3.59 3.98 4.25 4.47 4.65 4.79 4.92 5.04 5.14 5.23 5.32 5.39 5.46 5.53 5.59 5.65 5.70 5.75
20 2.95 3.58 3.96 4.23 4.45 4.62 4.77 4.90 5.01 5.11 5.20 5.28 5.36 5.43 5.49 5.55 5.61 5.66 5.71
24 2.92 3.53 3.90 4.17 4.37 4.54 4.68 4.81 4.92 5.01 5.10 5.18 5.25 5.32 5.38 5.44 5.50 5.54 5.59
30 2.89 3.49 3.84 4.10 4.30 4.46 4.60 4.72 4.83 4.92 5.00 5.08 5.15 5.21 5.27 5.33 5.38 5.43 5.48
40 2.86 3.44 3.79 4.04 4.23 4.39 4.52 4.63 4.74 4.82 4.91 4.98 5.05 5.11 5.16 5.22 5.27 5.31 5.36
60 2.83 3.40 3.74 3.98 4.16 4.31 4.44 4.55 4.65 4.73 4.81 4.88 4.94 5.00 5.06 5.11 5.16 5.20 5.24
120 2.80 3.36 3.69 3.92 4.10 4.24 4.36 4.48 4.56 4.64 4.72 4.78 4.84 4.90 4.95 5.00 5.05 5.09 5.13
∞ 2.77 3.31 3.63 3.86 4.03 4.17 4.29 4.39 4.47 4.55 4.62 4.68 4.74 4.80 4.85 4.89 4.93 4.97 5.01

290
TABEL 8 Amplitudinea studentizată Tukey T(0.01)
m 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
GLE
5 5.70 6.97 7.80 8.42 8.91 9.32 9.67 9.97 10.24 10.48 10.70 10.89 11.08 11.24 11.40 11.55 11.68 11.81 11.93
6 5.24 6.33 7.03 7.56 7.97 8.32 8.61 8.87 9.10 9.30 9.49 9.65 9.81 9.95 10.08 10.21 10.32 10.43 10.54
7 4.95 5.92 6.54 7.01 7.37 7.68 7.94 8.17 8.37 8.55 8.71 8.86 9.00 9.12 9.24 9.35 9.46 9.55 9.65
8 4.74 5.63 6.20 6.63 6.96 7.24 7.47 7.68 7.87 8.03 8.18 8.31 8.44 8.55 8.66 8.76 8.85 8.94 9.03
9 4.60 5.43 5.96 6.35 6.66 6.91 7.13 7.32 7.49 7.65 7.78 7.91 8.03 8.13 8.23 8.32 8.41 8.49 8.57
10 4.48 5.27 5.77 6.14 6.43 6.67 6.87 7.05 7.21 7.36 7.48 7.60 7.71 7.81 7.91 7.99 8.07 8.15 8.22
11 4.39 5.14 5.62 5.97 6.25 6.48 6.67 6.84 6.99 7.13 7.25 7.36 7.46 7.56 7.65 7.73 7.81 7.88 7.95
12 4.32 5.04 5.50 5.84 6.10 6.32 6.51 6.67 6.81 6.94 7.06 7.17 7.26 7.36 7.44 7.52 7.59 7.66 7.73
13 4.26 4.96 5.40 5.73 5.98 6.19 6.37 6.53 6.67 6.79 6.90 7.01 7.10 7.19 7.27 7.34 7.42 7.48 7.55
14 4.21 4.89 5.32 5.63 5.88 6.08 6.26 6.41 6.54 6.66 6.77 6.87 6.96 7.05 7.12 7.20 7.27 7.33 7.39
15 4.17 4.83 5.25 5.56 5.80 5.99 6.16 6.31 6.44 6.55 6.66 6.76 6.84 6.93 7.00 7.07 7.14 7.20 7.26
16 4.13 4.78 5.19 5.49 5.72 5.92 6.08 6.22 6.35 6.46 6.56 6.66 6.74 6.82 6.90 6.97 7.03 7.09 7.15
17 4.10 4.74 5.14 5.43 5.66 5.85 6.01 6.15 6.27 6.38 6.48 6.57 6.66 6.73 6.80 6.87 6.94 7.00 7.05
18 4.07 4.70 5.09 5.38 5.60 5.79 5.94 6.08 6.20 6.31 6.41 6.50 6.58 6.65 6.72 6.79 6.85 6.91 6.96
19 4.05 4.67 5.05 5.33 5.55 5.73 5.89 6.02 6.14 6.25 6.34 6.43 6.51 6.58 6.65 6.72 6.78 6.84 6.89
20 4.02 4.64 5.02 5.29 5.51 5.69 5.84 5.97 6.09 6.19 6.29 6.37 6.45 6.52 6.59 6.65 6.71 6.76 6.82
24 3.96 4.54 4.91 5.17 5.37 5.54 5.69 5.81 5.92 6.02 6.11 6.19 6.26 6.33 6.39 6.45 6.51 6.56 6.61
30 3.89 4.45 4.80 5.05 5.24 5.40 5.54 5.65 5.76 5.85 5.93 6.01 6.08 6.14 6.20 6.26 6.31 6.36 6.41
40 3.82 4.37 4.70 4.93 5.11 5.27 5.39 5.50 5.60 5.69 5.77 5.84 5.90 5.96 6.02 6.07 6.12 6.17 6.21
60 3.76 4.28 4.60 4.82 4.99 5.13 5.25 5.36 5.46 5.53 5.60 5.67 5.73 5.79 5.84 5.89 5.93 5.98 6.02
120 3.70 4.20 4.50 4.71 4.87 5.01 5.12 5.21 5.30 5.38 5.44 5.51 5.56 5.61 5.66 5.71 5.75 5.79 5.83
∞ 3.64 4.12 4.40 4.60 4.76 4.88 4.99 5.08 5.16 5.23 5.29 5.35 5.40 5.45 5.49 5.54 5.57 5.61 5.65

291
292

TABEL 9 Valori critice ale asimetriei şi boltirii


ASIMETRIA A BOLTIREA B
n↓ → 0.05 0.01 0.99 0.95 0.05 0.01
50 0.533 0.787 1.95 2.13 4.01 4.92
100 0.389 0.567 2.18 2.35 3.77 4.40
150 0.321 0.464 2.30 2.45 3.66 4.14
200 0.280 0.403 2.37 2.51 3.57 3.98
250 0.251 0.360 2.42 2.55 3.51 3.87
300 0.230 0.329 2.46 2.59 3.47 3.79
350 0.213 0.305 2.50 2.62 3.44 3.72
400 0.200 0.285 2.52 2.64 3.41 3.67
450 0.188 0.269 2.55 2.66 3.39 3.63
500 0.179 0.255 2.57 2.67 3.37 3.60
550 0.171 0.243 2.58 2.69 3.35 3.57
600 0.163 0.233 2.60 2.70 3.34 3.54
650 0.157 0.224 2.61 2.71 3.33 3.52
700 0.151 0.215 2.62 2.72 3.31 3.50
750 0.146 0.208 2.64 2.73 3.30 3.48
800 0.142 0.202 2.65 2.74 3.29 3.46
850 0.138 0.196 2.66 2.74 3.28 3.45
900 0.134 0.190 2.66 2.75 3.28 3.43
950 0.130 0.185 2.67 2.76 3.27 3.42
1000 0.127 0.180 2.68 2.76 3.26 3.41
1500 0.104 0.147 2.73 2.80 3.22 3.33
2000 0.090 0.127 2.77 2.83 3.18 3.28
2500 0.080 0.114 2.79 2.85 3.16 3.25
3000 0.073 0.104 2.81 2.86 3.15 3.22
3500 0.068 0.096 2.82 2.87 3.14 3.21
4000 0.064 0.090 2.83 2.88 3.13 3.19
4500 0.060 0.085 2.84 2.88 3.12 3.18
5000 0.057 0.081 2.85 2.89 3.12 3.17
293

TABEL 10 Valori critice R/2 ale coeficientului de corelaţie liniară R


GL↓  → 0.05 0.01 0.001 GL ↓ → 0.05 0.01 0.001
1 0.997 0.999 1.000 24 0.388 0.496 0.608
2 0.950 0.990 0.999 25 0.381 0.487 0.597
3 0.878 0.959 0.991 26 0.374 0.478 0.588
4 0.811 0.917 0.974 27 0.367 0.470 0.579
5 0.754 0.874 0.951 28 0.361 0.463 0.571
6 0.707 0.834 0.925 29 0.355 0.456 0.563
7 0.666 0.798 0.898 30 0.349 0.449 0.554
8 0.632 0.765 0.872 35 0.325 0.418 0.519
9 0.602 0.735 0.847 40 0.304 0.393 0.490
10 0.576 0.708 0.823 45 0.288 0.372 0.465
11 0.553 0.684 0.801 50 0.273 0.354 0.443
12 0.532 0.661 0.780 60 0.250 0.325 0.408
13 0.514 0.641 0.760 70 0.232 0.302 0.380
14 0.497 0.623 0.742 80 0.217 0.283 0.357
15 0.482 0.606 0.725 90 0.202 0.267 0.338
16 0.468 0.590 0.708 100 0.195 0.254 0.321
17 0.456 0.575 0.693 125 0.174 0.228 0.293
18 0.444 0.561 0.679 150 0.159 0.208 0.260
19 0.433 0.549 0.665 200 0.138 0.181 0.230
20 0.423 0.537 0.652 300 0.113 0.148 0.190
21 0.413 0.526 0.641 400 0.098 0.128 0.160
22 0.404 0.515 0.630 500 0.088 0.115 0.150
23 0.396 0.505 0.619 1000 0.062 0.081 0.110
Tabel 11 Transformarea Fisher : Z = 0.5 ln [(1+R) / (1- R)]

R 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0100 0.0200 0.0300 0.0400 0.0501 0.0601 0.0701 0.0802 0.0902
0.1 0.1003 0.1105 0.1206 0.1308 0.1409 0.1511 0.1614 0.1717 0.1820 0.1923
0.2 0.2027 0.2132 0.2237 0.2342 0.2448 0.2554 0.2661 0.2769 0.2877 0.2986
0.3 0.3095 0.3206 0.3317 0.3428 0.3541 0.3654 0.3769 0.3884 0.4001 0.4118
0.4 0.4236 0.4356 0.4477 0.4599 0.4722 0.4847 0.4973 0.5101 0.5230 0.5361
0.5 0.5493 0.5627 0.5763 0.5901 0.6042 0.6184 0.6328 0.6475 0.6625 0.6777
0.6 0.6931 0.7089 0.7250 0.7414 0.7582 0.7753 0.7928 0.8107 0.8291 0.8480
0.7 0.8673 0.8872 0.9076 0.9287 0.9505 0.9730 0.9962 1.0203 1.0454 1.0714
0.8 1.0986 1.1270 1.1568 1.1881 1.2212 1.2562 1.2933 1.3331 1.3758 1.4219
0.9 1.4722 1.5275 1.5890 1.6584 1.7380 1.8318 1.9459 2.0923 2.2976 2.6467
0.99 2.6467 2.6996 2.7587 2.8257 2.9031 2.9945 3.1063 3.2504 3.4534 3.800

294
295

Tabel 12 Valori critice aα pentru testul valorilor de sondaj străine

n ↓ α → 0.10 0.05 0.01


3 1.41 1.41 1.41
4 1.64 1.70 1.72
5 1.79 1.87 1.95
6 1.89 2.00 2.13
7 1.97 2.09 2.26
8 2.04 2.17 2.37
9 2.10 2.24 2.46
10 2.16 2.29 2.54
11 2.19 2.34 2.61
12 2.23 2.39 2.66
13 2.26 2.43 2.71
14 2.30 2.46 2.76
15 2.33 2.49 2.80
16 2.35 2.52 2.84
17 2.38 2.55 2.87
18 2.40 2.58 2.90
19 2.43 2.60 2.93
20 2.45 2.62 2.96
21 2.47 2.64 2.98
22 2.49 2.66 3.01
23 2.50 2.68 3.03
24 2.52 2.70 3.05
25 2.54 2.72 3.07
296

Tabel 13 Valori critice mα şi Mα pentru testul caracterului aleator al


datelor de sondaj

n m0.01 m0.05 M0.05 M0.01


4 0.53 0.78 3.22 3.51
5 0.54 0.82 3.18 3.46
6 0.56 0.89 3.1 3.44
7 0.61 0.94 3.06 3.39
8 0.66 0.98 3.02 3.34
9 0.71 1.02 2.98 3.29
10 0.75 1.06 2.94 3.25
11 0.79 1.10 2.90 3.21
12 0.83 1.13 2.87 3.17
15 0.92 1.21 2.79 3.08
20 1.04 1.30 2.70 2.96
25 1.13 1.37 2.63 2.87
297

Tabel 14 Valori critice dα pentru testul Massey al normalităţii ,


prin sondaj de volum mic

n d0.05 d0.10 n d0.05 d0.10


8 0.140 0.163 20 0.117 0.133
9 0.134 0.158 21 0.115 0.131
10 0.130 0.156 22 0.113 0.129
11 0.129 0.155 23 0.112 0.128
12 0.128 0.154 24 0.110 0.126
13 0.128 0.153 25 0.109 0.124
14 0.128 0.151 26 0.108 0.121
15 0.127 0.148 27 0.107 0.120
16 0.126 0.144 28 0.105 0.118
17 0.124 0.142 29 0.104 0.116
18 0.122 0.138 30 0.102 0.114
19 0.120 0.136 32 0.099 0.111
298

TABEL 15 Valori critice pentru fişe de control al calităţii

Vol.sondaj n w‾ δ D1 D2
2 1.128 1.880 0 3.267
3 1.693 1.023 0 2.575
4 2.059 0.729 0 2.282
5 2.326 0.577 0 2.115
6 2.534 0.483 0 2.004
7 2.704 0.419 0.076 1.924
8 2.847 0.373 0.136 1.864
9 2.970 0.337 0.184 1.816
10 3.078 0.308 0.223 1.777
11 3.173 0.285 0.256 1.744
12 3.258 0.266 0.284 1.716
13 3.336 0.249 0.308 1.692
14 3.407 0.235 0.329 1.671
15 3.472 0.223 0.348 1.652
16 3.532 0.212 0.364 1.636
17 3.588 0.203 0.379 1.621
18 3.640 0.194 0.392 1.608
19 3.689 0.187 0.404 1.596
20 3.735 0.180 0.414 1.586
21 3.778 0.173 0.425 1.575
22 3.819 0.167 0.434 1.566
23 3.858 0.16 0.443 1.557
24 3.895 0.157 0.452 1.548
25 3.931 0.153 0.459 1.541
299

TABEL 16 Valorile lui - P.log2P pentru calculul entropiei H

P 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 - 0.0644 0.1129 0.1518 0.1858 0.2161 0.2435 0.2686 0.2915 0.3127
0.1 0.3322 0.3503 0.3671 0.3826 0.3971 0.4105 0.4230 0.4346 0.4453 0.4552
0.2 0.4644 0.4728 0.4806 0.4877 0.4941 0.5000 0.5053 0.5100 0.5142 0.5179
0.3 0.5211 0.5238 0.5260 0.5278 0.5293 0.5301 0.5306 0.5307 0.5304 0.5298
0.4 0.5288 0.5274 0.5256 0.5236 0.5211 0.5184 0.5153 0.5120 0.5083 0.5043
0.5 0.5000 0.4954 0.4906 0.4854 0.4800 0.4744 0.4684 0.4623 0.4558 0.4491
0.6 0.4422 0.4350 0.4276 0.4199 0.4121 0.4040 0.3957 0.3871 0.3784 0.3694
0.7 0.3602 0.3508 0.3412 0.3314 0.3215 0.3113 0.3009 0.2903 0.2796 0.2687
0.8 0.2575 0.2462 0.2348 0.2231 0.2113 0.1993 0.1871 0.1748 0.1623 0.1496
0.9 0.1368 0.1238 0.1107 0.0974 0.0839 0.0703 0.0565 0.0426 0.0286 0.0140
300

TABEL 17 Cursul mediu anual de schimb în perioada 1990-2003

ANUL DOLAR ECU / EURO


1990 22.43 LEI -
1991 76.39 LEI -
1992 307.95 LEI -
1993 760.05 LEI ECU = 884.60 LEI
1994 1655.09 LEI ECU = 1967.56 LEI
1995 2033.26 LEI ECU = 2629.51 LEI
1996 3082.60 LEI ECU = 3862.90 LEI
1997 7167.94 LEI ECU = 8090.93 LEI
1998 8875.55 LEI ECU = 9989.90 LEI
1999 15332.93 LEI EURO = 16295.30 LEI
2000 21692.74 LEI EURO = 19955.90 LEI
2001 29060.87 LEI EURO = 26026.91 LEI
2002 33055.46 LEI EURO = 31255.26 LEI
2003 33200.07 LEI EURO = 37555.87 LEI
TABEL 18 SUPRAFEŢE CULTIVATE (MII HA) ÎN PERIOADA 1990 – 2002

ANUL 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002
PLANTA
GRÂU+
SECARĂ 2297.7 2217.1 1475.4 2307.4 2440.9 2501.4 1797.7 2424.4 2033.4 1686.9 1954.3 2558.6 2309.8
ORZ+
ORZOAICĂ 749 1017.7 628.4 637.1 785 581.7 515.4 626.5 517.2 415.5 411.9 528.8 578.8
OVĂZ 144.3 209.9 303.8 364.5 334.1 238.9 233.9 219.1 228.1 248.2 232.3 219.4 239.4
PORUMB 2466.7 2575 3335.9 3065.7 2983.4 3109.2 3277 3037.7 3128.9 3013.4 3049.4 2974 2894.5
MAZĂRE
BOABE 52 33.4 22.2 31.6 34.3 32.2 27.7 22 14 15.6 13.1 11.7 16.1
FASOLE
BOABE 72 46.2 46.4 34.4 31.9 29.9 37.8 29.9 29.9 28.1 26.2 21.5 27
FLOAREA
SOARELUI 394.7 476.8 615.1 588.4 582.2 714.5 916.8 780.4 962.2 1043 876.8 800.3 906.2
SOIA 190.2 108 165.6 75.1 64.5 73.4 80.2 63.1 147.3 99.8 117 44.8 71.8
SFECLĂ DE
ZAHĂR 162.7 201.6 179.9 97.2 130 133.2 135.9 128.8 117.8 65.5 48.4 39 41.6
CARTOFI
TOAMNĂ 204.7 204.7 192.3 216.1 216 211.7 224 229.9 229 238.5 246.5 241.6 246.7
LUCERNĂ
M.VERDE 442.1 449 351.5 345.7 340.3 343.1 337.2 343.9 335 336.2 323.1 322.3 345.5
TRIFOI
M.VERDE 153.7 122.6 118.8 118.4 123.7 129.4 130.5 135.8 141.8 140.1 137.7 133 142.1
ANUALE
FÂN+MV 464.1 417.3 393.9 355.6 371.3 337.7 345.1 286 302.6 384.4 310.5 269.8 351.1
PORUMB
SILOZ 560.5 225.6 278.4 170.8 134.8 113.7 132.1 79.7 86.9 57.6 50.1 36.4 48.1

301
TABEL 19 PRODUCŢII VEGETALE (MII TONE) ÎN PERIOADA 1990 - 2002

ANUL 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002
PLANTA
GRÂU+
SECARĂ 7379 5558.9 3227.6 5354.5 6186.5 7709.3 3164.1 7185.6 5207.9 4682.5 4456.2 7763.8 4441.1
ORZ+
ORZOAICĂ 2679.6 2950.7 1678 1552.8 2133.6 1816.3 1107.5 1889.3 1238 1018.6 867 1580 1160.4
OVĂZ 234 258.2 507.7 553.6 496.8 404.4 290.5 325.4 362.1 389.6 243.8 382.4 327.4
PORUMB 6809.6 10497.3 6828.3 7987.5 9343.2 9923.1 9607.9 12686.7 8623.4 10934.8 4897.6 9119.2 8399.8
MAZĂRE 20.5
BOABE 49.4 32.3 33.2 36.4 38.1 54.3 33.7 27.3 24-4 27 14.2 21.7
FASOLE
BOABE 57.5 46 41.2 48.4 37.4 41.8 42.1 50.2 46.9 47.7 21.8 36.5 33.6
FLOAREA
SOARELUI 556.2 612 774 695.8 763.7 932.9 1095.6 858.1 1073.3 1300.9 720.9 823.5 1002.8
SOIA 141.2 178.6 126.8 95.4 100.1 107.9 113.1 121.1 200.8 183.4 69.5 72.7 145.9
SFECLĂ DE
ZAHĂR 3277.7 4702.7 2896,7 1776.3 2763.8 2654.6 2848.2 2725.5 2361.4 14149 666.9 875.5 954.6
CARTOFI
TOAMNĂ 2830.9 1634.1 2332.2 3354.1 2620.1 2681.3 3246.3 2851 2952,8 3518.2 3132.1 3591.7 3696.7
LUCERNĂ
M.VERDE 8057.2 9661.2 6409.6 6879.4 6944.4 7081.2 6984.8 7727.6 7004.1 7738 5120.7 6476.8 6887.4
TRIFOI
M.VERDE 1926 2054.3 1792.6 1988.1 2059.3 2367 2400.6 2725.5 2632 2863.1 2018.4 2494.5 2534.6
ANUALE
FÂN+MV 6882.6 5645.8 4077.6 3971.9 4155.9 4127.4 3930.4 3741.4 3773.7 4334.5 28404 3146.2 3816.9
PORUMB
SILOZ 6549.5 4930 2827.2 2842.5 2193.5 1771.8 1978.8 1534.9 1095.4 974.2 444 542.2 517.5
RĂDĂCINOASE
NUTREŢ 2575 2139.3 1343.4 1465.1 1245.3 1322.4 1301.1 1247.9 1119.5 1174.6 800.6 1035.2 1042.5

302
TABEL 20 EFECTIVE DE ANIMALE (MII CAPETE) ÎN PERIOADA 1990-2003

ANUL  1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003
SPECIA 
B0VINE 6291 5381 4355 3683 3597 3481 3496 3435 3235 3143 3051 2870 2800 2878
VACI+BIV. 2468 2123 2266 2025 1979 1963 1983 1939 1844 1794 1769 1775 1746 1759
CABALINE 663 670 749 921 751 784 806 816 822 839 858 865 860 852
OVINE 15435 14062 13879 12079 11499 10897 10381 9663 8937 8409 8121 7657 7251 7312
OI+MIOARE 9292 9050 11496 8854 8731 8049 7688 7188 6714 6354 6166 5870 5823 5795
CAPRINE 1017 1005 954 805 776 745 705 654 610 585 558 538 525 633
CAPRE 796 697 734 613 562 542 514 475 453 429 411 404 406 469
PĂSĂRI 113968 121379 106032 87725 76532 70137 80524 78478 66620 69480 69143 70076 71413 77379
GĂINI OUĂT. 49390 51475 50213 42406 37981 36233 38574 38883 35089 37272 38497 40760 42156 44667
ALBINE(MII
FAMILII) 1201 1091 1207 780 759 747 696 656 626 620 614 649 745 781

TABEL 21 PRODUCŢII ZOOTEHNICE ÎN PERIOADA 1990-2002

ANUL  1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002
PRODUC. U.M.
LAPTE MII HL 33057 35107 33593 35594 41663 44759 45453 44984 43763 42292 41719 43233 44980
VACĂ+BIV.*
LÂNĂ TONE 38167 32537 28020 26011 25141 24323 23165 22120 19967 18983 17997 16880 16659
OUĂ GĂINĂ MILBUC 7701 6859 5801 5316 5091 5263 5459 4953 4956 5323 5257 5524 5771
CARNE VITĂ MII 425 375 403 421 466 412 427 421 371 364 362 357 399
TONE
CARNE MII 1054 1012 907 962 893 897 911 820 825 687 600 579 640
PORC TONE
CARNE OAIE MII 172 162 169 167 160 162 149 138 130 120 119 112 129
TONE
CARNE MII 561 459 406 376 325 367 373 318 340 342 327 360 429
PASĂRE TONE
MIERE TONE 10579 8279 10410 9936 9820 10435 11157 10543 10198 11153 11746 12598 13434
PEŞTE TONE 63497 52008 37769 26373 28577 25383 23857 19381 17925 13528 17099 13417 16232
* Fără consum viţei

303
TABEL 22 BAZA TEHNICO-MATERIALĂ A AGRICULTURII ÎN PERIOADA 1990-2002

ANUL  1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002
RESURSA 
TRACTOARE 127065 132761 146790 158126 161223 163370 165281 163016 164756 163883 160053 164221 163711
PLUGURI 73159 73384 80730 95850 103805 107253 113955 114721 121620 122956 123192 126905 131252
CULTIVATOARE 27339 23868 23223 23632 23446 23376 23899 28369 28057 27988 26212 26037 27433
SEMĂNĂTORI 35778 34988 37048 43921 47682 50395 51608 53853 55678 56173 57709 59979 62061
MAŞINI ÎNGRĂŞ. 10810 9871 10563 10694 10498 10259 9981 10061 9912 8940 8635 9250 9656
CHIMICE
MAŞINI STROPIT, 14991 14088 13698 12828 12099 11788 10950 9957 9424 8202 7371 6898 7191
PRĂFUIT
COMBINE PT. 35813 34497 34473 34552 35649 36125 35936 35959 31483 29934 26783 24716 24231
PĂIOASE
COMBINE PT. 4882 3117 2919 2757 2732 1996 1775 1746 1593 1334 1301 1068 1084
PORUMB
COMBINE PT. 5569 5194 5294 4866 4356 4135 3600 3082 2729 2101 1656 1267 1091
FURAJE
VINDROVERE PT. 4981 4805 4712 4491 4062 3764 3446 3093 2779 2153 1780 1661 1512
FURAJE
PRESE BALOTAT 21706 20663 21579 19200 18475 16346 14519 12831 11050 8544 6753 5575 4921
PAIE
AZOTAT * 656 275 258 346 313 306 368 262 254 225 239 268 239
SUPERFOSFAT * 313 145 133 165 149 149 153 129 114 93 88 87 73
SARE POTASICĂ * 144.3 44 31 27 17 15 14 13 15 13 15 14 14
ÎNGRĂŞĂMINTE 24791 16910 15792 17125 16945 17423 17871 16513 15842 16685 15813 15327 15746
NATURALE *
* MII TONE

304
279

BIBLIOGRAGIE GENERALĂ

1.ANDREI T.,STANCU S.,PELE D.T.”Statistica”,Ediţia II,Ed.Economică,2002


2.ALECU I.N. şi col.”Management în agricultură” ,Ed.Ceres ,1997
3.ANDREESCU E.”Curs de matematică şi statistică biologică”
AMD ,IANB,1980
4.ANGHELACHE C.”Statistică generală” ,Ed. Economică,1999
5.ANUARUL STATISTIC AL ROMÂNIEI ,1991-2003
6.BARON T.,ANGHELACHE C.,TIŢAN E. “Statistică” Ed.Economică,
1996
7.BĂDIŢĂ M:,BARON T.,KORKA M.”Statistică pentru afaceri”
Ed.Eficient, Bucureşti ,1998
8.BERCA M.”Ecologie generală şi protecţia mediului” Ed.Ceres , 2000
9.BIJI E.,NEGURĂ I. “ Aplicaţii statistice în conducerea activităţii din
agricultură” Ed.Ceres,1980
10.BIJI E.M. şi col.”Statistica managerială a agentului economic din
agricultură”,Ed.Ceres ,1998
11.BIJI M. şi col.”Tratat de Statistică” , Ed. Economică,2002
12.CEAPOIU N.”Metode statistice aplicate în experienţele agricole şi
biologice” Ed.Agrosilvică,1968
13.CAPANU I.,ANGHELACHE C.”Indicatori economici”,Ed.Economică,2000
14.CLOCOTICI V.,STAN A. “Statistică aplicată în psihologie”,Ed.Polirom, 2000
15.DAGNELIE P.”Statistique théorique et appliqueé”,tome 1,2 De Boeck et
Larcier,1998
16.DAVIES R.G.”Computer Programming in Quantitative Biology”
Academic Press,1971
17.DRĂGHICI M.,ALECU I.M.,DINU T.”Management general”Lito AMC, 1999
18.DRĂGHICI M. “AGR1.Producţie vegetală” Sistem informatic integrat
destinat planificării afacerilor exploataţiei agricole,
USAMV ,2003
19. DUMITRESCU M. “ Teoria sondajelor statistice” Ed.Tehnică ,2003
20. ENE D. “Calculul şi interpretarea unor indicatori informaţionali în
statistica agricolă”Lucrări ştiinţifice IANB,Seria E, vol.XVII
(1974),92-95
21.ENE D. “Calculul aporturilor variaţiei factorilor în agricultură şi al
concentraţiei acestora “ Lucrări ştiinţifice IANB,Seria E,
Vol.XX-XXI(1977-1978),25-30
22.ENE D. “ Curs de Matematică şi Biometrie” (Litografiat –Atelierele de
material Didactic USAMV) ,1979
23.ENE D.” Asupra unei funcţii de producţie unifactoriale” Lucrări ştiinţifice IANB
,Seria E,vol.XXIV(1981),89-92
24.ENE D. “ Generalizarea unor indicatori statistici de evoluţie” Lucrări
Ştiinţifice IANB,Seria E,vol.XXIV(1981),93-96
25.ENE D. “ Programe de calculator pentru funcţia de regresie liniară pe
porţiuni” Lucrări Ştiinţifice IANB,Seria E,vol.XXV(l982), 75-84
26.ENE D. “Asupra concentrării şi specializării producţiei agricole pe
280

ramuri”Lucrări Ştiinţifice IANB ,Seria E,vol.XXV(1982),85-90


27.ENE D. “Asupra calculului aporturilor variaţiei factorilor în variaţia
producţiei agricole” Lucrări Ştiinţifice IANB,Seria E,
vol.XXVI(1983),89-92
28.ENE D. “Aducerea în limite normale a valorii heritabilităţii estimată
prin metoda regresiei “ Comunicare la Simpozionul ştiinţific
internaţional de Zootehnie,Iaşi ,12-13 XII ,1996
29.ENE D.,DRĂGHICI M.,ALECU I.N. “Srtatistică aplicată în agricultură”,
Ed.Ceres,2003
30.ENE D.”Matematici(I) (Algebră şi programare liniară)”, Ed.Ceres,2004
31.ENE D. “ Matematică cu aplicaţii în biologie şi ştiinţe agricole” Ed.ALL,2004
32.ENE D.”Programe executabile de algebră liniară , analiză numerică,
optimizări şi statistică pentru agricultură” 2005
33.GOGONEA S.,ENE D.” Analiză numerică”,Ed. Cartea Universitară,2005
34.GROSU H.,LUNGU S.,KREMER V.D. “Modele liniare utilizate în
ameliorarea genetică a animalelor”,Ed.Coral Sanivet,1997
35.IOSIFESCU M.,TĂUTU P. “ Procese stohastice şi aplicaţii în biologie
şi medicină” Ed.Academiei R.S.R.,1968
36.IOSIFESCU M. “Lanţuri Markov finite şi aplicaţii” Ed.Tehnică,1977
37.IOSIFESCU M.,MOINEAGU C.,TREBICI V.,URSIANU E.” Mică
Enciclopedie de Statistică” Ed. Ştiinţifică şi Enciclopedică,1985
38.ISAIC-MANIU A.,GRĂDINARU A.,VOINEAGU V.,MITRUŢ C.
“Statistică teoretică şi economică” Ed.Tehnică ,Chişinău ,1994
39.ISAIC-MANIU A.,VODĂ GH.V. “Manualul calităţii”,Ed.Economică,1997
40.JABA E.” Statistica “ Ediţia II,Ed. Economică ,2000
41.JOHNSTON J.” Econometric Methods” 3rd Edition , McGraw-Hill,1984
42.KENDALL M. “ Time-Series” C.Griffin &Co.,London,1976
43.MALIŢA M.,ZIDĂROIU C. “ Matematica organizării”, Ed. Tehnică,1975
44.MARINESCU I.”Analiză factorială” Ed.Ştiinţifică şi Enciclopedică, 1984
45.MATHER K.”The Elements of Biometry”,Meuthen,1967
46.MERCE E., URS FL.,MERCE C.” Statistică”,Ed. Academic Pres,2001
47.METCALFE A.V.”Statistics ăn Engineering”,Ed.Chapman &Hall,1994
48.MIHOC GH.,URSEANU V. “Tratat de statistică matematică” Ed.Academiei
R.S.R.,1976-1977
49.MONTGOMERY D.C.,RUNGER G.C.”Applied Statistics and Probability For
Engineers”J.Wiley ,1994
50.NEGOESCU GH.,CIOBANU R.,BONTAŞ C.A”Bazele statisticii pentru
afaceri” Ed.ALL BECK,1999
51.OANCEA M.”Tratat de management în unităţile agricole”,Ed.Ceres,1999
52.OTIMAN P.I.,CREŢ F. “ Elemente de matematici aplicate în economia
agroalimentară” Ed. Agroprint, 2002
53.PECICAN E.S. “Econometrie” ,Ed.ALL,1994
54.POSTELNICU T.,TĂUTU P.”Metode matematice în medicină şi biologie”
Ed.Tehnică,1971
55.PURCARU I.”Informaţie şi corelaţie”,Ed.Ştiinţifică şi Enciclopedică,1988
56.SANDU GH.”Modele experimentale în zootehnie” Ed.Coral Sanivet,1995
281

57.SĂNDOIU D.I. “Tehnică experimentală” Partea I ,Ed.Elisavaros,


Bucureşti,2003
58.SĂULESCU N.A.,SĂULESCU N.N.”Câmpul de experienţă”Ed. Agro-
Silvică ,1967
59.SEARLE S.R.”Linear Models”, J.Wiley ,1971
60.SNEDECOR C.W. “ Medode statistice aplicate în cercetările de agricultură,şi
biologie”,Ed.Didactică şi Pedagogică,1968
61.SORA V.,HRISTACHE I.,MIHĂESCU C. “Demografie şi statistică
socială” Ed.Economică,1996
62.TACU A.”Metode statistice în zootehnie şi medicină veterinară”
Ed.Agrosilvică ,1968
63.TÂRCOLEA C.,FILIPOIU A.,BONTAŞ S.” Tehnici actuale în teoria fiabilităţii” Ed.
Ştiinţifică şi Enciclopedică,1989
64.TODORAN I.”Răspunsuri posibile.Corelaţie şi prognoză” Ed.Dacia,1989
65.TOMESCU D.,MANCIU GH.,SCRIPSNIC V. “ Fiabilitatea utilajelor
agricole”,Ed.Ceres,1981
66.VODĂ V.GH.”Gândirea statistică-un mod de gândire al viitorului “
Ed.Albatros,1977
67.VOINEAGU V. şi col. “Statistica economică”,Ed.Tribuna Economică,2001
68.WALLACE T.D.,SILVER J.L.” Econometrics. An Introduction”
Addison-Wesley ,1988

S-ar putea să vă placă și