Documente Academic
Documente Profesional
Documente Cultură
U.S.A.M.V. BUCUREŞT
- BUCUREŞTI
2017
1
CUPRINS
Pagina
Prefață..........................................................................................................................................5
2
5.3 Analiza varianţei bifactorială completă în populaţii omogene................89
BIBLIOGRAFIE ..............................................................................................................94
3
4.1 Corelația și regresia liniară monofactorială………………………………………..159
4.2 Corelația și regresia patratică monofactorială……………………………………..161
4.3 Corelația și regresia cubică ascendentă monofactorială…………………………..163
4.4A Evoluția producției de Grâu (Kg / Ha) în anii 1990-2012………………………..165
4.4B Evoluția producției de Porumb (Kg / Ha) în anii 1990-2012………………........167
4.4C Evoluția producției de Floarea Soarelui (Kg / Ha) în anii 1990-2012…………..169
4.4D Evoluția producției de Soia (Kg / Ha) în anii 1990-2012…………………………171
4.4E Evoluția producției de Sfeclă de Zahăr (Kg / Ha) în anii 1990-2012………........173
4.4F Evoluția producției de Cartofi (Kg / Ha) în anii 1990-2012……………………...175
4.5 Corelația și regresia liniară bifactorială…………………………………………...177
4
PREFAȚĂ
Evenimentele deterministe sunt cele care se realizează totdeauna sau niciodată. De exemplu
planeta noastră Tera se rotește totdeauna în jurul Soarelui în timp ce Soarele nu se rotește
niciodată în jurul planetei Tera.
Evenimentele aleatoare(întămplătoare) sunt cele care se realizează într-o
proporție oarecare (cuprinsă între 0 % și 100 % ) fiind parțial sau total sub influența
întămplării sau hazardului .
De exemplu precipitațiile într-un loc dat și la un moment dat sunt sub influența unor factori
climatici întâmplători deci se pot realiza într-o proporție variabilă , care pot fi prognozate de
meteorologi cu o anumită probabilitate și un anumit risc(marjă de eroare).
Natura și mediul de afaceri sunt dominate de evenimente aleatoare.
Statistica este partea aplicată a fenomenelor aleatoare , studiază colectivități nu exemplare
izolare și are ca scop luarea unor decizii rapide și corecte bazate pe culegerea și prelucrarea
datelor reale variabile din teren.
Rapiditatea deciziei este asigurată de folosirea computerelor (foi de calcul EXCEL) iar
corectitudinea deciziei este dată de folosirea metodelor eficiente ale statisticii(corelații și
regresii , analiza varianței.etc).
Aplicând foile statistice EXCEL din acest Curs , se pot lua decizii când trebuie și cu
intensitatea care trebuie privind cantitatea , calitatea și vandabilitatea produselor
agroalimentare și serviciilor agroturistice pentru piața internă și la export.
Mulțumim Domnului Director al Departamentului de Învățământ la Distanță
Conf. Dr. MĂRCUȚĂ LIVIU pentru sprijinul acordat la apariția acestei lucrări.
Suntem recunoscători tuturor specialiștilor din agricultură care vor oferi sugestii de
îmbunătățire a metodelor de decizie statistică bazate pe realitatea agriculturii românești.
Așteptăm aceste sugestii pe adresa de e-mail enepdumitru2003@yahoo.com .
5
CAPITOLUL 1 CALCUL STATISTIC CU PRODUSUL INFORMATIC EXCEL
Produsul informatic EXCEL face parte din pachetul MS OFFICE alături de WORD , POWER
POINT,ACCESS, OUTLOOK şi este în totalitate compatibil cu celelalte produse ale pachetului.
EXCEL este cel mai cunoscut produs de calcul tabelar şi dispune de pachete de funcţii diverse
,poate gestiona baze de date , are posibilităţi de reprezentări grafice, etc.
Unitatea de prelucrare de bază este foaia de calcul(sheet) formată din celule aranjate pe 65536
linii numerotate de la 1 la 65536 şi pe 256 colonane notate cu litere (A-Z,AA-AZ,…,IA+IV)
Fiecare foaie de calcul se împarte în pagini. Un număr de foi de calcul formează un caiet de
calcul (booksheet).
Fără a fi mediu de programare , EXCEL are facilităţi de prelucrare statistică a datelor , de
optimizare cu restricţii liniare sau neliniare , de calcule financiare şi de folosire a nucleului de
programare VISUAL BASIC for APLLICATIONS(VBA).
Lansarea produsului EXCEL se face pe una din căile :
1) Dublu clic stânga cu mouse pe pictograma EXCEL de pe Desktop(dacă aceasta există)
2) Clic stînga cu mouse pe butonul START (sau CTRL +ESC) , activarea opţiunii
PROGRAMS şi deschiderea ferestrei sale , urmată de clic stânga cu mouse (sau ENTER)
pe opţiunea MICROSOFT EXCEL .
3) Dublu clic stânga cu mouse pe orice fişier creat anterior cu EXCEL ( cu extensia .XLS)
Elementele ferestrei EXCEL principale , luate de sus în jos , sunt :
Calcule statistice cu opţiunea DATA ANALYSIS din meniul TOOLS (activată cu opţiunea
Add-Ins din TOOLS) :
1) Analiza varianţei monofactorială(ANOVA:single factor);
2) Analiza varianţei bifactorială cu interacţiuni(ANOVA :two factor with replication);
3) Planul blocurilor complete randomizate(ANOVA :two factor without replication);
4) Calculul coeficientului de corelaţie liniară(Correlation);
5) Calculul covarianţei(Covariance);
6) Statistică descriptivă(Descriptive statistics);
7) Regresie exponenţială(Exponential Smoothing);
8) Testul F pentru varianţe în două sondaje(F-Test : two sample for variance);
9) Analiză Fourier(Fourier analysis);
10) Histograme(Histogram);
11) Medii mobile(Moving average);
12) Generarea de numere aleatoare(Random number generation);
13) Rang şi percentile(Rank and percentile);
9
14) Calculul coeficientului de regresie liniară şi al termenului liber al regresiei(Regression);
15) Eşantionare(Sampling);
16) Testul t pentru medii în observaţii-perechi (t –test: paired two sample for means);
17) Testul t pentru medii în două sondaje cu varianţe egale în populaţii(t – test : two sample
assuming equal variances);
18) Testul t pentru medii în două sondaje cu varianţe neegale în populaţii(t – test : two sample
assuming unequal variances);
19) Testul z pentru medii în două sondaje din populaţii normale( z – test : two sample for
means)
O foaie de calcul statistic conţine celule cu :
- text ;
- litere cu notaţia mărimilor ;
- valori numerice observate ;
- valori numerice calculate prin formule proprii şi/sau cu funcţii EXCEL ;
Celulele care conţin valori numerice calculate vor date în liste care urmează după foaia de
calcul cu formulele aferente.
În capitolele 2-5 vor fi înserate în foile EXCEL unele funcții matematice din cele de mai sus
cu expresiiile explicite.
În capitolele 2-5 vor fi înserate în foile EXCEL unele funcții statistice din cele de mai sus
cu expresiiile explicite.
14
Efect : Se calculează valoarea minimă din celulele A1,…,An pentru câmpul numeric
specificat între ghilimele; în celula An+1 este numele câmpului iar în celula An+2 este
criteriul după care se calculează minimul .
5) An+3 : = DAVERAGE(A1:An , ”Nume câmp”,An+1,An+2 )
Efect : Se calculează valoarea medie din celulele A1,…,An pentru câmpul numeric
specificat între ghilimele; în celula An+1 este numele câmpului iar în celula An+2 este
criteriul după care se calculează media .
6) An+3 : = DVAR(A1:An , ”Nume câmp”,An+1,An+2 )
Efect : Se calculează varianţa valorilor din celulele A1,…,An pentru câmpul numeric
specificat între ghilimele; în celula An+1 este numele câmpului iar în celula An+2 este
criteriul după care se calculează varianţa .
3) An+3 : = DSTDEV(A1:An , ”Nume câmp”,An+1,An+2 )
Efect : Se calculează abaterea-standard a valorilor din celulele A1,…,An pentru câmpul
numeric specificat între ghilimele; în celula An+1 este numele câmpului iar în celula An+2
este criteriul după care se calculează abaterea-standard .
Produsul informatic EXCEL oferă şi facilităţi de reprezentare grafică a unuia sau a mai multe
cămpuri ale unei baze de date prin diagrame (CHART) .Există diagrame plane(2-D) sau
spaţiale (3-D) .
Pentru aceasta se selectează cîmpurile pe care le vom reprezenta grafic şi se deschide
butonum CHART din bara de butoane standard cu clic stânga pe mouse sau se alege
comanda CHART din meniul INSERT .
Se parcurg paşii următori :
1) Se alege tipul şi subtipul de diagramă ;
2) Se selectează domeniile de date( dacă nu au fost selectate anterior) şi se precizează
orientarea seriilor de date pe linii sau coloane ;
3) Se precizează elementele diagramei : titlu,denumiri axe , legendă, grilaje,etichete pe date ,
tabel de date
4) Se plasează diagrama pe foaia de calcul existentă sau pe altă foaie de calcul.
Trecerea de la un pas la altul se face cu butonul NEXT iar pasul 4) se încheie cu butonul
FINISH.
Tipuri de diagrame
I) Diagrame plane (2-D)
15
1) Linie (Line) ;
2) Puncte(Scatter) ;
3) Arii (Area ) ;
4) Bare orizintale(Bar) ;
5) Bare verticale (Columns) ;
6) Sectoare de cerc(Pie)
7) Coroane circulare (Doughnut) ;
8) Radiale (Radar) ;
9) Combinate( Combination) ;
II) Diagrame spaţiale (3-D)
10) Suporafeţe (3-D Area) ;
11) Benzi spaţiale ( 3-D Line ) ;
12) Paralelipipede orizontale (3-D Bar) ;
13) Paralelipipede verticale ( 3-D Column) ;
14) Sectoare de cilindru (3-D Pie) ;
15) Relief ( 3-D Surface ) .
2.1.1 Evenimente
Un experiment este aleator dacă rezultatele sale nu pot fi prevăzute cu exactitate, fiind sub
influenţa întâmplării.
Exemple
1) Apariţia unei feţe la aruncarea monezii;
2) Apariţia unei feţe la aruncarea zarului;
3) Apariţia unei bile albe la extragerea din urnă cu bile albe şi negre.
Totalitatea rezultatelor posibile ale unui experiment aleator se numeşte spaţiu de
evenimente elementare şi se notează cu Ω.
Mulţimea părţilor (submulţimilor) lui Ω se notează cu P(Ω).
Exemplu
1) La aruncarea monezii avem Ω = {stemă, ban};
2) La aruncarea zarului avem Ω = {1, 2, 3, 4, 5, 6};
Dacă mulţimea Ω este finită sau numărabilă (şir), orice submulţime A Ω se numeşte
eveniment.
16
CA se numeşte eveniment contrar cu A şi se mai notează cu Ā.
Exemplu
Dacă A = “apariţia unei feţe pare la aruncarea zarului” atunci CA = “ apariţia unei feţe
impare la aruncarea zarului”.
Ω ca eveniment, se numeşte evenimentul sigur iar CΩ = Ø se numeşte evenimentul
imposibil.
Incluziunea A B se numeşte implicare a evenimentului B de către evenimentul A:
realizarea lui A determină realizarea lui B.
Exemplu
Dacă A = “apariţia feţei 6 la aruncarea zarului” şi B = “apariţia unei feţe pare la
aruncarea zarului” avem A B.
Egalitatea A = B se numeşte echivalenţă a evenimentelor A şi B şi are loc dacă A B şi
B A.
Evenimentul B este elementar dacă A B A = Ø sau A = B.
Exemple
1) Apariţia unei anumite feţe la aruncarea unei monezi sau zar este eveniment
elementar;
2) Apariţia unei bile albe la extragerea din urnă a unei bile este eveniment elementar.
Dându-se două evenimente A şi B, reuniunea lor se notează cu A B şi se citeşte “A sau
B” fiind un eveniment compus care se realizează dacă se realizează măcar unul dintre
evenimentele A, B.
Dându-se două evenimente A şi B, intersecţia lor se notează A B şi se citeşte “A şi B”
fiind un eveniment compus care se realizează dacă ambele evenimente A, B se realizează.
Exemplu
Fie A evenimentul că becul 1 funcţionează la un moment dat şi B evenimentul că becul 2
funcţionează în acelaşi moment.
A B este evenimentul că trece curentul prin circuitul paralel care conţine becurile
1 şi 2.
A B este evenimentul că trece curentul prin circuitul serie care conţine becurile 1 şi 2.
Evenimentele A, B sunt incompatibile dacă nu se realizează simultan adică A B = Ø.
În caz contrar A şi B se numesc compatibile.
Exemple de evenimente incompatibile
1) Apariţia de feţe diferite la o aruncare cu moneda sau zarul;
2) Apariţia de culori diferite la extragerea unei bile din urnă.
Exemple de evenimente compatibile
1) Nimerirea unei ţinte de doi trăgători care ochesc asupra ei;
2) Funcţionarea la un moment dat a două becuri într-un circuit electric.
17
2.1.2 Probabilităţile evenimentelor
Aplicații
18
a)A1 şi A2 sunt independente deci P1 = P(A1 A2) = P(A1 ) (A 2 ) =
1 1 1
= .
2 2 4
1 1 1
b) P2 = P(Ā1 Ā2) = P(Ā1) . P(Ā2) = = .
2 2 4
3
c) P3 = 1 – P2 = .
4
2) Se aruncă 2 zaruri care nu se ciocnesc.
Se cere:
a) Probabilitatea P1 să iasă o anumitä dublă;
b) Probabilitatea P2 ca suma punctelor să fie cuprinsă între 2 şi 4;
c) Probabilitatea P3 ca produsul punctelor să fie cuprins între 3 şi 5.
Soluţie
a) Fie A1 evenimentul că iese o faţă dată pe primul zar şi A2 evenimentul că iese
aceeaşi faţă pe al II-lea zar. Evenimentele A1, A2 sunt independente deci P1 = P(A1 A2) =
1 1 1
P(A1) P(A2) = = ;
6 6 36
b) Avem 2 = 1 + 1; 3 = 1 + 2 = 2 + 1; 4 = 1 + 3 = 2 + 2 = 3 + 1 deci conform
6 1
definiţiei clasice a probabilităţii avem P2 = = ;
36 6
7
c) Avem 3 = 1 . 3 = 3 . 1; 4 = 1 . 4 = 2 . 2 = 4 . 1; 5 = 1 . 5 = 5 . 1 deci P3 = .
36
3) Se dau două urne U1 cu 7 bile albe şi 3 bile negre şi U2 cu 4 bile albe şi 6 bile negre. Se
extrage câte o bilă din fiecare urnă.
Se cere:
a) Probabilitatea P1 ca ambele bile să fie albe;
b) Probabilitatea P2 ca bilele să fie de aceeaşi culoare;
c) Probabilitatea P3 ca bilele să fie de culori diferite.
Soluţie
a) Fie evenimentele: A1 = “apariţia unei bile albe din urna U1” şi A2 = “apariţia unei
bile albe din urna U2”. Evenimentele A1 şi A2 sunt independente deci: P1 = P(A1 A2) =
7 4
P(A1) . P(A2) = = 28% ;
10 10
b) Evenimentele A1 A2 şi Ā1 Ā2 sunt incompatibile deci
P2 = P[(A1 A2) (Ā1 Ā2)] = P(A1 A2) + P(Ā1 Ā2) + P(A1) . P(A2) + + P(Ā1) . P(Ā2) =
7 4 3 6
+ = 46%
10 10 10 10
c) P3 = 1 – P2 = 54%
4) Două becuri au probabilităţile de nedefectare :
P(A1) = 0.8; P(A2) = 0.9
Se cere:
19
a) Probabilitatea P1 ca prin circuitul serie al celor 2 becuri să treacă curentul;
b) Probabilitatea P2 ca prin circuitul paralel al celor 2 becuri să treacă curentul.
Soluţie
Evenimentele A1, A2 sunt compatibile şi independente.
a) P1 = P(A1 A2) = P(A1) . P(A2) = 0.8 x 0.9 = 72%;
b) P2 = P(A1 A2) = P(A1) + P(A2) – P(A1) . P(A2) = 0.8 + 0.9 – 0.72 = 98%
5) Doi ochitori lovesc o ţintă cu probabilităţile P(A1) = 0.7; P(A2) = 0.8
Se cere:
a) Probabilitatea P1 a lovirii ţintei dacă trag simultan amândoi asupra ei;
b) Probabilitatea P2 a lovirii ţintei dacă primul ochitor execută două focuri succesive
asupra ei;
c) Probabilitatea P3 a lovirii ţintei dacă al II-lea ochitor execută două focuri succesive
asupra ei.
Soluţie
A1, A2 sunt evenimente compatibile şi independente.
a) P1 = P(A1 A2) = P(A1) + P(A2) – P(A1) . P(A2) = 0.7 + 0.8 – 0.7 . 0.8 = 94%;
b) P2 = P(A1 A1) = P(A1) + P(A1) – (PA1) . P(A1) = 0.7 + 0.7 – 0.7 . 0.7 = 91%;
c) P3 = P(A2 A2) = P(A2) + P(A2) – P(A2) . P(A2) = 0.8 + 0.8 – 0.8 . 0.8 = 96%.
6) Un soi de grâu îndeplineşte condiţiile de calitate cu probabilităţile: P(MMB standard) =
0.96; P(putere de germinare standard) = 0.97; P(umiditate standard) = 0.92
Se cere probabilitatea îndeplinirii standardelor pentru cele trei condiţii.
Soluţie
Condiţiile din enunţ sunt dependente deci P(A1 A2 A3) > P(A1) + P(A2) + P(A3) – 3 + 1 =
0.96 + 0.97 + 0.92 – 2 = 0.85 = 85%.
Pentru a descrie influenţa realizării unui eveniment A1 asupra realizării unui eveniment A2
se foloseşte probabilitatea condiţionată.
(
P A1 A 2 )
Raportul se numeşte probabilitatea lui A2 condiţionată de A1 şi se notează
P(A1 )
PA1(A2) sau P(A2/A1).
Observăm că dacă A1 şi A2 sunt independente, avem :
P(A1 A2) = P(A1) . P(A2) deci P(A2) = P(A2).
De asemenea dacă A1 implică pe A2 (A1 A2) atunci A1 A2 = A1 deci P(A1 A2) =
PA1) aşa că PA1(A2) = 1.
Teoremă
Dacă Ω = A1 … An cu A1, …, An К şi Ai sunt incompatibile câte două, pentru orice
20
B К avem :
1) (Formula probabilităţii totale):
P(B) = P(A1) . PA1(B) + … + P(An) . PAn(B) (6)
2) (Formula Bayes):
P(Aj) PAj (B)
PB (Aj) =
P(A1 ) PA1 (B) + ...+ P(A n ) PAn (B)
(7)
pentru orice j = 1, …, n
Exemple
1) La o tombolă sunt 50 bilete din care 5 sunt câştigătoare. O persoană cumpără 3 bilete.
Care este probabilitatea ca nici unul să nu fie câştigător?
Soluţie
Fie evenimentele Ai = “biletul la extragerea Nr.i a ieşit necâştigător” (i = 1,2,3).
Relaţia (5) se scrie:
45 44 43
P(A1 A2 A3) = P(A1) . PA1(A2) . PA1 A2(A3) = = 72.7%
50 49 48
2) O urnă conţine 12 bile albe şi 8 bile negre.
Se extrag succesiv din urnă 3 bile cu bila nerevenită. Care este probabilitatea ca bilele
extrase să fie în ordine: albă, neagră, albă?
Soluţie
Fie evenimentul A1 = “prima bilă extrasă este neagră”; A2 = ” a doua bilä extrasä este
neagrä”; A3 = “a treia bilă extrasă este albă”.
Relaţia (5) se scrie:
12 8 11
P(A1 A2 A3) = P(A1) . PA1(A2) . PA1 A2(A3) = = 15.4%
20 19 18
3) Se dau urnele U1 cu 12 bile albe şi 8 bile negre, U2 cu 10 bile albe şi 10 bile negre şi U3 cu
6 bile albe şi 14 bile negre.
a) Se extrage o bilă dintr-o urnă. Care este probabilitatea ca ea să fie albă?
b) Se extrage o bilă dintr-o urnă şi se constată că este albă. Din ce urnă provine bila
extrasă?
Soluţie
Fie evenimentele Ai = “bila extrasă provine din urna Ui” (i = 1,2,3) şi B = “bila extrasă este
albă”.
a) Relaţia (6) se poate scrie:
P(B) = P(A1) . PA1(B) + P(A2) . PA2(B) + P(A3) . PA3(B) =
1 12 1 10 1 6 12 10 6 28
= + + = + + = = 46.7%
3 20 3 20 3 20 60 60 60 60
b) Relaţia (7) se scrie pentru j = 1:
21
P(A1 ) PA1 (B) 12 28 12
PB (A1 ) = = : = = 42.8%
P(B) 60 60 28
10 6
Analog PB(A2) = = 35.7 % ; PB(A3) = = 21.5%
28 28
Deci este mai probabil că bila albă extrasă să provină din urna U1.
4) Se dau urnele U1 cu 12 bile albe şi 8 bile negre şi U2 cu 6 bile albe şi 14 bile negre.
Din U1 în U2 se transferă o bilă apoi se extrage o bilă din U2.
a) Care este probabilitatea ca bila extrasă din U2 să fie albă?
b) Ştiind că bila extrasă din U2 a fost albă, ce culoare avea bila transferată?
Soluţie
Fie evenimentele A1 = “bila transferată din U1 în U2 a fost albă”, A2 = “bila transferată din
U1 în U2 a fost neagră”; B = “bila extrasă din U2 este albă”.
a) Relaţia (6) pentru n = 3 se scrie:
P(B) = P(A1) . PA1(B) + P(A2) . PA2(B) =
12 7 8 6 84 48 132
= + = + = = 31.4%
20 21 20 21 420 420 420
b) Relaţia (7) pentru j = 1 se scrie:
P(A1 ) PA1 (B) 84 132 84
PB(A1) = = : = = 63.6%
P(B) 420 420 132
48
Analog PB(A2) = = 36.4% deci este mai probabil că bila transferată din U1 în U2 a
132
fost albă.
5) Trei boli la bovine au probabilităţile P(A1) = 0.45; P(A2) = 0.36; P(A3) = 0.19
Aceste boli modifică un parametru sanguin cu probabilităţile PA1(B)=0.23; PA2(B)=0.41;
PA3(B)=0.75
a) Care este probabilitatea ca o vacă bolnavă de una din cele trei boli să aibă
parametrul sanguin modificat?
b) La o vacă se constată că parametrul sanguin este modificat de una din cele trei boli.
Care din boli a provocat modificarea?
Soluţie
Fie evenimentele Ai = “vaca s-a îmbolnăvit de boala cu nr. i” (i = 1,2,3); B = “vaca are
parametrul sanguin modificat”.
a) Conform relaţiei (6) pentru n = 3 avem:
P(B) = P(A1) . PA1(B) + P(A2) . PB(A2) + P(A3) . PA3(B) = 0.45 . 0.23 + 0.36 . 0.41 +
0.19 . 0.75 = 0.1035 + 0.1476 +0.1425 = 39.36%
b) Relaţia (7) pentru j = 1 devine:
22
P(A1 ) PA1 (B) 0.1035
PB (A1 ) = == 26.3%
P(B) 0.3936
0.1476 0.1425
Analog PB(A2) = = 37.5% ; PB(A3) = = 36.2% deci este mai
0.3936 0.3936
probabil că boala nr. 2 a modificat parametrul sanguin.
Probabilităţi p1 …………………………...pn
În acest caz nu se cunosc probabilităţile p1,…,pn ale stărilor S1,…, Sn iar aceste stări
se
presupun egal probabile.
Alegerea deciziei optime se ia după una din regulile :
I) Regula optimistului(maxi-max)
Varianta optimă este aceea dintre variantele V1,…,Vm pentru care avem :
Max(Max a i j ) = Max A i
i j i
(cea mai mare valoare din valorile economice maxime Ai ale liniilor).
23
Varianta optimă este aceea dintre variantele V1,…,Vm pentru care avem :
Max(Min a i j ) = Max Bi
i j i
(cea mai mare valoare din valorile economice minime Bi ale liniilor).
(cea mai mare din valorile economice mixte Ci () ale liniilor).
Varianta optimă este aceea dintre variantele V1,…,Vm pentru care avem :
a i1 + ... + a i m
Max( ) = Max M i
i m i
Varianta optimă este aceea dintre variantele V1,…,Vm pentru care avem :
În acest caz se cunosc probabilităţile p1,…,pn ale stărilor S1,…, Sn deci aceste stări
sunt inegal
probabile .
24
Vom calcula mediile ponderate:
1 = a11p1+…+a1npn
……………………
m = am1p1+…+amnpn
abaterile-standard :
1=a11p12 +…+a1npn2 - 121/2
…………………………….
m=am1p12 +…+amnpn2 - m21/2
şi coeficienţii de risc :
r1 = 1 / 1 ,…, rm = m / m .
Varianta optimă în condiţii de risc va fi aceea dintre variantele V 1,…,Vm pentru care avem
: Mediile maxime: Max i sau riscurile minime : Min r
i i
Exemplul 1 (DECIZIE1)
Un agent economic are un magazin şi vrea să mărescă vânzările.
Variante:
V1 = Construirea unui magazin nou în altă zonă ;
V2 = Închirierea unui spaţiu nou de vânzare în altă zonă ;
V3 = Extinderea magazinului existent;
V4 = Mărirea numărului de ore între care este deschis magazinul existent .
Stări ale pieții:
S1 = Cerere mare ;
S2 = Cerere mijlocie;
S3 = Cerere mică .
STĂRI → S1 S2 S3
VARIANTE
V1 50 30 10
V2 80 70 60
V3 100 90 20
V4 80 70 50
Probabilităţi 0.5 0.2 0.3
Soluţie
I) Regula optimistului
A1 = Max(a1j ) = 50;A2 = Max(a 2 j ) = 80;A3 = Max(a 3 j ) = 100;A 4 = Max(a 4 j ) = 80
j j j j
așa că Max ( 50 ; 80 ; 100 ;80) =100 deci V3 este varianta optimă după regula optimistului.
așa că Max( 10 ;60 ;20 : 50) = 60 deci V2 este varianta optimă după regula pesimistului.
Pentru α ϵ [0 ; 2/3] varianta optimă este V2 iar pentru α ϵ [2/3 ; 1] varianta optimă este V3
.
Pentru α = 0.4 avem C1(0.4)=26 ; C2(0.4)=68 ; C3(0.4)=52 ; C4(0.4)=62 așa că
Max ( 26 ; 68 ; 52 ; 62 ) = 68 deci V2 este varianta optimă după criteriul mixt cu
oeficientul de optimism α = 0.4
26
IV) Regula mediei maxime
STĂRI → S1 S2 S3
VARIANTE
V1 50 70 90
V2 20 30 40
V3 0 10 80
V4 20 30 50
sșa că Min(90 : 40 : 80 : 50 )=40 deci V2 este varianta optimă după regula regretelor
minime .
Avem mediile :
1 = 50 x 0.5 +30 x 0.2 +10 x 0.3 = 34 ; 2 = 80 x 0.5 +70 x 0.2 +60 x 0.3 = 72 ;
3 = 100 x 0.5 +90 x 0.2 +20 x 0.3 = 74 ; 4 =850 x 0.5 +70 x 0.2 +50 x 0.3 = 69 ;
27
așa că Max(34 :72 :74 : 69 )= 74 deci varianta V3 este optimă după criteriul mediei
ponderate maxime .
Avem abaterile-standard :
1 = 502 x 0.5 +302 x 0.2 +102 x 0.3 - 342 1 / 2 = 17.44 ;
2 = 802 x 0.5 +702 x 0.2 +602 x 0.3 - 722 1 / 2 = 8.72 ;
Avem riscurile :
r1 = 1 / 1 = 0.51 ; r2 = 2 / 2 = 0.12 ; r3 = 3 / 3 = 0.65 ; r4 = 4 / 4 = 0.19 ;
așa că Min (0.51 ; 0.12 ; 0.65 ; 0.19 ) = 0.12 deci varianta optimă este V2 după criteriul
riscului minim .
Exemplul 2 (DECIZIE2)
Un fermier are o microfermă de vaci cu lapte şi vrea să mărescă profitul din vânzarea
laptelui.
Variante:
V1 = Cumpărarea de vaci cu lapte ;
V2 = Efectivul de vaci cu lapte = staționar ;
V3 = Vânzarea de vaci cu lapte;
Stări ale bazei furajere(dependentă de precipitații):
S1 = Furaje ieftine(precipitații abundente) ;
S2 = Furaje moderate ca preț(precipitații normale);
S3 = Furaje scumpe(Precipitații puține) .
Tabloul decizional are forma :
STĂRI → S1 S2 S3
VARIANTE
V1 2000 1600 900
V2 1700 1200 600
V3 1900 1500 1000
28
Valori economice din acest tabel decizional :
a11 = 2000 lei / zi este valoarea profitului din vânzarea laptelui în varianta V1 și starea bazei
furajere S1 .Idem pentru celelalte valori economice din acest tabel.
Soluţie
I) Regula optimistului
A1 = Max(a1j ) = 2000;A 2 = Max(a 2 j ) = 1700;A 3 = Max(a 3 j ) = 1900
j j j
așa că Max(2000 ; 1700 ;1900) =2000 deci V1 este varianta optimă după regula optimistului.
așa că Max ( 900 ; 600 ; 1000) = 1000 deci V3 este varianta optimă după regula
pesimistului.
Pentru α ϵ [0 ; 0.5] varianta optimă este V3 iar pentru α ϵ [0.5 ; 1] varianta optimă este V1
.
Pentru α = 0.6 avem C1(0.6)=1560 ; C2(0.6)=1260 ; C3(0.6)=1660 așa că
Max ( 1560 ; 1260 ; 1660 ) = 1660 deci V3 este varianta optimă după criteriul mixt cu
29
oeficientul de optimism α = 0.6
așa că Max( 1500 ; 1167 ;1467) = 1500 deci varianta V1 este optimă după regula mediei
maxime.
V) Regula regretului minim
Valoarea maximă aij pentru i = 1,2,3 şi j = 1,2,3 este egală cu 100 deci tabloul regretelor
bij este :
STĂRI → S1 S2 S3
VARIANTE
V1 0 400 1100
V2 300 800 1400
V3 100 500 1000
sșa că Min(1100 : 1400 : 1000 )=1000 deci V3 este varianta optimă după regula regretelor
minime .
Avem mediile :
1 = 2000 x 0.3 +1600 x 0.5 +900 x 0.2 = 1580 ;
2 = 1700 x 0.3 +1200 x 0.5 +600 x 0.2 = 1230 ;
3 = 1900 x 0.3 +1500 x 0.5 +1000 x 0.2 = 1520 ;
30
așa că Max(1580 ; 1230 ; 1520)= 1580 deci varianta V1 este optimă după criteriul mediei
ponderate maxime .
Avem abaterile-standard :
1 = 20002 x 0.3 +16002 x 0.5 +9002 x 0.2 - 15802 1 / 2 = 381.57 ;
2 = 17002 x 0.3 +12002 x 0.5 +6002 x 0.2 - 12302 1 / 2 = 382.23 ;
3 = 19002 x 0.3 +15002 x 0.5 +10002 x 0.2 - 15202 1 / 2 = 312.41 ;
Avem riscurile :
r1 = 1 / 1 = 24.1 % ; r2 = 2 / 2 = 31.1 % ; r3 = 3 / 3 = 20.5 %
așa că Min (24.1 % ; 31.1 % ; 20.5 % ) = 20.5 % deci varianta optimă este V3 după
criteriul riscului minim .
Calculele precedente se efectuează cu următoarele foi EXCEL aflate în ANEXA 2 :
2.1 DECIZIE1
2.2 DECIZIE2
Exemplul 3 (DECIZIE 3)
Fie evenimentele-cauze Ai (i = 1,2,3) la cumparatori :
A1 = “ Cerere mare de produse agroalimentare / servicii agroturistice “
A2 = “ Cerere mijlocie de produse agroalimentare / servicii agroturistice “
A3 = “ Cerere mică de produse agroalimentare / servicii agroturistice “
și evenimentele-efecte Bj (j=1,2,3) la vanzatori :
B1 = “ Volum vânzare mare de produse agroalimentare / servicii agroturistice “
B2 = “ Volum vânzare mijlocie de produse agroalimentare / servicii agroturistice “
B3 = “ Volum vânzare mică de produse agroalimentare / servicii agroturistice “
Cunoaștem probabilitățile efectelor Bj sub influența cauzelor Ai , notate
cu PA i ( B j ) precum și probabilitățile cauzelor Ai , notate cu P(Ai) ,prezente în tabelul 1 :
Tabel 1
B B1 B2 B3 P(Ai)
Soluție :
a) Aplicăm relația (1) pentru fiecare efect Bj deci înmulțim element cu element coloanele lui
B1 , B2 , B3 din tabelul 1 cu elementele coloanei ultime P(Ai) din același tabel 1 iar
rezultatele de pe coloane le însumăm în linia ultimă P(Bj) , obținând tabelul 2 cu
PA i ( B j ) P( Ai ) și P(Bj) :
Tabel 2
B B1 B2 B3
b) Aplicăm relația (2) pentru fiecare efect Bj prin împărțirea fiecărui element
din coloana Bj a tabelului 2 la capul de coloană P(Bj) a acstui tabel și obținem tabelul 3 cu
PB ( Ai ) :
j
Tabel 3
B B1 B2 B3
Cauza probabilă A1 A2 A2
d) Dacă vânzarea a fost mijlocie (B2) , ea a fost cel mai probabil provocată de o cerere
mijlocie (A2 ) : PB ( A2 ) =0.770 = maximul coloanei B2 .
2
e)Dacă vânzarea a fost mică (B3) , ea a fost cel mai probabil provocată de o cerere mijlocie
(A2 ) : PB ( A2 ) =0.720 = maximul coloanei B3 .
3
Exemplul 4 (DECIZIE4)
B B1 B2 B3 P(Ai)
A
Soluție :
a) Aplicăm relația (1) pentru fiecare efect Bj deci înmulțim ,element cu element , coloanele
lui B1 , B2 , B3 din tabelul 4 cu elementele coloanei ultime P(Ai) din același tabel 1 iar
rezultatele de pe coloane le însumăm în linia ultimă P(Bj) ,obținând tabelul 5 cu
PA i ( B j ) P( Ai ) și P(Bj) :
33
Tabel 5
B B1 B2 B3
b) Aplicăm relația (2) pentru fiecare efect Bj prin împărțirea fiecărui element din coloana Bj a
tabelului 5 la capul de coloană P(Bj) a acestui tabel și obținem tabelul 6 cu PB ( Ai ) :
j
Tabel 6
B B1 B2 B3
A
Cauza probabilă A1 A2 A2
c)Dacă volumul vânzarii a fost mare (B1) , ea a fost cel mai probabil provocat de un
tarif mic (A1 ) : PB ( A1 ) =0.60 = maximul coloanei B1
1
d) Dacă vânzarea a fost mijlocie (B2) , ea a fost cel mai probabil provocată de o cerere
mijlocie (A2 ) : PB ( A2 ) =0.84 = maximul coloanei B2 .
2
e) Dacă vânzarea a fost mică (B3) , ea a fost cel mai probabil provocată de o cerere mijlocie
(A2 ) : PB ( A2 ) =0.70 = maximul coloanei B3 .
3
34
Calculele precedente se efectuează cu următoarele foi EXCE , aflate în ANEXA 2 :
2.3 DECIZIE3
2.4 DECIZIE4
Procesele decizionale de mai sus sunt statice adică valorile economice ai j sunt constante ,
ceace este adevărat la un moment dat .
În realitate valorile economice ai j se schimbă în timp , decizii premature sau tardive
ajungând să fie inoperante .
În procesul decizional dinamic vom avea :
ai j (t) = i j .t2 + i j .t + i j ; (i j , i j < 0 )
Aceste valori economice au valori pozitive în intervalele
[ (i j – ( i j )1 / 2 ) / ( - 2 i j) ; (i j + ( i j )1 / 2 ) / ( - 2 i j) ] unde i j = ( i j )1 / 2 – 4. i j. i j
şi au valoarea maximă pentru momentul de timp i j / ( - 2 i j) .
Momentul minim în luarea unei decizii este :
ij − ij ij + ij
T1 = Min iar cel maxim este T2 = Max
i, j −2 i, j −2
ij
ij
Pentru fiecare valoare concretă t T1; T2 modelul devine static şi varianta optimă V0 se
alege ca mai sus.
Exemplu
STĂRI → S1 S2
VARIANTE
V1 -t2+10t-24 -t2+6t-5
V2 -t2+7t-12 -t2+7t-10
35
2.4 Decizii secvențiale
2.4.1 Controlul secvențial al resurselor
Exemplul 5 (RESURSA1)
Y(X) = consumul de apă de irigaţie la porumb.
Avem D=150 zile , S = 3000 m3 apă / ha ,Y(0) = 0 m3 apă / ha .
Funcţia consumului de apă de irigaţie la porumb va fi :
Y(X) = -0.000018713.X3 +0.003929825.X2 +0.084210526.X cu graficul :
și graficul aferent :
36
De exemplu dacă în ziua 90-a a controlului Nr.6 , avem consumul real de apă de irigaţie
XR(6) = 20 m3 /ha , coeficientul diversificat la data acestui control ,fiind C(6) = 134.49 ,
vom avea XTA(6) = 20 x 134.49 = 2689.8 m3 apă / ha prin care se estimează la momentul X6 = 90 zile ,
cantitatea XT = 3000 m3 / ha .
Decidem ca din a 91-a zi a perioadei de vegetație a porumbului , să recuperăm deficitul de apă
de 3000 – 2689.8 = 310.2 m3 apă / ha
Exemplul 6 (RESURSA2)
37
ai consumului de furaje concentrate la porci : C(i) = YT / Y(Xj) (Xj = 0,60,90,…,240):
Tabel 2
NR.CONTROL ZIUA X HRANA Y COEF.DIVERSIFICAT
1 30 0.64 1248.78
2 60 1.50 533.33
3 90 2.48 322.01
4 120 3.50 228.57
5 150 4.45 179.65
6 180 5.25 152.38
7 210 5.80 138.01
8 240 6.00 133.33
cu graficul aferent :
De exemplu dacă în ziua 120-a a controlului Nr.4 , avem consumul real de furaje
concentrate XR(4) = 3 Kg /cap , coeficientul diversificat la data acestui control ,fiind C(4) = 240 ,
vom avea XTA(4) = 3 x 228,57 = 685.71 Kg / cap prin care se estimează la momentul X6 = 120 zile , cantitatea X
800 Kg / cap
Decidem ca din a 121-a zi a perioadei de furajare a porcilor , să recuperăm deficitul de furaje concentrate
de 800 – 685.71 = 114.29 Kg / cap
38
2.4.2 Controlul secvențial al producțiilor
Exemplul 7 (PRODUCTIA1)
Y(X) = producţia de lapte de vacă ( litri ) .
Avem D=308 zile , YT = 3000 litri lapte .
Funcţia producţiei de lapte va fi :Y(X) = 0.000003211.X3 + 0.001915063.X2 + 0.308136412.X cu graficul :
cu graficul aferent:
39
De exemplu dacă în ziua 140-a a controlului Nr.5 , avem producţia reală de lapte
YR(5) = 13 litri/cap.zi , coeficientul diversificat la data acestui control ,fiind C(5) =208.12 ,
vom avea YTA(5) = 13 x 208.12 = 2705.56
litri / vacă prin care se estimează la momentul t5 = 140 zile cantitatea YT = 5000 litri lapte .
Decidem ca din a 141-a zi a perioadei de lactație a vacilor , să recuperăm deficitul producției
de lapte de 3000 – 2705.56 = 294,44 litri lapte / cap
Experimental s-au stabilit pentru producţia de lapte de vacă din România la cele 11 controale ,
Următorii coeficienţi diversificaţi :
Nr.control 1 2 3 4 5 6 7 8 9 10 11
Coef.diver- 237.3 236.7 250 261 280 295.7 327.1 357.6 398.3 456.3 518.5
sificaţi
Exemplul 8 (PRODUCTIA2)
40
YC(X) = - 0.000711780.(X4 /4)+ 0.053383519.(X3 /3)+0.717474490.(X2/2)
Avem YC(56) = YT =2500 grame .
Pentru N = 8 controale la D / N = 7 zile, avem în tabelul 4 coeficienţii diversificaţi
ai sporului zilnic în greutate al puilor : C(i) = YT / Y(Xj) (Xi = 7,14,21,…,56):
Tabel 4
NR.CONTROL ZIUA X GREUTATE Y COEF.DIVERSIFICAT
1 7 7.39 338.11
2 14 18.55 134.74
3 21 32.02 78.08
4 28 46.32 53.98
5 35 59.99 41.67
6 42 71.57 34.93
7 49 79.59 31.41
8 56 82.59 30.27
cu graficul aferent :
De exemplu dacă în ziua 28-a a controlului Nr.4 , avem sporul zilnic în greutate real YR(4) = 40 g / cap ,
coeficientul diversificat la data acestui control ,fiind C(4) = 53.98 , vom avea YTA(4) = 40 x 53.98 =
2159.2 g / cap prin care se estimează la momentul t4 = 28 zile cantitatea YT = 2500 grame
Decidem ca din a 29-a zi a perioadei de furajare a puilor de carne , să recuperăm deficitul de greutate
de 2500 – 2159.2 = 340.8 grame / cap.
41
CAPITOLUL 3 CULEGEREA ŞI PRELUCRAREA DATELOR DE SONDAJ
42
Menţionăm şi următoarele însuşiri colective:
- Consumul de resurse (forţă de muncă, forţă mecanică, energie, îngrăşăminte, apă, furaje,
medicamente etc.) pentru o societate agricolă (vegetală, zootehnică, de prelucrare produse agricole, de
comercializare produse alimentare, de agroturism) într-un ciclu de producţie;
- Costul resurselor pe unitate de resursă pentru o societate agricolă într-un ciclu de producţie;
- Cheltuielile cu resurse (consumuri înmulţite cu costurile) însumate pentru o societate agricolă
într-un ciclu de producţie;
- Cheltuielile neproductive (TVA, taxe, impozite etc.) ale unei societăţi agricole într-un ciclu de
producţie;
- Producţii fizice principale şi secundare ale unei societăţi agricole într-un ciclu de producţie;
- Preţurile de vânzare ale producţiilor fizice principale şi secundare pe unitate, pentru o societate
agricolă într-un ciclu de producţie;
- Veniturile (producţii fizice înmulţite cu preţurile de vânzare) însumate pentru o societate
agricolă într-un ciclu de producţie;
- Profitul (venitul din care se scad cheltuielile totale cu resursele cât şi cele neproductive) realizat
de societatea agricolă într-un ciclu de producţie;
- Rata profitului (profitul împărţit la cheltuielile totale) realizată de societatea agricolă într-un
ciclu de producţie.
Pentru comparaţia între ele, însuşirile colective se raportează la un exemplar, lungime, suprafaţă,
volum, greutate, timp, unitate bănească, etc.) obţinând însuşiri medii.
Exemple: consumul mediu de motorină pe ha, consumul mediu de furaje pe cap de vacă, profitul
mediu pe lună al unei unităţi de agroturism, etc.
În agricultură, omul nu poate controla în totalitate factorii de producţie sau de vânzare a produselor
agricole, de aceea însuşirile precedente sunt parţial sau total sub influenţa întâmplării (hazardului) fiind de
fapt în fiecare moment, variabile aleatoare iar în timp, procese aleatoare .
Acţiunea întâmplării asupra însuşirilor (caracterelor) în agricultură se concretizează în variabilitatea
valorilor acestora în spaţiu, timp, structură, etc. variabilitatea poate fi accidentală (involuntară) sau
sistematică(cu o cauză precisă).
Variabilitatea accidentală este presupusă a fi o variabilă normală cu media 0 şi abaterea –
standard σ
Exemple de surse de variabilitate:
- variabilitatea genotipică a plantelor şi animalelor;
- condiţiile pedoclimatice;
- atacul buruienilor, bolilor şi dăunătorilor;
- conjunctura economică (raport ofertă/cerere) pe piaţa produselor agroalimentare.
Fie o populaţie statistică de volum N pe care dorim să o studiem din punct de vedere al însuşirii
(caracterului) X pe care o posedă exemplarele populaţiei.
Din cauza volumului mare N al populaţiei, nu vom face măsurători complete în toată populaţia ci
vom extrage o parte reprezentativă din exemplarele populaţiei, numită sondaj (eşantion, probă) pe care
vom face măsurători relativ la însuşirea (caracterul) X.
n
Volumul sondajului se notează cu n iar raportul (%) se numeşte cotă de reprezentare sau factor
N
de sondaj.
Exemplu
43
Pe un ha cu porumb există N = 75.000 plante recoltabile din care extragem un sondaj de n = 75
plante reprezentative.
n 75
Cota de reprezentare este = = 1 : 1000 plante.
N 75000
Un sondaj se poate efectua în două feluri:
I. Static: se fac măsurători simultane la un moment dat pe n exemplare extrase din populaţie
obţinându-se astfel repartiţia în spaţiu a însuşirii X analizată prin datele de sondaj.
II. Dinamic: se fac măsurători consecutive în n momente de timp succesive pe acelaşi exemplar
al populaţiei statistice, obţinându-se astfel evoluţia în timp a însuşirii X analizată prin datele de sondaj.
Tehnica de efectuare a unui sondaj, depinde de compoziţia populaţiei în raport cu însuşirea X.
Avem situaţiile:
a) Populaţia este omogenă în raport cu însuşirea X adică orice valoare a lui X este în mod egal
probabil proprie fiecărui exemplar al populaţiei.
În acest caz se efectuează un sondaj simplu repetat sau nerepetat.
Sondajul simplu repetat se efectuează prin extragerea suscesivă a exemplarelor din populaţie şi
revenirea în populaţie a fiecărui exemplar după măsurarea însuşirii X (schema bilei revenite). Avantajul
acestui tip de sondaj este că extragerile din populaţie sunt independente iar dezavantajul este că la controlul
calităţii produselor, orice exemplar chiar dacă este rebut, trebuie întors în populaţie.
Sondajul simplu nerepetat se efectuează prin extragerea simultană a exemplarelor din populaţie şi
revenirea acestora în populaţie (dacă nu sunt rebuturi) după efectuarea tuturor măsurătorilor pe ele relativ la
însuşirea X (schema bilei nerevenită).
Dezavantajul acestui tip de sondaj este că extragerile din populaţie sunt dependente. Dacă volumul
de sondaj n este relativ mare rezultatele obţinute prin sondajul simplu repetat sau nerepetat sunt aproximativ
aceleaşi.
b) Populaţia este neomogenă în raport cu însuşirea X dar se poate împărţi în k straturi omogene în
raport cu X, volumul straturilor fiind N1, … Nk. Evident avem N1 + …+ Nk = N. În acest caz se efectuează
un sondaj stratificat care constă în k sondaje simple, repetate sau nerepetate, din straturi cu volumele de
sondaj din straturi n1, …, nk. Evident avem n1+ …+ nk = n.
Prezentăm câteva tipuri de sondaj stratificat:
n
a. Sondaj tipic: n1 = ... = n k = ;
k
n1 n n N N
b. Sondaj proporţional: = ... = k = deci n1 = n 1 ,...,n k = n k
N1 Nk N N N
n1 n n
c. Sondaj optim: = ... = k = deci
N1 1 N k k Ni i
N1σ1 N σ
n1 = n ,...,n k = n k k
Ni σi Ni σi
Aici σ 1, … σ k sunt abaterile standard ale exemplarelor din straturi în raport cu caracterul X ca
variabilă aleatoare (vezi cap. 2).
N
Observăm că pentru N1 = …= Nk = sondajul tipic şi cel proporţional coincid iar pentru σ 1 = …=
k
σ k = σ sondajul proporţional şi cel optim coincid.
44
N1 N
În cazul unei populaţii infinite → p1 ,..., k → p k deci pentru tipurile de sondaj stratificat
N N
precedent, avem:
n
a. Sondaj tipic: n1 = … = nk = ;
k
b. Sondaj proporţional: n1 = np1, …, nk = npk
p1σ1 p σ
c. Sondaj optim: n1 = n ,...,n k = n k k .
pi σi pi σi
Exemplu
O turmă de ovine de volum N = 1000 capete are structura N1 = 700 mioare, N2 = 250 miei, N3 = 50
berbeci.
Pentru analiza însuşirii X = lungimea firului de lână efectiv din sondaj de n = 60 ovine. Ştiind că
abaterile – standard în straturi sunt σ 1 =1 cm; σ 2 = 0.8 cm şi σ 3 = 2 cm, se cer volumele de sondaj din
straturi pentru diferite tipuri de sondaj stratificat.
Soluţie
a) Pentru sondajul tipic n1 = n / 3 =20 mioare; n2 = n / 3 =20miei; n3= n / 3 =20 berbeci;
700
b) Pentru sondajul proporţional n1 = 60 = 42 mioare,
1000
250
n2 = 60 = 15 miei şi n3 = n – n1 – n2 = 3 berbeci;
1000
700 1
c) Pentru sondajul optim Ni σ i = 700x1 + 250 x 0.8 + 50x2 =1000 aşa că: n1 = 60 = 42
1000
250 0.8
mioare; n2 = 60 = 12 miei şi n3 = n – n1 – n2 = 6 berbeci.
1000
45
3.2 Indicatori de sondaj de repartiţie
3.2.1 Cazul sondajului de volum mic (n < 30)
În acest caz datele nu se grupează în clase de valori, prelucrarea la statistică reducându-se la calculul
următorilor indicatori statistici:
I. Media de sondaj
X = MX =
xi
n
Media de sondaj este centrul de greutate al datelor de sondaj x1, …, xn fiind cea mai apropiată de
ansamblul valorilor: SPA(x) = (x1 – x)2 +…+ (xn – x)2 este minimă pentru
x = x.
Aici SPA este prescurtarea pentru suma patratelor abaterilor.
46
1 log X1 + ... + log X n
- media geometrică: X g = ( )
x1x 2 ...x n n de unde log X g =
n
1 1
+ ... +
1 X Xn
- media armonică: = 1
Xa n
1
X12 + ... + X 2n 2
- media pătratică: X 2 =
n
Avem X a ≤ X g ≤ X .
II. Mediana Me este acea valoare faţă de care jumătate din numărul valorilor de sondaj sunt mai
mici ca ea şi cealaltă jumătate din numărul valorilor de sondaj sunt mai mari ca ea.
Aranjăm datele de sondaj în ordine crescătoare: x1 < x2 < … < xn.
1
Dacă n = număr par avem Me = x k + x k −1 iar dacă n = număr impar avem Me = X k +1 .
2 2 2
2
Mediana Me este mai stabilă faţă de media X la valori de sondaj foarte mici faţă de restul valorilor
de sondaj, deoarece ia în calcul numărul de valori de sondaj nu şi mărimea valorilor de sondaj.
În plus, SMA(X) = X1 − X + ... + X n − X este minimă pentru X = Me.
Aici SMA este prescurtarea pentru suma modulelor abaterilor. Mediana primei jumătăţi a datelor de
sondaj crescătoare, se numeşte cuartila întâia Q1 . Me = Q2. Analog Q3 pentru a doua jumătate a datelor .
Media şi mediana au fost indicatori de poziţie pentru datele de sondaj.
Urmează indicatori de variabilitate pentru datele de sondaj.
(x i − X )
2
S= este principalul indicator valoric al variabilităţii fiind o abatere mijlocie a
n −1
datelor de sondaj faţă de media lor X .
Calităţi ale abaterii-standard
1) Abaterea standard este mărginită (cuprinsă între abaterea minimă amin şi cea maximă amax a datelor
de sondaj faţă de media lor X .
Defecte ale abaterii-standard
47
2) Abaterea standard S este legată de o unitate de măsură (aceeaşi ca şi pentru media X ) deci nu
permite comparaţii între caractere.
a max − S
Pentru comparaţii se poate folosi abaterea standard procentuală Sp = 0;1.
a max − a min
3) Abaterea standard este sensibilă la înmulţirea sau împărţirea datelor de sondaj conform teoremei
6.2.
4) Abaterea standard singură nu poate aprecia intensitatea variabilităţii datelor de sondaj.
Valorile Ui = (Xi - X )/ S se numesc reduse sau normate. Avem :
M(Ui) = 0 şi V(Ui)= 1.
V. Coeficientul de variabilitate
S
c= 100 este principalul indicator procentual al variabilităţii datelor de sondaj în jurul mediei la
X
X . El măsoară variabilitatea datelor luând ca unitate de măsură nu unitatea de măsură a caracterului X ci
media de sondaj X .
Calităţi ale coeficientului de variabilitate
a min
1) Coeficientul de variabilitate c este o valoare mărginită (cuprins între 100 şi
X max
a max
100 ).
X min
2) Coeficientul de variabilitate c nu are unităţi de măsuri, deci permite comparaţii între caractere.
3) Coeficientul de variabilitate c poate aprecia cu ajutorul unor praguri intensitatea variabilităţii
datelor de sondaj în jurul mediei lor.
În raport de valorile coeficientului de variabilitate c avem cazurile:
a) Coeficientul de variabilitate c are o valoare mică. În acest caz variabilitatea datelor de sondaj este
mică, omogenitatea este mare şi media X este foarte bună;
b) Coeficientul de variabilitate c are o valoare mijlocie. În acest caz variabilitatea datelor de sondaj
este mijlocie, omogenitatea lor este mijlocie şi media X este bună;
c) Coeficientul de variabilitate c are o valoare mare. În acest caz variabilitatea datelor este mare,
omogenitatea este mică şi media X este satisfăcătoare.
De exemplu pentru agricultură cazurile precedente au forma:
a) c < 10%; b) c (10%; 20]; c) c > 20%.
În cazul c) se pune problema existenţei unei cauze sistematice pentru variabilitatea mare a datelor de
sondaj.
Exemplu
Fie o populaţie statistică de plante de porumb la recoltarea pe suprafaţa de 1 ha cu volumul populaţiei
N = 75000 plante recoltabile.
Fie X = greutatea boabelor pe plantă la recoltare (g).
48
n
Efectuăm un sondaj de n = 10 plante reprezentative deci cota de reprezentare este = 1 : 7500
N
plante.
Datele de sondaj se aranjează în ordine Xi X i- X (Xi- X )2 Xi − X
crescătoare în tabelul alăturat. S
Avem indicatorii de sondaj:
500
I) X= = 50 g/plantă 40 -10 100 -1.43
10 42 -8 64 -1.14
II) Me ϵ [48; 51] deci 45 -5 25 -0.71
Me = 49.5 g/plantă
45 -5 25 -0.71
448
III) S2 = = 49.8 g 2 48 -2 4 -0.29
10 − 1 51 1 1 0.14
IV) S = 49.8 = 7 g / plantă 54 4 16 0.57
7 57 7 49 1.00
V) C= = 14% 58 8 64 1.14
50
60 10 100 1.43
500 0 448 -
În ANEXA 3 se găsește foaia EXCEL cu numele 3.1 ANALIZA UNUI CARACTER INTR-O
POPULATIE .
În acest caz se face gruparea datelor de sondaj în clase de valori astfel: se fixează numărul k de clase
de valori care nu trebuie să fie nici prea mic, deoarece se şterg trăsături esenţiale ale datelor de sondaj, nici
prea mare, deoarece se pun în evidenţă trăsături neesenţiale ale datelor de sondaj.
Acest număr k de clase de valori se poate calcula cu una din formulele k < 5 log n, k = 1 + 3.322 log
n sau se folosesc recomandabil orientative de mai jos.
49
3001 – 4000 19
4001 – 5000 20
X max − X min
Lungimea unei clase de valori este = .
nr. clase de valori k
Centrul clasei de valori Ci , notat cu xi, este mijlocul clasei adică media aritmetică a valorilor
extremităţilor clasei Ci.
Centrul clasei xi aproximează toate valorile de sondaj în clasa Ci, fiind reprezentantul acestor valori.
Frecvenţa absolută ni a valorilor de sondaj într-o clasă de valori Ci este numărul datelor de sondaj
care cad în clasa respectivă, valori aproximate prin centrul clasei xi.
ni
Frecvenţa relativă (procentuală)fi a valorilor de sondaj într-o clasă de valori Ci este fi = .
n
Alături de frecvenţele precedente se pot folosi frecvenţele cumulate calculate astfel: Frecvenţele absolute
cumulate:
n*i = n1 + n2 + … + ni (1 < i < n)
Frecvenţele relative cumulate:
f*i = f1 + f2 + … + fi (1 < i < n)
Datele grupete se pot prezenta grafic prin histograme în raport cu sistemul de axe (Ci, ni), poligonul
frecvenţelor în raport cu sistemul de axe (xi, ni) şi respectiv cumulata în raport cu sistemul de axe
*
xi + ; ni .
2
Toate aceste operaţii de grupare, tabelare şi reprezentare grafică se pot face cu programul C1GRUP
sau cu EXCEL.
Pentru datele de sondaj grupate, indicatorii de sondaj de la punctele 5.2 I) – V) capătă forma:
I) Media de sondaj:
1 k k
X= n i x i = fi x i
n i =1 i =1
II) Mediana de sondaj:
50
cosespunzătoare ordonatei ni* = n /2
Spre deosebire de media X care dă tendinţa centrală a datelor de sondaj ,modul Mo dă tendinţa sa
principală ,numindu-se din acest motiv , valoare dominantă sau principală. Există date de sondaj cu mai
multe moduri(plurimodale).
Dacă datele de sondaj negrupate X1,…,Xn sunt depuse în celulele A1: An din
coloana în EXCEL şi cel puţin două din aceste valori sunt egale ,modul Mo este
dat de funcţia EXCEL scrisă în celula B10 : = MODE (A1:An ).
51
S=
1 k
n (X
i i − X )2
=
n k
f i (X i − X )
2
n − 1 i =1 n − 1 i =1
Datorită grupării în clase de valori şi a aproximării valorilor dintr-o clasă cu centrul clasei xi, S suferă
2
o eroare care se înlătură prin corecţia Sheppard S ' = S 2 − unde l este lungimea claselor de valori.
12
S
V) Coeficientul de variabilitate de sondaj: c = 100
X
3
1 k X −X 1 k
VI) Coeficientul de asimetrie de sondaj: A = ni i = niUi3
n i =1 S n i =1
n i =1 S n i =1
Acest coeficient evaluează deplasarea pe verticală a poligonului frecvenţelor faţă de graficul funcţiei
de repartiţie N( X , S) conform figurii :
52
Se numeşte structură de date cu k componente ansamblul de numere
f1,…,fk care îndeplinesc condiţiile :
0≤ fi ≤ 1 (1≤ i ≤ k ) şi f1 +…+ fk = 1
(f1,…,fk) se numeşte vectorul structurii .
Exemple
1)Frecvenţele relative f1,…,fk ale datelor de sondaj de volum mare,grupate în clasele de valori C1,…,Ck cu
centrele de clase x1,…,xk definesc structura sondajului pe clase de valori .
2) Fie k ramuri ale unei unităţi economice şi fie C1,…,Ck cheltuielile totale
(productive şi neproductive) anuale ale ramurilor.Cheltuielile totale anuale
ale întregii unităţi sunt C = C1+…+Ck
Numerele f1=C1/ C ,…,fk = C1/ C definesc structura de cheltuieli a unităţii pe ramuri .
In mod analog , fie V1,…,Vk veniturile totale anuale ale ramurilor şi fie
V = V1+…+Vk total anual al unităţii .
Numerele f1 = V1/ V ,…, fk = Vk/ V definesc structura de venituri a
unităţii pe ramuri .
Concentrarea unei structuri de date este tendinţa de creştere a ponderii
fi a unei componente în detrimentul celorlalte,inclusiv micşorarea numărului k de componente .
Concentrarea structurii este maximă dacă fi = 1 şi fj = 0 pentru j≠ i.
Diversificarea structurii de date este tendinţa de egalizare valorică a
ponderilor f1,…,fk ale celor k componente ale structurii, inclusiv prin mărirea numărului k de componente .
Diversificarea structurii este maximă dacă f1=…= fk = 1/k .
Media valorilor f1,…,fk este f‾ = 1/k iar abaterea-standard a valorilor
f1,…,fk este :
f 2
−1
S=
i
k −1
deoarece f i =1
53
k fi 2 − 1
S = k .S = [0;1]
k −1
este un indicator al concentrării structurii pe componente şi se poate exprima în procente.
Entropia structurii este dată de relaţia :
k
H =− f . og
i=1
i f
2 i
Valorile lui - f.log2f se pot lua din tabela 16 din secțiunea Tabele statistice .
Avem H=0 pentru concentrarea maximă şi H= log2 k pentru diversificarea maximă .
Entropia ajustată :
k
1
H = −
og 2 k i =1
fi . og 2 fi
B0 = g − B1 . f = =
k k fi 2 − 1
Dacă | R | =1 avem legătura funcţională liniară între
cele două structuri ,dată de relaţia : g = B0 + B1.f
Avem R=1 dacă B1>0 şi R=-1 dacă B1<0 .
Dacă R = 0 ,cele două structuri nu sunt corelate liniar .
Exemplu
Dacă (f1,…,fk) este structura de venituri sau cheltuieli a unei unităţi
economice în anul de bază şi (g1,…,gk ) este structura de venituri sau cheltuieli a aceleiaşi unităţi în anul
curent , R măsoară gradul de stabilitate a structurii în timp .
54
Dacă caracterul X are numai valori întregi, datele de sondaj de volum mare (n > 30) se pot grupa pe
valori distincte Xi cu frecvenţele absolute ni sau se poate alege un număr de clase k astfel ca lungimea l a
claselor să fie număr întreg deci şi limitele claselor să fie numere întregi.
Exemplu
Fie o populaţie statistică de plante de porumb la recoltare de pe 1 ha cu volumul populaţiei N =
75000 plante recoltabile. Pentru a studia greutatea boabelor pe plantă X în grame, efectuăm un sondaj
n 50
reprezentativ de n = 50 plante deci cota de reprezentare = = 1 : 1500 plante.
N 75000
Date de sondaj în grame:
50; 45; 40; 48; 47; 53; 49; 56; 58; 60; 42; 48; 49; 51; 54; 53; 46; 49; 48; 46; 55; 59; 52; 44; 48; 43;
49; 51; 50; 52; 44; 55; 43; 49; 47; 50; 54; 56; 59; 49; 48; 51; 50; 51; 47; 46; 42; 53; 51,50.
Să se grupeze datele în k = 5 clase de valori, să se reprezinte grafic histograma, poligonul
frecvenţelor, cumulata şi să se calculeze indicatorii statistici de la punctul I) – VII).
Soluţie
Numărul de clase este k = 5 , lungimea unei clase de valori este :
60 − 40
= = 4g .
5
Clase Centre clase Frecvenţe ni Frecvenţe n*i Frecvenţe Frecvenţe f*i
Xi fI
Sub 44 g 42 g 5 plante 5 plante 0.10 0.10
[44 – 48 g) 46 9 14 0.18 0.28
[48 – 52 g) 50 21 35 0.42 0.70
[52 – 56 g) 54 9 44 0.18 0.88
peste 56 g 58 6 50 0.12 1.00
Graficele sunt:
Histograma :
Poligonul frecvenţelor :
55
Cumulata :
I) Media de sondaj:
1
X = ( 5 40 + 9 46 + 21 50 + 9 54 + 6 58) = 50.16 g/plantă
50
II) Mediana de sondaj Me = 50 g
III) Modul de sondaj Mo = 50 g
IV) Abaterea standard de sondaj:
1
S= 5 ( 42 − 50.16 ) + 9 ( 46 − 50.16 ) + 21( 50 − 50.16 ) + 9 (54 − 50.16 ) + 6 (58 − 50.16 ) =
2 2 2 2 2
49
4
= 4.5 g/plantă. Corecţia Shepard: S ' = S 2 − = 4.46 g
12
4.5
V) Coeficientul de variabilitate de sondaj: C= = 9%
50.16
VI) Coeficientul de asimetrie de sondaj:
56
1
3 (
A= 5 42 − 50.16 ) + 9 ( 46 − 50.16 ) + 21( 50 − 50.16 ) + 9 (54 − 50.16 ) + 6 (58 − 50.16) ==0.008
3 3 3 3 3
50 4.5
VII) Coeficientul de boltire de sondaj:
1
4 (
B= 5 42 − 50.16 ) + 9 ( 46 − 50.16 ) + 21( 50 − 50.16 ) + 9 (54 − 50.16 ) + 6 (58 − 50.16) =2.41
4 4 4 4 4
50 4.5
VIII) Coeficientul de concentrare de sondaj:
5 ( 0.102 + 0.182 + 0.422 + 0.182 + 0.122 ) − 1
S = = 28.6 %
5 −1
Desigur indicatorii X , Me, S, c puteau fi calculaţi şi din cele n = 50 valori de sondaj înainte de
gruparea datelor.
Dacă X este însuşire calitativă (atributivă), facem convenţia:
1, Exemplarul i are însuşirea X
xi =
0, în rest
Efectuăm un sondaj de volum n deci datele de sondaj vor fi un număr de n cifre egale cu 0 sau cu 1.
În ANEXA 3 se găsețte tabela EXCEL cu titlul : 3.2 ANALIZA UNUI CARACTER INTR-O
POPULATIE (DATE GRUPATE).
57
Dacă însuşirea Y ia valori întregi, datele unui sondaj extras din populaţie la momentele de timp t1, t2,
…, tn sunt valori instantanee y1, …, yn măsurate în acele momente de timp.
Dacă însuşirea Y ia valori reale, datele unui sondaj extras din populaţie în intervalele de timp [t1, t2),
[t2, t3), …, [tn-1, tn] sunt valori medii y1, …, yn măsurate în acele intervale de timp cu lungimile t2-t1, t3-t2,
…, t n – t n – 1 .
Exemplu
Y = efectivul anual de vaci al unei ferme zootehnice se măsoară prin valori instantanee (la 31
decembrie al anului calendaristic).
Y = producţia anuală de lapte al vacilor dintr-o fermă zootehnică se măsoară prin valori medii pe
perioada 1 ianuarie – 31 decembrie a anului calendaristic sau pe perioada medie de lactaţie normală de 308
zile.
Măsurătorile sunt echidistante dacă t2–t1 = t3–t2 = … = tn-tn-1 şi neechidistante în caz contrar.
Exemplu de măsurători echidistante :
Producţia de lapte a vacilor se controlează echidistant din 28 în 28 zile astfel că într-o lactaţie
normală de 308 zile se efectuează 11 controale ale producţiei de lapte.
Prezentarea grafică a datelor de sondaj de evoluţie instantanee se face prin poligonul valorilor în
raport cu axele (ti, yi) iar a datelor de sondaj de evoluţie se face prin cronograma în raport cu axele ([ti, ti+1),
yi).
Indicatori statistici de sondaj de evoluţie
I) Media cronologică
Dacă Y se măsoară prin valori instantanee y1, …, yn la momentele de timp t1, …, tn avem:
y ( t − t ) + y2 ( t3 − t2 ) + ... + yn −1 ( tn − tn −1 )
(1) Y C = 1 2 1
tn − t1
Dacă Y se măsoară prin valori medii y1, …,yxn în intervalele de timp [t1, t2), [t2, t3), …, [tn-1, tn] avem:
y1 + y2 y +y y +y
( t2 − t1 ) + 2 3 ( t3 − t2 ) + ... + n−1 n ( tn − tn−1 )
(2) Y m = 2 2 2
tn − t1
În cazul măsurătorilor echidistante în timp, avem t2 - t1 = t3 – t2 =, …,= t n – t n – 1 = d şi t n – t1 = (n
– 1 ).d deci :
y1 + y2 + ... + yn −1
(3) Y C = respectiv:
n −1
y1 y
+ y2 + ... + yn −1 + n
(4) Y m = 2 2
n −1
(5) D =
( y2 − y1 )( t2 − t1 ) + ( y3 − y2 )( t3 − t2 ) + ... + ( yn − yn−1 )(tn − tn−1 )
tn − t1
58
Yn − Y1
(6) D =
n −1
Valorile aşteptate ale datelor de sondaj de evoluţie formează progresia aritmetică cu raţia D:
Y1, Y1 + D, …, Y1 + (n – 1)D
Aceste valori aşteptate Y1 + (i-1.D se apropie de cele observate Yj atunci când caracterul Y
evoluează numai crescător sau numai descrescător în timp şi abaterile valorice ale datelor de sondaj
consecutive D1 ,…,D n – 1 sunt toate pozitive sau toate negative şi apropiate între ele ca valoare
(caracterul Y evoluează liniar în timp).
In caz contrar se ajustează aceste abateri valorice D1,…,D n – 1 cu o funcţie de regresie neliniară în
raport cu timpul .
Pe durata a m perioade de timp, variaţia valorică a caracterului Y va fi
P
P = y1 + (m – 1)D –yy1 = (m – 1) D deci Y variază valoric cu cantitatea P. în m = + 1 perioade de timp.
D
Dacă notăm y1 + … + ym = Q avem:
m ( m − 1)
mY1 + D = Q de unde
2
D − 2Y1 + ( D − 2Y1 ) + 8DQ
m=
2D
adică numărul de perioade de timp în care se acumulează cantitatea finală Q a caracterului Y
respectiv în care se consumă cantitatea iniţială Q a caracterului Y.
(7) I = ...
2 3
y1 y2 yn −1
Dacă logaritmăm relaţia precedentă, obţinem:
(8) log I =
( logy2 − log y1 )( t2 − t1 ) + ... + ( logy n − log yn−1 )( tn − tn−1 )
tn − t1
deci logaritmul lui I este ritmul mediu valoric de evoluţie al valorilor de sondaj logaritmate.
Dacă măsurătorile sunt echidistante avem:
t2 - t1 = t3 – t2 = … = t n – t n – 1 = d iar tn – t1 = (n – 1).d deci avem :
log yn − log y1
log I = adică :
n −1
1
y n −1
(9) I = n
y1
Valorile aşteptate ale datelor de sondaj de evoluţie formează o progresie geometrică cu raţia I:
y1,y1.I, …, y1 .I n – 1
59
Aceste valori aşteptatey1.Ij se apropie de cele observate yj atunci când caracterul Y evoluează
numai crescător sau numai descrescător în timp şi abaterile procentuale ale datelor de sondaj
consecutive, notate cu I1,…,I n – 1 sunt toate supraunitare sau toate subunitare şi apropiate între ele ca
valoare (caracterul Y are o evoluţie exponenţială în timp ).
In caz contrar se ajustează aceste abateri procentuale I1,…,I n – 1 cu o funcţie de regresie
neliniară in raport cu timpul .
Pe durata a m perioade de timp variaţia procentuală a lui Y va fi
y I m−1 log P
P= 1 = I m−1 deci Y variază procentual cu valoarea P în m = + 1 perioade de timp.
y1 log I
Q
log ( I − 1) + 1
I m −1 y adică
Dacă notăm Y1 + … + Ym = Q avem: y1 = Q de unde m= 1
I −1 log I
numărul de perioade de timp în care se acumulează cantitatea finală Q a valorilor caracterului Y respectiv în
care se consumă cantitatea iniţială Q a valorilor caracterului X.
Fie diviziunile de timp echidistante t1,…,tn (cu t2 – t1 = t3 – t2 = … = tn – tn - 1 ).
În cazul măsurătorilor echidistante , indicatorii D şi I nu depind de y2,…, yn -1 , defect
care poate fi corectat prin metoda uniformizării înclinării dinţilor de ferăstrău ai seriei
cronologice y1,…, yn , după cum urmează :
a) Corecţia lui D
Avem diferenţele de ordin I : Di = xi+1 – xi .
Dacă diviziunile de timp echidistante au lungimea 1 adică : t2 – t1 = t3 – t2 = … = tn – tn - 1 =1 atunci Di
este înclinarea(panta) segmentului care uneşte punctele ( ti , yi ) şi (ti+1 , yi+1) cu ti+1 – ti = 1.
Dacă Di < 0 , avem xi > xi+1 deci pe tronsonul [ ti ; ti+1] caracterul Y are variaţie
descrescătoare.
Dacă Di = 0 , avem yi = yi+1 deci pe tronsonul [ ti ; ti+1] caracterul Y este staţionar.
Dacă Di > 0 , avem xi < xi+1 deci pe tronsonul [ ti ; ti+1] caracterul Y are variaţie
crescătoare.
Vom înlocui pe D cu ritmurile medii valorice (absolute) RV1 şi RV2 care urmează :
RV1 < 0 este media aritmetică a diferenţelor Di < 0 iar RV2 > 0 este media aritmetică
a diferenţelor Di > 0 .
Valorile lui y1,…, yn vor fi ajustate cu ajutorul lui RV1 şi RV2 astfel :
YV1 = x1
yi + RV1 dacă yi yi +1
YVi = yi dacă yi = yi +1 (1 i n-1)
y + RV dacă y y
i 2 i i +1
Variaţia pătratică totală a lui Y este :
SPAT = ( xi − Y )2 iar variaţia pătratică reziduală valorică a lui Y este :
SPAV = (yi – YVi )2 .
Dacă SPAV < SPAT , raportul de corelaţie valorică are forma :
RV = 1 − SPAV / SPAT [0;1]
Prognoza valorii necunoscute yn+1 se face cu valoarea :
60
yn + RV1 dacă ne aşteptăm ca Y să scadă.
YVn+1 = yn dacă ne aşteptăm ca Y să fie staţionar.
y + RV dacă ne aşteptăm ca Y să crească.
n 2
b) Corecţia lui I
Avem rapoartele de ordin I : Ri = yi+1 / yi .
Dacă diviziunile de timp echidistante au lungimea 1 adică : t2 – t1 = t3 – t2 = … = tn – tn - 1 =1 atunci Ri este
înclinarea(panta) segmentului care uneşte punctele ( ti , logyi ) şi
(ti+1 , logyi+1) cu ti+1 – ti = 1.
Dacă Ri < 1 , avem yi > yi+1 deci pe tronsonul [ ti ; ti+1] caracterul logy are variaţie
descrescătoare.
Dacă Ri = 1 , avem yi = yi+1 deci pe tronsonul [ ti ; ti+1] caracterul logy este staţionar.
Dacă Ri > 1, avem yi < yi+1 deci pe tronsonul [ ti ; ti+1] caracterul logy are variaţie
crescătoare.
Vom înlocui pe R cu ritmurile medii procentuale (relative) RP1 şi RP2 care urmează :
RP1 < 1 este media geometrică a rapoartelor Ri < 1 iar RP2 > 1 este media geometrică
a rapoartelor Ri > 1 .
Valorile lui y1,…, yn vor fi ajustate cu ajutorul lui RP1 şi RP2 astfel :
yP1 = y1
yi RP1 dacă yi yi +1
yPi = yi dacă yi = yi +1 (1 i n-1)
y RP dacă y y
i 2 i i +1
Variaţia pătratică totală a lui Y este :
SPAT = ( yi − Y )2 iar variaţia pătratică reziduală procentuală a lui Y este :
SPAP = (yi – yPi )2 .
Dacă SPAP < SPAT , raportul de corelaţie procentuală are forma :
RP = 1 − SPAP / SPAT [0;1]
Prognoza valorii necunoscute yn+1 se face cu valoarea :
yn RP1 dacă ne aşteptăm ca Y să scadă.
yPn+1 = yn dacă ne aşteptăm ca Y să fie staţionar.
y RP dacă ne aşteptăm ca Y să crească.
n 2
Exemplu
Fie X nivelul apei unui râu din România măsurat la miră (m) în n = 10 zile consecutive.
Măsurătorile şi calculele conform formulelor precedente figurează în tabelul următor:
61
5 7.0 0.4 6.9 0.1 1.06 6.90 0.10
6 7.2 0.2 7.3 - 0.1 1.03 7.30 - 0.10
7 7.2 0 7.3 - 0.1 1 7.30 - 0.10
8 6.9 - 0.3 7.0 - 0.1 0.96 7.00 - 0.10
9 6.8 - 0.1 6.7 0.1 0.99 6.70 0.10
10 6.6 - 0.2 6.6 0 0.97 6.60 0
68.2 RV1= - 0.2;RV2=0.3 RP1=0.971;RP2=1.045
Rezultate :
Ritmul mediu de scădere procentuală este RP1 = 0.971; Scăderea medie este RP1-1 =2.9 %
Ritmul mediu de creştere procentuală este RP2 = 1.045 ; Creşterea medie este RP2-1 =4.5 %
Prognoză valorică :
Y10 + RV1 =6.6-0.2=6.4m dacă ne aşteptăm ca Y să scadă.
YV11 = Y10 =6.6m dacă ne aşteptăm ca Y să fie staţionar.
Y + RV =6.6+0.3=6.9m dacă ne aşteptăm ca Y să crească.
10 2
Prognoză procentuală :
Y10 RP1 =6.6*0.971=6.41m dacă ne aşteptăm ca Y să scadă.
YP11 = Y10 =6.6m dacă ne aşteptăm ca Y să fie staţionar.
Y RP =6.6*1.045=6.89m dacă ne aşteptăm ca Y să crească.
10 2
62
Clasele după X, notate C1, …, Ch au centrele de clase x1, … xh iar clasele după Y, notate D1, …, Dk
au centrele de clase y1, …, yk.
Dacă nij este frecvenţa observată a perechilor (x, y) cu x Ci, y Dj, alcătuim tabela de
contingenţă h x k:
Y D1 Dk Sume
X linii
C1 n11 n1k s1
Ch nh1 nhk sh
Sume t1 …………………...tk n
coloane
Dacă însuşirile X, Y sunt independente, avem P(xCi şi yDj) = P(xCi) . (yDj) adică pij = qi .rj de
nqi rj
unde npij = .
n
Dar n.pij = n’ij şi n.qi = si; n.rj = tj deci frecvenţele aşteptate n’ij ale perechilor (x, y) cu x Ci şi y
si t j
Dj vor fi date de relaţia nij' = ; (i = 1, …, h; j = 1, …, k) şi se vor trece în tabela de contingenţă h x k în
n
dreapta lui nij în paranteze.
Verificăm ipoteza H : X, Y = independente faţă de alternativa H : X, Y = dependente.
Teoremă
h k (nij − nij' )2
=
2
este variabilă hi patrat cu (h – 1) (k – 1) GL.
i =1 j =1 nij'
De aici rezultă testul hi patrat de independenţă al însuşirilor X, Y într-o populaţie normală:
Comparăm pe χ2 din enunţul teoremei 7.8 cu 0.05 2
; 0.01
2
; 0.001
2
extrase din tabela 3 a Anexei,pe linia
a (h – 1) (k – 1) GL şi deci avem:
.
Dacă 2 0.05
2
se acceptă ipoteza H : X, Y = independente. În caz contrar respingem ipoteza H
după cum urmează:
a) Dacă 2 0.05
2
; 0.01
2
) , X, Y sunt dependente semnificativ;
b) Dacă 2 0.01
2
; 0.001
2
) , X, Y sunt dependente distinct semnificativ;
c) Dacă 2 0.001
2
, X, Y sunt dependente foarte semnificativ.
Dacă X este însuşire cantitativă şi Y este însuşire calitativă avem tabele de contingenţă hx2 iar
dacă X, Y sunt însuşiri calitative avem tabele de contingenţă 2x2.
Exemplul 1
Fie X = înălţimea la greabăn a viţeilor (cm) şi Y = greutatea viţeilor (kg). Se face un sondaj de n = 50
viţei şi perechile de date obţinute se clasifică după X, Y în h = k = 3 clase de valori obţinând tabela de
contingenţă 3x3:
63
Clase Y Viţei slabi Viţei mijlocii Viţei graşi Suma linie
Clase X
Viţei scunzi 20(12.5) 5(7.5) 0(5) 25
Viţei potriviţi 10(5) 10(6) 5(4) 20
Viţei înalţi 0(2.5) 0(1.5) 5(1) 5
Suma coloană 25 15 10 n = 50
Avem =2
+ + + + +
12.5 7.5 5 10 6
( 5 − 4 ) ( 0 − 2.5) ( 0 − 1.5) ( 5 − 1)
2 2 2 2
+ + + + = 35.8
4 2.5 1.5 1
Din tabela 3 a Anexei, pe linia cu (h – 1)(k – 1) = (3 – 1)(3 – 1) = 4 GL şi coloanele α = 0,05; 0,01;
0,001 găsim valorile critice: 0.05
2
= 9.49; 0.01
2
= 13.28; 0.001
2
= 18.50 .
Cum 2 = 35.8 0.001
2
rezultă că H se respinge deci X, Y sunt dependente foarte semnificativ.
Exemplul 2
Fie X = culoare ou găină; Y = greutate ou găină. Se efectuează un sondaj de n = 60 ouă care se
grupează în h = 2 clase X (ouă albe şi ouă bej) şi k = 3 clase Y obţinând tabela de contingenţă 2x3:
Clase X
Ouă albe 10(7.5) 15(15) 5(7.5) 30
Ouă bej 5(7.5) 15(15) 10(7.5) 30
Suma coloană 15 30 15 n = 60
=
2
+ + + + + = 3.33
7.5 15 7.5 7.5 15 7.5
Din tabela 3 a Anexei, pe linia cu (h – 1)(k – 1) = (2 – 1)(3 – 1) = 2 GL şi coloanele α = 0.05; 0.01;
0.001 avem valorile critice: 0,05
2
= 5.99; 0.01
2
= 9.21; 0.001
2
= 13.80
Cum 2 = 3.33 0.05
2
= 5.99 , ipoteza H se acceptă deci X, Y sunt independente.
Exemplul 3
Fie X = leucoza vacilor, Y = tratament pentru leucoză vaci, se face un sondaj într-o fermă cu n = 100
vaci, datele obţinute se clasifică după X, Y şi se obţine tabela de contingenţă 2x2:
64
Clase Y Vaci tratate Vaci netratate Sume linii
Clase X
Vaci vindecate 88(81) 2(9) 90
Vaci nevindecate 2(9) 8(1) 10
Suma coloană 90 10 n = 100
(88 − 81) ( 2 − 9) ( 2 − 9) (8 − 1)
2 2 2 2
=
2
+ + + = 60.5
81 9 9 1
Din tabela 3 a Anexei , pe linia a (h – 1)(k – 1) = (2 – 1)(2 – 1) = 1 GL şi coloanele α = 0.05; 0.01;
0.001 găsim valorile critice 0.05
2
= 3.84; 0.01
2
= 6.63; 0.001
2
= 10.80 ;
Cum 2 = 60.5 0.001
2
= 10.80 , H se respinge deci X, Y sunt dependente foarte semnificativ.
Calculele precedente se efectuează cu foaia EXCELcu numele 3.5 Testul Hi Patrat de independență
a două caractere , aflată în ANEXA 3.
65
CAPITOLUL 4 CORELAŢIA ŞI REGRESIA ÎNTRE CARACTERE
Măsura cantitativă a influenţei variaţiei unui factor controlat X asupra variaţiei factorului Y, se
numeşte corelaţie între X şi Y iar funcţia care stabileşte dependenţa cantitativă a lui Y şi X se numeşte
funcţie de regresie a lui Y după X.
Din populaţie se aleg n exemplare pe care se măsoară însuşirile cantitative X şi Y obţinând perechile
de date de sondaj (x1, y1), …, (xn, yn).
Se reprezintă grafic în raport cu axele Ox, Oy punctele de coordonate (x1, y1), …, (xn, yn) obţinând
un nor de puncte în planul Oxy. După forma acestui nor de puncte funcţia de regresie poate fi liniară
(rectilinie) sau neliniară (curbilinie). Norul de puncte se poate reprezenta grafic cu produsele informatice
EXCEL şi TCWIN.
S2X =
1
(Xi − X )2 ; S2Y = 1 (Yi − Y )2 ;
n −1 n −1
III) Abaterile standard de sondaj:
SX = S2X ; SY = S2Y ;
(Xi − X )(Yi − Y );
1
V) Covarianţa de sondaj: SXY =
n −1
Covarianţa de sondaj este o măsură a legăturii statistice a caracterelor X, Y fiind o medie a
produselor între abaterile valorilor de sondaj Xi faţă de X şi abaterile valorilor de sondaj Yi faţă de Y .
Calităţi:
1) Covarianţa SXY are o valoare mărginită fiind cuprinsă în intervalul [-SXSY; + SXSY].
Dacă SXY > 0; Xi, Yi cresc sau scad simultan iar dacă SXY < 0; când Xi cresc, Yi scad şi reciproc.
Dacă SXY = 0; Xi, Yi nu sunt corelate liniar.
2 2
Observăm că SXX = S X ; SYY = S Y .
Defecte:
66
2) Covarianţa SXY are unităţi de măsură egală cu produsul unităţilor de măsură ale lui X şi Y deci nu
permite comparaţii între perechile de caractere.
3) Covarianţa SXY este sensibilă la înmulţirea şi împărţirea datelor (secţiunea 7.2).
4) Covarianţa de sondaj SXY singură nu poate aprecia intensitatea legăturii statistice între caracterele
X, Y.
Uneori mai importante decât valorile Xi, Yi ale însuşirilor X, Y sunt rangurile lor în ordonarea după
mărime.
În cazul însuşirilor X, Y calitative se cunosc numai asemenea ranguri în clasificarea după un anumit
criteriu.
Notăm cu d diferenţa rangurilor a două însuşiri X, Y ale aceluiaşi exemplar, coeficientul de corelaţie
a rangurilor într-un sondaj de n perechi de ranguri, capătă forma:
6(d12 + ... + d n2 )
R = 1−
n(n2 − 1)
Privind perechea de caractere X, Y ca un vector Z = (X, Y), acesta are indicatorii de sondaj:
1) Vectorul – medie de sondaj: M(Z) = ( X , Y )
2) Matricea de covarianţă de sondaj:
S2X SXY
C( Z) =
S 2
YX SY
3) Matricea de corelaţie liniară de sondaj:
1 R
L( Z ) =
R 1
VII) Coeficienţii de regresie liniară de sondaj:
SXY
daca regresia este cu termen liber (B0 0)
B1 = S2X
X Y / X daca regresia este fara termen liber (B = 0)
i i i 0
Y − B1 X daca regresia este cu termen liber (B0 0)
B0 =
0 daca regresia este fara termen liber (B0 = 0)
67
B1= R.(SY/SX)
Calităţi
1) Coeficienţii B0, B1 au valori mărginite:
Sy Sy Sy Sy
B1 − ; ; B0 Y − X; Y + X
SX SX SX SX
Defecte
2) B0 şi B1 au unităţi de măsură deci nu permit comparaţii între perechi de caractere;
3) B0 este sensibil la codificarea datelor iar B1 la înmulţirea şi împărţirea datelor;
4) Prognoza valorilor Y făcută pe baza dreptei de regresie Y = B0 + B1X este aproximativă.
Exemplu
68
Populaţia este formată din N = 100 viţei din care extragem un sondaj de
n = 10 viţei, pe care măsurăm înălţimea la greabăn şi greutatea, obţinând datele de sondaj:
xi 70 68 71 72 69 66 70 67 71 72
yi 55 54 56 60 54 50 56 53 56 58
Calcule:
Mediile: MX= X =
xi = 696 = 69.6 cm
n 10
MY= Y =
i = 552 = 55.2 kg
y
n 10
Abaterile – standard:
( x )
2
i −X 38.40
SX = = = 4.27 = 2.07 cm
n −1 10 − 1
( y )
2
i −Y 67.60
SY = = = 7.51 = 2.74 kg
n −1 10 − 1
Coeficienţii de variabilitate:
2.07 2.74
CX = 100 = 3% ; CY = 100 = 5%
69.6 55.2
Covarianţa S XY =
( x
i −X )( y − Y ) = 47.80 = 5.31 cm x kg
i
n −1 10 − 1
S XY 5.31
R= = = 0.938
S X SY 2.07 2.74
69
Deoarece R = 0.936 > R0.001 = 0.872 corelaţia liniară între X, Y pentru toţi viţeii din care provin
cei 10, este foarte semnificativă aşa că R= 0.936***
AX = R2 = 88%; AE = 1 – Ax = 12%
AE = 12%
Ax = 88%
Concluzie: 88% din variaţia lui Y este datorată variaţiei lui X, restul de 12% se datoreşte variaţiei
altor factori necontrolaţi numiţi Eroare.
Pentru coeficientul de corelaţie liniară necunoscut ρ între X, Y în populaţie, avem intervalele de
încredere:
[0.801; 0.982] cu încrederea de 95%;
[0.688; 0.989] cu încrederea de 99%;
[0.504; 0.994] cu încrederea de 99.9%.
Intervalul cel mai mic [0.801; 0.982] cu încrederea de 95% are următoarea interpretare:
Coeficientul de corelaţie necunoscut ρ între talia şi greutatea tuturor viţeilor din care fac parte cei 10
ai sondajului, este cuprins între 0.801 şi 0.982 cu o încredere de 95%.
Există semiriscul 2.5% ca acest coeficient ρ să fie mai mic ca 0.801 atunci când sondajul extras din
populaţie a fost intens corelat liniar (în sondaj sunt viţei scunzi şi slabi respectiv viţei înalţi şi graşi).
În mod analog există semiriscul 2.5% ca, coeficientul ρ să fie mai mare ca 0.982 atunci când
sondajul extras din populaţie a fost slab corelat liniar (în sondaj sunt viţei de toate categoriile: scunzi şi
slabi, scunzi şi graşi, înalţi şi slabi, înalţi şi graşi).
Ipoteza H : ρ = 0.9 se acceptă deoarece ρ = 0.9 [0.801; 0.911].
B1 =
x y
i 38467 0.793 kg crestere greutate
i
==
x 2
i48480 1 cm crestere talie
B0 = 0 kg (regresie fără termen liber).
Ţinând cont de relaţia : 1= .(Y/X) intervalul cel mai mic [0.676; 0.911] cu încrederea de 95%
are următoarea interpretare:
Coeficientul de regresie liniară necunoscut β1 între X şi Y în populaţia din care provine sondajul este
cuprins între 0.676 şi 0.911 cu încrederea de 95%.
70
Există semiriscul 2.5% ca acest coeficient β1 să fie mai mic de 0.676 atunci când sondajul extras din
populaţie a fost intens corelat liniar sau variabilitatea caracterului Y raportată la variabilitatea caracterului X
este relativ mare în populaţie.
În mod analog există semiriscul 2.5% ca acest coeficient β1 să fie mai mare ca 0.911 atunci când
sondajul extras din populaţie a fost slab corelat liniar sau variabilitatea caracterului Y raportată la
variabilitatea caracterului X este relativ mică în populaţie.
Ipoteza H : β1 = 0.7 se acceptă deoarece β1 = 0.7 [0.676; 0.911].
( n − 1) (1 − R 2 )
Relaţia: = SY t / 2;( n −2)GL
2 n ( n − 2)
(10 − 1) (1 − 0.9382 )
devine: = 2.74 2.31 = 0.736
2 10 (10 − 2 )
Ecuaţia dreptei de regresie cu fâşia de încredere Y = B0 + B1 X devine Y = 0.793X + 0.736.
2
Cu ajutorul acestei ecuaţii se pot face prognoze cu asigurarea de 95% astfel:
Pentru X = 75 cm avem valorile aşteptate:
60.211 kg (Maxima)
Ya = 0.793 x 75 + 0.736 = 59.475 kg (Media)
59.739 kg (Minima)
Pentru talia viţeilor Xa = 75 cm ,ne aşteptăm ca greutatea viţeilor din care provine sondajul să fie
cuprins între [58.739 kg; 60.211 kg] cu o încredere de 95%.
Există semiriscul 2.5% ca această greutate să fie sub 58.739 kg atunci când sondajul a fost ales
performant ca greutate.
În mod analog există semiriscul 2.5% ca această greutate să fie peste 60.211 kg atunci când sondajul
a fost ales neperformant ca greutate.
X a = 75 cm
Ipoteza H : se acceptă deoarece Ya = 60 kg [58.739; 60.211].
a
Y = 60 kg
Valorile aşteptate Ya ale lui Y se calculează cu relaţia Ya = 0.793X iar valorile corectate Yc ale Y
sunt date de relaţia:
Yc = Y + (Y − Ya )
Avem tabelul:
71
Foaia EXCEL intitulată 4.1 CORELAȚIA ȘI REGRESIA LINIARĂ MONOFACTORIALĂ care face
aceste calcule se găsește în ANEXA 4.
XT.X.B=XT.Y
Dacă matricea simetrică XT.X de ordin m+1 este nesingulară (det(XT.X)0), sistemul de ecuaţii
normale are soluţie unică scrisă matricial:
B=(XT.X)-1.XT.Y
72
Rc2 m
Fp = : (4)
1 − Rc n − m − 1
2
În cazul regresiei polinomiale fără termen liber (B0=0) ecuaţiile normale au forma:
Avem un sistem liniar de m ecuaţii cu m necunoscute B1,.........., Bm, deci numărul parametrilor
de regresie este d= m.
Cu d= m raportul Fisher capătă forma:
R2 m −1
Fp = c 2 :
1 − Rc n − m
cu (m-1;n-m)GL
Exemplu:
xi yi yai yi
0 15 15.28 -0.28
30 17 16.80 0.20
60 20 19.23 0.77
90 22 22.32 -0.32
120 25 25.80 -0.80
150 29 29.40 -0.40
73
180 34 32.88 1.12
210 36 35.97 0.03
240 38 38.40 -0.40
270 40 39.92 0.08
Variaţia totală este SPAY=742.4, iar variaţia reziduală este SPAY.X=3.025 aşa că raportul de corelaţie
SPAY . X
va fi : Rc= 1 − =0.99796.
SPAY
Raportul Fisher Fp are forma (4) (regresia este cu termen liber) şi pentru n=10; m=3 capătă
valoarea Fp=488.7 cu (3;6) GL.
Valorile critice Fisher din tabelele 4,5,6 din Anexă, cu (3;6) GL sunt: F0.05=4.76; F0.01=9.78;
F0.001=23.70.
Cum Fp=488.7 F0.001=23.70, corelaţia polinomială în populaţia din care provine sondajul este foarte
semnificativă.
Cel mai des se întâlnesc corelația și regresia polinomială monofactorială de grad 2
(pătratică) și cea de grad 3(cubică) după cum arată foile EXCEL care urmează.
NOTE
1) În cazul tabelelor din Anexa 1 , selectând cele 23 valori din coloana A , cu opțiunile succesive
Insert , Line ,Trendline ,Polynomial , Order 6 ,Display equation on chart,Display R-squared
Value on chart , Close obținem funcția polinomială de grad 6 și valoarea coeficientului de
regresie polinomială R2 , pe care le mutăm din diagramă sub diagramă .
3) În cazul diagramelor din Anexa 1 avem n=23 și luăm m=6 deci relația (4) de mai sus devine :
F =( 6*R2 ) / (16*(1- R2)) cu (6 ; 16) GL .
Din tabelele Fisher 4-6 pentru (6 ; 16) GL avem valorile critice F0.05=2.74; F0.01=4.20 ;
F0.001=6.81.Pentru aceste valori critice ale lui F rezultî valorile critice ale lui R2 :
R2 0.05=0.880 , R2 0.01=0.918 ; R2 0.001=0.941.
Dacă R2 depășește aceste trei valori critice ,trendul polinomial există.
În caz contrar apelăm la regresia trigonometrică după cum arată diagramele 4.4A-4.4E din
Anexa 4.
74
4.2.2 Corelaţia şi regresia trigonometrică monofactorială
în care avem 2k+1 parametri de regresie necunoscuţi T0, S1, C1,...., Sk,Ck.
Sistemul cu d= k+1 ecuaţii normale cu necunoscutele Y0, S1, C1,......., Sk,Ck dă aceste valori
astfel:
T0= MY
2 n 2 n
S1= yi sin xi ; C1= yi cos xi
n i =1 n i =1
...................................................……
2 n 2 n
Sk= i
n i =1
y sin kxi ; C k = yi cos kxi
n i =1
Foaia EXCEL, intitulată :4.4A EVOLUȚIA PRODUCȚIEI DE GRÂU (KG/HA) care face aceste calcule
, se găsește în ANEXA 4.
Foaia EXCEL intitulată :4,4B EVOLUȚIA PRODUCȚIEI DE PORUMB (KG/HA) care face aceste
calcule se găsește în ANEXA 4.
Foaia EXCEL intitulată : 4.4C EVOLUȚIA PRODUCȚIEI DE FLOAREA SOARELUI (KG/HA) care
face aceste calcule , se găsește în ANEXA 4
75
Foaia EXCEL intitulată : 4,4D EVOLUȚIA PRODUCȚIEI DE SOIA (KG/HA) care face aceste calcule
se găsește în ANEXA 4.
Foaia EXCEL intitulată : 4.4E EVOLUȚIA PRODUCȚIEI DE SFECLĂ DE ZAHĂR (KG/HA) care
face aceste calcule , se găsește în ANEXA 4.
Foaia EXCEL , intitulată : 4.4F EVOLUȚIA PRODUCȚIEI DE CARTOFI (KG/HA) care face aceste
calcule ,se găsește în ANEXA 4 .
Din examinarea acestor șase foi EXCEL prin corelația și regresia trigonometrică,se observă
caracterul ciclic al producțiilor vegetale principale (kg/ha) datorat în principal evoluției ciclice
favorabile sau defavorabile a factorilor climatici(în special precipitațiile).
Fie X, Y, Z trei caractere ale exemplarelor unei populaţii. Efectuăm un sondaj de n exemplare din
populaţie şi obţinem triplete de valori (xi,yi,zi) (i=1,…,n).
Reprezentând în spaţiul R3 faţă de sistemul de axe 0xzy cele n triplete se vor corespunde cu n puncte
în spaţiu care vor forma un nor. După forma acestui nor, funcţia de regresie va fi liniară (norul are formă
turtită ca o scoică) sau neliniară (norul are altă formă decât în cazul liniar).
Din datele de sondaj (xi,yi,zi) (i=1,…,n) calculăm următorii indicatori statistici de sondaj:
a) ( ) 1 1
Vectorul mediilor: X ,Y , Z unde: X = MX = xi , Y = MY = yi , Z = MZ = zi
n n
1
n
S X SXY SXZ
2
b) Matricea simetrică de covarianţă: S = SYX SY2 SYZ
SZX SZY S2Z
1
( ) 1
( ) 1
zi − Z ( )
2
unde varianţele sunt: S2X = xi − X ; SY2 = yi − Y ; S2Z =
n-1 n-1 n-1
iar covarianţele sunt:
S2XY =
1
n-1
( )( )
xi − X yi − Y ; S2XZ =
1
n-1
xi − X( )( z − Z ); S
i
2
YZ =
1
n-1
(
yi − Y )( z − Z );
i
1 RXY RXZ
T = RYX 1 RYZ
R 1
ZX RZY
S S S
unde RXY = XY -1;1 ; R XZ = XZ -1;1 ; R YZ = YZ -1;1
SX SY SX SZ SY SZ
Funcţia de regresie liniară multiplă are forma: Z = B0 + B1 X + B2Y unde coeficienţii de regresie liniară
multiplă B0, B1, B2 sunt daţi de:
Teorema 1
76
1) Planul de regresie Z = B0 + B1 X + B2Y are coeficienţii B1, B2 ca soluţii ale sistemului liniar:
B1S2X + B2S XY = S XZ
iar B0 = Z − B1 X − B2 Y
B1S XY +B2SY = SYZ
2
Dacă regresia este fără termen liber (B0=0) B1 şi B2 sunt soluţiile sistemului liniar:
B1 xi + B2 xi yi = xi zi
2
B1 xi yi + B2 yi = yi zi
2
( n − 1) (1 − RZ2. XY )
2) Lăţimea fâşiei de încredere este = SZ t ; (n −3)GL unde RZ . XY este definit în
2 n ( n − 3) 2
teorema anterioară.
z P+
P -
z P
y
0
y
x
x
P + : Z = B0 +B1X+B2 Y+
2
Teorema 2
77
A ( X,Y ) = RZ2. XY ;
A X = A( X,Y ) − A( Y ) = RZ2. XY − RZY
2
;
A Y = A( X,Y ) − A( X ) − = RZ2. XY − RZX
2
;
A XY = A ( X,Y ) − A X − A Y = RZX
2
+ RZY
2
− RZ2. XY ;
A E = 1 − A ( X,Y ) = 1 − RZ2. XY
RZ2. XY 2
3) F( X,Y ) = : este variabilă Fisher cu [2; n-3] GL
1 − RZ . XY n − 3
2
RZX .Y RZY . X
tX = n − 2 şi tY = n − 2 sunt variabile Student cu n-2 GL.
1 − RZX
2
.Y 1 − R 2
ZY . X
Între coeficienţii de corelaţie parţiali şi coeficienţii de regresie liniară multiplă există relaţiile:
S S
B1 = RZX .Y Z .Y ; B2 = RZY . X Z . X
SX .Y SY . X
care generalizează relaţia de la corelaţia liniară simplă între X şi Y:
S
B1 = R Y .
SX
Ecuaţia planului de regresie se poate scrie şi sub forma: ( ) (
Z − Z = B1 X − X + B2 Y − Y . )
În continuare vom aborda testele pentru corelaţia liniară multiplă în populaţie.
1) Coeficientul de corelaţie liniară multiplă total de sondaj RZ.XY este variabil de la un sondaj la altul
în jurul coeficientului de corelaţie total necunoscut ρZ.XY din populaţie.
Testul ipotezei H: ρZ.XY=0 faţă de alternativa H : Z . XY 0 se face pe baza teoremei 10.2 punctul 3) astfel:
RZ2. XY 2
Calculăm F( X,Y ) = : cu (2; n-3) GL. Din tabelele 4,5,6 din Anexă, pentru (2; n-3) GL extragem
1 − RZ . XY n − 3
2
valorile critice F0.05; F0.01; F0.001. Decizia asupra ipotezei H se ia astfel: dacă F(X,Y) < F0.05 ipoteza H se
acceptă: ρZ.XY =0 deci Z şi perechea (X,Y) nu sunt corelate liniar în populaţie. În caz contrar avem
cazurile:
a) F0.05 ≤ F(X,Y) < F0.001 deci Z şi (X,Y) sunt corelate liniar semnificativ.
b) F0.01 ≤ F(X,Y) < F0.001 deci Z şi (X,Y) sunt corelate liniar distinct semnificativ.
c) F(X,Y) ≤ F0.001 deci Z şi (X,Y) sunt corelate liniar foarte semnificativ.
2) Coeficienţii de corelaţie liniară multiplă parţiali de sondaj RZX.Y şi RZY.X sunt variabili de la un
sondaj la altul în jurul coeficienţilor de corelaţie parţiali necunoscuţi ρZX.Y şi respectiv ρZY.X din populaţie.
Testul ipotezei H: ρZX.Y=0 faţă de alternativa H : ZX .Y 0 se face pe baza teoremei 10.2 punctul 3) astfel:
RZX .Y
se calculează tX = n − 3 cu n-3 GL. Din tabela 2 din Anexă, pentru n-3 GL extragem valorile
1 − RZX2
.Y
78
Decizia asupra ipotezei H se ia astfel: dacă tX < t0.025 , ipoteza H se acceptă: ρZX.Y=0 deci Z şi X nu sunt
corelate liniar în populaţie pentru Y=constant.
În caz contrar avem cazurile:
a) t0.025 ≤ tX < t0.0025 deci Z şi X sunt corelate liniar semnificativ când Y=constant
b) t0.0025 ≤ tX < t0.0005 deci Z şi X sunt corelate liniar dinstinct semnificativ când Y=constant
c) tX ≥ t0.0005 deci Z şi X sunt corelate liniar foarte semnificativ când Y=constant
Exemplu
xi 142 141 142 143 146 140 142 143 142 144
yi 3.8 3.3 4 4.1 4.4 3 3.9 4 3.7 4.2
zi 110 109 112 114 118 106 111 112 110 115
Soluţie
(
1)Vectorul mediilor este X = 142.5 cm; Y = 3.84 cm; Z = 111.7 Kg )
S2X = 2.722 S XY = 0.622 S XZ = 5.389
Matricea de covarianţă este: S = SYX = 0.622 SY2 = 0.176 SYZ = 1.324
SZX = 5.389 SZY = 1.324 S2Z = 11.344
1 RXY = 0.8989 RXZ = 0.9697
Matricea de corelaţie liniară: T = RYX = 0.8989 1 RYZ = 0.9373
R = 0.9697 R = 0.9373
ZX ZY 1
2
RZX + RZY
2
− 2 RZX RZY RXY
2)Coeficientul de corelaţie multiplă total: RZ . XY = devine RZ . XY = 0.9812
1 − RXY
2
RZ2. XY 2
F( X,Y ) = : devine F( X,Y) = 90.47 cu (2 ; 7) GL
1 − RZ . XY n − 3
2
Din tabelele 4,5,6 din Anexă, avem F0.05 = 4.74; F0.01 = 9.55; F0.001.= 21.69 pentru (2 ; 7) GL.
79
Avem F(X,Y) = 90.47 > F0.001 = 21.69 deci corelaţia liniară multiplă între greutatea în viu a porcilor şi
perechea de factori formată din lungimea carcasei şi grosimea stratului de grăsime la greabăn, este foarte
semnificativă deci RZ . XY = 0.9812***
.
Coeficienţii de corelaţie multiplă parţiali:
RZX − RZY RXY
RZX .Y = devine R ZX .Y = 0.8328
(1 − RZY )(1 − RXY )
2 2
RZY . X
tY = n − 3 devine tY = 1.26 cu 7 GL.
1 − RZY2
.X
Din tabela 2 din Anexă,pentru 7 GL găsim: t0.025 = 2.36; t0.005 = 3.50; t0.0005.= 5.41
Cum t0.005 = 3.50 < tX < t0.005 = 5.41 corelaţia liniară parţială între greutatea în viu a porcilor şi lungimea
carcasei când grosimea stratului de grăsime este constantă, este distinct semnificativă deci RZX .Y = 0.8328**
Cum tY < t0.025 = 2.36, corelaţia liniară între greutatea în viu a porcilor şi grosimea stratului de grăsime când
lungimea carcasei este constantă, este nesemnificativă deci RZY . X = 0.4297
Aporturi:
A( X,Y ) = RZ2. XY = 0.982 = 96.3%
A X = RZ2. XY − RZY
2
= 8.4%
A Y = RZ2. XY − RZX
2
= 2.2%
A XY = A ( X,Y ) − A X − A Y = 85.7%
A E = 1 − A ( X,Y ) = 3.7%
Variaţia totală a greutăţii în viu a porcilor fiind considerată 100%, 8.4% din ea se datoreşte variaţiei
lungimii carcasei, 2.2% din ea se datoreşte variaţiei grosimii stratului de grăsime, 85.7% din ea se datoreşte
variaţiei interacţiunii între lungimea carcasei şi grosimea stratului de grăsime iar restul de 3.7% se datoreşte
variaţiei altor factori necontrolaţi numiţi Eroare care au fost relativ constanţi pentru cele 10 exemplare din
sondaj.
3)Planul de regresie: Z = B1 X + B2Y
(regesia este fără termen liber :B0=0)
B1 şi B2 sunt soluţiile sistemului liniar :
B1 xi + B2 xi yi = xi zi
203087 B1 + 5477.6 B2 = 159221
2
adică de unde:
B1 x i yi +B2 yi
2
= yi zi 5477.6 B1 +149.04 B2 = 4301.2
0.6441 Kg creştere greutate porc
B1 = când grosimea stratului de grăsime este constantă.
1 cm creştere lungime carcasă
5.1858 Kg creştere greutate porc
B2 = când lungimea carcasei este constantă
1 cm creştere lungime carcasă
80
( n − 1) (1 − RZ2. XY )
Lăţimea fâşiei de încredere este: = SZ t ; (n −3)GL
2 n ( n − 3) 2
Pentru = 5% din tabela 2 din Anexă, avem t0.005 = 2.36 pentru 7 GL aşa că 2.5% = 0.55 Kg.
Planul de regresie cu fâşia de încredere va fi: Z = 0.6441X + 5.1858Y 0.55 .
Foaia EXCEL intitulată 4.5 CORELAȚIA ȘI REGRESIA LINIARĂ BIFACTORIALĂ care face aceste
calcule , se găsește în ANEXA 4.
81
CAPITOLUL 5 ANALIZA VARIANŢEI
În populaţia statistică luăm ca obiect de studiu un caracter măsurabil Y faţă de care exemplarele
populaţiei au media .
Fie un alt caracter X asociat cu exemplarele populaţiei, caracterul X având m variante (doze, nivele,
tratamente) notate X(1) ,..........X(m).
Caracterul X se numeşte factor şi constituie un criteriu de clasificare a populaţiei în m
subpopulaţii (straturi ) ce corespund variantelor X(1) ,..........X(m), mediile pe subpopulaţii relativ la
caracterul Y fiind (1) ,.......... (m).
Diferenţele x(i)=(i)- se numesc efecte principale ale lui X în subpopulaţii.
m
Avem
i =1
x (i)= 0
Subpopulaţiile se presupun normale cu mediile (1) ,.......... (m) şi aceeaşi varianţă σ2(E) în
raport cu caracterul Y.
Extragem în mod întâmplător din subpopulaţii, m sondaje (probe, eşantioane) de volume p(1) ,..........
p(m).
m
Volumul de sondaj total este pT = p( j ) .
j =1
Datele relative la Y, din aceste sondaje le numim repetiţii (replicate) şi le notăm cu Y(i,j) (i=1,.......,
m; j=1,.........., p(i)).
Forma generală a modelului liniar este:
Y(i, j)= +x (i)+e(i, j)
unde e(i, j) sunt variabilele aleatoare normale, independente câte două, cu media zero şi varianţa σ2(E).
Orice variantă X(i) a lui X trebuie să modifice pe (i) nu şi pe σ.
Această condiţie se verifică prin ipoteza H: σ (1)2=..........= σ (m)2 faţă de
alternativa Ĥ: σ (1)2≠.........≠ σ (m)2 cu ajutorul testului Bartlett:
1 p (i )
Fie mediile de sondaj în cadrul variantelor MY (i ) = Y (i, j ) şi varianţele de sondaj în
p(i ) j =1
cadrul variantelor:
1 p (i )
SY(i) =2
[Y (i, j ) − MY (i)] 2
p(i) − 1 j =1
(1 i m)
m
1
Varianţa erorii este: S 2 E=
pT − m i=1
( p(i) − 1) SY (i) 2
Fie:
m
1 1 1
C=1+ [ − ]
3(m − 1) i =1 p(i ) − 1 m
( p(i) − 1)
i =1
Marimea:
82
m
1
2 B = [ ( p(i ) − 1) ln S2E- ( p(i) − 1) SY(i)2]
C i =1
Exemplu
X=proteină digestivă (PD) în raţia vacilor cu lapte ; Y=producţia lunară de lapte (litri) într-o anumită
lună a ciclului de lactaţie .
Luăm m=3 variante ale factorului X:
X1(1100g/zi) (doza-martor); X2(1200g/zi); X3(1300g/zi).
Aceste variante le aplicăm la câte p=4 repetiţii ale factorului Y.
Avem tabelul cu date:
Repet.Y → Y(i,j) Mediile pe variante Media totală
Variante X ↓
X1 300;314;306;308 MY(1)=307
X2 330;338;342;350 MY(2)=340 MYT=338
X3 366;362;370;370 MY(3)=367
83
Avem Q Q0.05, deci se acceptă ipoteza H: σ (1)2= σ (2)2= σ (3)2
Etape de calcul:
a) SPA şi GL:
m p
SPAT= [Y(i,j)-MYT]2 =7576 cu GLT=mp-1=11GL
i =1 j =1
m
SPAX=p [MY(i,j)-MYT]2=7224 cu GLX=m-1=2GL
i =1
SPAE=SPAT-SPAX=352 cu GLE=11-2=9GL
b) S2:
SPAX 7576 SPAE 352
S2X= = = 3612 ;S2E= = = 39.11
GLX 2 GLE 9
c) F:
3612
FX= S2X /S2E = = 92.35 cu (2;9) GL
39.11
Din tabelele Fisher 4,5,6 din Anexă, găsim valorile critice pentru (2;9) GL : F0.05=4.26; F0.01=8.02;
F0.001=16.39.
Cum FX F0.001 se acceptă ipoteza Ĥ adică (1), (2), (3), diferă foarte semnificativ între ele adică
influenţa variaţiei factorului X asupra variaţiei factorului Y este foarte semnificativă aşa că F=92.35***.
Tabelul sintetic de analiză a variaţiei este:
Sursă de Variaţii Grade de Variante(S2) Rapoarte
variaţie Pătratice(SPA) libertate(GL) Fisher(F)
X 7224 2 3612 92.35***
E 336 9 39.11 -
T 7560 11 - -
Testul Tukey
Diferenţe de medii
307 340 367
367 60** 27** -
340 33** - -
307 - - -
Din tabelele Tukey 7,8 din Anexă,pentru m=3 medii şi GLE=9 găsim T0.05=3.95; T0.01=5.43 aşa că
avem amplitudinile aşteptate:
A0.05= 39.11 / 4 X3.95=12.35
A0.01= 39.11 / 4 X5.43=16.98
84
Cele trei diferenţe din tabelul precedent depăşesc pe A0.01, deci sunt distinct semnificative adică (1),
(2), (3), diferă distinct semnificativ dauă câte două.
Aportul variaţiei lui X la variaţia lui Y egală cu 100%,este AX=IC2=95.5%.
Aportul variaţiei erorii la variaţia lui Y este AE=1-AX=4.5%
Foaia EXCEL cu numele : 5.1 ANALIZA VARIANŢEI MONOFACTORIALĂ care face aceste
calcule se găsește în ANEXA 5.
Există cazuri când pentru caracterul Y avem observaţii multiple deci datele de sondaj au forma:
xi yij yi
x1 y11 _________y1p y1
x2 y21 _________y2p
y2
. .
. .
. .
xn yn1 _________ynp yn
În acest caz se poate face corelaţia şi regresia liniară între valorile xi şi mediile y i şi pe de altă parte
se poate face analiza varianţei monofactorilaă balansată între valorile xi şi valorile yij.
Variaţia totală a valorilor Y este:
( )
n p
SPAY = yij − Y cu np – 1 GL
i =1 j =1
( )
n
SPAR = p B0 + B1 X i − Y
2
cu 1 GL
i =1
Variaţia abaterilor de la regresie este:
n
SPAA = p ( yi − B0 − B1 xi )
2
cu n – 2 GL
i =1
Variaţia intraclase (datorată erorii) este:
( )2 cu n(p-1) GL
n p
SPA E = y ij − y i
i =1 j =1
Se verifică prin calcul relaţia:
(6) SPAY = SPAR + SPAA + SPAE
85
n
SPAX = SPAR + SPAA = p (y i − y ) cu 1 + (n – 2) = n-1 GL
i =1
Variaţia reziduală a regresiei între X şi Y este:
(yij − B0 − B1x i )
n p
2
SPAY.X = SPAA + SPAE = cu (n - 1) + n(p - 1)
i =1 j =1
= (np-2) GL
Coeficientul de corelaţie liniară R între valorile xi şi y i se calculează cu formula (2) din teorema din
secțiunea 4.1 astfel:
SPAY X SPAR
R = 1− = (1)
SPAY SPAY
SPAE SPAX
Ic = 1 − = (2)
SPAY SPAY
Rezultă de aici:
SPAR = R2 . SPAY cu 1 GL
SPAY.X = (1 – R2) . SPAY cu np – 2 GL
respectiv:
SPAX =Ic2 . SPAY cu n – 1 GL
SPAE = (1 – Ic2) . SPAY cu n(p – 1) GL
De asemenea:
SPAA = (Ic2 – R2) . SPAY cu n – 2 GL
Prin împărţire cu SPAY, relaţia (6) devine:
1 = R2 + (Ic2 – R2) + (1 – Ic2) (3)
Din relaţia SPAA = (Ic – R ) SPAY rezultă: 0 <
2 2 .
R < Ic (4)
Teoremă
86
a) Ipoteza HX : η = 0 faţă de alternativa H X : η 0 se testează prin analiza variaţiei (secțiunea
5.1) cu ajutorul raportului Fisher:
S2 n −1 I2 n −1
FX = X2 : = c 2: cu [n – 1; n(p – 1)] GL
S E n( p − 1) 1 − I c n( p − 1)
R
De aici rezultă că tR = FR = np − 2
1 − R2
S A2 n−2 I c2 − R 2 n−2
FA = 2 : = : cu [n – 2; n(p – 1)] GL
S E n( p − 1) 1 − I c n( p − 1)
2
(n − 1)(1 − R 2 )
= SY t /2;( n−2)GL
2 n(n − 2)
Exemplu
Fie X = proteina digestibilă (kg) în raţia vacilor de lapte; Y = producţia lunară de lapte (hectolitri).
Avem n = 8 variante de proteină digestibilă aplicate la câte p = 3 vaci cu lapte. Date de sondaj:
Xi Yij Yi Y ai Y i
1 4.5; 4.5; 4.8 4.6 5.361 -0.761
1.05 5; 5; 5.3 5.1 5.629 -0.529
1.10 5.4; 5.3; 5.5 5.4 5.897 -0.497
1.15 6; 5.9; 6.1 6.0 6.165 -0.165
1.20 6.3; 6.3; 6.6 6.4 6.433 -0.033
1.25 6.9; 7; 7.1 7.0 6.701 0.299
1.30 7.5; 7.4; 7.6 7.5 6.969 0.531
1.35 7.9; 8.1; 8 8.0 7.237 0.763
87
Regresia este fără termen liber (B0=0 pentru X=0) deci B1 =
X Y i i
=
59.775
= 5.361 .
X i
2
11.15
Valorile aşteptate sunt yai = B1 .xi şi sunt înscrise în coloana patru a tabelului precedent.
8 3
Avem SPAY = ( yij − Y )2 = 30.452
i =1 j =1
8
SPAR=3 ( yai − Y )2 = 8.384
i =1
8
SPAA= 3 ( y i − yai )2 = 6.254
i =1
8 3
SPAE = ( yij − yi )2 = 15.814
i =1 j =1
Rezultă SPAX=SPAR+SPAA=14.638 şi
SPAY.X=SPAA+SPAE=22.068
SPAR SPAX
Rezultă R= = 0.525; I c = = 0.693
SPAY SPAY
Testele ipotezelor
a) HX:=0 faţă de HX: ≠0
I c2 n −1
FX= : = 2.112 cu (7;16)GL
1 − I c n( p − 1)
2
Din tabelele 4,5,6 din Anexă, avem valorile critice pentru (7;16) GL astfel: F0.05=2.66;
F0.01=3.04;F0.001=6.50
Cum FX<F0.05 , se acceptă ipoteza Hx: = 0
R2 1
FR= : = 8.371 cu [1;22] GL
1 − R np − 2
2
tR= FR =2.893 cu 22 GL
Din tabela Student 2 din Anexă,avem pentru 22 GL, valorile critice t0.05=2.07; t0.01=2.82; t0.001=3.79.
Cum tR [t0.01; t0.001] ipoteza HR: = 0 se respinge deci ≠ 0 distinct semnificativ.
I c2 − R 2 n − 2
FA = : = 1.050
1 − I c2 np − 1
cu (6;16) GL.
88
Din tabelele Fisher 4,5,6 din Anexă, pentru (6;16) GL ,avem valorile critice F0.05=2.74; F0.01=4.20;
F0.001=6.81
Cum FA<F0.05 ipoteza HA: = se acceptă.
Funcţia de regresie este Y=B1X adică y=5.361X.
1 n
Avem S Y = (Y i − Y )2 = 0.93
2
n i =1
Lăţimea fâşiei de încredere cu =0.05 este
(8 − 1)(1 − 0.5252 )
2.5 % = 0.964 2.45 = 0.768
8(8 − 2)
deci Y=0.5361X 0.768
Concluzia aceste secțiuni este că corelația și regresia liniară din secțiunea 4.1 și analiza
varianței din secțiunea 5.1 pot coexista .
Corelația și regresiile neliniare(vezi secțiunea 4.2 ) pot coexista cu analiza varianței din
Secțiunea 5.1 folosind raportul de corelație neliniară Rc în locul coeficientului de corelație liniară R .
Avantaj al corelației și regresiei (liniare sau neliniare)față de analiza varianței :
În corelația și regresia liniară valorile factorului-cauză sistematică X și valorile factorului-efect Y
participă împreună la calculul corelației și regresiei (liniare sau neliniare)
ceace nu se întâmlă în cazul analizei varianței.
Dezavantaj al corelației și regresiei liniare față de analiza varianței :
În analiza varianței este suficient un număr mic de perechi de valori (X,Y) ceace
nu se întâmplă în cazul corelației și regresiei (liniare sau neliniare).În plus valorile factorului-cauză
sistematică X pot fi și calitative.
Foaia EXCEL cu numele 5.2 ANALIZA VARIANŢEI ȘI CORELAȚIA ȘI REGRESIA
LINIARĂ care face aceste calcule,se găsește în ANEXA 5.
89
Forma generală a modelului liniar este:
unde e(i,j,k) sunt variabile aleatoare normale, independente două câte două cu media 0 şi varianţa
2(E).
Reunim toate subpopulaţiile care corespund variantei X(i) fixate pentru orice j=1,....., n.
Exemplarele din această reuniune vor avea faţă de caracterul Z media:
n
X(i)=(1/n). (i,j), iar efectul principal al variantei X(i) este :
j =1
m
X(i)=X(i)- . Avem
i =1
X(i)=0.
În mod analog se reunesc subpopulaţiile ce corespund variantei Y(j) fixate pentru orice
i=1,......., m.
m
Exemplarele din această reuniune au faţă de caracterul Z, media Y(j)=(1/m). (i,j), iar efectul
i =1
Un caz particular al analizei varianţei completă balansată este cel în care p=1, deci avem câte o
singură repetiţie ataşată fiecărei perechi de variante (X(i), Y(j)).
În acest caz avem T=(X,Y), iar E are GLE=0 grade de libertate, deci vom lua E=X.Y, deci
SPAE=SPA(XY)-SPAX-SPAY şi GLE=GL(X,Y)-GLX-GLY.
Tabelul sintetic de analiza varianţei are forma:
Sursa de SPA GL S2 F
Variaţie
X SPAX m-1 S2X FX
Y SPAY n-1 S2Y FY
E SPAE (m-1)(n-1) S2E -
T SPAT mn-1 - -
Exemplu
Fie X=proteina digestibilă în raţia porcilor la îngrăşat şi Y= unităţile nutritive în raţia porcilor la
îngrăşat şi Z=sporul lunar în greutate (kg)al porcilor la îngrăşat.
90
Luăm m=3 variante X=X1(250g/zi); X2(275g/zi); X3(300g/zi) şi n=2 variante Y=Y1(2.5UN) şi
Y2(3UN).Pentru fiecare combinaţie de variante (X,Y) luăm câte p=2 repetiţii Z. Avem tabelul cu date :
Repetiţii Z
Medii pe Medii pe Medii pe Media
Variante Z(i,j,p(i,j)) Variante variante X variante Y Totală
(X,Y) (X,Y)
MZX(2)= MZT
(X2, Y2) 16; 16.2 MZ(2, 2)=16.1 15.65 =15.67
MZX(3)=16.60 MZY(2)=16.17
(X3, Y2) 16.9; 17.1 MZ(3, 2)=17
Etape de calcul :
a)SPA şi GL:
m n p
SPAT = [ Z (i, j, k ) − MZ T ]2 = 10.2268 cu GL T =mnp-1=11GL
i =1 j =1 k =1
m n
SPA( X ,Y ) = p[ MZ (i, j ) − MZ T ]2 = 9.9868 cuGL ( X ,Y ) =mn-1=5GL
i =1 j =1
m
SPAX = np[ MZ X (i) − MZ T ] = 6.8468 cu GL X =m-1=2GL
i =1
n
SPAY = mp [ MZY ( j ) − MZT = 1.9200 cu GL Y =n-1=1GL
j =1
SPAX Y = SPA( X ,Y ) − SPAX − SPAY = 1.2200 cu GLX Y = GL( X ,Y ) − GLX − GLY = 2GL
SPAE = SPAT − SPA( X ,Y ) = 0.2400 cu GLE = GLT − GL( X ,Y ) = 6GL
b) S2 :
91
SPAX SPAY
S X2 = = 3.4234; SY2 = = 1.9200
GLX GLY
SPAX Y SPAE
S X2 Y = = 0.61; S E2 = = 0.04
GLX Y GLE
c)F:
S X2
FX = 2 = 85.585 cu (2;6) GL
SE
SY2
FY = 2 = 48 cu (1;6) GL
SE
S X2 Y
FX Y = 2 = 15.25 cu (2;6) GL
SE
Din tabelele Fisher 4,5,6 din TABELE STATISTICE ,găsim valorile critice pentru (2;6) GL :
F0.05 = 5.14 ; F0.01 = 10.92 ; F0.01 = 27 ;
Cum FX F0.001 se acceptă ipoteza H adică X (1), X (2), X (3) diferă foarte semnificativ între
ele adică influenţa variaţiei lui X asupra variaţiei lui Z este foarte semnificativă deci Fx = 85.585 * * * .
Cum F0.01 FX Y F0.001 se acceptă ipoteza H adică influenţa variaţiei interacţiunii X Y asupra
variaţiei lui Z este distinct semnificativă deci FX Y = 15.25 * * .
Din tabelele Fisher 4,5,6 din Anexă, găsim valorile critice pentru (1,6) GL : F0.05=5.99, F0.01 = 13.74;
F0.001 = 35.51.
Cum FY F0.001 se acceptă ipoteza H deci Y (1), Y (2) diferă foarte semnificativ între ele
adică influenţa variaţiei lui Y asupra variaţiei lui Z este foarte semnificativă deci FY = 48 * * * .
92
SPAX SPAY
Ic ( X ) = = 0.818*** ; I c (Y ) = = 0.433*** ;
SPAT SPAT
SPAX Y
I c ( X .Y ) = = 0.345**.
SPAT
93
BIBLIOGRAGIE
94
32.IOSIFESCU M.,MOINEAGU C.,TREBICI V.,URSIANU E.” Mică Enciclopedie de Statistică”
Ed.Ştiinţifică şi Enciclopedică,1985
33.ISAIC-MANIU A.,VODĂ GH.V. “Manualul calităţii”,Ed.Economică,1997
34.JABA E.” Statistica “ Ediţia II,Ed. Economică ,2000
35.JOHNSTON J.” Econometric Methods” 3rd Edition , McGraw-Hill,1984
36.KENDALL M. “ Time-Series” C.Griffin &Co.,London,1976
37.MALIŢA M.,ZIDĂROIU C. “ Matematica organizării”, Ed. Tehnică,1975
38.MARINESCU I.”Analiză factorială” Ed.Ştiinţifică şi Enciclopedică, 1984
39.MATHER K.”The Elements of Biometry”,Meuthen,1967
40.MERCE E., URS FL.,MERCE C.” Statistică”,Ed. Academic Pres,2001
41.METCALFE A.V.”Statistics in Engineering”,Ed.Chapman &Hall,1994
42.MIHOC GH.,URSEANU V. “Tratat de statistică matematică” Ed.Academiei R.S.R.,1976-1977
43.MONTGOMERY D.C.,RUNGER G.C.”Applied Statistics and Probability For Engineers”J.Wiley ,1994
44.OANCEA M.”Tratat de management în unităţile agricole”,Ed.Ceres,1999
45.OTIMAN P.I.,CREŢ F. “ Elemente de matematici aplicate în economia agroalimentară”
Ed. Agroprint, 2002
46.PECICAN E.S. “Econometrie” ,Ed.ALL,1994
47.POSTELNICU T.,TĂUTU P.”Metode matematice în medicină şi biologie” Ed.Tehnică,1971
48.PURCARU I.”Informaţie şi corelaţie”,Ed.Ştiinţifică şi Enciclopedică,1988
49.SANDU GH.”Modele experimentale în zootehnie” Ed.Coral Sanivet,1995
50.SĂULESCU N.A.,SĂULESCU N.N.”Câmpul de experienţă”Ed. Agro-Silvică ,1967
51.SEARLE S.R.”Linear Models”, J.Wiley ,1971
52.SNEDECOR C.W. “ Medode statistice aplicate în cercetările de agricultură,şi biologie”,Ed.Didactică şi
Pedagogică,1968
53.TACU A.”Metode statistice în zootehnie şi medicină veterinară” Ed.Agrosilvică ,1968
54.TÂRCOLEA C.,FILIPOIU A.,BONTAŞ S.” Tehnici actuale în teoria fiabilităţii” Ed. Ştiinţifică şi
Enciclopedică,1989
55.TODORAN I.”Răspunsuri posibile.Corelaţie şi prognoză” Ed.Dacia,19895
56.TOMESCU D.,MANCIU GH.,SCRIPSNIC V. “ Fiabilitatea utilajelor agricole”,Ed.Ceres,1981
57.VODĂ V.GH.”Gândirea statistică-un mod de gândire al viitorului “ Ed.Albatros,1977
58.WALLACE T.D.,SILVER J.L.” Econometrics. An Introduction” Addison-Wesley ,1988
95
ANEXĂ CU TABELE STATISTICE
96
TABEL 1 Functia de repartitie N(0;1) : F( U/2 ) = 1 - /2
U 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54379 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57534
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 O.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62551 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.64838 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75803 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78523
0.8 0.78814 0.79103 0.79389 0.79673 0.79954 0.80234 0.80510 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83397 0.83646 0.83891
1.0 0.84134 0.84375 0.84613 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.86650 0.86864 0.87076 0.87285 0.87493 0.87697 0.87900 0.88100 0.88297
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89616 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91308 0.91465 0.91621 0.91773
1.4 0.91924 0.92073 0.92219 0.92364 0.92506 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95448
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96637 0.96711 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.9 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861
3.0 0.99865 0.99869 0.99874 0.99878 0.99882 0.99886 0.99889 0.99893 0.99897 0.99900
97
3.1 0.99903 0.99906 0.99910 0.99913 0.99916 0.99918 0.99921 0.99924 0.99926 0.99929
3.2 0.99931 0.99934 0.99936 0.99938 0.99940 0.99942 0.99944 0.99946 0.99948 0.99950
3.3 0.99952 0.99953 0.99955 0.99957 0.99958 0.99960 0.99961 0.99962 0.99964 0.99965
3.4 0.99966 0.99968 0.99969 0.99970 0.99971 0.99972 0.99973 0.99974 0.99975 0.99976
3.5 0.99977 0.99978 0.99978 0.99979 0.99980 0.99981 0.99981 0.99982 0.99983 0.99983
3.6 0.99984 0.99985 0.99985 0.99986 0.99986 0.99987 0.99987 0.99988 0.99988 0.99989
3.7 0.99989 0.99990 0.99990 0.99990 0.99991 0.99991 0.99992 0.99992 0.99992 0.99992
3.8 0.99993 0.99993 0.99993 0.99994 0.99994 0.99994 0.99994 0.99995 0.99995 0.99995
3.9 0.99995 0.99995 0.99996 0.99996 0.99996 0.99996 0.99996 0.99996 0.99997 0.99997
TABEL 2 Valorile Student t/2 si t : P(| t | > t/2 ) = P(t > t) =
GL↓ → 0.40 0.25 0.10 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005
1 0.325 1.000 3.078 6.314 12.706 31.821 63.657 127.32 318.31 636.62
2 0.289 0.816 1.886 2.920 4.303 6.965 9.925 14.089 23.326 31.598
3 0.277 0.765 1.638 2.353 3.182 4.541 5.841 7.453 10.213 12.924
4 0.271 0.741 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610
5 0.267 0.727 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869
6 0.265 0.718 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959
7 0.263 0.711 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408
8 0.262 0.706 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041
9 0.261 0.703 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781
10 0.260 0.700 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587
11 0.260 0.697 1.363 1.796 2.201 2.718 3.106 3.497 4.025 4.437
12 0.259 0.695 1.356 1.782 2.179 2.681 3.055 3.428 3.930 4.318
13 0.259 0.694 1.350 1.771 2.160 2.650 3.012 3.372 3.852 4.221
14 0.258 0.692 1.345 1.761 2.145 2.624 2.977 3.326 3.787 4.140
15 0.258 0.691 1.341 1.753 2.131 2.602 2.947 3.286 3.733 4.073
16 0.258 0.690 1.337 1.746 2.120 2.583 2.921 3.252 3.686 4.015
17 0.257 0.689 1.333 1.740 2.110 2.567 2.898 3.222 3.646 3.965
18 0.257 0.688 1.330 1.734 2.101 2.552 2.878 3.197 3.610 3.922
19 0.257 0.688 1.328 1.729 2.093 2.539 2.861 3.174 3.579 3.883
20 0.257 0.687 1.325 1.725 2.086 2.528 2.845 3.153 3.552 3.850
21 0.257 0.686 1.323 1.721 2.080 2.518 2.831 3.135 3.527 3.819
22 0.256 0.686 1.321 1.717 2.074 2.508 2.819 3.119 3.505 3.792
98
23 0.256 0.685 1.319 1.714 2.069 2.500 2.807 3.104 3.485 3.767
24 0.256 0.685 1.318 1.711 2.064 2.492 2.797 3.091 3.467 3.745
25 0.256 0.684 1.316 1.708 2.060 2.485 2.787 3.078 3.450 3.725
26 0.256 0.684 1.315 1.706 2.056 2.479 2.779 3.067 3.435 3.707
27 0.256 0.684 1.314 1.703 2.052 2.473 2.771 3.057 3.421 3.690
28 0.256 0.683 1.313 1.701 2.048 2.467 2.763 3.047 3.408 3.674
29 0.256 0.683 1.311 1.699 2.045 2.462 2.756 3.038 3.396 3.659
30 0.256 0.683 1.310 1.697 2.042 2.457 2.750 3.030 3.385 3.646
40 0.255 0.681 1.303 1.684 2.021 2.423 2.704 2.971 3.307 3.551
50 0.255 0.679 1.299 1.676 2.009 2.403 2.678 2.937 3.261 3.496
60 0.254 0.679 1.296 1.671 2.000 2.390 2.660 2.915 3.232 3.460
70 0.254 0.678 1.294 1.667 1.994 2.381 2.648 2.899 3.211 3.435
80 0.254 0.678 1.292 1.664 1.990 2.374 2.639 2.887 3.195 3.416
90 0.254 0.677 1.291 1.662 1.987 2.368 2.632 2.878 3.183 3.402
100 0.254 0.677 1.290 1.660 1.984 2.364 2.626 2.871 3.174 3.390
0.253 0.674 1.282 1.645 1.960 2.326 2.576 2.807 3.090 3.291
99
TABEL 3 Valorile hi patrat (2 ) : P (2 > 2 ) =
100
18 4.44 6.26 8.23 28.87 31.53 34.81 37.16 42.31 44.43
100 59.90 67.33 74.22 124.34 129.56 135.81 140.17 149.45 153.17
101
TABEL 4 Valorile Fisher ( F0.05 ) : P ( F > F0.05 ) = 0.05
GL 1→ 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120
GL 2 ↓
1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 241.9 243.9 245.9 248.0 249.1 250.1 251.1 252.2 253.3 254.3
2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.41 19.43 19.45 19.45 19.46 19.47 19.48 19.49 19.50
3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.74 8.70 8.66 8.64 8.62 8.59 8.57 8.55 8.53
4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.91 5.86 5.80 5.77 5.75 5.72 5.69 5.66 5.63
5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.68 4.62 4.56 4.53 4.50 4.46 4.43 4.40 4.36
6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.00 3.94 3.87 3.84 3.81 3.77 3.74 3.70 3.67
7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.57 3.51 3.44 3.41 3.38 3.34 3.30 3.27 3.23
8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.28 3.22 3.15 3.12 3.08 3.04 3.01 2.97 2.93
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.07 3.01 2.94 2.90 2.86 2.83 2.79 2.75 2.71
10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.91 2.85 2.77 2.74 2.70 2.66 2.62 2.58 2.54
11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.79 2.72 2.65 2.61 2.57 2.53 2.49 2.45 2.40
12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.69 2.62 2.54 2.51 2.47 2.43 2.38 2.34 2.30
13 4.67 3.81 3.41 3.18 3.83 2.92 2.83 2.77 2.71 2.67 2.60 2.53 2.46 2.42 2.38 2.34 2.30 2.25 2.21
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.53 2.46 2.39 2.35 2.31 2.27 2.22 2.18 2.13
15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.48 2.40 2.33 2.29 2.25 2.20 2.16 2.11 2.07
16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.42 2.35 2.28 2.24 2.19 2.15 2.11 2.06 2.01
17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.38 2.31 2.23 2.19 2.15 2.10 2.06 2.01 1.96
18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.34 2.27 2.19 2.15 2.11 2.06 2.02 1.97 1.92
19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.31 2.23 2.16 2.11 2.07 2.03 1.98 1.93 1.88
20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.28 2.20 2.12 2.08 2.04 1.99 1.95 1.90 1.84
21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32 2.25 2.18 2.10 2.05 2.01 1.96 1.92 1.87 1.81
22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.23 2.15 2.07 2.03 1.98 1.94 1.89 1.84 1.78
23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 2.27 2.20 2.13 2.05 2.01 1.96 1.91 1.86 1.81 1.76
24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25 2.18 2.11 2.03 1.98 1.94 1.89 1.84 1.79 1.73
25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 2.16 2.09 2.01 1.96 1.92 1.87 1.82 1.77 1.71
26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.15 2.07 1.99 1.95 1.90 1.85 1.80 1.75 1.69
27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25 2.20 2.13 2.06 1.97 1.93 1.88 1.84 1.79 1.73 1.67
28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24 2.19 2.12 2.04 1.96 1.91 1.87 1.82 1.77 1.71 1.65
29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22 2.18 2.10 2.03 1.94 1.90 1.85 1.81 1.75 1.70 1.64
30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 2.09 2.01 1.93 1.89 1.84 1.79 1.74 1.68 1.62
40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 2.00 1.92 1.84 1.79 1.74 1.69 1.64 1.58 1.51
60 4.00 4.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.92 1.84 1.75 1.70 1.65 1.59 1.53 1.47 1.39
120 3.93 3.07 2.29 2.45 2.29 2.17 2.09 2.02 1.96 1.91 1.83 1.75 1.66 1.61 1.55 1.50 1.43 1.35 1.25
3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88 1.83 1.75 1.67 1.57 1.52 1.46 1.39 1.32 1.22 1.00
102
TABEL 5 Valorile Fisher ( F0.01 ) : P ( F > F0.01 ) = 0.01
GL 1 → 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120
GL 2 ↓
1 4052 4999 5403 5625 5764 5859 5928 5982 6022 6056 6106 6157 6209 6235 6261 6287 6313 6339 6366
2 98.50 99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39 99.40 99.42 99.43 99.45 99.46 99.47 99.47 99.48 99.49 99.50
3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35 27.23 27.05 26.87 26.69 26.60 26.50 26.41 26.32 26.22 26.13
4 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 14.37 14.20 14.02 13.93 13.84 13.75 13.65 13.56 13.46
5 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.89 9.72 9.55 9.47 9.38 9.29 9.20 9.11 9.02
6 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.72 7.56 7.40 7.31 7.23 7.14 7.06 6.97 6.88
7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.47 6.31 6.16 6.07 5.99 5.91 5.82 5.74 5.65
8 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.67 5.52 5.36 5.28 5.20 5.12 5.03 4.95 4.46
9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.11 4.96 4.81 4.73 4.65 4.57 4.48 4.40 4.31
10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.71 4.56 4.41 4.33 4.25 4.17 4.08 4.00 3.91
11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54 4.40 4.25 4.10 4.02 3.94 3.86 3.78 3.69 3.60
12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4.16 4.01 3.86 3.78 3.70 3.62 3.54 3.45 3.36
13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 4.10 3.96 3.82 3.66 3.59 3.51 3.43 3.34 3.25 3.17
14 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94 3.80 3.66 3.51 3.43 3.35 3.27 3.18 3.09 3.00
15 8.68 6.36 5.42 4.89 4.36 4.32 4.14 4.00 3.89 3.80 3.67 3.52 3.37 3.29 3.21 3.13 3.05 2.96 2.87
16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3 .69 3.55 3.41 3.26 3.18 3.10 3.02 2.93 2.84 2.75
17 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.46 3.31 3.16 3.08 3.00 2.92 2.83 2.75 2.65
18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.37 3.23 3.08 3.00 2.92 2.84 2.75 2.66 2.57
19 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.43 3.30 3.15 3.00 2.92 2.84 2.76 2.67 2.58 2.49
20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.23 3.09 2.94 2.86 2.78 2.69 2.61 2.52 2.42
21 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40 3.31 3.17 3.03 2.88 2.80 2.72 2.64 2.55 2.46 2.36
22 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.12 2.98 2.83 2.75 2.67 2.58 2.50 2.40 2.31
23 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30 3.21 3.07 2.93 2.78 2.70 2.62 2.54 2.45 2.35 2.26
24 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17 3.03 2.89 2.74 2.66 2.58 2.49 2.40 2.31 2.21
25 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22 3.13 2.99 2.85 2.70 2.62 2.54 2.45 2.36 2.27 2.17
26 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18 3.09 2.96 2.81 2.66 2.58 2.50 2.42 2.33 2.23 2.13
27 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3.15 3.06 2.93 2.78 2.63 2.55 2.47 2.38 2.29 2.20 2.10
28 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12 3.03 2.90 2.75 2.60 2.52 2.44 2.35 2.26 2.17 2.06
29 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.09 3.00 2.87 2.73 2.57 2.49 2.41 2.33 2.23 2.14 2.03
30 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.84 2.70 2.55 2.47 2.39 2.30 2.21 2.11 2.01
40 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80 2.66 2.52 2.37 2.29 2.20 2.11 2.02 1.92 1.80
60 7.08 4.98 4.13 3.65 3.34 3.12 3.95 2.82 2.72 2.63 2.50 2.35 2.20 2.12 2.03 1.94 1.84 1.73 1.60
120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 2.47 2.34 2.19 2.03 1.95 1.86 1.76 1.66 1.53 1.38
6.63 4.61 378 3.32 3.02 2.80 2.64 2.51 2.41 2.32 2.18 2.04 1.88 1.79 1.70 1.59 1.47 1.32 1.00
103
TABEL 6 Valorile Fisher ( F0.001 ) : P ( F > F0.001 ) = 0.001
GL 1 → 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120
GL 2 ↓
1 40532 50002 54042 56252 57642 58592 59292 59812 60232 60562 61072 61582 62092 62352 62612 62872 63132 63402 63662
2 998.5 999.0 999.2 999.2 999.3 999.3 999.4 999.4 999.4 999.4 999.4 999.4 999.4 999.5 999.5 999.5 999.5 999.5 999.5
3 167.0 148.5 141.1 137.1 134.6 132.8 131.6 130.6 129.9 129.2 128.3 127.4 126.4 125.9 125.4 125.0 124.5 124.0 123.5
4 74.14 61.25 56.18 53.44 51.71 50.53 49.66 49.00 48.47 48.05 47.41 46.76 46.10 45.77 45.43 45.09 44.75 44.40 44.05
5 47.18 37.12 33.20 31.09 29.75 28.84 28.16 27.64 27.24 26.92 26.42 25.91 25.39 25.14 24.87 24.60 24.33 24.06 23.79
6 35.51 27.00 23.70 21.92 20.81 20.03 19.46 19.03 18.69 18.41 17.99 17.56 17.12 16.89 16.67 16.44 16.21 15.99 15.75
7 29.25 21.69 18.77 17.19 16.21 15.52 15.02 14.63 14.33 14.08 13.71 13.32 12.93 12.73 12.53 12.33 12.12 11.91 11.70
8 25.42 18.49 15.83 14.39 13.49 12.86 12.40 12.04 11.77 11.54 11.19 10.84 10.48 10.30 10.11 9.92 9.73 9.53 9.33
9 22.86 16.39 13.90 12.56 11.71 11.13 10.70 10.37 10.11 9.89 9.57 9.24 8.90 8.72 8.55 8.37 8.19 8.00 7.81
10 21.04 14.91 12.55 11.28 10.48 9.92 9.52 9.20 8.96 8.75 8.45 8.13 7.80 7.64 7.47 7.30 7.12 6.94 6.76
11 19.69 13.81 11.56 10.35 9.58 9.05 8.66 8.35 8.12 7.92 7.63 7.32 7.01 6.85 6.68 6.52 6.35 6.17 6.00
12 18.64 12.97 10.80 9.63 8.89 8.38 8.00 7.71 7.48 7.29 7.00 6.71 6.40 6.25 6.09 5.93 5.76 5.59 5.42
13 17.81 12.31 10.21 9.07 8.35 7.86 7.42 7.21 6.98 6.80 6.52 6.23 5.93 5.78 5.63 5.47 5.30 5.14 4.97
14 17.14 11.78 9.73 8.62 7.92 7.43 7.08 6.80 6.58 6.40 6.13 5.85 5.56 5.41 5.25 5.10 4.94 4.77 4.60
15 16.59 11.34 9.34 8.25 8.57 7.09 6.74 6.47 6.26 6.08 5.81 5.54 5.25 5.10 4.95 4.80 4.64 4.47 4.31
16 16.12 10.97 9.00 7.94 7.27 6.81 6.46 6.19 5.98 5.81 5.55 5.27 4.99 4.85 4.70 4.54 4.39 4.23 4.06
17 15.72 10.66 8.73 7.68 7.02 6.56 6.22 5.96 5.75 5.58 5.32 5.05 4.78 4.63 4.48 4.33 4.18 4.02 3.85
18 15.38 10.39 8.49 7.46 6.81 6.35 6.02 5.76 5.56 5.39 5.13 4.87 4.59 4.45 4.30 4.15 4.00 3.84 3.67
19 15.08 10.16 8.28 7.26 6.62 6.18 5.85 5.59 5.39 5.22 4.97 4.70 4.43 4.29 4.14 3.99 3.84 3.68 3.51
20 14.82 9.95 8.10 7.10 6.46 6.02 5.69 5.44 5.24 5.08 4.82 4.56 4.29 4.15 4.00 3.86 3.70 3.54 3.38
21 14.59 9.77 7.94 6.95 6.32 5.88 5.56 5.31 5.11 4.95 4.70 4.44 4.17 4.03 3.88 3.74 3.58 3.42 3.26
22 14.38 9.61 7.80 6.81 6.19 5.76 5.44 5.19 4.99 4.83 4.58 4.33 4.06 3.92 3.78 3.63 3.48 3.32 3.15
23 14.19 9.47 7.67 6.69 6.08 5.65 5.33 5.09 4.89 4.73 4.48 4.23 3.96 3.82 3.68 3.53 3.38 3.22 3.05
24 14.03 9.34 7.55 6.59 5.98 5.55 5.23 4.99 4.80 4.64 4.39 4.14 3.87 3.74 3.59 3.45 3.29 3.14 2.97
25 13.88 9.22 7.45 6.49 5.88 5.46 5.15 4.91 4.71 4.56 4.31 4.06 3.79 3.66 3.52 3.37 3.22 3.06 2.89
26 13.74 9.12 7.36 6.41 5.80 5.38 5.07 4.83 4.64 4.48 4.24 3.99 3.72 3.59 3.44 3.30 3.15 2.99 2.82
27 13.61 9.02 7.27 6.33 5.73 5.31 5.00 4.76 4.57 4.41 4.17 3.92 3.66 3.52 3.38 3.23 3.08 2.92 2.75
28 13.50 8.93 7.19 6.25 5.66 5.24 4.93 4.69 4.50 4.35 4.11 3.86 3.60 3.46 3.32 3.18 3.02 2.86 2.69
29 13.39 8.85 7.12 6.19 5.59 5.18 4.87 4.64 4.45 4.29 4.05 3.80 3.54 3.41 3.27 3.12 2.97 2.81 2.64
30 13.29 8.77 7.05 6.12 5.53 5.12 4.82 4.58 4.39 4.24 4.00 3.75 3.49 3.36 3.22 3.07 2.92 2.76 2.59
40 12.61 8.24 6.60 5.70 5.13 4.73 4.44 4.21 4.02 3.87 3.64 3.40 3.15 3.01 2.87 2.73 2.57 2.41 2.23
60 11.97 7.76 6.17 5.31 4.76 4.37 4.09 3.87 3.69 3.54 3.31 3.08 2.83 2.69 2.55 2.41 2.25 2.08 1.89
120 11.38 7.32 5.79 4.95 4.42 4.04 3.77 3.55 3.38 3.24 3.02 2.78 2.53 2.40 2.26 2.11 1.95 1.76 1.54
10.83 6.91 5.42 4.62 4.10 3.74 3.47 3.27 3.10 2.96 2.74 2.51 2.27 2.13 1.99 1.84 1.66 1.45 1.00
104
TABEL 7 Amplitudinea studentizată Tukey T(0.05)
m→ 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
GLE
5 3.64 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99 7.17 7.32 7.47 7.60 7.72 7.83 7.93 8.03 8.12 8.21
6 3.46 4.34 4.90 5.31 5.63 5.89 6.12 6.32 6.49 6.65 6.79 6.92 7.03 7.14 7.24 7.34 7.43 7.51 7.59
7 3.34 4.16 4.68 5.06 5.36 5.61 5.82 6.00 6.16 6.30 6.43 6.55 6.66 6.76 6.85 6.94 7.02 7.09 7.17
8 3.26 4.04 4.53 4.89 5.17 5.40 5.60 5.77 5.92 6.05 6.18 6.29 6.39 6.48 6.57 6.65 6.73 6.80 6.87
9 3.20 3.95 4.42 4.76 5.02 5.24 5.43 5.60 5.74 5.87 5.98 6.09 6.19 6.28 6.36 6.44 6.51 6.58 6.64
10 3.15 3.88 4.33 4.65 4.91 5.12 5.30 5.46 5.60 5.72 5.83 5.93 6.03 6.11 6.20 6.27 6.34 6.40 6.47
11 3.11 3.82 4.26 4.57 4.82 5.03 5.20 5.35 5.49 5.61 5.71 5.81 5.90 5.99 6.06 6.14 6.20 6.26 6.33
12 3.08 3.77 4.20 4.51 4.57 4.95 5.12 5.27 5.40 5.51 5.62 5.71 5.80 5.88 5.95 6.03 6.09 6.15 6.21
13 3.06 3.73 4.15 4.45 4.69 4.88 5.05 5.19 5.32 5.43 5.53 5.63 5.71 5.79 5.86 5.93 6.00 6.05 6.11
14 3.03 3.70 4.11 4.41 4.64 4.83 4.99 5.13 5.25 5.36 5.46 5.55 5.64 5.72 5.79 5.85 5.92 5.97 6.03
15 3.01 3.67 4.08 4.37 4.60 4.78 4.94 5.08 5.20 5.31 5.40 5.49 5.58 5.65 5.72 5.79 5.85 5.90 5.96
16 3.00 3.65 4.05 4.33 4.56 4.74 4.90 5.03 5.15 5.26 5.35 5.44 5.52 5.59 5.66 5.72 5.79 5.84 5.90
17 2.98 3.63 4.0 4.30 4.52 4.71 4.86 4.99 5.11 5.21 5.31 5.39 5.47 5.55 5.61 5.68 5.74 5.79 5.84
18 2.97 3.61 4.00 4.28 4.49 4.67 4.82 4.96 5.06 5.17 5.27 5.35 5.43 5.50 5.57 5.63 5.69 5.74 5.79
19 2.96 3.59 3.98 4.25 4.47 4.65 4.79 4.92 5.04 5.14 5.23 5.32 5.39 5.46 5.53 5.59 5.65 5.70 5.75
20 2.95 3.58 3.96 4.23 4.45 4.62 4.77 4.90 5.01 5.11 5.20 5.28 5.36 5.43 5.49 5.55 5.61 5.66 5.71
24 2.92 3.53 3.90 4.17 4.37 4.54 4.68 4.81 4.92 5.01 5.10 5.18 5.25 5.32 5.38 5.44 5.50 5.54 5.59
30 2.89 3.49 3.84 4.10 4.30 4.46 4.60 4.72 4.83 4.92 5.00 5.08 5.15 5.21 5.27 5.33 5.38 5.43 5.48
40 2.86 3.44 3.79 4.04 4.23 4.39 4.52 4.63 4.74 4.82 4.91 4.98 5.05 5.11 5.16 5.22 5.27 5.31 5.36
60 2.83 3.40 3.74 3.98 4.16 4.31 4.44 4.55 4.65 4.73 4.81 4.88 4.94 5.00 5.06 5.11 5.16 5.20 5.24
120 2.80 3.36 3.69 3.92 4.10 4.24 4.36 4.48 4.56 4.64 4.72 4.78 4.84 4.90 4.95 5.00 5.05 5.09 5.13
∞ 2.77 3.31 3.63 3.86 4.03 4.17 4.29 4.39 4.47 4.55 4.62 4.68 4.74 4.80 4.85 4.89 4.93 4.97 5.01
106
2500 0.080 0.114 2.79 2.85 3.16 3.25
3000 0.073 0.104 2.81 2.86 3.15 3.22
3500 0.068 0.096 2.82 2.87 3.14 3.21
4000 0.064 0.090 2.83 2.88 3.13 3.19
4500 0.060 0.085 2.84 2.88 3.12 3.18
5000 0.057 0.081 2.85 2.89 3.12 3.17
107