Sunteți pe pagina 1din 261

FACULTATEA DE AGRONOMIE COLECTIVUL DE BIOLOGIE SECIA FRECVEN REDUS Prof. Univ. Dr.

DUMITRU ENE

BIOSTATISTIC

Ediia II revizuit

- BUCURETI 2010

3
Pagina Prefa...6 CAP. 6 CALCULUL PROBABILITILOR.7 6.1 Evenimente i probabilitile lor.7 6.1.1 Evenimente...7 6.1.2 Probabilitile evenimentelor....8 6.1.3 Probabilitile condiionate ale evenimentelor11 6.2 Variabile aleatoare...14 6.2.1 Densitatea de probabilitate i funcia de repartiie ...14 6.2.2 Indicatori numerici ...19 6.2.3 Funcia caracteristic 22 6.3 Vectori aleatori.24 6.3.1 Densitatea de probabilitate i funcia de repartiie ...24 6.3.2 Indicatori numerici ..27 6.4 Variabile aleatoare clasice discontinue...31 6.4.1 Variabila binomial...31 6.4.2 Variabila hipergeometric.34 6.4.3 Variabila Poisson..35 6.5 Variabile aleatoare clasice continue37 6.5.1 Variabila uniform37 6.5.2 Variabilele exponenial, Weibull, Erlang...37 6.5.3 Variabila normal.39 6.5.4 Variabilele Hi Patrat, Student, Fisher41 A. Variabila Hi Patrat (2).41 B. Variabila Student(t)...42 C. Variabila Fisher (F)42 6.5.5 Vectorul aleator normal..44 6.6 Legi-limit45 6.7 Fiabilitatea echipamentelor..48 CAP.7 CULEGEREA I PRELUCRAREA DATELOR DE SONDAJ.........................................52 7.1 Populaii statistice i sondaje...52 7.2 Indicatori de sondaj de repartiie..55 7.2.1 Cazul sondajului de volum mic (n < 30)55 7.2.2. Cazul sondajului de volum mare (n > 30).59 7.3 Indicatori de sondaj de evoluie67 7.3.1 Cazul msurtorilor simple n timp67 7.3.2 Cazul msurtorilor multiple n timp73 7.3.3 Indici statistici...75 7.4 Estimaii / teste n populaii normale84 7.5 Estimaii / teste parametrice n populaii normale87 7.5.1 Estimaii / teste pentru parametrii , ai unui caracter cantitativ ntr-o populaie normal...87 7.5.2 Estimaii / teste pentru parametrul p al unui caracter calitativ ntr-o populaie normal..91 7.5.3 Estimaii / teste pentru parametrii 2 - 1, 2 / 1 ai unui caracter cantitativ n

4
dou populaii normale.93 7.5.4 Estimaii / teste pentru parametrul p2 p1 al unui caracter calitativ n dou populaii normale..98 7.6 Teste neparametrice n populaii normale100 7.6.1 Testul hi patrat de concordan...100 7.6.2 Testul hi patrat de independen102 7.6.3 Testul normalitii prin asimetrie i boltire105 CAP. 8 TESTE ALE CONTROLULUI CALITII I FIABILITII N AGRICULTUR.107 8.1 Controlul statistic de calitate n cursul procesului de producie107 8.1.1 Cazul unei nsuiri cantitative..109 8.1.2 Cazul unei nsuiri calitative..112 8.2 Controlul statistic de calitate la recepie.114 8.2.1 Controlul unei nsuiri cantitative....117 A. Controlul simplu al unei nsuiri cantitative.117 B. Controlul secvenial al unei nsuiri cantitative...119 8.2.2 Controlul unei nsuiri calitative..121 A. Controlul simplu al unei nsuiri calitative...121 B. Controlul secvenial al unei nsuiri calitative.122 8.2.3 Controlul fiabilitii mainilor agricole..124 A. Controlul simplu al fiabilitii.124 B. Controlul secvenial al fiabilitii125 CAP. 9 ANALIZA VARIANEI I PLANURI EXPERIMENTALE N AGRICULTUR 127 9.1 Analiza varianei monofactorial nebalansat n populaii omogene...127 9.2 Analiza varianei bifactorial complet nebalansat n populaii omogene.127 9.3 Analiza varianei bifactorial ierarhic nebalansat n populaii omogene..135 9.4 Planuri experimentale n populaii neomogene143 9.4.1 Planul blocurilor complete randomizate..148 9.4.2 Planul patratelor latine.152 CAP. 10 CORELAIA I REGRESIA NTRE CARACTER158 10.1 Corelaia i regresia monofactorial liniar..158 10.1.1 Cazul observaiilor perechi (xi, yi).158 10.1.2 Cazul observaiilor multiple (xi, yij).173 10.1.3 Cross-corelaia i autocorelaia seriilor de timp...177 10.2 Corelaii i regresii monofactoriale neliniare...179 10.2.1 Corelaia i regresia monofactorial polinomial..180 10.2.2 Corelaia i regresia monofactorial trigonometric183 10.2.3 Corelaia i regresia monofactorial polinomial-trigonometric..186 10.3 Corelaii i regresii polifactoriale..190 10.3.1 Corelaia i regresia polifactorial liniar pentru cazul a 2+1 caractere..190 10.3.2 Corelaia i regresia polifactorial liniar pentru cazul a m+1 caractere.200 10.3.3 Corelaia i regresia polifactorial polinomial de grad k fr interaciuni pentru cazul a m+1 caractere...212 10.3.4 Corelaia i regresia polifactorial polinomial de grad 3 cu interaciuni pentru cazul a m+1 caractere...214

5
CAP.11 SISTEME BIOLOGICE..215 11.1 Definiia,clasificarea i proprietile sistemelor 11.1.1 Definiia sistemelor 11.1.2 Clasificarea sistemelor 11.1.3 Proprietile sistemelor 11.1.4 Sisteme liniare 11.2 Sisteme biologice.. 11.2.1 Sisteme biologice pn la nivel de organism (biosisteme) 11.2.2 Sisteme biologice la nivel de populaii (biocenoze) 11.2.3 Pdurile ca ecosisteme vegetale BIBLIOGRAFIE218 ANEX CU TABELE STATISTICE Tabel 1 Funcia de repartiie N(0;1) : F( u/2 ) 1 /2 Tabel 2 Valorile Student t /2 i t : P( | t | > t /2 ) = P( t > t ) = Tabel 3 Valorile hi patrat 2 : P( 2 > 2 ) = Tabel 4 Valorile Fisher F0.05 : P( F> F0.05 ) = 0.05 Tabel 5 Valorile Fisher F0.01 : P( F> F0.01 ) = 0.01 Tabel 6 Valorile Fisher F0.001 : P( F> F0.001 ) = 0.001 Tabel 7 Amplitudinea studentizat Tukey T0.05 Tabel 8 Amplitudinea studentizat Tukey T0.01 Tabel 9 Valori critice ale asimetriei i boltirii Tabel 10 Valori critice R/2 ale coeficientului de corelaie liniar R Tabel 11 Transformarea Fisher z = 0.5 ln [(1 R)/(1+ R )] Tabel 12 Valori critice pentru fie de control al calitii Tabel 13 Valorile lui - P.log2P pentru calculul entropiei

6 Prefa Aceast lucrare este destinat studenilor de la Facultatea de Agronomie ,Secia Biologie Frecven redus . Capitolele 6-10 sunt consecrate aplicaiilor statisticii n biologie i agricultur , domeniu care are o lung tradiie n tara noastr. Aplicaiile statisticii n agricultur au beneficiat de aportul remarcabil al computerelor pentru partea de calcule prin produse informatice generale sau specializate pe statistic. n acest moment accentul cade pe modelarea statistic cea mai eficient n biologie i agricultur i pe interpretarea corect a rezultatelor n vederea lurii unor decizii corecte i rapide. Biologia ca domeniu de activitate cu risc din partea naturii , se dovedete un domeniu de predilecie al statisticii , ca mod de gndire al viitorului , citndu-l pe statisticianul V.Vod. Capitolul 6 prezint noiunile de teoria probabilitilor strict necesare pentru nelegerea conceptelor statisticii:evenimente,probabiliti,variabile i vectori aleatori,variabile aleatoare clasice , legi-limit i fiabilitatea echipamentelor. Capitolul 7 prezint sondajele n populaii statistice,semnificaia i modul de calcul al indicatorilor de sondaj de repartiie i evoluie. Acest capitol se ncheie cu estimaii i teste parametrice ale mediilor i abaterilor-standard n populaii pentru caractere cantitative(msurabile) respectiv estimaii i teste parametrice ale probabilitilor n populaii pentru caractere calitative( atributive) precum i teste neparametrice n populaii : concordan,independen i normalitate a populaiei. n capitolul 8 se prezint testele controlului calitii i fiabilitii n biologie i agricultur att n cursul procesului de producie(prin fie de control al calitii) ct i la recepie(prin control simplu i secvenial). n capitolul 9 se prezint analiza varianei mono i polifactorial nebalansat complet i ierarhic n populaii omogene inclusiv calculul componentelor de varian n populaie. Pentru populaii neomogene se prezint principalele planuri experimentale folosite n biologie i agricultur:planul blocurilor complete randomizate i planul patratelor i dreptunghiurilor latine. Facem precizarea c n capitolul 9 folosim denumirea de indice de corelaie ,distinct fa de denumirea de raport de corelaie neliniar din capitolul 10 dei Enciclopedia de statistic le identific. n capitolul 10 se prezint corelaia/regresia monofactorial liniar i neliniare (de tip polinomial , trigonometric i mixt). n continuare se prezint corelaia/regresia polifactorial liniar i neliniar polinomial (fr i cu interaciuni) ,ntre m+1 caractere. Pentru corelaia i regresia liniar polifactorial , se prezint calculul aporturilor a m factori la al m+1-lea caracter,stabilit de ENE D. n lucrrile 21 i 27 . n ntreaga lucrare am adoptat un compromis ntre rigoarea tiinific(prin definiii,teoreme i demonstraii) i accesibilitate/utilitate (prin exemple detaliate). Toate exemplele din lucrare conin date convenionale plauzibile din biologie i agricultur. Lucrarea se ncheie cu bibliografie i o anex cu 13 tabele statistice . Pentru problemele tratate n lucrare dispunem de un pachet propriu de programe executabile.Dealtfel n lucrare facem referiri dese la produsul EXCEL pentru optimizri , funcii statistice uzuale i pachetul de statistic DATA ANALYSIS din opiunea TOOLS. Decembrie 2010 Autorul

CAPITOLUL

6 CALCULUL PROBABILITILOR

Obiective :nsuirea de ctre studeni a conceptelor de eveniment , probabilitate simpl i condiionat a evenimentelor , variabil aleatoare i indicatori asociai , vector aleator i indicatori asociai , variabile aleatoare clasice discontinue i continue precum i a legilor-limit . Coninut : 6.1 Evenimente i probabilitile lor 6.1.1 Evenimente 6.1.2 Probabilitile evenimentelor 6.1.3 Probabilitile condiionate ale evenimentelor 6.2 Variabile aleatoare 6.2.1 Densitatea de probabilitate i funcia de repartiie 6.2.2 Indicatori numerici 6.2.3 Funcia caracteristic 6.3 Vectori aleatori 6.3.1 Densitatea de probabilitate i funcia de repartiie 6.3.2 Indicatori numerici 6.4 Variabile aleatoare clasice discontinue 6.4.1 Variabila binomial 6.4.2 Variabila hipergeometric 6.4.3 Variabila Poisson 6.5 Variabile aleatoare clasice continue 6.5.1 Variabila uniform 6.5.2 Variabilele exponenial, Weibull, Erlang 6.5.3 Variabila normal 6.5.4 Variabilele Hi Patrat, Student, Fisher A. Variabila Hi Patrat (2) B. Variabila Student(t) C. Variabila Fisher (F) 6.5.5 Vectorul aleator normal 6.6 Legi-limit 6.7 Fiabilitatea echipamentelor 6.8 Rezumat 6.9 ntrebri 6.10 Bibliografie Cuvinte cheie : eveniment, probabilitate, probabilitate condiionat , variabil aleatoare , funcie de repartiie i densitate de probabilitate, media i variana unei variabile aleatoare , funcia caracteristic a unei variabile aleatoare , vector aleator , covariana i coeficientul de corelaie liniar pentru un vector aleator , variabila binomial , Poisson , exponenial,normal , hi patrat,Student,Fisher,vectorul aleator normal . 6.1 EVENIMENTE I PROBABILITILE LOR 6.1.1 Evenimente

Un experiment este aleator dac rezultatele sale nu pot fi prevzute cu exactitate, fiind sub influena ntmplrii. Exemple 1) Apariia unei fee la aruncarea monezii; 2) Apariia unei fee la aruncarea zarului; 3) Apariia unei bile albe la extragerea din urn cu bile albe i negre. Totalitatea rezultatelor posibile ale unui experiment aleator se numete spaiu de evenimente elementare i se noteaz cu . Mulimea prilor (submulimilor) lui se noteaz cu P(). Exemplu 1) La aruncarea monezii avem = {stem, ban}; 2) La aruncarea zarului avem = {1, 2, 3, 4, 5, 6}; Dac mulimea este finit sau numrabil (ir), orice submulime A se numete eveniment. Dac mulimea este nenumrabil (de exemplu = R), vom numi evenimente numai submulimile A a cror familie formeaz o algebr K P() care se definete prin condiiile: 1) 2) Ai pentru i I U Ai 3) A CA CA se numete eveniment contrar cu A i se mai noteaz cu . Exemplu Dac A = apariia unei fee pare la aruncarea zarului atunci CA = apariia unei fee impare la aruncarea zarului. ca eveniment, se numete evenimentul sigur iar C = se numete evenimentul imposibil. Incluziunea A B se numete implicare a evenimentului B de ctre evenimentul A: realizarea lui A determin realizarea lui B. Exemplu Dac A = apariia feei 6 la aruncarea zarului i B = apariia unei fee pare la aruncarea zarului avem A B. Egalitatea A = B se numete echivalen a evenimentelor A i B i are loc dac A B i B A. Evenimentul B este elementar dac A B A = sau A = B. Exemple 1) Apariia unei anumite fee la aruncarea unei monezi sau zar este eveniment elementar; 2) Apariia unei bile albe la extragerea din urn a unei bile este eveniment elementar. Dndu-se dou evenimente A i B, reuniunea lor se noteaz cu A U B i se citete A sau B fiind un eveniment compus care se realizeaz dac se realizeaz mcar unul dintre evenimentele A, B. Dndu-se dou evenimente A i B, intersecia lor se noteaz A I B i se citete A i B fiind un eveniment compus care se realizeaz dac ambele evenimente A, B se realizeaz. Exemplu Fie A evenimentul c becul 1 funcioneaz la un moment dat i B evenimentul c becul 2 funcioneaz n acelai moment. A U B este evenimentul c trece curentul prin circuitul paralel care conine becurile 1 i 2.

iI

A I B este evenimentul c trece curentul prin circuitul serie care conine becurile 1 i 2. Evenimentele A, B sunt incompatibile dac nu se realizeaz simultan adic A I B = . n caz contrar A i B se numesc compatibile. Exemple de evenimente incompatibile 1) Apariia de fee diferite la o aruncare cu moneda sau zarul; 2) Apariia de culori diferite la extragerea unei bile din urn. Exemple de evenimente compatibile 1) Nimerirea unei inte de doi trgtori care ochesc asupra ei; 2) Funcionarea la un moment dat a dou becuri ntr-un circuit electric. 1.1.2 Probabilitile evenimentelor Fie o - algebr de evenimente din P(). O funcie P : R+ se numete probabilitate dac: 1) P() = 1 2) P U Ai = P(Ai) pentru orice familie (Ai) i I cu Ai , incompatibile cte iI iI dou. Tripleta {, , P} se numete cmp de probabilitate. Fie p(i) numere negative de sum 1 care se corespund bijectiv cu evenimentele elementare i (i N). Definim P(i) = p(i) i pentru orice eveniment A P() lum P ( A ) = p(i) .

1 pentru orice i {1, , m} vom avea m nr. cazuri favorabile evenimentului A P (A) = nr.cazuri egal posibile
n particular dac = {1, , m} i p(i ) = Aceasta este definiia clasic a probabilitii unui eveniment. Exemple 1) P(stema ) =

Funcia P astfel definit este probabilitate n sensul definiiei de mai sus.

i A

1 = 50% ; 2

2) P fa dat la zar =

1 6

= 16, 7% ;

3) Fie urna U cu 7 bile albe i 3 bile negre.

P ( bil extras alb ) =

Definiia clasic a probabilitii nu se aplic dac: 1) moneda este deformat; 2) zarul nu are feele egale (este paralelipiped); 3) bilele din urn nu au acelai diametru, cci n aceste cazuri evenimentele elementare nu sunt egal posibile. Evenimentele A i B se numesc independente dac P(A I B) = P(A) . P(B) i dependente n caz contrar. Exemple de evenimente independente 1) Apariiile unor fee la aruncarea simultan a dou monezi sau zaruri care nu se ciocnesc;

7 = 70% 10

10

2) Apariiile unor fee la dou aruncri succesive a unei monezi sau zar; 3) Apariiile a dou bile la extrageri simultane din dou urne diferite; 4) Apariia a dou bile albe la dou extrageri succesive dintr-o urn cu bila revenit. Exemple de evenimente dependente Apariia a dou bile albe la dou extrageri succesive din urn cu bila nerevenit. Teorema 6.1. Avem proprietile: 1) P() = 1 P(A) pentru orice A ; 2) P(A1 U U An) = [P(A1) + + (An)] - [P(A1 I A2) + + P(An-1 I An)] + + (-1)nP(A1 I I An) pentru orice evenimente A1, , An 3) 0 < P(A) < 1 pentru orice A ; P() = 0; P() = 1 4) P(A1 I I An) > P(A1) + + (An) n + 1 (Boole) Demonstraie 1) A I = i A U = deci P(A I ) = P() = 1 deci conform axiomei 2) din definiia probabilitii : P(A) + P() = 1 deci P() = 1 P(A) 2) Vom demonstra egalitatea pentru n = 2 i apoi aplicm inductia dup n. Evenimentele A1 i 1 I A2 sunt incompatibile i A1 U (1 I A2) = A1 U A2 deci conform axiomei 2) a probabilitii, avem: (1) P(A1) + P(1 I A2) = P(A1 U A2) Evenimentele A1 I A2 i 1 I A2 sunt incompatibile i (A1 I A2) U (1 I A2) = A2 deci conform axiomei 2) a probabilitilor avem: P(A1 I A2) + P(1 I A2) = P(A2) (2) Scznd egalitatea (2) din (1) obinem: P(A1) - P(A1 I A2) = P(A1 U A2) P(A2) sau : P(A1 U A2) = P(A1) + P(A2) - P(A1 I A2) (3) Dac A i B sunt incompatibile (A I B = ) din (3) reobinem axioma 2) a probabilitii : P(A1 U A2) = P(A1) + P(A2) (4) 3) P(A) > 0 i P() = 1 conform axiomei 1) a probabilitii. Dac A1 A2 egalitatea (2) devine: P(A1) + P(1 I A2) = P(A2) sau P(A2) P(A1) = P(1 I A2) > 0 deci A1 A2 implic P(A1) < P(A2) n particular A deci P(A) < P() = 1 De asemenea = deci conform punctului 1) avem P() = 1 P() = 0 4) Vom demonstra inegalitatea pentru n = 2 apoi aplicm inductia dup n. Avem P(A1 I A2) = P(A1) + P(A2) P(A1 U A2) > P(A1) + P(A2) 1 = P(A1) + P(A2) - 2 +1 Dac A1, A2 sunt independente avem conform definiiei egalitatea P(A1 I A2) = P(A1) . P(A2). Q.E.D. Exemple 1) Se arunc 2 monezi care nu se ciocnesc. Se cere: a) Probabilitatea P1 s ias 2 steme; b) Probabilitatea P2 s nu ias nici o stem;

11

c) Probabilitatea P3 s ias cel puin o stem. Soluie Fie evenimentele: A1 = apariia stemei pe prima moned i A2 = apariia stemei pe a doua moned a)A1 i A2 sunt independente deci P1 = P(A1 I A2) = P(A1 ) (A 2 ) =

b) P2 = P(1 I 2) = P(1) . P(2) = c) P3 = 1 P2 =

2) Se arunc 2 zaruri care nu se ciocnesc. Se cere: a) Probabilitatea P1 s ias o anumit dubl; b) Probabilitatea P2 ca suma punctelor s fie cuprins ntre 2 i 4; c) Probabilitatea P3 ca produsul punctelor s fie cuprins ntre 3 i 5. Soluie a) Fie A1 evenimentul c iese o fa dat pe primul zar i A2 evenimentul c iese aceeai fa pe al II-lea zar. Evenimentele A1, A2 sunt independente deci P1 = P(A1 I A2) = P(A1) I P(A2) = b) Avem 2 = 1 + 1; 3 = 1 + 2 = 2 + 1; 4 = 1 + 3 = 2 + 2 = 3 + 1 deci conform definiiei clasice a probabilitii avem P2 =

3 . 4

1 1 1 = . 2 2 4

1 1 1 = . 2 2 4

1 1 1 = ; 6 6 36

6 1 = ; 36 6

c) Avem 3 = 1 . 3 = 3 . 1; 4 = 1 . 4 = 2 . 2 = 4 . 1; 5 = 1 . 5 = 5 . 1 deci P3 =

3) Se dau dou urne U1 cu 7 bile albe i 3 bile negre i U2 cu 4 bile albe i 6 bile negre. Se extrage cte o bil din fiecare urn. Se cere: a) Probabilitatea P1 ca ambele bile s fie albe; b) Probabilitatea P2 ca bilele s fie de aceeai culoare; c) Probabilitatea P3 ca bilele s fie de culori diferite. Soluie a) Fie evenimentele: A1 = apariia unei bile albe din urna U1 i A2 = apariia unei bile albe din urna U2. Evenimentele A1 i A2 sunt independente deci: P1 = P(A1 I A2) = P(A1) . P(A2) =

7 . 36

7 4 = 28% ; 10 10 b) Evenimentele A1 I A2 i 1 I 2 sunt incompatibile deci P2 = P[(A1 I A2) U (1 I 2)] = P(A1 I A2) + P(1 I 2) + P(A1) . P(A2) + + P(1) . P(2) = 7 4 3 6 + = 46% 10 10 10 10
c) P3 = 1 P2 = 54% 4) Dou becuri au probabilitile de nedefectare : P(A1) = 0.8; P(A2) = 0.9 Se cere: a) Probabilitatea P1 ca prin circuitul serie al celor 2 becuri s treac curentul; b) Probabilitatea P2 ca prin circuitul paralel al celor 2 becuri s treac curentul.

12

Soluie Evenimentele A1, A2 sunt compatibile i independente. a) P1 = P(A1 I A2) = P(A1) . P(A2) = 0.8 x 0.9 = 72%; b) P2 = P(A1 U A2) = P(A1) + P(A2) P(A1) . P(A2) = 0.8 + 0.9 0.72 = 98% 5) Doi ochitori lovesc o int cu probabilitile P(A1) = 0.7; P(A2) = 0.8 Se cere: a) Probabilitatea P1 a lovirii intei dac trag simultan amndoi asupra ei; b) Probabilitatea P2 a lovirii intei dac primul ochitor execut dou focuri succesive asupra ei; c) Probabilitatea P3 a lovirii intei dac al II-lea ochitor execut dou focuri succesive asupra ei. Soluie A1, A2 sunt evenimente compatibile i independente. a) P1 = P(A1U A2) = P(A1) + P(A2) P(A1) . P(A2) = 0.7 + 0.8 0.7 . 0.8 = 94%; b) P2 = P(A1U A1) = P(A1) + P(A1) (PA1) . P(A1) = 0.7 + 0.7 0.7 . 0.7 = 91%; c) P3 = P(A2U A2) = P(A2) + P(A2) P(A2) . P(A2) = 0.8 + 0.8 0.8 . 0.8 = 96%. 6) Un soi de gru ndeplinete condiiile de calitate cu probabilitile: P(MMB standard) = 0.96; P(putere de germinare standard) = 0.97; P(umiditate standard) = 0.92 Se cere probabilitatea ndeplinirii standardelor pentru cele trei condiii. Soluie Condiiile din enun sunt dependente deci P(A1 I A2 I A3) > P(A1) + P(A2) + P(A3) 3 + 1 = 0.96 + 0.97 + 0.92 2 = 0.85 = 85%. 1.1.3 Probabilitile condiionate ale evenimentelor Pentru a descrie influena realizrii unui eveniment A1 asupra realizrii unui eveniment A2 se folosete probabilitatea condiionat. P A1 I A 2 Raportul se numete probabilitatea lui A2 condiionat de A1 i se noteaz P(A 1 ) PA1(A2) sau P(A2/A1). Observm c dac A1 i A2 sunt independente, avem : P(A1 I A2) = P(A1) . P(A2) deci P(A2) = P(A2).

De asemenea dac A1 implic pe A2 (A1 A2) atunci A1 I A2 = A1 deci P(A1 I A2) = PA1) aa c PA1(A2) = 1. Relaia de definiie P(A1 I A2) = P(A1) . PA1(A2) se extinde prin inductie dup n: P(A1 I I An) = P(A1) . PA1(A2) . . . PA1 I I An-1(An) (5)

Teorema 6.2 Dac = A1 U An cu A1, , An i Ai sunt incompatibile cte dou, pentru orice B avem : 1) (Formula probabilitii totale): P(B) = P(A1) . PA1(B) + + P(An) . PAn(B) (6) 2) (Formula Bayes): P(Aj) PAj (B) PB (Aj) = (7)

P(A1 ) PA1 (B) + ... + P(A n ) PAn (B)

13

pentru orice j = 1, , n Demonstraie 1) Din relaia = A1 U U An rezult B = (A1 I B) U U (An I B) A1, , An fiind incompatibile cte dou i A1 I B, , An I B vor fi incompatibile cte dou. Din axioma 2) a probabilitii rezult: P(B) = P(A1 I B) + + P(An I B) Dar P(Aj I B) = P(Aj) . PAj(B) ; (j = 1, , n) deci rezult relaia (6) din enunt: P(B) = P(A1) . PA1(B) + + P(An) . PAn(B) 2)Avem:

PB (Aj) =

; (j = 1, , n) adic relaia (7) din enun. Q . E . D. Exemple 1) La o tombol sunt 50 bilete din care 5 sunt ctigtoare. O persoan cumpr 3 bilete. Care este probabilitatea ca nici unul s nu fie ctigtor? Soluie Fie evenimentele Ai = biletul la extragerea Nr.i a ieit nectigtor (i = 1,2,3). Relaia (5) se scrie: P(A1 I A2 I A3) = P(A1) . PA1(A2) . PA1 I A2(A3) =

P(Aj) PAj (B) P(AjI B) = P(B) P(A1 ) PA1 (B) + ... + P(A n ) PAn (B)

2) O urn conine 12 bile albe i 8 bile negre. Se extrag succesiv din urn 3 bile cu bila nerevenit. Care este probabilitatea ca bilele extrase s fie n ordine: alb, neagr, alb? Soluie Fie evenimentul A1 = prima bil extras este neagr; A2 = a doua bil extras este neagr; A3 = a treia bil extras este alb. Relaia (5) se scrie:

45 44 43 = 72.7% 50 49 48

P(A1 I A2 I A3) = P(A1) . PA1(A2) . PA1 I A2(A3) =

12 8 11 = 15.4% 20 19 18

3) Se dau urnele U1 cu 12 bile albe i 8 bile negre, U2 cu 10 bile albe i 10 bile negre i U3 cu 6 bile albe i 14 bile negre. a) Se extrage o bil dintr-o urn. Care este probabilitatea ca ea s fie alb? b) Se extrage o bil dintr-o urn i se constat c este alb. Din ce urn provine bila extras? Soluie Fie evenimentele Ai = bila extras provine din urna Ui (i = 1,2,3) i B = bila extras este alb. a) Relaia (6) se poate scrie: P(B) = P(A1) . PA1(B) + P(A2) . PA2(B) + P(A3) . PA3(B) =

b) Relaia (7) se scrie pentru j = 1:

1 12 1 10 1 6 12 10 6 28 + + = + + = = 46.7% 3 20 3 20 3 20 60 60 60 60

14

Deci este mai probabil c bila alb extras s provin din urna U1. 4) Se dau urnele U1 cu 12 bile albe i 8 bile negre i U2 cu 6 bile albe i 14 bile negre. Din U1 n U2 se transfer o bil apoi se extrage o bil din U2. a) Care este probabilitatea ca bila extras din U2 s fie alb? b) tiind c bila extras din U2 a fost alb, ce culoare avea bila transferat? Soluie Fie evenimentele A1 = bila transferat din U1 n U2 a fost alb, A2 = bila transferat din U1 n U2 a fost neagr; B = bila extras din U2 este alb. a) Relaia (6) pentru n = 3 se scrie: P(B) = P(A1) . PA1(B) + P(A2) . PA2(B) = =

12 28 12 : = = 42.8% P(B) 60 60 28 10 6 Analog PB(A2) = = 35.7 % ; PB(A3) = = 21.5% 28 28 PB (A1 ) = =

P(A1 ) PA1 (B)

12

b) Relaia (7) pentru j = 1 se scrie: PB(A1) =

20 21

20 21

84

420 =

48

420 :

132

420 =

= 31.4% 84

P(A1 ) PA1 (B) P(B) 48 132

84

132

420 420

132

= 63.6%

Analog PB(A2) =

= 36.4% deci este mai probabil c bila transferat din U1 n

U2 a fost alb. 5) Trei boli la bovine au probabilitile P(A1) = 0.45; P(A2) = 0.36; P(A3) = 0.19 Aceste boli modific un parametru sanguin cu probabilitile PA1(B)=0.23; PA2(B)=0.41; PA3(B)=0.75 a) Care este probabilitatea ca o vac bolnav de una din cele trei boli s aib parametrul sanguin modificat? b) La o vac se constat c parametrul sanguin este modificat de una din cele trei boli. Care din boli a provocat modificarea? Soluie Fie evenimentele Ai = vaca s-a mbolnvit de boala cu nr. i (i = 1,2,3); B = vaca are parametrul sanguin modificat. a) Conform relaiei (6) pentru n = 3 avem: P(B) = P(A1) . PA1(B) + P(A2) . PB(A2) + P(A3) . PA3(B) = 0.45 . 0.23 + 0.36 . 0.41 + . 0.19 0.75 = 0.1035 + 0.1476 +0.1425 = 39.36% b) Relaia (7) pentru j = 1 devine:

PB (A1 ) =

P(A1 ) PA1 (B) P(B) 0.1476 0.3936

0.1035

0.3936

= 26.3%
PB(A3) =

Analog PB(A2) =

= 37.5% ;

0.1425 0.3936

= 36.2% deci este

mai probabil c boala nr. 2 a modificat parametrul sanguin.


6.2 Variabile aleatoare

15

6.2.1 Densitatea de probabilitate i funcia de repartiie

Fie spaiul evenimentelor elementare asociat unui eveniment aleator i P() o algebr de evenimente incluse n . Fie mulimea numerelor reale R i - algebra mulimilor boreliene B P(R) adic cea mai mic - algebr de submulimi ale lui R care conine toate intervalele din R. Fie cmpul de probabilitate (, , P).O variabil aleatoare este o funcie X: R astfel c { / X() B} pentru orice mulime borelian B P(R).Dac mulimea valorilor variabilei aleatoare X este numrabil (ir finit sau infinit): x1, x2, , xn, atunci {X = xi} sunt evenimente i cunoaterea lui P(X = xi) = f(xi) (i =1,2,3,) permite calculul lui P(X B) = f(xi) unde nsumarea se face dup valorile lui i pentru care xi B. Funcia xi f(xi) (i N) se numete densitatea de probabilitate a variabilei aleatoare X. Avem: 1 = P() = f(x i )

Dac mulimea valorilor variabilei aleatoare X este nenumrabil, densitatea de


probabilitate este o funcie real f(x) > 0 astfel c P(a < X < b) = = f(x)dx
b a

iN

n particular 1 = P( X ) = n acest caz P(X B) = f(x)dx


B

f(x)dx

Observm c orice constant a R este formal o variabil aleatoare X cu valoarea a i P(X = a) = 1. O variabil aleatoare cu mulimea valorilor numrabil se numete discontinu iar o variabil aleatoare cu mulimea valorilor nenumrabil se numete continu. Exemple de variabile aleatoare discontinue 0 1) Cu codificarea 1 = stema, 0 = banul, variabila aleatoare X: este asociat aruncrii unei monezi; 2) La aruncarea unui zar avem variabila aleatoare X:

1 5 6

1/6 1/6 1/6 1/6 1/6 1/6

3) Se d o urn U cu 4 bile albe i 6 bile negre. Se extrag n = 2 bile succesiv cu bila revenit. Pot apare x = 0,1,2 bile albe deci avem variabila aleatoare X:
9/25 12/25 4/25

Variabilele de la punctele 1) i 2) se numesc uniforme deoarece toate valorile au aceeai probabilitate (densitatea de probabilitate este funcie constant) iar variabila de la punctul 3) nu este uniform. mx, x [2;4] 4) Fie funcia f(x) = in rest 0

16
+

f(x) este densitatea de probabilitate a unei variabile aleatoare continue dac

f(x, y) 0 deci

1 m = . Este vizibil c f(x) > 0. 6

mxdx = 1 -

sau

mxdx = 1 adic
2

m.

4 2

f(x) = 1 i
= 1 deci

Funcia real F(x) = P(X < x) se numete funcia de repartiie a variabilei aleatoare X.

Teorema 6.1 Avem proprietile: 1) F(x) ia valori n [0,1];

lim F(x) = 0; lim F(x) = 1 x x 2) F(x) este o funcie continu la stnga: lim F(x) = F(x0)
xx0

3) F(x) este funcie cresctoare: x1 < x1 F(x1) < F(x2) 4) P(a < X < b) = F(b) F(a) P(X < b) = F(b) P(a < X) = 1 F(a) Demonstraie 1) Evident 0 < F(x) < 1 conform definiiei lui F i punctului 3) din teorema 1.1. Fie irul descresctor Xn cu limita - i evenimentele : A0 = X < x1, Bn = < X < Xn-1 (n > 2). Avem Bi I Bj = pentru i j i A0 = U B n deci

P(A 0 ) =

F(x3)] + + [F(xn) F(xn+1)] + adic F(x1) = F(x1) -

n2

P(Bn )

n2

sau F(x1) = [F(x1) F(x2)] + [F(x2) F(x3)] + + +[F(x2)


x n

lim

F(x n ) aa c

x n

lim

F(x n ) = 0 .
x n

Relaia

lim

F(x n ) = 1 se demonstreaz n mod analog.

2) Fie irul cresctor Xn cu limita x0. Fie evenimentele A = X < x0; A0 = X < x1; An = xn < X < xn+1 (nN). Avem Ai I Aj = pentru i j i A = A0 U A1 U A2 U An U deci P(A) = P(A0) + P(A1) + + P(An) + adic F(x0) = F(x1) + [F(x2) F(x1)] + + [F(xn) F(xn-1)] + adic F(x0) = lim F(x n ) deci F este continu la stnga n x0. 3) Fie evenimentele A = X < x1; B = X < x2. Cum x1 < x2 rezult A B deci P(A) < P(B) aa c F(x1) < F(x2) deci F este cresctoare. 4) Fie evenimentele A = X < a;B = X < b;C = a < X < b. Avem A I C = i A U C = B deci P(B) = P(A) + P(C) sau F(b) = F(a) + P(a < X < b). Punnd n aceast relaie a = x0, b = x0 + X avem P(x0 < X < x0 + X) =
xn x0

17

= F(x0 + x) F(x0). Cum F(x) este continu la stnga, pentru X 0 egalitatea precedent devine: P(X = x0) =0. n particular P(X = b) = 0 i cum evenimentele a < X < b i X = b sunt compatibile, putem scrie P(a < X < b) = P(a < X < b) + P(X = b) = = F(b) F(a) + 0 = F(b) F(a) n fine P(X < b) = F(b) - lim F(x) = F(b) 0 = F(b) i P(a < X) = 1 P(X < a) = 1 F(a) Q.E.D.
x

Dac X este variabil aleatoare discontinu cu repartiia repartiie : 0 P1 ,x < x1 ,x1 < x < x2 , xn < x

x1 ,........x n , ea are funcia de p1 ,.......p n

F(x) =

.. P1 + + pn-1,
1

xn-1 < x < xn

Dac X este variabil aleatoare continu cu densitatea de probabilitate f(x), X are funcia de repartiie F(x) =
x

Reciproc, avem F(x) = f(x). Pe graficul lui f(x), F(x) este aria de sub grafic aflat n stnga ordonatei lui x:

f(t)dt .

f(x) F(x)

x
Exemple 1) Pentru variabila aleatoare discontinu X cu repartiia :

X:

10

ave

avem densitatea de probabilitate:

0.11 0.42 0.30 0.07 0.10


0.11 0.42 0.30 0.07 ,x=1 ,x=2 ,x=4 ,x=6

f(x) =

18

0.10 0

, x = 10 n rest F(x) =

i funcia de repartiie:

0 0.11 0.53 0.83 0.90 1

,x<1 ,1<x<2 ,2<x<4 ,4<x<6 , 6 < x < 10 , 10 < x

Avem P(1.5 < X < 7.4) = F(7.4) F(1.5) = 0.90 0.11 = 69% P(X < 5.8) = F(5.8) = 83%; F(3.4 < X) = 1 F(3.4) = 1 0.53 = 47% 2) Pentru variabila aleatoare continu X cu densitatea de probabilitate : x x , x [ 2; 4] f(x) = 6 avem funcia de repartiie F(x) = f(t)dt 0 n rest
Pentru x < 2 avem

F(x) =

0dt = 0
x

x t t 1 2 (x 4) iar pentru Pentru 2 < x < 4 avem F(x) = dt = dt = 6 6 12 2

x > 4 avem

4 t t = dt dt = 1 6 6 2

P(2.3 < X < 3.6) = F(3.6) F(2.3) = P(X < 3) = F(3) =

Dou variabilele aleatoare X1, X2 se numesc independente dac P(X1 B1 i X2 B2) = P(X1 B1) . P(X2 B2) n particular dac X1, X2 sunt variabile aleatoare discontinue, X1, X2 sunt independente dac pentru orice x1, x2 R evenimentele X1 = x1 i X2 = x2 sunt independente adic P(X1 = x1 i X2 = x2) = P(X1 = x1) . P(X2 = x2) Exemple 1) Aruncarea a dou monezi sau zaruri care nu se ciocnesc, dau natere la variabile aleatoare independente; 2) Extragerea a cte unei bile albe din dou urne dau natere la variabile aleatoare independente. ntre variabilele aleatoare independente se fac operaiile aritmetice obinuite. Fie de exemplu variabilele aleatoare discontinue independente X i Y cu repartiiile

1 2 (3 4) = 42.7% 12 1 (2.52 4) = 81.2% P(2.5 < X) = 1 F(2.5) = 1 12

1 [(3.62 4) (2.32 4)] = 63.9% ; 12

x1 , ______ x m X : p , ______ p ; 1 m

y1 , ______ y n Y : q , ______ q 1 n

19

deci rij = P(X = xi i Y = yj) = P(P(X = xi) . P(Y = yj) = pi . qj Dac a R, avem variabila aleatoare constant a : 1 Vom avea variabilele aleatoare cu repartiiile

i = 1, .... m j 1, .... n =

xi a ax i X x i /a (a 0) : X aX : ; ; p p p a i i xi y j x ia ; respectiv X Y : Xa : p pi q j i

xi y j X x i /y j XY : : ; (yj 0) pi .q j pi .q j Y Dac X este variabil aleatoare continu cu densitatea de probabilitate f(x), atunci se arat c variabila aleatoare Y = (X) unde este o funcie bijectiv i derivabil, va avea densitatea de probabilitate: g(y) = f[-1(y)] . [ 1 (y) ]'
Exemplu Se d variabila aleatoare X cu densitatea de probabilitate :

f(x) =

x 2 0

, x [0, 2] , n rest

Se cere densitatea de probabilitate a variabilelor Y = 2X + 3;Y = e4X;Y = ln(X + 1) Soluie y3 1 a) Y = 2X + 3 1 (y) = a a c ; [ -1 (y)]' = 2 2 y -3 , x [3; 7] g(y) = 8 0 , n rest
b) Y = e4X 1 (y) =
lny 32y 0

lny ; 4

[ -1 (y)]' =

1 a a c : 4y

g(y) =

, y [1; e8 ] , n rest

c) Y = ln(X + 1) 1 (y) = e y 1; [ -1 (y)]' = e y

deci

20

g(y) =

e 2y - e y 2 0

, y [0; ln3] , n rest

6.2.2 Indicatori numerici

n afar de funcia de repartiie F(x), variabila aleatoare X are i urmtorii indicatori numerici:

1) Media M(X) =

xf(x)dx
xi ; (i N) pi

Dac X este discontinu cu repartiia X : avem M(X) =

xp
iN i

2) Mediana Me(X) este definit de relaia: F(Me) = 3) Modul Mo(x) este punct de maxim pentru f(x)

1 2

4) Variana V(X) = M[(X M(X)) ] =

[x M(X)] f(x)dx
2

Dac X este discontinu cu repartiia X : avem V(X) =

[x
iN

xi ; (i N) pi

- M(X)]2 pi
este minim pentru x = M(X) i are valoarea minim V(X).

Observm c eroarea ptratic total : SPA(x) =


i N

(x x i ) 2 pi

Exemple 1) Pentru variabila aleatoare discontinu X cu repartiia :

V(X) (X) 6) Coeficientul de variaie c(X) = 100 (%) M(X)


5) Abaterea standard

(X) =

2 4 6 10 1 X : avem 0.11 0.42 0.30 0.07 0.10

M(X) = 1 x 0.11 + 2 x 0.42 + 4 x 0.30 + 6 x 0.07 + 10 x 0.10 = 3.57 ; Me(X) = 4; Mo(X) = 2

21

V(X) = (1 3.57)2 x 0.11 + (2 3.57)2 x 0.42 + (4 3.57)2 x 0.30 + + (6 3.57)2 x 0.07 + (10 3.57)2 x 0.10 = 6.3651

(X) = 6.3651 = 2.52


c(X) = 2) Pentru variabila aleatoare continu X cu densitatea de probabilitate :

2.52 = 70.6% 3.57


x 6 0

f(x) =

, x [2; 4] , n rest
4 4

avem :

x 1 2 x3 4 1 3 (4 23 ) = 3.11 M(X) = xf(x)dx = x dx = x dx = 2= 6 62 18 18 2


F(x) =

x2 4 1 = Me(X) = 10 = 3.16; Mo(X) = 4 cci f(x) este cresctoare . 12 2 V(X)=


2

x2 4 12

pentru x [2; 4]

deci

x 1 [x M(X)] f(x)dx (x 3.11) dx (x 3 6.22x 2 + 3.112 x) = = = 6 62 2 2 1 x4 x3 2 x 4 = 6.22 + 11 = 0.6543; (X) = 0.6543 = 0.81 6 4 3 2 2 0.81 c(X) = = 26% 3.11
2

Proprietile mediei M(X) n raport cu operaiile cu variabile aleatoare, sunt date de:

Teorema 6.2 Avem proprietile: 1) M(a) = a 2) M(X + a) = M(X) + a 3) M(aX) = aM(X) 4) M(X + Y) = M(X) + M(Y) 5) Dac X, Y sunt independente, avem : M(X . Y) = M(X) . M(Y) Demonstraie Relaiile rezult prin calcul direct pentru variabile discontinue : x1 ... x m y1 ... y n i se generalizeaz pentru variabile continue X: Y : ; p1 ... p m q1 ... q n folosind liniaritatea integralelor Q.E.D.

22

Proprietile variantei V(X) n raport cu operaiile cu variabile aleatoare sunt date de:
Teorema 6.3 Avem proprietile: 1) V(a) = 0 2) V(X + a) = V(X) 3) V(aX) = a2V(X) 4) V(X) = M(X2) M2(X) 5) X, Y = independente V(X + Y) = V(X) + V(Y) Demonstraie Relaiile rezult prin calcul direct (folosind i teorema 6.2) pentru variabile discontinue : x1 ... x m y1 ... y n X: ; Y : i se generalizeaz pentru variabile continue folosind p1 ... p m q1 ... q n liniaritatea integralelor Q.E.D. Fie X o variabil aleatoare cu media M(X) i variana V(X) si fie > 0. Dac cunoatem funcia de repartiie F(x) avem P(M(X) < X < M(X) + ) = P X M(x) < = F[M(x) + ] F[M(x) ] .

n caz contrar aplicm inegalitatea Cebev valabil pentru >


Teorema 6.4

(X), dat de:

P( X M(X) < ) 1
Demonstraie

V(X) 2 x1 , ........, x n

Fie variabila aleatoare discontinu X cu repartiia X : p , ........, p 1 n Fie I =

{ i [1;n] : x
n

M(X) > }
n i =1

deci :
iI

P ( X M(X) < ) = 1 P ( x i M(X) > ) = 1 pi Avem V(X) = [ x i M(X) ] pi [ x i M(X) ] pi 2 pi aa c:


2 2

V(X) 2

i =1

iI

iI

1 p i = P( X M(X) < ) .
iI

Demonstraia cnd X este variabil aleatoare continu se face la fel ca mai sus, nlocuind sumele cu integrale. Q.E.D. Exemple 1) Se d variabila aleatoare discontinu X cu repartiia :

2 4 6 10 1 X: i cu M(X) = 3.57; V(X) = 6.3651; 0.11 0.42 0.30 0.07 0.10 (X) = 2.52. Se cere o margine inferioar pentru P ( X 3.57 < 3)

Soluie

23

Conform inegalitii Cebev cu = 3

P ( X 3.57 < 3) 1

2) Pentru variabila aleatoare continu X cu densitatea de probabilitate X , X [ 2; 4] f(X) = 6 i cu M(X) = 3.11;V(X) = 0.6543; (X) = 0.81 0 , n rest Se cere o margine inferioar pentru P X < 3,11 < 1 .
Soluie Conform inegalitii Cebrev cu = 1 >

V(X) 6.3651 = 1 = 29.3% . 2 9

(X) avem:

P ( X 3.11 < 1) 1

V(X) 0.6543 = 1 = 34.6% 2 1

(X) avem:

6.2.3 Funcia caracteristic

Un instrument puternic n studiul variabilelor aleatoare ofer funcia caracteristic. Fie X o variabil aleatoare cu densitatea de probabilitate f(X) i fie variabila aleatoare complex: Funcia complex de variabil real : (t) = M(eitX) = M(cos tX + isin tX) se numete funcie caracteristic a variabilei aleatoare X. Dac X este variabil aleatoare discontinu avem :

eitX = cos tX + i sin tX

(t ) = e p j
itx j jN

Dac X este variabil aleatoare continu avem :

(t) =

n ambele cazuri (t) este funcie continu.


Teorema 6.5 Avem proprietile: 1) (0) = 1;

itx e f(x)dx .

(t) 1; (-t) = (t)

2) Dac X are funcia caracteristic (t) atunci aX are funcia caracteristic (at). 3) Dac X, Y sunt independente i au funciile caracteristice 1(t), 2(t) atunci variabila aleatoare X + Y are funcia caracteristic 1(t) . 2(t). 4) Momentele de ordin k ale lui X sunt date de relaiile: (k) (0) M(X k ) = ; (k N) ik Demonstraie 1) (0) = M(e0) = M(1) = 1

24
+ + + +

(t) =

itx e f(x)dx

e f(x)dx =
itx

cos tx + i sin tx f(x)dx

f(x)dx = 1

( t) = M(e itX ) = M(cos tX - i sin tX) = (t)


2) Variabila aleatoare aX are funcia caracteristic :

M(e

ia tX

)=

3) X + Y are funcia caracteristic:

i(at)x

f(x)dx = (at)
cci X, Y sunt

(t) = M(eit(X+Y) ) = M(ei t X .eitY ) = M(eit X ).M(ei t Y )


(k)

independente deci (t) = 1(t) . 2(t) 4) Derivm funcia caracteristic de k ori:

(t) =

(ix)

e f(x)dx = i
k k

itx

xe
k

k itx

f(x)dx
Q.E.D.

deci

(k) (0) = i k

x f(x)dx = i M(X

Inversarea transformatei Fourier permite exprimarea n mod unic a densitii de probabilitate f(x) a variabilei aleatoare X cu ajutorul funciei caracteristice (t):

Teorema 6.5 transfer proprietile lui (t) la f(x):


+

1 i t x f(x) = e (t)dt 2

1) f(x) > 0;

2) Dac variabila aleatoare X are densitatea de probabilitate f(x), variabila aX are densitatea a.f(x). 3) Dac variabilele aleatoare independente X, Y au densitile de probabilitate f1(x), f2(x), atunci variabila aleatoare X+Y are ca densitate de probabilitate produsul de convoluie
+

f(x)dx = 1

al lui f1(x), f2(x):

f(x) =

4) Momentele de ordin k ale variabilei aleatoare X sunt date de relaia:

f(s)g(x s)ds = f(x s)g(s)ds


+ k

M(X
Exemple

) = x f(x)dx
1 2 4 X: 0.1 0.6 0.3

1) Fie variabila aleatoare discontinu X cu repartiia S se afle funcia caracteristic (t) Soluie

(t) = eit 0.1 + e2it 0.2 + e 4it 0.3

2) Fie variabila aleatoare continu X cu densitatea de probabilitate

25

Soluie

x f(x) = 6 0
+

, x [ 2; 4] n rest
itx

Se cere funcia caracteristic (t)

(t) =
= 1 6t
2

[(1 4it )e

4 1 4 itx 1 4 f(x)dx = e xdx = x cos t x dx + i x sin tx dx = 62 6 2 2 4it

(1 2it )e 2it

6.3 Vectori aleatori 6.3.1 Densitatea de probabilitate i funcia de repartiie

Fie spaiul euclidian Rn i - algebra mulimilor boreliene B P(Rn) adic cea mai mic - algebr de submulimi ale lui Rn care conine toate intervalele din Rn. Fie cmpul de probabilitate (, K, P). Un vector aleator n dimensional este o funcie X = (X1, , Xn): Rn astfel c X(( B K pentru orice mulime borelian B P(Rn).

Componentele X1, , Xn sunt variabile aleatoare numite variabile marginale pentru X. Pentru simplificarea expunerii, vom prezenta cazu n = 2 adic vectorii aleatori bidimensionali Z = (X, Y). Dac mulimea valorilor vectorului aleator Z = (X, Y) este numrabil (ir finit sau infinit) vectorul aleator se numete discontinuu. De exemplu dac variabila aleatoare X ia valorile x1, .., xm iar variabila aleatoare Y ia valorile y1, , yn, cunoaterea lui rij = P(X = xi i Y = yj) adic a densitii de probabilitate a lui Z = (X, Y) cu 1 = rij permite cunoaterea repartiiei vectorului aleator discontinuu
i =1 j =1 m n

Z = (X, Y) Repartiia vectorului aleator discontinuu Z = (X, Y) se d prin tabelul:


Y X x1 . . . . xm Suma coloan

y1 yn r11 .. r1n

Suma linie

rm1 ...rmn p1 pn

q1 . . . . qn 1

26
m x1 ___ x m Variabila marginal X are repartiia X : = xipi i variana: p ___ p media: M(X) i =1 1 m

V(X) = x i 2 p i M(X) 2
i =1

Variabila marginal Y are repartiia Y : = y jq j i variana: q ___ q media: M(Y) j=1 1 n

y1 ___ Yn

V(Y) = y j 2 q j M(Y) 2
j =1

Exemplu La tragerea la int, orice lovitur este caracterizat de perechea (X, Y) unde X este abaterea n direcie fa de centrul O al intei i Y este abaterea n nlime fa de centrul O al intei iar rij = P(X = xi i Y = yj); i, j N este probabilitatea ca o lovitur s aib abaterea n direcie xi i n nlime yj. Dac mulimea valorilor vectorului aleator Z = (X, Y) este nenumrabil atunci vectorul aleator se numete continuu i densitatea sa de probabilitate este o funcie real f(x, y) > 0

astfel c P(a < X < b i c < Y < d) =

f(x, y)dxdy .
ac
+ +

bd

n particular 1 = P(X R si Y R) =
Exemplu

f(x, y)dxdy

mx 2 y, x [2;4] Fie funcia f(x, y) = y [1;3] i f(x,y) este densitatea de probabilitate al 0 in rest
+ +

vectorului aleator continuu Z = (X, Y) dac


+ +

f(x, y) = 1 i f(x,y) > 0 deci

mx

ydxdy = 1 sau m x 2 dx ydy = 1 deci 56 3 4 = 1 aa c m = . Vizibil f(x,y) > 0. 3 224


2 1

Funcia de repartiie a vectorului aleator Z = (X, Y) este F(x, y) = P(X < x i Y < y). Ca i n cazul variabilei aleatoare (teorema 2.1.) se demonstreaz: Teorema 6.6 Avem proprietile: 1) F(x, y) ia valori n [0; 1];

27

lim

F(x, y) =

lim

F(x, y) =

(x, y) ( , + )

lim

F(x, y) = 1

2) F este continu la stnga n raport cu fiecare variabil: lim F(x, y) = F(x 0 , y) ; lim F(x, y) = F(x, y 0 )
xx

3) F este cresctoare n raport cu fiecare variabil: x1 < x2 F(x1, y) < F(x2, y) y1 < y2 F(x, y1) < F(x, y2) 4) P[a < X < b i c < Y < d] = [F(b,d) F(a,d)] - [F(b,c) F(a,c)] P(X < b i Y < d) = F(b,d) P(a < X i c < Y) = 1 F(a,c) Variabilele aleatoare X, Y care compun vectorul aleator Z = (X, Y) , au funciile de repartiie: F1 (x) = lim F(x, y) i F2 (y) = lim F(x, y)
y x

Cunoscnd densitatea de probabilitate f(x,y) a vectorului aleator X = (X,Y), funcia sa de repartiie este dat de relaia:

F(x, y) =

Reciproc ,dac F(x,y) este derivabil de dou ori n raport cu x, y avem densitatea de probabilitate f(x,y) = Fxy(x,y). Variabilele X, Y vor avea densitile de probabilitate:

f(s, t)ds dt

f1 (x) = f 2 (y) =

f(x, y)dy = F'1 (x) f(x, y)dx = F'2 (y)

Exemplu Pentru vectorul aleator Z = (X, Y) cu densitatea de probabilitate

3 2 224 x y ; x [2,4] f(x, y) = y [1,3] 0 in rest


x y x y 2

avem funcia de repartiie

y x 3 2 3 s3 x t 2 y F(x, y) = f (s, t)ds d t = s tds d t = s ds tdt = 14 224 3 2 0 , x < 2 sau y < 1 1 (x 3 23 )(y 2 12 ) n rest adic: F(x, y) = 448 1 , x > y si y > 3

Pe graficul suprafeei z = f(x, y), densitatea de probabilitate f(x, y) este cota punctului de abscis x i ordonat y iar funcia de repartiie F(x, y) este volumul de sub suprafaa

28

z = f(x, y) aflat n semispaiul Z > 0 i n stnga planelor X = x i Y = y.


Teorema 6.7 Variabilele aleatoare X, Y din componena vectorului aleator Z = (X, Y) sunt independente dac i numai dac F(x, y) = F1(x) . F2(y) sau dac i numai dac f(x, y) = f1(x) . f2(y) Demonstraie X, Y sunt independente dac i numai dac evenimentele X < x i Y < y sunt independente dac i numai dac P(X < x i Y < y) = P(X < x) . P(Y < y) dac i numai dac F(x, y) = F1(x) . F2(y) de unde prin derivare parial n raport cu x, y obinem Fxy(x, y) = F1(x) . F2(y) adic f(x, y) = f1(x) . f2(y). Q.E.D. 6.3.2 Indicatori numerici

n afar de funcia de repartiie F(x, y), vectorul aleator Z = (X, Y) are i urmtorii indicatori numerici: 1) Vectorul medie M(Z) = (M(X), M(Y)) unde

M(X) =

xf1 (x)dx;

M(Y) =

yf 2 (y)dy
x1 ___ x m
n

Dac X, Y sunt discontinue, de exemplu dac X : p ___ p 1 m

y1 ___ y n Y : q ___ q 1 n

avem:

M(X) = x i p i ;
i =1

M(Y) = y jq j
j =1

2) Matricea de covarian : C(Z) =

C(X, X) C(X, Y) C(Y, X) C(Y, Y)

Aici C(X, Y) este covariana variabilelor aleatoare X, Y dat de relaia de definiie: C(X, Y) = M[(X M(X) . (Y M(Y)]. Dac X, Y sunt discontinue, avem:

C(X, Y) = (x i M(X)) (y j M(Y)) rij


i = 1 j =1

m n

unde rij = P(X = xi i Y = yj) Dac X, Y sunt continue avem:


+ +

C(X, Y) =

Este vizibil c C(X,Y) = C(Y,X) De asemenea avem:

(x M(X) (y M(Y)) f (x, y)dx dy


m 2

C(X, X) = V(X) = (x i M(X)) p i =


i =1
n

C(Y, Y) = V(Y) = (y j M(Y)) 2 q j =


j =1

(x M(X)) f1 (x)dx
(y M(Y)) f 2 (y)dy

respectiv:

Observm c eroarea ptratic total :

29
m n

SPA(x, y) = (x x i ) 2 pi + (y y j ) 2 q j este minim pentru


i =1 j=1

x = M(X), y = M(Y), valoarea minimului fiind urma V(X) + V(Y) a matricii de covarian C(Z). 2) Funcia de regresie Y = g(X) n cazul vectorului aleator discontinuu Z = (X,Y) definim mediile condiionate:

M c (x i ) = M X = x i (Y) = y jrij se definete prin relaiile: g(xi) = MX=xi (Y)


j =1

n cazul vectorului aleator continuu Z = (X,Y) definim mediile condiionate:


+

Mc(xi) = MX=Xi(Y) =

relaia:

g(x) = Mc(x) 4) Coeficientul de corelaie liniar al variabilelor aleatoare X,Y este definit de

yf(x, y)dy

iar funcia de regresie va fi:

(X, Y) =

C(X, Y) C(X, Y) = V(X) V(Y) (X) (Y)

Proprietile covarianei C(X,Y) n raport cu operaiile cu variabile aleatoare, sunt date de:
Teorema 6.8 Avem proprietile: 1) C(a,b) = 0 2) C(X + a, Y + b) = C(X,Y) 3) C(aX, bX) = abC(X,Y)

4) C(X,Y) = M(X . Y) M(X) . M(Y) =

5) Dac X,Y sunt variabile aleatoare independente atunci C(X,Y) = 0 adic X,Y sunt necorelate liniar. Dac X,Y sunt variabile aleatoare normale este adevrat i reciproca. Demonstraie Relaiile 1) 4) rezult prin calcul direct, folosind teoremele 6.2 i 6.3 i definiia lui C(X,Y).Dac X = Y, din teorema 6.8 reobinem teorema 6.3. S demonstrm punctul 5) din enun. Dac X,Y = variabile aleatoare independente, conform teoremelor 6.2 i 6.3 avem M(X . Y) = M(X) . M(Y) respectiv V(X + Y) = V(X) + V(Y) deci conform punctului 4) din enun, avem C(X.Y) = 0 adic X, Y nu sunt corelate liniar. Reciproca pentru X, Y = variabile aleatoare normale va fi demonstrat n teorema 6.10. Dac X, Y nu sunt variabile aleatoare normale, reciproca afirmaiei de la punctul 5) din enun, nu este adevrat: exist variabile necorelate liniar care sunt dependente. Exemplu Pentru vectorul aleator discontinuu Z = (X, Y) cu repartiia Y 1 3 Suma p X 1 0.4 0 0.4 2 0.1 0.5 0.6 Suma q 0.5 0.5 1

1 [V(X + Y) V(X) V(Y)] 2

30

avem C(X, Y) = 0 dei: 0.1 = P(X = 2, Y = 1) P(X = 2) . P(Y = 1) = 0.6 . 0.5 = 0.3.Q.E.D. Proprietile coeficientului de corelaie liniar (X,Y) n raport cu operaiile cu variabile aleatoare sunt date de:
Teorema 6.9 Avem proprietile: 1) (a, b) = 0 2) (X + a, Y + b) = (X,Y) 3) (aX, bY) = (X, Y) 4) (X, Y) 1; (X, Y) = 1; dac i numai dac X,Y sunt dependente funcional

liniar: Y = aX + b 5) Dac X, Y sunt variabile aleatoare independente atunci (X, Y) = 0 adic X, Y sunt necorelate liniar. 6) Dac X, Y sunt variabile aleatoare normale, este adevrat i reciproca. Demonstraie Relaiile 1) 3) rezult prin calcul direct, folosind teoremele 6.3, 6.8 i definiia lui (X, Y) =

C(X, Y) . Din relaiile 2) 3) rezult: V(X) V(Y)

Relaia 5) din enun rezult din relaia 5) a teoremei 2.8 i din definiia lui (X, Y). S demonstrm punctul 4) din enun. Avem V[ (Y) . X - (X) . Y] > 0, relaie n care folosim teoremele 2.2, 2.3, 2.8 i obinem: 2(X) . 2(Y) - (X) . (Y) . C(X,Y) > 0 sau

X M(X) Y - M(Y) (X, Y) = C (X) , (Y)

(X, Y) 1

n mod analog relaia V[ (Y) . X +

C(X, Y) 1 (X)(Y)

(X) . Y] > 0 conduce la relaia (X, Y) > - 1 deci

Dac (X, Y) = 1 s artm c Y = aX + b. Fie funcia E(a, b) = M[(Y aX b)2] Folosind teoremele 2.2, 2.3, 2.8, avem: E(a, b) = V(Y) + a2V(X) 2a (X, Y) . (X) (Y) + [M(Y) aM(X) - b]2 Pentru a minimiza funcia E(a, b), anulm derivatele sale pariale n raport cu a, b:

cu soluia:

E' a = 2aV(x) 2X, Y) (X)(Y) 2M(X) [M(Y) aM(X) b] = 0 E' b = 2[M(Y) aM(X) b]
(Y) (X)

a = (X, Y)

b = M(Y) aM(X)

Valoarea minimului este E min = [1 (X, Y)] V(Y) .

31

Dac (X, Y) = 1 avem Emin = 0 adic: M(Y aX b) = 0 deci Y = aX + b Reciproc, dac Y = aX + b s artm c (X, Y) = 1

Avem (X, Y) = (X, aX + b) = deoarece V(X) a 2 V(X) C(X,aX + b) = M[X(aX + b)] M(X) . M(aX + b) = C(X, aX + b) = V(X) V(aX + b) aV(X) = 1 =1 a

= aM(X2) aM2(X) = aV(X) Dac a > 0 avem (X, aX + b) = 1 iar dac a < 0 avem (X, aX + b) = -1 a se numete coeficientul de regresie liniar iar b se numete termenul liber al regresiei. Exemplu Fie vectorul aleator discontinuu Z = (X, Y) cu repartiia: X 1 2 Suma q Y 1 0.5 0 0.5 2 0.1 0 0.1 0 0 0.4 0.4 Suma p 0.6 0.4 1

S se calculeze M(Z), C(Z), Y = g(X), (X, Y) i coeficienii regresiei liniare a, b. Soluie

Vectorul medie este M(Z) =( 1.4; 1.9) Avem covariana C(X, Y) =( 1 1.4) . (1 1.9) . 0,5 + (1 1.4) . (2 1.9) . 0.1 + (2 1.4) . (2 1.9) . 0.4 = 0.44 Matricea de covarian va fi:

1 2 are media M(X) = 1.4 X: 0.6 0.4 i variana V(X) = 0.2 1 2 3 are media M(Y) = 1.9 Variabila Y : 0.5 0.1 0.4 i variana V(Y) = 0.89
Variabila

Avem mediile condiionate: MX=1(Y) = 1 . 0.5 + 2 . 0.1 + 3 . 0 = 0.7 MX=2(Y) = 1 . 0 + 2 . 0 + 3 . 0.4 = 1.2 deci funcia de regresie Y = g(X) are forma tabelar: Avem coeficientul de corelaie liniar :

0.24 C(Z) = 0.44

0.44 0.89

(X, Y) =

C(X, Y) 0.44 = = 0.96 V(X) V(Y) 0.24 0.89


(Y) 0.89 = 0.96 = 1.85 (X) 0.24

x 1 2

g(x) 0.7 1.2

Coeficientul de regresie este:

a = (X, Y)

Termenul liber al regresiei este: b = M(Y) aM(X) = 1.9 1.85 . 0.24 = 1.46

32

6.4 Variabile aleatoare discontinue 6.4.1 Variabila binomial

Variabila aleatoare binominal este variabil aleatoare cu un numr finit de valori avnd ca model schema bilei revenite. Aceast schem este un caz particular al unei scheme mai generale, numit schema lui Poisson care const n urmtoarele: Se dau n urne: U1 cu a1 bile albe i b1bile negre, Un cu an bile albe i bn bile negre. Se extrag n bile, cte una din fiecare urn (extrageri independente). Probabilitatea de a extrage o bil alb din urna Uj este : pj =(aj / (aj +bj ) iar probabilitatea de a extrage o bil neagr din urna Uj este qj = 1- pj (1j n).
Teorema 6.10 Probabilitatea ca din n bile s obinem k bile albe (k=0,1,.,n) i restul negre, este coeficientul lui tk n produsul (p1t+q1).(pnt +qn) este : Demonstraie Fie Aj evenimentul extrageii unei bile albe din urna Uj i j evenimentul extragerii unei bile negre din urna Uj (1jn). Obinerea a k bile albe i n-k bile negre cnd se extrage cte o bil din fiecare din cele n urne, const n realizarea unui eveniment de forma: An,k = Ai1..Aik A ik+1.. A in unde i1,.., in este o permutare a indicilor 1,n. Cum evenimentele Aj, A j sunt independente cte dou, avem:

Pn ,k = pi1 ...pik qik +1 ....qin

Evenimentele An,k fiind incompatibile cte dou, probabilitatea Pn,k a obinerii a k bile albe i n-k bile negre n schema Poisson, va fi:

P(An,k)=pi1.pikqik+1.qin

(p1t+q1).(pnt+qn) Q.E.D. Schema lui Poisson se aplic cnd se urmrete ca n experimente independente s apar de k ori un eveniment A, dac se cunosc probabilitile diferite de realizare a sa n cele n experimente. Schema bilei revenite se obine ca un caz particular din schema lui Poisson cnd urnele U1,,Un au un coninut identic n bile albe i negre: a1=..=an= a i b1=.bn=b n acest caz , extragerea simultan a cte unei bile din cele n urne identice U cu a bile albe i b bile negre este echivalent cu extragerea succesiv a n bile dintr-o singur urn U cu a bile albe i b bile negre, punnd bila napoi n urn dup fiecare extragere, pentru ca urna U s fie identic la fiecare din cele n extrageri succesive. Avem p1=..=pn=p i q1=.qn=q=1- p, deci Pn,k este coeficientul lui tk n produsul (pt+q)(pt+q)=(pt+q)n adic:
Pn,k = Cnkpkqn-k ;

Pn,k = pi1.pikqik+1..qin pentru toate permutrile i1,..in ale indicilor 1,.,n adic chiar coeficientul lui tk n produsul

(k=0,1,,n)

33

Schema bilei revenite se aplic cnd se urmrete ca n n repetri independente ale unui experiment, s apar de k ori un eveniment A, dac se cunoate probabilitatea sa de realizare n acel experiment. Aruncrile repetate de monezi i zaruri se supun schemei bilei revenite, dnd natere la evenimente independente. Formula combinrilor este: n(n 1)...(n k + 1) n! k n nk = (k )= = = Cn Cn 1.2...k k !(n k )! Funcii EXCEL pentru aranjamente,permutri i combinri : a) Aranjamente de n obiecte luate cte k : Ank=n(n-1)(n-k+1)= n! / (n-k)! Funcia EXCEL : = PERMUT(n,k) b) Permutri de k obiecte: Pk = 1.2.k = k! Funcia EXCEL : = FACT(k) c) Combinri de n obiecte luate cte k : Cnk = ( nk ) = Ank / Pk = n!/ k!(n-k)! Funcia EXCEL : = COMBIN(n,k) Dac n i k au valori mari, factorialele se calculeaz aproximativ cu formula Stirling: n n ! 2 n .( ) n e n concluzie variabila binomial B(n,p) are densitatea de probabilitate: (1) f(k)= Cnkpkqn-k ; (k=0,1,,n) Calculul lui f(k) se face mai comod prin formulele recurente: f(0) = qn (k=0) n k +1 p f (k ) = f (k 1). . (k = 1,2,..., n) k q
Funcia de repartiie binomial este :
h h nh F ( k ) = Cn p q k

Funcie EXCEL : = BINOMDIST(k,n,p,L) Pentru L = FALSE avem densitatea de repartiie binomial f(k) iar pentru L = TRUE avem funcia de repartiie binomial F(k) . Funcia caracteristic este

h =0

(t ) = ( peit + q) n

Din teorema 6.5 rezult M ( X ) =


M (X 2 ) =

' (0)
i

= np i

= n 2 p 2 + npq aa c V(X) = M(X2)-M2(X) =npq. i2 Modul Mo(X) satisface relaia np-qMo(X) np+q.

"(0)

Teorema 6.11 Dac X,Y sunt variabile binomiale independente de tip B(n1,p) i respectiv B(n2,p), atunci X + Y este variabil binomial de tip B(n1+n2,p).

34

Demonstraie it n1 it n2 Conform teoremei 6.5 , X+Y are funcia caracteristic (pe +q) .(pe +q) = =(peit +q)n1+n2 deci X+Y este variabil binomial B(n1+n2,p) Q.E.D. Valorile f(k) din formula (1) se obin prin calcul direct pentru n<30 iar pentru n30 variabila binomial se poate aproxima cu cea normal (Teorema 6.14 (Moivre-Laplace) de mai jos). Observm c f(k) din formula (1) este termenul general al dezvoltrii binomului 1=(q+p)n, de unde i denumirea de variabil binomial. Dac urna U are a1 bile de culoarea 1,,am bile de culoarea m i extragem succesiv n bile cu bila revenit, dorim s apar k1 bile de culoarea 1,,km bile de culoarea m, deci avem variabila aleatoare polinomial cu densitatea de probabilitate: n! f (k1 ,...km ) = p1k1 ... pm km k1 !...km ! (k1,,km=0,1,.n; k1++km=n) Pentru m=2 reobinem variabila aleatoare binominal. Exemple 1) Se arunc o moned de n=5 ori. Care este probabilitatea s apar stema de k=2 ori ? Soluie Aruncrile succesive ale monedei sunt independente deci se supun legii binomiale. 1 1 Acum p = , q = 1 p = , n = 5, k = 2 deci conform relaiei (1) avem: 2 2 1 1 5.4 1 5 f (2) = C5 2 ( ) 2 ( )3 = . 5 = = 31.2% 2 2 1.2 2 16 Funcii EXCEL : = BINOMDIST(2,5,0.5,FALSE) = 31.2% = BINOMDIST(2,5,0.5,TRUE) =50% 5 Numrul mediu de bile albe va fi: M(X)=np= = 2.5 bile albe i abaterea standard a 2 1 1 5 numrului de bile albe va fi ( x) = npq = 5. = = 1.1 bile albe. 2 2 2 2) Se arunc un zar de n=4 ori. Care este probabilitatea s apar faa nr. 6 de k=2 ori? Soluie Aruncrile succesive ale zarului sunt independente deci se supun legii binomiale.

Avem p = , q =1 p = , n = 4, k = 2 deci conform relaiei (1) avem: 4.3 52 52 25 2 1 2 5 2 ( ) ( ) = . 4 = 3 = = 11.6% f (2) = C4 6 6 1.2 6 216 6 Funcii EXCEL : = BINOMDIST(2,4,1/6,FALSE) = 11.6% = BINOMDIST(2,4,1/6,TRUE) =98.4% Numrul mediu de fee nr. 6 aprute va fi M ( x ) = np = numrului de fee nr.6 aprute va fi

1 6

5 6

4 = 0.7 bile iar abaterea standard a 6

( x) = npq =

3) Se d o urn U cu a=6 bile albe i b = 14 bile negre. Se extrag succesiv n=4 bile cu bila revenit. Care este probabilitatea s obinem k=2 bile albe ? Soluie

20 5 = = 0.7 bile 36 3

35

Avem p =

Funcii EXCEL : = BINOMDIST(2,4,0.3,FALSE) = 26.5% = BINOMDIST(2,4,0.3,TRUE) =91.6%


6.4.2 Variabila hipergeometric

6 14 , q = 1 p = , n = 4, k = 2 deci conform formulei (1) avem: 20 20 4.3 32.7 2 2 6 2 14 2 f (2) = C 4 ( ) ( ) = . = 26.5% 20 20 1.2 10 4

Variabila aleatoare hipergeometric este variabila aleatoare cu un numr finit de valori avnd ca model schema bilei nerevenite. Fie o urn U cu a bile albe i b bile negre din care se extrag succesiv n bile fr revenirea n urn a bilei dup fiecare extragere (extrageri dependente). Cele n bile pot fi extrase i simultan. Schema bilei nerevenite se aplic la controlul calitii produselor, deoarece cu convenia bil alb=obiect bun i bil neagr=rebut, rebuturile nu se mai ntorc n urn dup extragere.
Teorema 6.12 Probabilitatea ca din n bile extrase s apar k bile albe (k=0,1,,n) n cadrul schemei bilei nerevenite este:
k Ca .Cbnk Pn ,k = n Ca +b

Demonstraie: Din a bile albe se pot forma Cak grupe distincte de cte k bile albe n fiecare grup iar din b bile negre se pot forma Cbn-k grupe distincte cu n-k bile negre n fiecare grup. Extragerea culorilor alb i neagr fiind independente, numrul cazurilor favorabile n schema bilei nerevenite este Cka.Cbn-k. Din a+b bile se pot forma Ca+bn grupe distincte cu n bile n fiecare grup, deci numrul cazurilor egal posibile n schema bilei nerevenite este Ca+bn. k Ca .Cbn k Q.E.D. Conform definiiei clasice a probabilitii avem: Pn ,k = n Ca +b n concluzie, densitatea de probabilitate a variabilei hipergeometrice H(a,b,n) este:

f (k ) =

k nk .Cb Ca n Ca +b

Un calcul comod pentru f(k) se face cu formulele de recuren: Cn a(a 1)....(a n + 1) ; (k = 0) f (0) = na = Ca +b (a + b)(a + b 1)....(a + b n + 1)
(a k + 1)(n k + 1) ; (k = 1,2,......n) (b n + k ).k Funcia de repartiie hipergeometric este : f (k ) = f (k 1).

36

h Ca .Cbn h F (k ) = Can+b h =0 k

Funcie EXCEL : = HYPGEOMDIST(k,n,a,a+b) Avem M(X)=np; V(X)=npq (1

Dac a+b, variabilele binomial i hipergeometric au aproximativ aceeai repartiie. Dac urna U are a1 bile de culoarea 1,, am bile de culoarea m, extragem succesiv cu bila nerevenit n bile (extragerile pot fi i simultane). Dorim s apar k1 bile de culoarea 1,, km bile de culoarea m, deci avem variabila hipergeometric cu m stri cu densitatea de probabilitate:

n 1 ) a + b 1

f (k1 ,...., km ) =

km k1 Ca ... C a 1 m

n Ca 1 + b1 +....+ am +bm

Exemplu ntr-un incubator sunt 1000 ou din care 5 % neeclozionate. Se extrag simultan n=100 ou. Care este probabilitatea ca s gsim k=90 ou eclozionate ? Soluie Avem schema bilei revenite cu a=950 ou eclozionate i b=50 ou neeclozionate.

(k1 ,...., km = 0,1,...., n; k1 + .... + km = n)

Avem P100,90=

90 10 C950 .C50 100 C1000

Funcie EXCEL : = HYPGEOMDIST (90,100,950,1000) =1.4% M(X)=np=100x0.95= 95 ou eclozionate. n 1 ) = 100 0.95 0.05 . V(X)=npq( (1 a + b 1 100 1 (1 ( x) = 4.3 = 2.1 ou eclozionate. ) = 4.3 deci 1000 1
6.4.3 Variabila Poisson

Variabila aleatoare Poisson este variabil cu un ir infinit de valori cu densitatea de probabilitate:

e ; (k = 0,1, 2,...) k! Notaie: PO() f(k) se calculeaz recurent astfel: f(0)=e ; (k=0) f ( x) =
f(k) = f (k 1).

; (k=1,2,3,)

Funcia de repartiie Poisson este :


F (k ) =
h =0 k

h
h!

37

Funcie EXCEL : = POISSON(k,,L) Pentru L = FALSE avem densitatea de repartiie Poisson f(k) iar pentru L=TRUE avem funcia de repartiie F(k) . it Funcia caracteristic este (t ) = e ( e 1) de unde conform teoremei 2.5. rezult:

i i2 deci V(X) = M(X 2 )-M 2 (X) =

M (X ) =

'(0)

= ; M(X 2 ) =

" (0)

= 2 +

Teorema 6.13 Dac X,Y sunt variabile Poisson de tip PO (1 ) respectiv PO(2) atunci X+Y este variabil Poisson de tip PO (1+2). Demonstraie Conform teoremei 6.5 , X+Y are funcia caracteristic it it it (t ) = 1 (t ) 2 (t ) = e1 ( e 1) .e2 ( e 1) = e( 1 + 2 )( e 1) deci X+Y este variabil Poisson de tip PO(1+2) Q.E.D. Teorema 6.14 Variabila Poisson se obine din variabila binomial dac n,p0 i np = . Demonstraie
(np ) k 1 k 1 (1 p ) n k (1 )....(1 ). care tinde catre e k! n n (1 p ) k k! 1 k 1 deoarece (1- )...(1 ) 1, (1 p) k 1 i (1-p) n = [(1 p ) 1/ p ] np e . n n Rezult c modelul aproximativ al variabilei Poisson este schema bilei revenite aplicat unei urne foarte bogate iar cu foarte puine bile albe i din care se extrag succesiv cu bila revenit un numr de n foarte mare de bile. Din acest motiv variabila Poisson se mai numete variabila evenimentelor rare. Repartiia Poisson se gsete des n agricultur: numrul gemenilor, numrul animalelor cu tare genetice i numrul celulelor iradiate cu particule , sunt evenimente rare. Exemplu Numrul mediu de miei la 100 oi este de 120 miei, Care este probabilitatea ca o oaie s fete 2 miei ? Soluie 1.22 1.2 Avem =1.2 i k=2 deci f (2) = e = 21.7 %. 2! Funcii EXCEL : = POISSON(2,1.2,FALSE)=21.7% = POISSON(2,1.2,TRUE) = 87.9% 6.5 Variabile aleatoare clasice continue Cnk p k q n k =
Avem :

6.5.1 Variabila uniform

Variabila aleatoare uniform are densitatea de probabilitate : f(x) =1, x [0;1] f(x) =0, n rest

38

e it 1 Funcia caracteristic este (t ) = i conform teoremei 6.5. avem: it ' ( 0) 1 '' (0) 1 1 M(X)= = ; M ( X 2 ) = 2 = deci V(X) = M(X 2 )-M 2 (X) = 3 12 i i 2 Valorile x [0,1] ale lui se numesc numere aleatoare i se tabeleaz sau se genereaz cu
calculatorul (funcia RND). Cu ajutorul variabilei uniforme , se pot simula valorile oricrei variabile aleatoare prin metoda Monte Carlo . Simularea altor variabile aleatoare clasice se face cu ajutorul variabilei uniforme astfel: Alegem n mod aleator (la ntmplare) m valori ale variabilei uniforme i[0,1] i lum x = xi dac F(xi) = i (i = 1, , m) unde F(x) este funcia de repartiie a variabilei aleatoare X. Dac X este variabil aleatoare discontinu cu un numr finit de valori, cu repartiia:

x1 ___ x n X : p ___ p 1 n

din relaia F(xi) = i (i = 1, , m) rezult c vom lua:

dac 0 < i < p1 xi = x1 dac p1 < i < p1 + p2 xi = x2 . dac p1 + + pk-1 < i < p1 + + pk xi = xk . dac p1 + + pn-1 < i < 1 xi = xn Dac X este variabil aleatoare discontinu cu un ir infinit de valori, din condiia 0 < pi < 1 i
i =1

p i = 1 rezult c numai pentru un numr finit de valori xi avem pi > cu 0 < < 1

deci vom lua n calcul numai aceste valori. Dac X este variabil aleatoare continu, din relaia F(xi) = i (i = 1, , m) rezult xi ca funcie de i.
6.5.2 Variabilele exponenial, Weibull, Erlang

Variabila exponenial E() are densitatea de probabilitate: f(x) = e - x ; (x0) Funcia de repartiie este F(x) = 1-e - x Funcie EXCEL : = EXPONDIST(x,,L) Pentru L=FALSE avem densitatea de probabilitate exponenial f(x) iar pentru L=TRUE avem funcia de repartiie F(x) . Funcia caracteristic este (t)= (1

it

i 2 Variabila exponenial i gsete aplicaii n fiabilitatea mainilor agricole (Seciunea 6.7 de mai jos). Variabila exponenial admite urmtoarele generalizri: A.Dac X este variabil exponenial E() atunci Y=X este variabil Weibull cu densitatea de probabilitate :

M (X ) =

' (0)
i

) 1 , deci conform teoremei 2.5. avem


2
2

i M(X2)=

(0)
'' 2

deci V(X) = M(X 2 )-M 2 (X) =

f ( x) = x 1e x ,( x 0)

39

este funcia de repartiie . Funcie EXCEL : = WEIBULL(x,, 1/(1/ ), L) Pentru L=FALSE avem densitatea de probabilitate WEIBULL f(x) iar pentru L=TRUE avem funcia de repartiie WEIBULL F(x) . Avem:

F ( x) = 1 e x

M (X ) =

Avem funcia Gama :

+1 ) ;V ( X ) = 1 ( + 2 ) (( + 1)) 2 1/ 1/

( x) = t x 1e t dt cu proprietile :
0

1) (1)=1; (1/2)= 2) (n+1) = n!; 3) (x+1) = x (x)

B.Dac X1,.Xn sunt variabile aleatoare exponeniale, independente cte dou i toate de parametru , atunci X=X1++Xn este variabil Erlang cu densitatea de probabilitate :
f ( x) =

n
(n 1)!

x n 1e x ;( x 0)
n 1 (x ) j j =0

Funcia de repartiie este F ( x ) = 1 e Funcia caracteristic este:

.x

j!

it '(0) n (t ) = (1 ) n deci conform teoremei 6.5 avem M(X) = = i


i Variabila exponenial i generalizrile ei Weibull i Erlang, sunt cazuri particulare ale variabilei Gama generalizate .
2 2

M(X2)=

'' (0)

n2 + n

deci V(X)=M(X2) M2(X)= 2

6.5.3 Variabila normal

Variabila normal are densitatea de probabilitate: care are graficul :

1 f ( x) = e 2

( x )2 2 2

,xR

40

Funcia caracteristic este (t )

=e

it

2t 2
2

deci conform teoremei 6.5. avem:

= 2 + 2 deci V(X) = M ( X 2 ) M 2 ( X ) = 2 i i2 Variabila normal X are notaia X=N(, ). Din graficul densitii de probabilitate f(x) a variabilei normale se confirm cele 2 legi ale erorilor accidentale, gsite de Gauss: 1) Legea simetriei: Numrul valorilor care se abat sub media este egal cu numrul valorilor care se abat peste media ; 2) Legea concentrrii: Abaterile mici de la media sunt numeroase iar abaterile mari de la media sunt rare. Dac pe verticala lui lsm s cad boabe de cereale, boabe de nisip sau pietricele , acestea se ciocnesc i se rostogolesc formnd o grmad care are n seciune vertical profilul de curb normal de mai sus. Teorema 6.15 Dac X1, X2 sunt variabile aleatoare normale de tip N(1,1) i respectiv N(2,2), independente ntre ele, atunci variabila aleatoare a1X1+a2X2 este o variabil aleatoare normal de tip N(a11+a2 2 ; (a1212+a2222)1/2). Demonstraie Variabila aleatoare a1X1+a2X2 are conform teoremei 6.5. funcia caracteristic:

M (X ) =

'(0)

= ; M ( X 2 ) =

'' (0)

1(a1t1)2(a2t2)= e

ia11t

2 2 2 1 t a1 2

.e

ia2 2 t

2 2 2 2t a2 2

=e

i ( a11 + a2 2 ) t

2 2 2 2 2 ( a1 1 +a2 2 )t 2

deci a1X1+a2X2 este variabil aleatoare normal de tip N(a11+a22;

2 2 a12 12 + a2 2 ) Q.E.D.

Pentru =0, =1 obinem variabila aleatoare normal redus U=N(0,1) cu densitatea de probabilitate f(u)=

1 u2 / 2 e i cu graficul: 2

41

Legtura ntre variabila normal X=N(, ) i variabila normal redus U=N(0,1) este dat de relaia U =

Funcia de repartiie a variabilei normale reduse U=N(0,1) este

respectiv X = +U.
t2 2

1 F (u ) = 2

e dt

Valorile lui F(u) pentru u 0 se gsesc n tabela 1 din Anex iar pentru u <0 avem: F(u)=1-F(-u). Graficul lui F(u) are forma:

Avem F(u/2) = P(u<u/2 )=1-/2 si P(u<u/2)=1-. Funcia EXCEL : = NORMDIST(u) d funcia de repartiie normal redus F(u) .

1.821256; a5=1.330274 Teorema 6.16

1 u2 5 i e . aW ; (u0) unde Pentru F(u) avem i formula aproximativ F (u ) = 1 i 2 i =1 1 cu p=0.2316419 respectiv a1=0.3193815;a2=-0.3565638; a3=1.781478; a4=W= 1 + pu

42

Dac X este variabil N(,) avem: b a ) F( ) P ( a X b) = F (


Demonstraie

Relaia rezult din teorema 6.3 punctul 4 cu substituia U = n particular pentru a = -, b= + i innd cont c F ( enun capt forma:

) = 1 F ( ) relaia din

P( X < ) = 2 F ( ) 1 Q.E.D.
Exemplu Greutatea la livrare a porcilor Landrace de 8 luni este variabila normal N(100 kg; 5 kg). Se cere probabilitatea ca greutatea porcilor de 8 luni s fie cuprins ntre 98 kg i 106 kg ? Soluie 106 100 98 100 F( ) F( ) = F (1.2) F (0.4) = F (1.2) 1 + F (0.4) = P(98X106)= 5 5 = 0.8849 + 0.6554 1 = 54%. Funcii EXCEL : = NORMDIST(1.2) =0.8849 i = NORMDIST(-0.4)==0.3446 6.5.4 Variabilele Hi Patrat, Student, Fisher A. Variabila Hi Patrat (2)

Dac X1,.,Xn sunt variabile aleatoare N(0,1) independente cte dou, atunci variabila X definit de relaia: X = X 1 + .... + X n se numete variabil hi ptrat (X2) cu n grade de libertate. Ea are densitatea de probabilitate:
2 2 2

f ( x) =

n 2 .( ) 2

n 2

.x

n 1 2

.e ;( x 0)

x 2

n Funcia caracteristic este (t)=(1-2it) 2 deci conform teoremei 2.5. avem

M(X)=

'(0)

i i 2 2 V(X)=M(X )-M (X)=2n

= n; M ( X 2 ) =

"(0)
2

= n 2 + 2n aa c :

Teorema 6.17 Dac X1, X2 sunt variabile hi patrat cu n1 grade de libertate respectiv n2 grade de libertate, atunci X1+X2 este variabil hi patrat cu n1+n2 grade de libertate. Demonstraie Conform teoremei 6.5. variabila aleatoare X1+X2 are funcia caracteristic

(t ) = (1 2it ) 2 .(1 2it )


libertate. Q.E.D.

n1

n2 2

= (1 2it )

n1 + n2 2

deci este variabil hi patrat cu n1+n2 grade de

43

Variabila hi ptrat cu n grade de libertate este un caz particular al variabilei Gama generalizate . Dac X este variabil hi ptrat cu n grade de libertate (n30) atunci variabila
2

este aproximativ variabil hi ptrat cu n grade de libertate pentru n30.


2 2 2

(U + 2n 1) 2 2 X 2n 1 U unde U = N (0,1) de unde rezult c variabila X = 2

Valorile lui date de relaia P( > ) = se obin din tabela 3 din Anex. Funcia EXCEL : = CHIINV(P,GL) d valoarea 2 pentru care P(
2 2 > ) =

B. Variabila Student (t)

Dac X1 este variabil N (0,1) i X2 este variabil hi ptrat cu n grade de libertate, X1 , X2 fiind independente ntre ele, atunci Y =

X1 se numete variabil Student (t) cu n grade X2 n

de libertate. Ea are densitatea de probabilitate : n +1 ( ) n +1 x2 2 f ( x) = (1 + ) 2 n n n ( ) 2

Avem M(X) = 0; V(X) =

n n2

Valorile lui t/2 i t date de relaiile P(t>t/2) = P(t>t)=, se obin din tabela 2 din Anex Pentru n 30 variabila Student este bine aproximat de variabila normal N(0,1). Funcia EXCEL : = TINV(P,GL) d valorile t/2 pentru care P(t>t/2)=
C. Variabila Fisher (F)

Dac X1, X2 sunt variabile hi ptrat cu n1 respectiv n2 grade de libertate, independente ntre ele, atunci Y= Evident

Densitatea de probabilitate este: n + n2 ) n1 1 ( 1 n1 n2 n1 2 n1 n1 + 2 2 2 F(X) = ( ( ) . x .(1 + x) n1 n2 n2 n2 ( ) ( ) 2 2

1 este tot variabil Fisher cu (n2,n1) grade de libertate. Y


;

X1 X 2 : se numete variabil Fisher (F) cu (n1,n2) grade de libertate. n1 n2

(x0)

44
2 2n 2 (n1 + n 2 -2) n2 Avem M(X) = ; V(X) = n2 2 n1 (n2 2) 2 (n2 4)

Variabilele normal redus, hi ptrat, Student sunt cazuri particulare ale variabilei Fisher X cu (n1,n2) grade de libertate astfel:

X cu n1 = 1; n2 = - Variabila hi ptrat este X cu n1 = n; n2 =


- Variabila U este - Variabila Student este X1/2 cu n1=1;n2=n. Valorile critice F1 date de relaia P(F>F)= pentru =5%, 1 %; 0.1 % se obin din tabelele 4-6 din Anex . Funcia EXCEL : = FINV(P,GL1,GL2) d valorile F pentru care P(F>F)= . Valorile critice din tabelele 1-6 ale Anexei , sunt legate prin relaiile:

U /2 = F ;1, ; t /2;n = F ;1,n

2 ,n = n.F ; n , ;

Pe grafic aceste valori au forma:

6.5.5 Vectorul aleator normal

Vectorul aleator normal Z = (X,Y) are densitatea de probabilitate:

f ( x, y ) =

1 2 1 2 1 2

1 2(1 )
2

( x 1 )2 ( y 2 )2 x 1 y + 2 . 2 2

45

Funcia caracteristic este:

(t1 , t2 ) = e

1 22 22 i ( 1t1 + 2 t2 ) ( 1 t1 + 2 t2 + 2 1 2 t1t2 ) 2

Aici X = N ( 1 , 1 ), Y = N ( 2 , 2 ) i = (X,Y) Avem vectorul medie M(Z) = ( 1 ; 2 ) i matricea de covarian


2 1 2 C(Z) = 1 2 2 1 2 Graficul lui z= f(x,y) este o suprafa n spaiu n form de clopot cu deschiderea n jos, cu 1 vrful clopotului n punctul: M ( 1 ; 2 ; ) 2 1 2 1 2

Dac 1 = 2 = 0 i 1 = 2 = 1 obinem vectorul aleator normal redus W = (U,V) cu densitatea de probabilitate: 1 [u 2 +v2 2 . u . v ] 2 2(1 )

f (u , v) =

2 1

1 Avem M(W) = ( 0; 0); C(W) = 1 Dac Z = (X, Y) cu X = N ( 1 , 1 ), Y = N( 2 , 2 ) iar W = (U,V) cu U = V = N (0,1) avem relaiile de legtur: X 1 Y- 2 U= ; V=

1 2 Am vzut n teorema 6.8 punctul 5) c n general variabilele necorelate liniar pot fi dependente.

Teorema 6.18 Dac variabilele aleatoare normale X, Y sunt necorelate liniar, ele sunt independente. Demonstraie Dac variabilele normale sunt necorelate liniar avem = 0 deci:

f ( x, y ) = = 1 2 1 1

1 2 1 2 e

1 x 1 2 y [( ) +( 2 1 2

2 2

) ]

=
2 2

1 x 1 )2 ( 2 1

1 2 2

1 y ( 2 2

= f1 ( x) f 2 ( y )

deci conform teoremei 6.7. rezult c X, Y sunt variabile aleatoare independente. Q.E.D.
6.6 Legi limit Teorema 6.19 (Legea numerelor mari a lui Cebev)

46

Fie X1,, Xn variabilele aleatoare independente cte dou, cu abaterile standard X + ..... + X n atunci pentru orice > 0 avem: mrginite de T. Dac X = 1 n lim P(X-M(X) <)=1 n
Demonstraie Deoarece X1,Xn sunt independente cte dou, conform teoremei 6.2. avem: M ( X 1 ) + ... + M ( X n ) M(X)= n iar conform teoremei 6.3, avem: V ( X 1 ) + ... + V ( X n ) nT 2 T 2 2 = V(X) = n n n Aplicnd inegalitatea Cebev din teorema 2.4, avem:

P(X-M(X)<)1Dar
n

V (X )

lim P = 1 deci

T = P n 2 lim P( X-M(X) < ) = 1


n

Din expresia lui P rezult numrul minim de variabile aleatoare care asigur evenimentului X-M(x)<) o probabilitate de realizare superioar lui P i anume: n= T2 . Q.E.D. 2 (1 P )

Legea numerelor mari a lui Cebev arat c media unui numr mare de variabile aleatoare independente cte dou i cu abateri standard mrginite, i pierde caracterul de variabil aleatoare, stabilindu-se n jurul mediei sale. n particular, media a n msurtori independente ale unei nsuiri cantitative X se stabilizeaz , cnd volumul msurtorilor crete. Exemplu Cte msurtori trebuie fcute pentru ca greutatea oulelor s fie cuprins ntre 49 g i 51 g cu o ncredere de cel puin 99 %, dac tolerana maxim admis la greutatea oulelor este T=1g ? Soluie 12 Avem T = 1 g, =1g, P =0.99 deci n = = 100 msuratori. 1 0.01 Dac n legea numerelor mari a lui Cebev lum variabilele aleatoare X1=.=Xn 1 0 X + ... + X n =( ) ,independente cte dou, X= 1 ia valori de forma k/n = f i M(X) = p; n p q V(X) = pqT2 deci relaia: V (X ) P(X-M(X)<) 1 2 de mai sus devine:

47

P(f-p <)1-

pq n 2

= P

Cum lim P = 1 rezult: n lim P(f-p <)=1 deci am demonstrat : n


Teorema 6.20 (Legea numerelor mari a lui Bernoulli )

Dac A este un eveniment cu probabilitatea de realizare p iar f = k/n este frecvena de realizare a acestui eveniment de k ori n n experiene independente, atunci pentru orice > 0 avem: lim P(f-p<)=1 n Din expresia lui P rezult numrul minim de experiene independente care asigur evenimentului f-p< o probabilitate de realizare superioar lui P:

n=

p (1 p )

2 (1 P )

Legea numerelor mari a lui Bernoulli arat c frecvena f de apariie a unui eveniment n n experiene independente care este n fond media a n valori a unei nsuiri calitative X, se stabilizeaz n jurul probabilitii p de realizare a evenimentului. Prin urmare, n cazul unui numr mare de experiene independente, probabilitatea p (constant i cunoscut naintea experienelor) ncepe s fie confirmat de frecvena f (variabil i cunoscut dup experiene). Exemplu Care este numrul minim de aruncri ale unei monezi pentru ca frecvena de apariie a stemei s fie cuprins ntre 45 % i 55 % cu o ncredere de cel puin 90 % ?
Soluie Avem p = 1/2 = 50 %; =5 % = 0.05, P = 90 % = 0.90

deci n= 2

P(1 p)

(1 P )

0.5(1 0.5)
2

0.05 .(1 0.90)

= 1000 aruncri

Teorema 6.21 (Leapunov) Dac X1,..,Xn sunt variabile aleatoare independente i suma lor X=X1+.+Xn satisface condiia: 3 3 M ( X 1 M ( X 1 ) ) + .... + M ( X n M ( X n ) ) lim =0 n ( X )3 X M (X ) tinde ctre funcia de atunci funcia de repartiie a variabilei aleatoare normate ( x) repartiie F(x) a variabilei normale reduse N (0,1) cnd n . (fr demonstraie)

48

Cu alte cuvinte, dac valorile a n variabile aleatoare independente , vor fi mici n raport cu suma lor, atunci aceast sum are o repartiie normal cnd n. Dac n teorema 6.21 lum variabilele aleatoare independente X1=.=Xn =(

p q

) deci

X = X1+.+Xn este variabil binomial, condiia din enunul teoremei 6.21 este ndeplinit deoarece M(Xi) = pq aa c M (Xi-M(Xi)3) sunt finite i egale ntre ele deci:

[M ( X
i =1

M ( X i ) )]

( X )3

nM ( X i p ) ( npq)3

M ( Xi p ) n p3 q3

pentru n deci rezult:


Teorema 6.22 (Moivre-Laplace) Dac X este o variabil binomial cu media M(X) = np i variana V(X) = =npq cu q=1-p, atunci funcia de repartiie a variabilei aleatoare normate X M ( X ) X np tinde ctre funcia de repartiie F a variabilei normale reduse N(0,1) = (X ) npq

cnd n . Cu alte cuvinte, probabilitatea ca un eveniment A s se realizeze n n experiene independente de un numr de ori cuprins ntre a i b este aproximativ egal cu:

F(

b np a np ) F( ) cnd n 30 npq npq

Valorile lui F(u) pentru u 0 sunt date de tabela 1 din Anex iar pentru u <0 avem F(u) = 1-F(-u). Exemplu ntr-o urn se afl 600 bile albe i 400 bile negre. Se extrag n = 200 bile cu bila revenit. Se cere probabilitatea ca numrul X de bile albe extrase s fie cuprins ntre 100 i 140 bile albe. Soluie Avem: p=6/10 ; q=4/10 ; n=200 ; a=100 ;b=140 deci: 6 6 140 200. 100 200. 10 ) F ( 10 ) = P (100 X 140) = F ( 6 4 6 4 200. . 200. . 10 10 10 10 = F (2.9) F (2.9) = 2.F (2.9) 1 = 2 0.9981 1 = 99.6%

6.7

Fiabilitatea echipamentelor

Fie T variabila aleatoare pozitiv a timpului de funcionare fr defeciuni a unui echipament. Fie f(t) densitatea de probabilitate a variabilei aleatoare T i F(t) = P( T < t ) funcia sa de repartiie. 1)Fiabilitatea echipamentului este probabilitatea ca echipamentul s funcioneze fr defeciuni n intervalul de timp [0 , t] adic R(t) = P ( T t ) = 1 F(t) . Cuvnt sinonim : reliabilitate .

49

Proprieti : a) R(t) ia valori ntre 0 i 1; R(0) = 1; b) R(t) este continu la stnga:


t t0

lim R(t ) = 0 ;
t

lim R(t ) = R(t0 ) ;

c) R(t) este funcie descresctoare: t1 < t2 R(t1) > R(t2); P(a < T < b) = R(a) R(b);P(T< b) = =1 R(b) ; P(a < T) = R(a). 2) Probabilitatea de defectare a echipamentului n intervalul de timp [ 0 , t] este F(t) = P( T < t ) 3) Viteza de defectare a echipamentului la momentul t este f(t) = F(t) = - R(t) . Avem : f(t)= lim F(t + t) F(t) P(t T < t + t) = lim t 0 t t

t 0

de unde P(t T < t + t) = f(t).t deci probabilitatea de defectare a echipamentului n intervalul de timp [ t , t +t ] este egal cu densitatea de repartiie f(t) nmulit cu lungimea t a acestui intreval de timp . 4) Rata defectrii (t) este viteza de defectare a echipamentului la momentul de timp t , dac echipamentul a funcionat fr defeciuni n intervalul de timp [0 , t] . Avem : (t) = f(t) / [ 1 F(t)] = - R(t) / R(t) n adevr , fie A evenimentul c echipamentul a funcionat fr defeciuni n intervalul de timp [ 0 , t] i B evenimentul c echipamentul se va defecta n intervalul de timp [t , t +t ] . Probabilitatea lui B , condiinat de A este : P(A B) P(t T< t+t) F(t+t)-F(t) P( B A) = = = de unde : P(A) P(T>t) 1-F(t) 1 F(t+t)-F(t) 1 f (t) R (t) = = (t) = lim P( B A)= lim t 0 t t 0 t 1 F(t) 1 F(t) R(t) Avem P( B A) = (t).t deci probabilitatea ca echipamentul s se defecteze n intervalul de timp [t , t +t ] , dac a funcionat fr defeciuni n intervalul de timp [ 0 , t] , este egal cu rata defectrii nmulit cu lungimea t a intervalului de timp [t , t +t ] . Din relaia (t) = - R(t) / R(t) rezult :

R(t) = e

- (s)ds
0

Graficul ratei defectrii are forma:

(t)

II

III

tr

tu

50

Avem trei perioade n evoluia funcionrii unui echipament n timp: I) Perioada de rodaj [0; tr] n care apar un numr mare de defecte de fabricaie; II) Perioada de via util [tr; tu] n care rata defectrii este sczut i constant; III) Perioada de uzur fizic [tu; +] n care rata defectrii crete din nou datorit uzurii fizice. 5) Rata de defectare cumulat este funcia : (t)= (s)ds
0 t

Cum (s) = - R(s) / R(s) rezult : (t) = - ln R(t) Rata de defectare cumulat medie este (t) / t = - [ln R(t)] / t . 6) Durabilitatea echipamentului este timpul mediu de funcionare fr defeciuni al echipamentului : M(t) = t f(t)dt 7) Mentenana echipamentului . Dac echipamentul se defecteaz la un moment de timp t d , el trebuie reparat .Defeciunea poate fi subiectiv(cauzat de exploaterea necorepunztoare sau nerealizarea reviziilor obligatorii) sau obiectiv (cauzat de uzura fizic). Fie Tm variabila aleatoare pozitiv a timpului de restabilire a funcionalitii echipamentului , numit i timp de mentenan(restabilire) . Fie Fm(t) funcia de repartiie a variabilei Tm deci Fm(t) = P(Tm < t) este probabilitatea de restabilire a echipamentului ntr-un timp inferior lui t . fm(t) = Fm (t) este densitatea de repartiie a variabilei Tm iar media variabilei Tm este timpul mediu de restabilire a echipamentului : M(Tm ) = t f m (t)dt Mentenana poate fi preventiv(revizie periodic) sau corectiv(reparaie efectiv). 8) Disponibilitatea echipamentului este capacitatea sa de a-i ndeplini rolul pe o perioad de timp , prin controlul fiabilitii i mentenanei .Pentru evaluarea cantitativ a disponibilitii avem parametrul D= M(T) / [M(T)+M(tm)] adic proporia de timp ct echipamentul este activ. Fiabilitatea i mentenana sunt invers proporionale : cu ct fiabilitatea echipamentului este mai mare cu att mentenana sa este mai mic. n studiul disponibilitii intervin aspecte tehnice i economice. Din punct de vedere economic,uzura fizic implic cheltuieli de mentenan cresctoare deci echipamentul trebuie casat cnd aceste cheltuieli cumulate depesc costul de achiziie al unui echipament nou. Uzura moral scurteaz perioada de mentenan sub aspectul calitate / pre . Echipamentele pot fi cu funcionare intermitent sau continu. De exemplu computerul este cu funcionare intermitent iar frigiderul este cu funcionare continu (tot timpul ct conine alimente perisabile).
0 0

51

Studiile de fiabilitate i mentenan privesc o mulime de echipamente similare care funcioneaz n condiii identice. Concluziile asupra grupului de echipamente permit efectuarea de corecii asupra echipamentelor individuale. Studiul fiabilitii i mentenanei echipamentelor se aplic i la starea de sntate a fiinelor vii . Exemplu Pentru intervalul de timp [ 0 , t ] se urmresc N echipamente identice din care se defecteaz Nr(t) i sunt bune Nb(t) . Avem R(t) = Nb(t) / N ; F(t) = Nr(t) / N ; f(t) = Nr(t) / N ; (t) = - Nb(t) / Nb(t)
Exemple

1) T = variabil exponenial deci F(t) = 1 e aa c R ( t ) = e ; (t) = ; M(T) = 1 Acest caz se ntlnete n perioada II) de via util cnd (t) = constant. Dac probabilitatea funcionrii fr defeciuni a unui element constructiv ntr-un interval de timp de lungime t, nu depinde de funcionarea anterioar a elementului ci numai de lungimea t a intervalului de timp, atunci T este variabil exponenial. 2) T = variabil Weibull deci F( t ) = 1 e
t t

aa c:

+1 R (t ) = e ; ( t ) = t 1 ; M (T ) = 1 n cazul 0 < < 1, (t) descrete (cazul elementelor cu defecte de fabricaie multe da care se uzeaz lent); n cazul = 1 avem (t) = = constant adic cazul 1) al fiabilitii exponeniale de mai sus; n cazul > 1, (t) crete (cazul elementelor cu defecte de fabricaie puine dar care se uzeaz rapid). ( s )2 t 1 2 3) T = variabil normal deci F (t ) = e 2 cu valori n tabele , dup

transformarea U =

T . ( t ) =
( t )2 2 2

Rezult R(t) = 1 F(t); Aici

f (t) ; 1 F( t )

M(T) =

f (t ) =

N(;). Dac dou elemente constructive independente ntre ele, au fiabilitile R1(t), R2(t) atunci legndu-le n serie avem un element compus cu fiabilitatea R(t) = R1(t) . R2(t) iar legndu-le n paralel, avem un element compus cu fiabilitatea R(t) = R1(t) + R2(t) R1(t) . R2(t). Exemplu Dou elemente constructive independente ale unui tractor au fiabilitile exponeniale R1(t) e - 0.5t; R2(t) = e - 1.5t. S se calculeze fiabilitatea elementului compus din cele 2 elemente precedente n montaj serie i paralel.

1 e 2

este densitatea de probabilitate a variabilei aleatoare normale

52

Soluie

Pentru montajul serie avem Rs(t) = e-0,5t . e-1,5t = e-2t deci s(t) = 2; Pentru montajul paralel avem Rp(t) = e-0,5t + e-1,5t e-2t deci

M s (T ) =

p (t ) =

1 = 0.5 . 2 R ' p (t )

R p (t )

Mp(T) =

R
0

(t )dt .

6.8 Rezumat n acest capitol se prezint definiia unui eveniment , clasificarea evenimentelor i exemple, definiia axiomatic i clasic a probabilitii , definiia probabilitii condiionate , formulele probabilitii totale i Bayes , variabil aleatoare pentru care se descrie funcia de repartiie i densitatea de probabilitate, media , variana i funcia caracteristic . Deasemenea se prezint noiunea de vector aleator pentru care se descrie covariana i coeficientul de corelaie liniar , variabilele aleatoare clasice discontinue ntre care remarcm variabilele binomial i Poisson ,variabilele aleatoare continue ntre care remarcm variabilele exponenial , normal , hi patrat ,Student i Fisher precum i vectorul aleator normal. Capitolul continu cu legile limit : Cebev , Bernoulli i teorema limit-central. n ncheiere se prezint fiabilitatea echipamentelor. 6.9 ntrebri 1. Ce este un eveniment i ce operaii se fac cu evenimente ? 2. Care este definiia clasic a probabilitii i ce proprieti are probabilitatea ? 3. Cum se aplic formula probabilitii totale i formula Bayes la diagnosticul bolilor la animale ? 4.Enumerai proprietile funciei de repartiie i densitii de probabilitate a unei variabile aleatoare . 5. Enumerai proprietile mediei i varianei unei variabile aleatoare . 6. Enumerai proprietile covarianei i coeficientului de corelaie liniar pentru pentru un vector aleator . 7. Unde se aplic variabilele discontinue binomial i Poisson ? 8. Unde se aplic variabilele continue exponenial , normal , hi patrat ,Student i Fisher ? 9. Ce importan practic au legile-limit Cebev i Bernoulli ? 10. Definii fiabilitatea unui echipament i enumerai proprietile ei . 6.10 Bibliografie 1.D.Ene , M.Drghici, I.N. Alecu Statistic aplicat n agricultur Ed.Ceres,2003 2.M.Iosifescu i col. Mic enciclopedie de statistic Ed.tiinif.i Enciclop,,1985 3. Anuarul statistic al Romniei , 1990 -2003

53

CAPITOLUL 7 CULEGEREA I PRELUCRAREA DATELOR DE

SONDAJ

Obiective : nsuirea de ctre studeni a tehnicilor de sondaj, a calculului i interpretrii indicatorilor de sondaj de repartiie i evoluie , precum i a calculului i interpretrii indicilor statistici . nsuirea de ctre studeni a metodei intervalelor de ncredere pentru estimaii / teste parametrice (medii, abateri-standard i probaliliti) n una i dou populaii normale precum i teste neparametrice.. Coninut : 7.1 Populaii statistice i sondaje 7.2 Indicatori de sondaj de repartiie 7.2.1 Cazul sondajului de volum mic (n < 30) 7.2.2. Cazul sondajului de volum mare (n > 30) 7.3 Indicatori de sondaj de evoluie 7.3.1. Cazul msurtorilor simple n timp 7.3.2 Cazul msurtorilor multiple n timp 7.3.3 Indici statistici 7.4 Estimaii / teste n populaii normale 7.5 Estimaii / teste parametrice n populaii normale 7.5.1 Estimaii / teste pentru parametrii , ai unui caracter cantitativ ntr-o populaie normal 7.5.2 Estimaii / teste pentru parametrul p al unui caracter calitativ ntr-o populaie normal 7.5.3 Estimaii / teste pentru parametrii 2 - 1, 2 / 1 ai unui caracter cantitativ n dou populaii normale 7.5.4 Estimaii / teste pentru parametrul p2 p1 al unui caracter calitativ n dou populaii normale 7.6 Teste neparametrice n populaii normale 7.6.1 Testul hi patrat de concordan 7.6.2 Testul hi patrat de independen 7.6.3 Testul normalitii prin asimetrie i boltire 7.7 Rezumat 7.8 ntrebri 7.9 Bibliografie Cuvinte cheie : populaie statistic , sondaj simplu repetat i nerepetat,sondaj stratificat tipic,proporional i optim , indicatori de sondaj de repartiie / evoluie , indici statistici individuali i sintetici , estimaie corect i absolut corect ,ipotez simpl / compus unilateral i bilateral ,funcia de putere a testului , interval de ncredere , diferen limit . 7.1 Populaii statistice i sondaje Populaia statistic este o mulime de exemplare care aparin aceleiai familii i care fac obiectul cercetrii statistice. Cercetarea statistic poate fi complet sau exhaustiv (pentru toate exemplarele populaiei) de tip referendum sau recensmnt sau poate fi parial sau selectiv de tip sondaj (eantion, prob, sondaj de opinie) (pentru o parte reprezentativ din exemplarele populaiei).

54

Exemple de populaii statistice n agricultur: plantele unei culturi ntr-o parcel, animalele unei ferme zootehnice, mainile agricole care deservesc o suprafa arabil, fermele vegetale sau zootehnice dintr-un jude, unitile de prelucrare a produselor agricole (mori, fabrici de ulei, zahr, produse lactate, mezeluri, abatoare, etc.), magazinele care comercializeaz produse alimentare, reeaua de case de agroturism, reeaua de uniti de alimentaie public, etc. Fiecare exemplar al populaiei statistice are o serie de nsuiri cantitative (msurabile) sau calitative (atributive) notate X, Y, Z, sau X1, X2, , Xn pe care le vom numi n continuare i caractere. Pentru populaiile statistice din agricultur, nsuirile admit i alte clasificri: - dup natur: nsuiri biologice, tehnologice, economice, ecologice; - dup modul de exprimare numeric: nsuiri bivalente (0 sau 1), ntregi i reale (fracionare); - dup modul de apreciere: nsuiri primare (numai msurabile) i nsuiri derivate (msurabile sau calculabile); - dup gradul de generalitate: nsuiri individuale (proprii fiecrui element al populaiei) i colective (proprii unor grupe de elemente ale populaiei). Exemple de nsuiri individuale: - talia plantei; - suprafaa foliar a plantei; - greutatea i densitatea plantei; - dimensiunile fructelor; - greutatea i densitatea fructelor; - numrul de boabe din fruct; - dimensiunile boabelor; - greutatea i densitatea boabelor; - coninutul n substane nutritive al fructelor sau boabelor. Exemple de nsuiri individuale la animale: - nlimea la greabn; - nlimea la crup; - lungimea corpului; - circumferina toracic; - greutatea i densitatea corpului; - dimensiunea organelor interne (ficat, inim, rinichi, creier, etc.); - greutatea i densitatea organelor interne; - greutatea i densitatea produselor zootehnice (lapte, grsime i protein n lapte, carne, etc.); - coninutul n substane nutritive al produselor zootehnice. nsuirile individuale precedente devin colective dac se nsumeaz pentru plantele unei culturi de pe o parcel dat sau pentru animalele dintr-o ferm zootehnic dat. Menionm i urmtoarele nsuiri colective: - Consumul de resurse (for de munc, for mecanic, energie, ngrminte, ap, furaje, medicamente etc.) pentru o societate agricol (vegetal, zootehnic, de prelucrare produse agricole, de comercializare produse alimentare, de agroturism) ntr-un ciclu de producie; - Costul resurselor pe unitate de resurs pentru o societate agricol ntr-un ciclu de producie; - Cheltuielile cu resurse (consumuri nmulite cu costurile) nsumate pentru o societate agricol ntr-un ciclu de producie;

55

- Cheltuielile neproductive (TVA, taxe, impozite etc.) ale unei societi agricole ntr-un ciclu de producie; - Producii fizice principale i secundare ale unei societi agricole ntr-un ciclu de producie; - Preurile de vnzare ale produciilor fizice principale i secundare pe unitate, pentru o societate agricol ntr-un ciclu de producie; - Veniturile (producii fizice nmulite cu preurile de vnzare) nsumate pentru o societate agricol ntr-un ciclu de producie; - Profitul (venitul din care se scad cheltuielile totale cu resursele ct i cele neproductive) realizat de societatea agricol ntr-un ciclu de producie; - Rata profitului (profitul mprit la cheltuielile totale) realizat de societatea agricol ntr-un ciclu de producie. Pentru comparaia ntre ele, nsuirile colective se raporteaz la un exemplar, lungime, suprafa, volum, greutate, timp, unitate bneasc, etc.) obinnd nsuiri medii. Exemple: consumul mediu de motorin pe ha, consumul mediu de furaje pe cap de vac, profitul mediu pe lun al unei uniti de agroturism, etc. n agricultur, omul nu poate controla n totalitate factorii de producie sau de vnzare a produselor agricole, de aceea nsuirile precedente sunt parial sau total sub influena ntmplrii (hazardului) fiind de fapt n fiecare moment, variabile aleatoare iar n timp, procese aleatoare (vezi cap. 6). Aciunea ntmplrii asupra nsuirilor (caracterelor) n agricultur se concretizeaz n variabilitatea valorilor acestora n spaiu, timp, structur, etc. variabilitatea poate fi accidental (involuntar) sau sistematic(cu o cauz precis). Variabilitatea accidental este presupus a fi o variabil normal cu media 0 i abaterea standard (vezi cap.6) Exemple de surse de variabilitate: - variabilitatea genotipic a plantelor i animalelor; - condiiile pedoclimatice; - atacul buruienilor, bolilor i duntorilor; - conjunctura economic (raport ofert/cerere) pe piaa produselor agroalimentare. Fie o populaie statistic de volum N pe care dorim s o studiem din punct de vedere al nsuirii (caracterului) X pe care o posed exemplarele populaiei. Din cauza volumului mare N al populaiei, nu vom face msurtori complete n toat populaia ci vom extrage o parte reprezentativ din exemplarele populaiei, numit sondaj (eantion, prob) pe care vom face msurtori relativ la nsuirea (caracterul) X. Volumul sondajului se noteaz cu n iar raportul reprezentare sau factor de sondaj.

n (%) se numete cot de N

Exemplu Pe un ha cu porumb exist N = 75.000 plante recoltabile din care extragem un sondaj de n = 75 plante reprezentative. Cota de reprezentare este

Un sondaj se poate efectua n dou feluri:

n 75 = = 1 : 1000 plante. N 75000

56

I. Static: se fac msurtori simultane la un moment dat pe n exemplare extrase din populaie obinndu-se astfel repartiia n spaiu a nsuirii X analizat prin datele de sondaj. II. Dinamic: se fac msurtori consecutive n n momente de timp succesive pe acelai exemplar al populaiei statistice, obinndu-se astfel evoluia n timp a nsuirii X analizat prin datele de sondaj. Tehnica de efectuare a unui sondaj, depinde de compoziia populaiei n raport cu nsuirea X. Avem situaiile: a) Populaia este omogen n raport cu nsuirea X adic orice valoare a lui X este n mod egal probabil proprie fiecrui exemplar al populaiei. n acest caz se efectueaz un sondaj simplu repetat sau nerepetat. Sondajul simplu repetat se efectueaz prin extragerea suscesiv a exemplarelor din populaie i revenirea n populaie a fiecrui exemplar dup msurarea nsuirii X (schema bilei revenite). Avantajul acestui tip de sondaj este c extragerile din populaie sunt independente iar dezavantajul este c la controlul calitii produselor, orice exemplar chiar dac este rebut, trebuie ntors n populaie. Sondajul simplu nerepetat se efectueaz prin extragerea simultan a exemplarelor din populaie i revenirea acestora n populaie (dac nu sunt rebuturi) dup efectuarea tuturor msurtorilor pe ele relativ la nsuirea X (schema bilei nerevenit). Dezavantajul acestui tip de sondaj este c extragerile din populaie sunt dependente. Dac volumul de sondaj n este relativ mare rezultatele obinute prin sondajul simplu repetat sau nerepetat sunt aproximativ aceleai. b) Populaia este neomogen n raport cu nsuirea X dar se poate mpri n k straturi omogene n raport cu X, volumul straturilor fiind N1, Nk. Evident avem N1 + + Nk = N. n acest caz se efectueaz un sondaj stratificat care const n k sondaje simple, repetate sau nerepetate, din straturi cu volumele de sondaj din straturi n1, , nk. Evident avem n1+ + nk = n. Prezentm cteva tipuri de sondaj stratificat: a. Sondaj tipic: n1 = ... = n k = b. Sondaj proporional: c. Sondaj optim:

n1 n N N n = ... = k = deci n1 = n 1 ,..., n k = n k N1 Nk N N N


deci

n ; k

n1 = n

N11 N ,..., n k = n k k Nii Nii

n n1 n = ... = k = N1 1 N k k N i i

Aici 1, k sunt abaterile standard ale exemplarelor din straturi n raport cu caracterul X ca variabil aleatoare (vezi cap. 2). Observm c pentru N1 = = Nk = pentru

1 = = k = sondajul proporional i cel optim coincid.


n cazul unei populaii infinite

N sondajul tipic i cel proporional coincid iar k

stratificat precedent, avem:

N1 N p1 ,..., k p k deci pentru tipurile de sondaj N N

57

a. Sondaj tipic:

n1 = = nk =

b. Sondaj proporional: n1 = np1, , nk = npk c. Sondaj optim: n1 = n

n ; k

Exemplu O turm de ovine de volum N = 1000 capete are structura N1 = 700 mioare, N2 = 250 miei, N3 = 50 berbeci. Pentru analiza nsuirii X = lungimea firului de ln efectiv din sondaj de n = 60 ovine. tiind c abaterile standard n straturi sunt 1 =1 cm; 2 = 0.8 cm i 3 = 2 cm, se cer volumele de sondaj din straturi pentru diferite tipuri de sondaj stratificat. Soluie a) Pentru sondajul tipic n1 = n / 3 =20 mioare; n2 = n / 3 =20miei; n3= n / 3 =20 berbeci; 700 = 42 mioare, b) Pentru sondajul proporional n1 = 60 1000 250 n2 = 60 = 15 miei i n3 = n n1 n2 = 3 berbeci; 1000 c) Pentru sondajul optim Ni i = 700x1 + 250 x 0.8 + 50x2 =1000 aa c: n1 = 700 1 250 0.8 60 = 42 mioare; n2 = 60 = 12 miei i n3 = n n1 n2 = 6 berbeci. 1000 1000 7.2 Indicatori de sondaj de repartiie 7.2.1 Cazul sondajului de volum mic (n < 30)

p11 p ,..., n k = n k k . pii pii

n acest caz datele nu se grupeaz n clase de valori, prelucrarea la statistic reducndu-se la calculul urmtorilor indicatori statistici: I. Media de sondaj xi X = MX = n Media de sondaj este centrul de greutate al datelor de sondaj x1, , xn fiind cea mai apropiat de ansamblul valorilor: SPA(x) = (x1 x)2 ++ (xn x)2 este minim pentru x = x. Aici SPA este prescurtarea pentru suma patratelor abaterilor.
Caliti ale mediei a) Este o valoare mrginit: X [x min; x max]; b) Niveleaz diferenele ntre valori: suma abaterilor valorilor de sondaj fa de media lor este zero (xi - X ) = 0; c) Este reprezentantul ntregului pachet de date de sondaj: suma valorilor de sondaj este media lor nmulit cu numrul lor (xi = n . X ). Defecte ale mediei d) Prin nivelare, media nu d informaii despre variabilitatea datelor de sondaj.

58

Acest defect se remediaz prin folosirea indicatorilor statistici de variabilitate ntre care citm abaterea standard S i coeficientul de variabilitate c ,care vor fi prezentai mai jos. 5) Media este legat de o unitate de msur deci nu permite comparaii ntre caractere. Pentru comparaii se poate folosi media procentual Xp =

6) Media este sensibil la valori de sondaj mult mai mici sau mult mai mari ca restul datelor de sondaj. Acest defect se remediaz fie eliminnd aceste valori din rndul datelor de sondaj ca valori strine fie folosind mediana prezentat mai jos. 7) Media este sensibil la codificarea datelor. Conform teoremei 6.1 orice operaie aritmetic efectuat cu datele de sondaj, trebuie efectuat i asupra mediei de sondaj. Dac sondajul a fost stratificat, datele de sondaj au forma: x11, , x1,n1 extrase din stratul 1 i cu media de sondaj X 1 ----------------------------------------------------------------------Xk1, , Xk,nk extrase din stratul k i cu media de sondaj X k. Volumul sondajului stratificat este n = n1 + + nk iar media de sondaj X a sondajului stratificat este medie ponderat:

X max X [0;1]. X max X min

X=

Media de sondaj de la punctul 1) se mai numete i medie aritmetic de sondaj. Se folosesc n anumite cazuri i alte medii: media geometric: X g = (x1x 2 ...x n )n de unde
1

n1 X 1 + ... + nk X k n1 + ... + nk

log X g =

1 1 + ... + X Xn 1 - media armonic: = 1 Xa n


2 X1

log X1 + ... + log X n n

media ptratic: X 2 =

Avem X a X g X . Dac X1,,Xn sunt depuse n celulele A1:An din coloana A n EXCEL media X este dat de funcia EXCEL scris n celula B1 : = AVERAGE(A1: An) , media geometric X g este dat de funcia EXCEL scris n celula B2 : = GEOMEAN (A1:An) iar media armonic X a este dat de funcia EXCEL scris n celula B3 : = HARMEAN (A1:An) .
II. Mediana Me este acea valoare fa de care jumtate din numrul valorilor de sondaj sunt mai mici ca ea i cealalt jumtate din numrul valorilor de sondaj sunt mai mari ca ea. Aranjm datele de sondaj n ordine cresctoare: x1 < x2 < < xn.

+ ... + n

X2 n

1 2

59

Me = X k +1 .
2

1 Dac n = numr par avem Me = x k + x k 1 iar dac n = numr impar avem 2 2 2

Aici SMA este prescurtarea pentru suma modulelor abaterilor. Mediana primei jumti a datelor de sondaj cresctoare, se numete cuartila ntia Q1 . Me = Q2. Analog Q3 pentru a doua jumtate a datelor . Dac X1,,Xn sunt depuse n celulele A1:An din coloana A n EXCEL, mediana Me este dat de funcia EXCEL scris n celula B4 : = MEDIAN (A1:An) sau de funcia EXCEL scris n celula B4 : = QUARTILE (A1:An , 2 ) , quartila Q1 este dat de funcia EXCEL scris n celula B5 : = QUARTILE (A1:An , 1) iar quartila Q3 este dat de funcia EXCEL scris n celula B6 : = QUARTILE (A1:An , 3).
Media i mediana au fost indicatori de poziie pentru datele de sondaj. Urmeaz indicatori de variabilitate pentru datele de sondaj. III. Variana (dispersia)
2

Mediana Me este mai stabil fa de media X la valori de sondaj foarte mici fa de restul valorilor de sondaj, deoarece ia n calcul numrul de valori de sondaj nu i mrimea valorilor de sondaj. n plus, SMA(X) = X1 X + ... + X n X este minim pentru X = Me.

V =S
2

(x i X ) =
n 1

(xi - X ) raportat la numrul gradelor de libertate GL = n 1. Datele de sondaj X1, , Xn sunt independente dar satisfac o relaie de dependen: xi = n . X i de aceea avem GL = n 1 . IV. Abaterea - standard

X xi n este variaia ptratic total SPA = = n 1

S=

(x i X )
n 1

este principalul indicator valoric al variabilitii fiind o abatere

mijlocie a datelor de sondaj fa de media lor X . Caliti ale abaterii-standard 1) Abaterea standard este mrginit (cuprins ntre abaterea minim amin i cea maxim amax a datelor de sondaj fa de media lor X . Defecte ale abaterii-standard 2) Abaterea standard S este legat de o unitate de msur (aceeai ca i pentru media X ) deci nu permite comparaii ntre caractere. Pentru comparaii se poate folosi abaterea standard procentual

Sp =

a max S [0;1]. a max a min

60

3) Abaterea standard este sensibil la nmulirea sau mprirea datelor de sondaj conform teoremei 6.2. 4) Abaterea standard singur nu poate aprecia intensitatea variabilitii datelor de sondaj. Dac X1,,Xn sunt depuse n celulele A1:An din coloana A n EXCEL , variaia ptratic total SPA este dat de funcia EXCEL scris n celula B7 : = DEVSQ (A1 : An) , variana V este dat de funcia EXCEL scris n celula B8 : = VAR (A1:An) iar abaterea-standard S este dat de funcia EXCEL scris n celula B9 : = STDEV (A1:An ). Valorile Ui = (Xi - X )/ S se numesc reduse sau normate. Avem : M(Ui) = 0 i V(Ui)= 1. Funcia EXCEL pentru calculul valorilor reduse are forma = STANDARDISE ( Xi , X , S ). V. Coeficientul de variabilitate

S 100 este principalul indicator procentual al variabilitii datelor de sondaj n X jurul mediei la X . El msoar variabilitatea datelor lund ca unitate de msur nu unitatea de msur a caracterului X ci media de sondaj X . c=
Caliti ale coeficientului de variabilitate

1) Coeficientul de variabilitate c este o valoare mrginit (cuprins ntre


i

ntre caractere. 3) Coeficientul de variabilitate c poate aprecia cu ajutorul unor praguri intensitatea variabilitii datelor de sondaj n jurul mediei lor. n raport de valorile coeficientului de variabilitate c avem cazurile: a) Coeficientul de variabilitate c are o valoare mic. n acest caz variabilitatea datelor de sondaj este mic, omogenitatea este mare i media X este foarte bun; b) Coeficientul de variabilitate c are o valoare mijlocie. n acest caz variabilitatea datelor de sondaj este mijlocie, omogenitatea lor este mijlocie i media X este bun; c) Coeficientul de variabilitate c are o valoare mare. n acest caz variabilitatea datelor este mare, omogenitatea este mic i media X este satisfctoare. De exemplu pentru agricultur cazurile precedente au forma: c) c > 20%. a) c < 10%; b) c (10%; 20]; n cazul c) se pune problema existenei unei cauze sistematice pentru variabilitatea mare a datelor de sondaj.
Exemplu Fie o populaie statistic de plante de porumb la recoltarea pe suprafaa de 1 ha cu volumul populaiei N = 75000 plante recoltabile. Fie X = greutatea boabelor pe plant la recoltare (g). Efectum un sondaj de n = 10 plante reprezentative deci cota de reprezentare este

a max 100 ). X min 2) Coeficientul de variabilitate c nu are uniti de msuri, deci permite comparaii

a min 100 X max

n = 1 : 7500 plante. N

61

Datele de sondaj se aranjeaz n ordine cresctoare n tabelul alturat. Avem indicatorii de sondaj: I) II) III) IV) V)

Xi

Xi- X

(Xi- X )2

X=

Me = [48; 51] deci Me = 49.5 g/plant

500 = 50 g/plant 10

Xi X S -1.43 -1.14 -0.71 -0.71 -0.29 0.14 0.57 1.00 1.14 1.43 -

S2 =

448 = 49.8 g 2 10 1 S = 49.8 = 7 g / plant


7 = 14% 50

C=

O sintez elegant a acestor calcule este dat n foaia de calcul C1P1.XLS aflat n Anex.

40 42 45 45 48 51 54 57 58 60 500

-10 -8 -5 -5 -2 1 4 7 8 10 0

100 64 25 25 4 1 16 49 64 100 448

7.2.2. Cazul sondajului de volum mare (n > 30)

n acest caz se face gruparea datelor de sondaj n clase de valori astfel: se fixeaz numrul k de clase de valori care nu trebuie s fie nici prea mic, deoarece se terg trsturi eseniale ale datelor de sondaj, nici prea mare, deoarece se pun n eviden trsturi neeseniale ale datelor de sondaj. Acest numr k de clase de valori se poate calcula cu una din formulele k < 5 log n, k = 1 + 3.322 log n sau se folosesc recomandabil orientative de mai jos.
Volum sondaj (n) 30 40 41 60 61 80 81 100 101 125 126 150 151 175 176 200 201 400 401 600 601 800 801 1000 1001 2000 2001 3000 3001 4000 4001 5000 Lungimea unei clase de valori este Nr. clase de valori (k) 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

l=

Centrul clasei de valori Ci , notat cu xi, este mijlocul clasei adic media aritmetic a valorilor extremitilor clasei Ci.

X max X min . nr. clase de valori k

62

Centrul clasei xi aproximeaz toate valorile de sondaj n clasa Ci, fiind reprezentantul acestor valori. Frecvena absolut ni a valorilor de sondaj ntr-o clas de valori Ci este numrul datelor de sondaj care cad n clasa respectiv, valori aproximate prin centrul clasei xi. Frecvena relativ (procentual)fi a valorilor de sondaj ntr-o clas de valori Ci este

fi =
astfel:

ni . Alturi de frecvenele precedente se pot folosi frecvenele cumulate calculate n

Frecvenele absolute cumulate: n*i = n1 + n2 + + ni (1 < i < n) Frecvenele relative cumulate: f*i = f1 + f2 + + fi (1 < i < n) Datele grupete se pot prezenta grafic prin histograme n raport cu sistemul de axe (Ci, ni), poligonul frecvenelor n raport cu sistemul de axe (xi, ni) i respectiv cumulata n raport

cu sistemul de axe

Toate aceste operaii de grupare, tabelare i reprezentare grafic se pot face cu programul C1GRUP sau cu EXCEL. Pentru datele de sondaj grupate, indicatorii de sondaj de la punctele 5.2 I) V) capt forma: I) Media de sondaj:

l * x + ; ni . i 2

X=
II)

Mediana de sondaj:

k 1 k n i x i = fi x i n i =1 i =1

Me se determin grafic cu ajutorul cumulatei fiind abscisa de pe axa corespunztoare ordonatei n i =


*

xi +

n ; 2

l 2

63

III) Modul de sondaj: Clasa modal Mo este acea clas Ci cu ni maxim. Modul Mo se determin grafic n clasa modal cu ajutorul histogramei :

Spre deosebire de media X care d tendina central a datelor de sondaj ,modul Mo d tendina sa principal ,numindu-se din acest motiv , valoare dominant sau principal. Exist date de sondaj cu mai multe moduri(plurimodale). Dac datele de sondaj negrupate X1,,Xn sunt depuse n celulele A1: An din coloana n EXCEL i cel puin dou din aceste valori sunt egale ,modul Mo este dat de funcia EXCEL scris n celula B10 : = MODE (A1:An ).
IV) Abaterea standard de sondaj:

S=

1 k n k 2 2 ( ) n X X = fi (Xi X) i i n 1i=1 n 1i=1

64

Datorit gruprii n clase de valori i a aproximrii valorilor dintr-o clas cu centrul


l2 unde l este clasei xi, S sufer o eroare care se nltur prin corecia Sheppard S ' = S 12 lungimea claselor de valori.
2

V) Coeficientul de variabilitate de sondaj: c =

S 100 X

1 k X X 1 k VI) Coeficientul de asimetrie de sondaj: A = ni i niU i3 = n i =1 S n i =1 Acest coeficient evalueaz deplasarea pe orizontal a poligonului frecvenelor fa de graficul funciei de repartiie N( X , S) conform figurii :

V)

Coeficientul de boltire de sondaj:

1 k Xi X B = ni n i =1 S

1 k 4 = niU i i =1 n

Acest coeficient evalueaz deplasarea pe vertical a poligonului frecvenelor fa de graficul funciei de repartiie N( X , S) conform figurii :

Dac datele de sondaj negrupate X1,,Xn sunt depuse n celulele A1:An din coloana A n EXCEL, coeficientul de asimetrie ajustat(numit skewness):

65

Skew =

n2 .A (n 1)(n 2)

este dat de funcia EXCEL scris n coloana B11 : = SKEW(A1:An) iar coeficientul de boltire ajustat(numit Kurtozis) : n 2 (n 1) 3(n 1) 2 Kurt = .B (n 1)(n 2)(n 3) (n 2)(n 3) este dat de funcia EXCEL scris n coloana B12 : = KURT(A1:An). Se numete structur de date cu k componente ansamblul de numere f1,,fk care ndeplinesc condiiile : 0 fi 1 (1 i k ) i f1 ++ fk = 1 (f1,,fk) se numete vectorul structurii .
Exemple 1)Frecvenele relative f1,,fk ale datelor de sondaj de volum mare,grupate n clasele de valori C1,,Ck cu centrele de clase x1,,xk definesc structura sondajului pe clase de valori . 2) Fie k ramuri ale unei uniti economice i fie C1,,Ck cheltuielile totale (productive i neproductive) anuale ale ramurilor.Cheltuielile totale anuale ale ntregii uniti sunt C = C1++Ck Numerele f1=C1/ C ,,fk = C1/ C definesc structura de cheltuieli a unitii pe ramuri . In mod analog , fie V1,,Vk veniturile totale anuale ale ramurilor i fie V = V1++Vk total anual al unitii . Numerele f1 = V1/ V ,, fk = Vk/ V definesc structura de venituri a unitii pe ramuri . Concentrarea unei structuri de date este tendina de cretere a ponderii fi a unei componente n detrimentul celorlalte,inclusiv micorarea numrului k de componente . Concentrarea structurii este maxim dac fi = 1 i fj = 0 pentru j i. Diversificarea structurii de date este tendina de egalizare valoric a ponderilor f1,,fk ale celor k componente ale structurii, inclusiv prin mrirea numrului k de componente . Diversificarea structurii este maxim dac f1== fk = 1/k . Media valorilor f1,,fk este f = 1/k iar abaterea-standard a valorilor f1,,fk este :
S=

2 i

k 1

deoarece

=1

Pentru concentrarea maxim avem S= 1 / (k)1/2 iar pentru diversificarea maxim avem S = 0 . Abaterea-standard corectat :
[0;1] k 1 este un indicator al concentrrii structurii pe componente i se poate exprima n procente. Entropia structurii este dat de relaia : S = k .S = k fi 2 1

66
k

H =

f .log
i=1 i

2 i

Valorile lui - f.log2f se pot lua din tabela 16 din Anex . Avem H=0 pentru concentrarea maxim i H= log2 k pentru diversificarea maxim . Entropia ajustat :
H =
k 1 fi .log 2 fi log 2 k i =1

este indicator al diversificrii structurii pe componente i se poate exprima n procente . Fie dou structuri de date cu vectorii de structur (f1,,fk) i (g1,,gk) Mediile lui f1,,fk i respectiv g1,,gk sunt f = g = 1/k . Legtura ntre cele dou structuri se msoar prin coeficientul de corelaie liniar dat de teorema 6.2 : R= k fi gi 1

(k fi 2 1)(k gi2 1)

[1;1]

Conform teoremei 6.1, coeficientul de regresie liniar ntre cele dou structuri are forma :
k fi 2 1 iar termenul liber al regresiei este :
2 1 B1 f i fi gi = B0 = g B1 . f = k k fi 2 1 Conform teoremei 2.9, dac | R | =1 avem legtura funcional liniar ntre

B1 =

k fi gi 1

cele dou structuri ,dat de relaia : g = B0 + B1.f Avem R=1 dac B1>0 i R=-1 dac B1<0 . Dac R = 0 ,cele dou structuri nu sunt corelate liniar .
Exemplu

Dac (f1,,fk) este structura de venituri sau cheltuieli a unei uniti economice n anul de baz i (g1,,gk ) este structura de venituri sau cheltuieli a aceleiai uniti n anul curent , R msoar gradul de stabilitate a structurii n timp . Dac caracterul X are numai valori ntregi, datele de sondaj de volum mare (n > 30) se pot grupa pe valori distincte Xi cu frecvenele absolute ni sau se poate alege un numr de clase k astfel ca lungimea l a claselor s fie numr ntreg deci i limitele claselor s fie numere ntregi. Exemplu Fie o populaie statistic de plante de porumb la recoltare de pe 1 ha cu volumul populaiei N = 75000 plante recoltabile. Pentru a studia greutatea boabelor pe plant X n

67

grame, efectum un sondaj reprezentativ de n = 50 plante deci cota de reprezentare

Date de sondaj n grame: 50; 45; 40; 48; 47; 53; 49; 56; 58; 60; 42; 48; 49; 51; 54; 53; 46; 49; 48; 46; 55; 59; 52; 44; 48; 43; 49; 51; 50; 52; 44; 55; 43; 49; 47; 50; 54; 56; 59; 49; 48; 51; 50; 51; 47; 46; 42; 53; 51. S se grupeze datele n k = 5 clase de valori, s se reprezinte grafic histograma, poligonul frecvenelor, cumulata i s se calculeze indicatorii statistici de la punctul I) VII). Soluie Numrul de clase este k = 5 , lungimea unei clase de valori este : 60 40 l= = 4g . 5 Frecvene n*i Frecvene Frecvene f*i Clase Centre clase Frecvene ni fI Xi 0.10 0.10 5 plante 5 plante 42 g Sub 44 g 0.28 0.18 14 9 46 [44 48 g) 0.70 0.42 35 21 50 [48 52 g) 0.88 0.18 44 9 54 [52 56 g) 1.00 0.12 50 6 58 peste 56 g Graficele sunt:
Histograma :

n 50 = = 1 : 1500 plante. N 75000

Poligonul frecvenelor :

68

Cumulata :

I) Media de sondaj: 1 X = ( 5 40 + 9 46 + 21 50 + 9 54 + 6 58 ) = 50.16 g/plant 50 II) Mediana de sondaj Me = 50 g III) Modul de sondaj Mo = 50 g IV) Abaterea standard de sondaj:
S= 1 2 2 2 2 2 5( 42 50.16) + 9( 46 50.16) + 21( 50 50.16) + 9( 54 50.16) + 6( 58 50.16) = 49 4 = 4.46 g 12

= 4.5 g/plant. Corecia Shepard: S ' = S 2

V) Coeficientul de variabilitate de sondaj:

C=

4.5 = 9% 50.16

69

VI) Coeficientul de asimetrie de sondaj: 1 3 3 3 3 3 A= 5 4250.16) +9( 4650.16) +21( 5050.16) +9( 5450.16) +6( 5850.16) ==0.008 3 ( 504.5 VII) Coeficientul de boltire de sondaj:
B= 1 4 4 4 4 4 5 4250.16) +9( 4650.16) +21( 5050.16) +9( 5450.16) +6( 5850.16) =2.41 4 ( 504.5 VIII) Coeficientul de concentrare de sondaj:

= 28.6 % 5 1 Desigur indicatorii X , Me, S, c puteau fi calculai i din cele n = 50 valori de sondaj nainte de gruparea datelor. Dac X este nsuire calitativ (atributiv), facem convenia: 1, Exemplarul i are nsuirea X xi = 0, n rest Efectum un sondaj de volum n deci datele de sondaj vor fi un numr de n cifre egale cu 0 sau cu 1. Fie k numrul cifrelor Xi = 1 (1 < k < n). Media de sondaj devine

S =

5 ( 0.102 + 0.182 + 0.422 + 0.182 + 0.122 ) 1

f=

Indiferent de volumul de sondaj n, datele de sondaj se mpart n 2 clase: C = {xi/xi = 1} cu k valori i C = {xi/xi = 0} cu n k valori. Exemplu ntr-un miniincubator avem o populaie statistic de N = 1000 ou. Efectum un sondaj reprezentativ de n = 50 ou i gsim k = 6 ou neeclozionate. S se calculeze frecvena de sondaj a oulor neeclozionate. Soluie

k [0;1] , numindu-se frecven de sondaj. n

f=

Exemple de nsuiri calitative (atributive) n agricultur - ecloziune ou culoare, culoare ou, rezistena la manipulare ou; - viabilitate purcei sugari, pui de o zi; - stare de gestaie la animale; - stare de profitabilitate a unei societi agricole. 7.3 Indicatori de sondaj de evoluie 7.3.1. Cazul msurtorilor simple n timp

k 6 = = 12% n 50

Dac nsuirea X ia valori ntregi, datele unui sondaj extras din populaie la momentele de timp t1, t2, , tn sunt valori instantanee x1, , xn msurate n acele momente de timp. Dac nsuirea X ia valori reale, datele unui sondaj extras din populaie n intervalele de timp [t1, t2), [t2, t3), , [tn-1, tn] sunt valori medii x1, , xn msurate n acele intervale de timp cu lungimile t2-t1, t3-t2, , t n t n 1 . Exemplu

X.

Fie o populaie statistic pe care o studiem din punct de vedere al nsuirii cantitative

70

X = efectivul anual de vaci al unei ferme zootehnice se msoar prin valori instantanee (la 31 decembrie al anului calendaristic). X = producia anual de lapte al vacilor dintr-o ferm zootehnic se msoar prin valori medii pe perioada 1 ianuarie 31 decembrie a anului calendaristic sau pe perioada medie de lactaie normal de 308 zile. Msurtorile sunt echidistante dac t2t1 = t3t2 = = tn-tn-1 i neechidistante n caz contrar. Exemplu de msurtori echidistante : Producia de lapte a vacilor se controleaz echidistant din 28 n 28 zile astfel c ntr-o lactaie normal de 308 zile se efectueaz 11 controale ale produciei de lapte. Prezentarea grafic a datelor de sondaj de evoluie instantanee se face prin poligonul valorilor n raport cu axele (ti, xi) iar a datelor de sondaj de evoluie se face prin cronograma n raport cu axele ([ti, ti+1), xi). Indicatori statistici de sondaj de evoluie
I) Media cronologic Dac X se msoar prin valori instantanee x1, , xn la momentele de timp t1, , tn

avem:

x (t t1 ) + x 2 (t 3 t 2 ) + ... + x n 1 (t n t n 1 ) (1) X C = 1 2 t n t1

Dac X se msoar prin valori medii x1, , xn n intervalele de timp [t1, t2), [t2, t3), , [tn-1, tn] avem:

n cazul msurtorilor echidistante n timp, avem t2 - t1 = t3 t2 =, ,= t n t n 1 = d i t n t1 = (n 1 ).d deci : (3) X C =

x1 + x 2 (t 2 t1 ) + x 2 + x 3 (t 3 t 2 ) + ... + x n 1 + x n (t n t n 1 ) 2 2 2 (2) X m = t n t1

X1 + X 2 + ...X n 1 respectiv: n 1

X1 X + X 2 + ... + X n 1 + n 2 (4) X m = 2 n 1
II) Ritmul mediu valoric(absolut) de evoluie Abaterile valorice ale datelor de sondaj consecutive sunt D1 = X2 X1, , = X n X n 1 . Ritmul mediu valoric de evoluie al datelor de sondaj va fi:

Dn 1

(5) D =

(x 2 x1 )(t 2 t1 ) + (x 3 x 2 )(t 3 t 2 ) + ... + (x n x n 1 )(t n t n 1 )


t n t1

n cazul msurtorilor echidistante avem t2 = t1 + r, t3 = t1 + 2r, , tn = t1 + (n 1)r deci: (6) D =

X n X1 n 1

71

Valorile ateptate ale datelor de sondaj de evoluie formeaz progresia aritmetic cu raia D: X1, X1 + D, , X1 + (n 1)D Aceste valori ateptate X1 + j.D se apropie de cele observate Xj atunci cnd caracterul X evolueaz numai cresctor sau numai descresctor n timp i abaterile valorice ale datelor de sondaj consecutive D1 ,,D n 1 sunt toate pozitive sau toate negative i apropiate ntre ele ca valoare (caracterul X evolueaz liniar n timp). In caz contrar se ajusteaz aceste abateri valorice D1,,D n 1 cu o funcie de regresie neliniar n raport cu timpul ca n seciunea 10.3 Pe durata a m perioade de timp, variaia valoric a caracterului X va fi P = x1 + (m 1)D x1 = (m 1) D deci X variaz valoric cu cantitatea P. n m = perioade de timp. Dac notm x1 + + xm = Q avem:

P +1 D

adic numrul de perioade de timp n care se acumuleaz cantitatea final Q a caracterului X respectiv n care se consum cantitatea iniial Q a caracterului X.
III) Ritmul mediu procentual(relativ) de evoluie Abaterile procentuale ale datelor de sondaj consecutive sunt: X X X I1 = 2 , I 2 = 3 , ..., I n - 1 = n X1 X2 X n 1 Ritmul mediu procentual de evoluie a datelor de sondaj va fi:
tn tn 1 t t X t2 t1 X t3 t2 n 1 Xn 3 2 (7) I = ... X1 X2 X n 1 Dac logaritmm relaia precedent, obinem: ( logX 2 log X 1 )( t2 t1 ) + ... + ( logX n log X n1 )( tn tn1 ) (8) log I = tn t1 deci logaritmul lui I este ritmul mediu valoric de evoluie al valorilor de sondaj logaritmate. Dac msurtorile sunt echidistante avem: t2 - t1 = t3 t2 = = t n t n 1 = d iar tn t1 = (n 1).d deci avem : log X n log X 1 log I = adic : n 1
1

m(m 1) D = Q de unde 2 D 2X1 + (D 2X1 ) + 8DQ m= 2D mX1 +

X n 1 (9) I = n X1 Valorile ateptate ale datelor de sondaj de evoluie formeaz o progresie geometric cu raia I: X1, X1.I, , X1 .I n 1 Aceste valori ateptate X1.Ij se apropie de cele observate Xj atunci cnd

72

caracterul X evolueaz numai cresctor sau numai descresctor n timp i abaterile procentuale ale datelor de sondaj consecutive, notate cu I1,,I n 1 sunt toate supraunitare sau toate subunitare i apropiate ntre ele ca valoare (caracterul X are o evoluie exponenial n timp ). In caz contrar se ajusteaz aceste abateri procentuale I1,,I n 1 cu o funcie de regresie neliniar in raport cu timpul ca n seciunea 10.3 Pe durata a m perioade de timp variaia procentual a lui X va fi X I m 1 log P = I m 1 deci X variaz procentual cu valoarea P n m = + 1 perioade de timp. P= 1 log I X1

Dac notm X1 + + Xm = Q avem: X 1

I m 1 = Q de unde I 1

Q log ( I 1) + 1 X1 m= adic numrul de perioade de timp n care se acumuleaz log I cantitatea final Q a valorilor caracterului X respectiv n care se consum cantitatea iniial Q a valorilor caracterului X. Exemplu Fie X = greutatea porcilor la ngrat (kg). Fie ti vrsta n zile a porcilor. Se fac n = 10 controale echivalente din 28 n 28 zile. ti xi(g/zi) 28 3 56 12 84 26 112 42 140 60 168 78 196 94 224 107 252 117 280 120

Graficul perechilor de valori (x,z) are forma

Se cer X , D, I. Soluie

1 1 X 1 + X 2 + ... + X n 1 + X n 2 X = 2 = 66.4 kg n 1

73

D=

X n X1 log X n log X 1 = 13 kg; log I = = 0.178 deci I = =100.178 =1.57 n 1 n 1

Fie diviziunile de timp echidistante t1,,tn (cu t2 t1 = t3 t2 = = tn tn - 1 ). n cazul msurtorilor echidistante , indicatorii D i I nu depind de X2,, Xn -1 , defect care poate fi corectat prin metoda uniformizrii nclinrii dinilor de ferstru ai seriei cronologice X1,, Xn , dup cum urmeaz : a) Corecia lui D Avem diferenele de ordin I : Di = Xi+1 Xi . Dac diviziunile de timp echidistante au lungimea 1 adic : t2 t1 = t3 t2 = = tn tn - 1 =1 atunci Di este nclinarea(panta) segmentului care unete punctele ( ti , Xi ) i (ti+1 , Xi+1) cu ti+1 ti = 1. Dac Di < 0 , avem Xi > Xi+1 deci pe tronsonul [ ti ; ti+1] caracterul X are variaie descresctoare. Dac Di = 0 , avem Xi = Xi+1 deci pe tronsonul [ ti ; ti+1] caracterul X este staionar. Dac Di > 0 , avem Xi < Xi+1 deci pe tronsonul [ ti ; ti+1] caracterul X are variaie cresctoare. Vom nlocui pe D cu ritmurile medii valorice (absolute) RV1 i RV2 care urmeaz : RV1 < 0 este media aritmetic a diferenelor Di < 0 iar RV2 > 0 este media aritmetic a diferenelor Di > 0 . Valorile lui X1,, Xn vor fi ajustate cu ajutorul lui RV1 i RV2 astfel :

XV1 = X 1

Variaia ptratic total a lui Y este : SPAT = ( X i X ) 2 iar variaia ptratic rezidual valoric a lui X este : SPAV = (Xi XVi )2 . Dac SPAV < SPAT , raportul de corelaie valoric are forma :

X i + RV1 dac X i > X i +1 XVi = X i dac X i = X i +1 X + RV dac X < X i i +1 2 i

(1 i n-1)

RV = 1 SPAV / SPAT [0;1]

X n + RV1 dac ne ateptm ca X s scad. XVn+1 = X n dac ne ateptm ca X s fie staionar. X + RV dac ne ateptm ca X s creasc. 2 n
b) Corecia lui I Avem rapoartele de ordin I : Ri = Xi+1 / Xi . Dac diviziunile de timp echidistante au lungimea 1 adic : t2 t1 = t3 t2 = = tn tn - 1 =1 atunci Ri este nclinarea(panta) segmentului care unete punctele ( ti , logXi ) i (ti+1 , logXi+1) cu ti+1 ti = 1. Dac Ri < 1 , avem Xi > Xi+1 deci pe tronsonul [ ti ; ti+1] caracterul logX are variaie descresctoare. Dac Ri = 1 , avem Xi = Xi+1 deci pe tronsonul [ ti ; ti+1] caracterul logX este staionar. Dac Ri > 1, avem Xi < Xi+1 deci pe tronsonul [ ti ; ti+1] caracterul logX are variaie cresctoare.

Prognoza valorii necunoscute Xn+1 se face cu valoarea :

74

Vom nlocui pe R cu ritmurile medii procentuale (relative) RP1 i RP2 care urmeaz : RP1 < 1 este media geometric a rapoartelor Ri < 1 iar RP2 > 1 este media geometric a rapoartelor Ri > 1 . Valorile lui X1,, Xn vor fi ajustate cu ajutorul lui RP1 i RP2 astfel :

XP 1 = X1

Variaia ptratic total a lui Y este : SPAT = ( X i X ) 2 iar variaia ptratic rezidual procentual a lui X este : SPAP = (Xi XPi )2 . Dac SPAP < SPAT , raportul de corelaie procentual are forma :

X i RP 1 dac X i > X i +1 XPi = X i dac X i = X i +1 X RP dac X < X 2 i i +1 i

(1 i n-1)

RP = 1 SPAP / SPAT [0;1]

Exemplu Fie X nivelul apei unui ru din Romnia msurat la mir (m) n n = 10 zile consecutive. Msurtorile i calculele conform formulelor precedente figureaz n tabelul urmtor: Xi 6.5 6.8 6.6 6.6 7.0 7.2 7.2 6.9 6.8 6.6 68.2 Diferene Di 0 XVi 6.5 6.8 6.6 6.6 6.9 7.3 7.3 7.0 6.7 6.6 X Di 0 0 0 0 0.1 - 0.1 - 0.1 - 0.1 0.1 0 X Rapoarte Ri 1 XPi 6.50 6.79 6.60 6.60 6.90 7.30 7.30 7.00 6.70 6.60 X DPi 0 0.01 0 0 0.10 - 0.10 - 0.10 - 0.10 0.10 0 X

X n RP 1 dac ne ateptm ca X s scad. XPn+1 = X n dac ne ateptm ca X s fie staionar. X RP dac ne ateptm ca X s creasc. 2 n

Prognoza valorii necunoscute Xn+1 se face cu valoarea :

- 0.2

0.3 0.4 0.2

0 0

0.97

1.05 1.06 1.03

1 1

- 0.3 - 0.1 - 0.2 RV1= - 0.2;RV2=0.3

0.96 0.99 0.97 RP1=0.971;RP2=1.045

Rezultate : Graficul perechilor (x,y) are forma :

75

Media cronologic pentru msurtori instantanee este MC=68.2/10 = 6.82 m Ritmul mediu de scdere valoric este RV1 = - 0.2 m Ritmul mediu de cretere valoric este RV2 = 0.3 m Ritmul mediu de scdere procentual este RP1 = 0.971; Scderea medie este RP1-1 =2.9 % Ritmul mediu de cretere procentual este RP2 = 1.045 ; Creterea medie este RP2-1 =4.5 % Variaia ptratic total a lui X este SPAT = 0.576 Variaia rezidual valoric a lui X este SPAV = 0.087 deci raportul de corelaie valoric este RCV = 0.956 Variaia rezidual procentual a lui X este SPAP = 0.096 deci raportul de corelaie procentual este RCP = 0.951 Prognoz valoric :

Prognoz procentual :

X 10 + RV1 =6.6-0.2=6.4m dac ne ateptm ca X s scad. XV11 = X10 =6.6m dac ne ateptm ca X s fie staionar. X + RV =6.6+0.3=6.9m dac ne ateptm ca X s creasc. 2 10

X 10 RP 1 =6.6*0.971=6.41m dac ne ateptm ca X s scad. XP 11 = X10 =6.6m dac ne ateptm ca X s fie staionar. X RP =6.6*1.045=6.89m dac ne ateptm ca X s creasc. 2 10
7.3.2. Cazul msurtorilor multiple n timp

Fie o populaie statistic pentru care studiem evoluia caracterului X. Extragem m exemplare independente din populaie pe care msurm caracterul X n n momente de timp t1, , tn. Datele de sondaj au forma:

76

Nr. 1 2 m

Timp

t1

t2 ...tn

Medii cronologice

x11 x12 x1n x21 x22 x2n . xm1 xm2 .. xmn

X Ci X C1 X C2

Medii de sondaj X j

X 1 X 2 . X n

X Cm

XC

Pentru repartiia caracterului X n sondajul cu m exemplare avem la momentul tj media de sondaj X j =

Pe ntreaga perioad de timp [t1, t n] avem indicatorii globali: - media cronologic global :

1 m x ij ; (1 < j < n). m i =1

XC =
-

ritmul mediu valoric global:

1 1 (X1 + X 2 )(t 2 t1 ) + ... + 1 (X n 1 + X n )(t n t n 1 ) t n t1 2 2

D=
-

ritmul mediu procentual global I unde : 1 ( log X 2 log X 1 ) ( t2 t1 ) + ... + ( log X n log X n 1 ) ( tn tn 1 ) log I = tn t1 Pentru evoluia caracterului X n timp avem pentru exemplarul de sondaj numrul i media de evoluie:

1 [(X 2 X1 )(t 2 t1 ) + ... + (X n X n 1 )(t n t n 1 )] t n t1

X Ci =

1 1 (X i1 + X i 2 )(t 2 t1 ) + ... + 1 (X i, n 1 + X in )(t n t n 1 ) t n t1 2 2

; (1 < i < m). Pe ansamblul ntregului sondaj avem indicatorii de sondaj globali:

1 m - media de sondaj global: X = X Ci m i =1


-

Exemplu X = greutatea porcilor la ngrat (kg). Fie tj numrul de zile trecute de la data ftrii porcilor pn la data controlului numrul j. Se fac n = 10 controale echidistante de 28 zile la m = 5 porci. Data de sondaj:

1 m (X Ci X )2 m 1 i =1 S coeficientul de variabilitate de sondaj global: C = 100 (%) X


abaterea standard de sondaj global: S =

77

Repetiia C 1 2 3 4 5 Medii sondaj Xj

tj

28 3 3 3 4 3

56 12 13 12 13 12

84 26 27 25 27 25

112 42 43 41 43 41

140 60 61 59 61 59

168 78 78 77 77 78

196 94 94 94 92 96

224 104 106 109 104 111

252 117 115 118 112 121

280 120 118 122 115 125

Medii cronologice 66.4 66.4 66.4 65.4 67.4

X Ci

3.2

12.4

26

42

60

77.6

94

107.4

116.6

120

X C=66.4

X =66.4

Pe baza datelor din tabel i a mediilor de la capetele de tabel s le calculeze indicatorii de repartiie i evoluie globali. Soluie X X1 + X 2 + ... + X n 1 + n 2 = 66.4 kg. Media cronologic global: X C = 2 n 1 Ritmul mediu valoric global:

D=

X n X1 = 13 kg. n 1

Ritmul mediu procentual global: log I = deci I = 100.175 = 1.49 Media de sondaj global: X =

log X n log X 1 = 0.175 n 1

1 X C1 + ... + X C n = 66.4 kg. n Abaterea standard de sondaj global: 2 2 1 S= X C1 X + ... + X C n X = 0.47 kg n 1 S Coeficientul de variabilitate de sondaj global: C = 100 = 0.7% X 7.3.3 Indici statistici

n seciunea precedent am vzut c pentru un caracter X cu valorile diferite X0 , X1 putem calcula : - variaia absolut : D(X)=X1 X0 ; - variaia relativ : I(X)=X1 / X0 - variaia procentual : R(X)=D(X) / X0 . n limbaj economic diferena D se numete spor : X1=X0 +D(X) , raportul I se numete indice : X1=X0 . I(X) iar mrimea R se numete ritm : X1=X0 +X0.R(X) . Variaia relativ este superioar celei absolute deoarece nu are uniti de msur iar variaia procentual se calculeaz uir pe baza celei relative : R(X)=I(X) 1 .
I. n multe situaii ntlnim caractere Z compuse din produse ale altor caractere X,Y : Z=X.Y cu valori diferite : Z0=X0.Y0 respectiv Z1=X1.Y1 . Exemple: - Cheltuielile cu o resurs = consumul de resurs x costul unitii de resurs ; - Venitul din vnzarea unui produs agricol = producia fizic x preul de vnzare ;

78

- Venitul dim munc = productivitatea muncii(venit pe muncitor) x nr. muncitori . n acest caz putem calcula : D(Z)=Z1- Z0 ; I(Z)= Z1/ Z0 ; R(Z)=D(Z) / Z0 . Avem relaiile : I(Z)=I(X.Y)=I(X).I(Y) ; R(Z)=R(X.Y)=I(X).I(Y)-1 Avem i mrimile : - produsul mediu : PM(Z) = Z0 = X0.Y0 - produsul marginal : PD(Z) = (X1- X0).(Y1 Y0) = D(X).D(Y) - elasticitatea produsului : EP(Z) = PD(Z) / PM(Z) = R(X).R(Y)
II. n multe situaii ntlnim caractere Z compuse din rapoarte(rate) ale altor caractere X,Y : Z=X /Y cu valori diferite : Z0=X0 / Y0 respectiv Z1=X1 / Y1 . Exemple - Rata profitului = Profit / Cheltuieli ; - Costul unitii de produs = Cheltuieli cu produsul / Producia fizic ; - Rata omajului = Numr omeri / Numr persoane active . n acest caz putem calcula : D(Z)=Z1 - Z0 ; I(Z)= Z1/ Z0 ; R(Z)=D(Z) / Z0 . Avem relaiile : I(Z)=I(X /Y)=I(X) / I(Y) ; R(Z)=R(X / Y)=I(X) /I(Y)-1 Avem i mrimile : - rata medie : PM(Z) = Z0 = X0 / Y0 - rata marginal : PD(Z) = (X1- X0) / (Y1 Y0) = D(X) / D(Y) - elasticitatea ratei : EP(Z) = PD(Z) / PM(Z) = R(X) / R(Y) Indicii statistici sunt numere relative rezultate din compararea valorilor unui indicator statistic la diferite momente de timp,n locuri diferite sau n categorii diferite n raport cu un criteriu. Indicii calculai la momente diferite de timp, se numesc indici ai dinamicii. Indicii calculai n locuri diferite, se numesc indici teritoriali. Indicii calculai n categorii diferite n raport cu un criteriu,se numesc indici calitativi. n calculul indicilor se aleg dou momente de timp/locuri/categorii : 1) Momentul de timp/locul/categoria de baz (de referin) , notat cu 0 . 2) Momentul de timp/locul/categoria curent ,notat cu 1 Pentru elemente omogene se calculeaz indici elementari(individuali) iar pentru elemente neomogene se calculeaz indici sintetici (de grup) . Caliti i defecte ale indicilor 1. Sunt mrimi mrginite pozitive. 2. Nu au uniti de msur deci se pot compara ntre ei. 3. Nu sunt sensibili la nmulirea i mprirea datelor. 4. Indicii sintetici se pot calcula numai pentru cheltuieli i venituri . Exemplul 1 Fie trei resurse R1 (motorin n litri/ha ) , R2 (ngrminte chimice NPK n Kg/ha ) i R3 (ap de irigaie n m3/ha ). Baza este anul 2000 iar anul curent este anul 2003. Qi (uniti de resurs/ha ) este consumul de resurs Ri ,Ci (lei/unitate de resurs ) este costul resursei Ri iar CHi=Qi .Ci (milioane lei/ha) este suma cheltuit cu resursa Ri .

Resurse

Consumuri Qi

Costuri Ci

Cheltuieli CHi= QiCI

79

R1 R2 R3 Total
A.

Baz Qi0 120 210 1000

Curent Qi1 110 220 800

Baz Ci0 12000 6000 300 18300

Curent Ci1 18000 8000 500 26500

Qi0Ci0 1.44 1.26 0.30 3.00

Qi0Ci1 2.16 1.68 0.50 4.34

Qi1Ci0 1.32 1.32 0.24 2.88

Qi1Ci1 1.98 1.76 0.40 4.14

Indici individuali : - pentru consumuri : IQ (R1) =Q11 / Q10 =110 / 120 = 0.92 IQ (R2) = Q21 / Q20 = 220 / 210 = 1.05 IQ (R3) = Q31 / Q30 = 800 / 1000 = 0.80 IQ = [IQ(R1). IQ(R2). IQ(R3)]1 / 3 = 0.916

- pentru costuri : IC (R1 ) = C11 / C10 = 18000 / 12000 = 1.50 IC (R2) = C21 / C20 = 8000 / 6000 = 1.33 IC (R3) = C31 / C30 = 500 / 300 = 1.60 IC = [IC(R1). IC(R2). IC(R3)]1 / 3 = 1.494 - pentru cheltuieli : ICH (R1) = (Q11C11) / (Q10C10) = 1.98 / 1.44 = 1.375 ICH (R2) = (Q21C21) / (Q20C20) = 1.76 /1.26 = 1.40 ICH (R3) = (Q31C31) / (Q30C30) = 0.40 /0.30 = 1.33 ICH = [ICH(R1). ICH(R2). ICH(R3)]1 / 3 = 1.368 A) Indici sintetici pentru cheltuieli ca indici agregai : 1) Indicele total : IT (CH)= (Qi1Ci1) / (Qi0Ci0) = 4.14 / 3.00 = 1.38 2) Indicele Laspeyres : - pentru consumuri : IL(Q) = (Qi1Ci0) / (Qi0Ci0) = 2.88 / 3.00 = 0.96 - pentru costuri : IL(C) = (Qi0Ci1) / (Qi0Ci0) = 4.34 / 3.00 = 1.45 3) Indicele Paasche : - pentru consumuri : IP(Q) = (Qi1Ci1) / (Qi0Ci1) = 4.14 / 4.34 = 0.95 - pentru costuri : IP(C) = (Qi1Ci1) / (Qi1Ci0) = 4.14 /2.88 = 1.44 4) Indicele Fisher : - pentru consumuri : IF(Q) = [ IL(Q).IP(Q) ]1/2 = 0.955 - pentru costuri : IF(C) = [ IL(C).IP(C) ]1/2 = 1.455
Observaii : i) Indicele Laspeyres este medie aritmetic ponderat a indicilor individuali I(Ri) cu ponderile : Ui = (Qi0Ci0) / ( Qi0Ci0) deci Ui = 1. - pentru consumuri :

80

IL(Q) = IQ(Ri).Ui - pentru costuri : IL(C) = IC(Ri).Ui ii) Indicele Paasche este medie armonic ponderat a indicilor individuali I(Ri) cu ponderile : Vi = (Qi1Ci1) / ( Qi1Ci1) deci Vi = 1 : - pentru consumuri : [ 1 / IP(Q) ] = [ 1 / IQ(Ri ) ]. Vi - pentru costuri : [ 1 / IP(C) ] = [ 1 / IC(Ri ) ]. Vi iii) Indicele total este produsul indicilor Laspeyres i Paasche : IT (CH)= IL(Q).IP(C) = IL(C).IP(Q)
B) Indicii sintetici pentru cheltuieli ca rapoarte de medii : 5) Indicele cu structur variabil : ISV = [ (Qi1Ci1) / (Ci1) ] : [ (Qi0Ci0) / (Ci0) ] = (4.14 / 26500) : (3.00 / 18300) = 0.95 6) Indicele cu structur fix : ISF = [ (Qi1Ci1) / (Ci1) ] : [ (Qi0Ci1) / (Ci1) ] = (4.14 / 26500) : (4.34 / 26500) = 0.95 7) Indicele variaiei structurii : IVS = [ (Qi0Ci1) / (Ci1) ] : [ (Qi0Ci0) / (Ci0) ] = (4.34 / 26500) : (3.00 / 18300) = 1 Observaii : iv) Pentru indicii 7) - 9) avem relaia : ISV = ISF.IVS v) Cu notaiile Wi0 = Ci0 / (Ci0) deci Wi0 = 1 respectiv Wi1 = Ci1 / (Ci1) deci Wi1 = 1 , indicii 7) - 9) capt forma de indici agregai : ISV = (Qi1Wi1) / (Qi0Wi0) analog cu indicele total IT de la punctul 1) ISF = (Qi1Wi1) / (Qi0Wi1) analog cu indicele Paasche IP(Q) de la punctul 3) IVS = (Qi0Wi1) / (Qi0Wi0) analog cu indicele Laspeyres IL(C) de la punctul 2)

Cheltuielile CH sunt un indicator complex bifactorial de forma CH=Q.C Variaia cheltuielilor n timp este absolut :(CH)=Qi1Ci1 - Qi0Ci0 sau relativ : IT(CH) = (Qi1Ci1) / Qi0Ci0 Aceste variaii absolute sau relative , se pot descompune n componente cu metoda restului/ctului nedescompus . Variaiile absolute sunt : (CH)=Qi1Ci1 - Qi0Ci0 = 1.14 (Q)=Qi1Ci0 - Qi0Ci0 = - 0.12 (C)=Qi0Ci1 - Qi0Ci0 = 1.34 (QC)=( Qi1Ci1 - Qi1Ci0 ) - ( Qi0Ci1 - Qi0Ci0 ) = - 0.08 Verificare : (CH) = (Q) + (C) + ( QC ) Coeficienii de importan pentru repartizarea restului nedescompus ( QC ) n mod proporional cu influena independent a factorilor ,vor fi: (Q) = (Q) / ((Q) + ( C )) = - 0.098 (C) = (C) / ((Q) + ( C )) =1.098 deci (Q) + ( C ) = 1 Recalculm variaiile absolute astfel : *(Q) = (Q) + (Q).(QC) = - 0.11 *(C) = (C) + (C).(QC) = 1.25

81

Verificare : (CH) = *(Q) + *(C) Variaiile relative sunt : IT (CH) = (Qi1Ci1)/ (Qi0Ci0)= 1.38 IL (Q) = (Qi1Ci0 )/ (Qi0Ci0 )= 0.96 IL (C ) = (Qi0Ci1 )/ (Qi0Ci0 )= 1.45 I(QC) = (Qi1Ci1 / Qi1Ci0) : (Qi0Ci1 / Qi0Ci0) = IP (C) /IL( C) = 0.993 Verificare : IT(CH) = IL(Q) . IL(C) .I(QC) Coeficienii de importan pentru repartizarea ctului nedescompus I(QC) n mod proporional cu influena independent a factorilor vor fi : (Q) = ( log IL(Q) ) / (log IL(Q)+ log IL(C)) = - 0.126 (C) = ( log IL(C) ) / (log IL(Q)+ log IL(C)) =1.126 deci (Q)+(C) = 1 Recalculm variaiile relative astfel : * I L(Q) = IL(Q).[I(QC)](Q) = 0.961 I*L(C) = IL(C).[I(QC)](C) = 1.438 Verificare : IT(CH) = I*L(Q). I*L(C) Metoda poate fi aplicat i indicatorilor compleci trifactoriali , tetrafactoriali , etc. Exemplul 2 Fie trei produse : T1(Gru) ; T2(Porumb) ; T3(Floarea soarelui). Baza este anul 2000 iar anul curent este 2003. Yi este producia fizic a produsului Ti (Kg/ha) , Di este preul de vnzare al unitii de producie fizic a produsului Ti (lei/kg) iar Vi=Yi.Di este venitul obinut din vnzarea produsului Ti (milioane lei/ha).

Produse T1 T2 T3 T O

Producii Yi Curent Yi1 3500 6000 2000

Baz Yi0 3000 5000 1800 T A L

Preuri vnzare Di Baz Curent Di0 Di1 2000 4000 2500 4000 10000 12000 14500 20000

Venituri Vi=YiDI Yi0Di0 6 12.5 18 36.5 Yi0Di1 12 20 21.6 53.6 Yi1Di0 7 15 20 42 Yi1Di1 14 24 24 62

A) Indici individuali : - pentru producii : IY(T1) = Y11 / Y10 = 3500/3000 = 1.17 IY(T2) = Y21 / Y20 = 6000/5000 = 1.20 IY(T3) = Y31 / Y30 = 2000/1800 = 1.11 IY = [IY(T1). IY(T2). IY(T3)]1 / 3 = 1.159

- pentru preuri de vnzare : ID(T1) = D11 / D10 = 4000/2000 = 2.00 ID(T2) = D21 / D20 = 4000/2500 = 1.60 ID(T3) = D31 / D30 = 12000/10000 = 1.20 ID = [ID(T1). ID(T2). ID(T3)]1 / 3 = 1.566

82

- pentru venituri : IV(T1) = Y11D11 / Y10D10 = 14/6 = 2.33 IV(T2) = Y21D21 / Y20D20 = 24/12.5 = 1.92 IV(T3) = Y31D31 / Y30D30 = 24/18 = 1.33 IV = [IV(T1). IV(T2). IV(T3)]1 / 3 = 1.814
B) Indici sintetici pentru venituri ca indici agregai : 1) Indicele total : IT(V) = (Yi1Di1) / (Yi0Di0) = 62/36.5 = 1.70 2) Indicele Laspeyres : - pentru producii : IL (Y) = (Yi1Di0) / (Yi0Di0) = 42/36.5 = 1.15 - pentru preuri de vnzare : IL (D) = (Yi0Di1) / (Yi0Di0) = 53.6/36.5 = 1.47 3) Indicele Paasche : - pentru producii : IP (Y) = (Yi1Di1) / (Yi0Di1) = 62/53.6 = 1.48 - pentru preuri de vnzare : ID = (Yi1Di1) / (Yi1Di0) = 62/42 = 1.48 4) Indicele Fisher : - pentru producii : IF(Y) = [ IL(Y) . IP(Y) ]1/2 = 1.155 - pentru preuri de vnzare : IF(D) = [ IL(D) . IP(D) ]1/2 = 1.475 C) Indici sintetici pentru venituri ca rapoarte de medii : 5) Indicele cu structur variabil : ISV = [ (Yi1Di1) / (Di1) ] : [ (Yi0Di0) / (Di0) ] = (62/20000) : (36.5/14500) = 1.23 6) Indicele cu structur fix : ISF = [ (Yi1Di1) / (Di1) ] : [ (Yi0Di1) / (Di1) ] = (62/20000) : (53.6/20000) = 1.16 7) Indicele variaiei structurii : IVS = [ (Yi0Di1) / (Di1) ] : [ (Yi0Di0) / (Di0) ] = (53.6/20000) : (36.5/14500) = 1.06 Verificare : ISV = ISF. IVS

Veniturile V sunt un indicator complex bifactorial de forma V = Y.D Variaia veniturilor n timp este absolut :(V)=Yi1Di1 - Yi0Di0 sau relativ : IT(V) = (Yi1Di1) / Yi0Di0 Aceste variaii absolute sau relative , se pot descompune n componente cu metoda restului/ctului nedescompus . Variaiile absolute sunt : (V)=Yi1Di1 - Yi0Di0 = 25.5 (Y)=Yi1Di0 - Yi0Di0 = 5.5 (D)=Yi0Di1 - Yi0Di0 = 17.1 (YD)=( Yi1Di1 - Yi1Di0 ) - ( Yi0Di1 - Yi0Di0 ) = 2.9 Verificare : (V) = (Y) + (D) + ( YD ) Coeficienii de importan pentru repartizarea restului nedescompus ( YD ) n mod proporional cu influena independent a factorilor ,vor fi: (Y) = (Y) / ((Y) + ( D )) = 0.357 (D) = (D) / ((Y) + ( D )) =0.643

83

deci (Y) + ( D ) = 1 Recalculm variaiile absolute astfel : *(Y) = (Y) + (Y).(YD) = 2.143 *(D) = (D) + (D).(YD) = 3.857 Verificare : (V) = *(Y) + *(D)
Variaiile relative sunt : IT (V) = (Yi1Di1)/ (Yi0Di0)= 1.699 IL (Y) = (Yi1Di0 )/ (Yi0Di0 )= 1.151 IL (D ) = (Yi0Di1 )/ (Yi0Di0 )= 1.468 I(YD) = (Yi1Di1 / Yi1Di0) : (Yi0Di1 / Yi0Di0) = IP (D) /IL( D) = 1.005 Verificare : IT(V) = IL(Y) . IL(D) .I(YD)

Coeficienii de importan pentru repartizarea ctului nedescompus I(YD) n mod proporional cu influena independent a factorilor vor fi : (Y) = ( log IL(Y) ) / (log IL(Y)+ log IL(D)) = 0.267 (D) = ( log IL(D) ) / (log IL(Y)+ log IL(D)) =0.733 deci (Y)+(D) = 1 Recalculm variaiile relative astfel : * I L(Y) = IL(Y).[I(YD)](Y) = 1.152 I*L(D) = IL(D).[I(YD)](D) = 1.473 Verificare : IT(V) = I*L(Y). I*L(D) Metoda poate fi aplicat i indicatorilor compleci trifactoriali , tetrafactoriali , etc.
Exemplul 3 Fie trei societi comerciale : S1(Vegetal) ; S2(Zootehnie) ;S3(Procesare produse agrozootehnice). Baza este anul 2000 iar anul curent este 2003. NI este numrul de muncitori n ramura Si , Pi este productivitatea muncii n ramura Si (milioane lei venit/muncitor) iar Wi=Ni.Pi este venitul din fora de munc n ramura Si (milioane lei/an).

Societ. Comer. S1 S2 S3 T O

Nr. muncitori Ni Curent Ni1 8 12 16

Baz Ni0 10 15 20 T A L

Productiviti Pi Baz Curent Pi0 Pi1 10 15 6 7 10 12 26 34

Venituri Wi =NiPi Ni0Pi0 100 90 200 390 Ni0Pi1 150 105 240 495 Ni1Pi0 80 72 160 312 Ni1Pi1 120 84 192 396

A) Indici individuali : - pentru numr de muncitori : IN(S1) = N11/N10 = 8/10 = 0.80 IN(S2) = N21/N20 = 12/15 = 0.80 IN(S3) = N31/N30 = 16/20 = 0.80 IN = [IN(S1). IN(S2). IN(S3)]1 / 3 = 0.800

84

- pentru productiviti : IP(S1) = P11/P10 = 15/10 = 1.50 IP(S2) = P21/P20 = 7/6 = 1.17 IP(S3) = P31/P30 = 12/10 = 1.20 IP = [IP(S1). IP(S2). IP(S3)]1 / 3 = 1.281 - pentru venituri : IV(S1) = N11P11/N10P10 = 120/100 = 1.20 IV(S2) = N21P21/N20P20 = 84/90 = 0.93 IV(S3) = N31P31/N30P30 = 192/200 = 0.96 IW = [IW(S1). IW(S2). IW(S3)]1 / 3 = 1.024
B) Indici sintetici pentru venituri ca indici agregai : 1) Indicele total : IT (W)= (Ni1Pi1) / (Ni0Pi0) = 396/390 = 1.02 2) Indicele Laspeyres : - pentru numrul de muncitori : IL (N) = (Ni1Pi0) / (Ni0Pi0) = 312/390 = 0.80 - pentru productiviti : IL (P) = (Ni0Pi1) / (Ni0Pi0) = 495/390 = 1.27 3) Indicele Paasche : - pentru numrul de muncitori : IP (N) = (Ni1Pi1) / (Ni0Pi1) = 396/495 = 0.80 - pentru productiviti : IP (P)= (Ni1Pi1) / (Ni1Pi0) = 396/312 = 1.27 4) Indicele Fisher : - pentru numrul de muncitori : IF(N) = [ IL(N) . IP(N) ]1/2 = 0.80 - pentru productiviti : IF(P) = [ IL(P) . IP(P) ]1/2 = 1.27 C) Indici sintetici pentru venituri ca rapoarte de medii : 5) Indicele cu strucutur variabil : ISV = [ (Ni1Pi1) / (Pi1) ] : [ (Ni0Pi0) / (Pi0) ] = (396/34) : (390/26) =0.776 6) Indicele cu structur fix : ISF = [ (Ni1Pi1) / (Pi1) ] : [ (Ni0Pi1) / (Pi1) ] = (396/36) : (495/36) = 0.80 7) Indicele variaiei structurii : IVS = [ (Ni0Pi1) / (Pi1) ] : [ (Ni0Pi0) / (Pi0) ] = (495/34) : (390/26) = 0.97 Verificare : ISV = ISF . IVS

Veniturile din fora de munc W sunt un indicator complex bifactorial de forma W = N.P Variaia veniturilor n timp este absolut :(W)=Ni1Pi1 - Ni0Pi0 sau relativ : IT(V) = (Ni1Pi1) / Ni0Pi0 Aceste variaii absolute sau relative , se pot descompune n componente cu metoda restului/ctului nedescompus . Variaiile absolute sunt : (W)=Ni1Pi1 - Ni0Pi0 = 6 (N)=Ni1Pi0 - Ni0Pi0 = - 78 (P)=Ni0Pi1 - Ni0Pi0 = 105 (NP)=( Ni1Pi1 - Ni1Pi0 ) - ( Ni0Pi1 - Ni0Pi0 ) = - 21 Verificare : (W) = (N) + (P) + ( NP )

85

Coeficienii de importan pentru repartizarea restului nedescompus ( NP ) n mod proporional cu influena independent a factorilor ,vor fi: (N) = (N) / ((N) + ( P )) = - 2.889 (P) = (P) / ((N) + ( P )) = 3.889 deci (N) + ( P ) = 1 Recalculm variaiile absolute astfel : *(N) = (N) + (N).(NP) = - 17.331 *(P) = (P) + (P).(NP) = 23.331 Verificare : (W) = *(N) + *(P)
Variaiile relative sunt : IT (W) = (Ni1Pi1)/ (Ni0Pi0)= 1.015 IL (N) = (Ni1Pi0 )/ (Ni0Pi0 )= 0.8 IL (P) = (Ni0Pi1 )/ (Ni0Pi0 )= 1.269 I(NP) = (Ni1Pi1 / Ni1Pi0) : (Ni0Pi1 / Ni0Pi0) = IP (P) /IL( P) = 1 Verificare : IT(W) = IL(N) . IL(P) .I(NP)

Coeficienii de importan pentru repartizarea ctului nedescompus I(NP) n mod proporional cu influena independent a factorilor vor fi : (N) = ( log IL(N) ) / (log IL(N)+ log IL(P)) = - 16.167 (P) = ( log IL(P) ) / (log IL(N)+ log IL(P)) =17.167 deci (N)+(P) = 1 Recalculm variaiile relative astfel : I*L(N) = IL(N).[I(NP)](N) = 0.8 I*L(P) = IL(P).[I(NP)](P) = 1.269 Verificare : IT(W) = I*L(N). I*L(P) Metoda poate fi aplicat i indicatorilor compleci trifactoriali , tetrafactoriali , etc. Momentul de baz din exemplele precedente , notat cu 0 ,poate fi nlocuit cu un loc de baz sau cu o categorie de baz n raport cu un criteriu. Deasemenea momentul curent din exemplele precedente, notat cu 1 , poate fi nlocuit cu un loc curent sau cu o categorie curent n raport cu un criteriu. Indicii precedeni satisfac anumite condiii , numite teste ale indicilor , prezentate n lucrarea Mic enciclopedie de statistic, pag. 227-230. Vom descrie n ncheiere modul de calcul al indicelui preului de consum(IPC) pe baza indicelui sintetic Laspeyres. I.Nomenclatorul de produse i servicii conine trei grupe : a) Produse alimentare b) Produse nealimentare c) Servicii Fiecare grup conine mai multe subgrupe,fiecare subgrup conine mai multe produse i fiecare produs conine mai multe sortimente.n total nomenclatorul conine circa 2000 sortimente. Exemplu: n grupa produselor alimentare avem de exemplu subgrupa carne i produse din carne n care avem de exemplu produsul carne de porc n care avem de exemplu sortimentul pulp de porc cu os. II.Nomenclatorul de localiti conine 68 centre de culegere i nregistrare a preurilor/tarifelor n fiecare din cele 41 judee (Municipiul Bucureti are 6 centre pentru cele 6 sectoare i unul pentru sectorul agricol Ilfov;Timioara,Constana,Cluj,Braov au cte 3 centre,etc.) III.Nomenclatorul de magazine i piee alimentare i nealimentare, precum i uniti prestatoare de servicii pentru nregistrarea preurilor / tarifelorpe sortimentele de la punctul I.

86

IV.Periodicitatea nregistrrii preurilor /tarifelor este sptmnal pentru mrfuri alimentare, blunar pentru mrfuri nealimentare i servicii i lunar pentru cele supravegheate(pine, benzin,transport CFR , etc). Etape de calcul: 1)Se calculeaz preul/tariful mediu lunar PMjk pentru fiecare sortiment j din cele 2000 i pentru fiecare centru de culegere k din cele 68. 2)Se calculeaz preul/tariful mediu lunar PMj pentru fiecare sortiment j din cele 2000 i pentru toate cele 68 centre de culegere , att pentru momentul baz(0) ct i pentru momentul curent(1). 3)Se calculeaz indicele individual de pre Ij = PMj(1) / PMj(0) pentru fiecare sortiment j din cele 2000 . 4)Se calculeaz indicii la nivel de produs,subgrup,grup printr-un indice Laspeyres cu coeficienii de ponderare n perioada de baz :Uj(0) pe sortiment , Up(0) pe produs , Us(0) pe subgrup , Ug(0) pe grup : I j U (0) I j U (0) j j ; pe produs : I p = = (0) (0) Up Uj
pe subgrup : Is = pe grup : Ig = 5) Calculul IPC :

I U = I U U U I U IPC = U
s (0) s (0) s s (0) g g (0) g (0) g

I U U
p

(0) p

(0) p

U (0) p
(0) s

(0) Us

IPC se utilizeaz n aprecierea inflaiei,n politica monetar i fiscal(masa monetar,rata dobnzii), n stabilirea drepturilor bneti(salarr,pensii,alocaii,burse)pentru meninerea puterii de cumprare, a salariului real i a veniturilor reale ale populaiei .
7.4 Estimaii / teste n populaii normale

X.

Fie o populaie statistic de volum N, care este normal N(,) n raport cu nsuirea

Efectum un sondaj de n valori independente x1, .....,xn care au media de sondaj 2 xi i abaterea standard de sondaj S = 1 xi X . X = n n 1 X i S se schimb de la un sondaj la altul, fiind variabile aleatoare independente cu urmtoarele medii i variane: Pentru sondajul simplu repetat avem:

1) M X = ; V X =

2 ; n 2 ; 2) M(S 2 )= 2 ; V(S 2 )= 2n Rezult de aici M X = ; lim V X = 0 , deci X este o estimaie absolut corect

( )

( )

( )

( )

pentru .

De asemenea M(S2)=2; lim V ( S 2 ) = 0 deci S este o estimaie absolut corect


n

pentru .

87

Pentru sondajul simplu nerepetat avem: 3) M( X )=; V X = 4) M(S2)=

( )

2
n

2
N

2 N 2 ; V(S2)= ; N 1 2n 2 N Rezult de aici c M( X )=; lim V X = 0 , deci i n acest caz X este estimaie
n

( )

absolut corect pentru . De asemenea M(S2)=

estimaie corect pentru . Pentru populaii infinite (N), expresiile precedente n cazul sondajului simplu repetat de la punctele 1), 2) coincid cu cele din cazul sondajului nerepetat de la punctele 3), 4). Dac X este nsuire calitativ, X =f (frecvena valorii X n sondaj) se schimb de la un p(1 p) deci f este o estimaie absolut corect pentru p. sondaj la altul i M(f)=p; V(f)= n n cazul sondajului stratificat se efectueaz sondaje simple (repetate sau nerepetate) de volume n1,......,nk (n1+........+nk=n) din straturile numrul 1,.........,k de volume N1,......,Nk ; (N1+.......+Nk=N), gsindu-se mediile de sondaj din straturi X 1,......, X k. n x1 + + nk x k 5) Media sondajului stratificat va fi: X = 1 n 1 k N 2 2 6) n cazul sondajelor simple repetate din straturi avem: V X = 2 i i ; N =1 ni 7) n cazul diferitelor tipuri de sondaj stratificat nlocuim pe ni n relaiile 5)-7) astfel: n a) Pentru sondajul tipic: ni = , (i=1,.....,k) ; k N b) Pentru sondajul proporional: ni = n i , (i=1,......,k) ; N N i i , (i=1,.........,k) ; c) Pentru sondajul optim: ni = n k N i i

N 2; N 1

lim V ( S ) = 0 , deci S este


n

( )

i =1

n cazul sondajului stratificat optim avem V( X )=minim. N 8) Dac populaia este infinit, i pi , deci indiferent dac sondajele simple n N straturi sunt repetate sau nerepetate avem: k pi2 i2 V X = . ni =1 Trebuie rezolvate dou probleme: I. Estimarea lui i prin intervale de ncredere pe baza lui X i S; II. Testarea de valori concrete 0 i 0 pentru i pe baza lui X i S.

( )

O ipotez statistic este o presupunere asupra parametrilor unor variabile aleatoare ce caracterizeaz anumite populaii statistice. Fie variabila aleatoare X cu densitatea de probabilitate y=f(x,), unde este un parametru care poate lua valorile 0, 1, 2,.....

88

Ipoteza H: =0 se numete ipoteza nul iar ipoteza H :=i (i=1,2,......) se numete ipoteza alternativ. Ipotezele n care se specific valorile parametrului se numesc ipoteze simple iar cele n care nu se specific valorile lui , se numesc ipoteze compuse. De exemplu ipoteza nul H:=0este ipotez simpl n timp ce ipoteza alternativ H :0 este ipotez compus bilateral iar ipotezele H =0 i H :0 sunt ipoteze compuse unilaterale. O ipotez H asupra lui poate fi adevrat sau fals iar decizia noastr asupra lui H poate fi de asemenea c H este adevrat sau fals. Probabilitile combinaiilor acestor situaii sunt date n tabelul alturat: H este H este fals Decizia adevrat despre H Ipoteza H H este adevrat H este fals 1- 1-

se numete eroare de ordin I sau nivel de semnificaie al testului, se numete eroare de ordin II. n controlul statistic al calitii i fiabilitii (Cap. 8), se numete riscul furnizorului iar riscul beneficiarului. Se poate arta c dac scade, atunci crete i invers, iar dac volumul de sondaj n crete atunci i scad. Mai observm i faptul c pentru ipoteze compuse unilaterale este /2 pentru ipoteze compuse bilaterale deci n continuare vom considera numai ipoteze compuse bilaterale.
Fie vectorul sondajului x=(x1, ......... ,xn) i mulimea vectorilor de sondaj W R astfel c avem probabilitatea condiionat PH(x W)= dac ipoteza H este adevrat. W se numete zon critic iar complementara sa W zon de acceptare a ipotezei H. Fie ipoteza nul H:=0 fa de ipoteza alternativ H :=1. Probabilitatea de respingere a lui H ca funcie de , se numete funcia de putere a testului i se noteaz (W,)=P(x W). Evident avem: (W,0)= ; (W,1)=1- . Funcia de putere a testului (W,) permite determinarea probabilitii 1- ca testul s sesizeze o anumit diferen ntre 0 i 1 i reciproc ea permite calcularea diferenei maxime ntre 0 i 1 pe care o poate sesiza testul cu o anumit putere 1- la un anumit prag de semnificaie . Exemplu: pentru ipoteza nul H:=0 fa de ipoteza alternativ H :>0 funcia de putere a testului are graficul:
n

89

Pentru ipoteza nul H:=0 fa de ipoteza alternativ H :0 funcia de putere a testului are graficul:

Testul cu funcia de putere (W, )=maxim, se numete cel mai puternic test. Se demonstreaz:
Lema Neyman-Pearson Testul ipotezei nule H:=0 fa de ipoteza alternativ simpl H :=1 este cel mai puternic test dac zona critic W a testului satisface condiia:

7.5 7.5.1

f ( x, 0 ) f ( x, 0 ) k dac x W . k dac x W i f ( x, 1 ) f ( x,1) Estimaii / teste parametrice n populaii normale


Estimaii/teste pentru parametrii , ai unei nsuiri cantitative ntr-o populaie normal

Fie o populaie statistic normal N(, ) fa de nsuirea cantitativ X.

90

Fie un sondaj simplu repetat de n valori independente x1, ...... ,xn extras din populaie. Fie X media de sondaj i S abaterea standard de sondaj (vezi seciunea 2.2) Teorema 7.1 Mrimea

t=

Demonstraie x1, ...... ,xn fiind valori de sondaj independente extrase dintr-o populaie normal N(,) fa de nsuirea cantitativ X, se poate arta cu teoremele 2.2, 2.3, 3.7 c 1 1 X = x1 + + x n este o variabil normal cu media: n n 1 1 1 1 M ( X ) = M ( x1 ) + + M ( x n ) = + + = i variana: n n n n

X n S

este variabil Student cu n-1 grade de libertate.

1 1 1 2 1 2 2 + + = + + . ( ) ( ) V x V x = 1 n n n2 n2 n2 n2 X n fiind variabil N(0,1) i conform teoremei 6.2 de mai jos, Mai departe,

V (X ) =

(n 1)S

t=
2

fiind variabil 2 cu n-1 grade de libertate, variabila

(n 1)S 2
n= n 1

Q.E.D.

X n este variabil Student cu n-1 grade de libertate. S

Din teorema 3.1 rezult: P (t 2 t t 2 ) = 1 ,adic intervalul de ncredere pentru :


P X / 2 ; X + / 2 = 1 unde / 2 =

(1)

S n

t / 2 este diferena limit.

Reciproc, dndu-se / 2 , avem mrimea probei :


S n= .t / 2 / 2
2

Din tabela 2 din Anex , conform relaiei P ( t t / 2 ) = , pe linia a n-1 grade de libertate i coloanele = 0.05; 0.01 i 0.001 gsim valorile critice 2.5% ajutorul crora gsim trei intervale de ncredere pentru de forma: cu ncrederea 95% ;
1) [ X 2.5% ; X + 2.5% ] 2) [ X 0.5% ; X + 0.5% ] cu ncrederea de 99% ;

; t0.5% ; t0.05% cu

91

3) [ X 0.05% ; X + 0.05% ] cu ncrederea de 99.9% .

contrar astfel: a) 0 semnificativ dac totui: 0 X 0.5% ; X 2.5% U X + 2.5% ; X + 0.5% ; b) 0 distinct semnificativ dac totui:
X 0.05% ; X 0.5% U X + 0.5% ; X + 0.05% 0

Ipoteza H:=0 se accept dac 0 X 2.5% ; X + 2.5% i se respinge n caz

c) 0 foarte semnificativ dac: 0 < X 0.05% sau 0 > X + 0.05% .


Teorema 7.2

Mrimea

( n 1)S 2 = 2
2

Demonstraie:
2

este variabil hi ptrat cu n-1 grade de libertate.


2 2

xn X x1 X xi X u = = + + Avem = i cum sunt i 2 variabile N(0,1), independente cte dou, 2 este variabil hi ptrat cu n-1 grade de libertate x X x X (cci avem relaia de dependen 1 + + n = 0 ) Q.E.D.

( n 1) S 2

Din teorema 7.2 rezult: 2 ( n 1) S 2 2 P = 1 adic intervalul de ncredere 1 2 2 2 pentru : n 1 n 1 (2) P 2 S ; 2 S = 1 . 1 2 2 Reciproc, dndu-se :

n 1

/2
2

' .S = /2 i

n 1

2 1 /2

'' .S = /2

rezult :
' '' 2 2 /2 /2 n1 = . /2 + 1 i n2 = .1 /2 + 1 S S 2 2

deci mrimea probei este n = max { n1 ; n2 }

92
2 ) = , pe linia a n-1 grade de libertate i Din tabela 3 din Anex ,conform relaiei P ( 2 >

pe coloanele =0.05; =0.01; =0.001 gsim valorile 2 iar pe coloanele 1-=0.95; 11 2

=0.99; 1-=0.999 gsim valorile cu ajutorul crora gsim trei intervale de ncredere
2

pentru de forma: n 1 n 1 1) .S ; .S 2 2 0.975% 0.025% cu ncrederea de 95% ; n 1 n 1 2) .S ; .S 2 2 0.995 0.005 cu ncrederea de 99% ;
n 1 n 1 3) . S ; .S 2 2 0.9995 0.0005 cu ncrederea de 99.9%.

n 1 n 1 Ipoteza H:=0 se accept dac: 0 S; S i se respinge n caz contrar dup 2 2 0.025 0.975 cum urmeaz: a) 0 semnificativ dac totui: n 1 n 1 n 1 S U S; S ; 2 2 2 0.025 0.975 0.995 b) 0 distinct semnificativ dac totui:

n 1
2 0.005

S;

n 1 n 1 n 1 U S S ; S ; 2 2 2 2 0.005 0.9995 0.995 0.0005 c) 0 foarte semnificativ dac:

n 1

S;

0 <

n 1

2 0.0005

S sau 0 >

n 1
2 0.9995

S.

Exemplu: Fie X greutatea vieilor (kg). Dintr-un sondaj de n=50 viei gsim X =64.9kg; S=2.33kg. a) Se cer intervale de ncredere cu riscurile =5%; 1%; 0.1% pentru i testerea ipotezelor H:=65kg; H:=67kg. b) Se cer intervale de ncredere cu riscurile =5%; 1%; 0.1% pentru i testarea ipotezelor H:=2.5kg; H:=3.3kg. Soluie a) Pe linia a n-1=49GL i coloanele =0.05; =0.01; =0.001 gsim n tabela 2 din Anex, valorile critice t2.5%=2.01; t0.5%=2.68; t0.05%=3.50 deci nlocuind n formula (1) gsim intervalele de ncredere pentru : 1) [64.2 Kg ;65.6 Kg ]

2) [64 Kg ;65.8Kg ]

93

3) [63.8Kg ;66 Kg ] cu ncrederile de 95 % ; 99 % ; 99.9%. De exemplu pentru intervalul mic cu 1-=95% avem concluzia: Greutatea medie necunoscut a tuturor vieilor din care fac parte cei 50 din sondaj, este cuprins ntre 64.2kg i 65.8kg cu o ncredere de 95%. Exist semiriscul 2.5% ca aceast medie s fie mai mic ca 64.2kg atunci cnd cei 50 viei ai sondajului au fost alei cei mai performani ca greutate. Concluzia este simetric pentru >65.8kg. Ipoteza H:=65kg se accept deoarece 65 [64.2;65.6] iar ipoteza H:=67kg se respinge (67kg foarte semnificativ cci 67>66). b) Pe linia a n-1=49GL i coloanele 1

= 0.999; 0.995; 0.975 gsim n tabela 2 din

Anex : 20.999=24.70; 20.995=27.99; 20.975=32.36 iar pe coloanele 0.001 gsim: 20.025=71.42; 20.005=79.49; 20.001=86.70 deci nlocuind n formula (2), gsim intervalele de ncredere pentru : 1) [2 Kg ; 2.9 Kg ] cu o ncredere de 95 %; 2) [1.9 Kg ;3.2 Kg ] cu o ncredere de 99%; 3) [1.8 Kg ;3.4 Kg ] cu o ncredere de 99.9%.

= 0.025; 0.005;

De exemplu pentru intervalul mic cu 1-=95% avem concluzia: Abaterea standard necunoscut a greutii tuturor vieilor din care fac parte cei 50 viei ai sondajului, este cuprins ntre 2kg i 2.9kg cu ncrederea de 95%. Exist semiriscul 2.5% ca aceast abatere standard s fie mai mic ca 2 Kg atunci cnd cei 50 viei ai sondajului au fost alei cei mai neomogeni ca greutate. Concluzia este simetric pentru cazul >2.9kg. Ipoteza H:=2.5kg se accept deoarece 2.5 [2;2.9] iar ipoteza H:=3.3kg se respinge( 3.3kg distinct semnificativ deoarece 3.3 [3.2;3.4] ). O sintez elegant a acestor calcule este dat n foaia de calcul C1P1.XLS aflat n Anex.
7.5.2 Estimaii/teste pentru parametrul p al unei nsuiri calitative ntr-o populaie normal

Fie o populaie statistic normal n care nsuirea calitativ X are probabilitatea de apariie p. Efectum un sondaj simplu repetat de n valori independente x1, ........ ,xn unde: xi = 1 dac exemplarul i are nsuirea X xi = 0 n rest Dac k din cele n exemplare de sondaj au valoare 1, media de sondaj X devine k (0 k n). frecvena de sondaj f = n

94

Teorema 7.3

Pentru n, mrimea u =
Demonstraie:

p (1 p ) n

f p

este variabil normal redus N(0.1).

1 k 1 k este valoare a unei variabile binomiale iar M ( f ) = M = M (k ) = np = p i n n n 1 p(1 p ) k 1 V ( f ) = V = 2 V (k ) = 2 np(1 p ) = deci conform teoremei limit central n n n n f M(f ) f p este variabil normal 6.14 din seciunea 6.3, variabila normat u = = (f ) p(1 p ) redus N(0.1) cnd n.Q.E.D. Din teorema 7.3 rezult: P u u u = 1 adic intervalul de ncredere pentru p: 2 2 (3)
n

P( p f 2 ; f +
2

]) = 1

unde

f (1 f ) u n

este diferena limit.

Reciproc , dndu-se / 2 , avem mrimea probei :

u n = f (1 f ). / 2 / 2 Din tabela 1 din Anex , conform relaiei: P ( u < u

) = 1

avem u2.5%=1.96; u0.5%=2.58; u0.05%=3.29 deci trei intervale de ncredere pentru p de forma: 1) p [ f 2.5% ; f + 2.5% ] cu ncrederea de 95%; 2) p [ f 0.5% ; f + 0.5% ] cu ncrederea de 99%; 3) p [ f 0.05% ; f + 0.05% ] cu ncrederea de 99.9%. Ipoteza H:p=p0 se accept dac p0 [ f 2.5% ; f + 2.5% ] i se respinge n caz contrar astfel: a) pp0 semnificativ dac totui: p0 [ f 0.5% ; f 2.5% ] U [ f + 2.5% ; f + 0.5% ] ;

c) pp0 foarte semnificativ dac: p0 < f 0.05% sau Exemplu:

b) pp0 distinct semnificativ dac totui: p0 [ f 0.05% ; f 0.5% ] U [ f + 0.5% ; f + 0.05% ] ;

p0 > f + 0.05%

95

Fie X= ecloziunea oulelor de gin la incubator. Se face un sondaj simplu repetat de n=1600 ou, gsindu-se frecvena oulelor eclozionate f=95%. Se cer intervalele de ncredere pentru probabilitatea p de ecloziune pentru toate oulele din care fac parte cele 1600 din sondaj i s se testeze ipotezele H:p=96% i H:p=90%. Soluie: Avem u2.5%=1.96; u0.5%=2.58; u0.05%=3.29 deci formula (3) d intervalele de ncredere pentru p: 1) p [93.5%;96.5%] cu o ncredere de 95%; 2) p [93.1%;96.8%] cu o ncredere de 99%; 3) p [92.7%;97.2%] cu o ncerede de 99.9% . De exemplu pentru intervalul mic cu 1-=95% avem concluzia: Probabilitatea necunoscut p a ecloziunii pentru toate oule din care fac parte cele 1600, este cuprins ntre 93.5% i 96.5% cu o ncredere de 95%. Exist semiriscul 2.5% ca aceast probabilitate s fie mai mic de 93.5% atunci cnd sondajul celor 1600 ou a fost ales cel mai performant n ceea ce privete ecloziunea. Pentru p>96.5% concluzia este simetric. Ipoteza H:p=96% se accept deoarece 96% [93.5%;96.5%] iar ipoteza H:p=90% se respinge (90% foarte semnificativ deoarece 90%<92.7%)
7.5.3 Estimaii / teste pentru parametrii 2 1 , 2 / 1 ai unei nsuiri cantitative n populaii normale

Fie dou populaii statistice normale N(1, 1) i respectiv N(2, 2) fa de caracterul cantitativ X. Extragem un sondaj simplu repetat de n1 exemplare din prima populaie cu n1 valori de 1 n1 sondaj independente X11, X12, ..... , X 1n1 i calculm media de sondaj X 1 = X 1i respectiv n1 i =1
2 1 n1 x1i X 1 . n1 1 i =1 Extragem un sondaj simplu repetat de n2 exemplare din a II-a populaie,cu n2 valori de sondaj independente X21,X22,..... , X 2 n2 i calculm media de sondaj:

abaterea standard de sondaj:

S1 =

1 n2 X 2i n2 i =1 si respectiv abaterea-standard de sondaj :

X2 =

S2 =

1 n2 x2i X 2 n2 1 i =1

Fie S =

(n1 1)S12 + (n2 1)S 22


n1 + n2 2

96
2 2 2 2 2 S12 S 2 1 S1 1 S2 i n* = n + n 1 n +n : n 1 n deci 2 1 1 2 2 1 min (n1 1; n 2 1) n* n1 + n2 2 . Teorema 7.4 X 2 X 1 ( 2 1 ) Dac 1=2 mrimea t = este variabil Student cu n1+n2-2 1 1 + S n1 n2 grade de libertate. Dac 1 2 mrimea :

2 S12 S2 + n1 n2 este aproximativ variabil Student cu n* grade de libertate . Demonstraie: X 2 X 1 este variabil normal cu media :

t=

( X 2 X 1 ) ( 2 1 )

M X 2 X 1 = M X 2 M X 1 = 2 1
i variana
2 1 2 1

( ) ( ) V ( X X ) = V ( X ) +V ( X ) = n
( )

2 1 1

2 2

n2

deoarece cele dou sondaje se presupun independente deci i X 1 , X 2 sunt variabile aleatoare independente. X 2 X 1 ( 2 1 ) este variabil N(0;1). nlocuind pe 1=2 cu Rezult c u =

12
n1

+
2

2 2

S, conform teoremei 6.1,

este o variabil Student cu n1+n2-2 1 1 + S n1 n2 grade de libertate. Cea de-a doua afirmaie din enun o admitem fr demonstraie Q.E.D. Din teorema 7.4 rezult: P ( t 2 t t 2 ) = 1 adic intervalul de ncredere

t=

(X

n2

X 1 ( 2 1 )

pentru 2-1:

P 2 1 X 2 X 1 2 ; X 2 X 1 + 2 = 1 1 1 unde 2 = S + t 2 este diferena limit. n1 n 2 Din tabela 2 din Anex, conform relaiei P ( t > t
2

)=

gsim t/2 cu n1+n2 -2 GL

pentru =5%; 1%; 0.1% deci trei intervale de ncredere pentru 2-1 cu ncrederile 1-=95%; 99%; 99.9%:

97

1) 2 1 [( X 2 X 1 ) 2.5% ;( X 2 X 1 ) + 2.5% )]

cu ncrederea de 95%;
2) 2 1 [( X 2 X 1 ) 0.5% ;( X 2 X 1 ) + 0.5% ] cu ncrederea de 99%; 3) 2 1 [( X 2 X 1 ) 0.05% ;( X 2 X 1 ) + 0.05% ] cu ncrederea de 99.9% . Ipoteza H:1=2 se accept dac i numai dac : 0 X 2 X 1 2.5% ; X 2 X 1 + 2.5% i se respinge n caz contrar. n cazul sondajelor dependente de volum n1=n2=n vom forma diferenele d1=x21-x11,

..... ,dn=x2n x 1n i vom calcula d =

2 1 n 1 n d i S = di d . i d n i =1 n 1 i =1 Intervalul de ncredere cu riscul pentru 2 1 va avea forma: P 2 1 d 2 ; d + 2 = 1 S unde 2 = d t 2 este diferena limit. n Din tabela 2 din Anexa conform relaiei P ( t > t 2 ) = gsim t/2 pentru n-1 GL

pentru =5%; 1%; 0.1% deci trei intervale de ncredere pentru 2-1 ca mai sus. Ipoteza H:1=2 se verific ca mai sus. Teorema7.5 2 S 22 Mrimea F = 2 : este variabil Fisher cu (n1-1;n2-1) grade de libertate. 12 S12 Demonstraie: (n 1)S 2 Conform teoremei 7.2 12 = 1 2 1 este variabil hi ptrat cu n1-1 GL iar

22 =

(n2 1)S
2 2

2 2

este variabil hi ptrat cu n2-1 GL deci F =

variabil Fisher cu (n1-1; n2-1) GL.Q.E.D. Din teorema 7.5 rezult P(0 F F ) = 1 adic intervalul de ncredere pentru

n1 1 n2 1

12

2 2

2 2 2 S2 : este 12 S12

2 : 1
(5) 2 S2 F P 0 ; = 1 . S 1 1 Din tabelele 4, 5, 6 din Anex , conform relaiei P(F > F ) = gsim F pentru

(n1-1; n2-1) GL pentru =5%; 1%; 0.1% deci trei intervale de ncredere pentru ncrederile 1-=95%; 99%; 99.9%:

2 cu 1

98

1)

2 S [0; 2 . F5% ] 1 S1

cu ncrederea de 95%;
2)

cu ncrederea de 99%;
3)

2 S [0; 2 . F1% ] 1 S1

cu ncrederea de 99.9% .
S Ipoteza H:1=2 se accept dac 1 0; 2 F5% i se respinge n caz contrar astfel: S1 S 1. 2 >1 semnificativ dac totui 1 < 2 F1% ; S1 S 2. 2 >1 distinct semnificativ dac totui 1 < 2 F0.1% ; S1 S 3. 2 >1 foarte semnificativ dac 1 > 2 F0.1% . S1

2 S [0; 2 . F0.1% ] 1 S1

Not. Numerotm populaiile 1 i 2 astfel ca S2 S1. Exemplu: X= greutatea vieilor (kg). Populaia 1: Brun. Populaia 2: Blat cu negru. Se cntresc n1=20 viei din populaia 1, gsind X 1 = 60.1kg i S1=2.5kg. Se cntresc n2=30 viei, gsind

X 2 = 62.2kg i S2=2.8kg. a) S se gseasc intervale de ncredere pentru 2-1 cu riscuri =5%; 1%; 0.1% i s se testeze ipoteza H:1=2. b) S se gseasc intervae de ncredere pentru 2/1 cu riscuri =5%; 1%, 0.1% i s se testeze ipoteza H:1=2. Soluie a) n ipoteza 1=2 care va fi verificat la punctul b), calculm: adic S=2.42kg. n1 + n2 2 Din tabela 2 din Anex, pe linia a 20+30-2=48GL i coloanele lui =0.05; 0.01; 0.001 1 1 gsim: t2.5%=2.01; t0.5%=2.68; t0.05%=3.50 . Mrimea 2 = S + t 2 devine: n1 n2 2.5%=0.72.01=1.41; 0.5%=0.7 2.68=1.88; 0.05%=0.7 3.50=2.45 . Din formula (2) avem intervalele de ncredere pentru 2-1 cu ncrederile 1-=95%; 99%; 99.9%: S=

(n1 1)S12 + (n2 1)S 22

99

1) 2 1 [1.69 Kg ;3.51Kg ] cu o ncredere de 95%; 2) 2 1 [0.22 Kg ;3.98Kg ] cu o ncredere de 99%; 3) 2 1 [0.35 Kg ; 4.55Kg ] cu o ncredere de 99.9% . De exemplu pentru intervalul mic cu 1-=95% avem concluzia: Diferena greutii medii a vieilor 2-1 necunoscut, pentru toi vieii Blat cu negru din care fac parte cei 20 fa de toi vieii Brun din care fac parte cei 30, este cuprins ntre 1.69kg n favoarea vieilor Blat cu negru i 3.51kg n favoarea vieilor blat cu negru , cu o ncredere de 95%. Exist semiriscul 2.5% ca aceast diferen 2-1 s fie mai mic de 1.69kg n favoarea rasei blat cu negru , atunci cnd primul sondaj a fost ales cel mai neperformant iar n al doilea sondaj cel mai performant.O concluzie simetric pentru 2-1>3.51kg. Ipoteza H:1=2 se respinge cci 0 = 2 1 [1.69;3.51] . b) Pentru (20-1; 30-1) GL din tabelele 4, 5, 6 ale Anexei , gsim F5%=2.00; F1%=2.68; S2 F0.1%=3.73 aa c F va avea valorile: 1.58; 1.83; 2.16 deci avem intervalele S1 cu ncrederile 1-=95%; 99%; 99.9%:

1)

cu ncrederea de 95%;
2)

2 [0;1.58] 1

cu ncrederea de 99%;
3)

2 [0;1.83] 1

cu ncrederea de 99.9% . De exemplu pentru intervalul mic cu 1-=95% avem concluzia: Raportul abaterilor standard

2 [0; 2.16] 1

30 de viei fa de toi vieii brun din care provin cei 20 viei este cuprins ntre 0 i 1.88 ori n favoarea rasei blat cu negru. Exist semiriscul 2.5% ca acest raport s fie mai mare de 1.58 ori n favoarea blatei cu negru, atunci cnd sondajul 1 a fost ales cel mai omogen iar al II-lea cel mai omogen. Ipoteza H:1=2 se accept deoarece 1 [0;1.58] . Aceast ipotez a stat la baza calculelor de la punctul a). O sintez elegant a acestor calcule este dat n foaia de calcul C1P2.XLS aflat n Anex.

2 al tuturor vieilor blat cu negru din care provin cei 1

100

7.5.4

Estimaii/teste pentru parametrul p2 p1 al unei nsuiri calitative n dou populaii normale

k1 1 p1 (1 p1 ) 1 De asemenea V ( f 1 ) = V aa c = n 2 V (k1 ) = n 2 n1 p1 (1 p1 ) = n n1 1 1 1 p (1 p1 ) p 2 (1 p 2 ) + V ( f 2 f1 ) = V ( f 2 ) + V ( f1 ) = 1 . n1 n2 Conform teoremei-limit central 6.14 din seciunea 6.3, variabila normat: ( f f1 ) M ( f 2 f1 ) ( f 2 f1 ) ( p 2 p1 ) u= 2 = ( f 2 f1 ) p1 (1 p1 ) p 2 (1 p 2 ) + n1 n2 este variabil normal redus N(0,1). Q. E.D. Din teorema 7.6 rezult: P( u 2 u u 2 ) = 1 deci un interval de ncredere

i analog M ( f 2 ) = p 2 aa c M ( f 2 f1 ) = M ( f 2 ) M ( f 1 ) = p 2 p1 .

Fie dou populaii statistice normale n care nsuirea calitativ X apare cu probabilitile p1 i p2. Efectum dou sondaje simple repetate de volume n1 i n2. Fie k1 exemplare din primul sondaj n care nsuirea X are valoarea 1 i k2 exemplare din al doilea sondaj n care k k nsuirea X are valoarea 1 deci avem frecvenele de sondaj f1 = 1 respectiv f 2 = 2 . n1 n2 n f + n2 f 2 Frecvena sondajelor reunite este f = 1 1 . n1 + n 2 Teorema 7.6 ( f 2 f1 ) ( p 2 p1 ) Pentru n1, n2 , u = este variabil normal redus p1 (1 p1 ) p 2 (1 p 2 ) + n1 n2 N(0,1). Demonstraie: k1 i k2 sunt valori ale unor variabile binomiale iar k1 1 1 M ( f1 ) = M = n M (k1 ) = n n1 p1 = p1 n 1 1 1

pentru p2 p1:

(6) P p2 p1 ( f 2 f1 ) 2 ; ( f 2 f1 ) + unde
2

= 1

1 1 f (1 f ) + u 2 este diferena limit. n1 n2 Din tabela 1 din Anex , conform relaiei: P ( u < u 2 ) = 1 gsim u2.5%=1.96; =

u0.5%=2.58; u0.05%=3.29, deci trei intervale de ncredere pentru p2-p1 cu ncrederile 1-=95%; 99%; 99.9%: 1) p2 p1 [( f 2 f1 ) 2.5% ;( f 2 f1 ) + 2.5% ] cu ncrederea de 95% ;

101

2) p2 p1 [( f 2 f1 ) 0.5% ;( f 2 f1 ) + 0.5% ] cu ncrederea de 99%; 3) p2 p1 [( f 2 f1 ) 0.05% ;( f 2 f1 ) + 0.05% ] cu ncrederea de 99.9% . Ipoteza H:p1=p2 se accept dac : 0 ( f 2 f1 ) 2.5% ; ( f 2 f1 ) + 2.5% . n caz contrar ipoteza H se respinge dup cum urmeaz: a) p1 p2 semnificativ dac totui: 0 ( f 2 f1 ) 0.5% ; ( f 2 f1 ) 2.5% U ( f 2 f1 ) + 2.5% ; ( f 2 f1 ) + 0.5% b) p1 p2 distinct semnificativ dac totui: 0 ( f 2 f1 ) + 0.5% ; ( f 2 f1 ) + 0.05% ( f 2 f1 ) 0.05% ; ( f 2 f1 ) 0.5% U c) p1 p2 foarte semnificativ dac: 0 < ( f 2 f1 ) 0.05% sau
0 > ( f 2 f1 ) + 0.05% .

Exemplu Fie X= ecloziunea oulelor de gin la incubator. Se fac msurtori pe dou rase de gini, gsindu-se la primul sondaj de n1=3000 ou din prima ras, frecvena oulelor eclozionate f1=85% i la al doilea sondaj de n1=2000 ou din a doua ras, frecvena oulelor eclozionate f2=90%. S se gseasc intervale de ncredere pentru diferena p1-p2 a probabilitilor de ecloziune pentru toate oulele din care fac parte cele 3000 ou din primul sondaj fa de toate oulele din care fac parte cele 2000 ou din al doilea sondaj i s se testeze ipoteza H:p1=p2 . Soluie n f + n2 f 2 Avem f = 1 1 = 87% aa c : n1 + n 2
1 1 = 0.87(1 0.87 ) + u 2 = 0.0097u 2 . si cum u2.5%=1.96 ; 3000 2000 u0.5%=2.58; u0.05%=3.29 rezult 2.5%=1.9%; 0.5%=2.5%; 0.05%=3.2%. Avem intervale de ncredere pentru p2-p1 cu ncrederile 1-=95%, 99%; 99.9% : 1) p2 p1 [3.1%;6.9%] cu ncrederea de 95%; 2) p2 p1 [2.5%;7.5%] cu ncrederea de 99%; 3) p2 p1 [1.8%;8.2%] cu ncrederea de 99.9% . De exemplu pentru intervalul mic cu 1-=95% avem concluzia: Diferena necunoscut p2-p1 a probabilitilor eclozionrii pentru toate oulele din care fac parte cele 2000 din rasa de gini nr. 2 fa de toate oulele din care fac parte cele 3000 ale rasei de gini nr. 1 este cuprins ntre 3.1% i 6.9% n favoarea rasei nr.2, cu o ncredere de 95%. Exist semiriscul ca aceast diferen s fie mai mic de 3.1% n favoarea rasei nr. 2, atunci cnd sondajul din rasa de gini nr. 1 a fost cel mai neperformant iar sondajul din rasa de gini nr. 2 a fost cel mai performant sub aspectul ecloziunii oulelor. Ipoteza H:p1=p2 se respinge deoarece 0 = p 2 p1 [3.1%;6.9%] i anume p1 p2 foarte semnificativ deoarece 0<1.8%.

102

7.6 Teste neparametrice n populaii normale 7.6.1 Ttestul hi patrat de concordan

Fie o populaie normal n raport cu nsuirea (caracterul) X a exemplarelor sale i fie un sondaj de volum mare (n > 30) cu datele de sondaj independente i grupate n clasele de valori C1, , Ck cu centrele de clase x1, , xk i frecvenele valorilor n clase n1, , nk (n1 + + nk = n). Dac exist ni < 5, clasele cu aceste frecvene se grupeaz cu clasele vecine pentru a avea ni > 5. Forma poligonului frecvenelor observate n sistemul de axe (xi, ni) arat c X este o variabil aleatoare clasic (cap. 6) cu frecvenele ateptate n 'i = np i
(0)

unde

p i(0) = P(X C i ) ; (i = 1, , k).

Dorim s verificm ipoteza H : p1 = p1 ,..., p k = p k a concordanei probabilitilor pi cu valorile ipotetice p i Teorema 7.7 Pentru n , mrimea:
(0)

(0)

(0)

; (i = 1, , k).

= n n 'i pi(0) i =1 este variabil hi patrat cu k 1 grade de libertate. Demonstraie Valorile n1, , nk sunt pentru n , valori ale unor variabile aleatoare Poisson
2

=
i =1

( ni n 'i )

(f

pi(0) )

(seciunea 6.4.3) independente, cu mediile i varianele egale cu n1 = np1 ,..., n k variabilele normate u1 =
(0) n1 np1 ( 0) np1

'

(0)

(0)

deci

,..., u k =

0) n k np ( k 0) np ( k

sunt variabile independente ntre

ele cu media 0 i variana 1. Conform teoremei limit central 6.14, pentru n , variabilele aleatoare independente ntre ele, u1, , uk tind ctre variabila normal redus N(0, 1) deci la limit, mrimea: este variabil hi patrat cu k 1 grade de = n ni' pi(0) i =1 libertate (se pierde un grad de libertate datorit relaiei de dependen n1 + + nk = n. Uneori numrul de grade de libertate este mai mic dect k 1: dac X este variabil binomial sau Poisson avem k 2 grade de libertate, datorit relaiei de dependen n1 + + nk = n, n1x1 + +nkxk = n . x iar la variabila X = N(0,1) avem k 3 grade de libertate, datorit relaiilor de dependen n1 + + nk = n, n1x1 + + nkxk = n . x , n1(x1 - x )2 + + Q.E.D. nk(xk - x )2 = (n 1) . S2 . Din teorema 7.1 rezult testul hi patrat de concordan ntr-o populaie normal: Comparm mrimea: 2 (0) k k ( f p ( ni n 'i ) i i ) 2 = = n n 'i pi(0) i =1 i 1
2

= u =
i =1
2 i

(n

ni' )

(f

pi(0) )

i =1

103
2 2 2 0.05 ; 0.01 ; 0.001 extrase n tabela 6 pe linia a k 1 grade

cu variabile critice libertate. Dac

de

n caz contrar H se respinge dup cum urmeaz:


2 2 2 a) Dac 0.05 ; 0.01

2 (0) 2 < 0.05 , H se accept deci pi concord cu valorile ipotetice p i .

2 2 b) Dac 2 0.01 ; 0.001 ) atunci pi p i 2 c) Dac 2 0.001 atunci pi p i

atunci pi p i
(0)

(0)

semnificativ; distinct semnificativ.

(0)

foarte semnificativ

Exemplu ncrucind dup schema alturat un soi de porumb de floricele P1 cu boabe albe i netede cu un soi P2 cu boabe albastre i zbrcite, s-au obinut n generaia F2 665 boabe albastre i netede 210 boabe albastre i zbrcite, 240 boabe albe i netede i 85 boabe albe i zbrcite. S se testeze raportul de segregare 9 : 3 : 3:1 al combinaiilor de caractere precedente.

P1 F1 B1 F2

P2

B2

Soluie Numrul total de boabe este n = 665 + 210 + 240 + 85 = 1200. Frecvenele ateptate sunt ni = n . pi

n1 = 1200 .

9 16 3 n2 = 1200 . 16 9 n3 = 1200 . 16 1 n4 = 1200 . 16

boabe albastre i netede boabe albastre i zbrcite boabe albe i netede boabe albe i zbrcite

Avem ipoteza H : p1 =

=
2

( ni n 'i )
n 'i

9 3 1 , p 2 = p3 = , p 4 = 16 16 16

devine pentru k = 4:
+

i =1

=
2

( 665 675)
675

( 210 225 )
225

( 240 225)
225

( 85 75)
75

= 3.48

Din tabela 3 pe linia k 1 = 3 GL i coloanele = 0.05; 0.01; 0.001 gsim:

raportul de segregare 9 : 3 : 3 : 1.

2 2 2 0.05 = 7.81; 0.01 = 11.34; 0.001 = 16.30 2 2 Cum = 3.84 < 0.05 = 7.81 rezult c ipoteza H se accept deci se confirm

104

n cazul nsuirii X calitative, avem dou clase : C n care nsuirea X este prezent cu frecvena n1 = nf i C n care X este absent cu frecvena n2 = n(1-f). Avem frecvenele ateptate n1 = np i n2 = n(1-p) aa c: 2 2 2 ( n1 n '1 ) ( n2 n '2 ) n ( f p ) 2 = cu k = 2 1 = 1 GL. De aici rezult testul + = n '1 n '2 p (1 p )
hi patrat al ipotezei H : p = p0 fa de alternativa H : p p0: 2 n ( f p0 ) 2 cu valorile critice: Se compar: = p0 (1 p0 )

Anex i se ia decizia ca mai sus.

2 2 2 0.05 = 3.84; 0.01 = 6.63; 0.001 = 10.80 pentru 1 GL extrase din tabela 3 din

Exemplu Fie X = leucoza vacilor. ntr-o ferm cu n = 100 vaci s-a gsit f = 2%. S se testeze ipoteza H : p = 1% fa de H : p 1% Soluie. Pentru n = 100; f = 0.02; p0 = 0.01 gsim: 2 ( 0.02 0.01) 2 2 = 100. = 1.01 < 0.05 = 3.84 deci se accept ipoteza H : p = 1% a incidenei 0.01(1 0.01) leucozei pentru toate vacile din care provin cele n = 100 vaci. 7.6.2 Testul hi patrat de independen

Fie o populaie normal n raport cu dou nsuiri X, Y. Fie un sondaj de n > 30 exemplare estrase din populaie pe care msurm caracterele X, Y obinnd n > 30 perechi de valori (x, y) pe care le grupm n h clase dup X i k clase dup Y. aceast grupare o poate face programul C2GRUP. Clasele dup X, notate C1, , Ch au centrele de clase x1, xh iar clasele dup Y, notate D1, , Dk au centrele de clase y1, , yk. Dac nij este frecvena observat a perechilor (x, y) cu x Ci, y Dj, alctuim tabela de contingen h x k: X C1 Y D1 n11 Dk Sume linii s1

Ch Sume coloane

n1k nhk nh1 t1 ...tk

sh n

Dac nsuirile X, Y sunt independente, avem P(xCi i yDj) = P(xCi) . (yDj) nqi rj adic pij = qi .rj de unde npij = . n

105

Dar n.pij = nij i n.qi = si; n.rj = tj deci frecvenele ateptate nij ale perechilor (x, y) cu si t j ' x Ci i y Dj vor fi date de relaia nij ; (i = 1, , h; j = 1, , k) i se vor trece n = n tabela de contingen h x k n dreapta lui nij n paranteze. Verificm ipoteza H : X, Y = independente fa de alternativa H : X, Y = dependente. Ca i teorema 7.7 se demonstreaz:
Teorema 7.8
' 2 (nij nij ) ' nij

=
2 i =1

j =1

este variabil hi patrat cu (h 1) (k 1) GL.

De aici rezult testul hi patrat de independen al nsuirilor X, Y ntr-o populaie normal: 2 2 2 ; 0.01 ; 0.001 extrase din tabela 3 a Comparm pe 2 din enunul teoremei 7.8 cu 0.05 . Anexei,pe linia a (h 1) (k 1) GL i deci avem: 2 se accept ipoteza H : X, Y = independente. n caz contrar respingem Dac 2 < 0.05 ipoteza H dup cum urmeaz: 2 2 a) Dac 2 0.05 ; 0.01 ) , X, Y sunt dependente semnificativ;
2 2 b) Dac 2 0.01 ; 0.001 ) , X, Y sunt dependente distinct semnificativ;

2 c) Dac 2 > 0.001 , X, Y sunt dependente foarte semnificativ. Dac X este nsuire cantitativ i Y este nsuire calitativ avem tabele de contingen hx2 iar dac X, Y sunt nsuiri calitative avem tabele de contingen 2x2. Exemplul 1 Fie X = nlimea la greabn a vieilor (cm) i Y = greutatea vieilor (kg). Se face un sondaj de n = 50 viei i perechile de date obinute se clasific dup X, Y n h = k = 3 clase de valori obinnd tabela de contingen 3x3:

Clase Y Clase X

Viei slabi

Viei mijlocii

Viei grai

Suma linie

Viei scunzi

Viei potrivii Viei nali Suma coloan

20(12.5) 10(5) 0(2.5) 25

5(7.5) 10(6) 0(1.5) 15

0(5) 5(4) 5(1) 10

25 20 5 n = 50

S se testeze ipoteza H : X, Y = independente fa de alternativa H : X, Y = dependente Soluie si t j ' Frecvenele ateptate nij din paranteze au fost calculate cu relaia nij = n 25 25 ' De exemplu n11 = = 12.5 50 2 2 2 2 2 ( 20 12.5) ( 5 7.5) ( 0 5) ( 5 10 ) (10 6 ) 2 Avem = + + + + + 12.5 7.5 5 10 6

106

+ + + = 35.8 4 2.5 1.5 1 Din tabela 3 a Anexei, pe linia cu (h 1)(k 1) = (3 1)(3 1) = 4 GL i coloanele 2 2 2 = 0,05; 0,01; 0,001 gsim valorile critice: 0.05 = 9.49; 0.01 = 13.28; 0.001 = 18.50 . +
2 rezult c H se respinge deci X, Y sunt dependente foarte Cum 2 = 35.8 > 0.001 semnificativ. Exemplul 2 Fie X = culoare ou gin; Y = greutate ou gin. Se efectueaz un sondaj de n = 60 ou care se grupeaz n h = 2 clase X (ou albe i ou bej) i k = 3 clase Y obinnd tabela de contingen 2x3:

( 5 4)

( 0 2.5)

( 0 1.5)

( 5 1)

Clase Y Clase X

Ou uoare Ou mijlocii

Ou grele

Sume linii

Ou albe

Ou bej Suma coloan

10(7.5) 5(7.5) 15
2

15(15) 15(15) 30

5(7.5) 10(7.5) 15

30 30 n = 60
2

+ + + + + = 3.33 7.5 15 7.5 7.5 15 7.5 Din tabela 3 a Anexei, pe linia cu (h 1)(k 1) = (2 1)(3 1) = 2 GL i coloanele 2 2 2 = 0.05; 0.01; 0.001 avem valorile critice: 0,05 = 5.99; 0.01 = 9.21; 0.001 = 13.80
2 = 5.99 , ipoteza H se accept deci X, Y sunt independente. Cum 2 = 3.33 < 0.05 Exemplul 3 Fie X = leucoza vacilor, Y = tratament pentru leucoz vaci, se face un sondaj ntr-o ferm cu n = 100 vaci, datele obinute se clasific dup X, Y i se obine tabela de contingen 2x2:

=
2

(10 7.5)

(15 15)

( 5 7.5)

( 5 7.5)

(15 15)

(10 7.5)

Clase Y Clase X Vaci vindecate Vaci nevindecate Suma coloan

Vaci tratate Vaci netratate

Sume linii

88(81) 2(9) 90
2

2(9) 8(1) 10

90 10 n = 100
2

+ + + = 60.5 81 9 9 1 Din tabela 3 a Anexei , pe linia a (h 1)(k 1) = (2 1)(2 1) = 1 GL i coloanele 2 2 2 = 0.05; 0.01; 0.001 gsim valorile critice 0.05 = 3.84; 0.01 = 6.63; 0.001 = 10.80 ;
2 = 10.80 , H se respinge deci X, Y sunt dependente foarte Cum 2 = 60.5 > 0.001 semnificativ.

=
2

( 88 81)

( 2 9)

( 2 9)

( 8 1)

107

7.6.3

Testele normalitii prin asimetrie i boltire

Testarea normalitii unei populaii statistice n raport cu o nsuire X a exemplarelor sale este extrem de important deoarece conform teoremei limit central 1.13, pentru n orice variabil aleatoare devine normal iar pe de alt parte metodele statisticii biologice se aplic cu succes numai populaiilor normale. Testarea normalitii populaiei revine la verificarea ipotezei H : Populaia este normal fa de nsuirea X fa de alternativa H : Populaia nu este normal fa de nsuirea X. Testarea normalitii populaiei fa de nsuirea X se poate face pentru sondaje de volum mare (n > 30) i cu ajutorul coeficienilor de asimetrie i boltire ale cror valori critice sunt date n tabela 9.

n i (X i X ) Coeficientul de asimetrie este A =


nS3

i d gradul de asimetrie pe

orizontal al poligonului frecvenelor relative observate f i = dominant dat de modul M0 (vezi seciunea 7.2.2)

ni fa de curba normal n N( X ,S) adic poziia relativ a tendinei centrale dat de media X fa de tendina

n i (X i X ) Coeficientul de boltire este B =


nS4

i d gradul de concentrare pe

vertical a poligonului frecvenelor relative observate f i = N( X , S) (vezi seciunea 7.2.2). Avem B > 1.

ni fa de curba normal n

Testarea normalitii pe orizontal a populaiei fa de caracterul X se face cu ajutorul coeficientului de asimetrie A care se compar cu valorile critice A0.05 i A0.01 pentru valoarea lui n, extrase din tabela 9 din Anex . Dac A < A0.05 populaia este normal pe orizontal. n caz contrar avem cazurile: a) A0.05 A < A0.01 deci populaia este nenormal pe orizontal semnificativ; b)
A A0.01 deci populaia este nenormal pe orizontal district semnificativ.

Testarea normalitii populaiei pe vertical fa de caracterul X se face cu ajutorul coeficientului de boltire B care se compar cu valorile critice B0.99 < B0.95 < B0.05 < B0.01 pentru valoarea lui n, extrase din tabela 9 . Dac B [B0.95; B0.05], populaia este normal pe vertical. n caz contrar avem cazurile: a) Dac B [B0.99; B0.95) sau B (B0.05; B0.01], populaia este nenormal semnificativ pe vertical. b) Dac B < B0.99 sau B > B0,01, populaia este nenormal distinct semnificativ pe vertical. Exemplu Fie X = greutatea vieilor (kg) Avem un sondaj de n = 50 viei cu media X = 64.9 kg, abaterea standard S = 2.3 kg. Datele se grupeaz n k = 5 clase de valori Ci cu centrele de clas Xi i frecvenele absolute n clase ni:

108

Ci Sub 62 [62 64) [64 66) [66 68) peste 68 kg

Xi 61 kg 63 65 67 69

ni 7 10 18 9 6

Avem: 1 3 3 3 3 3 A= 7 61 64.9) +10( 63 64.9) +18( 65 64.9) + 9( 67 64.9) + 6( 69 64.9) = 3 ( 50 2.3 = 0.02 1 4 4 4 4 4 7 61 64.9) +10( 63 64.9) +18( 65 64.9) + 9( 67 64.9) + 6( 69 64.9) = B= 4 ( 50 2.3 = 2.46 Din tabela 9 a Anexei , pentru n = 50 avem valorile critice A0.05 = 0.533; A0.01 = 0.787 Avem A = 0.02 < A0.05 = 0.533 deci populaia din care a fost extras sondajul ,este normal pe orizontal. Din tabela 9 a Anexei , pentru n = 50 avem valorile critice B0.99 = 1.95; B0.95 = 2.13 respectiv B0.05 = 4.01; B0.01 = 4.92 Avem B = 2.46 [B0.95; B0.05] deci populaia din care a fost extras sondajul, este normal pe vertical. 7.7 Rezumat

n acest capitol se prezint tehnicile de sondaj n populaii statistice omogene i neomogene, calculul i interpretarea indicatorilor de sondaj de repartiie i evoluie precum i calculul i interpretarea indicilor statistici individuali i sintetici . n continuare se prezint conceptele de estimaie corect i absolut corect a parametrilor pentru una sau dou populaii(medii , abateri-standard i probabiliti) ,de ipotez statistic simpl sau compus , unilateral sau bilateral. Se prezint metoda de estimare prin intervale de n credere pentru parametrii precedeni , testul hi patrat de concordan , de independen a dou caractere X , Y i de normalitate a unei populaii n raport cu un caracter. 7.8 ntrebri 1.Clasificai sondajele n populaii statistice omogene i neomogene . 2. Ce semnificaie au indicatorii de sondaj de repartiie ? 3. Ce semnificaie au indicatorii de sondaj de evoluie ? 5. Ce semnificaie au indicii statistici individuali i sintetici ? 6. Ce este o estimaie corect respectiv absolut corect al unui parametru din populaie ? 7. Ce este o ipotez statistic simpl sau compus , unilateral sau bilateral ? 8. Ce este funcia de putere a testului ? 9. Ce este un interval de ncredere ? 10.Cum de aplic testul hi patrat de concordan n genetica mendelian ? 11.Cum se folosesc tabelele de contingen n testarea independenei a dou caractere? 12.Cum se testeaz normalitatea unei populaii n raport cu un caracter prin asimetrie i boltire ? 7.9 Bibliografie 1.D.Ene , M.Drghici, I.N. Alecu Statistic aplicat n agricultur Ed.Ceres,2003 2.M.Iosifescu i col. Mic enciclopedie de statistic Ed.tiinif.i Enciclop,,1985 3. Anuarul statistic al Romniei , 1990 -2009

109
CAPITOLUL 8 TESTE ALE CONTROLULUI CALITII SI FIABILITII IN AGRICULTUR Obiectice : nsuirea de ctre studeni a tehnicilor de control statistic al calitii produselor agricole i al fiabilitii mainilor agricole n cursul procesului de producie i la recepie (control simplu i secvenial) Coninut : 8.1 Controlul statistic de calitate n cursul procesului de producie 8.1.1 Cazul unei nsuiri cantitative 8.1.2 Cazul unei nsuiri calitative 8.2 Controlul statistic de calitate la recepie 8.2.1 Controlul unei nsuiri cantitative A. Controlul simplu al unei nsuiri cantitative B. Controlul secvenial al unei nsuiri cantitative 8.2.2 Controlul unei nsuiri calitative A. Controlul simplu al unei nsuiri calitative B. Controlul secvenial al unei nsuiri calitative 8.2.3 Controlul fiabilitii mainilor agricole A. Controlul simplu al fiabilitii B. Controlul secvenial al fiabilitii 8.3 Rezumat 8.4 ntrebri 8.5 Bibiliografie Cuvinte cheie : fie de control, control simplu,control secvenial,nsuire cantitativ , nsuire calitativ , fiabilitate . Produsele agricole de origine vegetal sau animal sunt destinate n principal consumului uman,consumului zootehnic i ca materie prim pentru industrie . Produsele de consum uman pot fi consumate direct(alimente proaspete) sau dup prelucrare/conservare(fin,mlai,zahr,ulei,brnzeturi,mezeluri, buturi,etc). Calitatea alimentelor destinate consumului uman este un complex de nsuiri fizice,chimice,biologice i estetice care trebuie ndeplinite fa de anumite baremuri (standarde) astfel ca s asigure la nivel optim nevoile omului. Aceleasi cerine se impun i pentru produsele de consum zootehnic (furaje proaspete sau prelucrate/conservate). Materiile prime pentru industrie(alimentar,textil,energetic,cosmetic,etc )privesc standarde de calitate asupra capacitii de prelucrare sau conservare n vederea satisfacerii la nivel optim a cerinelor ca produse finite (alimente,mbrcminte,nclminte,biogaz,produse fitofarmaceutice si cosmetice,etc). Mainile agricole pentru producia vegetal sau zootehnic trebuie s aib capaciti funcionale i de economicitate privind combustibilii conform unor standarde care s le permit amortizarea cheltuielilor de fabricaie i obinerea de profit n urma utilizrii lor .

110
Cel mai important indicator de calitate al masinilor agricole este sigurana lor n funcionare(fiabilitatea) care trebiue s ndeplineasc bareme de timp privind funcionarea fr defeciuni la exploatarea n condiii reale . Controlul calitii produselor agricole i a fiabilitii masinilor agricole are caracter oficial si cheltuielile necesare acestui control se amortizeaz prin vandabilitatea crescut pe piaa intern i mai ales cea extern. Controlul calitii si fiabilitii n agricultur se face n toate etapele procesului de producie ct i la recepia produselor sau masinilor agricole. Acest control poate fi exhaustiv(pentru toate produsele sau masinile) sau selectiv (prin sondaj) . Utilitatea statisticii n controlul calitii i fiabilitii rezult din faptul c agricultura este un domeniu de predilecie al aciunii ntmplrii(hazardului) prin variabilitatea genetic a plantelor sau animalelor i prin variabilitatea condiiilor de mediu n care acestea triesc. Astfel orice nsuire cantitativ (msurabil) sau calitativ(atributiv) X este o variabil aleatoare n jurul standardului de calitate. Timpul T de funcionare fr defeciuni al unei maini agricole este tot o variabil aleatoare calitativ n jurul standardului de calitate. Dac X este nsuire cantitativ(msurabil) trebuie ca M(X)= i V(X)<W2 iar dac X este nsuire calitativ(atributiv) trebuie ca frecvena sa de apariie relativ fn(X) s tind ctre probabilitatea P. 8.1 CONTROLUL STATISTIC DE CALITATE N CURSUL PROCESULUI DE PRODUCIE Fie X o caracteristic de calitate care poate fi cantitativ(msurabil) sau calitativ(atributiv). n cursul procesului de producie n agricultur,asupra caracretisticii X acioneaz o multitudine de factori care provoac asupra valorilor lui X variaii accidentale(cu cauze necontrolabile) i variaii sistematice(cu cauze controlabile). Obiectul controlului de calitate este n acest caz,supravegherea variaiilor sistematice i eliminarea lor prin corecii aduse procesului de producie. De fapt caracteristica de calitate X este un proces aleator Xt ; 0 t DS unde DS este durata unei serii n agricultur ( DS = durata perioadei de vegetaie la plante i DS = durata unui ciclu de exploatare a animalelor ). Realizrile Xi , i= 0,1,2, ale lui Xt se presupun a fi variabile aleatoare normale N(,) ,independente cte dou. mprim intervalul de timp [ 0; DS ] n m subinrtervale de timp egale : [ t0 = 0 ; t1) , [ t1; t2 ],,[ tm-1; tm = DS ] i efectum la momentele de timp t1 , t2 ,, tm= DS , m sondaje toate de volum n ,obinnd datele de sondaj : x11,x12,,x1n la momentul t1; x21, x22,,x2n la momentul t2 ; xm1 ,xm2,, xmn la momentul tm . a) Dac X este nsuire cantitativ(msurabil) , din datele de sondaj calculm mediile sondajelor :
xi = 1 n xij n j =1

abaterile-standard de sondaj:

111
1 n ( xij xi )2 n 1 j =1
1 m n xij mn i =1 j =1

si = precum i media total :


x=

respectiv abaterea-standard total : s=


m n 1 ( xij x) 2 mn 1 i =1 j =1

Fie xi,min = m i n xij ; xi,max = m a x xij deci avem amplitudinile 1jn 1jn de sondaj ai = xi,max xi,min . b) Dac X este nsuire calitativ(atributiv) avem xij = 1 dac obiectul numrul j din sondajul numrul i este rebut i xij = 0 n caz contrar deci

di =

j =1

x ij

va fi numrul de rebuturi n sondajul numrul i iar :


i = 1

j = 1

ij

Dac populaia este de volum N , raportul f = n/N se numete factor de sondaj. Mrimea lui f i cadena lurii probelor m depind de rapiditatea apariiei variaiilor sistematice i de costul lurii probelor . Pentru caracteristica de calitate X controlm doi parametri : M care ne Indic tendina central i D care ne indic mprtierea valorilor lui X. Pentru aceasta se construiesc intervalele de ncredere IM pentru M i ID pentru D . n controlul propriuzis, dac o valoare Mi a lui M cade n afara intervalului IM sau dac o valoare Di a lui D cade n afara intervalului ID ,se aduc corecii procesului de producie . Intervalele de ncredere IM i ID au forma : [ LCI ; LCS ] cu ncrederea 1 i riscul . LCI se numete limita de control inferioar pentru X iar LCS se numete limita de control superioar pentru X . Aceste limite se prezint grafic pe fiele de control al calitii de forma :

112

8.1.1 Cazul unei nsuiri cantitative n acest caz n rolul lui M vom lua mediile de sondaj xi sau medianele de sondaj Mei iar n rolul lui D vom lua abaterile-standard de sondaj si sau amplitudinile de sondaj ai Avem de verificat prin control al calitii , ipoteza H: = 0 fa de alternativa : 0 respectiv H: = 0 fa de alternativa H: > 0 . a) Fia de control pentru medie(fia X ) Mediile sondajelor x1,,xm sunt variabile aleatoare normale N(0, 0/n ) deci vom lua :

LCI ( x) = 0 u / 2

0
n

; LCS ( x) = 0 + u / 2

0
n

(1)

Dac 0 nu este cunoscut , se aproximeaz cu x iar dac 0 nu este cunoscut ,se aproximeaz cu s . De regul se ia u/2 =3 deci 1- = 99.865% i =0.135% . b)Fia de control pentru abaterea-standard (fia s) . Mrimile (n-1)si2 / 02 sunt variabile aleatoare 2 cu n-1 GL deci vom lua :

LCI ( s ) =

. 0 ; LCS ( s ) = . 0 (2) n 1 n 1 Pentru controlul calitii abaterii-standard se folosete numai LCS .

12 / 2

2 /2

n locul fiei de control b) pentru abaterea-standard se poate folosi : b) Fia de control pentru amplitudine ( fia R) Amplitudinea unui sondaj de volum n , notat a = xmax xmin este variabil aleatoare deci este variabil aleatoare i raportul w = a/ . Mediaw are valorile date de tabela 15 din Anex. Un estimator al lui este = a /w deci limitele de control pentru medie din relaiile (1) devin :

113
LCI ( x) = x 3 a n w ; LCS ( x) = x + 3 a n w (3)

Notm :

3 n w
(4)

LCI ( x) = x .a ; LCS ( x) = x + .a

cu valori n tabela 15 din Anex, deci limitele de control pentru medie devin : Din relaia a = w rezult (a) = (w). i cum nu se cunoate, va fi estimat de = a / w aa c un estimator pentru (a) va fi (a) = (w).a / w deci limitele de control pentru a capt forma :
LCI (a ) = a 3.

( w)
w

.a ; LCS (a) = a + 3.

( w)
w

.a

(5)

Cu notaiile :
D1 = 1 3.

( w)
w

; D2 = 1 + 3.

( w)
w

care au valori n tabela 15 din Anex, limitele de control pentru a ,capt forma:
LCI (a ) = D1 .a ; LCS(a)=D 2 .a (6)

Exemplu

Fie X greutatea puilor de carne la 40 zile. Lum m = 10 sondaje n 10 serii diferite , a cte n = 4 valori fiecare i obinem datele de sondaj din tabelul urmtor: Nr. Sondaj 1 2 3 4 5 1000;1100;1050;1010 950;980;1030;1000 1100;1020;1010;990 970;1020;1000;990 1100;1030;990;960 1000 950 970 990 960 1040 990 1010 1030 1020 1100 1030 1050 1100 1010 100 80 80 110 140 45.46 33.67 33.67 48.30 60.55 Date sondaj xij Xi,min xi xi,max ai si

114
6 7 8 9 10 TOTAL 1020;1010;1050;1000 970;1010;990;1030 980;990;1010;1100 1040;1020;1030;910 970;990;1020;1020 1000 970 980 910 970 xmin= 910 1020 1000 1020 1000 1000 x = 1013 1050 1030 1100 1040 1020 Xmax= 1100 50 60 120 130 50 a= 92 21.60 25.82 54.77 60.55 24.49 s= 40.84

Pentru n =4 , din tabela 15 din Anex, avem = 0.729 deci relaiile (4) devin: LCI(x ) = 1013 0.729x92 = 945.932 LCS(x ) = 1013 + 0.792x92 = 1080.68 Toate valorile xi sunt ntre aceste limite deci X corespunde la controlul calitii n cursul procesului de producie , ca tendin central a valorilor. Pentru n = 4 , din tabela 15 din Anex avem D1 = 0 ; D2 = 2.282 deci relaiile (6) devin : LCI(a) = 0 ; LCS(a) = 2.282x92 = 209.944 Niciuna din valorile ai nu depete pe LCS(a) deci X corespunde la controlul calitii n cursul procesului de producie ,ca mprtiere a valorilor. n cazul msurtorilor individuale ,volumele sondajelor sunt egale cu 1 i limitele de control pentru cele m valori individuale xi vor fi: LCI ( x) = x 3. am a ; LCS ( x) = x + 3. m w w (7)

Aici w se culege din tabela 15 din Anex pentru n = 2 iar am este media diferenelor succesive aim =| x i x i 1 | numite amplitudini mobile.
Exemplu

X = producia zilnic de lapte de vac(litri/zi) n a 28-a zi de la ftare (controlul Nr. 1). Avem m=10 sondaje a cte n=1 vaci fiecare cu produciile xi : xI 9.5 10 10.4 9.9 11 10.7 10.5 12.4 11.7 10.9 x = 10.8 |xi-xi-1| 0.5 0.4 0.5 1.1 0.3 0.2 1.9 0.7 0.8 am= 0.71

115
Din tabela 15 din Anex , pentru n=2 valori n amplitudinile mobile , avem w =1.128 deci : LCI(x)=10.8 3 .(0.71/1.128)=8.91 LCS(x)=10.8 + 3 .(0.71/1.128)=12.69 Toate cele 10 producii individuale sunt ntre limitele precedente, deci caracteristica X corespunde calitii . 8.1.2 Cazul unei nsuiri calitative n acest caz vom avea un singur parametru M n rolul cruia vom lua fie numrul di de exemplare-rebut din sondajul nr. i , fie frecvena rebuturilor fi = di / n din sondajul nr. i ; (i=1,2,,m). di este variabil binomial adic : P(di = k) = Cnk p0k (1- p0) n k unde p0 este proporia rebuturilor n cursul procesului de producie . Avem de verificat ipoteza H : p = p0 fa de alternativaH: p>p0 . Fie k1() cel mai mare numr natural pentru care avem :

P(d k1 ( )) =

k1 ( ) k =0

k n

k p0 (1 p0 ) nk 1

Fie k2() cel mai mare numr natural pentru care avem :

P(d k2 ( )) =
Avem :

k = k2 ( ) +1

k k Cn p0 (1 p0 ) nk 1

LCI(d) = k1() ; LCS(d) = k2()

(7)

Din pcate , limitele (7) implic calcule laborioase deaceea pentru n 40 i p0 0.1 , variabila binomial poate fi aproximat cu variabila normal.
a) Fia de control pentru frecvena rebuturilor (fia p )

Un estimator pentru p0 este fi = di /n unde di este numrul rebuturilor din sindajul nr. i de volum n . Avem : M(fi)= p0 i V(fi)=p0(1- p0)/n deci limitele de control pentru p0 vor fi :

116
LCI ( p0 ) = p0 3. p0 (1 p0 ) p (1 p0 ) ; LCS ( p0 ) = p0 + 3. 0 n n (8)

Cum p0 nu se cunoate , se aproximeaz cu :


f = 1 m 1 m 1 m n f = d = i mn xij i m i =1 mn i =1 j =1 i =1

aa c limitele de control pentru p0 devin :


LCI ( p0 ) = f 3. f (1 f ) f (1 f ) ; LCS ( p0 ) = f + 3. n n (9)

Dac LCI(p0) < 0 , lum LCI(p0) = 0 . Exemplu X = starea de ecloziune a oulelor de gin n a 18-a zi de incubaie. Se efectueaz m = 10 sondaje a cte n = 100 ou n 10 serii de incubaie, gsinduse numrul di de ou neeclozionate n aceste sondaje i frecvenele de rebut fi : Nr. 1 2 3 4 5 6 7 8 9 10 TOTAL Sond di 3 5 2 0 4 7 8 3 2 6 d=4 fi 0.03 0.05 0.02 0 0.04 0.07 0.0 8 0.03 0.02 0.06 f=0.04

Avem f = 0.04 deci din relaiile (9) obinem :


LCI ( p0 ) = 0.04 3 LCS ( p0 ) = 0.04 + 3 0.04 0.96 = 0.04 0.059 = 0 deci LCI(p0 ) = 0 100 0.04 0.96 = 0.04 + 0.059 = 0.099 100 0.10

Se observ c toate valorile fi nu depesc limita superioar LCS(p0) deci X corespunde la controlul calitii n cursul procesului de producie ca proporie a rebuturilor .
b)Fia de control pentru numrul rebuturilor (fia C )

n acest caz numrul di al rebuturilor ntr-un sondaj de volum n poate fi considerat variabil Poisson cu media i variana , deci limitele de control pentru d au forma :

LCI (d ) = 3 ; LCS (d ) = + 3 Cum nu se cunoate , l aproximm cu : d= 1 m di m i =1

(10)

117
deci limitele precedente capt forma :
LCI (d ) = d 3 d

LCS (d ) = d + 3 d

(11)

Dac LCI(d) <0 lum LCI(d) = 0 .


Exemplu

Pentru exemplul anterior avem d= 4 aa c : LCI (d ) = 4 3 4 = 2 deci LCI(d)=0


LCS(d)=4+3 4 = 10 Niciuna din valorile di din cele 10 sondaje nu depete pe LCS(d) deci X corespunde la controlul calitii n cursul procesului de producie ca numr de rebuturi.
8.2 CONTROLUL STATISTIC DE CALITATE LA RECEPIE D Fie un lot de N produse din care D au defecte i fie p = proporia acestor defecte. N Efectum un control selectiv al calitii produselor astfel:extragem din lot un sondaj de n n produse (factorul de sondaj este ) i le controlm, gsind produse defecte. N Dac c , lotul se accept ca fiind corespunzator calitii X controlate,iar dac > c , lotul se respinge ca fiind necorespunzator calitii X controlate.In lotul respins se nlocuiesc produsele defecte cu altele bune. Probabilitatea de acceptare a lotului ca funcie de p (proporia produselor defecte n intregul lot) se noteaz cu L(p) i se numeste caracteristica operativ a controlului de calitate. Graficul su are forma:

= 1 L(p 0 ) este eroarea de ordin I, adic probabilitatea respingerii unui lot cu defecte putine,deci este riscul furnizorului. = L(p1 ) este eroarea de ordin II, adic probabilitatea acceptrii unui lot cu defecte multe,deci este riscul beneficiarului.

118
p 0 se va numi calitate de acceptare, iar p1 calitate limit admis. Controlul calitatii revine deci la verificarea ipotezei H : p < p 0 fa de alternativa

H : p > p1 . Evident L ( p ) = P ( c ) = P ( = d ) . In plus valoarea medie pentru volumul n de sondaj este: n = n L ( p ) + N 1 L ( p ) . Observm c pentru p=0 avem n = n ,iar pentru p=1 avem n = N . este variabil hipergeometric deoarece obiectele controlate deja (ntre care pot fi i rebuturi) nu se mai ntorc n populaie,de aceea avem: n d n d Cd Cd N p C N (1 p ) D CN D P ( = d) = = . p CD CN N N D Prin calcul rezult c ca variabila aleatoare,are media M = i variana n n N 1 N n D ( N D) este o estimaie absolut corect pentru proporia V = deci 2 n N n n N 1 D de produse defecte ale lotului,deoarece: real p = N D ,iar lim V = 0 . M = n n N n Pentru , dai, trebuie s aflm pe n i c astfel ca: L ( p 0 ) = 1 ; L ( p1 ) = , adic:
d =0 c

d =0

n d Cd Np1 C N(1 p0 )

p0 CN d =0 N d n d c C Np1 C N(1 p1 )

=1 ;

Aceste ecuaii n raport cu n i c sunt foarte greu de rezolvat datorit calculelor cu combinri.In unele cazuri variabila hipergeometric poate fi inlocuit cu variabila binomial,Poisson sau normal. n este mult mai mic ca 1,avem: 1)Dac N
d L ( p ) Cd n p (1 p ) c n d d =0

p1 CN N

= .

nct n si c satisfac ecuaiile:

C
d =0

d n

p (1 p 0 )
d 0

n d

= 1 ;
=.

C
d =0

d n

d p1 (1 p1 )

n d

119
2)Dac p i n sunt mult mai mici ca 1, avem: N c d L ( p ) e d = 0 d! n = n p = D , deci n i c satisfac ecuaiile: N

unde

d =0 c

( n p0 )
d!

e np0 = 1 ; e np1 = .

d =0

( n p1 )
d!

3)Dac n este foarte mare, avem: c np , L ( p) F np (1 p ) unde F este funcia de repartiie N(0,1) cu valori in tabela 1 a Anexei,aa c n i c satisfac ecuaiile: c np 0 = 1 ; F np0 (1 p0 ) c np 1 =. F np1 (1 p1 )
Prezentm mai departe dou tipuri de control al calitii i fiabilitii: controlul simplu i controlul secvenial.
8.2.1 Controlul unei nsuiri cantitative

A. Controlul simplu al unei nsuiri cantitative


X.

Fie Tmax limita superioar admis pentru valorile nsuirii cantitative(msurabile)

Pentru , i p0 , p1 dai, trebuie s gsim volumul sondajului n i pragul de acceptare c al lotului la controlul calitii. Lotul este acceptat dac la sondajul efectuat gsim media X Tmax c . Aceast condiie se mai scrie: X ( Tmax ) c sau: X T n max c n . Dar proporia de produse defecte este: T p = 1 F max aa c , Aadar lotul se accept dac:

Tmax = Up .

X n ( Up c) n .

120
Pentru p = p0 obinem:

X P n U p0 c

n =1 , n =.

iar pentru

p = p1

obinem:

X P n U p1 c

Conform demonstraiei teoremei 6.1 din seciunea 6.2, este variabil N(0,1),deci avem : innd cont c: Teorema 8.1 In cazul testului simplu al controlului calitii avem:
2

U = U p0 c
am demonstrat:

X n

n;U1 = U p1 c

U1 = U ,

U + U n = Up Up 1 0
2

U U p1 + U U p0 ;c = U + U

(1)

Dac =necunoscut, lum S, deci c rmne neschimbat,iar n crete de c 1 + ori. 2 Dac Tmin este limita inferioar admis pentru valorile lui X, lotul este acceptat dac la sondajul efectuat gsim media: X Tmin + c , ceea ce duce la aceleai valori ca mai sus pentru n i c. Fie T limita (superioar sau inferioar) pentru valorile lui X. T 0 T 1 1 F Fie = p0 ; F aa c: = p1 , 0 = T U p0 ; 1 = T + U p1
T 0 T ; U p1 = 1 Verificarea ipotezei H : p < p0 fa de alternativa H : p > p1 devine:

deoarece

U p0 =

H : < 0

fa de alternativa

H : > 1

iar valorile din teorema 8.1 devin:

( U + U ) ( U 1 U 0 ) ( U U ) T (2) n= ; c = 2T ( 0 + 1 ) ( U + U )
Exemple 1)Se controleaz X=greutatea unui lot de pui livrai(kg) pentru care limita inferioar de calitate este Tmin = 1kg. Dac se tie c = 0.1kg i se dau =3%; =7%;

121
p0 = 1%; p1 = 4% , s se determine volumul n al sondajului i limita de acceptare Tmin + c pentru media de sondaj X . Solutie: Din tabela 1 a Anexei, obinem F ( U 3% ) = 97% = 0.9700 deci
U1% = 2.33; F ( U 4% ) = 96% = 0.9600 deci U 4% = 1.75.

U 3% = 1.88; F ( U 7% ) = 93% = 0.9300 deci U 7% = 1.48; F ( U1% ) = 99% = 0.9900 deci

Din relaiile de mai sus obinem: 0=0.767 Kg ; 1=1.175 Kg. nlocuind aceste valori n relaia (1) gsim: Tmin + c = 1.2kg . n=34; c=2 deci Lotul se accept dac dintr-un sondaj de n=34 de pui livrai,greutatea medie al acestora este de cel puin 1.2 kg. 2)Se controleaz X=grosimea stratului de grsime la greabn al porcilor livrai(cm) pentru care limita superioar de calitate este Tmax = 4cm . Dac se tie c =0.1 cm i se dau =5%; =10%; p 0 = 2%; p1 = 7% , s se determine volumul sondajului n i limita de acceptare Tmax c pentru media de sondaj
Soluie Din tabela 1 din Anex obinem ca n exemplul anterior: U 5% = 1.65; U10% = 1.28; U 2% = 2.06; U 7% = 1.48 ; Din formulele precedente obinem : 0=3.794 cm; 1=4.148 cm. Din formula (1) rezult: n=12; c=1.7; Tmax c = 3.83 cm. Lotul se accept dac ntr-un sondaj de n=12 porci,grosimea medie a stratului de grsime la greabn nu depeste 3.83 cm.

X.

B. Controlul secvenial al unei nsuiri cantitative In acest caz volumul n al sondajului nu se mai determin n prealabil,ci se face controlul n lot,produs cu produs,pn la acceptarea sau respingerea lotului la controlul de calitate. In acest fel,dac p este mult mai mic ca p0 (lot foarte bun) sau mult mai mare ca p1 (lot foarte prost),volumul n de sondaj este mult mai mic ca n cazul sondajului simplu. Fie Tmax limita superioar admis pentru valorile nsuirii cantitative X i fie 0 , 1

T 0 definite de relaiile: 1 F max

Tmax 1 = p0 ; F = p1 ,

de unde rezult: 0 = Tmax U p0 ;


H : > 1 .

1 = Tmax + U p1 .

Controlul de calitate revine a la verifica ipoteza H : < 0 fa de alternativa Fie Pn 0 probabilitatea de a obine valorile de sondaj adevarat ipoteza H i Pn1 este adevarat ipoteza alternativ H . Avem cazurile:

x1 ,..., x n n cazul n care este probabilitatea de a obine valorile x1 ,..., x n n cazul n care

122
P 1 < n1 < , n care caz se continu msurtorile; 1 Pn 0 P 2) n 1 < , n care caz se ia decizia acceptrii ipotezei H : < 0 ; Pn 0 1 P 1 3) n 1 > , n care caz se ia decizia acceptrii ipotezei alternative H : > 1 . Pn 0 Populaia fiind presupus normal i datele de sondaj independente,avem: 2 2 ( x i 0 ) ( x i 1 )

1)

Pn 0 =

2 2

Pn 1 =
2

2 2

de unde rezult:

Pn 1 =e Pn 0
aa c avem: Cu notaiile:
a=
ln

( x i 0 ) ( x i 1 )
2

2 2

n ( 0 + 1 ) Pn 1 1 0 = x i 2 Pn 0 2

0 + 1 2 2 1- < 0 ; b1 = ; b0 = ln ln > 0 (3) 2 1 0 1 1 0

cazurile 1)-3) de mai sus,prin logaritmare n baza e,duc la :


Teorema 8.2 Avem cazurile: 1) a.n + b0 < x i < a.n + b1 ,

n care caz se continu msuratorile; H : < 0 ;

2) x i < a.n + b 0 , n care caz se accept ipoteza Practic, se reprezint grafic dreptele punctul de coordonate

3) x i > a.n + b1 , n care caz se accept ipoteza alternativa H : > 1 . x = a.n + b 0 i x = a.n + b1 ,

n sistemul de axe cu abscisa n i ordonata

(n ; x )
i

i se continu msuratorile pn cnd

trece prin una din zonele 2 sau 3:

123

Tmax fiind limit superioar pentru X, acceptarea ipotezei H duce la acceptarea lotului la controlul calitii, deci zona 2 este zona de acceptare a lotului,n timp ce acceptarea ipotezei alternative duce la respingerea lotului la controlul calitii,deci zona 3 este zona de respingere a lotului. Dac Tmin este limit inferioar pentru X ,situaia este invers. Exemple 1)X=greutatea porcilor la livrare(kg) limitat inferior.Dac se dau =5%;=2% i se tie c =5 kg,s se verifice ipoteza H : < 100kg fa de H : > 110kg prin control secvenial. Solutie Avem 0 = 100kg; 1 = 110kg; = 5kg; = 5%; = 2% ,deci conform formulelor (3) obinem: a = 105kg; b 0 = 9.65; b1 = 7.44 . Tabelul de calcul cu datele de sondaj x i i sumele

este:

n 1 2 3 4 5 6 7

xi

105n-9.65 95.35 200.35 305.35 410.35 515.35 620.35 725.35

x 1 + KK + x n

105n+7.44 112.44 217.44 322.44 427.44 532.44 637.44 742.44

107 103 109 96 103 105 100

107 210 319 415 518 623 723

Dup n=7 msuratori,avem

respinge la controlul calitii deoarece X este limitat inferior. 2)X=grosimea stratului de grsime la greabn pentru porci(cm) limitat superior. Dac se dau =6%;=9% i se tie c =1 cm,s se verifice ipoteza H : < 3cm fa de alternativa H : > 4cm , prin control secvenial.

< a.n + b 0 ,

deci se accept H,aa c lotul se

124
Solutie Avem 0 = 3cm; 1 = 4cm; = 1cm; = 6%; = 9% , obinem: a = 3.5cm; b 0 = 2.35; b1 = 2.72

deci conform formulelor (3)


i

Tabelul de calcul cu datele de sondaj x i i sumelor n 1 2 3 4 5 6 7 8 9


xi

,este: 3.5n+2.72 6.22 9.72 13.22 16.72 20.22 23.72 27.22 30.72 34.22

3.5n-2.35 1.15 4.65 8.15 11.65 15.15 18.65 22.15 25.65 29.15

x 1 + KK + x n

3.6 4.1 3.1 3.0 3.8 2.9 2.6 3.0 2.7

3.6 7.7 10.8 13.8 17.6 20.5 23.1 26.1 28.8

Dac n=9 msurtori,avem


8.2.2

aa c lotul se accept la controlul calitii deoarece X este limitat superior.


Controlul unei nsuiri calitative

< a.n + b 0 , deci se accept H,

A. Controlul simplu al unei nsuiri calitative Pentru , , p 0 , p1 dai,trebuie s gsim volumul n al sondajului i pragul de acceptare c al lotului la controlul de calitate. Lotul este acceptat dac la sondajul efectuat gsim numrul de rebuturi c . 1 2 Se poate arta c p = p cu 2(c+1) grade de libertate. 2n 1 2 1 2 Pentru p = p 0 avem 1 = p 0 , iar pentru p = p1 avem = p1 , de unde 2n 2n rezult : Teorema 8.3 cu 2(c+1) grade de libertate. = 2p 0 2p1 In concluzie vom cuta pentru cte grade de libertate (egale cu 2(c+1)) avem:
n=

Avem

12

12
p0

2
p1

deci gsim pe c, apoi din teorema 8.3 gsim pe n.

Exemplu X=ecloziunea unui lot de ou de gin n a 18-a zi de incubaie. Dac se dau = 5%; = 5%; p 0 = 3%; p1 = 6% , se cere volumul sondajului n i pragul de acceptare c al lotului la controlul calitii. Solutie

125
2 2 sau 3 0.95 0.05 , egalitate care se realizeaz 0.03 0.06 2 2 pentru 2(c+1)=19 GL ,pentru c n acest caz avem 0.95 = 10.12; 0.05 = 30.14 . 10.12 Rezult c c=9 i n = = 167 . 2 0.03 Lotul se accept dac dintr-un sondaj de n=167 de ou ,cel mult c=9 ou sunt neeclozionate.

Trebuie s avem:

2 0.95

2 0.05

B. Controlul secvenial al unei nsuiri calitative


1, dac al i-lea produs din sondaj este defect fa de nsuirea X Fie: x i = 0, n caz contrar p = P(x i ) = 1 i n. Controlul de calitate revine la verificarea ipotezei H : p < p 0 fa de alternativa

deci dac x i sunt independente,

este variabil binominal de parametri

H : p > p1 . In cazul nostru avem:


k Pn 0 = Ck n p 0 (1 p 0 ) n k k k ; Pn 1 = Cn p1 (1 p1 ) n k

k = xi unde calitativ X.

este numrul produselor din sondaj care sunt rebuturi fa de nsuirea


k n k

p 1 p1 p 1 p1 P Pn 1 Avem n 1 = 1 = k .ln 1 + ( n k ) .ln . ,deci: ln Pn 0 p0 1 p 0 Pn 0 p0 1 p0 Dndu-se i , respectiv p 0 , p1 avem cazurile: P 1 < n1 < , n care caz se continu msurtorile; 1) 1 Pn 0 P 2) n 1 < , n care caz se decide c H : p < p 0 este adevarat; Pn 0 1 P 1 3) n 1 > , n care caz se decide c alternativa H : p > p1 este adevarat. Pn 0 Cu notatiile: 1 p0 1 ln ln ln 1 p1 1 ;b = a= ; b0 = (4) 1 p1 (1 p0 ) p1 (1 p 0 ) p1 (1 p 0 ) ln ln ln p 0 (1 p1 ) p0 (1 p1 ) p0 (1 p1 ) cazurile 1)-3) de mai sus prin logaritmare n baza e,conduc la : Teorema 8.4 Avem cazurile: 1) a.n + b0 < k < a.n + b1 , n care caz se continu masuratorile;

126
2) k < a.n + b0 , n care caz se accept ipoteza H; 3) k > a.n + b1 , n care caz se accept alternativa H . Practic,se reprezint grafic dreptele x = a.n + b 0 i x = a.n + b1 n sistemul de axe cu

(n,k) trece n una din zonele 2 sau 3. Acceptarea ipotezei H duce la acceptarea lotului la controlul calitii,deci zona 2 este zona de acceptare a lotului n timp ce acceptarea alternativei H duce la respingerea lotului la controlul de calitate,deci zona 3 este zona de respingere a lotului. Exemplu X=viabilitatea puilor de gin in vrst de o zi. Se dau =4%;=6%. S se verifice ipoteza H:p<10% fa de alternativa H : p > 90% prin controlul secvenial. Solutie Avem = 0.04; = 0.06; p 0 = 0.1; p1 = 0.9 , deci conform formulelor (4) obinem: a = 0.5; b 0 = 0.63; b1 = 0.72 . Tabelul de calcul cu datele de sondaj x i N 1 2 3 4 5 6 7 8
xi

abscisa n i ordonata k = x i i se continu msurtorile pn cnd punctul de coordonate

i sumele k = x i , este:

0.5n-0.63 -0.13 0.37 0.87 1.37 1.87 2.37 2.87 3.37

k = x1 + K + x n
0 1 2 2 2 3 3 3

0.5n+0.72 1.22 1.72 2.22 2.72 3.22 3.72 4.22 4.72

0 1 1 0 0 1 0 0

Dup n=8 pui controlai se accept ipoteza H,deci lotul se accept la controlul calitii.
8.2.3 Controlul fiabilitii mainilor agricole

A. Controlul simplu al fiabilitii mainilor agricole Dac pentru produsele agricole destinate consumului este important controlul statistic al calitii lor in raport cu diferite nsuiri X, msurabile sau atributive, pentru mainile agricole este important controlul statistic al siguranei n functionare sau al fiabilitatii lor. Definiia fiabilitii a fost dat n seciunea 1.2 Fiabilitatea este o nsuire calitativ(atributiv) pentru care p 0 i p1 sunt nlocuii cu T0 (timpul mediu de funcionare fr defeciuni acceptat), respectiv T1 (timpul mediu de funcionare fr defeciuni limit admis),deci trebuie verificat ipoteza H : t > T0
fa de alternativa H : t < T1 , unde avem T0 >T1 spre deosebire de p 0 < p1 la nsuirile X atributive. In cadrul testului simplu al controlului fiabilitii, pentru ; ;T0 ;T1 dai,trebuie gsite numrul de defeciuni acceptate c i timpul de acceptare t c al lotului la controlul fiabilitii.

127
Lotul este acceptat dac: a)timpul de funcionare pn la apariia a c defeciuni este t t c sau b)numrul de defeciuni aprute n timpul de funcionare t c este In caz contrar lotul se respinge la controlul fiabilitii. 2t c Se poate arta c t = 2 cu 2(c+1) grade de libertate.

k c.

Pentru t = T0 avem: T0 =

2t c
2 1

, iar pentru t = T1 avem: T1 =

2t c

, de unde

rezult: Teorema 8.5 T T Avem t c = 0 12 = 1 2 cu 2(c+1) 2 2

grade de libertate. avem

T0

2 1

Vom cuta n tabela 3 din Anex ,pentru cte grade de libertate, adic 2(c+1),

T1 , deci obinem pe c, apoi din teorema 8.5 obinem pe t c .


2

Exemplu Pentru controlul fiabilitii unor maini agricole de mprtiat ngrminte chimice, se dau = 5%; = 5%;T0 = 160 ore; T1 = 80 ore. S se determine numrul c de maini defecte acceptat i timpul de acceptare t c la controlul fiabilitii. Solutie 2 2 2 2 2 Trebuie s avem T0 12 T1 , adic 160 0.95 80 0.05 sau 2 0.95 0.05

ceea ce se ntampl pentru 2(c+1)=40 GL. 2 2 In acest caz 0.95 = 26.51; 0.05 = 55.76 . 160 26.51 = 2120 ore. De aici rezult c c=19; t c = 2 In concluzie,lotul se accept dac timpul de funcionare pn la defectarea a 19 maini este de cel puin 2120 ore sau dac numrul de maini care s-au defectat dup 2120 ore de funcionare este de cel putin 19 maini. In caz contrar,lotul se respinge la controlul fiabilitii. B. Controlul secvenial al fiabilitii mainilor agricole Dorim s verificm ipoteza H : t > T0 fa de alternativa H : t > T1 , unde T0>T1 . t este timpul de funcionare fr defeciuni al unei maini,iar datele de sondaj privind funionarea sa fr defeciuni sunt: t 1 ,KK , t n . Conform teoremei 4.1 , probabilitatea de a avea k defeciuni ntr-un interval de timp de k ( t ) t e . lungime t,este: P ( k ) = k! k t t 1 Cu = avem: P ( k ) = e . k!

128
este timpul mediu ntre apariia a dou defeciuni consecutive. n cazul c ipoteza Fie Pn 0 probabilitatea de a obine datele de sondaj t 1 ,KK , t n H este adevarat i Pn 1 probabilitatea de a obine datele de sondaj t 1 ,KK , t n n cazul c alternativa H este adevarat. Avem:
Pn 0 t t T = o e T0 ; Pn 1 = k!
k 1 1 k

t t T1 e T1 , k!

deci:

T T Pn 1 T0 t = e 1 0, Pn 0 T1 1 1 T P de unde: ln n 1 = k .ln o t . T1 Pn 0 T1 T0 Avem cazurile: P 1 1) , n care caz se continu msurtorile; n1 1 Pn 0 P , n care caz se accept ipoteza H; 2) n 1 < Pn 0 1 P 1 , n care caz se accept ipoteza alternativa H . 3) n 1 > Pn 0

1 1 1 ln ln T T0 ; b 0 = 1 ; b1 = Cu notatiile: a = 1 (5) T0 T0 T0 ln ln ln T1 T1 T1 prin logaritmare in baza e,cazurile 1)-3) de mai sus conduc la :

Teorema 9.6 Avem cazurile: n care caz se continu msurtorile; 1) a.t + b 0 < k < a.t + b1 , 2) k < a.t + b0 , n care caz se accept ipoteza H;

3) k > a.t + b1 ,

n care caz se accept ipoteza alternativ H . x = a.t + b0 i x = a.t + b1 , n sistemul de

axe cu abscisa t i ordonata k = t i i se continu msurtorile pn cnd punctul de

Practic,se reprezint grafic dreptele

coordonate (t,k) trece prin una din zonele 2 sau 3. Zona 2 este zona de acceptare al lotului la controlul fiabilitii,iar zona 3 este zona de respingere al lotului la controlul fiabilitii.

Exemplu Pentru controlul fiabilitii unor staii pentru epurarea dejeciilor la porci, avem =5%;=10%. S se verifice ipoteza H: t>4 luni fa de alternativa H : t < 1 lun prin control secvenial. Soluie

129
Avem = 5%; = 10%;T0 = 4;T1 = 1 , deci conform formulelor (5) gsim: a = 0.54; b 0 = 1.62; b1 = 2.08 . Tabelul de calcul cu datele de sondaj t i i sumele k = ti ,este:

t 1 2 3 4 5 6 7

ti

0.54t-1.62 -1.08 -0.54 0 0.54 1.08 1.62 2.16

k = t1 + KK + tn
0 1 1 1 2 2 2

0.54t+2.08 2.62 3.16 3.70 4.24 4.78 5.32 5.86

0 1 0 0 1 0 0

Se accept ipoteza H: t>4 luni dup t=7 luni de funcionare deci lotul de staii de epurare se accept la controlul calitii.
8.3 Rezumat n acest capitol se prezint controlul statistic al calitii n cursul procesului de producie prin fie de control al unei nsuiri cantitative respectiv calitative . Se prezint controlul simplu i secvenial al controlului statistic de recepie pentru nsuiri cantitative, caliative i fiabilitate. 8.4 ntrebri 1. Ce fie de control se folosesc pentru controlul calitii n cursul procesului de fabricaie? 2. n ce const controlul simplu al calitii la recepie ? 3. n ce const controlul secvenial al calitii la recepie ? 4. n ce caz controlul secvenial este preferat controlului simplu ? 8.5 Bibliografie

1.D.Ene , M.Drghici, I.N. Alecu Statistic aplicat n agricultur Ed.Ceres,2003 2.M.Iosifescu i col. Mic enciclopedie de statistic Ed.tiinif.i Enciclop,,1985 3. Anuarul statistic al Romniei , 1990 -2008

130
CAPITOLUL 9 ANALIZA VARIANEI I PLANURI EXPERIMENTALE N AGRICULTUR

Obiectice : nsuirea de ctre studeni a puternicului aparat al analizei varianei mono i polifactoriale n populaii omogene i neomogene (planuri experimentale). Coninut : Analiza varianei monofactorial nebalansat n populaii omogene Analiza varianei bifactorial complet nebalansat n populaii omogene Analiza varianei bifactorial ierarhic nebalansat n populaii omogene Planuri experimentale n populaii neomogene 9.4.1 Planul blocurilor complete randomizate 9.4.2 Planul patratelor latine 9.5 Rezumat 9.6 ntrebri 9.7 Bibliografie Cuvinte cheie : analiza varianei nebalansat complet / ierarhic, model cu efecte fixe / aleatoare,componente de varian,blocuri complete randomizate, patrate i dreptunghiuri latine. 9.1 ANALIZA VARIANEI MONOFACTORIAL NEBALANSAT N POPULAII OMOGENE n populaia statistic lum ca obiect de studiu un caracter msurabil Y fa de care exemplarele populaiei au media . Fie un alt caracter X asociat cu exemplarele populaiei, caracterul X avnd m variante (doze, nivele, tratamente) notate X(1) ,..........X(m). Caracterul X se numete factor i constituie un criteriu de clasificare a populaiei n m subpopulaii (straturi ) ce corespund variantelor X(1) ,..........X(m), mediile pe subpopulaii relativ la caracterul Y fiind (1) ,.......... (m). Diferenele x(i)=(i)- se numesc efecte principale ale lui X n subpopulaii. Avem 9.1 9.2 9.3 9.4

x (i)= 0
i= 1

Subpopulaiile se presupun normale cu mediile (1) ,.......... (m) i aceeai varian 2 (E) n raport cu caracterul Y. Extragem n mod ntmpltor din subpopulaii, m sondaje (probe, eantioane) de volume p(1) ,.......... p(m). Volumul de sondaj total este pT = p ( j ) .
j =1 m

Datele relative la Y, din aceste sondaje le numim repetiii (replicate) i le notm cu Y(i,j) (i=1,......., m; j=1,.........., p(i)). Forma general a modelului liniar este:

Y(i, j)= +x (i)+e(i, j)


unde e(i, j) sunt variabilele aleatoare normale, independente cte dou, cu media zero i variana 2(E).

131
Orice variant X(i) a lui X trebuie s modifice pe (i) nu i pe . Aceast condiie se verific prin ipoteza H: (1)2=..........= (m)2 fa de alternativa : (1)2......... (m)2 cu ajutorul testului Bartlett: 1 p (i ) MY (i ) = Y (i, j ) i varianele de Fie mediile de sondaj n cadrul variantelor p(i ) j =1

sondaj n cadrul variantelor: 1 p (i ) SY(i)2= [Y (i, j ) MY (i)] 2 p (i ) 1 j =1 Variana erorii este: Fie: C=1+
2

(1 i m)

m 1 S E= ( p(i ) 1) SY (i ) 2 pT m i =1

m 1 1 [ 3(m 1) i =1 p (i ) 1

( p(i) 1)
i =1

Marimea: m 1 2B= [ ( p (i ) 1) ln S2E- ( p(i ) 1) SY(i)2] C i =1

este o variabil 2 cu m-1 grade de libertate. Se extrag din tabela 3 din Anex, valorile critice 20.05; 20.01; 20.001 cu m-1 GL i se compar 2B cu aceste valori critice. Dac 2B<20.05 atunci se accept ipoteza H: (1)2=..........= (m)2. n caz contrar avem cazurile : 1) 20.052B<20.01 n care caz se accept deci (1)2......... (m)2 difer semnificativ ntre ele ; 2) 20.012B<20.001 n care caz se accept deci (1)2......... (m)2 difer distinct semnificativ ntre ele; 3) 2B20.001 n care caz se accept deci (1)2......... (m)2 difer foarte semnificativ ntre ele. n cazul balansat p(1) =.........= p(m) = p; pT = mp i ipoteza H: (1)2=..........= (m)2 fa de alternativa : (1)2........ (m)2 se verific cu testul Cochran: Fie SY2max =max SY(i)2 1im Calculm : Q=SY2max/(SY(1)2+.......+SY(M)2) i extragem din tabelele Cochran, valorile critice Q0.05 i Q0.01 pentru m variante i p-1 GL. Dac Q< Q0.05 se accept ipoteza H: (1)2=..........= (m)2. n caz contrar avem cazurile : Q0.05Q<Q0.01 deci se accept adic (1)2......... (m)2 difer semnificativ ntre ele; Q<Q0.001 deci se accept adic (1)2......... (m)2 difer distinct semnificativ ntre ele. Dup modul de alegere al subpopulaiilor, avem dou tipuri de modele : a) Modele cu efecte fixe:

1) 2)

132
n acest caz experimentatorul fixeaz valorile variantelor X(1) ,..........X(m) i mparte populaia n m subpopulaii ce se vor asocia cu X(1) ,..........X(m). Mediile (i) sunt constante, efectele principale x(i)=(i)- sunt de asemenea constante. Avem : M(Y(i,j))= (i) M(x (i))= x (i) (1im) M(e(i,j))=0 (1jp(i)) respectiv: V(Y(i,j))= 2(E) V(x (i))= M(2x (i))- M(x (i))2=2x (i)- 2x (i)=0 V(e(i,j))= M(e2x (i))- M(e(i,j))2= 2(E)- 2(E)=0 Ipoteza care se verific este H: (1)=..........= (m) = fa de alternativa : (1)......... (m) ) sau sub alt form H: x (i)=0 fa de alternativa : x (i) 0. Modelul cu efecte fixe se aplic cnd numrul m de variante este mic i permite ca aceleai variante s fie utilizate din nou dac experiena se repet. Exemplu X=ngrminte, ap, energie la plante respectiv furaje,sex, perioada de ngrare la animale.
b) Modelul cu efecte aleatoare:

Experimentatorul alege n mod aleator valorile variantelor X(1),........,X(m), iar cele m subpopulaii se aleg n mod aleator din mulimea subpopulaiilor posibile, urmnd a fi asociate n mod aleator cu variantele X(1),........,X(m). Mediile (i) sunt variabile aleatoare normale cu media i variana 2(x), iar efectele principale x (i)= (i)- sunt tot variabile aleatoare normale cu media 0 i variana 2(x). Avem: M(Y(i,j))= M(x (i))= 0 unde : (i=1,......,m) i (j=1,.......,p(m)) M(e(i,j))=0 respectiv: V(Y(i,j))= V(x (i))+ 2(E) V(x (i))= M(2x (i))- M(x (i))2= 2(x)-0= 2(x) V(e(i,j))= M(e2x (i))- M(e(i,j))2= 2(E)-0= 2(E). Aici x este variabila aleatoare:

x (1), ......, x (m ) x = p(1), ......., p(m )


cu media M(x)= p(i)x(i)=0 i variana 2(x).
i= 1 m

133
Ipoteza care se verific este H: (x)=0 fa de alternativa : (x) 0. Modelul cu efecte aleatoare se aplic cnd numrul m de variante X este mare (poate fi i infinit ), dar numai n din ele sunt alese n experiment. Aceleai variante nu pot fi utilizate din nou dac experiena se repet. Exemplu: X=tata sau mama n ncruciarea plantelor i animalelor. n cazul ambelor modele, datele mpreun cu calculele de sume i medii pe variante i pe total, se trec n tabelul de mai jos:

RepetiiiY VarianteX X(1) . . . . X(m)


m

Y(i,j) Y(1,1),......, Y(1,p(1)) . . . . Y(m,1),..., Y(m,p(m))

Medii pe variante MY(1) . . . . MY(m)

Media total

MYT

Notaie : pT= p(i )


Calcule:
m p (i ) i =1

a)SPA i GL:

SPAT= [Y(i,j)-MYT]2= Y(i,j)2-S2T/pT cu


i =1 j =1
m

m p (i )

GLT=pT-1 GLX= m-1

i =1 j =1
m

SPAX= p(i)[MY(i)-MYT]2= S(i)2/p(i)-S2T/pT


i=1 i=1

cu

SPAE= [Y(i,j)-MY(i)]2=SPAT-SPAX cu
b)S2: S2X=SPAX/(m-1); c)F: FX=S2X/S2E>1 cu
i =1 j =1

m p (i )

GLE=GLT-GLX=pT-m

S2E=SPAE/(pT-m) [m-1; pT-m]GL

Rezultatele de la punctele a)-c) se trec n tabelul sintetic de analiz a varianei: Sursa de variaie X E T SPA SPAX SPAE SPAT GL m-1 pT-m pT 1 S2 S2X S2E F FX -

134
Raportul Fisher FX se compar cu valorile critice F0.05; F0.01; F0.001 extrase din tabelele 4,5,6 din Anex pentru perechile de grade de libertate corespunztoare i se accept sau se respinge ipoteza formulat mai sus. Conform teoremei 9.1 de mai jos, avem: 1)Pentru modelul cu efecte fixe: 1 m M(S2X)= [ p(i)2x (i)]+ 2(E) m 1 i=1 2 M(S E)= 2(E) Avem estimatorii: * 2(E)= S2E; * 2(E)=(S2X-S2E)/a(1,1) 1 m unde a(1,1)= [ p(i)2x (i)] m 1 i=1 2)Pentru modelul cu efecte aleatoare: m 1 [pT-(1/pT) p2(i)] 2(x)+ 2(E) M(S2X)= m1 i =1 2 2 M(S E)= (E) Avem estimatorii: *2(E)= S2(E); *2(X)= (S2X-S2E)/a(1,1), m 1 [pT-(1/pT). p2(i)] unde a(1,1)= m1 i =1 n cazul balansat avem: p(1)=.........=p(m)=p; pT=mp i p m 2 a(1,1)= x (i), pentru modelul cu efecte fixe; m1 i=1 i a(1,1)=p, pentru modelul cu efecte aleatoare;
Modelul cu efecte fixe este ilustrat de desenul:

Modelul cu efecte aleatoare este ilustrat de desenul:

135

Teorema 9.1 (fr demonstraie)

a) Pentru modelul cu efecte fixe, avem: 1 m M(S2X)= [ p(i)2x (i)]+ 2(E) m 1 i=1 M(S2E)= 2(E) b) Pentru modelul cu efecte aleatoare, avem: m 1 [pT-(1/pT). p2(i)] 2(x)+ 2(E) M(S2X)= m1 i =1 2 M(S E)= 2(E) Un indicator statistic asemntor cu coeficientul de corelaie liniar din seciunea 10.1 i cu raportul de corelaie neliniar din seciunea 10.3, este indicele de corelaie definit astfel: Ic= 1 SPAE / SPAT
Teorema 9.2

Indicele de corelaie Ic are proprietile: 1) 0Ic1 2) X, Y= independente => X, Y= necorelate(Ic=0) 3) X, Y= dependente funcional (Y=f(x)) dac i numai dac Ic=1.
Demonstraie:

1)Ic= 1 SPAE / SPAT = SPAX / SPAT 0. rezult 0Ic1.

Cum

SPAX SPAT

2)X, Y= independente => MY(i) nu depinde de X(i), deci sunt egale ntre ele adic MY(i)=MY (i=1,.....,m) aa c SPAX =0 ,deci Ic=0, adic X, Y=necorelate. 3)X, Y= dependente funcional (Y=f(x)) dac i numai dac lui X(i) i corespunde un singur Z(i) adic Y(i,j) sunt egale ntre ele pentru orice j=1,....., p deci Y(i,j)=MY(i) (j=1,......., p) aa c SPAX=SPAT ceeace are loc dac i numai dac Ic=1. Q.E.D.

136
Raportul Fisher FX=[SPAX/SPAE] : [(m-1)/(pT-m)] capt forma FX=[Ic2/(1-Ic2)] :[(m-1)/(pT-m)] , deci verificarea ipotezei HX: (1)=.......= =(m)= fa de alternativa X: (1)....... (m) se reformuleaz astfel : HX:c=0 fa de HX: c0, unde c este indicele de corelaie n populaie mprit n m subpopulaii crora li se aplic X(1),........., X(m). n plus AX=Ic2; AE=1-Ic2, proprietate pe care o are i coeficientul de corelaie liniar r i raportul de corelaie neliniar Rc. n cazul respingerii ipotezei HX: (1)=......= (m)= , se poate stabili n cazul balansat (p(1)=,........., p(m)) prima variant X(i) a lui X cu influen semnificativ asupra variaiei lui Y astfel: Aranjm mediile pe variante n ordine cresctoare : MY(i1),.........,MY(im) (i1, .........., im{1, ......, m}) i presupunem c MY(it) este media variantei martor X(1).(it{1, ......, m}). Fie (h,t)=MY(ih)-MY(it), (h=1,......., m;ht) Se calculeaz amplitudinea teoretic a diferenelor de medii: A=max-min=(S2E/p)1/2T, unde T este amplitudinea studentizat Tukey obinut din tabelele 7,8 ale Anexei, pentru numrul m al mediilor i numrul de grade de libertate ale erorii GLE. Fiecare diferen fa de martor (h,t); (h=1,......., m;ht), care depete pe A0.05 primete o stelu de semnificaie, iar dac depete pe A0.01 primete a doua stelu de semnificaie. Un test asemntor cu testul Tukey este testul Duncan, precum i testul diferenei limit: /2=(i)- (j)=(2S2E/p)1/2t/2; GLE
Exemplu X=protein digestiv (PD) n raia vacilor cu lapte ; Y=producia lunar de lapte (litri) ntr-o anumit lun a ciclului de lactaie . Lum m=3 variante ale factorului X: X1(1100g/zi) (doza-martor); X2(1200g/zi); X3(1300g/zi). Aceste variante le aplicm la cte p=4 repetiii ale factorului Y. Avem tabelul cu date:

Repet.Y Variante X X1 X2 X3

Y(i,j) 300;314;306;308 330;338;342;350 366;362;370;370

Mediile pe variante MY(1)=307 MY(2)=340 MY(3)=367

Media total MYT=338

Verificm ipoteza H: (1)2=(2)2=(3)2, fa de alternativa : H: (1)2 (2)2 (3)2,cu testul Cochran: SY(1)2=33.33; SY(2)2=69.33; SY(3)2=14.66; 69.33 =0.5910 Avem Q= 33.33 + 69.33 + 14.66 Din tabelele pentru m=3 variante X i p-1=3GL avem valorile critice Q0.05=0.8709; Q0.01=0.9423; Avem Q< Q0.05, deci se accept ipoteza H: (1)2= (2)2= (3)2

137
Etape de calcul: a) SPA i GL:

SPAT= [Y(i,j)-MYT]2 =7576 cu GLT=mp-1=11GL


i =1 j =1 m

SPAX=p [MY(i,j)-MYT]2=7224 cu GLX=m-1=2GL SPAE=SPAT-SPAX=352 cu GLE=11-2=9GL b) S2: SPAX 7576 SPAE 352 S2X= = = 3612 ;S2E= = = 39.11 2 9 GLX GLE c) F: 3612 FX= S2X /S2E = = 92.35 cu (2;9) GL 39.11 Din tabelele Fisher 4,5,6 din Anex, gsim valorile critice pentru (2;9) GL : F0.05=4.26; F0.01=8.02; F0.001=16.39. Cum FX> F0.001 se accept ipoteza adic (1), (2), (3), difer foarte semnificativ ntre ele adic influena variaiei factorului X asupra variaiei factorului Y este foarte semnificativ aa c F=92.35***.
Tabelul de analiz a variaiei sintetic este:
Surs de variaie X E T Variaii Ptratice(SPA) 7224 336 7560 Grade de libertate(GL) 2 9 11 Variante(S2) 3612 39.11 Rapoarte Fisher(F) 92.35*** i =1

Indicele de corelaie este Ic = SPAX / SPAT =0.977*** i este foarte semnificativ.


Testul Tukey

Calculm triunghiul diferenelor de medii pe variantele lui X:

Diferene de medii 367 340 307 60** 33** -

307

340 27** -

367 -

Din tabelele Tukey 7,8 din Anex,pentru m=3 medii i GLE=9 gsim T0.05=3.95; T0.01=5.43 aa c avem amplitudinile ateptate: A0.05= 39.11 / 4 X3.95=12.35

138
A0.01= 39.11 / 4 X5.43=16.98 Cele trei diferene din tabelul precedent depesc pe A0.01, deci sunt distinct semnificative adic (1), (2), (3), difer distinct semnificativ dau cte dou. Aportul variaiei lui X la variaia lui Y egal cu 100%,este AX=IC2=95.5%. Aportul variaiei erorii la variaia lui Y este AE=1-AX=4.5% Calculele precedente privitoare la analiza varianei monofactorial balansat n populaii omogene, pot fi fcute n EXCEL astfel : Depunem n foaia de calculNr.1 n blocul de celule A1:C5 astfel : A B C 1 X1 X2 X3 2 300 330 366 3 314 338 362 4 306 342 370 5 308 350 370 Deschidem fereastra TOOLS n care activm opiunea DATA ANALYSIS . Aici activm opiunea ANOVA:SINGLE FACTOR n care declarm blocul de celule cu date A1:C5 Rezultatele se gsesc fie n foaia de calcul Nr. 2 ,fie tot n foaia de calcul Nr.1, prin declararea ca celule de rezultate , a altor celule dect cele din blocul de date A1:C5 O prezentare elegant a calculelor precedente se afl n foaia de calcul AV1.XLS din Anex.
9.2 ANALIZA VARIANEI BIFACTORIAL COMPLET NEBALANSAT N POPULAII OMOGENE

n populaia statistic lum ca obiect de studiu un caracter msurabil Z fa de care exemplarele populaiei au media . Fie alte dou caractere X,Y asociate cu exemplarele populaiei, caracterul X avnd m variante (doze, nivele, tratamente) notate X(1),...,X(m), iar caracterul Y avnd n variante (doze, nivele, tratamente) notate Y(1),...,Y(n). Caracterele X, Y se numesc factori i constituie criterii de clasificare dubl a populaiei n mn subpopulaii (straturi) ce corespund perechilor de variante (X(i), Y(j)), mediile pe subpopulaii relativ la caracterul Z fiind (i,j) (i=1,........, m; j=1,........,n). Diferenele (X,Y)(i,j) = (i,j)- se numesc efecte principale ale perechii de factori
(X,Y) n subpopulaii.

Avem

i =1 j =1

(X,Y)(i,j)=0

Subpopulaiile se presupun normale cu mediile (i,j) i aceeai varian 2(E) n raport cu caracterul Z. Extragem n mod ntmpltor din subpopulaii mn sondaje (probe, eantioane) de volume p(i,j) (i=1,......., m; j=1,.......n). Datele reletiv la caracterul Z, din aceste sondaje le numim repetiii, (replicate) i le notm cu Z(i,j,k) (i=1,........., m; j=1,......., n; k=1,.......,p(i,j)). Forma general a modelului liniar este: Z(i,j,k)= +X(i)+ Y(j)+X.Y(i,j)+e(i,j,k) unde e(i,j,k) sunt variabile aleatoare normale, independente dou cte dou cu media 0 i variana 2(E).

139
n. Reunim toate subpopulaiile care corespund variantei X(i) fixate pentru orice j=1,....., Exemplarele din aceast reuniune vor avea fa de caracterul Z media: X(i)=(1/n). (i,j), iar efectul principal al variantei X(i) este :
j =1 n

X(i)=X(i)- .

Avem

i =1

X(i)=0.

n mod analog se reunesc subpopulaiile ce corespund variantei Y(j) fixate pentru orice i=1,......., m. Exemplarele din aceast reuniune au fa de caracterul Z, media Y(j)=(1/m). (i,j), iar efectul principal al variantei Y(j) este: Y(j)= Y(j)-.
i =1 m

Avem

j =1

Y(j)=0.

Cantitatea: X.Y(i,j)= (i,j)-X(i)-Y(j)+ se numete efectul principal al interaciunii variantei X(i) cu varianta Y(j). Dup modul de alegere al subpopulaiilor dup X i Y, avem trei tipuri de modele : a) Model cu efecte fixe n acest caz ambii factori X, Y definesc efecte constante X(i), Y(j), X.Y(i,j). Ipotezele care se verific sunt: 1) HX: X(1)=...........=X(m)= fa de alternativa HX: X(1)...........X(m) sau sub alt form: HX: X(i)=0 fa de alternativa HX: X(i) 0. 2) HY: Y(1)=...........=Y(n)= fa de alternativa HY:Y(1)...........Y(n) sau sub alt form: HY: Y(j)=0 fa de alternativa: HY: Y(j) 0. 3) HX.Y: (i,j)= X(i)+ Y(j) fa de alternativa HX.Y: (i,j) X(i)+ Y(j) sau sub alt form: HX.Y: X.Y(i,j)=0 fa de alternativa: HX.Y: X.Y(i,j) 0.
b)
2

Model cu efecte aleatoare :

n acest caz ambii factori definesc efecte aleatoare : X(i) sunt variabile aleatoare N(0; (X)), Y(j) sunt variabile aleatoare N(0; 2(Y)), iar X.Y(i,j) sunt variabile aleatoare N(0; 2(X.Y)). Ipotezele care se verific sunt: 1) HX: 2(X)=0 fa de HX: 2(X) 0 2) HY: 2(Y)=0 fa de HY: 2(Y) 0 3) HX.Y: 2(X.Y)=0 fa de HX.Y: 2(X.Y) 0.
c) Modelul mixt: n acest caz unul din factori, de exemplu X, este cu efecte fixe, iar cel de-al doilea Y este cu efecte aleatoare. Efectele X(i) sunt constante i ipoteza care se verific este: 1) HX: X(i)=0 fa de HX: X(i) 0 Efectele Y(j) sunt variabile aleatoare de tip N(0; 2(Y)) i ipoteza care se verific este :

140
2) HY: 2(Y)=0 fa de HY: 2(Y) 0 Efectele X.Y(i,j) sunt variabile aleatoare de tip N(0; 2(X.Y)) i ipoteza care se verific este: 3) HX.Y: 2(X.Y)=0 fa de HXY: 2(X.Y) 0. n cazul celor trei modele, datele mpreun cu calculele de sume si medii ale repetiiilor pe variante (X,Y), X, Y i pe total se trec n tabelul care urmeaz:
Repet.Z Variante (X,Y) Z(i,j,p(i,j)) Medii pe Variante (X,Y) Medii pe Variante X Medii pe Variante Y Media Total

(X(1),Y(1)) . (X(1),Y(n)) . (X(m),Y(1)) .. (X(m),Y(n))


Notaii:

Z(1,1,1),,Z(1,1,p(1,1)) . Z(1,n,1),,Z(1,n,p(1,n)) .. Z(m,1,1),,Z(m,1,p(m,1)) .. Z(m,n,1),,Z(m,n,p(m,n))

MZ(1,1) . MZ(1,n) . MZ(m,1) .. MZ(m,n)

MZX(1) . MZX(m)

MZY(1) MZY(n) MZT

q=numrul de celule (i, j) nevide; pT= p(i,j); px(i)=


i =1 j =1 m n

j =1

p(i,j); pY(j)=

i =1

p(i,j)

CALCULE: a)SPA i GL:

SPAT= de libertate;
m

p (i , j )

i =1 j =1 k =1

[Z(i,j,k)-MZT] =
2

p (i , j )

i =1 j =1 k =1

Z2(i,j,k)-S2T/pT

cu

GLT=pT-1 grade

SPA(X,Y)= p(i,j)[MZ(i,j)-MZT]2= S2(i,j)/p(i,j)-S2T/pT cu GL(X,Y)=q-1


i =1 j =1 i =1 j =1

grade de libertate; SPAX= px(i)[MZX(i)-MZT]2= S2X(i)/px(i)-S2T/pT cu GLX=m-1 grade de libertate;


i =1 n i =1 n m m

SPAY= PY(j)[MZY(j)-MZT]2= S2Y(j)/pY(j)-S2T/pT cu GLY=n-1 grade de


j =1 j =1

libertate;

141
SPAX.Y= p(i,j)[MZ(i,j)-MZx(i)-MZY(j)+MZT]2= S2(i,j)/p(i,j)i =1 j =1 n i =1 j =1 m n m n

i =1

S2X(i)/px(i)- S2Y(j)/pY(j)+S2T/pT=SPA(X,Y)-SPAX-SPAY cu GLX.Y=q-m-n+1=GL(X,Y)j =1

GLX-GLY grade de libertate; SPAE=


m n p (i , j ) i =1 j =1 k =1

[Z(i,j,k)-MZ(i,j)]2=

p (i , j )

i =1 j =1 k =1

Z2(i,j,k)- S2(i,j)/p(i,j)=SPATi =1 j =1

SPA(X,Y) cu GLE=pt-q=GLT-GL(X,Y) grade de libertate.


b)S2 :

S2X=SPAX/(m-1); S2Y=SPAY/(n-1); S2X.Y=SPAXY/(q-m-n+1); S2E=SPAE/(pT-q) FX=S2X/S2E>1 cu 2 2 FY=S Y/S E>1 cu 2 2 FX.Y=S X.Y/S E>1 cu [m-1;pT-q]GL [n-1;pT-q]GL [q-m-n+1;pT-q]GL

c)F:

Rezultatele de la punctele a)-c) se trec n tabelul sintetic de analiz a varianei: Sursa de SPA GL S2 F variaie X SPAX m-1 S2X FX 2 Y SPAY n-1 SY FY X.Y SPAX.Y q-m-n+1 S2X.Y FX.Y E SPAE pT-q S2E T SPAT pT-1 Rapoartele Fisher FX, FY, FX.Y se compar cu valorile critice F0.05; F0.01; F0.001 extrase din tabelele 4,5,6 din Anex, pentru perechile de grade de libertate corespunztoare i se accept sau se resping ipotezele formulate mai sus. Printr-un calcul asemntor cu cel din teorema 9.1 obinem relaiile: (1) (2) (3) (4) unde: M(S2X)=a(1,1).2()+a(1,2).2()+a(1,3).2()+2(E) M(S2Y)=a(2,1).2()+a(2,2).2()+a(2,3).2()+2(E) M(S2X.Y)=a(3,1).2()+a(3,2).2()+a(3,3).2(.)+2(E) M(S2E)= 2(E)

1 1 m 2 [ pT ( p X(i))] a(1,1)= m 1 pT i =1 m n 1 1 1 n a(1,2)= [ ( p2(i,j))- ( p2Y(j))] pT j =1 m 1 i =1 p X (i ) j =1 m n 1 1 1 m n a(1,3)= [ ( p2(i,j))- ( p2(i,j))] pT i=1 j=1 m 1 i =1 p X (i ) j =1

142
m 1 n 1 1 m a(2,1)= [ ( p2(i,j))- ( p2X(j))] pT i =1 n 1 j =1 pY ( j ) i =1

1 1 n a(2,2)= [ pT ( p2Y(i))] n 1 pT j =1
m 1 n 1 1 m n a(2,3)= [ ( p2(i,j))- ( p2(i,j))] pT i=1 j=1 n 1 j =1 pY ( j ) i =1

a(3,1)= -

a(3,2)= -

m n 1 1 a(3,3)= [ pT ( i =1 p X ( i ) j =1 q m n +1

m 1 a (1, 2) q m n +1

n 1 a (2, 1) q m n +1

p2(i,j))-

j =1

m 1 1 m n ( p2(i,j))+ ( p2X(j))] pT i =1 j =1 pY ( j ) i =1

Cu aceti coeficieni alctuim tabelul componentelor de varian: M(S2) M(S2X) M(S2Y) M(S2X.Y) M(S2E) 2(X) a(1,1) a(2,1) a(3,1) 0 2(Y) a(1,2) a(2,2) a(3,2) 0 2(X.Y) a(1,3) a(2,3) a(3,3) 0 2(E) 1 1 1 1

Avem estimatorii: *2(E)=S2E

*2

*2 ( X ) S 2 X S 2E 2 1 2 = *2 (Y ) = A S Y S E * 2 S 2 S 2 E X .Y ( X Y ) X .Y
a (1,1) a (1,2) a (1,3) A= a (2,1) a (2,2) a (2,3) a (3,1) a (3,2) a (3,3)

unde

n cazul balansat avem:

p(i,j)=p; pT=mnp; pX(i)=np; pY(j)=mp; q=mn

143
Tabelul sintetic de analiza varianei are forma: Sursa de SPA GL variaie X SPAX m-1 Y SPAY n-1 X.Y SPAX.Y (m-1)(n-1) E SPAE mn(p-1) T SPAT Mnp-1 S2 S2X S2Y S2X.Y S2 E F FX FY FX.Y -

Tabelul cu componentele de varian are forma particular: M(S2) 2(Y) 2(X.Y) 2(E) 2(X) 2 M(S X) np 0 p 1 M(S2Y) 0 mp p 1 M(S2X.Y) 0 0 p 1 2 M(S E) 0 0 0 1 Un caz particular al analizei varianei complet balansat este cel n care p=1, deci avem cte o singur repetiie ataat fiecrei perechi de variante (X(i), Y(j)). n acest caz avem T=(X,Y), iar E are GLE=0 grade de libertate, deci vom lua E=X.Y, deci SPAE=SPA(XY)-SPAX-SPAY i GLE=GL(X,Y)-GLX-GLY. Tabelul sintetic de analiza varianei are forma: Sursa de SPA GL S2 F Variaie X SPAX m-1 S2X FX 2 Y SPAY n-1 SY FY 2 E SPAE (m-1)(n-1) SE T SPAT mn-1 Tabelul cu componentele de varian are forma: M(S2) 2(Y) 2(E) 2(X) M(S2X) n 0 1 2 M(S Y) 0 m 1 M(S2E) 0 0 1 Exemplu Fie X=proteina digestibil n raia porcilor la ngrat i Y= unitile nutritive n raia porcilor la ngrat i Z=sporul lunar n greutate (kg)al porcilor la ngrat. Lum m=3 variante X=X1(250g/zi); X2(275g/zi); X3(300g/zi) i n=2 variante Y=Y1(2.5UN) i Y2(3UN).Pentru fiecare combinaie de variante (X,Y) lum cte p=2 repetiii Z. Avem tabelul cu date :
Repetiii Z Variante (X,Y) Z(i,j,p(i,j)) Medii pe Variante (X,Y) Medii pe variante X Medii pe variante Y Media Total

(X1, Y1) (X1, Y2)

14; 14.2 15.2; 15.6

MZ(1, 1)=14.1 MZ(1, 2)=15.4

MZX(1)=14.75

MZY(1)=15.17

144
(X2, Y1) (X2, Y2) (X3, Y1) (X3, Y2) 15; 15.4 16; 16.2 16.1; 16.3 16.9; 17.1 MZ(2, 1)=15.2 MZ(2, 2)=16.1 MZ(3, 1)=16.2 MZX(3)=16.60 MZ(3, 2)=17 MZY(2)=16.17 MZX(2)=15.65 MZT=15.67

141
Etape de calcul : a)SPA i GL:

SPAT = [ Z (i, j , k ) MZ T ] 2 = 10.2268 cu GL T =mnp-1=11GL


i =1 j =1 k =1
m

SPA( X ,Y ) = p [ MZ (i, j ) MZ T ] 2 = 9.9868


i =1 j =1

cuGL ( X ,Y ) =mn-1=5GL cu GL X =m-1=2GL

SPAX = np [ MZ X (i ) MZ T ] = 6.8468
SPAY = mp [ MZY ( j ) MZT = 1.9200
j =1

i =1 n

cu GL Y =n-1=1GL

SPA X Y = SPA( X ,Y ) SPA X SPAY = 1.2200 cu


GL X Y = GL( X ,Y ) GL X GLY = 2GL

SPAE = SPAT SPA( X ,Y ) = 0.2400 cu GL E = GLT GL( X ,Y ) = 6GL


b) S2 :
2 = SX 2 SX Y

SPA X = 3.4234; GL X SPA X Y = = 0.61; GL X Y

SPAY = 1.9200 GLY SPAE 2 = = 0.04 SE GL E S Y2 =

c)F:
2 SX FX = 2 = 85.585 cu (2;6) GL SE

2 SY FY = 2 = 48 cu (1;6) GL SE

FX Y
F0.01

2 SX = 2Y = 15.25 cu (2;6) GL SE

Din tabelele Fisher 4,5,6 din Anex ,gsim valorile critice pentru (2;6) GL : F0.05 = 5.14 ; = 10.92 ; F0.01 = 27 ;

142
Cum FX > F0.001 se accept ipoteza H adic X (1), X (2), X (3) difer foarte semnificativ ntre ele adic influena variaiei lui X asupra variaiei lui Z este foarte semnificativ deci Fx = 85.585 * * * . Cum F0.01 < FX Y < F0.001 se accept ipoteza H adic influena variaiei interaciunii X Y asupra variaiei lui Z este distinct semnificativ deci FX Y = 15.25 * * . Din tabelele Fisher 4,5,6 din Anex, gsim valorile critice pentru (1,6) GL : F0.05=5.99, F0.01 = 13.74; F0.001 = 35.51.

Cum FY > F0.001 se accept ipoteza H deci Y (1), Y (2) difer foarte semnificativ ntre ele adic influena variaiei lui Y asupra variaiei lui Z este foarte semnificativ deci FY = 48 * * * .

Tabelul sintetic de analiza varianei este : Sursa de Variaii Grade de Variaie ptratice libertate (GL) (SPA) X 6.8468 2 Y 1.9200 1 1.2200 2 X Y E 0.2400 6 T 10.2268 11 Indicii de corelaie sunt:

Variane (S 2 )

Rapoarte Fisher (F)


85.585*** 48*** 15.25** -

3.4234 1.9200 0.6100 0.400 -

Ic ( X ) = I c ( X .Y ) =

SPAX SPAY = 0.818*** ; I c (Y ) = = 0.433*** ; SPAT SPAT

SPAX Y = 0.345**. SPAT

Aporturile variaiilor lui X,Y, X Y la variaia lui Z,socotit egal cu 100 %, sunt: SPAX SPAY AX = = 66.9%; AY = = 18.8%; AX Y = 11.9%. SPAT SPAT Aportul variaiei erorii la variaia lui Z este: AE = 1 AX AY AX Y = 2.4%.

Testele Cochran i Tukey se efectueaz ca n seciunea 9.1. Calculele precedente privitoare la analiza varianei bifactorial complet balansat n populaii omogene cu p repetiii n celul, pot fi fcute n EXCEL astfel : Depunem n foaia de calcul Nr.1 datele n blocul de celule A1:D5 asfel :

143
1 2 3 4 5 A Y1 Y2 B X1 14 14.2 15.2 15.6 C X2 15 15.4 16 16.2 D X3 16.1 16.3 16.9 17.1

Deschidem fereastra TOOLS n care activm opiunea DATA ANALYSIS Aici activm opiunea ANOVA:TWO-FACTOR WITH REPLICATION n care declarm blocul de celule cu date A1:D5 i numrul p=2 de repetiii (replicate). Rezultatele se gsesc fie n foaia de calcul Nr. 2 ,fie tot n foaia de calcul Nr.1, prin declararea ca celule de rezultate , a altor celule dect cele din blocul de date A1:D5

9.3 ANALIZA VARIANEI BIFACTORIAL IERARHIC NEBALANSAT M POPULAII OMOGENE


n populaia statistic lum ca obiect de studiu un caracter msurabil Z fa de care exemplarele populaiei au media . Fie alte dou caractere X, Y asociate cu exemplarele populaiei n mod ierarhizat. Caracterul X are m variante (doze, nivele, tratamente) notate X(1),.,X(m) i n cadrul fiecrei variante X(i), caracterul Y are subvariabilele Y(i,1),..,Y(i,n(i)). Caracterele X, Y se numesc factori ierarhizai i constituie criterii de clasificare succesiv, mai nti n m subpopulaii care corespund variantelor X(1),,X(m), fiecare din aceste subpopulaii se mparte la rndul ei n subsubpopulaii care corespund subvariantelor Y(i,j). Mediile pe subpopulaii relativ la caracterul Z sunt (1),., (m) iar mediile pe subsubpopulaii relativ la Z sunt: (1,1),, (1,n(1)) (m,1),, (m,n(m)).

Efectele principale ale factorului X sunt X (i ) = (i ) , iar efectele principale ale factorului Y sunt Y (i, j ) = (i, j ) (i ) .
Avem

X (i) = 0;
i =1


i =1 j =1

m n( m)

(i, j ) = 0.

Subpopulaiile dup X se presupun normale cu mediile (i) i aceeai varian 2 ( E ) iar subsubpopulaiile dup Y n cadrul lui X se presupun normale cu mediile (i,j) i aceeai varian 2 (E) . Extragem n mod ntmpltor din subpopulaii m n(i ) sondaje (probe, eantioane) de
m i =1

volume p(i,j) ; (i=1,.,m),(j=1,.,n(m)). Datele relative la Z din aceste sondaje, le numim repetiii (replicate) i le notm cu Z(i,j,k) (i=1,..,m; j=1,..,n(m)); k=1,..,p(m,n(m))).

144
Forma general a modelului liniar ierarhizat este : Z (i, j , k ) = + X (i ) + Y (i, j ) + e(i, j , k ) unde e(i,j,k) sunt variabile aleatoare normale cu media 0 i variaia 2 ( E ) . Ca i la analiza variaiei bifactorial complet din seciunea 9.1.2, modelul poate fi cu efecte fixe, cu efecte aleatoare sau mixt dar n cazul ierarhic lipsete interaciunea X Y . a) n cazul modelului cu efecte fixe verificm ipotezele: H X : (1) = .......... = (m) = fa de H X : (1) .......... ( m) ; 1) 2) b) 1) 2) H Y : (i, j ) = (i ) fa de H Y : (i, j ) (i ) . n cazul modelului cu efecte aleatoare verificm ipotezele: H X : 2 ( X ) = 0 fa de H X : 2 ( X ) 0;

H Y : 2 (Y ) = 0 fa de

H Y : 2 ( Y ) 0.

n toate cazurile, datele mpreun cu calculele de sume i medii de repetiii pe variante, subvariante i total, se trec n urmtorul tabel:

Repetiii Z

Z(i,j,p(i,j))

Medii pe Subvar.Y

X Y (X(1), Y(1,1) . . . . (X(1), Y(1,n(1)) . . . (X(m), Y(m,1)) . . . . . X(m), Y(m,n(m))


Variante

Medii pe Var. X

Media Total

Z(1,1,1),,Z(1,1,p(1,1))

Z(1,n(1),1),,Z(1,n(1),p(1,n(1))) . . . Z(m,1,1),..,Z(m,1,p(m,1)) . . . . . Z(m,n(m),1),,Z(m,n(m),p(m,n(m)))

MZY (1,1) . . . MZY (1, n(1))

MZ X (1)

. . .
MZY (m,1) . . . . . MZY (m, n(m))

. . .

MZT

MZ X (m)

Notaii:

pT = p (i, j ); p x (i ) = p(i, j ); nT = n(i ).


i =1 j =1
j =1

m n (i )

n (i )

i =1

145 Calcule:
a)SPA i GL:
m n (i ) p (i , j ) m n (i ) p (i , j )

SPAT =
m

i =1 j =1 k =1

[Z (i, j, k ) MZ

] =
2

i =1 j =1 k =1

S 2T Z (i, j , k ) cu pT
2

GLT = pT 1 grade de libertate;

S 2 X (i ) S 2T SPAX = p X (i )[ MZ X (i ) MZT ] = cu GL X = m 1 grade pT i =1 i =1 p X (i )


2 m

de libertate;

SPAY p(i, j )[ MZ Y (i, j ) MZ X (i )] 2 =


i =1 j =1 i =1

m n (i )

m n(i )

S 2 Y (i, j ) m S 2 X (i ) cu p ( i , j ) j =1 i =1 p X (i )
S 2 Y (i, j ) Z (i, j , k ) i =1 j =1 p (i , j )
2 m n(i )

GLY = nT m grade de libertate;

SPAE =

m n(i ) p (i , j )

i =1 j =1 k =1

[Z (i, j, k ) MZ

(i, j )] =
2

m n (i ) p (i , j )

i =1 j =1 k =1

= SPAT SPAX SPAY cu GLE = pT nT = GLT GLX GLY

S2X

b)S2 : SPAX 2 ; S Y = m 1 c)F:


2

SPAX SPAE 2 ; S E = pT nT nT m;
[nT m; pT m]GL .
F
FX FY

S X S 2Y cu FX = 2 > 1 cu [m 1; nT m]GL; FY = 2 S Y S E >1 Datele de la punctele a)-c) se trec n tabelul:

Sursa de Variaie X Y
E T

SPA
SPAX SPAY

GL
m-1

S2
S2X S 2Y S 2E
-

SPAE SPAT

nT m pT nT pT 1

Rapoartele Fisher FX , FY se compar cu valorile critice F0.05 ; F0.01 ; F0.001 extrase din tabelele 4,5,6 din Anex, pentru perechile de grade de libertate corespunztoare i se accept sau se resping ipotezele formulate mai sus. Printr-un calcul asemntor cu cel din teorema 9.1 obinem relaiile: M ( S 2 X ) = a (1,1) 2 ( X ) + a (1,2) 2 ( Y ) + 2 ( E ) 1)

146
2) 3) unde:

M ( S 2 X ) = a (2, 2) 2 (Y ) + 2 ( E )

M (S 2 X ) = 2 ( E )

1 1 m 2 [ pT ( p X (i ))]; a (1,1) = m 1 pT i =1 m 1 1 n (i ) 2 1 m n (i ) 2 [ ( p (i, j )) ( p (i, j )]; a (1, 2) = m 1 i =1 p X (i ) j =1 pT i =1 j =1


m 1 1 n (i ) 2 [ pT ( p (i, j ))]. a (2, 2) = nT m i =1 p X (i ) j =1

Cu aceti coeficieni alctuim tabelul componentelor de varian:


M (S 2 ) M (S 2 X ) M (S 2 Y ) M (S 2 E )

2 ( X )
a(1,1) 0 0

2 ( Y )
a(1,2) a(2,2) 0

2 (E)
1 1 1

Avem estimatorii:

*2 ( E ) = S 2 E ;
*2 (Y ) =

2 SY2 S E a (2, 2) S 2 X a (1, 2) *2 (Y ) S 2 E *2 ( X ) = a (1,1)

n cazul balansat avem: p(i,j)=p; p X (i ) = np; n(i)=n; nT=mn; Tabelul cu componentele de varian are forma:

pT = mnp.

M (S 2 )
M (S 2 X ) M (S 2 Y ) M (S
2

2 ( X )
np 0 0

2 ( Y )
p p 0

2 (E)
1 1 1

147
Exemplu Fie X=genotip vier; Y=genotip scroaf i Z=greutatea la ftare a purceilor (Kg); lum m=2 variante X = X 1 (martor ), X 2 (elit) i lum n=2 subvariante Y pentru fiecare variant X: Y11 (martor), Y12 (elit) respectiv Y21 (martor), Y22 (elit). Pentru fiecare variant X i fiecare subvariant Y lum cte p=3 repetiii Z (purcei rezultai din ncruciarea variantelor paterne cu subvariantele materne). Avem tabelul cu date: Repetiii Z Variante
X Y

Z(i,j,k)
0.9; 1; 1.1 1; 1.1; 1.2 1.2; 1.2; 1.2 1.1; 1.4; 1.4

Medii pe Subvariante Y
MZ Y (1,1) = 1 MZ Y (1,2) = 1.1 MZ Y (2,1) = 1.2 MZ Y (2,2) = 1.3

Medii pe Variante X

Media Total

( X 1 , Y11 ) ( X 1 , Y12 ) ( X 2 , Y21 ) ( X 2 , Y22 )

MZ X (1) = 1.05
MZ X (2) = 1.25

MZ T = 1.15

Etape de calcul: a) SPA i GL:

SPAT = [ Z (i, j , k ) MZ T ] 2 = 0.25 cu GLT =mnp-1=11 GL;


i =1 j =1 k =1
m n

SPAY = p [ MZ Y (i, j ) MZ X (i )]2 = 0.03 cu GLY =m(n-1)=2 GL;


i =1 j =1

SPAX = np [ MZ X (i ) MZ T ] 2 = 0.12 cu GL X =m-1=1 GL;


i =1

SPAE = SPAT SPAX SPAY = 0.10 cu

GLE = GLT GLX GLY = 8GL .

b)S2 :
S2X = SPAX SPAY SPAE = 0.1200; S 2 Y = = 0.0150; S 2 E = = 0.0125. GL X GLY GLE

S2X = 8 cu (1;2) GL S 2Y S 2Y FY = 2 = 1.2 cu (2;8) GL S E Din tabelele Fisher 4,5,6 din Anex,pentru (1;2) GL avem valorile critice F0.05 = 18.51; F0.01 = 98.5; F0.001 = 998.5. Cum FX > F0.05 rezult c influena variaiei lui X asupra variaiei lui Z este nesemnificativ. FX =

c)F:

148
Din tabelele Fisher 4,5,6 din Anex,pentru (2;8) GL avem valorile critice F0.05 = 4.46; F0.01 = 8.65; F0.001 = 18.41. Cum FY > F0.05 rezult c influena variaiei lui Y asupra variaiei lui Z este nesemnificativ. Tabelul sintetic de analiz a varianei este:

Sursa de Variaie
X Y E T

Variaii ptratice (SPA) 0.12


0.03 0.10 0.25

Grade de Libertate (GL) 1


2 8 11

Variane

(S )
0.1200 0.0150 0.0125 -

Rap. Fisher (F) 8


1.2 -

Indicii de corelaie sunt:

Ic ( X ) =

SPAX = 0.693 ; SPAT

Ic ( y) =

SPAY = 0.500 . SPAX

Aporturile variaiei lui X, Y, E la variaia lui Z egal cu 100%,vor fi: SPAX SPAY SPAE AX = = 48%; AY = = 12%; A E = = 40%. SPAT SPAT SPAT

9.4 PLANURI EXPERIMENTALE N POPULAII NEOMOGENE 9.4.1 Planul blocurilor complete randomizate
n seciunile 9.1-9.3 s-a presupus c populaia este omogen n raport cu nsuirea cantitativ Y luat n studiu. Populaia omogen s-a mprit n mod aleator n m subpopulaii omogene asociate cu variantele X1,,Xm . Din fiecare subpopulaie s-au extras n mod aleator blocurile de repetiii Y1j,Ymj care corespund variantelor X1,,Xm . Din acest motiv aranjamentul folosit se numete plan complet randomizat. Dac populaia este neomogen, presupunem c se poate mpri n l subpopulaii, omogene n raport cu nsuirea Y luat n studiu. Materialul experimental va fi i el neomogen fiind constituit din l sondaje din cele l subpopulaii, fiecare sondaj fiind format din m repetiii corespunztor celor m variante ale unei alte nsuiri X asociat populaiei, notate X(1),...,X(m). Fiecare din cele l sondaje omogene de cte m repetiii, l vom numi bloc. Blocurile se numesc complete dac conin exact attea repetiii cte variante are factorul X i anume m.

149
Blocurile se numesc randomizate deoarece n fiecare bloc se aplic n mod aleator cte o variant a factorului X pentru fiecare repetiie a blocului. Exemple de blocuri naturale: sex, soi, ras, hibrid, exemplar, loc, perioad de timp, etc. Desemnm fiecare repetiie printr-o casu n care notm varianta aplicat X(i) i rspunsul repetiiei Y(i;j). Un mod posibil de randomizare se asigur prin permutri circulare ale variantelor de la un bloc la altul dup schema: B(1) B(2) X(1) X(2) X(m) Y(1;1) Y(2;1) Y(m;1) X(m) X(1) X(m-1) Y(m;2) Y(1;2) Y(m-1;2)

X(m-l+2) X(m-l+3) X(m-l+1) Y(m-l+2;l) Y(m-l+3;l) Y(m-l+1;l) Rspunsurile Y(i;j) se rearanjeaz n tabelul de mai jos pentru a fi prelucrat prin analiza varianei bifactorial complet (cu factori X,B) balansat, cu o repetiie n fiecare celul (p(i;j) = 1).

B(l)

Repetiii Y Variante (X,B) (X(1);B(1)) (X(1);B(l)) (X(m);B(1)) (X(m);B(l)) Etape de calcul: a)SPA i GL
m l

Yi j
Y(1;1) Y(1;l) Y(m;1) Y(m;l)

Medii pe variante X MYX(1) . . . . . MYX(m)

Medii pe blocuri B MYB(1) . . . . . MYB(l)

Media Total

MYT

SPA T = Y ( i;j) -MYT cu GLT = ml-1 grade de liberatate;


i=1 j=1

SPA X = l [MYX (i)-MYT ]2 cu GLX = m-1 grade de liberatate;


SPA B = m[MYB (j)-MYT ]2 cu GLB = l-1 grade de liberatate;
j=1

i=1 l

b)S2:

SPA E = SPA T -SPA X -SPA B cu GLE = GLT-GLX-GLB = (m-1)(l-1) grade de libertate;

150

S2 X =
c)F:

SPA X 2 SPA B 2 SPA E ; SB = ; SE = m-1 l -1 ( m-1)( l -1)


S2 X > 1 cu [m-1;(m-1)(l-1)]GL S2 E

FX =

FB =

Valorile precedente se trec n tabelul sintetic de analiz a varianei:

S2 B > 1 cu [l-1;(m-1)(l-1)]GL S2 E
Sursa de Variaie X
B E T

SPA
SPAX SPAB SPAE SPAT

GL m-1 l-1
(m-1)(l-1)

S2

F
FX FB -

S2 X S2 B
-

ml-1

S2 E

Valorile FX i FB se compar cu valorile critice F0.05, F0.01 i F0.001 extrase din tabelele 4,5,6 din Anex, pentru perechile de grade de libertate corespunztoare. Se accept sau se resping ipotezele: 1) H X : X (1) = = X ( m ) = fa de alternativa: 2) H B : B (1) = = B ( l ) = fa de alternativa: H B : B (1) B ( l )

H X : X (1) X ( m )

Exemplu X = proteina digestibil n raia porcilor (g/zi) Y = sporul lunar n greutate al porcilor (Kg) Populaia este neomogen n raport cu Y dar se poate mpri n l = 2 blocuri omogene: B1(Landrace) i B2(Marele Alb). Lum m = 3 variante X: X1(250 g/zi); X2(275 g/zi) i X3(300 g/zi) deci fiecare bloc va conine cte m = 3 repetiii (bloc complet). n fiecare bloc variabilele X se distribuie n mod aleator (bloc randomizat): X(1) X(2) X(3) B(1) 15 17 19 X(3) X(1) X(2) B(2) 20 14 18
Datele precedente se rearanjeaz pe variante (X,B) n tabelul:

151
Repetiii Y Variante (X,B) (X1;B1) (X1;B2) (X2;B1) (X2;B2) (X3;B1) (X3;B2) Etape de calcul: a)SPA i GL:
SPAT = 26.833 cu GLT = 5 GL; SPAX = 25.333 cu GLX = 2 GL; SPAB = 0.166 cu GLB = 1 GL; SPAE = SPAT-SPAX-SPAB = 1.334 cu GLE = GLT-GLX-GLB = 2 GL; b)S2:

Yi j
15 14 17 18 19 20

Medii pe Variante X
MYX(1) = 14.5 MYX(2) = 17.5 MYX(3) = 19.5

Medii pe Blocuri B
MYB(1) = 17 MYB(2) = 17.33

Media total

MYT = 17.165

S2 X =
c)F:

SPA X SPA B SPA E 2 2 = 12.667; SB = = 0.166; SE = = 0.667 GL X GL B GL E

FX =

S2 X = 19 cu (2 ; 2) GL S2 E

Din tabelele Fisher 4,5,6 din Anex,pentru (2 ; 2) GL avem valorile critice F0.05 = 19, F0.01 = 99 i F0.001 = 999. Cum F0.05 = FX < F0.01 influena variaiei lui X asupra variaiei lui Y este semnificativ, aadar FX = 19*. Cum FB < 1 influena variaiei blocului B asupra variaiei lui Y este nesemnificativ. Tabelul sintetic de analiz a variaiei este: Sursa de Variaii Grade de Variaie ptratice (SPA) libertate (GL) X 25.333 2 B 0.166 1 E 1.334 2 T 26.833 5 Indicii de corelaie sunt:

S2 1 S2 B E FB = 2 < 1 deci = 2 = 9.02 cu (2 ; 1) GL SE FB SB

Variane (S2) 12.667 0.166 0.667 -

Rapoarte Fisher (F) 19* 4.02 -

152

Ic ( X ) =

Aporturile variaiei lui X, B i E la variaia lui Y egal cu 100%,sunt:

SPA X SPA B = 0.972*; Ic ( B) = = 0.079 SPA T SPA T

AX =

SPA X SPA B = 94.4%; A B = = 0.6% SPA T SPA T

A E = 1-A X -A B = 5%
Calculele precedente privitoare la analiza varianei bifactorial complet balansat cu cte o repetiie n celul , pot fi fcute n EXCEL astfel : Depunem n foaia de calcul Nr.1 datele n blocul de celule A1:D3 astfel : 1 2 3 A B1 B2 B X1 15 14 C X2 17 18 D X3 19 20

Deschidem fereastra TOOLS n care activm opiunea DATA ANALYSIS. Aici activm opiunea ANOVA:TWO-FACTOR WITHOUT REPLICATION n care declarm blocul de celule cu date A1:D3 Rezultatele se gsesc fie n foaia de calcul Nr. 2 ,fie tot n foaia de calcul Nr.1 ,prin declararea ca celule de rezultate,a altor celule dect cele din blocul de date A1:D3

9.4.2

PLANUL PATRATELOR I DREPTUNGHIURILOR LATINE

Un ptrat latin l x l ( l 2) este un aranjament de l2 litere latine mari n form de ptrat cu laturile de l litere astfel c pe fiecare linie i pe fiecare coloan a ptratului fiecare liter apare odat i numai odat. Exemple Ptrat 2 x 2 Ptrat 3 x 3 Ptrat 4 x 4

A B

B A

A C B

B A C

C B A

A D C B

B A D C

C B A D

D C B A

Dou sau mai multe ptrate latine l x l se pot alipi dup linii sau dup coloane dnd natere la un dreptunghi latin. Exemple:

A B C D

B A D C

A B

B A

C D

D C

153
Planul n ptrate latine rezult din combinarea a dou planuri n blocuri complete randomizate, blocurile primului plan fiind liniile ptratelor iar blocurile celui de al doilea plan fiind coloanele ptratelor. Numrul l al repetiiilor fiecrui bloc-linie este egal cu numrul repetiiilor fiecrui bloccoloan i este divizor al numrului m al variantelor factorului X. Randomizarea variantelor factorului X, notate cu X(1), , X(m) puse n locul literelor latine, se asigur prin faptul c n fiecare ptrat latin fiecare variant a lui X se aplic odat i numai odat repetiiei din fiecare linie i din fiecare coloan. Desemnm fiecare repetiie printr-o csu n care notm varianta aplicat X(i) i rspunsul la ea Y(i;j;k). Randomizarea este asigurat prin permutri circulare ale variantelor de la o linie (coloan) la alta conform structurii ptratului latin. Rezultatele se valorific prin analiza varianei trifactorial complet (X,L,C) cu p(i;j;k) = 1 repetiii n celul. C(1) L(1) L(2) X(1) Y(1;1;1) X(m) Y(m;2;1) X(2) Y(2;l;1) C(2) X(2) Y(2;1;2) X(1) Y(1;2;2) X(3) Y(3;l;2) C(l) X(m) Y(m;1;l) X(m-1) Y(m-1;2;l) X(1) Y(1;l;l)

L(l)

Din ptratele sau dreptunghiurilor latine, datele se rearanjeaz pe variante (X,L,C) n tabelul: Y(i,j,k) Medii pe Medii pe Medii pe Media Repetiii Y variante linii coloane total X L C Variante (X,L,C) (X(1);L(1);C(1)) Y(1;1;1) MYX(1) MYL(1) MYC(1) . . . (X(m);L(1);C(1)) Y(m;1;1) MYT . . . . . . (X(m);L(l);C(1)) Y(m;l;1) . . . MYX(m) MYL(l) MYC(l) (X(m); L(l);C(l)) Y(m;l;l)

Etape de calcul: a)SPA i GL:


m l l i=1 j=1 k=1 2

SPA T = Y ( i;j;k ) -MYT cu GLT = ml-1 grade de liberatate;

154
SPA X = l [MYX (i)-MYT ]2 cu GLX = m-1 grade de liberatate;
i=1
l

SPA L = m [MYL (j)-MYT ]2 cu GLL = l-1 grade de liberatate;


j=1

SPA C = m [MYC (k)-MYT ]2 cu GLC = l-1 grade de liberatate;


k=1

SPA E = SPA T -SPA X -SPA L -SPA C cu GLE = GLT-GLX-GLL-GLC = = (l-1)(m-2) grade de libertate;
b)S2:

S2 X =
c)F:

SPA X 2 SPA L 2 SPA C 2 SPA E ; SL = ; SC = ; SE = m-1 l -1 l -1 ( l -1)( m-2 )

FX = FL = FC =

S2 X > 1 cu [m-1;(l-1)(m(l+1)-2)]GL S2 E S2 L > 1 cu [l-1;(l-1)(m(l+1)-2)]GL S2 E

2 SC > 1 cu [l-1;(l-1)(m(l+1)-2)]GL S2 E Mrimile precedente se trec n tabelul sintetic de analiz a varianei:

Sursa de variaie X

SPA

GL m-1 l-1 l-1

S2

SPAX SPAL SPAC SPAE SPAT

L C E T

S2 X

FX FL FC -

(l1)[m( l1)-2]
ml2-1

S2 L 2 SC S2 E

Valorile FX, FL i FC se compar cu valorile critice F0.05, F0.01 i F0.001 extrase din tabelele 4,5,6 din Anex, pentru perechile de grade de libertate corespunztoare. Se accept sau se resping ipotezele: 1) H X : X (1) = = X ( m ) = fa de alternativa H X : X (1) X ( m )
2) H L : L (1) = = L ( l ) = fa de alternativa H L : L (1) L ( l )
3) H C : C (1) = = C ( l ) = fa de alternativa H C : C (1) C ( l )

155
n compararea a dou planuri experimentale se folosete eficiena relativ. Fisher: S2 S2 E 2 GL E 2 + 1 E GL E1 + 1 e (%) = : 1 GL E2 + 3 GL E1 + 3

2 unde S2 E1 i SE 2 sunt varianele erorilor celor dou planuri experimentale iar GL E1 i GL E 2 sunt gradele de libertate ale acestora.

Exemplu X = proteina digestibil n raia porcilor la ngrat (g/zi) Y = sporul lunar n greutate al porcilor (Kg) Populaia este neomogen n raport cu Y dar se poate mpri n l = 2 blocuri-linie: L1(Landrace) i L2(Marele Alb) i n l = 2 blocuri-coloan: C1(vrst 6 luni) i C2(vrst 7 luni). Lum m = 4 variante X: X1(250 g/zi); X2(270 g/zi); X3(290 g/zi) i X4(310 g/zi). Datele se trec n dou ptrate latine care prin alipire dup linii/coloane, constituie un dreptunghi latin:
L1 L2 C1 X1 10 X2 12 C2 X2 12 X1 12 L1 L2 C1 X3 13 X4 15 C2 X4 14 X3 16

Datele precedente se rearanjeaz pe variante (X,L,C) n tabelul:

Repetiii Z Variante (X,L,C) (X1;L1;C1) (X1;L2;C2) (X2;L1;C2) (X2;L2;C1) (X3;L1;C1) (X3;L2;C2) (X4;L1;C2) (X4;L2;C1) Etape de calcul:

Z1

Medii pe variante X
MYX(1) =11 MYX(2) =12 MYX(3) =14.5 MYX(4) = 14.5

Medii pe linii L

Medii pe coloane C

Media Total

10 12 12 12 13 16 14 15

MYL(1) = = 12.25 MYL(2) = = 13.75

MYC(1) = = 12.5 MYC(2) = = 13.5

MYT = 13

a)SPA i GL: SPAT = 26 cu GLT = 7 GL; SPAX = 19 cu GLX = 3 GL; SPAL = 4.5 cu GLL = 16 GL; SPAC = 2 cu GLC = 1 GL;

156
SPAE = SPAT-SPAX-SPAL-SPAC = 0.5 cu GLE = GLT-GLX-GLL-GLC = 2 GL;

b)S2 :
S2 X =

SPA C SPA X SPA L SPA E 2 2 = 6.33; SL = = 4.5;SC = = 2; S2 = 0.25 E = GL X GL L GLC GL E

c)F:

S2 FX = X = 25.32 cu (3 ; 2) GL S2 E FL = S2 L = 18 cu (1 ; 2) GL 2 SE
2 SC = 8 cu (1 ; 2) GL S2 E

FC =

Din tabelele Fisher 4,5,6 din Anex,pentru (3 ; 2) GL avem valorile critice F0.05 = 19.6, F0.01 = 99.17 i F0.001 = 999.20. Cum F0.05 = FX < F0.01 influena variaiei lui X asupra variaiei lui Y este semnificativ, aadar FX = 25.32*. Din tabelele Fisher 4,5,6 din Anex,pentru (1 ; 2) GL avem valorile critice F0.05 = 18.51,F0.01 = 98.50 i F0.001 = 998.50 Cum FL, FC < F0.05 influena variaiei lui L i C asupra variaiei lui Y este nesemnificativ. Tabelul sintetic de analiz a varianei este:

Variaii Grade de Variaie Rapoarte Ptratice Libertate Fisher (SPA) (F) (GL) (S2) X 19 3 6.33 25.32* L 4.5 1 4.5 18 C 2 1 2 8 E 0.5 2 0.25 T 26 7 Indicii de corelaie sunt: SPA C SPA X SPA L Ic ( X ) = = 0.855*; Ic ( L) = = 0.416; Ic (C ) = = 0.277 SPA T SPA T SPA T Aporturile variaiei lui X, L, C i E la variaia lui Y egal cu 100%,sunt: SPA X SPA L = 73.1%; A L = = 17.3% AX = SPA T SPA T

Sursa de variaie

AC =

SPA C = 7.7%; A E = 1-A X -A L -A C = 1.9% SPA T

157
n exemplul rezolvat n seciunea 9.3.1 (planul blocurilor complete randomizate) am gsit S = 0.667 cu n1 = 2 GL iar n exemplul de mai sus (planul ptratelor latine) am gsit
2 E1

S2 E 2 = 0.25 cu n2 = 2 GL deci:
e (%) = S2 E 2 GL E 2 + 1

( GL

E2

) : S ( GL + 1) = 2.4 = 240% + 3) ( GL + 3)
2 E1 E1 E1

Aadar planul ptratelor latine este de 2.4 ori mai eficient ca planul blocurilor complete randomizate.

9.5 Rezumat n acest capitol se prezint analiza varianei mono i bifactorial (complet i ierarhic) nebalansat n populaii omogene. Se prezint i planurile experimentale(blocuri complete randomizate,patrate i dreptunghiuri latine) n populaii neomogene care se valorific prin analiza varianei polifactorial balansat . 9.6 ntrebri
1. 2. 3. 4. Care este ideea fundamental a analizei varianei? Prin ce se deosebete analiza varianei bifactorial complet ce cea ierarhic ? Cum se asigur randomizarea n planurile experimentale ? Ce este eficiena relativ Fisher a dou planuri experimentale ?

9.7 Bibliografie
1.D.Ene , M.Drghici, I.N. Alecu Statistic aplicat n agricultur Ed.Ceres,2003 2.M.Iosifescu i col. Mic enciclopedie de statistic Ed.tiinif.i Enciclop,,1985 3. Anuarul statistic al Romniei , 1990 -2009

158

CAPITOLUL 10 CORELAIA I REGRESIA NTRE CARACTERE Obiective : nsuirea de ctre studeni a conceptelor de corelaie i regresie mono i polifactorial ntre caractere , liniar i neliniare precum i tehnicilor de prognoz efectuate pe baza lor . Coninut : 10.1 Corelaia i regresia monofactorial liniar 10.1.1 Cazul observaiilor perechi (xi, yi) 10.1.2 Cazul observaiilor multiple (xi, yij) 10.1.3 Cross - corelaia i autocorelaia seriilor de timp 10.2 Corelaii i regresii monofactoriale neliniare 10.2.1 Corelaia i regresia monofactorial polinomial 10.2.2 Corelaia i regresia monofactorial trigonometric 10.2.3 Corelaia i regresia monofactorial polinomial-trigonometric 10.3 Corelaii i regresii polifactoriale 10.3.1 Corelaia i regresia polifactorial liniar pentru cazul a 2+1 caractere 10.3.2 Corelaia i regresia polifactorial liniar pentru cazul a m+1 caractere 10.3.3 Corelaia i regresia polifactorial polinomial de grad p fr interaciuni pentru cazul a m+1 caractere 10.3.4 Corelaia i regresia polifactorial polinomial de grad 3 cu interaciuni pentru cazul a m+1 caractere 10.4 Rezumat 10.5 ntrebri 10.6 Bibliografie Cuvinte cheie :covarian, coeficient de corelaie liniar, coeficieni de regresie liniar, raport de corelaie neliniar, coeficieni de regresie neliniar,cross-corelaie i autocorelaie. Msura cantitativ a influenei variaiei unui factor controlat X asupra variaiei factorului Y, se numete corelaie ntre X i Y iar funcia care stabilete dependena cantitativ a lui Y i X se numete funcie de regresie a lui Y dup X. Din populaie se aleg n exemplare pe care se msoar nsuirile cantitative X i Y obinnd perechile de date de sondaj (x1, y1), , (xn, yn). Se reprezint grafic n raport cu axele Ox, Oy punctele de coordonate (x1, y1), , (xn, yn) obinnd un nor de puncte n planul Oxy. Dup forma acestui nor de puncte funcia de regresie poate fi liniar (rectilinie) sau neliniar (curbilinie). Norul de puncte se poate reprezenta grafic cu produsele informatice EXCEL i TCWIN. 10.1 CORELAIA I REGRESIA MONOFACTORIAL LINIAR 10.1.1 Cazul observaiilor perechi (xi, yi) Din datele de sondaj calculm urmtorii indicatori statistici de sondaj: a) Indicatorii de sondaj proprii fiecrui caracter: I) Mediile de sondaj:

159

MX= X = II)

S2 X =
III)

1 1 (X i X )2 ; S2 (Yi Y )2 ; Y = n 1 n 1
Abaterile standard de sondaj:

1 1 X i ; MY = Y = Yi ; n n Varianele de sondaj:

2 SX = S2 X ; SY = SY ;

IV)
CX =

Coeficienii de variabilitate de sondaj : SX

.100(%) X Y Definiiile, calitile i defectele acestor indicatori proprii au fost date n seciunea 7.2. b) Indicatorii de sondaj de legtur ntre caractere: V)
Covariana de sondaj: SXY =

.100(%); CY =

SY

1 (X i X )(Yi Y ); n 1

Covariana de sondaj este o msur a legturii statistice a caracterelor X, Y fiind o medie a produselor ntre abaterile valorilor de sondaj Xi fa de X i abaterile valorilor de sondaj Yi fa de Y . Caliti: 1) Covariana SXY are o valoare mrginit fiind cuprins n intervalul [-SXSY; + SXSY]. Dac SXY > 0; Xi, Yi cresc sau scad simultan iar dac SXY < 0; cnd Xi cresc, Yi scad i reciproc. Dac SXY = 0; Xi, Yi nu sunt corelate liniar. Observm c SXX = SX ; SYY = SY . Defecte: 2) Covariana SXY are uniti de msur egal cu produsul unitilor de msur ale lui X i Y deci nu permite comparaii ntre perechile de caractere. 3) Covariana SXY este sensibil la nmulirea i mprirea datelor (seciunea 7.2). 4) Covariana de sondaj SXY singur nu poate aprecia intensitatea legturii statistice ntre caracterele X, Y.
Coeficientul de corelaie liniar de sondaj S XY R= (vezi teorema 10.2 de mai jos) S X SY Acest coeficient este o msur standardizat a legturii statistice ntre caracterele X, Y Caliti (vezi seciunea 6.2): 1) Coeficientul R este standardizat: R [-1; 1]; 2) Coeficientul R nu are uniti de msur deci permite comparaii ntre perechile de caractere; 3) Coeficientul R nu este sensibil la codificarea datelor; 4) Coeficientul R poate aprecia intensitatea legturii statistice a caracterelor X, Y (vezi teorema 10.2, punctul 3). VI)
2 2

Dac X1,,Xn sunt depuse n celulele A1:An din coloana A n EXCEL iar

160

Y1,,Yn sunt depuse n celulele B1:Bn din coloana B , atunci covariana Sxy este dat de funcia EXCEL scris n celula C1 : = COVAR((A1:An),(B1:Bn)) iar coeficientul de corelaie liniar R este dat de funcia EXCEL scris n celula C2 : = CORREL((A1:An),(B1:Bn)) Valorea lui Sxy poate fi obinut n EXCEL i prin deschiderea ferestrei TOOLS n care activm opiunea COVARIANCE n care declarm celulele A1:An , B1:Bn n care se gsesc datele. Valoarea lui Sxy se obine fie n foaia de calcul Nr.2 fie tot n foaia de calcul Nr.1 n care se gsesc datele ,prin declararea ca celule de rezultate a altor celule dect cele din blocul de date A1:Cn . Coeficientul de corelaie liniar R se obine exact ca i Sxy , dac n DATA ANALYSIS activm opiunea CORRELATION . Uneori mai importante dect valorile Xi, Yi ale nsuirilor X, Y sunt rangurile lor n ordonarea dup mrime. n cazul nsuirilor X, Y calitative se cunosc numai asemenea ranguri n clasificarea dup un anumit criteriu. Notm cu d diferena rangurilor a dou nsuiri X, Y ale aceluiai exemplar, coeficientul de corelaie a rangurilor ntr-un sondaj de n perechi de ranguri, capt forma: 6(d12 + ... + d n2 ) R = 1 n(n 2 1) Privind perechea de caractere X, Y ca un vector Z = (X, Y), acesta are indicatorii de sondaj: 1) Vectorul medie de sondaj: M(Z) = ( X , Y ) 2) Matricea de covarian de sondaj:

3) Matricea de corelaie liniar de sondaj: 1 R L( Z ) = 1 R VII) Coeficienii de regresie liniar de sondaj:

S2 SXY C( Z) = X 2 S YX SY

SXY daca regresia este cu termen liber (B0 0) B1 = S2 X X Y / X daca regresia este fara termen liber (B = 0) 0 i i i Y B1 X daca regresia este cu termen liber (B0 0) B0 = 0 daca regresia este fara termen liber (B0 = 0)

Intre coeficientul de corelaie liniar R i coeficientul de regresie B1 exist relaia : B1= R.(SY/SX) Coeficienii B1 i B0 de sondaj sunt o msur a legturii bijective a caracterelor X, Y dat de ecuaia Y = B0 + B1X. Aceasta reprezint grafic dreapta de regresie care trece prin centrul de greutate ( X , Y ) al norului de puncte cci Y = Y + B1(X - X ).

161

n legtura de tip statistic ntre X, Y se poate asocia o valoare a lui X cu mai multe valori ale lui Y i o valoare a lui Y poate corespunde cu mai multe valori ale lui X. n legtura de tip funcional ntre X, Y, nu se poate asocia o valoare a lui X cu mai multe valori ale lui Y dar o valoare a lui Y poate corespunde cu mai multe valori ale lui X. n legtura de tip bijectiv ntre X, Y fiecare valoare a lui X se asociaz cu o valoare unic a lui Y i fiecare valoare a lui Y corespunde unei valori unice a lui X(coresponden 1-1). Legtura din tabelul: xi 2 3 3 4 5 6 yi 8 10 11 14 14 20 este de tip statistic cci lui x = 3 i se asociaz y = 10 i y = 11 iar y = 14 se corespunde cu x = 4 i x = 5. Legtura din tabelul: xi 1 2 3 4 5 6 yi 8 10 11 14 14 20 este de tip funcional cci y = 14 se corespunde cu x = 4 i x = 5. Legtura din tabelul: xi 1 2 yi 8 10 3 11 4 14 5 15 6 20

este de tip bijectiv deoarece fiecare x este unic asociat cu un y unic. Coeficientul de regresie B1 este egal cu

care crete sau scade Y cnd X crete cu o unitate. Termenul liber al regresiei B0 este valoarea- martor a lui Y cnd X = 0. Caliti 1) Coeficienii B0, B1 au valori mrginite:

Y deci B1 este valoarea marginal cu X

Sy Sy Sy Sy B1 ; ; B Y X ; Y + X 0 SX SX SX SX

Defecte 2) B0 i B1 au uniti de msur deci nu permit comparaii ntre perechi de caractere; 3) B0 este sensibil la codificarea datelor iar B1 la nmulirea i mprirea datelor; 4) Prognoza valorilor Y fcut pe baza dreptei de regresie Y = B0 + B1X este aproximativ.

Dac X1,,Xn sunt depuse n celulele A1:An din coloana A n EXCEL iar Y1,,Yn sunt depuse n celulele B1:Bn din coloana B , atunci coeficientul de regresie liniar B1 este dat de funcia EXCEL scris n celula C3 : = SLOPE((A1:An),(B1:Bn)) iar termenul liber al regresiei B0 este dat de funcia EXCEL scris n celula C4 : = INTERCEPT((A1:An),(B1:Bn)) Pentru prognoza valorii Y(0) = B0 + B1.X(0) se folosete funcia EXCEL scris n celula C5 : = FORECAST (X(0) , (A1:An),(B1:Bn)). Fundamentarea afirmaiilor din seciunea 10.1 se bazeaz pe teoremele care urmeaz:

162

Teorema 10.1 1) Dreapta de regresie Y = B0 + B1X are coeficienii dai de relaiile: S XY pt. B0 0 S2 B1 = X 2 X i Yi / X i pt. B0 = 0

2) Limea fiei de ncredere este:

=
2

( n 1) (1 R 2 ) SY t ; n - 2 GL 2 n ( n 2)

Demonstraie 1) Dac regresia este cu termen liber (B0 0) vom minimiza variaia rezidual cu necunoscutele B0, B1: SPAY.X = (y1 B1x1 B0)2 + + (yn B1xn B0)2 = minim (metoda celor mai mici ptrate) Anulnd derivatele pariale ale lui SPAY.X n raport cu B1, B0, obinem sistemul de ecuaii normale cu necunoscutele B1, B0:
2 B1 x i + B0 x i = x i y i B1 x i + nB0 = y i

S , apoi din a II-a Eliminnd B0 ntre cele dou ecuaii normale, gsim B1 = XY 2
ecuaie normal mprit cu n, gsim B0 = Y -B1. X Ecuaia dreptei de regresie se scrie Y = Y B1X + B1 X adic

SX

Y - Y = B1(X - X ) deci dreapta de regresie Y = B0 + B1X trece prin centrul de greutate ( X , Y ) al norului de puncte {(xi, yi) ; (i = 1, , n}. Dac regresia este fr termen liber (B0 = 0) avem variaia rezidual minim: SPAY.X = (y1- B1x1)2 + + (yn B1xn)2 = minim. Anulnd derivata lui SPAY.X n raport cu B1, gsim ecuaia normal necunoscuta B1:

2 2) Avem M(Y B0 B1X) = M(Y) B0 B1M(X) = 0 i V(Y B0 B1X) = Y X n Y B0 B1X deci variabila normat n este variabil N(0, 1). YX
Variabila

B1 X i2 = X i Yi de unde B1 = X i Yi / X i2 .

( n 2 ) SY2 X

2 Y X

este variabil 2 cu n 2 GL, independent de variabila N(0, 1)

notat

Y B0 B1X n . De aici rezult c : YX

163

( n 2 ) SY2 X
t= 2 GL. Y B0 B1 X

Y X

n:

2 Y X

n2

Y B0 B1 X SY X

este variabil student cu n

De aici rezult: P t t t
2

) = 1 adic intervalul de ncredere pentru


este diferena limit.

Y B0 B 1X: P Y B0 + B1 X ; B0 + B1 X + = 1 2 2

unde

=
2

innd cont de demonstraia teoremei 10.2 avem: S


2 Y X 2 2 2 SPAY X (1 R ) SPAY (1 R ) ( n 1) SY = = = deci avem n2 n2 n2

SY X t /2;( n2)GL n

=
2

( n 1) (1 R 2 ) SY t /2;( n2)GL n ( n 2)
2

Graficul dreptei de regresie cu fia de ncredere are forma:

D+ D D-

Y
D-

0 Aici dreptele D+, D, D- au ecuaiile : D +: Y = B0 + B1X +


2

164

D: D-:

Y = B0 + B1X Y = B0 + B1X -
2

Q.E.D.
S XY ; S X SY
2

Teorema 10.2

1) Coeficientul de corelaie liniar este dat de relaia: R =

2) Aporturile variaiei lui X, E la variaia lui Y sunt A X = rXY ; AE = 1-AX R 3) t = n 2 este variabil Student cu n 2 grade de libertate. 1 R2
Demonstraie

S 1) Dac B1 = XY ; B0 = Y - B1 . X se verific prin calcul relaia: 2

(Yi Y )

= (B1X i + B0 Y ) + (Yi B1X i B0 )2 adic:


2

SX

SPAY = SPAR + SPAY.X (1) cu n 1 = 1 + (n 2) grade de libertate. Grafic variaiile ptratice din relaia (1) au forma :

165

Definim coeficientul de corelaie liniar R astfel:


R = 1 SPAY X SPAY

(2)

deci conform relaiei (1) avem:


R= SPAR = SPAY

(B X + B Y ) (Y Y )
1 i 0 2 i

S i nlocuind pe B1 = XY ; B0 = Y - B1 X 2 SX
(conform teoremei 10.1) rezult prin calcul: R = Observm c:
2 SPAXY SPAY X = (1 R 2 ) SPAY = 1 SPAX SPAY

S XY S X SY SPAY

adic:

SPA Y X

3) innd cont de relaia (2) relaia (1) se scrie: SPAY = R 2 .SPAY + (1 R 2 ) .SPAY

SPA 2 XY = SPA Y SPA X

(3)

aa c AX = R2 (numit i determinaie) este aportul n procente al variaiei lui X la variaia lui Y i AE = 1 R2 este aportul n procente al variaiei tuturor factorilor necontrolai (numii Eroare) la variaia lui Y. ntreaga variaie a lui Y este egal cu 100%. 3) Avem variana total a lui Y:
regresiei liniare a lui Y dup X: a lui Y fa de X:
2 SY X
2 R

sau 1 = R 2 + (1 R 2 )

S2 Y

SPA Y (Yi Y ) , variana = = GL Y n 1


2

2 SPA Y X (Yi + B1X i B0 ) = = GL Y X n2


2 SR cu (1; n 2)GL. 2 SY X

SPAY = S = GLY

(B X
1

+ B0 Y )

i variana rezidual

Rezult variabila Fisher FX =


2 R

2 SPAR R 2 SPAY SPAY X (1 R ) SPAY 2 = i SY X = = deci Dar S = n2 n2 1 1

R2 1 avem: F = : 2 1 R n 2

cu (1; n-2) GL i conform seciunii 1.2

166

t= F =

R 1 R2
B1

n2

este variabil Student cu n 2 GL.

Avem : t =

S B12 S

2 Y 2 X

n2

Q.E.D.

Avem regresie

B1 = R

SY S de unde R = B1 X SX SY

aa c valorile Yai calculate din dreapta de

Y = Y + B1(X - X ) Yai = Y + B1(Xi - X )

conform relaiei: ; (i = 1, , n) (4)

se numesc valori ateptate ale lui Y. Valorile Yci calculate conform relaiei: Yci = Yi B1(Xi - X ) = Y + (Yi Yai)) ; (i = 1, , n) se numesc valori corectate ale lui Y.
Teorema 10.3

(5)

1) Pentru valorile ateptate

Ya = (Ya1, , Yan) avem:

2 2 2 ; Covariana SX,Ya = SXY; Media Ya = Y ; Variana SYa = B12 S X = R 2 SY Coeficientul de corelaie liniar RX,Ya = 1

2) Pentru valorile corectate Yc = (Yc1, , Ycn) avem:


2 2 2 = SY B12 S X = (1 R 2 ) SY2 ; Covariana SX,Yc = 0; Media Yc = Y ; Variana SYc Coeficientul de corelaie liniar RX,Yc = 0

Demonstraie

1) Ya = M (Ya ) = M Y + B1 X X = Y + B1 M X X = Y 2 2 2 SYa = V ( Ya ) = V Y + B1 X X = B1 .V X X = B12 .V ( X ) = R 2 V (Y ) = R 2 SY S X ,Ya = C ( X , Ya ) = M ( X Ya ) M ( X ) M (Ya ) = M [ X Y + B1 ( X 2 X X )] X Y =

2 2 = XY + B1 M ( X ) M ( X ) X Y = B1 V ( X ) =

C( X ,Y ) V ( X ) = S XY V (X )

RX ,Ya =

C ( X , Ya ) V ( X )V (Ya)

B1 V ( X ) V ( X ) B12 .V ( X )

=1

2) Yc = M (Yc) = M [Y + (Y Ya)] = Y + M (Y ) M (Ya ) = Y + Y Y = Y

167

Avem

Yc + Ya = Y + Y
2 1

deci V (Yc) + V (Ya ) = V (Y ) aa c

V (Yc) = V (Y ) V (Ya ) = V (Y ) B V ( X ) S (Y ) Dar B1 = ( X , Y ) deci B12 V ( X ) = 2 ( X , Y ) V (Y ) S(X )

aa c

2 2 2 V (Yc) = 1 ( X , Y ) V (Y ) = (1 R ) SY

S X ,Yc = C ( X , Yc) = C X , Y + (Y Ya) = C [ X , Y Ya ] = C ( X , Y ) C ( X , Ya) = S XY S XY = 0 RX ,Yc = ( X , Yc) = C ( X , Yc) V ( X ).V (Yc) = 0 . Q.E.D.

n continuare vom aborda estimaii/teste pentru corelaia i regresia liniar n populaie.


Teorema 10.4

1)

Intervalul de ncredere pentru coeficientul de corelaie liniar necunoscut xy n populaia din care provine sondajul, are forma unde P(xy [ ; ' ]) = 1
2 2

=
2

(1 + R) (1 R)e (1 + R ) + (1 R )e (1 + R) (1 R)e (1 + R) + (1 R )e

2 u / n 3
2

2 u / n 3
2

2 u / n 3
2

' =
2

2 u / n 3
2

2) Intervalul de ncredere pentru coeficientul de regresie liniar necunoscut 1 n populaia din care provine sondajul, are forma: P(1 [1 - ; 1 + ' ]) = 1 unde
2 2

=
2

1 R SY t /2;( n2)GL n 2 SX

Intervalul de ncredere pentru termenul liber necunoscut 0 al regresiei liniare n populaia din care provine sondajul, are forma:

P 0 B 0 ; B 0 + = 1 2 2

unde

=
2

( n 1) S (1 R )
2

2 + nX SY t /2;( n 2) GL n ( n 2) SX 2 X

168

(Fr demonstraie)

Coeficientul de corelaie liniar de sondaj R este variabil de la un sondaj la altul n jurul coeficientului de corelaie liniar necunoscut n populaie. 2 (1- ) deci lim V ( R) = 0 aa c R este o Se arat c: M ( R ) = ; V(R) = n n estimaie absolut corect a lui . 1) Testul ipotezei H: = 0 fa de alternativa H : 0 se face pe baza teoremei 10.2 punctul 3) astfel: Din relaia

t=
t
2 2

R 1 R
2

n 2 = t

rezult:

R=

t + n 2
2

= R /2

Valorile critice R pentru = 0.05; 0.01; 0.001 i n 2 GL sunt date de tabela 10 din Anex. Decizia asupra ipotezei H se ia astfel: Dac R < R0.025 ipoteza H se accept: = 0 deci X, Y nu sunt corelate liniar n populaie. n caz contrar avem cazurile: a) R0.025 R < R0.005 deci X, Y sunt corelate liniar semnificativ; b) R0.005 R < R0.0005 deci X, Y sunt corelate distinct semnificativ; c)
R > R0.0005 deci X, Y sunt corelate liniar foarte semnificativ.

2) Testarea ipotezei H: = 0 fa de alternativa H : 0 este echivalent conform S relaiei B1 = R Y cu testarea ipotezei H : 1 = 0 fa de alternativa H: 1 0 fcut pe baza SX B1 relaiei: t = n 2 care se compar cu valorile critice t0.05; t0.01; t0.001 cu n 2 SY2 B12 2 SX GL , extrase din tabela 2 din Anex. Decizia se ia ca la punctul 1). 3) Testul ipotezei H : = 0 fa de alternative H : 0 se face cu transformata 1 1+ R Fisher : z = ln . 2 1 R

169

1 1 + 0 1 1+ 1 ; Se arat c z este variabil normal N ln deci cu z 0 = ln 2 1 0 2 1 n-3


rezult c: u = (z z0) n 3 este variabil N(0,1). Din tabela 11 din Anex, obinem transformatele Fisher z al lui R i z0 al lui 0 i calculm pe u din relaia precedent i l comparm cu u0.025 = 1.96; u0.005= 2.58; u0.0005 = 3.29 Decizia se ia ca la punctul 1). Valorile z din tabelul 11 din Anex se obin i cu funcia EXCEL := FISHER ( R ) . 4) Testul ipotezei H: = fa de alternativa H : pe baza a dou sondaje de n1 perechi de valori (xi, yi) respectiv n2 perechi de valori (xi, yi), extrase din dou populaii 1 1+ ' 1 1+ R' 1 ; este variabil N ln normale, se bazeaz pe faptul c z ' = ln iar 2 1 ' n 3 2 1 R ' 1
z" =

1 1 + " 1 1+ R" ; ln este variabil: N ln 2 1 " 2 1 R"

z z este variabil N 0;

variabil N(0, 1). Din tabela 11 din Anex, obinem transformatele Fisher z i z ale lui R, R apoi calculm pe u din relaia precedent i l comparm cu valorile critice u0.025=1.96; u0.005=2.58; u0.0005=3.29 Decizia se ia ca la punctul 1). Exemple

(z, z = independente) deci n2 3 z'z" 1 1 aa c u = + este n1 - 3 n 2 3 1 1 + n1 3 n 2 3 1

sondaj: xi yi

1) Fie X = nlimea la greabn a vieilor (cm) i Y = greutatea n viu a vieilor (kg). Populaia este format din N = 100 viei din care extragem un sondaj de n = 10 viei, pe care msurm nlimea la greabn i greutatea, obinnd datele de 70 55 68 54 71 56 72 60 69 54 66 50 70 56 67 53 71 56 72 58

Se cere semnificaia lui R, diagrama aporturilor i dreapta de regresie Y=B0+B1X + 0.025 cu prognoz pentru x = 75 cm. Soluie Se reprezint grafic norul de puncte cu coordonatele (xi, yi) cu unul din produsele informatice EXCEL ,TCWIN .

170

Forma alungit a norului de puncte indic o dependen liniar. Deoarece pentru talia X = 0 avem greutatea Y = 0, regresia este fr termen liber.
Calcule:

a) Indicatorii de sondaj proprii fiecrui caracter xi = 696 = 69.6 cm Mediile: MX= X = n 10 yi = 552 = 55.2 kg MY= Y = 10 n Abaterile standard:
SX =

(x X )
i

n 1

38.40 = 4.27 = 2.07 cm 10 1

SY =

( y

n 1

67.60 = 7.51 = 2.74 kg 10 1

Coeficienii de variabilitate:

CX =

2.07 2.74 100 = 3% ; CY = 100 = 5% 69.6 55.2

b) Indicatorii de sondaj de legtur ntre caractere:


Covariana
S XY =

(x

n 1

)( y Y ) = 47.80 = 5.31 cm x kg
i

10 1

Coeficientul de corelaie liniar de sondaj:

171

R=

S XY 5.31 = = 0.938 S X SY 2.07 2.74

Valorile critice din tabela 10 din Anex, pentru 10 2 = 8 GL sunt: R0.05 = 0.632; R0.01=0.765; R0.001 = 0.872 Deoarece R = 0.936 > R0.001 = 0.872 corelaia liniar ntre X, Y pentru toi vieii din care provin cei 10, este foarte semnificativ aa c R= 0.936*** AX = R2 = 88%; AE = 1 Ax = 12%
AE = 12%

Variaia total a lui Y = 100%


Ax = 88%

Concluzie: 88% din variaia lui Y este datorat variaiei lui X, restul de 12% se datorete variaiei altor factori necontrolai numii Eroare. Pentru coeficientul de corelaie liniar necunoscut ntre X, Y n populaie, avem intervalele de ncredere: [0.801; 0.982] cu ncrederea de 95%; [0.688; 0.989] cu ncrederea de 99%; [0.504; 0.994] cu ncrederea de 99.9%.

Intervalul cel mai mic [0.801; 0.982] cu ncrederea de 95% are urmtoarea interpretare: Coeficientul de corelaie necunoscut ntre talia i greutatea tuturor vieilor din care fac parte cei 10 ai sondajului, este cuprins ntre 0.801 i 0.982 cu o ncredere de 95%. Exist semiriscul 2.5% ca acest coeficient s fie mai mic ca 0.801 atunci cnd sondajul extras din populaie a fost intens corelat liniar (n sondaj sunt viei scunzi i slabi respectiv viei nali i grai). n mod analog exist semiriscul 2.5% ca, coeficientul s fie mai mare ca 0.982 atunci cnd sondajul extras din populaie a fost slab corelat liniar (n sondaj sunt viei de toate categoriile: scunzi i slabi, scunzi i grai, nali i slabi, nali i grai). Ipoteza H : = 0.9 se accept deoarece = 0.9 [0.801; 0.911].
Coeficienii de regresie liniar de sondaj:
38467 0.793 kg crestere greutate = 48480 1 cm crestere talie B0 = 0 kg (regresie fr termen liber). B1 =
i i 2 i

x y x

Pentru coeficientul de regresie liniar necunoscut 1 ntre X i Y n populaie, avem intervalele de ncredere: [0.676; 0.911] cu ncrederea de 95%; [0.622; 0.965] cu ncrederea de 99%; [0.530; 1.057] cu ncrederea de 99.9%.

172

innd cont de relaia : 1= .(Y/X) intervalul cel mai mic [0.676; 0.911] cu ncrederea de 95% are urmtoarea interpretare: Coeficientul de regresie liniar necunoscut 1 ntre X i Y n populaia din care provine sondajul este cuprins ntre 0.676 i 0.911 cu ncrederea de 95%. Exist semiriscul 2.5% ca acest coeficient 1 s fie mai mic de 0.676 atunci cnd sondajul extras din populaie a fost intens corelat liniar sau variabilitatea caracterului Y raportat la variabilitatea caracterului X este relativ mare n populaie. n mod analog exist semiriscul 2.5% ca acest coeficient 1 s fie mai mare ca 0.911 atunci cnd sondajul extras din populaie a fost slab corelat liniar sau variabilitatea caracterului Y raportat la variabilitatea caracterului X este relativ mic n populaie. Ipoteza H : 1 = 0.7 se accept deoarece 1 = 0.7 [0.676; 0.911]. Relaia: =
2

( n 1) (1 R 2 ) SY t / 2;( n 2)GL n ( n 2)

devine: =
2

(10 1) (1 0.9382 ) 2.74 2.31 = 0.736 10 (10 2 )


2

Ecuaia dreptei de regresie cu fia de ncredere Y = B0 + B1 X devine Y = 0.793X + 0.736. Cu ajutorul acestei ecuaii se pot face prognoze cu asigurarea de 95% astfel: Pentru X = 75 cm avem valorile ateptate: 60.211 kg (Maxima) Ya = 0.793 x 75 + 0.736 = 59.475 kg (Media) 59.739 kg (Minima) Pentru talia vieilor Xa = 75 cm ,ne ateptm ca greutatea vieilor din care provine sondajul s fie cuprins ntre [58.739 kg; 60.211 kg] cu o ncredere de 95%. Exist semiriscul 2.5% ca aceast greutate s fie sub 58.739 kg atunci cnd sondajul a fost ales performant ca greutate. n mod analog exist semiriscul 2.5% ca aceast greutate s fie peste 60.211 kg atunci cnd sondajul a fost ales neperformant ca greutate. X a = 75 cm Ipoteza H : se accept deoarece Ya = 60 kg [58.739; 60.211]. Ya = 60 kg Valorile ateptate Ya ale lui Y se calculeaz cu relaia Ya = 0.793X iar valorile corectate Yc ale Y sunt date de relaia: Yc = Y + ( Y Ya ) Avem tabelul: xi 70 68 71 72 69 66 70 yi 55 54 56 60 54 50 56 yai 55.54 53.96 56.34 57.13 54.75 52.37 55.54 yi=yi-yai - 0.54 0.04 - 0.34 2.87 - 0.75 - 2.37 0.46

yci = y + yi
54.66 55.24 54.86 58.07 54.45 52.83 55.66

173

67 71 72

53 56 58

53.16 56.34 57.13

- 0.16 - 0.34 0.87

55.04 54.86 56.07

Coloanele yi (albastr) i yai (crmizie) apar mpreun n diagram :

Calculele precedente privitoare la regresia liniar pot fi fi fcute n EXCEL astfel : Valorile X1,,Xn se nscriu n celulele A1:An din coloana A iar valorile Y1,,Yn se nscriu n celulele B1:Bn din coloana B a foii de calcul Nr.1 Deschidem fereasta TOOLS n care activm opiunea DATA ANALYSIS . Aici activm opiunea REGRESSION n care declarm celulele A1:An i B1:Bn unde se afl datele. Rezultatele regresiei liniare se gsesc fie n foaia de calcul Nr.2,fie tot n foaia de calcul Nr.1 cu date ,prin declararea ca celule de rezultate a altor celule dect cele din blocul de date A1:Cn O sintez elegant a acestor calcule este dat n foaia de calcul C2P1.XLS pentru regresii cu termen liber i n foaia de calcul C2P10.XLS pentru regresii fr termen liber ,aflate n Anex. 2) a) S se testeze ipoteza H : = 0.9 fa de alternativa H : 0.9 pentru exemplul 1 1+ R . 1) cu transformata Fisher: z = ln 2 1 R Soluie Transformata Fisher din tabela 11 din Anex, pentru R = 0.938 este z = 1.7220 iar transformata Fisher din tabela 11 din Anex, pentru 0 = 0.9 este z0 = 1.4722

u = (z z 0 ) n 3 devine u = 0.66

Cum u = 0.66 < u0.025 = 1.96 , ipoteza H: =0.9 se accept. b) Dintr-o populaie de viei se extrage un sondaj de n1 = 10 viei pe care se msoar talia X la greabn n cm i greutatea Y n kg gsindu-se R=0.938. Din a II-a populaie de viei se extrage un al II-lea sondaj de n2= 17 viei i se gsete R=0.865. S se testeze ipoteza H : = n cele dou populaii fa de alternativa H :

174

Soluie Pentru R= 0.938 avem din tabela 11 din Anex, transformata Fisher z= 1.7220 iar pentru R= 0.865 din aceeai tabel, avem transformata Fisher z=1.3132

Avem u =

z ' z " 1 1 + n1 3 n2 3

1.7220 1.3132 1 1 + 7 14

= 3.04 .

Cum u = 3.04 [2.58; 3.29] rezult c distinct semnificativ. 3) n exemplul 1) cei 10 viei ocup urmtoarele ranguri n ordine descresctoare dup talie la greabn X i greutate Y: ti gi di di2 6 6 0 0 8 8 0 0 3 4 1 1 1 1 0 0 7 7 0 0 10 10 0 0 6 di2 5 5 0 0 9 9 0 0 4 3 1 1 2 2 0 0

Coeficientul de corelaie a rangurilor R = 1

n ( n 2 1)

devine R = 0.988 cu 10 2 = 8 GL.

Valorile critice pentru n 2 = 8 GL din tabela sunt R0.05 = 0.632; R0.01 = 0.765; R0.001 = 0.872. Cum R = 0.988 > R0.001 = 0.872, corelaia rangurilor dup talie i greutate a tuturor vieilor din care fac parte cei 10, este foarte semnificativ. 10.1.2 Cazul observaiilor multiple (xi, yij) Exist cazuri cnd pentru caracterul Y avem observaii multiple deci datele de sondaj au forma: xi x1 x2 . . . xn yij y11 _________y1p y21 _________y2p

. . .

yi y1 y2

yn1 _________ynp

yn

n acest caz se poate face corelaia i regresia liniar ntre valorile xi i mediile y i i pe de alt parte se poate face analiza varianei monofactorila balansat ntre valorile xi i valorile yij. Variaia total a valorilor Y este:
SPAY = yij Y
i =1 j =1 n n p

cu np 1 GL

Variaia regresiei ntre X i Y este:

SPAR = p B0 + B1 X i Y
i =1

cu 1 GL

Variaia abaterilor de la regresie este:

175

SPAA = p ( yi B0 B1 xi )
i =1

cu n 2 GL

Variaia intraclase (datorat erorii) este:

SPA E = y ij y i
i =1 j =1

)2

cu n(p-1) GL

Se verific prin calcul relaia: SPAY = SPAR + SPAA + SPAE (6) cu np-1 = 1 + (n 2) + n(p 1) GL. Prin nsumarea dou cte dou, variaiile din membrul II dau:
Variaia interclase (datorat lui X) este:
n

SPAX = SPAR + SPAA = p (y i y ) cu 1 + (n 2) = n-1 GL


Variaia rezidual a regresiei ntre X i Y este:
i =1

SPAY.X = SPAA + SPAE =

i =1 j =1

(y ij B0 B1x i )

n p

cu (n - 1) + n(p - 1)

= (np-2) GL Coeficientul de corelaie liniar R ntre valorile xi i y i se calculeaz cu formula (2) din teorema 10.2 astfel: SPAY X SPAR (7) R = 1 = SPAY SPAY Indicele de corelaie din analiza variaiei (cap. 9.1) are forma:
Ic = 1 SPAE = SPAY SPAX SPAY

(8)

Rezult de aici: SPAR = R2 . SPAY cu 1 GL SPAY.X = (1 R2) . SPAY cu np 2 GL respectiv: SPAX =Ic2 . SPAY cu n 1 GL SPAE = (1 Ic2) . SPAY cu n(p 1) GL De asemenea: SPAA = (Ic2 R2) . SPAY cu n 2 GL Prin mprire cu SPAY, relaia (6) devine: 1 = R2 + (Ic2 R2) + (1 Ic2) (9) 2 2 . Din relaia SPAA = (Ic R ) SPAY rezult: 0 <

R < Ic

(10)

Reunind teorema 6.9 din seciunea 6.2 i teorema 9.2 din seciunea 9.1, obinem: Teorema 10.5 n cazul observaiilor multiple (xi, yij) avem proprietile:

176

1) 0 < R < Ic < 1


R = Ic

dac i numai dac xi i yij sunt dependente funcional liniar

( y i = B0 + B1xi) 2) X, Y = independente X, Y = necorelate liniar (R = 0) 3) X, Y = independente X, Y = necorelate (Ic = 0) 4) X, Y = dependente funcional liniar (Y = B0 + B1X) dac i numai dac R = 1 5) X, Y = dependente funcional liniar dac i numai dac Ic = 1. Fie indicele de corelaie n populaia din care face parte sondajul. Avem trei ipoteze relativ la populaia din care face parte sondajul: a) Ipoteza HX : = 0 fa de alternativa H X : 0 se testeaz prin analiza variaiei (cap. 8.1) cu ajutorul raportului Fisher: I c2 S2 n 1 n 1 : : FX = X = cu [n 1; n(p 1)] GL 2 2 S E n( p 1) 1 I c n( p 1) b) Ipoteza HR : = 0 fa de alternativa H R : 0 se testeaz cu ajutorul raportului Fisher: 2 SR 1 1 R2 : FR = 2 : = cu [1; np 2] GL 2 SY X np 2 1 R np 2 R De aici rezult c t R = FR = np 2 1 R2 c) Ipoteza HA : = fa de alternativa H A : se testeaz cu ajutorul raportului Fisher:
2 I c2 R 2 SA n2 n2 : : = cu [n 2; n(p 1)] GL 2 2 1 I c n( p 1) S E n( p 1) Ecuaia dreptei de regresie ntre valorile xi i y i cu fia de ncredere se stabilete ca

FA =

seciunea 10.1.1 pe baza relaiei: y = B0 + B1x + unde B1 =


S XY ; B0 = Y -B1 X ; 2 SX

(n 1)(1 R 2 ) = SY t /2;( n2)GL n(n 2)

Exemplu Fie X = proteina digestibil (kg) n raia vacilor de lapte; Y = producia lunar de lapte (hectolitri). Avem n = 8 variante de protein digestibil aplicate la cte p = 3 vaci cu lapte. Date de sondaj:

Xi

Yij

Yi

Y ai

Y i

177

1 1.05 1.10 1.15 1.20 1.25 1.30 1.35

4.5; 4.5; 4.8 5; 5; 5.3 5.4; 5.3; 5.5 6; 5.9; 6.1 6.3; 6.3; 6.6 6.9; 7; 7.1 7.5; 7.4; 7.6 7.9; 8.1; 8

4.6 5.1 5.4 6.0 6.4 7.0 7.5 8.0

5.361 5.629 5.897 6.165 6.433 6.701 6.969 7.237

-0.761 -0.529 -0.497 -0.165 -0.033 0.299 0.531 0.763

Avem MX= 1.175 kg PD; MY=6.25 hectolitri lapte pe lun. Regresia este fr termen liber (B0=0 pentru X=0) deci X iYi = 59.775 = 5.361 . B1 = X i2 11.15 Avem SPAY = ( yij Y ) 2 = 30.452
i =1 j =1

Valorile ateptate sunt yai = B1 .xi i sunt nscrise n coloana patru a tabelului precedent.
8 3

SPAR=3 ( ya i Y ) 2 = 8.384 SPAA= 3 ( y i ya i ) 2 = 6.254


i =1 i =1 8

SPAE = ( yij yi ) 2 = 15.814


i =1 j =1

Rezult SPAX=SPAR+SPAA=14.638 i SPAY.X=SPAA+SPAE=22.068 SPAR SPAX Rezult R= = 0.525; I c = = 0.693 SPAY SPAY
Testele ipotezelor a) HX:=0 fa de HX: 0

I c2 n 1 : = 2.112 FX= 2 1 I c n( p 1)

cu (7;16)GL

Din tabelele 4,5,6 din Anex, avem valorile critice pentru (7;16) GL astfel: F0.05=2.66; F0.01=3.04;F0.001=6.50 Cum FX<F0.05 , se accept ipoteza Hx: = 0 b) HR: = 0 fa de HR: 0 FR=
R2 1 : = 8.371 2 1 R np 2
cu [1;22] GL

tR= FR =2.893 cu 22 GL

178

Din tabela Student 2 din Anex,avem pentru 22 GL, valorile critice t0.05=2.07; t0.01=2.82; t0.001=3.79. Cum tR [t0.01; t0.001] ipoteza HR: = 0 se respinge deci 0 distinct semnificativ. c) HA: = fa de H A : I c2 R 2 n 2 : = 1.050 1 I c2 np 1 cu (6;16) GL. Din tabelele Fisher 4,5,6 din Anex, pentru (6;16) GL ,avem valorile critice F0.05=2.74; F0.01=4.20; F0.001=6.81 Cum FA<F0.05 ipoteza HA: = se accept. Funcia de regresie este Y=B1X adic y=5.361X. 1 n 2 Avem S Y = (Y i Y ) 2 = 0.93 n i =1 Limea fiei de ncredere cu =0.05 este FA = 2.5 % = deci 10.1.3
(8 1)(1 0.5252 ) 0.964 2.45 = 0.768 8(8 2) Y=0.5361X 0.768

Cross - corelaia i autocorelaia seriilor de timp

n seciunile a) i b) caracterele X,Y au fost msurate n acelai moment de timp dnd la sondajul de repartiie (x1,y1),., (xn,yn) pentru vectorul aleator Z=(X,Y). Dac msurtorilor sunt efectuate succesiv n timp la momentele t=1,2,,n obinem sondajul de evoluie (x1,y1),.,(xn,yn) pentru procesul aleator Z(t) = (X(t), Y(t)). Valorile consecutive n timp (x1,,xn) respectiv (y1,.,yn) se numesc i serii de timp pentru caracterele X,Y. Uneori mai important dect corelaia perechilor (xi,yi) este cross-corelaia perechilor (xi, yi+1). Astfel resursa X aplicat la plante sau animale n momentul t=i are efect asupra valorii produciei Y la momentul urmtor t=i+1.
Exemple 1) X=precipitaii n sptmna t=i Y = talia plantei n sptmna urmtoare t=i+1

2) X=cantitatea de protein digestibil n raia vacilor cu lapte n ziua t=i Y=producia zilnic de lapte n ziua urmtoare t=i+1
Exemplu X=proteina digestibil n raia unei vaci cu lapte (g/zi) n 11 zile consecutive Y=producia zilnic de lapte (litri/zi) n 11 zile consecutive.

Xt Yt Yt+1

Date de sondaj: 1000 1020 1040 9.6 9.6 9.7 9.6 9.7 9.8

1060 9.8 9.9

1080 9.9 9.9

1100 9.9 9.9

1120 9.9 10.1

1140 10.1 10.3

1160 10.3 10.4

1180 10.4 10.6

1200 10.6 -

179

Fie notaiile X=Xt ; Z= Yt+1 Mediile: MX=1090 g/zi ; MZ=10.02 l/zi Abaterile standard: SX=60.553 g/zi; SZ =0.322 l/zi Covariana: SXZ =18.889 g x l/zi Coeficientul de cross-corelaie liniar: R=0.967 Coeficienii de cross-regresie liniar: B0=0; B1=0.009 Limea fiei de ncredere 2.5% =0.063; Ecuaia de cross-regresie este :Yt+1=B0+B1.Xt /2
Autocorelaia pentru caracterul Y este corelaia ntre valorile yi la momentul t=i i valorile yi+1 la momentul t=i+1. Valoarea produciei yi+1 la momentul t=i+1 depinde de valoarea produciei yi la momentul anterior t=i. Exemplu Fie notaiile : Y=Yt ; Z= Yt+1 .Avem rezultatele : Mediile: MY = 9.92 l/zi ; MZ = 10.02 l/zi Abaterile standard: SY = 0.274 l/zi; SZ =0.322 l/zi Autocovariana SYZ = 0.086 Coeficientul de autocorelaie liniar: R=0.976 Coeficienii de autoregresie liniar: B0= 0 ; B1= 1.010 Limea fiei de ncredere : 2.5%=0.054 Ecuaia de autoregresie Yt+1 = B0+B1.Yt / 2

Cross-corelaia i autocorelaia se pot combina ntr-un model liniar mixt(vezi 10.3.1): Valoarea produciei yi+1 la momentul t=i+1 depinde att de valoarea resursei xi la momentul anterior t=i ct i de valoarea produciei yi la momentul anterior t=i. De exemplu, producia de lapte yi+1 n ziua t=i+1 depinde att de cantitatea de protein digestibil xi n ziua precedent t=i (cauz extern) ct i de producia de lapte yi n ziua precedent t=i (cauz intern). Exemplu Fie notaiile : X=Xt ; Y = Yt ; Z= Yt+1 . Avem rezultatele : Mediile: MX=1090 g/zi ; MY = 9.92 l/zi ; MZ=10.02 l/zi Coeficienii de corelaie liniar simpli : RXY=0.964; RXZ=9.967;RYZ=0.976 Coeficienii de corelaie liniar multipli : Coeficientul multiplu total : RZ.XY = 0.981 Coeficienii multipli pariali : RZX.Y = 0.458 ; RZY.X = 0.638 Coeficienii de regresie multipl : B0 = 0 ; B1 = 0.002 ; B2 = 0.845 Limea fiei de ncredere : 2.5%=0.053 Ecuaia de regresie multipl :Yt+1 = B0+B1.Xt +B2.Yt / 2
10.2 CORELAII I REGRESII MONOFACTORIALE NELINIARE

Am vzut n capitolul 6 c dou variabile aleatoare independente X,Y sunt necorelate liniar sau prin negaie dou variabile X, Y corelate liniar sunt dependente.Reciproca nu

180

este n general adevrat, adic exist variabile X,Y dependente, care nu sunt corelate liniar, dar pot fi corelate neliniar. n cazul corelaiei i regresiei neliniare a variabilelor X,Y forma norului de puncte (xi,yi) (i=1,....., n) indic o anumit form a funciei de regresie Y=f(X,B0, B1,........., Bd-1), unde B0, B1,........., Bd-1 sunt d parametri necunoscui ai funciei de regresie. Parcurgem urmtoarele etape: a)Calculul parametrilor de regresie B0, B1,........., Bd-1 se face ca i n cazul regresiei liniare, prin metoda celor mai mici ptrate (vezi teorema 10.1): Vom minimiza variaia rezidual: SPAY.X =[y1-f(x1, B0, B1,....., Bd-1)]2+............+[yn- f(xn, B0, B1,....., Bd-1)]2= =minim Anulnd derivatele pariale ale lui SPAY.X n raport cu B0, B1,....., Bd-1 obinem sistemul de d ecuaii normale cu d necunoscute : B0, B1,....., Bd-1:

b) Dup calculul celor d parametri de regresie B0, B1,....., Bd-1, vom calcula raportul de corelaie neliniar Rc printr-o formul asemntoare cu formula (1) din demonstraia teoremei 6.2:

SPAY . X SPAY . X = 0,................., =0 B 0 Bd 1

Rc = 1

Aici SPAY= ( yi Y ) 2 este variana total a valorilor lui Y cu n-1 GL.

SPAY . X SPAY

(1)

f(xi, B0, B1,....., Bd-1) ale lui Y fa de valorile observate yi ale ale lui Y n-d grade de libertate (d este numrul parametrilor B0, B1,....., Bd-1 ai regresiei) Diferena SPAY-SPAY.X=SPAR se numete variana regresiei neliniare i are (n-d)=d-1GL Ca i n cazul teoremei 10,2 se arat c : Rc2 d 1 : F= 2 1 Rc n d (2)

SPAY.X= [yi-f(xi , B0, B1,....., Bd-1)]2 este variana rezidual a valorilor ateptate n-1-

este variabil Fisher cu (d-1;n-d ) GL. n cazul dreptei de regresie Y=B0+B1X avem d=2 parametrii necunoscui B0, B1, deci: F= R2 1 : 2 1 R n 2 (3)

este variabil Fisher cu (1;n-2) GL, deci t= F

R 1 R
2

n2

este

variabil Student cu n-2 GL ( punctul 3 al teoremei 10.2) Deosebirea ntre R i Rc este accea c R[-1;1], iar Rc[0;1] 10.2.1 Corelaia i regresia monofactorial polinomial

181

Funcia de regresie are forma : Y=f(X, B0, B1,....., Bm)= B0+B1X+.....+ BmXm n care avem d=m+1, parametri de regresie necunoscui B0, B1,....., Bm. Sistemul cu d =m+1 ecuaii normale cu necunoscutele B0, B1,....., Bm are forma:

Bm xi2 m + ... + B1 xim+1 + B0 xim = xim yi ..................................................................... Bm xim+1 + ... + B1 xi2 + B0 xi = xi yi Bm xim + ... + B1 xi + nB0 = yi
Notm
x1m x1m 1.............1 X= ........................ m m 1 xn xn .............1

de tip

n x (m+1)

Bm B XT este matricea transpus a lui X, de tip (m+1) x n, B= m 1 este vectorul .......... Bo y1 coloan de tip (m+1)x 1 al coeficienilor de regresie polinomial, iar Y= .... este vectorul yn

coloan de tip n x 1 pentru valorile lui Y. Sistemul precedent capt forma matricial: XT.X.B=XT.Y Dac matricea simetric XT.X de ordin m+1 este nesingular (det(XT.X)0), sistemul de ecuaii normale are soluie unic scris matricial: B=(XT.X)-1.XT.Y Cu d= m+1, raportul Fisher F capt forma : Fp = Rc2 m : 2 1 Rc n m 1 GL. (4)

cu (m; n-m-1)

n cazul regresiei polinomiale fr termen liber (B0=0) ecuaiile normale au forma:

182

Bm xi2 m + ... + B1 xim+1 = xim yi ......................................................... Bm xim+1 + ... + B1 xi2 = xi yi


Avem un sistem liniar de m ecuaii cu m necunoscute B1,.........., Bm, deci numrul parametrilor de regresie este d= m. Cu d= m raportul Fisher capt forma: Rc2 m 1 : (5) Fp = 2 1 Rc n m cu (m-1;n-m)GL Exemplu: Fie X= cantitatea de azotat de amoniu (kg/ha) i Y= producia de gru (quintale/ha). Avem un sondaj de volum n=10: xi yi 0 15 30 17 60 20 90 22 120 25 150 29 180 34 210 36 240 38 270 40

Diagrama care urmeaz conine norul de puncte al perechilor (x,y) :

Folosim funcia de regresie polinomial de grad m=3 avnd forma: Y=Bo+B1X+B2X2+B3X3 Coeficienii de regesie dai de sistemul de ecuaii normale au valorile : B0=15.27849; B1=0.032527; B2=0.000653; B3=-0.0000016 Valorile xi, valorile observate yi , valorile ateptate yai =B0+B1 .xi +B2 xi 2 +B3 xi 3 i diferenele yi=yi-yai , sunt date de tabelul:

183

xi 0 30 60 90 120 150 180 210 240 270

yi 15 17 20 22 25 29 34 36 38 40

yai 15.28 16.80 19.23 22.32 25.80 29.40 32.88 35.97 38.40 39.92

yi -0.28 0.20 0.77 -0.32 -0.80 -0.40 1.12 0.03 -0.40 0.08

Variaia total este SPAY=742.4, iar variaia rezidual este SPAY.X=3.025 aa c SPAY . X raportul de corelaie va fi : Rc= 1 =0.99796. SPAY Raportul Fisher Fp are forma (4) (regresia este cu termen liber) i pentru n=10; m=3 capt valoarea Fp=488.7 cu (3;6) GL. Valorile critice Fisher din tabelele 4,5,6 din Anex, cu (3;6) GL sunt: F0.05=4.76; F0.01=9.78; F0.001=23.70. Cum Fp=488.7> F0.001=23.70, corelaia polinomial n populaia din care provine sondajul este foarte semnificativ. 10.2.2 Corelaia i regresia monofactorial trigonometric Funcia de regresie are forma: Y=To+(S1sinx+ C1cosx)+..........+(Sksinkx+Ckcoskx), (k n/2) n care avem 2k+1 parametri de regresie necunoscui T0, S1, C1,...., Sk,Ck. Sistemul cu d= k+1 ecuaii normale cu necunoscutele Y0, S1, C1,......., Sk,Ck aceste valori astfel: T0= MY 2 n 2 n S1= yi sin xi ; C1= yi cos xi n i =1 n i =1 ................................................... Sk= 2 n 2 n sin y kx ; C = k i yi cos kxi i n i =1 n i =1 d

Pentru a aduce date de sondaj xi n carcul trigonometric [0;2], vom nlocui pe xi (n 1) xi + ( xn nx1 ) 2 cu xci= dup ce n prealabil valorile xi au fost reordonate n xn x1 n ordine cresctoare. Dac xi[x1;xn], atunci xci=[0;2] iar xcn=2 Dac xi=x1+(i-1)r (xi sunt echidistante), atunci :

184

xc1=2/n, xc2=2(2/n),........, xcn=n(2/n)= 2. Calculul raportului de corelaie neliniar Rc se face cu formula (1) de mai sus. Testarea corelaiei trigonometrice n populaia din care provine sondajul adic varificarea ipotezei H: c=0 fa de alternativa H: c 0 se face cu relaia (2) de mai sus n care F este variabil Fisher cu (d-1; n-d) GL, unde d este numrul parametrilor de regresie necunoscui T0, S1, C1,........, Sk, Ck, deci d=2k+1, aa c F renotat cu Ft are forma : Ft = [Rc2 / (1- Rc2 )] : [2k/(n-2k-1)] (6) cu (2k ; n-2k-1 ) GL Prin regresia trigonometric se ajusteaz date cu caracter periodic (ciclic) mai ales cnd x este timpul msurat sezonier (n secunde , minute, ore, zile, sptmni, luni, trimestre, semestre, ani, decenii, secole, milenii). De exemplu n cazul X=timpul, Y poate fi caracter meteorologic (precipitaii, cldur, lumin, secete, inundaii, ngheuri, grindin,etc.) sau geologic (cutremure, alunecri de teren) sau biologic (cicluri de reproducie i lactaie, serii la ngrat pentru animale domestice, perioade de vegetaie pentru plantele de cultur) sau economic (perioade de avnt economic i de recesiune). Exemple 1)X=timpul n luni Y=temperatura medie lunar a aerului n perioada 1901-1990 la staia meteo Bucureti-Filaret (0C). Z=precipitaiile medii lunare n perioada 1901-1990 la staia meteo Bucureti-Filaret (m3/ha). Date de sondaj: Luna X Temperatura Y Precipitaii Z 1 -2.4 406 2 -0.3 340 3 5.2 374 4 11.6 444 5 16.9 681 6 20.6 860 7 22.8 578 8 22.3 512 9 17.8 391 10 11.8 411 11 5.5 485 12 0.4 411 a) Diagrama temperaturilor are forma:

185

Funcia de regresie trigonometric pentru temperatura medie lunar Y cu k=2 armonice are coeficienii: T0=MY=11.01667 oC S1= - 6.5409; C1= - 10.5161; S2= - 0.4908; C2= - 0.5500. Valorile echidistante xi, valorile din cerc xci = i.(2/12), valorile observate yi, cele ateptate yai = T0 + [s1.sin(xci) + c1.cos(xci)] + [s2.sin(2.xci) + c2.cos(2.xci)] i diferenele yi=yi-yai sunt :

xi 1 2 3 4 5 6 7 8 9 10 11 12

Xci 0.5235989 1.047198 1.570797 2.094395 2.617994 3.141593 3.665192 4.188791 4.712390 5.235988 5.759587 6.283186

Yi -2.4 -0.3 5.2 11.6 16.9 20.6 22.8 22.3 17.8 11.8 5.5 0.4

yai -2.06 -0.06 5.03 11.31 17.00 20.98 22.69 21.79 18.11 12.12 5.33 -0.05

yi -0.34 -0.24 0.17 0.29 -0.10 -0.38 0.11 0.51 -0.31 -0.32 0.17 0.45

Variaia total este SPAY=2381.04, variaia rezidual este SPAY.X=1.148, deci raportul de corelaie trigonometric dat de relaia (1) va fi Rc=0.999759 Raportul Fisher este dat de relaia (6) i pentru n=12; k=2 capt valoarea : Ft=3629 cu (4; 7)GL. Valorile critice Fisher din tabele 4,5,6 din Anex, cu (4;7)GL sunt F0.05=4.12; F0.01=7.85; F0.001=17.19

186

Cum Ft=3629 >F0.001=17.19, corelaia trigonometric n populaia din care provine sondajul, este foarte semnificativ.
b) Diagrama precipitaiilor are forma :

b) Funcia de regresie trigonometric pentru precipitaiile medii lunare Z cu k=5 armonice, are coeficienii: T0=491.0834 m3/ha S1= -20.8963; C1= -145.0328; S2= -26.7024; C2= 121.2500; S3= 6.8334; C3= -40.6666; S4= -25.8362; C4= 17.9168; S5 = 19.2296 ; C5 = - 38.8806 Valorile echidistante xi, valorile din cerc xci = i.(2/ 12), valorile observate zi, valorile ateptate
zai = T0 + [ s j .sin( j.xci ) + c j cos( j.xci )]
j =1 5

i diferenele zi=zi - zai sunt date de tabelul de mai jos. xi 1 2 3 4 5 6 7 8 9 10 11 12 xci 0.5235989 1.047198 1.570797 2.094395 2.617994 3.141593 3.665192 4.188791 4.712390 5.235988 5.759587 6.283186 zi 406 340 374 444 681 860 578 512 391 411 485 411 zai 411.25 334.75 379.25 438.75 686.25 854.75 583.25 506.75 396.25 405.75 490.25 405.75 zi - 5.25 5.25 - 5.25 5.25 - 5.25 5.25 - 5.25 5.25 - 5.25 5.25 - 5.25 5.25

187

Variaia total este SPAZ=3142985, variaia rezidual este SPAZ.X=331, deci raportul de corelaie trigonometric dat de relaia (6) este : Rc==0.9999474 Raportul Fisher Ft dat de relaia (1) ,pentru n=12, k=5 capt valoarea Ft=950.9893 cu (10; 1) GL. Valorile critice Fisher pentru (10;1) GL extrase din tabelele 4,5,6 din Anex, sunt F0.05=241.9; F0.01=6056; F0.001=605600 Cum F0.05 < Ft <F0.01, corelaia trigonometric n populaia din care provine sondajul este semnificativ. 10.2.3 Corelaia i regresia monofactorial polinomial-trigonometric Funcia de regresie are forma: y=[B0+B1x+.......+Bmxm]+[T0+S1sinx+C1cosx+........+Sksinkx+Ckcoskx] a)Partea polinomial din prima parantez ptrat din membrul doi, este neperiodic i se numete tendin (trend), coeficienii B0, B1, ........, Bm, se stabilesc ca n seciunea 10.3.1 de mai sus, prelucrnd datele primare (xi, yi) (1 i n). Valorile ateptate ale regresiei polinomiale sunt date de relaia yapi= B0+B1xi+.......+Bmxim, iar ypi=yi-yapi. Testarea ipotezei H: cp=0 fa de alternativa H: cp0 adic a inexistenei sau a existenei trendului polinomial n populaia din care face parte sondajul, se face cu raportul Fisher dat de relaia (4) : Fp=[Rcp2/(1-Rcp2 ]: [m/(n-m-1)], care are (m; n-m-1) GL. Aici raportul de corelaie polinomial Rcp are forma din relaia (1): SPAY . X Rcp= 1 , SPAY cu SPAY= ( yi y ) 2 ;SPAY.X= ( yi yapi ) 2 . a) Partea trigonometric din a doua parantez ptrat din membrul doi al funciei de regresie de mai sus ,este periodic i se numete parte ciclic sau sezonier, coeficienii T0, S1, C1,........, Sk, Ck se stabilesc ca n seciunea 10.3.2 de mai sus, prelucrnd datele reziduale (xi; ypi) de la regresia polinomial, unde ypi=yi-yapi (1 i n). Valorile ateptate ale regresiei trigonometrice sunt date de relaia : yati=T0+S1sin xi+C1cos xi+........+Sksin kxi+Ckcos kxi. Diferenele ypti = ypi yati are forma ypti=yi-yapi - yati . Valorile ateptate ale regresiei polinomial-trigonometrice sunt: yapti= yapi + yati , aa c ypti=yi - yapti . Testarea ipotezei H: ct=0 fa de alternativa H:ct 0, adic a inexistenei sau a existenei prii ciclice n populaia din care face parte sondajul, se face cu raportul Fisher dat de relaia (6) i anume : Ft=[(Rct)2/(1-(Rct)2 )]: [2k/(n-2k-1)] cu (2k; n-2k-1) GL. Aici raportul de corelaie trigonometric are forma din relaia (1) i anume: SPADY . X Rct= 1 SPADY
i =1 i =1 n n

188

unde SPADY= (ypi ypi ) 2


i =1 n

i SPADY.X= (ypi yati ) 2


Exemplul 1 X=timpul (zile trecute de la data ftrii) Y=producia zilnic de lapte de vac (litri/zi) Date de sondaj: xi 28 56 84 112 140 168 yi 15 18 20 21 22 19
i =1

196 16

224 12

252 8

280 4

308 2

a) Graficul perechilor (x,y) are forma:

a) Regresia polinomial: Pentru funcia polinomial alegem gradul m=3, deci y= B0+B1x+B2x2+B3x3. Sistemul de 4 ecuaii normale are ca soluii coeficienii de regresie: B0=7.61776; B1=0.28246; B2=- 0.00166; B3=0.0000022. Valorile echidistante xi, valorile n cerc xci = i.(2 / 11), valorile observate yi, valorile ateptate yapi = B0+B1 .xi +B2 xi 2 +B3 xi 3 ale regresiei polinomiale i diferenele ypi=yiyapi se gsesc n tabelul de mai jos. Avem SPAY=478.182; SPAY.X=5.481, deci Rcp=0.994252 cu (3; 7)GL. Valoarea Fisher este Fp=201.22, iar valorile critice din tabelele 4,5,6 din Anex, pentru (3;7) GL sunt: F0.05=4.35; F0.01=8.45; F0.001=18.77 Cum Fp=201.22>F0.001=18.77, corelaia polinomial este foarte semnificativ n populaia din care provine sodajul. b) Regresia trigonometric : Perechile de valori (xi; ypi) din tabelul de mai jos se prelucreaz cu regresia trigonometric cu k=2 armonice, deci: yp=S0+(S1sinx+C1cosx)+(S2sin2x+C2cos2x.) Conform seciunii 10.3.2 de mai sus, avem coeficienii de regresie trigonometric: T0=0.00000217 S1= -0.0548; C1= -0.2158; S2= 0.3089; C2= 0.7362;

189

Valorile ateptate ale regresiei polinomial-trigonometrice yapti =[ B0+B1 .xi +B2 xi 2 +B3 xi 3 ] + [ T0 +s1.sin(xci) +c1.cos(xci)+ + s2.sin(2.xci)+c2.cos(2.xci)] i diferenele ypti=yi-yapti se gsesc n tabelul de mai jos: xi 28 56 84 112 140 168 196 224 252 280 308 yi 15 18 20 21 22 19 16 12 8 4 2 xci 0.5711987 1.142397 1.713596 2.284795 2.855994 3.427193 3.998391 4.569590 5.140789 5.711987 6.283186 yapi 14.27 18.61 20.92 21.49 20.62 18.60 15.71 12.24 8.49 4.75 1.30 ypi 0.73 -0.61 -0.92 -0.49 1.38 0.40 0.29 -0.24 -0.49 -0.75 0.70 Yapti 14.65 18.22 20.10 21.18 21.27 19.61 16.09 11.71 7.74 4.62 1.82 ypti 0.35 -0.22 -0.10 -0.18 0.73 -0.61 -0.09 0.29 0.26 -0.62 0.18

Avem SPADY=5.481; SPAY.X=1.702, deci Rct=0.8302674 cu (4; 6)GL. Valoarea Fisher este Ft=3.328, iar valorile critice din tabelele 4,5,6 din Anex, pentru (4; 6) GL sunt F0.05=4.53; F0.01=9.15; F0.001=21.92. Cum Ft=3.328<F0.05=4.53, corelaia trigonometric este nesemnificativ n populaia din care provine sondajul. Media de sondaj de evoluie este :
Y Y1 + Y2 + ... + Yn 1 + n 2 = 14.85 litri lapte/zi MYc = 2 n 1
Exemplul 2 X= timpul (zile trecute de la data ecloziunii oulelor de gin) Y=greutate pui broiler (grame) Date de sondaj: xi 0 7 14 21 28 35 42 yi 21 92 213 378 580 791 1005

49 1220

56 1432

Graficul perechilor (x,y) este:

190

Regresia polinomial : Lum m=3, deci: B0=19.74748; B1=6.16912; B2=0.63531; B3= - 0.0052885 Valorile echidistante xi, valorile n cerc xci = i.(2/9), valorile observate yi, valorile ateptate yapi = B0+B1 .xi +B2 xi 2 +B3 xi 3 ale regresiei polinomiale i diferenele ypi=yi-yapi se gsesc n tabelul de mai jos. SPAY=2057641; SPAY.X=108; Rcp=0.9999738 cu (3; 5)GL; Fp=31804.948*** F0.05=5.41; F0.01=12.06; F0.001=33.20<Fp Corelaia polinomial n populaia din care provine sondajul este foarte semnificativ.

a)

b) Regresia trigonometric : Lum k=2 armonice, deci: T0= - 0.00007354; S1= -0.4810; C1= -0.7903; S2=4.0881; C2=1.6168 Valorile ateptate ale regresiei polinomial-trigonometrice yapti =[ B0+B1 .xi +B2 xi 2 +B3 xi 3 ] + [ T0 +s1.sin(xci) +c1.cos(xci)+ + s2.sin(2.xci)+c2.cos(2.xci)] i diferenele ypti=yi-yapti se gsesc n tabelul de mai jos:

SPAy=107.72; SPAy.x=16.90; Rct=0.9182102 cu (4; 4)GL; Ft=5.374; F0.05=9.28; F0.01=29.46; F0.001=141.10 Ft < F0.05 deci corelaia trigonometric este nesemnificativ n populaia din care provine sondajul. Media de sondaj de evoluie este :

191

Y Y1 + Y2 + ... + Yn 1 + n 2 = 625.7 g MYc = 2 n 1 Tabelul final cu rezultate este : xi 0 7 14 21 28 35 42 49 56 xci 0.6981318 1.396264 2.094395 2.792527 3.490659 4.188791 4.886923 5.585055 6.283186 yi 21 92 213 378 580 791 1005 1220 1432 yapi 19.75 92.25 216.12 380.49 574.47 787.18 1007.72 1225.22 1428.80 ypi 1.25 -0.25 -3.12 -2.49 5.53 3.83 -2.72 -5.22 3.20 yapti 23.14 91.52 211.75 379.68 579.25 790.72 1005.14 1221.18 1429.62 ypti -2.14 0.48 1.25 -1.68 0.75 0.28 -0.14 -1.18 2.38

10.3 CORELAII I REGRESII POLIFACTORIALE

10.3.1 Corelaia i regresia polifactorial liniar pentru cazul a 2+1 caractere Fie X, Y, Z trei caractere ale exemplarelor unei populaii. Efectum un sondaj de n exemplare din populaie i obinem triplete de valori (xi,yi,zi) (i=1,,n). Reprezentnd n spaiul R3 fa de sistemul de axe 0xzy cele n triplete se vor corespunde cu n puncte n spaiu care vor forma un nor. Dup forma acestui nor, funcia de regresie va fi liniar (norul are form turtit ca o scoic) sau neliniar (norul are alt form dect n cazul liniar). Din datele de sondaj (xi,yi,zi) (i=1,,n) calculm urmtorii indicatori statistici de sondaj: a) Vectorul mediilor: X ,Y , Z unde:

X = MX = b)

1 1 1 xi , Y = MY = yi , Z = MZ = zi n n n S2 SXY X 2 Matricea simetric de covarian: S = SYX SY SZX SZY

SXZ SYZ S2 Z

unde varianele sunt: S2 X =

iar covarianele sunt: 1 1 xi X yi Y ; S2 S2 xi X XY = XZ = n-1 n-1 c) Matricea simetric de corelaie liniar:

1 1 1 2 xi X ; SY yi Y ; S2 = zi Z Z= n-1 n-1 n-1

)
i

)(

)( z Z ); S
i

2 YZ

1 yi Y n-1

)( z Z );

1 T = RYX R ZX

RXY 1 RZY

RXZ RYZ 1

192

SXY S S [ -1;1] ; R XZ = XZ [ -1;1] ; R YZ = YZ [ -1;1] SX SY SX SZ SY S Z Funcia de regresie liniar multipl are forma: Z = B0 + B1 X + B2Y unde coeficienii de regresie liniar multipl B0, B1, B2 sunt dai de:

unde

RXY =

Teorema 10.6

1)

Planul de regresie Z = B0 + B1 X + B2Y are coeficienii B1, B2 ca soluii ale sistemului

B1S2 X + B2 S XY = S XZ iar B0 = Z B1 X B2 Y liniar: 2 B1S XY +B2 SY = SYZ Dac regresia este fr termen liber (B0=0) B1 i B2 sunt soluiile sistemului liniar: 2 B1 xi + B2 xi yi = xi zi 2 B1 xi yi + B2 yi = yi zi

2)

Limea fiei de ncredere este =


2

( n 1) (1 RZ2. XY ) SZ t ; (n 3)GL 2 n ( n 3)

unde

RZ . XY

este definit n teorema 10.7 Demonstraie 1) Dac regresia este cu termen liber (B0=0) vom minimiza variaia rezidual cu necunoscutele B0, B1, B2: 2 2 SPA Z XY = ( z1 B1 x1 B2 y1 B0 ) + L + ( zn B1 xn B2 yn B0 ) = minim.

Anulnd derivatele pariale ale lui SPA Z.XY n raport cu B1, B2, B0, obinem sistemul de ecuaii normale cu necunoscutele B1, B2, B0: B1 xi2 + B2 xi yi + B0 xi = xi zi 2 B1 xi yi + B2 yi + B0 yi = yi zi B 1 xi + B2 yi + nB0 = zi Din a 3-a ecuaie avem: B0 =

z
n

B1

x
n

B2

y
n

i nlocuim n primele dou ecuaii

B1S2 X + B2 S XY = S XZ de unde rezult pe B0, dup mprirea ambilor membri cu n-1 obinem: 2 B1S XY +B2 SY = SYZ B1 i B2. Dac regresia este fr termen liber (B0=0) vom minimiza variaia rezidual cu necunoscutele B1 i B2: 2 2 SPA Z.XY = ( z1 B1 x1 B2 y1 ) + L + ( zn B1 xn B2 yn ) = minim.

B1 xi2 + B2 xi yi = xi zi normale cu necunoscutele B1 i B2: 2 B1 xi yi + B2 yi = yi zi


Prin rezolvarea acestui sistem gsim pe B1 i B2. 2) Avem M(Z-B0-B1X-B2Y)=M(Z)-B0-B1M(X)-B2M(Y)=0 i

Anulnd derivatele pariale ale lui SPA Z.XY n raport cu B1 i B2, gsim sistemul de ecuaii

193

V ( Z-B0 -B1 X-B2 Y ) =

2 Z . XY

deci variabila normat

( Z-B0 -B1X-B2 Y )
Z . XY

este variabil N(0,1). ( n 3) S2 Z . XY este variabila hi ptrat cu n-3 GL, independent de variabila N(0,1) Variabila 2
notat cu
t=

( Z-B0 -B1X-B2 Y )
Z . XY
Z . XY
n:

Z . XY

n . De aici rezult c:

( Z-B0 -B1X-B2 Y )

( n 3 ) S2 Z . XY

2 Z . XY

Z-B0 -B1 X-B2 Y n este SZ . XY

variabil Student cu n-3 GL. De aici rezult: P t t t


2

n3

) = 1 adic intervalul de ncredere pentru Z-B -B X-B Y :


0 1 2

P Z B0 +B1 X+B2 Y- ; B0 +B1 X+B2 Y+ 2 2 S unde = Z . XY t ;( n 3)GL este diferena limit. 2 2 n innd cont de demonstraia teoremei 10.2 avem: 2 2 2 SPA Z . XY (1 RZ . XY ) SPA Z (1 RZ . XY ) ( n 1) SZ 2 SZ . XY = = = deci avem: n3 n3 n3

=
2

( n 1) (1 RZ2. XY ) SZ t ; (n 3)GL 2 n ( n 3)

Graficul planului de regresie cu fia de ncredere are forma:

P+ P P

y y

x x
P + : Z = B0 +B1 X+B2 Y+ Aici planele de regresie P , P i P au ecuaiile: P : Z = B0 +B1 X+B2 Y P - : Z = B0 +B1 X+B2 Y-
+ 2

194

Q.E.D. Teorema 10.7

1)

Coeficientul de corelaie liniar multipl total este dat de relaia:

2 2 RZX + RZY 2 RZX RZY RXY RZ . XY = 2 1 RXY Coeficienii de corelaie liniar multipl pariali sunt dai de relaiile: RZX RZY RXY RZY RZX RXY ; R ZY . X = RZX .Y = 2 2 2 2 (1 RZY )(1 RXY ) (1 RZY )(1 RXY )

2) Aporturile variaiei X,Y, interaciunea X Y i E la variaia lui Z sunt: 2 A ( X,Y ) = RZ . XY ;


2 2 A X = A ( X,Y ) A ( Y ) = RZ . XY RZY ; 2 2 A Y = A ( X,Y ) A ( X ) = RZ . XY RZX ; 2 2 2 A XY = A ( X,Y ) A X A Y = RZX + RZY RZ . XY ; 2 A E = 1 A ( X,Y ) = 1 RZ . XY 2 RZ 2 . XY F( X,Y ) = : este variabil Fisher cu [2; n-3] GL 3) 2 1 RZ . XY n 3 RZX .Y RZY . X tX = n 2 i t Y = n 2 sunt variabile Student cu n-2 GL. 2 2 1 RZX 1 R .Y ZY . X

Demonstraie:

1)

( z
n j =1

B0, B1, i B2 sunt dai de teorema 10.6, pct. 1); se verific prin calcul relaia:
j

) = ( B x +B y
2 n j =1 1 j 2

+ B0 Z

) + (z
2 n j =1

B1 x j B2 y j -B0 )

adic

SPA Z = SPA R + SPA Z . XY cu n -1 = 2 + ( n - 3)

GL

(1)

Definim coeficientul de corelaie liniar multipl total: SPA Z . XY RZ . XY = 1 SPA Z

(2)
1 2 0

deci conform relaiei (1) avem: RZ . XY

SPA R = = SPA Z

( B x +B y + B (z Z )
j j 2 j

nlocuind pe B1, B2 i B0 dai de teorema 10.1 pct. 1) n aceast expresie, rezult prin calcul: RZ . XY =
2 2 RZX + RZY 2 RZX RZY RXY . 2 1 RXY

195

Fie

TXX * T = TYX T ZX

TXY TYY TZY


TZZ

TXZ TYZ TZZ

matricea adjunct a matricii de corelaie T, format cu complemenii algebrici ai elementelor din T


(3)

Rezult RZ . XY = 1

det ( T )

Dac B1, B2 i B0 sunt dai de teorema 6.1 punctul 1), se verific prin calcul relaia (cu Y=constant):

( z

) = (B x + B y
2 1 i 2

+ B0 Z

) + ( z B x B y
2
i

1 i

B0 ) (4)
2

SPA Z .Y = SPA RX + SPA Z . XY

cu

n - 2 = 1 + (n - 3) GL

Definim coeficientul de corelaie liniar multipl parial (cnd Y=constant):


RZX .Y = 1 SPA Z . XY SPA Z .Y

(5) SPA RX = = SPA Z .Y

deci conform relaiei (3) avem: RZX .Y

( B x +B y + B ( z Z )
1 i 2 0 2
i

i nlocuind pe B1, B2 i B0 cu valorile lor din teorema 11.1 punctul 1), gsim prin calcul: RZX .Y
2 1 RZ . XY = 1 = 2 1 RZY

(1 R )(1 R )
2 ZY 2 XY

RZX RZY RXY

(6)
TYZ TYY TZZ

Cu ajutorul complemenilor algebrici din T* avem: RZX .Y =


2 2 2 Observm c: 1 RZ . XY = (1 RZY )(1 RZX .Y ) de unde rezult:

RZX .Y = 1 RZ . XY = 1 RZX .Y = 0 RZ . XY = RZY

n mod analog definim coeficientul de corelaie liniar multipl parial: (cnd X=constant): SPA Z . XY care dup calcule capt forma: RZY . X = 1 SPA Z . X

RZY . X = 1

2 1 RZ . XY = 2 1 RZX

(1 R )(1 R )
2 ZX 2 XY

RZY RZX RXY

Cu ajutorul complemenilor algebrici din L* avem: RZY . X =


2 2 2 Observm c: 1 RZ . XY = (1 RZX )(1 RZY . X ) de unde rezult:

LXZ LXX LZZ

RZY . X = 1 RZ . XY = 1 RZY . X = 0 RZ . XY = RZX

2)

innd cont de relaia (2), relaia (1) se scrie:

196
2 2 2 2 SPA Z = RZ . XY SPA Z + (1 RZ . XY ) SPA Z sau 1 = RZ . XY + (1 RZ . XY ) aa c 2 2 A ( X,Y ) = RZ . XY ; A E = 1 RZ . XY .

2 innd cont de relaia SPA Z .Y = (1 RZY ) SPA Z precum i de relaiile (2) i (4), relaia (3)
2 2 2 2 devine: (1 RZY ) SPA Z = RZX .Y (1 RZY ) SPA Z + (1 RZ . XY ) SPA Z 2 2 2 2 1 RZY = RZX .Y (1 RZY ) + (1 RZ . XY )

adic:

2 2 2 2 n mod analog rezult relaia: A Y = RZY . X (1 RZX ) = RZ . XY RZX = A ( X,Y ) A ( X ) 2 2 2 2 + RZY RZ n fine: A XY = A ( X,Y ) A ( X ) A ( Y ) = RZY . XY i A E = 1 A ( X,Y ) = 1 RZ . XY

2 2 2 2 deci A X = RZX .Y (1 RZY ) = RZ . XY RZY = A ( X,Y ) A (Y)

3)

Avem variana total:

SPA Z = S2 Z = GL Z SPA R S2 = R = GL R

( z
1 i

n 1 2

variana regresiei totale: variana rezidual:

(B x
i

+ B2 yi + B0 Z

2 Z . XY

SPA Z . XY = = GL Z . XY

( z -B x

1 i

B2 yi B0 )

n3

Rezult variabila Fisher F( X,Y ) =


2 R

2 2 SPA Z . XY (1 RZ . XY ) SPA Z SPA R RZ 2 . XY SPA Z Dar S = = i SZ . XY = = aa c: n3 n3 2 2 2 RZ 2 . XY = cu (2; n-3) GL F( X,Y ) : 2 1 RZ . XY n 3

S2 R cu (2; n-3) GL. 2 SZ . XY

SPA Z .Y = Avem variana parial (cnd Y=constant): S2 Z .Y = GL Z .Y variana regresiei pariale dup X (cnd Y=constant): S2 RX SPA RX = = GL RX

( z

n2

(B x

1 i

+ B2 y0 + B0 Z 1

variana rezidual :

2 Z . XY

SPA Z . XY = = GL Z . XY S2 RX S2 Z . XY

( z -B x
i

1 i

B2 y0 B0 )

n3

Rezult variabila Fisher FX =


2 RX

cu (1; n-3) GL.

2 2 SPA Z . XY (1 RZX .Y ) SPA Z .Y SPA RX RZX 2 .Y SPA Z .Y Dar: S = = i SZ . XY = = aa c: n3 n3 1 1 2 RZX RZX .Y 1 .Y cu (1; n-3) GL deci: tX = FX = : n 3 este variabil Student 2 2 1 RZX .Y n 3 1 RZX .Y cu n-3 GL.

197

n mod analog
Q.E.D.

tY =

RZY . X 1 R
2 ZY . X

n 3 este variabil Student cu n-3 GL .

ntre coeficienii de corelaie pariali i coeficienii de regresie liniar multipl exist relaiile: S S B1 = RZX .Y Z .Y ; B2 = RZY . X Z . X S X .Y SY . X care generalizeaz relaia de la corelaia liniar simpl ntre X i Y: S B1 = R Y . SX Ecuaia planului de regresie se poate scrie i sub forma: Z Z = B1 X X + B2 Y Y .

n continuare vom aborda testele pentru corelaia liniar multipl n populaie. 1) Coeficientul de corelaie liniar multipl total de sondaj RZ.XY este variabil de la un sondaj la altul n jurul coeficientului de corelaie total necunoscut Z.XY din populaie. Testul ipotezei H: Z.XY=0 fa de alternativa H : Z . XY 0 se face pe baza teoremei 10.2 punctul 3) astfel: 2 RZ 2 . XY cu (2; n-3) GL. Din tabelele 4,5,6 din Anex, pentru (2; n: Calculm F( X,Y ) = 2 1 RZ . XY n 3 3) GL extragem valorile critice F0.05; F0.01; F0.001. Decizia asupra ipotezei H se ia astfel: dac F(X,Y) < F0.05 ipoteza H se accept: Z.XY =0 deci Z i perechea (X,Y) nu sunt corelate liniar n populaie. n caz contrar avem cazurile: a) F0.05 F(X,Y) < F0.001 deci Z i (X,Y) sunt corelate liniar semnificativ. b) F0.01 F(X,Y) < F0.001 deci Z i (X,Y) sunt corelate liniar distinct semnificativ. c) F(X,Y) F0.001 deci Z i (X,Y) sunt corelate liniar foarte semnificativ. 2) Coeficienii de corelaie liniar multipl pariali de sondaj RZX.Y i RZY.X sunt variabili de la un sondaj la altul n jurul coeficienilor de corelaie pariali necunoscui ZX.Y i respectiv ZY.X din populaie. Testul ipotezei H: ZX.Y=0 fa de alternativa H : ZX .Y 0 se face pe baza teoremei 10.2 RZX .Y punctul 3) astfel: se calculeaz tX = n 3 cu n-3 GL. Din tabela 2 din Anex, 2 1 RZX .Y pentru n-3 GL extragem valorile critice t0.025; t0.0025; t0.0005 Decizia asupra ipotezei H se ia astfel: dac tX < t0.025 , ipoteza H se accept: ZX.Y=0 deci Z i X nu sunt corelate liniar n populaie pentru Y=constant. n caz contrar avem cazurile: a) t0.025 tX < t0.0025 deci Z i X sunt corelate liniar semnificativ cnd Y=constant b) t0.0025 tX < t0.0005 deci Z i X sunt corelate liniar dinstinct semnificativ cnd Y=constant c) tX t0.0005 deci Z i X sunt corelate liniar foarte semnificativ cnd Y=constant

198

Decizia asupra ipotezei H : ZY . X = 0 fa de alternativa H : ZY . X 0 se ia n mod RZY . X asemntor cu ajutorul lui tY = n 3 cu (n-3) GL. 2 1 RZY . X Exemplu X = lungime carcas porci (cm) Y = grosime strat grsime la greabn (cm) Z = greutate n viu porci (kg) Date de sondaj de la n=10 porci: xi yi zi 142 3.8 110 141 3.3 109 142 4 112 143 4.1 114 146 4.4 118 140 3 106 142 3.9 111 143 4 112 142 3.7 110 144 4.2 115

S se calculeze i s se testeze RZ.XY , RZX.Y , RZY.X , s se alctuiasc diagrama aporturilor i s se calculeze planul de regresie z = B1 x + B2 y 2.5% (regresie fr termen liber :B0 = 0 ) i s se efectueze prognoza lui Z pentru X = 150 cm; Y = 45 cm.
Soluie 1)Vectorul mediilor este X = 142.5 cm; Y = 3.84 cm; Z = 111.7 Kg

S2 S XY = 0.622 S XZ = 5.389 X = 2.722 2 = 0.176 SYZ = 1.324 Matricea de covarian este: S = SYX = 0.622 SY SZX = 5.389 SZY = 1.324 S2 Z = 11.344
1 RXY = 0.8989 RXZ = 0.9697 Matricea de corelaie liniar: T = RYX = 0.8989 1 RYZ = 0.9373 R = 0.9697 R = 0.9373 1 ZY ZX

Matricea de covarian S se calculeaz n EXCEL astfel : Inscriem datele xi n celulele A1:A10 din coloana A ,datele yi n celulele B1: B10 din coloana B ,i datele zi n celulele C1:C10 din coloana C , din foaia de calcul Nr.1 Deschidem fereastra TOOLS n care activm opiunea DATA ANALYSIS. Aici activm opiunea COVARIANCE n care declarm celulele A1:A10 , B1: B10 i C1:C10 n care se gsesc datele .Matricea de covarian S se va obine fie n foaia de calcul Nr.2 ,fie tot n foaia de calcul Nr.1 unde se gsesc datele,prin declararea ca celule de rezultate a altor celule dect cele din blocul de date A1: C10 . Matricea de corelaie liniar T se obine exact ca i S , dac n DATA ANALYSIS activm opiunea CORRELATION. 2)Coeficientul de corelaie multipl total: RZ . XY =
2 2 RZX + RZY 2 RZX RZY RXY devine 2 1 RXY

2 RZ 2 . XY devine F( X,Y ) = 90.47 cu (2 ; 7) GL RZ . XY = 0.9812 F( X,Y ) = : 2 1 RZ . XY n 3 Din tabelele 4,5,6 din Anex, avem F0.05 = 4.74; F0.01 = 9.55; F0.001.= 21.69 pentru (2 ; 7) GL.

199

Avem F(X,Y) = 90.47 > F0.001 = 21.69 deci corelaia liniar multipl ntre greutatea n viu a porcilor i perechea de factori format din lungimea carcasei i grosimea stratului de grsime la greabn, este foarte semnificativ deci RZ . XY = 0.9812*** . Coeficienii de corelaie multipl pariali: RZX RZY RXY devine R ZX .Y = 0.8328 RZX .Y = 2 2 1 1 R R ( ZY )( XY ) RZY . X = tX = tY =

(1 R )(1 R )
2 ZX 2 XY

RZY RZX RXY

devine R ZY . X = 0.4297 tX = 3.98 cu 7 GL.

RZX .Y
2 1 RZX .Y

n3

devine

n 3 devine tY = 1.26 cu 7 GL. 2 1 RZY .X Din tabela 2 din Anex,pentru 7 GL gsim: t0.025 = 2.36; t0.005 = 3.50; t0.0005.= 5.41 Cum t0.005 = 3.50 < tX < t0.005 = 5.41 corelaia liniar parial ntre greutatea n viu a porcilor i lungimea carcasei cnd grosimea stratului de grsime este constant, este distinct semnificativ deci RZX .Y = 0.8328** Cum tY < t0.025 = 2.36, corelaia liniar ntre greutatea n viu a porcilor i grosimea stratului de grsime cnd lungimea carcasei este constant, este nesemnificativ deci RZY . X = 0.4297 Aporturi: 2 2 A ( X,Y ) = RZ . XY = 0.98 = 96.3%
2 2 A X = RZ . XY RZY = 8.4% 2 2 A Y = RZ . XY RZX = 2.2%

RZY . X

A XY = A ( X,Y ) A X A Y = 85.7% A E = 1 A ( X,Y ) = 3.7%

Variaia total a greutii n viu a porcilor fiind considerat 100%, 8.4% din ea se datorete variaiei lungimii carcasei, 2.2% din ea se datorete variaiei grosimii stratului de grsime, 85.7% din ea se datorete variaiei interaciunii ntre lungimea carcasei i grosimea stratului de grsime iar restul de 3.7% se datorete variaiei altor factori necontrolai numii Eroare care au fost relativ constani pentru cele 10 exemplare din sondaj. 3)Planul de regresie: Z = B1 X + B2Y (regesia este fr termen liber :B0=0) B1 i B2 sunt soluiile sistemului liniar : 2 203087 B1 + 5477.6 B2 = 159221 B1 xi + B2 xi yi = xi zi de unde: adic 2 = 5477.6 B +149.04 B 4301.2 y y y z = B x +B 1 2 i i i i 1 i 2 0.6441 Kg cretere greutate porc cnd grosimea stratului de grsime este constant. 1 cm cretere lungime carcas 5.1858 Kg cretere greutate porc B2 = cnd lungimea carcasei este constant 1 cm cretere lungime carcas B1 =

200

Limea fiei de ncredere este: =


2

( n 1) (1 RZ2. XY ) SZ t ; (n 3)GL 2 n ( n 3)

Pentru = 5% din tabela 2 din Anex, avem t0.005 = 2.36 pentru 7 GL aa c 2.5% = 0.55 Kg. Planul de regresie cu fia de ncredere va fi: Z = 0.6441X + 5.1858Y 0.55 .
Prognoz pentru X = 70 cm; Z = 4.5 cm: Valoarea ateptat a lui Z va fi:
119.45 Kg (Minima) Za = ( 0.6441 70 ) + ( 5.1858 4.5 ) 0.55 = 119.95 Kg (Media) 120.50 Kg (Maxima) La o lungime a carcasei de 70 cm i la o grosime a stratului de grsime de 4.5 cm, ne ateptm ca greutatea n viu a tuturor porcilor din care provin cei 10, s fie cuprins ntre 119.45 Kg i 120.50 Kg cu o ncredere de 95%. Exist semiriscul 2.5% ca aceast greutate s fie mai mic de 119.45 Kg atunci cnd cei 10 porci ai sondajului au fost alei cei mai performani ca greutate. n mod simetric, exist semiriscul 2.5% ca aceast greutate s fie mai mare ca 120.50 Kg atunci cnd cei 10 porci ai sondajului au fost alei cel mai puin performani ca greutate. n tabelul de mai jos se gsesc valorile xi, yi, valorile ateptate zi, valorile ateptate zai i diferenele zi = zi zai:

xi 62 61 62 63 66 60 62 63 62 64

yi 3.8 3.3 4 4.1 4.4 3 3.9 4 3.7 4.2

zi 110 109 112 114 118 106 111 112 110 115

zai 111.173 107.936 112.210 113.373 116.861 105.736 111.692 112.854 110.655 114.536

zi -1.173 1.064 -0.210 0.627 1.139 0.264 -0.692 -0.854 -0.655 0.464

O sintez elegant a acestor calcule este dat n foaia de calcul C3P1.XLS pentru regresii cu termen liber i n foaia de calcul C3P10.XLS pentru regresii fr termen liber ,aflate n Anex. 10.3.2 Corelaia i regresia polifactorial liniar pentru cazul a m+1 caractere Fie X(1), X(2),...,X(m),Y notaiile pentru m+1 caractere ale exemplarelor unei populaii. Efectum un sondaj de n ansambluri de valori (x1i,x2i,...,xmi ; yi) ; (i=1,,n). Din aceste date calculm urmtorii indicatori statistici de sondaj:

201

a)
b)

1 n 1 n Vectorul mediilor: X 1 ,..., X m ;Y unde X i = xij ; Y = yi n i =1 n i =1 Matricea simetric de covarian de ordin m+1:

S2 X 1 S X 2 X1 S = ...... S X n X1 SYX 1

S X1 X 2 S2 X2 ...... SX n X 2 SYX 2
2 Xi

...... S X1X n ...... S X 2 X n ...... ...... ...... ...... S2 Xn SYX n

S X1Y S X 2Y ...... S X nY 2 SY

1 n 1 n 2 unde varianele sunt: S = yi Y xij X i ; SY = n-1 n-1 j =1 i =1

iar

covarianele sunt:

S
c)

2 Xi X j

1 n = xik X i n-1 k =1

)( x

jk

Xj ;S

2 X iY

1 n = xij X i n-1 j =1

)( y

Matricea simetric de corelaie liniar de ordin m+1:

1 RX 2 X1 T = ...... RX m X 1 RYX 1

RX 1 X 2 1 ...... RX m X 2 RYX 2

...... RX1X m ...... RX 2 X m ...... ...... ...... ...... 1 RYX m

RX1Y RX 2Y ...... RX mY 1

Funcia de regresie liniar multipl are forma: Y = B0 + B1 X 1 + ... + Bm X m . Coeficienii B0, B1,...,Bm se obin prin metoda celor mai mici ptrate:
n

Variaia rezidual

SPAY . X1 ,..., X m = ( y j B0 B1 x1 j ... Bm xmj ) = minim .


j =1

Anulnd derivatele pariale ale variaiei reziduale n raport cu B1,...,Bm,B0 obinem:

2 x1 j ( y j B0 B1 x1 j ... Bm xmj ) = 0
j =1

202

................................................................ 2 xmj ( y j B0 B1 x1 j ... Bm xmj ) = 0


j =1 n n

2 ( y j B0 B1 x1 j ... Bm xmj ) = 0
j =1

sau :
n n n n 2 B1 x1 j + ... + Bm x1 j xmj +B0 x1 j = x1 j y j j =1 j =1 j =1 j =1 ................................................................................ n n n n 2 xmj x1 j + ... + Bm xmj +B0 xmj = xmj y j B1 j =1 j =1 j =1 j =1 n n n B1 x1 j + ... + Bm xmj +nB0 = y j j =1 j =1 j =1

(6)

Acesta este sistemul de m+1 ecuaii normale al regresiei liniare multiple cu m+1 necunoscute B0, B1,,Bm. Fie matricea cu n linii i m+1 coloane:

x11 x21 ...... xm1 1 X= ...... ...... ...... ...... ...... x1n x2 n ...... xmn 1

i fie vectorul-coloan al necunoscutelor

B1 y1 M respectiv vectorul-coloan al termenilor liberi Y = B= M Bm y n B 0

Sistemul (6) capt forma matricial: X T X B=X T Y Dac rang ( X T X ) = m + 1 adic det ( X T X ) 0 sistemul (7) are soluia matricial: Sistemul (6) se poate aduce la forma: B= ( X T X ) X T Y
1

(7)

203

B1S2 X1 + B2S X1 X 2 + ... + BmS X1 X m = S X 1Y ........................................................ 2 B1S X m X1 + B2S X m X 2 + ... + BmS X m = S X mY B = Y B X ... B X m m 1 1 0
Pentru aceasta, se mparte ultima ecuaie din (6) cu n adic:

(8)

1 n 1 n 1 n B1 x1 j + ... + Bm xmj + B0 = y j n j =1 n j =1 n j =1
Ecuaia (9) se nmuleste cu

(9)

x
j =1

1j

n ambii membri i rezultatul se scade din prima ecuaie a

sistemului (6) ,obinnd prima ecuaie a sistemului (8),.., ecuaia (9) se nmulete cu

x
j =1

mj

n ambii membri i rezultatul se scade din a m-a ecuaie a sistemului (6), obinnd a m-

a ecuaie a sistemului (8). n cazul regresiei fr termen liber (B0=0) sistemul de ecuaii normale are forma:
n n n 2 B1 x1 j + ... + Bm x1 j xmj = x1 j y j j =1 j =1 j =1 .............................................................. n n n 2 B1 xmj x1 j + ... + Bm xmj = xmj y j j =1 j =1 j =1

(10)

Matricea X0 are m linii i n coloane , avnd forma:


x11 x21 ...... xm1 X0 = ...... ...... ...... ...... x1n x2 n ...... xmn B1 y1 Cu vectorii-coloan B = M ; Y = M B y m n
T sistemul (10) capat forma matricial: X T 0 X 0 B=X 0 Y

T T X0 Y i pentru det ( X T 0 X 0 ) 0 , acest sistem are soluia matricial: B= ( X 0 X 0 )


1

Ca i n demonstraia teoremei 10.1, se arat c limea fiei de ncredere este:

204

=
2

( n 1) (1 RY2X ,..., X n ( n m 1)
1

) S

; (n m 1) GL

(11)

2 unde RY X1 ... X m este definit mai jos n relaia (13).

Fie

Ti1 ,...,ik ;m+1

valoarea minorului de ordin k+1 din matricea de corelaie liniar R i fie

si coloanele i1, ,ik, unde i1 ,..., ik {1, 2,..., m} . Conform relaiilor (2) si (3) definim coeficientul de corelaie liniar multipl total ntre Y i X i ,..., X i astfel:
1 k

Ti1 ,...,ik

valoarea complementului algebric de ordin k din minorul precedent, format cu liniile

RY X i ,..., X i = 1
1 k

SPAY X i ,..., X i
1

SPAY

= 1

Ti1 ,...,ik ;m+1 Ti1 ,...,ik

(12)

n particular pentru k =m avem coeficientul de corelaie liniar multipl total ntre Y i toate caracterele X1,,Xm :

RY X1 ,..., X m = 1

SPAY X1 ,..., X m SPAY

= 1

T1,...,m;m+1 T1,...,m

(13)

Ca i n demonstraia teoremei 10.7, testarea coeficientului de corelaie liniar total n populaie adic verificarea ipotezei H : Y X ,..., X = 0 fa de alternative
i1 ik

H : Y X i ,..., X i 0 se face cu variabila Fisher:


1 k

F(i1 ,...,ik ) =

RY2 X i ,..., X i
1

1 R

2 Y X i1 ,..., X ik

k cu n k 1

( k ; n k 1) GL
(14)

(k = 1,2,,m). Conform relaiei (5) din demonstraia teoremei 6.7, definim coeficientul de corelaie liniar multiplu parial ntre Y i X i ,..., X i cnd restul de caractere X j ,..., X j sunt
constani:
1 k 1 mk

RYX i ,..., X i X j ,..., X j


1 k 1

mk

= 1

SPAY X1 ,..., X m SPAY X j ,..., X j


1 mk

= 1

1 RY2 X1 ,..., X m
2 1 RY X j ,..., X j
1 mk

(15)

205

Ca i n demonstraia teoremei 10.7, testarea coeficientului de corelaie liniar parial n = 0 fa de alternativa populaie adic verificarea ipotezei: H : YX ,..., X X ,..., X
i1 ik j1 jm k

H : YX i ,..., X i
1

X j1 ,..., X jm k

0
1

se face cu variabila Fisher:

F( i1 ,...,ik ) = cu

2 RYX i ,..., X i X j ,..., X j


1 k 1 k 1

mk

2 1 RYX i ,..., X i X j ,..., X j

mk

k n m 1

; (k = 1,2,,m)

(16)

( k ; n m 1)

GL

n continuare vom calcula aporturile variaiei caracterelor X1,,Xm i interaciunii acestora la variaia lui Y stabilite de ENE DUMITRU n lucrrile 42 i 48 (vezi Bibliografia). a)Calculm aporturile totale ale variaiei caracterelor X i ,..., X i la variaia lui Y cu
1 k

relaia:

Pe baza acestei relaii calculm C1 m aporturi ale cte unui factor:

( X i1 ,..., X ik )

= RY2 X i ,..., X i
1

(17) 2m-1 aporturi totale:

A ( X1 ) ,..., A ( X m )
C2 m aporturi ale ansamblurilor a 2 factori:

A ( X1 ; X 2 ) ,..., A ( X m1 ; X m ) ................................
Ck m aporturi ale ansamblurilor a k factori:

A ( X1 ,..., X k ) ,..., A ( X mk +1 ,..., X m )

.......................................
A( X1 ,..., X m )

Cm m = 1 aporturi ale ansamblurilor a m factori:

Cel de al 2m-lea aport total este aportul erorii:

A E = 1- A ( X1 ,..., X m )

b)Aporturile pariale ale variaiei factorilor

factorilor

X j1 ,..., X jmk

X i1 ,..., X ik

i interaciunilor lor cnd restul

sunt constani, la variaia lui Y ,vor fi date de relaiile:

206

+ A X i ... X i = A X ,..., X k 1 ( ) j1 jm k + A X , X ,..., X + ... + A X , X ,..., X ( ik j1 jmk ) ( i1 j1 jmk ) + A X , X , X ,..., X + ... + A X , X X ,..., X ( ) ( ) i1 i2 j1 jmk ik 1 ik j1 jm k +... + ( 1)
k 1

(18)

A X ,..., X ( 1 m)

n membrul drept al acestei relaii, n prima parantez ptrat avem C0 k = 1 , aporturi totale cu m-k factori, n a doua parantez ptrat avem C1 k aporturi totale cu m-k+1 factori, n a treia 2 parantez ptrat avem Ck aporturi totale cu m-k+2 factori, etc., n ultima parantez ptrat avem C k k = 1 aporturi totale cu m factori. n total n membrul drept al relaiei (18) avem n cele k+1 paranteze ptrate, un numr de 2k aporturi totale. Mai departe avem:

A X1... X m = A ( X1 ,..., X m ) A X1 + ... + AX m A X1 X 2 + ... + AX m1. X m A X1... X m1 + A X 2 ... X m ...


adic:

A X1... X m = A ( X1 ) + ... + A ( X m ) A ( X1 , X 2 ) + ... + A ( X m1 , X m ) + + A ( X1 , X 2 , X 3 ) + ... + A ( X m2 , X m1 , X m ) + +... + (1) m A ( X1 ,..., X m1 ) + A ( X 2 ,..., X m ) + +(1) m+1 A ( X1 ,..., X m )

(19)

Pe baza relaiilor (18) i (19) calculm 2m-1 aporturi pariale n care se descompune A ( X ,..., X ) :
1 m

C aporturi pariale, ale cte unui factor (k=1)cu relaia (18):

1 m

A ( X1 ) ,..., A ( X m )
C2 m aporturi pariale ale interaciunilor a cte 2 factori (k=2) cu relaia (18):

207

A ( X1 X 2 ) ,...,A ( X m1 X m ) ................................
Ck m aporturi pariale ale interaciunilor a cte k factori, cu relaia (18):

A ( X1... X k ) ,..., A ( X mk +1... X m ) .......................................


Cel de al 2m-lea aport este : Cm m = 1 aporturi pariale ale interaciunii celor m factori, cu relaia (19):

A X1... X m

A E = 1- A ( X1 ,..., X m )

n final se ntocmete diagrama aporturilor pariale ale variaiei factorilor X 1 ,..., X m i a interaciunilor lor cte 2,3,,m , la variaia lui Y presupus a fi egal cu 100%.
Exemplu

X1 = talia plantei de porumb la recoltare (cm) X2 = suprafaa foliar a plantei de porumb la recoltare (cm2) X3 = numrul de boabe pe plant la recoltare Y= greutatea boabelor pe plant la recoltare Date de sondaj de la n=10 plante:
x1 x2 x3 y

210 2080 315 42

215 2100 320 44

200 2000 300 40

220 2150 340 50

218 2120 325 46

225 2210 370 55

230 2300 400 60

226 2230 380 58

206 2050 310 41

220 2160 350 52

Se calculeaz: 1) Vectorul mediilor: X 1 = 217 cm; X 2 = 2140 cm 2 ; X 3 = 341 boabe; Y = 48.8 g;

2) Matricea de covarian:

3) Matricea de corelaie liniar:

S2 X = 88.4444; 1 S X X = 821.1111; S= 2 1 S X 3 X1 = 291.1111; S = 64.5556; YX1

S X1 X 2 = 821.1111;

S X1Y = 64.5556 S2 S X 2 X 3 = 2933.3330; S X 2Y = 635.5556 X 2 = 8044.4440; S X 3 X 2 = 2933.3330; S2 S X 3Y = 239.1111 X 3 = 1104.4450; 2 = 52.8444 SYX 2 = 636.5560; SYX 3 = 239.1111; SY S X1 X 3 = 291.1111;

208

RX1 X1 = 1; RX 2 X1 = 0.9735; T = = 0.9314; R X 3 X1 RYX = 0.9443; 1

RX1 X 2 = 0.9735; RX1 X 3 = 0.9314; RX1Y = 0.9443 RX 2 X 2 = 1; RX 2 X 3 = 0.9841; RX 2Y = 0.9748 RX 3 X 2 = 0.9841; RX 3 X 3 = 1; RX 3Y = 0.9898 RYX 2 = 0.9748; RYX 3 = 0.9898; RYY = 1

4) Calculul i testarea coeficienilor de corelaie totali:

-bifactoriali:

Rezult RY.X1X2 =0.975012 Analog :

RY X1X 2 = 1 unde: TX1X 2 1 0.9735 0.9443 TX1 X 2Y = 0.9735 1 0.9748 = 0.002581 0.9443 0.9748 1 0 0.9735 TX1 X 2 = = 0.052298 0.9735 1 TX1X 2Y

TX1X 3Y = 0.002187 i TX1 X 3 = 0.132494 deci R Y X1X 3 = 0.991712 TX 2 X 3Y = 0.0006397 i TX 2 X 3 = 0.0315473 deci R Y X 2 X 3 = 0.989809
-trifactorial:

RY X1X 2 X 3 = 1
Dar

TX1X 2 X 3Y TX1 X 2 X 3

TX1X 2 X 3Y = det.( T ) = 0.00000508

TX1X 2 X 3 = 0.00094115 RY . X1X 2 X 3 = 0.997298


Testarea coeficienilor de corelaie totali: -monofactoriali:

209

RYX1 = 0.944*** ; R YX 2 = 0.975*** ; R YX 3 = 0.990*** cu 10-2 = 8


coeficieni sunt foarte semnificativi. -bifactoriali:
2

GL.

Valorile critice R pentru 8 GL din tabela 10 din Anex,sunt 0.632; 0.765; 0.872 deci cei trei

RY X1X 2 = 0.971; R Y X1 X 3 = 0.992; R Y X 2 X 3 = 0.894


2 RX iX j

2 F( X , X ) = : 2 i j 1 RX n3 iX j

cu

[ 2; n-3] GL d: [ 2; 7]
GL

F( X1 , X 2 ) = 57.733; F( X1 , X 3 ) = 217.697; F( X 2 , X 3 ) = 13.933 cu


Din tabelele 4,5,6 din Anex, avem valorile critice F cu [2; 7] GL: F0.05 = 19.35; F0.01 = 99.35; F0.0005 = 999.35 deci:

-trifactoriali:

RY X1X 2 = 0.971* ; R Y X1X 3 = 0.992** ; R Y X 2 X 3 = 0.894

RY X1X 2 X 3 = 0.977; F( X1 , X 2 , X 3 ) =

RY2 X1X 2 X 3
2 1 RY X1 X 2 X 3

3 = 333.834 n4

Din tabelele 4,5,6 din Anex, avem valorile critice F cu [3; 6] GL: F0.05 = 8.94; F0.01 = 27.91;F0.001 = 132.8 deci:

RY X1X 2 X 3 = 0.997***

5) Calculul i testarea coeficienilor de corelaie pariali: -monofactoriali:

RYX1 X 2 X 3 = 1
n mod analog

2 1 RY X1 X 2 X 3

1 RY2 X 2 X 3

= 0.985 .
GL.

RYX 2 X1X 3 = 0.791 i R YX 3 X1X 2 = 0.946 toi cu n-4=6


2

Din tabela 10 din Anex, avem valorile critice R pentru 6 GL: R0.025 = 0.707; R0.005 = 0.834;R0.0005 = 0.925 deci: -bifactoriali:

RYX1 X 2 X 3 = 0.985*** ; R YX 2 X1X 3 = 0.791* i R YX 3 X1X 2 = 0.946*** 1 RY2 X1X 2 X 3 1 R


2 YX 3

RYX1X 2 X 3 = 1

= 0.837

210

n mod analog Avem :

RYX 2 X1 X 3 = 0.937 i R YX 3 X1X 2 = 0.972 2 n4

FX i . X j =

2 RYX k X i X j

1 R

2 YX k X i X j

cu

[ 2; n-4] GL

Din tabelele 4,5,6 din Anex, avem valorile critice F cu [2; 6] GL: F0.05 = 19.33; F0.01 = 99.30; F0.001 = 999.30 Rezult : FX1.X2 =7.02 ; FX1.X3 =21.58 ;FX2.X3 =51.33 cu (2;6) GL deci :

RYX1 X 2 X 3 = 0.837; R YX 2 X1 X 3 = 0.937* i R YX 3 X1X 2 = 0.972*

6) Calculul aporturilor totale i pariale: a) totale: -monofactoriale:

2 2 2 A ( X1 ) = RYX = 0.891702; A = R = 0.950235; A = R = 0.970704 YX YX X X ( 2) ( 3) 1 2 3


2 2 A ( X1 , X 2 ) = RY2 X1 X 2 = 0.950648; A ( X1 , X 3 ) = RY X1 X 3 = 0.983494; A ( X 2 , X 3 ) = RY X 2 X 3 = 0.979723

-bifactoriale:

-trifactoriale:

A ( X1 , X 2 , X 3 ) = RY2 X1X 2 X 3 = 0.994602

b) pariale: -monofactoriale:

A X1 = A ( X 2 , X 3 ) + A ( X1 , X 2 , X 3 ) = 0.014879 1.5%; A X 2 = A ( X1 , X 3 ) + A ( X1 , X 2 , X 3 ) = 0.011080 1.1%;


-bifactoriale :

A X 3 = A ( X1 , X 2 ) + A ( X1 , X 2 , X 3 ) = 0.043954

4.4%

A X1 . X 2 = A ( X 3 ) + A ( X1 , X 3 ) + A ( X 2 , X 3 ) A ( X1 , X 2 , X 3 ) = = 0.011089 = 1.1%; A X1 . X 3 = A ( X 2 ) + A ( X1 , X 2 ) + A ( X 3 , X 2 ) A ( X1 , X 2 , X 3 ) = = 0.014466 = 1.4%; A X 2 . X 3 = A ( X1 ) + A ( X 2 , X1 ) + A ( X 3 , X1 ) A ( X1 , X 2 , X 3 ) =

-trifactorial:

= 0.047838 = 4.8%

211

A X1 . X 2 . X 3 = A ( X1 , X 2 , X 3 ) A ( X 1 ) A ( X 2 ) A ( X 3 ) A ( X1 , X 2 ) A ( X1 , X 3 ) A ( X 2 , X 3 ) = = 0.892426 = 89.3%
Aportul erorii:

A E = 1 A( X1 , X 2, X 3 ) = 0.00539798 = 0.5%
7) Calculul funciei de regresie liniar i a fiei de ncredere: Y = B1X1+B2X2+B3X3 /2 (regresia este fr termen liber : B0 = 0 ). B1, B2, B3 sunt soluiile sistemului liniar:
n n n n 2 B1 x1 j + B2 x1 j x2 j + B3 x1 j x2 j = x1 j y j j =1 j =1 j =1 j =1 n n n n 2 B1 x2 j x1 j + B2 x2 j + B3 x2 j x3 j = x2 j y j j =1 j =1 j =1 j =1 n n n n 2 B1 x3 j x1 j + B2 x3 j x2 j + B3 x3 j = x3 j y j j =1 j =1 j =1 j =1

adic: 471686*B1+4651190*B2+742590*B3=106477 4651190*B1+45868400*B2+7323800*B3=1050040 742590*B1+7323800*B2+1172750*B3=168560 0.4258 g cretere greutate boabe de unde: B1 = 1 cm cretere talie cnd suprafaa foliar i numrul de boabe pe plant sunt constante. 0.0644 g cretere greutate boabe B2 = 1 cm 2 cretere suprafa foliar cnd talia i numrul de boabe pe plant sunt constante. 0.2761 g cretere greutate boabe B3 = 1 bob cretere nr. boabe pe plant cnd talia i suprafaa foliar sunt constante. Limea fiei de ncredere este:

=
2

( n 1) (1 RY2X X X n ( n 3)
1 2

) S

; (n 4) GL

2.5% =

(10 1)(1 0.997 ) 10 (10 3)

52.844 2.45 = 0.49 g

212

Ecuaia funciei de regresie liniar cu fia de ncredere 2.5% este: Y= 0.4258X1- 0.0644X2+0.2761X3 0.49
Prognoz: Pentru X 1 = 235 cm; X 2 = 2350 cm 2 ; X 3 = 420 boabe avem greutatea ateptat a boabelor pe plant: 64.20 g ( Minima ) Ya = ( 0.4258 235 ) ( 0.0644 2350 ) + ( 0.2761 420 ) 0.49 = 64.69 g ( Media ) 65.18 g ( Maxima ) n tabelul de mai jos, se gsesc valorile x1i ,x2i,x3i ,valorile observate yi ,valorile ateptate yai i diferenele : yi = yi - yai :

x1i 210 215 200 220 218 225 230 226 206 220

x2i 2080 2100 2000 2150 2120 2210 2300 2230 2050 2160

x3i 315 320 300 340 325 370 400 380 310 350

yi 42 44 40 50 46 55 60 58 41 52

yai 42.48 44.70 39.23 49.14 46.07 55.69 60.30 57.59 41.33 51.25

yi -0.48 -0.70 0.77 0.86 -0.07 -0.69 -0.30 0.41 -0.33 0.75

10.3.3 Corelaia i regresia polifactorial polinomial de grad p fr interaciuni pentru cazul a m+1 caractere Fie X1 ,X 2 ,...,X m , Y notaiile pentru m+1 caractere ale exemplarelor unei populaii. Efectum un sondaj de n ansambluri de valori

de regresie neliniar multipl are forma: Y = f ( X 1 , X 2 ,..., X m ; B1 , B2 ,..., Bd ) unde B1,B2,,Bd sunt d coeficieni de regresie neliniar multipl necunoscui care vor fi determinai prin metoda celor mai mici patrate (variaia rezidual a datelor de sondaj este minim):

( x1i , x2i ,..., xmi , yi ) ; (1 i n ) . Funcia

SPAY X1 ,..., X m = y j f ( x1 j , x2 j ,..., xmj ; B1 ,B2 ,..., Bd ) = minim.


n 2 j =1

Derivatele pariale ale acestei variaii reziduale n raport cu B1,B2,,Bd trebuie s fie nule:

SPAY X1 ,..., X m B1

= 0,

SPAY X1 ,..., X m B2

= 0,...,

SPAY X1 ,..., X m Bd

= 0,

Am obinut sistemul de ecuaii normale care este neliniar i care furnizeaz pe B1,B2,,Bd. Raportul de corelaie neliniar multipl se calculeaz cu formula:

213

Rc = 1

SPAY X1 ,..., X m SPAY

Testarea acestui raport se face cu variabila Fisher: 2 ( Rc ) d 1 F= : cu [ d -1; n d ] GL 2 1 ( Rc ) n d Avem m factori X1,,Xm care acioneaz asupra caracterului Y. Dispunem de n seturi de msurtori pentru ansamblul (X1,,Xm ; Y) i anume : X11,,Xm 1 ; Y1 . X1n,,Xm n ; Yn a) Funcia de regresie are forma :

p Y = (Bi1X i + Bi2 X + ... + Bip X ) + B0 adic Y = BijX ij + B0 i =1 i =1 j=1


m 2 i p i m

Parametrii necunoscui sunt : B11,,B1p (coeficienii pentru X1) .. Bm1,,Bmp (coeficienii pentru Xm)

Numrul acestor parametri este d = p.m +1 Trebiue s avem n>m.p+1 de unde : (1) p Int[(n-1)/m] n cazul regresiei fr termen liber (B0=0) avem p Int(n/m) Variaia rezidual este :

(2)

E=SPA YX1...X m

Condiia necesar de minim este : E / Bij = 0 (1im ; 1jp) ; E / B0 = 0 adic m.p+1 ecuaii cu m.p+1 necunoscute Bij i B0 de forma :

p m = yl ( Bij (x il ) j ) B0 = min im l =1 i =1 j=1 n

(3)

n p n n j k k k Bij (x il ) (x hl ) + B0 (x hl ) = (x hl ) y l ; i=1 j=1 l=1 l=1 l=1 (h = 1,..., m;k = 1,...,p) m n p n j Bij (x il ) + B0 n = yl i=1 j=1 l =1 l=1 m

n cazul regresiei fr termen liber (B0=0) avem m.p parametri necunoscui Bij dai de m.p ecuaii :

214

n p n j k (4) Bij (x il ) (x hl ) = (x hl ) k y l ;(h = 1,..., m;k = 1,..., p) i=1 j=1 l=1 l=1 m

b) Dup calculul celor m.p+1 parametri de regresie Bij i B0 , vom calcula raportul de corelaie neliniar Rc cu formula cunoscut :

(5)

Rc = 1

SPA YX1...Xm SPA Y

; SPA Y = (y l y) 2
l =1

iar SPAY.X1Xm este dat de relaia (2) n care Bij , B0 sunt dai de sistemul liniar (3) sau (4). 2 Rc d-1 F= : este variabil Fisher cu (d-1;n-d) grade de libertate 2 1 R c n-d unde d = m.p+1 este numrul parametrilor necunoscui Bij , B0 . Rezult c : 2 Rc mp (6) F= : este variabil Fisher cu (m p;n-m p-1) grade de libertate 2 1 R c n-m p-1 ceace permite testarea semnificaiei corelaiei polinomiale multiple fr interaciuni. n cazul regresiei fr termen liber (B0=0) relaia (6) devine : (7)
2 Rc m p-1 : este variabil Fisher cu (m p-1;n-m p) grade de libertate 2 1 R c n-m p Cazuri particulare I. Pentru m=1 ; p=1 obinem corelaia i regresia liniar monofactorial (vezi seciunea 10.1) II. Pentru m=1 obinem corelaia i regresia polinomial monofactorial (vezi seciunea 10.2) III. Pentru p=1 obinem corelaia i regresia liniar polifactorial (vezi seciunea 10.3.2)

F=

Exemplu Lum m =3 factori i n=12 msurtori iar regresia este cu termen liber deci lum p=3 . X1 = Azotat de amoniu(Kg/Ha) X2 = Superfosfat(Kg / Ha) X3 = Sare potasic(Kg / Ha) Y = Gru (Kg / Ha) Date de pe n = 12 parcele experimentale : 40 80 120 160 200 X1 0 X2 0 30 60 90 120 150 X3 0 10 20 30 40 50 Y 1500 1700 1900 2200 2400 2700 Rezultate : a) Coeficienii de regresie polinomial sunt : B11 = -438.795 (coeficientul lui X1) B12 = -0.571 (coeficientul lui X12) B13 = 0 (coeficientul lui X13) 240 180 60 3100 280 210 70 3600 320 240 80 4000 330 250 90 3700 350 260 95 3500 400 270 100 3000

215

B21 = 360.308 (coeficientul lui X2) B22 = 0.442 (coeficientul lui X22) B23 = -0.002 (coeficientul lui X23) B31 = 693.091 (coeficientul lui X3) B32 = -13.063 (coeficientul lui X32) B33 = 0.064 (coeficientul lui X33) Termenul liber al regresisi polinomiale este B0 = 1503.453 Tabel cu valori observate Y , valori ateptate Yc i diferene DY: Y 1500 1700 1900 2200 2400 2700 3100 3600 4000 3700 3500 3000 Yc 1503 1698 1911 2150 2424 2741 3108 3536 4030 3693 3507 2999 DY -3 2 -11 50 -24 -41 -8 64 -30 7 -7 1 b) Variaia ptratic rezidual a lui Y dup X1,X2,X3 este E =10080.91 iar variaia ptratic total a lui Y este SPAY = 7742504 deci conform relaiei (5) raportul de corelaie neliniar este Rc = 0.99935 Din relaia (6) rezult F = 170.77 cu (9;2) grade de libertate.Din tabelele 4,5,6 pentru (9;2) GL avem valorile critice F5% =19.38 ; F1% = 99.39 ; F0.1% =999.4 Deoarece F1% < F < F0.1% , corelaia polinomial multipl este distinct semnificativ deci Rc = 0.99935* * 10.3.4 Corelaia i regresia polifactorial polinomial de grad 3 cu interaciuni pentru cazul a m+1 caractere Funcia de regresie polinominal cubic cu interaciuni are forma:
m m m m

Y = B3i X + B2ij X i X j + B1i X i + B0


i =1

3 i

i =1 j =1

i =1

Avem coeficienii de regresie necunoscui B3i, B2ij, B1i i B0 n numr egal cu d=m+m2+m+1=(m+1)2. Datele de sondaj au forma
m

Ecuaiile normale care dau coeficienii de regresie necunoscui, vor avea forma:
m n 3 3 m m n n 3 3 + + B x x B x x x B x x 3i il hl 2 ij il jl hl 1i il hl + i =1 l =1 i =1 j =1 l =1 i =1 l =1

( x1l ,..., xml ; yl ) ; (1 l m ) .

unde 1 h m ;

n 3 n 3 + B0 xhl = xhl yl l =1 l =1

216

n 3 m m n m n B3i xil xhl xkl + B2 ij xil x jl xhl xkl + B1i xil xhl xkl i =1 l =1 i =1 j =1 l =1 i =1 l =1
m

n n + B0 xhl xkl = xhl xkl yl unde (1 h; k m ) ; l =1 l =1 n 3 m m n m n B3i xil xhl + B2ij xil x jl xhl + B1i xil xhl i =1 l =1 i =1 j =1 l =1 i =1 l =1
m

n n + B0 xhl = xhl yl unde 1 h m l =1 l =1 n 3 m m n m n B x + B x x + B x 2ij il jl 1i il + 3i il i =1 l =1 i =1 j =1 l =1 i=1 l =1


m

n + ( n ) B0 = yl l =1
n total avem d=m+m2+m+1=(m+1)2

B 211 ,..., B21m ; B ,...,B ; B ..................... ( B31 ,..., B3m ) ; 1m ) 0 ( 11 B ,..., B 2 mm 2 m1

ecuaii cu (m+1)2 necunoscute:

Sumele dup l de la 1 la n din parantezele rotunde se calculeaz pe baza datelor de sondaj. m ( m 1) m 2 + 5m + 2 Din cele d=(m+1)2 ecuaii normale precedente, numai d = sunt 2 2 m ( m 1) sunt dependente de ele. independente, iar 2 m ( m 1) m ( m 1) sunt diferite iar restul de Din cele d=(m+1)2 necunoscute numai d sunt 2 2 egale ntre ele, datorit simetriei B2ij = B2 ji ; (1 i; j m ) . Raportul de corelaie neliniar total se calculeaz cu formula cunoscut:

Rc = 1

SPAY X1 ,..., X m SPAY

Testarea acestui coeficient se face cu valoarea Fisher:

217

F=

( Rc ) 2 1 ( Rc )
2

m 2 + 5m + 2 1 m 2 + 5m + 2 m 2 + 5m + 2 2 : cu ; n GL 2 2 m 2 + 5m + 2 n 2

Exemplu:

X1=ngrmnt chimic NPK (zeci Kg/ha) X2=ap irigaie (sute m3/ha) Y=producie de porumb (t/ha) Date de sondaj:
x 1i

0 5 5 5 10 10 10 15 15 15 20 20 20

x 2i

0 10 15 20 10 15 20 10 15 20 10 15 20

yi 3 4 4.8 6.3 5.8 6.7 7.4 8.5 9.2 9.4 9.7 9.9 10

Rezultate 1)Vectorul mediilor:


x = 11.54 sute Kg NPK/ha y = 13.85 sute m3 ap/ha z = 7.28 t porumb/ha

2)Coeficieni de regresie liniar cubic cu interaciuni: B0=3 B11= -0.5865 ; B12 = 0.1085 B211= 0.11064 ; B212=B221 = -0.01334 ; B222 = 0.000310 B31 = -0.003155 ; B32 = -0.000310

3)Tabel cu valorile x1i, x2i, valorile observate yi, valorile ateptate yai i diferenele yi :
x 1i

0 5

x 2i

0 10

yi

3 4

Yai 3 3.89

yI 0 0.11

218

5 5 10 10 10 15 15 15 20 20 20 4)

15 20 10 15 20 10 15 20 10 15 20

4.8 6.3 5.8 6.7 7.4 8.5 9.2 9.4 9.7 9.9 10

5.04 6.97 5.82 6.64 7.43 8.56 9.04 9.50 9.73 9.88 10.00

-0.24 0.13 -0.02 0.06 -0.03 -0.06 0.16 -0.10 -0.03 0.02 0

Raportul de corelaie neliniar este: 0.13275 Rc = 1 = 0.999 68.51685 m 2 + 5m 2 ( Rc ) 2 Valoarea Fisher: F = : 2 2 1 ( Rc ) n m + 5m + 2 2 cu m=2 i n=13 devine : F=356.6 Valorile critice din tabelele 4,5,6 din Anex ,cu [7; 5] GL sunt: F0.05=3.97; F0.01=7.46 i F0.001=16.21 deci Rc=0.999* * * 10.4 Rezumat n acest capitol se prezint corelaia i regresia monofactorial liniar precum i corelaiile i regresiile monofactoriale neliniare exemplificate prin corelaiile i regresiile polinomial, trigonometric i polinomial-trigonometreic. Se prezint corelaia i regresia polifactorial liniar i neliniar. Se calculeaz aporturile factorilor n corelaia polifactorial liniar. 10.5 ntrebri

1. 2. 3. 4. 5. 6. 7. 8. 9.

Ce sunt coeficientul de corelaie liniar i coeficienii de regresie liniar ? Ce sunt raportul de corelaie neliniar i coeficienii de regresie neliniar ? Ce este autocorelaia i cross-corelaia seriilor de timp ? Ce avantaje prezint corelaia i regresia polinomial-trigonometric ? Ce sunt coeficienii de corelaie liniar multipli totali i cum se testeaz ei ? Ce sunt coeficienii de corelaie liniar multipli pariali i cum se testeaz ei ? Ce sunt coeficienii de regresie liniar multipl ? Prin ce se deosebesc rapoartele de corelaie neliniar multipl de coeficienii de corelaie liniar multipl ?
10.6 Bibliografie

1.D.Ene , M.Drghici, I.N. Alecu Statistic aplicat n agricultur Ed.Ceres,2003 2.M.Iosifescu i col. Mic enciclopedie de statistic Ed.tiinif.i Enciclop,,1985 3. Anuarul statistic al Romniei , 1990 -2009

219
CAPITOLUL 11 SISTEME BIOLOGICE

Obiective : nsuirea de ctre studeni a conceptului modern de sistem biologice ,proprieti , exemple i analiza lor. Coninut : 11.1 Definiia,clasificarea i proprietile sistemelor 11.1.1 Definiia sistemelor 11.1.2 Clasificarea sistemelor 11.1.3 Proprietile sistemelor 11.1.4 Sisteme liniare 11.2 Sisteme biologice 11.2.1 Sisteme biologice pn la nivel de organism (biosisteme) 11.2.2 Sisteme biologice la nivel de populaii (biocenoze) 11.2.3 Pdurile ca ecosisteme vegetale Cuvinte cheie : sistem,sistem biologic 11.1 DEFINIIA ,CLASIFICAREA I PROPRIETILE SISTEMELOR

11.1.1 Definiia sistemelor Un sistem este o mbinare armonioas din punct de vedere structural i funcional a urmtoarelor elemente : 1) Mulimea de n intrri (inputs) de forma X= (X1,,Xn) Rn 2) Mulimea de p stri interne(internal states) de forma S =(S0,,Sp-1) Rp 3) Mulimea de m ieiri(outputs) de forma Y = (Y1,,Ym) Rm ntre elementele precedente exist urmtoarele legturi: a) Ecuaia de stare S= f (S,X) Aici S este starea consecutiv strii S care este simultan cu intrarea X . b) Ecuaia de ieire Y= g (S,X) c) Ecuaia de reglare cibernetic(feedback) Z = h (S,Y) Aici Z este intrarea corectat care regleaz intrarea X . 11.1.2 I. 1) 2) Clasificarea sistemelor

SISTEME BIOLOGICE PARIAL DIRIJATE Sistemul florei spontane plante ierboase arbori/arbuti Sistemul faunei slbatice animale ierbivore animale carnivore

220
II. 3) 4) animale omnivore SISTEME BIOLOGICE TOTAL DIRIJATE Sistemul plantelor cultivate Ferme de cereale ,plante tehnice i furajere Ferme legumicole Ferme pomicole Ferme viticole Parcuri i spaii verzi Pduri i pepiniere silvice Sistemul animalelor domestice Ferme de bovine pentru lapte i carne Ferme de porcine Ferme de ovine i caprine pentru lapte i carne Ferme de psri pentru ou i carne Ferme piscicole Ferme sericicole Stupine

III. SISTEME TEHNICE DE PRELUCRARE A PRODUSELOR AGRICOLE 5) Uniti de prelucrare a produselor agricole vegetale - Mori de fin i mlai - Fabrici de nutreuri combinate - Fabrici de pine - Fabrici de ulei - Fabrici de zahr - Fabrici de legume i fructe conservate - Fabrici de bere - Uniti de vinificaie - Fabrici de buturi spirtoase - Uniti de produse fitofarmaceutice 6) Uniti de prelucrare a produselor agricole zootehnice - Fabrici de produse lactate - Abatoare i carmangerii - Fabrici de mezeluri i conserve din carne - Fabrici de conserve din pete IV. SISTEME ECONOMICE DE COMERCIALIZARE I SERVICII PENTRU PRODUSE AGRICOLE BRUTE SAU PRELUCRATE 7) Piee agroalimentare 8) Angrouri de produse agroalimentare 9) Trguri pentru animale vii 10) Uniti de alimentaie public 11) Uniti agroturistice

221
Cititorul poate uor identifica intrrile,strile interne i ieirile pentru sistemele enumerate mai sus. Pentru orice sistem agricol din cele enumerate mai sus , se asociaz un sistem informaional economic care consemneaz sub form contabil intrrile ,strile interne i ieirile din sistemul agricol respectiv . Intrrile n sistemul informaional sunt date de intrare necesare pentru calculul economic respectiv ; strile interne ale sistemului informaional sunt etape de calcul i rezultate intermediare iar ieirile sunt rezultate finale ale calculului economic. n prezent sistemele informaionale economice din agricultur sunt informatizate . Sistemul informaional economic nu coincide cu sistemul agricol pe care l modeleaz : cheltuielile sunt intrri n sistemul agricol dar sunt ieiri n sistemul informaional economic asociat. Exemple de sisteme neagricole V. VI. VII. VIII. IX. OMUL AUTOMOBILUL COMPUTERUL SISTEMUL SOLAR UNIVERSUL

Cititorul este invitat s recunoasc intrrile,strile interne i ieirile pentru aceste sisteme neagricole. Oservm c omul este singurul sistem care poate percepe n mod contient frumosul ca valoare estetic. 11.1.3 Proprietile sistemelor 1) Integralitatea Un sistem nu este o sum de pri ci mbinarea armonioas a acestor pri din punct de vedere structural i funcional . 2) Echilibrul dinamic Orice sistem este amplasat n spaiu i evolueaz n timp printr-un schimb permanent de materie ,energie i informaie cu mediul ambiant,realizndu-se o renoire continu a sistemului. Dac sistemul este biologic , el se renoiete singur , n caz contrar renoirea trebuie dirijat de om. 3) Reglarea cibernetic Sistemul i menine integralitatea i echilibrul dinamic prin adaptarea continu la schimbrile mediului ,optimizndu-i evoluia. Dac sistemul este biologic, el se autoregleaz , n caz contrar reglarea trebuie creat i dirijat de om.

222
4) Existena finit Evoluia sistemului are o stare iniial i o stare final. Dac sistemul este biologic,evoluia sa este dezvoltarea ontogenetic i filogenetic marcat de natere,reproducere i moarte. n caz contrar sistemul sufer n timp uzur fizic ,amnat prin reparaii periodice i uzur moral ,fiind necesar casarea sa la un moment dat, considerat moment final al evoluiei sistemului. 5) Ierarhizarea Poate fi relaional (pe orizontal) sau structural (pe vertical). Ierarhizarea relaional apare cnd n relaia ntre dou sisteme , unul conduce sau coordoneaz iar cellalt este condus sau este coordonat. n cazul coordonrii ierarhizarea este mai slab dect n cazul conducerii. Exemplu Orice exploataie agricol este coordonat de Direcia agricol judeean care la rndul ei este coordonat de Ministerul Agriculturii . Ierarhizarea structural apare cnd un sistem este constituit din subsisteme interconectate i la rndul su este subsistem ntr-un alt sistem ierarhic superior. Exemple a) Omul ca sistem biologic este constituit din cteva sisteme interconectate : sistemul nervos,sistemul endocrin,sistemul circulator, sistemul respirator,sistemul digestiv,sistemul excretor,sistemul reproductor, sistemul imunitar,sistemul ocular,sistemul auditiv,etc. Omul este la rndul su subsistem al sistemelor: familie,comunitate local,naiune,orientare religioas,partid,politic,organizaie profesional,etc. b) Computerul ca sistem tehnic este constituit din sisteme interconectate : unitate de comand cu microprocesor i coprocesor,unitate de prelucrare date, monitor ,imprimant,memorii(hard,floppy,compact disc,RAM),etc. Computerul este este subsistem pentru sistemele: reea local,reea naional, INTERNET,etc. Exist un suprasistem care conine toate celelalte sisteme: Universul. Dou subsisteme se pot conecta ntr-un sistem, n serie(amonte-aval), n paralel i mixt. Exemplu Sistemul culturii grului este conectat n serie cu morile de mcinat fin. Sistemul culturii grului i sistemul culturii porumbului sunt sisteme vegetale conectate n paralel iar sistemul produciei vegetale i zootehnice sunt inteconectate mixt(sistemul vegetal trimite furaje n sistemul zootehnic iar sistemul zootehnic trimite gunoi de grajd sistemului vegetal).

223
Subsistemele unui sistem se npart n subsisteme eseniale (fr de care sistemul nu poate exista) i subsisteme neeseniale (lipsa lor se poate compensa de ctre subsistemele eseniale). Exemple 1.Pentru sistemul om subsistemele nervos, circulator,digestiv, hepatopancreatic, renal sunt exemple de subsisteme eseniale iar subsistemele vizual , auditiv,locomotor sunt exemple de subsisteme neeseniale . 2.Pentru sistemul computer subsistemele microprocesor,harddisc, tastatur,monitor ,memorii externe(floppy disc / cdrom / stick) sunt exemple de subsisteme eseniale iar imprimanta este exemplu de subsistem neesenial . 6) Controlabilitatea Un sistem este controlabil la momentul t1 > t0 dac pentru orice stare intern S(t0) i orice stare intern consecutiv S(t1) , exist o intrare X(t) cu t n intervalul [ t0 , t1 ] care transfer sistemul din starea S(t0) n starea S(t1) n intervalul de timp t = t1 t0 . 7) Observabilitatea Un sistem este observabil n momentul de timp t0 dac pentru orice stare S(t0) exist momentul de timp t1 > t0 pentru care atunci cnd se cunosc intrrile X(t) cu t n intervalul [ t0 , t1 ] i Y(t1) , se poate determina starea S(t0) . 8) Stabilitatea Fie o stare intern posibil S1(t) a sistemului . Aceast stare intern este stabil dac pentru orice > 0 ,exist ( ) > 0 astfel c pentru orice alt stare intern posibil S2(t) , din relaia | S2(t0) S1(t0) | < ( ) rezult | S2(t) S1(t) | < pentru orice t > t0 . Un sistem este stabil dac toate strile sale interne sunt stabile . 9) Memorie finit Un sistem dinamic este cu memoria finit m dac exist maximum m momente de timp t0 ,t1,,tm cu intrrile cunoscute X(t0) , X(t1) ,, X(tm) i starea intern iniial cunoscut S(t0) ,astfel c la momentul de timp tm+1 avem : a) S(tm+1) = [ S(t0) ; X(t0) , X(t1) ,, X(tm) ] b) Y(tm+1) = [ S(t0) ; X(t0) , X(t1) ,, X(tm) ] 11.1.4 Sisteme liniare

Sistemele liniare sunt definite prin ecuaiile : I. Ecuaiile de stare : S(t+h) = A(t).S(t) + B(t).X(t)

224
Aici S este vector-coloan cu p componente reale , X este vector-coloan cu n componente reale , A este matrice patratic de ordin p cu elemente reale iar B este matrice de tip p x n cu elemente reale. II. Ecuaiile de ieire : Y(t) = C(t).S(t) + D(t).X(t) Aici Y este vector-coloan cu m componente reale , C este matrice de tip m x p cu elemente reale i D este matrice de tip m x n cu elemente reale . III. Ecuaiile de reglare : Z(t+h) = U(t).S(t) + V(t).Y(t) Aici Z este vectorul-coloan al intrrilor reglate cu n componente reale, U este matrice de tip n x p cu elemente reale iar V este matrice de tip n x m cu elemente reale . Vom restrnge studiul la sisteme liniare staionare n care matricile A,B,C,D,U,V nu depind de timpul t , deci avem ecuaiile : S(t+h) = A.S(t) + B.X(t) Y(t) = C.S(t) + D.X(t) Z(t+h) = U.S(t) + V.Y(t) (1) (2) (3)

nlocuim n relaia (3) pe Y(t) din relaia (2) i obinem : Z(t+h) = (U+V.C).S(t) + (V.D).X(t) (4)

Fie intervalele de timp echidistante [ h ,2h ) ; [ 2h , 3h ) ,, [ (r-1)h , rh] Intervalul de timp total [ h , rh ] se numete serie i are durata DS=(r1)h . Ecuaiile de stare (1) se scriu pentru t = h,2h,,(j-1)h : S(2h) = A.S(h) + B.X(h) S(3h) = A.S(2h) + B.X(2h) S((j-1)h) = A.S((j-2)h)) + B.X((j-2)h) S(jh) = A.S((j-1)h) + B.X((j-1)h) nmulim la stnga aceste relaii n ordine cu Aj-2 , Aj-3,,A1 , A0 , le adunm i dup reducerea unor termeni , obinem : S(jh) = [ Aj-2.S(h) ] + [ Aj-2.B.X(h) + Aj-3.B.X(2h) ++ A.B.X((j-2)h) + + A0.B.X((j-1)h) ] (5)

225
n cuvinte , starea final a sistemului linir staionar la momentul de timp tj = jh , (1 j r ), depinde de starea sa iniial S(h) i de intrrile n sistem n toate perioadele de timp ,anterioare celei din momentul tj . Ecuaia de ieire (2) se scrie pentru t = jh : Y(jh) = C.S(jh) + D.X(jh) i folosind relaia (4) rezult : Y(jh) = [C.Aj-2.S(h) ]+[C.Aj-2.B.X(h) + C.Aj-3.B.X(h) ++ C.A.B.X((j-2)h) + C.A0.B.X((j-1)h) ] + C.D.X(jh) (6)

n cuvinte , ieirea din sistemul liniar staionar la momentul de timp tj = jh , (1 j r ), depinde de starea sa iniial S(h) i de intrrile n sistem n toate perioadele de timp ,inclusiv cea de la momentul tj . Ecuaia de reglare (4) se scrie pentru t = h,2h,,(j-1)h : Z(2h) = (U+V.C).S(h) + (V.D).Y(h) Z(3h) = (U+V.C).S(2h) + (V.D).Y(2h) Z((j-1)h) = (U+V.C).S((j-2)h)) + (V.D).Y((j-2)h) Z(jh) = (U+V.C).S((j-1)h) + (V.D).Y((j-1)h) nmulim la stnga aceste relaii n ordine cu (U+V.C)j-2 , (U+V.C)j-3,, (U+V.C)1 , (U+V.C)0 , le adunm i dup reducerea unor termeni , obinem : Y(jh) = [ (U+V.C)j-2.S(h) ] + [ (U+V.C)j-2.(V.D).X(h) + (U+V.C)j - 3.(V.D).X(2h) (7) ++ (U+V.C).(V.D).X((j-2)h) + (U+V.C)0.(V.D).X((j-1)h) ] n cuvinte , intrarea reglat a sistemului liniar staionar la momentul de timp tj = jh , (1 j r ), depinde de starea sa iniial S(h) i de intrrile n sistem n toate perioadele de timp ,anterioare celei din momentul tj . Dac la momentul tj = jh , (1 j r ), sistemul liniar staionar este perturbat fa evoluia sa stabil , n momentul tj+1 = (j+1)h ,nlocuim intrarea X((j+1)h) cu intrarea reglat Z((j+1)h) . Not Ecuaiile de stare sub forma diferenial , au forma : S (t) = A.S(t) + B.X(t) i au soluia general :

226
t

S(t) = e .S(0) + e A(t r) .B.X(r) d r


At

Fie sistemul liniar staionar dat de ecuaiile : S = A.S + B.X Y = C.S + D.X (8) (9)

unde S este starea care urmeaz dup S. n ecuaia (8) S i S sunt vectori-coloan cu p componente reale , X este vectorcoloan cu n componente reale , A este matrice de numere reale de tip p x p i B este matrice de numere reale p x n . n ecuaia (9) S este vector-coloan cu p componente reale , X este vector-coloan cu n componente reale , Y este vector-coloan cu m componente reale , C este matrice de numere reale de tip m x p iar D este matrice de numere reale de tip m x n . Se arat c sistemul liniar staionar dat de ecuaiile (8) i (9) este controlabil dac i numai dac matricea G = [ B A.B Ap 1.B ] de tip p x (p.n) are rangul maxim p adic matricea [ A - .I B ] de tip p x (p+n) are rangul maxim p , pentru orice valoare proprie a matricii ptratice A. n mod dual , se arat c sistemul liniar staionar dat de ecuaiile (8) i (9) este observabil dac i numai dac matricea H de tip (m.p) x p de forma :

C C . A H = ...... p 1 C . A
are rangul maxim p adic matricea

pentru orice valoare proprie a matricii ptratice A. 11.2 SISTEME BIOLOGICE

A .I de tip (m+p) x p are rangul maxim p C

11.2.1 Sistemele biologice pn la nivel de organism (biosisteme) Pentru sisteme biologice sunt valabile toate proprietile sistemelor din seciunea 5.1.3 Dealtfel ,sistemele biologice ofer modele care sunt imitate de sistemele tehnice i chiar economice (exemplu : biotehnologiile). Sistemele biologice au urmtoarele nivele de ierarhizare (n parantez sunt tiinele care le abordeaz ):

227
- nivelul atomic (biofizic) - nivelul molecular (biochimie) - nivelul celular (citologie) - nivelul de esut (histologie) - nivelul de organ (anatomie i fiziologie) - nivelul de organism (endocrinologie i neurologie) - nivelul de populaie(ecologie) Sistemele biologice pn la nivel de organism i le vom numi biosisteme iar sistemele biologice la nivel de populaie le vom numi biocenoze. n aceast seciune ne vom ocupa de biosisteme . Intrrile i ieirile n biosisteme sunt materiale (hran ,ap, oxigen,etc) ,energetice (cldur,lumin,glucide din hran,etc) i informaionale (semnale). Dac un semnal are probabilitatea de apariie P , informaia dat de semnal este I = - log2 P . Rezult 1/ P = 2I deci I reprezint numrul de cifre binare (0 sau 1) sau bii cu care se codific semnalul . Pentru P 0 avem I iar pentru P 1 avem I 0 deci semnalele care apar mai des , se codific mai scurt iar cele care apar mai rar , se codific mai lung . Dac un semnal are n stri posibile , cu probabilitile P1,, Pn , atunci media aritmetic a informaiilor acestor stri , este entropia semnalului : H = - P1. log2 P1 - - Pn. log2 Pn H reprezint numrul mediu de cifre binare cu care se codific semnalul . Dac Pi = 1 i Pj = 0 pentru j i atunci starea semnalului cu numrul i este sigur i avem entropia minim H = 0 . Dac P1 = = Pn = 1/n , atunci toate strile sunt egal probabile i avem entropia maxim H = log2 n . Pentru exprimarea procentual folosim Hp = H/log2 n Rezult de aici c entropia H este o msur a gradului de nedeterminare (dezorganizare) a strilor semnalului . Exemplu Asupra unui animal poate aciona un semnal de la mediu cu n = 3 stri : apariia hranei cu probabilitatea P1 = 0.50 = 50 % ; apariia puiului cu probabilitatea P2 = 0.35 = 35 % i apariia unui duman cu probabilitatea P3 = 0.15 = 15 % . S se calculeze entropia semnalului . Soluie Din tabela 1 din Anex avem : pentru P1 = 0.50 rezult - P1log2 P1 = 0.5000 , pentru P2 = 0.35 rezult - P2log2 P2 = 0.5301 iar pentru P3 = 0.15 rezult - P3log2 P3 = 0.4105 deci prin nsumare avem H = 1.4406 bii . n procente Hp = H / log2 3 = 0.909 = 90.9 % Un sens opus entropiei l are abaterea/standard a probabilitilor P1,,Pn :

228

S=

n Pi n 2 Pi i=1 n i =1 n 1

. Cum Pi = 1 rezult S =
i =1

Pi2
i=1

1 n

n 1

S se numete coeficient de concentrare al semnalului deoarece pentru Pi =1 i Pj =0 pentru j i , apariia strii i a semnalului este sigur i S=1 / n1/2 iar pentru P1==Pn = 1/n , toate strile semnalului sunt egal probabile i S=0. Rezult de aici c coeficientul de concentrare S este o msur a gradului de determinare (organizare) a strilor semnalului ,invers fa de entropia H . n cazul exemplului de mai sus avem S = 0.174 deci n procente Sp=31/2.S= 0.3 =30 %. Semnalele primite sau transmise de un biosistem ,sunt de natur mecanic,termic, electromagnetic i chimic. Ele sunt decodificate sau codificate de biosistem sub aspectul intensitii semnalelor,al calitii lor, al repartiiei lor spaiale i al frecvenei lor temporale. Performanele biosistemului privind semnalele se refer la viteza de recepie sau emisie a semnalului , la capacitatea de memorare a acestor semnale i timpul de acces la memorie . Astfel vzul omului poate recepiona 3x106 bii /secund , auzul 3x104 bii/ secund , pipitul 2x105 bii /secund ,mirosul 50 bii/secund i gustul 10 bii / secund . Omul poate recepiona sau transmite contient 100 bii/secund i incontient 109 bii /secund . Din acest punct de vedere multe animale sunt superioare omului ca performane. Creierul uman are o capacitate de memorare de 109 bii i un timp de acces de 0.01 secunde . n ceace privete strile interne ale unui biosistem ,evoluia ontogenetic i filogenetic a materiei vii orienteaz biosistemul ctre starea inrtern optim, celelalte stri interne fiind din ce n ce mai puin probabile, deci evoluia determin o cretere a gradului de determinare(organizare) a biosistemului deci o scdere a entropiei H i o cretere a coeficientului de concentrare S . Elementul nou adus de cibernetica biologic n structura biosistemelor este capacitatea de autoreglare a intrrii n raport de starea intern i de valoarea ieirii prin conexiunea invers (feedback). Autoreglarea se manifest la toate nivelele biosistemului , fcnd posibil existena homeostaziei adic a capacitii biosistemului de a-i menine echilibrul biologic. Conexiunea invers pozitiv tinde s ndeprteze biosistemul de starea sa de echilibru biologic n timp ce conexiunea invers negativ caut s readuc biosistemul n starea de echilibru biologic Aceste dou tipuri de conexiuni sunt ilustrate n figurile care urmeaz .

1 Avem S 0; deci n procente Sp = n.S [ 0;1] n

229

n ambele bazine debitul robinetului de alimentare a bazinului este egal cu debitul robinetului de evacuare a apei din bazin. Viteza de scurgere a lichidului este V = (19.6 h)1/2 m3/ secund unde h este nlimea n metri a luciului apei deasupra robinetului de evacuare . Din funcionarea acestor modele hidraulice este clar c la deschiderea robinetului de evacuare a apei din bazin , feedbackul negativ menine constant nivelul apei n bazin ce feedbackul pozitiv duce la creterea continu a apei din bazin. n continuare vom trece n revist cteva exemple de manifestare a feedbackului negativ la biosisteme , n vederea autoreglrii strilor interne i funciilor vitale ale acestora prin mecanismele tampon fizico-chimice , mecanismele automate fiziologice i mecanismele de coordonare i integrare neurohormonale . 1) Activitatea celulelor este autoreglat prin acizii nucleici, cei mai imprtani fiind AND i ARN . Cu ajutorul acestora din urm se codific informaia genetic pe vertical de la prini la descendeni .

230
n activitatea curent a celulei pe orizontal , metabolismul acesteia i n special sinteza proteinelor se autoregleaz pe cale enzimatic . Deasemenea vitezele reaciilor metabolice celulare se autoregleaz prin retroaciunea produselor rezultate dn aceste reacii . 2) Cantitatea de ap din organism se autoregleaz prin ajustarea aportului de lichide la pierderea de ap . Deshidratarea este esmnalat de senzaia de sete ca rezultat al stimulrii receptorilor speciali (osmoreceptori,baroreceptori) de ctre concentraia mrit a sngelui . Pierderea de lichide mai ales prin rinichi este sub controlul complexului hipotalamohipofizar prin secreia hormonului antidiuretic i al glandelor suprarenale prin secreia de aldosteron . 3) Cantitatea de energie biologic coninut n hran se autoregleaz prin ajustarea aportului de hran la scderea rezervelor energetice ale organismului n urma activitii celulelor. Scderea acestor rezerve este semnalat de senzaia de foame ca rezultat al stimulrii receptorilor speciali (glucorepetori,liporeceptori) din hipotalamus de ctre penuria de hran. Completarea rezervelor energetice este controlat de centrul foamei i centrul saietii , aflai n hipotalamus . Forma curent sub care celulele primesc energie este glucoza ,nivelul sanguin al acesteia fiind autoreglat prin reacia glucoz-glicogen controlat de ficat i reacia glucoz-insulin controlat de pancreas . 4) Temperatura organismului fiinelor homeoterme (cu temperatur constant) se autoregleaz prin ajustarea producerii de cldur (termogenez) la pierderea de cldur (termoliz) . Modificarea tempeaturii organismelor este semnalat de frisonul termic ca rezultat al stimulrii termoreceptorilor periferici i centrali de ctre dezechilibrul termic. Echilibrarea temic organism-mediu ambiant , este controlat de centrul pierderii de cldur i centrul producerii de cldur ,aflai n hipotalamus . Forme concrete ale pierderii de cldur sunt transpiraia , radiaia , convecia i conducia iar a producerii de cldur este intensificarea metabolismului . 5) Concentraia ionilor de hidrogen (H+) n snge (pH) se autoregleaz prin neutralizarea acizilor sau bazelor n exces. Echilibrarea acidobazic se realizeaz : - printr-un mecanism respirator care const n adaptarea ventilaiei pulmonare la concentraia de CO2 din snge , sub controlul centrului respirator bulbar ; - printr-un mecanism renal care const n secreia tubular a ionilor de hidrogen 6) Cantitatea de oxigen din snge (fixat prin hemoglobina din eritrocite) se autoreleaz prin ajustarea producerii de eritrocite (eritropoeza) la pierderea de eritrocite . Stimularea eritropoezei n mduva oaselor se face prin eritropoetin cu contribuia rinichiului atunci cnd presiunea parial a oxigenului n snge scade . Fixarea oxigenului n snge se face de ctre fierul din hemoglobin ,concentratia acestuia n snge fiind autoreglat prin absorbia fierului la nivelul celulei epiteliale intestinale sub form de transferin . 7) Tensiunea arterial se autoregleaz prin ajustarea aportului de snge (vasodilataie i vasoconstricie ) acolo unde este nevoie i cnd este nevoie . Modificarea tensiunii arteriale este semnalat de presoreceptori i controlat de centrul coordonator vasomotor aflat n poriunea inferioar a trunchiului cerebral. Echilibrarea concret a tensiunii arteriale se face prin intermediul nervilor vasomotori i ai glandelor suprarenale care secret hormoni vasoactivi.

231
8) Secreia endocrin este autoreglat prin ajustarea de hormoni la nevoie. Un rol principal n constelaia endocrin l are hipofiza care activeaz secreia altor glane prin hormonii tropi : tiroida prin tireotrop , suprarenalele prin adenocorticotrop(ACTH) i glandele sexuale prin gonadotrop . La rndul su ,hipofiza este controlat de hipotalamus prin hormonii de echilibrare . Desigur i alte procese vitale sunt autoreglate cibernetic : adaptarea ochiului la lumin ,a urechii la zgomot,micarea ,etc. Din cele de mai sus rezult clar rolul central a creierului ca organ de comand a autoreglrii cibernetice a organismelor . ntreaga activitate de autoreglare a organismului de ctre creier este efectuat prin reflexe . Reflexele necondiionate autoregleaz schimbul de materie ,energie i informaie precum i funciile vegetative ale organismului. Astfel reflexele integrative controleaz ingestia de hran, cele de coordonare controleaz circulaiea,respiraia,temperatura proprie i micarea , instinctele controleaz comportamentul vegetativ general al organismului n mediul ambiant . La organismele superioare , creierul are i o activitate nervoas superioar care autoregleaz starea psihic a organismului . Aceast autoreglare se realizeaz prin reflexele condiionate care contituie baza gndirii ca principal form de manifestare a activitii nervoase superioare . 11.2.2 Sistemele biologice la nivel de populaii (biocenoze) Biocenoza conine spaiul n care exist populaiile biologice (biotop) , condiiile pedoclimatice ale biotopului , biomasa de origine vegetal i populaiile care ocup acest spaiu . Autoreglarea populaiilor biologice se face cantitativ i calitativ, n spaiu i timp, prin lupta pentru existen ntre indivizii unei specii sau ntre specii diferite . Ca exemple de autoreglare cantitativ avem autoreglarea efectivelor totale , pe sexe i pe grupe de vrst , autoreglarea structurii genetice , a mrimii corpului , a densitii ntr-un biotop , a numrului de urmai ,etc. I. Evoluia efectivului total al unei singure specii ntr-un biotop deschis cu resurse limitate de hran Fie X(t) efectivul total de indivizi ai speciei la momentul de timp t . Fie I numrul de indivizi ai speciei care vin n biotop (imigrri) i E numrul de indivizi ai speciei care pleac din biotop (emigrri) . Fie (t) coeficientul de natalitate i (t) coeficientul de mortalitate al speciei. Viteza de variaie a efectivului total X(t) al speciei n timp va fi : dX / dt = [ (t) - (t) ] . X(t) + I - E Datorit limitrii hranei , avem (t) = - a.X(t) ; (t) = b.X(t) = a + b se numete coeficient de competiie pentru hran .

232
Ecuaia diferenial de mai sus devine : dX / dt = ( ) .X .X2 + I E

.X(0) X(t) = X(0) .e ( ) t X(0) +


Aceat funcie are ca grafic curba de cretere (logistica) cu pragul de saturaie ( ) / :

Pentru I= E ,avem soluia :

Momentul t0 este soluia ecuaiei X (t) = 0 adic :

t0 =

l n(

1) .X( 0 )

Momentul de timp t0 delimiteaz faza de expansiune a speciei cnd creterea efectivului este accelerat ( X(t) i dX / dt cresc ) de faza de saturaie a speciei cnd creterea efectivului este ncetinit ( X(t) crete dar dX / dt scade ) . n momentul de timp t0 viteza de variaie dX / dt a efectivului va fi maxim iar valoarea efectivului X(t) n acest moment va fi : X(t) = ( )/2 adic jumtate din valoarea pragului de saturaie . n particular pentru = 0 (hran suficient ) avem :

233
dX / dt = ( ) .X de unde X(t) = X(0).e( )t cu graficul o exponenial care taie axa vertical n X(0) .

II. Evoluia efectivului pe sexe a unei singure specii ntr-un biotop nchis cu resurse limitate de hran Presupunem c la momentul de timp t , specia are X1(t) masculi cu coeficientul de natalitate 1 , de mortalitate 1 i de competiie pentru hran 1 i specia are X2(t) femele cu coeficientul de natalitate 2 , de mortalitate 2 i de competiie pentru hran 2 . Vitezele de variaie ale efectivelor pe sexe vor fi date de sistemul de ecuaii difereniale : dX1 / dt = 1X2 - 1X1 - 1X1(X1+X2) dX2 / dt = (2 2)X2 2X2(X1+X2) X1(t) i X2(t) oscileaz n jurul unor valori de echilibru date de sistemul dX1 / dt = dX2 / dt = 0 . Efectivul total X1(t) + X2(t) are valoarea de echilibru (2 2 ) / 2 (plafonul femelelor). Raportul efectivelor pe sexe X1(t) / X2(t) are valoarea de echilibru :

1 ( 2 2 ) + 1 2
Pentru calculul efectivelor pe sexe la momentele de timp t =1,2,3, n diferite cicluri de reproducie a speciei , cunoscnd efectivele iniiale pe sexe X1(t) i X2(t) ,avem din sistemul de ecuaii precedent , sistemul recurent : X1 (t+1) = 1X2 (t) +(1 - 1)X1(t) - 1X1(t)[ X1(t)+X2(t) ]

234
X2 (t+1) = (1+2 2)X2 (t) 2X2(t) [ X1(t)+X2(t) ] Programul EFECTIVE rezolv numeric acest sistem recurent. Exemplu n anii secetoi cnd hrana se mpuineaz , insectele fitofage depun ou mai puine ( X(t) scade ) i numrul femelelor scade ( X1(t) / X2(t) crete ). n anii ploioi are loc procesul invers . III. Evoluia efectivului pe grupe de vrst a unei singure specii ntr-un biotop nchis cu hran suficient Fie grupa prereproductoare (tineret) cu efectivul X1(t) , grupa reproductoare (aduli) cu efectivul X2(t) i grupa postreproductoare(btrni) cu efectivul X3(t). Evoluia pe grupe de vrst la dou momente succesive de timp t i t+1 n dou cicluri de reproducie a speciei , va fi dat de ecuaiile : X1(t+1) = X2(t) X2(t+1) = 1X1(t) X3(t+1) = 2X2(t) n adevr , din grupa reproductoare , cu coeficientul de natalitate , la momentul t , se vor nate urmai care vor constitui grupa prereproductoare la momentul t+1 ; grupa prereproductoare cu coeficientul de mortalitate 1 la momentul t , devine grup reproductoare la momentul t+1 ; grupa reproductoare cu coeficientul de mortalitate 2 la momentul t ,devine grup postreproductoare la momentul t+1 iar grupa postreproductoare la momentul t dispare cu totul la momentul t+1 . Ecuaiile precedente admit i o scriere matricial :

X1 (t) Dac X(t)= X 2 (t) i X (t) 3

0 0 A= 1 0 0 0 2

avem X(t+1) = A.X(t) de unde pentru t=0,1,,n, gsim: X(1) = A.X(0) , X(2) = A.X(1) ,, X(n) = A.X(n - 1) i prin nmulire obinem : X(n) = An . X(0) de unde rezult structura efectivului pe grupe de vrst astfel : Pentru momente de timp t = numere pare , avem: X1(n) = n 1n 1X1(0) X2(n) = n - 1 1n X2(0) X3(n) = n - 1 1n 1 2X1(0)

235
Pentru momente de timp t = numere impare , avem: X1(n) = n 1n 1X2(0) X2(n) = n - 1 1n X1(0) X3(n) = n - 1 1n 1 2X2(0) n ambele cazuri , rezult concluziile : a) Dac 1 < 1 , efectivele pe toate grupele de vrst scad pentru n ; b) Dac 1 > 1 , efectivele pe toate grupele de vrst cresc pentru n ; c) Dac 1 = 1 , efectivele pe toate grupele de vrst sunt staionare pentru n Exemplu n cazul petilor avem > 1 deci efectivul grupei prereproductoare (puiet) crete cel mai repede. Reglarea acestui efectiv se face prin canibalism : de exemplu bibanul consum n mod obinuit propriul lui puiet. n continuare vom analiza cazul unei biocenoze n care avem dou specii existente ntr-un biotop nchis cu hran limitat . Autoreglarea cibernetic a biocenozei se realizeaz prin lupta pentru existen ntre specii . IV. Competiia pentru hran ntre dou specii fitofage Fie X(t) , Y(t) efectivele celor dou specii la momentul de timp t . Fie i coeficienii de natalitate respectiv mortalitate ai primei specii ; i coeficienii de natalitate respectiv mortalitate ai celei de a doua specii ; i coeficienii de competiie pentru hran ai celor dou specii . Vitezele de variaie ale efectivelor celor dou specii vor fi date de sistemul de ecuaii difereniale : dX / dt = ( )X X.Y dY / dt = ( )Y X.Y X(t) i Y(t) oscileaz n jurul unor valori de echilibru date de sistemul de ecuaii dX / dt = 0 ; dY / dt = 0 de unde rezult valoarea de echilibru a raportului X / Y al efectivelor celor dou specii , egal cu [ ( ) / ] / [ ( ) / ] . De aici rezult concluziile : a) Dac ( ) / < ( ) / ,dispare a doua specie din biocenoz; b) Dac ( ) / > ( ) / ,dispare prima specie din biocenoz; c) Dac ( ) / = ( ) / , cele dou specii rmn n echilibru . Pentru calculul efectivelor celor dou populaii la momentele de timp t = 1,2,3, n diferite cicluri de reproducie ale speciilor , cunoscnd efectivele iniiale X(0) , Y(0) , avem din sistemul de ecuaii precedent , sistemul recurent : X(t+1) = (1+ )X(t) X(t).Y(t)

236
Y(t+1) = (1+ )Y(t) X(t).Y(t) Programul EFECTIVE rezolv numeric acest sistem recurent. Exemplu Echilibrul ntre efectivele diferitelor specii de peti fitofagi din acelai biotop se stric uneori n favoarea unei specii : n unii ani echilibrul crap caras n Delta Dunrii s-a stricat n favoarea carasului . V. Competiia prad prdtor a unei specii fitofage cu una zoofag . Fie X(t) , Y(t) , , , , cu aceleai semnificaii ca n secinea IV cu <, este coeficientul de decimare a przii iar este coeficientul de expansiune a prdtorului pe seama przii. X(t) i Y(t) sunt date de sistemul de ecuaii difereniale : dX / dt = ( )X X.Y dY / dt = ( )Y + X.Y De aici rezult legile lui Volterra :

a) Legea ciclului periodic :

Efectivele przii X(t) i prdtorului Y(t) sunt funcii periodice de t cu perioada T = 2 / [( )( )]1/2 Pe durata de timp a unei perioade T mediile efectivelor MX(t) ; MY(t) sunt independente de condiiile iniiale i depind numai de , , , .

b) Legea conservrii valorilor medii

c) Legea perturbrii valorilor medii :


Dac speciile sunt distruse uniform i direct proporional cu efectivele lor , atunci media przii MX(t) crete iar media prdtorului MY (t) scade . Dac este distrus prdtorul , media MX (t) crete iar media MY(t) este constant . Dac este distrus prada , media MX(t) este constant iar media MY(t) scade . Rezult c n toate cazurile este favorabil prada . Eliminnd pe t ntre X(t) i Y(t) i reprezentnd grafic n spaiul fazelor , dependena ntre X i Y , avem :

237

Este clar c A , A sunt puncte de maxim respectiv minim al efectivului przii iar B , B sunt puncte de maxim respectiv minim al efectivului prdtorului . Aceste maxime i minime alterneaz deoarece prdtorul decimnd prada ,i distruge baza de existen ceace duce la micorarea efectivului Y al prdtorului i la renaterea przii , al crui efectiv X crete din nou . n timp cele dou efective au graficele :

Pentru calculul efectivelor celor dou specii la momentele de timp t = 1,2,3, n diferite cicluri de reproducie ale speciilor , cunoscnd efectivele lor iniiale X(0) i Y(0) , avem din sistemul de ecuaii precedent , sistemul recurent : X(t+1) = (1+ )X(t) X(t).Y(t) Y(t+1) = (1+ )Y(t) + X(t).Y(t)

238
Programul EFECTIVE rezolv numeric acest sistem recurent. Exemplu O specie de roztori din America ,numii Lemingi , sunt devorai de vulpi . Dac numrul lemingilor scade , scade i numrul vulpilor care nu mai au hran suficient , fapt care duce la recrudescena lemingilor , al crui efectiv crete din nou . Perioada din legea ciclului periodic a lui Volterra este pentru aceste dou specii T = 4 ani . n cazul n care prada este un duntor agricol,combaterea sa biologic se face prin aducerea n biotopul su a unui prdtor ( entomofag,acarofag,pasre sau mamifer insectivor ). Din cele prezentate mai sus ,rezult c efectivul X(t) al unei specii n competiia pentru hran sau n lupta cu alte specii , poate s scad , s rmn staionar sau s creasc . Dac efectivul X(t) al unei specii scade sub o anumit limit inferioar m , numit limit de supravieuire , atunci scade vertiginos i specia dispare . Dac efectivul X(t) al unei specii crete peste o anumit limit superioar M , numit limit de periclitare a echilibrului ecologic , aceasta duce la distrugerea hranei vegetale sau a altor specii . Prin urmare este de dorit ca efectivul speciei s rmn staionar cu oscilaii periodice n timp cu o perioad T . VI. Reglarea artificial a efectivelor populaiilor , efectuat de ctre om Lsnd la o parte cazul speciilor de animale domestice n care intervine numai n mic msur competiia pentru hran ,datorat densitii n grajduri , vom aborda reglarea artificial de ctre om a efectivelor animalelor slbatice folositoare pentru vntoare i pescuit precum i combaterea duntorilor agricoli . a) n cazul vntorii i pescuitului , reglarea artificial are ca scop meninerea efectivului speciei vnate sau pescuite deasupra limite de supravieuire m . Fie = (efectiv vnat sau pescuit ) / (efectiv total ). Efectivul X(t) satisface ecuaia diferenial : dX / dt = ( )X X2 cu soluia :

.X(0) X(t) = X(0) + X(0) .e ( )


Aceast soluie are ca grafic logistica de mai jos :

239

Aici punctul de inflexiune este :

ln( t '0 =
Trebuie s avem : ( ) / > m > .m de unde : (1)

) 1 .X(0) ( )

Exemplu Multe specii de vnat sau pescuit valoroase sunt ameninate cu dispariia , avnd efectivul apropiat de limita de supravieuire m . Cota de vnat sau pescuit este strict limitat prin lege , conform condiiei precedente . b) n cazul unei specii de duntori agricoli reglarea artificial a efectivului acestora const n decimarea pe cale chimic sau biologic a acestor duntori . 1) Pe cale chimic : Avem = (efectiv decimat chimic ) / (efectiv total ). Efectivul X(t) al duntorilor satisface ecuaia diferenial : dX / dt = ( )X X2 Pentru ca efectivul s scad trebuie ca (dX / dt) <0 deci : ( ).X .X2 < 0 de unde : < .X (2)

240
2) Pe cale biologic : Se sterilizeaz o parte Xs(t) din numrul de masculi ceace duce la micorarea coeficienilor de natalitate ai sexelor de la 1 la 1(1 Xs / X1) la masculi i de la 2 la 2(1 Xs / X1) la femele aa c sistemul de ecuaii difereniale de la punctul II , devine : dX1 / dt = 1 (1 Xs / X1).X2 - 1X1 - 1X1.(X1+X2) dX2 / dt = [ 2 (1 Xs / X1) 2 ].X2 2X2.(X1+X2) Presupunem pentru simplificare 1= 2= ; 1= 2= ;1= 2= deci scznd ecuaiile precedente obinem : d(X1 - X2) / dt = - (X1 X2) aa c X1 X2 = e t deci pentru t avem X1= X2 = X / 2 i ecuaiile precedente vor coincide cu ecuaia : dX / dt = (1 Xs / X1 ) .X - X X2 Pentru ca efectivul X(t) s scad , trebuie ca dX / dt < 0 adic : (1 Xs / X1 ) .X - X X2 < 0 i notnd = Xs / X1 ,rezult : > 1 / ( / ) .X (3)

Exemplu La decimarea chimic a gndacului de Colorado, cantitatea de insecticid i concentraia acestuia (%) se stabilesc astfel ca cota decimat chimic s duc la scderea efectivului conform relaiei (2 ) de la punctul a). Decimarea biologic prin sterilizare s-a aplicat n America la musca Cochliomy Hominivorax care atac animalele domestice , fapt care a dus la scderea vertiginoas a efectivului aceste mute , conform condiiei (3) de la punctul b). 11.2.3 Pdurile ca ecosisteme vegetale

n epocile geologice naintea apariiei omului ,pdurea a fost cel mai important sistem biologic vegetal. mportana pdurii n prezent este la fel de mare pentru sntatea planetei iar ca sistem biologic i tehnico-economic este controlat printr-o legislaie strict. Calitile principale ale pdurii sunt urmtoarele : 1) Este principala furnizoare de oxigen i consumatoare de bioxid de carbon a planetei . Arborii valorific cldura i lumina solar pe vertical , un arbore avnd o suprafa verde echivalent cu o mare suprafa ierboas. 2) Este furnizoarea materiei prime lemnoase folosit pentru construcii , mobil i combustibil . Dealtfel pdurile preistorice sunt la originea formrii zcmintelor de crbuni. 3) Este principalul factor de mbuntire a microclimatului prin atragerea ploilor, de combatere a pulberilor i gazelor poluante,de stabilizare a terenurilor n pant. 4) Este un habitat ideal pentru multe specii de animale slbatice n special cele arboricole . 5) Are valene turistice incontestabile ca loc de recrerere i odihn .

241
6) Are valene fitoterapeutice mari prin substanele coninute n arbori , unele insuficient cunoscute i studiate de medicin . 7) Implic cheltuieli specifice mai mici fa de plantele de cultur n raport cu veniturile pe care le aduc. Din pcate n prezent suprafeele mpdurite scad continuu mai ales n rile n curs de dezvoltare cu consecine catastrofale pentru mediu la scar mic i la scar mare . Cele mai nefaste consecine sunt accentuarea polurii globale , deertificarea i alunecrile de teren. Exploatarea iraional a fondului forestier nensoit de o replantare corespunztoare , este principala cauz a scderii suprafeelor mpdurite. Un arbore mare se taie n cteva minute dar se reface n cteva zeci de ani . n multe locuri pdurile au fost defriate pentru a face loc terenurilor arabile , care exploatate intensiv , s-au degradat . Politicile naionale i internaionale fa de pduri trebuie s stopeze fenomenele negative semnalate mai sus ,pentru a repune n drepturi acest aur verde al planetei. Din cele prezentate mai sus reies i componentele pdurii ca ecosistem vegetal. Sistemul silvic are urmtoarele componente : a) Intrri : oxigen ,bioxid de carbon, energie solar gratuit,ap,substane minerale din sol , resturi vegetale reciclate ,ngrminte naturale de la animalele slbatice i altele . b) Stri interne : starea de vegetaie este legat de vrsta arborilor , de densitatea i de efectul nefavorabil al polurii i furtunilor . ntre arbori de diferite vrste i talii exist o lupt acerb pentru lumin i cldur . Starea pdurilor este obiectul de activitate al unor organisme specializate i trebuie urmrit cu strictee. c) Ieiri : oxigen,mas lemnoas ,biomas ,fructe de pdure,hran pentru animale slbatice , spaii de recreere i parcuri dendrologice i altele . Un calcul economic arat c pdurea este un sistem rentabil dac se respect cerinele i dezideratele enumarate mai sus .

242
BIBLIOGRAGIE GENERAL 1.ANDREI T.,STANCU S.,PELE D.T.Statistica,Ediia II,Ed.Economic,2002 2.ALECU I.N. i col.Management n agricultur ,Ed.Ceres ,1997 3.ANDREESCU E.Curs de matematic i statistic biologic AMD ,IANB,1980 4.ANGHELACHE C.Statistic general ,Ed. Economic,1999 5.ANUARUL STATISTIC AL ROMNIEI ,1991-2003 6.BARON T.,ANGHELACHE C.,TIAN E. Statistic Ed.Economic, 1996 7.BDI M:,BARON T.,KORKA M.Statistic pentru afaceri Ed.Eficient, Bucureti ,1998 8.BERCA M.Ecologie general i protecia mediului Ed.Ceres , 2000 9.BIJI E.,NEGUR I. Aplicaii statistice n conducerea activitii din agricultur Ed.Ceres,1980 10.BIJI E.M. i col.Statistica managerial a agentului economic din agricultur,Ed.Ceres ,1998 11.BIJI M. i col.Tratat de Statistic , Ed. Economic,2002 12.CEAPOIU N.Metode statistice aplicate n experienele agricole i biologice Ed.Agrosilvic,1968 13.CAPANU I.,ANGHELACHE C.Indicatori economici,Ed.Economic,2000 14.CLOCOTICI V.,STAN A. Statistic aplicat n psihologie,Ed.Polirom, 2000 15.DAGNELIE P.Statistique thorique et applique,tome 1,2 De Boeck et Larcier,1998 16.DAVIES R.G.Computer Programming in Quantitative Biology Academic Press,1971 17.DRGHICI M.,ALECU I.M.,DINU T.Management generalLito AMC, 1999 18.DRGHICI M. AGR1.Producie vegetal Sistem informatic integrat destinat planificrii afacerilor exploataiei agricole, USAMV ,2003 19. DUMITRESCU M. Teoria sondajelor statistice Ed.Tehnic ,2003 20. ENE D. Calculul i interpretarea unor indicatori informaionali n statistica agricolLucrri tiinifice IANB,Seria E, vol.XVII (1974),92-95 21.ENE D. Calculul aporturilor variaiei factorilor n agricultur i al concentraiei acestora Lucrri tiinifice IANB,Seria E, Vol.XX-XXI(1977-1978),25-30 22.ENE D. Curs de Matematic i Biometrie (Litografiat Atelierele de material Didactic USAMV) ,1979 23.ENE D. Asupra unei funcii de producie unifactoriale Lucrri tiinifice IANB ,Seria E,vol.XXIV(1981),89-92 24.ENE D. Generalizarea unor indicatori statistici de evoluie Lucrri tiinifice IANB,Seria E,vol.XXIV(1981),93-96 25.ENE D. Programe de calculator pentru funcia de regresie liniar pe poriuni Lucrri tiinifice IANB,Seria E,vol.XXV(l982), 75-84 26.ENE D. Asupra concentrrii i specializrii produciei agricole pe

243
ramuriLucrri tiinifice IANB ,Seria E,vol.XXV(1982),85-90 27.ENE D. Asupra calculului aporturilor variaiei factorilor n variaia produciei agricole Lucrri tiinifice IANB,Seria E, vol.XXVI(1983),89-92 28.ENE D. Aducerea n limite normale a valorii heritabilitii estimat prin metoda regresiei Comunicare la Simpozionul tiinific internaional de Zootehnie,Iai ,12-13 XII ,1996 29.ENE D.,DRGHICI M.,ALECU I.N. Srtatistic aplicat n agricultur, Ed.Ceres,2003 30.ENE D.Matematici(I) (Algebr i programare liniar), Ed.Ceres,2004 31.ENE D. Matematic cu aplicaii n biologie i tiine agricole Ed.ALL,2004 32.ENE D.Programe executabile de algebr liniar , analiz numeric, optimizri i statistic pentru agricultur 2005 33.GOGONEA S.,ENE D. Analiz numeric,Ed. Cartea Universitar,2005 34.GROSU H.,LUNGU S.,KREMER V.D. Modele liniare utilizate n ameliorarea genetic a animalelor,Ed.Coral Sanivet,1997 35.IOSIFESCU M.,TUTU P. Procese stohastice i aplicaii n biologie i medicin Ed.Academiei R.S.R.,1968 36.IOSIFESCU M. Lanuri Markov finite i aplicaii Ed.Tehnic,1977 37.IOSIFESCU M.,MOINEAGU C.,TREBICI V.,URSIANU E. Mic Enciclopedie de Statistic Ed. tiinific i Enciclopedic,1985 38.ISAIC-MANIU A.,GRDINARU A.,VOINEAGU V.,MITRU C. Statistic teoretic i economic Ed.Tehnic ,Chiinu ,1994 39.ISAIC-MANIU A.,VOD GH.V. Manualul calitii,Ed.Economic,1997 40.JABA E. Statistica Ediia II,Ed. Economic ,2000 41.JOHNSTON J. Econometric Methods 3rd Edition , McGraw-Hill,1984 42.KENDALL M. Time-Series C.Griffin &Co.,London,1976 43.MALIA M.,ZIDROIU C. Matematica organizrii, Ed. Tehnic,1975 44.MARINESCU I.Analiz factorial Ed.tiinific i Enciclopedic, 1984 45.MATHER K.The Elements of Biometry,Meuthen,1967 46.MERCE E., URS FL.,MERCE C. Statistic,Ed. Academic Pres,2001 47.METCALFE A.V.Statistics n Engineering,Ed.Chapman &Hall,1994 48.MIHOC GH.,URSEANU V. Tratat de statistic matematic Ed.Academiei R.S.R.,1976-1977 49.MONTGOMERY D.C.,RUNGER G.C.Applied Statistics and Probability For EngineersJ.Wiley ,1994 50.NEGOESCU GH.,CIOBANU R.,BONTA C.ABazele statisticii pentru afaceri Ed.ALL BECK,1999 51.OANCEA M.Tratat de management n unitile agricole,Ed.Ceres,1999 52.OTIMAN P.I.,CRE F. Elemente de matematici aplicate n economia agroalimentar Ed. Agroprint, 2002 53.PECICAN E.S. Econometrie ,Ed.ALL,1994 54.POSTELNICU T.,TUTU P.Metode matematice n medicin i biologie Ed.Tehnic,1971 55.PURCARU I.Informaie i corelaie,Ed.tiinific i Enciclopedic,1988 56.SANDU GH.Modele experimentale n zootehnie Ed.Coral Sanivet,1995

244
57.SNDOIU D.I. Tehnic experimental Partea I ,Ed.Elisavaros, Bucureti,2003 58.SULESCU N.A.,SULESCU N.N.Cmpul de experienEd. AgroSilvic ,1967 59.SEARLE S.R.Linear Models, J.Wiley ,1971 60.SNEDECOR C.W. Medode statistice aplicate n cercetrile de agricultur,i biologie,Ed.Didactic i Pedagogic,1968 61.SORA V.,HRISTACHE I.,MIHESCU C. Demografie i statistic social Ed.Economic,1996 62.TACU A.Metode statistice n zootehnie i medicin veterinar Ed.Agrosilvic ,1968 63.TRCOLEA C.,FILIPOIU A.,BONTA S. Tehnici actuale n teoria fiabilitii Ed. tiinific i Enciclopedic,1989 64.TODORAN I.Rspunsuri posibile.Corelaie i prognoz Ed.Dacia,1989 65.TOMESCU D.,MANCIU GH.,SCRIPSNIC V. Fiabilitatea utilajelor agricole,Ed.Ceres,1981 66.VOD V.GH.Gndirea statistic-un mod de gndire al viitorului Ed.Albatros,1977 67.VOINEAGU V. i col. Statistica economic,Ed.Tribuna Economic,2001 68.WALLACE T.D.,SILVER J.L. Econometrics. An Introduction Addison-Wesley ,1988

245
ANEX CU TABELE STATISTICE Tabel 1 Funcia de repartiie N(0;1) : F( u/2 ) 1 /2 Tabel 2 Valorile Student t /2 i t : P( | t | > t /2 ) = P( t > t ) = Tabel 3 Valorile hi patrat 2 : P( 2 > 2 ) = Tabel 4 Valorile Fisher F0.05 : P( F> F0.05 ) = 0.05 Tabel 5 Valorile Fisher F0.01 : P( F> F0.01 ) = 0.01 Tabel 6 Valorile Fisher F0.001 : P( F> F0.001 ) = 0.001 Tabel 7 Amplitudinea studentizat Tukey T0.05 Tabel 8 Amplitudinea studentizat Tukey T0.01 Tabel 9 Valori critice ale asimetriei i boltirii Tabel 10 Valori critice R/2 ale coeficientului de corelaie liniar R Tabel 11 Transformarea Fisher z = 0.5 ln [(1 R)/(1+ R )] Tabel 12 Valori critice pentru fie de control al calitii

246 TABEL 1
U 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.9 2.9 3.0 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 0.00 0.50000 0.53983 0.57926 0.61791 0.65542 0.69146 0.72575 0.75803 0.78814 0.81594 0.84134 0.86433 0.88493 0.90320 0.91924 0.93319 0.94520 0.95543 0.96407 0.97128 0.97725 0.98214 0.98610 0.98928 0.99180 0.99379 0.99534 0.99653 0.99744 0.99813 0.99865 0.99903 0.99931 0.99952 0.99966 0.99977 0.99984 0.99989 0.99993 0.99995

Functia de repartitie N(0;1) : F( U/2 ) = 1 - /2


0.01 0.50399 0.54379 0.58317 0.62172 0.65910 0.69497 0.72907 0.76115 0.79103 0.81859 0.84375 0.86650 0.88686 0.90490 0.92073 0.93448 0.94630 0.95637 0.96485 0.97193 0.97778 0.98257 0.98645 0.98956 0.99202 0.99396 0.99547 0.99664 0.99752 0.99819 0.99869 0.99906 0.99934 0.99953 0.99968 0.99978 0.99985 0.99990 0.99993 0.99995 0.02 0.50798 0.54776 0.58706 0.62551 0.66276 0.69847 0.73237 0.76424 0.79389 0.82121 0.84613 0.86864 0.88877 0.90658 0.92219 0.93574 0.94738 0.95728 0.96562 0.97257 0.97831 0.98300 0.98679 0.98983 0.99224 0.99413 0.99560 0.99674 0.99760 0.99825 0.99874 0.99910 0.99936 0.99955 0.99969 0.99978 0.99985 0.99990 0.99993 0.99996 0.03 0.51197 0.55172 0.59095 0.62930 0.66640 0.70194 0.73565 0.76730 0.79673 0.82381 0.84849 0.87076 0.89065 0.90824 0.92364 0.93699 0.94845 0.95818 0.96637 0.97320 0.97882 0.98341 0.98713 0.99010 0.99245 0.99430 0.99573 0.99683 0.99767 0.99831 0.99878 0.99913 0.99938 0.99957 0.99970 0.99979 0.99986 0.99990 0.99994 0.99996 0.04 0.51595 0.55567 0.59483 0.63307 0.67003 0.70540 0.73891 0.77035 0.79954 0.82639 0.85083 0.87285 0.89251 0.90988 0.92506 0.93822 0.94950 0.95907 0.96711 0.97381 0.97932 0.98382 0.98745 0.99036 0.99266 0.99446 0.99585 0.99693 0.99774 0.99836 0.99882 0.99916 0.99940 0.99958 0.99971 0.99980 0.99986 0.99991 0.99994 0.99996 0.05 0.51994 0.55962 0.59871 0.63683 0.67364 0.70884 0.74215 0.77337 0.80234 0.82894 0.85314 0.87493 0.89435 0.91149 0.92647 0.93943 0.95053 0.95994 0.96784 0.97441 0.97982 0.98422 0.98778 0.99061 0.99286 0.99461 0.99598 0.99702 0.99781 0.99841 0.99886 0.99918 0.99942 0.99960 0.99972 0.99981 0.99987 0.99991 0.99994 0.99996 0.06 0.52392 0.56356 O.60257 0.64058 0.67724 0.71226 0.74537 0.77637 0.80510 0.83147 0.85543 0.87697 0.89616 0.91308 0.92785 0.94062 0.95154 0.96080 0.96856 0.97500 0.98030 0.98461 0.98809 0.99086 0.99305 0.99477 0.99609 0.99711 0.99788 0.99846 0.99889 0.99921 0.99944 0.99961 0.99973 0.99981 0.99987 0.99992 0.99994 0.99996 0.07 0.52790 0.56749 0.60642 0.64431 0.68082 0.71566 0.74857 0.77935 0.80785 0.83397 0.85769 0.87900 0.89796 0.91465 0.92922 0.94179 0.95254 0.96164 0.96926 0.97558 0.98077 0.98500 0.98840 0.99111 0.99324 0.99492 0.99621 0.99720 0.99795 0.99851 0.99893 0.99924 0.99946 0.99962 0.99974 0.99982 0.99988 0.99992 0.99995 0.99996 0.08 0.53188 0.57142 0.61026 0.64803 0.64838 0.71904 0.75175 0.78230 0.81057 0.83646 0.85993 0.88100 0.89973 0.91621 0.93056 0.94295 0.95352 0.96246 0.96995 0.97615 0.98124 0.98537 0.98870 0.99134 0.99343 0.99506 0.99632 0.99728 0.99801 0.99856 0.99897 0.99926 0.99948 0.99964 0.99975 0.99983 0.99988 0.99992 0.99995 0.99997 0.09 0.53586 0.57534 0.61409 0.65173 0.68793 0.72240 0.75490 0.78523 0.81327 0.83891 0.86214 0.88297 0.90147 0.91773 0.93189 0.94408 0.95448 0.96327 0.97062 0.97670 0.98169 0.98574 0.98899 0.99158 0.99361 0.99520 0.99643 0.99736 0.99807 0.99861 0.99900 0.99929 0.99950 0.99965 0.99976 0.99983 0.99989 0.99992 0.99995 0.99997

247

TABEL 2 Valorile Student t/2 si t : P(| t | > t/2 ) = P(t > t) =


GL 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 0.40 0.325 0.289 0.277 0.271 0.267 0.265 0.263 0.262 0.261 0.260 0.260 0.259 0.259 0.258 0.258 0.258 0.257 0.257 0.257 0.257 0.257 0.256 0.256 0.256 0.256 0.256 0.256 0.256 0.256 0.256 0.255 0.255 0.254 0.254 0.254 0.254 0.254 0.253 0.25 1.000 0.816 0.765 0.741 0.727 0.718 0.711 0.706 0.703 0.700 0.697 0.695 0.694 0.692 0.691 0.690 0.689 0.688 0.688 0.687 0.686 0.686 0.685 0.685 0.684 0.684 0.684 0.683 0.683 0.683 0.681 0.679 0.679 0.678 0.678 0.677 0.677 0.674 0.10 3.078 1.886 1.638 1.533 1.476 1.440 1.415 1.397 1.383 1.372 1.363 1.356 1.350 1.345 1.341 1.337 1.333 1.330 1.328 1.325 1.323 1.321 1.319 1.318 1.316 1.315 1.314 1.313 1.311 1.310 1.303 1.299 1.296 1.294 1.292 1.291 1.290 1.282 0.05 6.314 2.920 2.353 2.132 2.015 1.943 1.895 1.860 1.833 1.812 1.796 1.782 1.771 1.761 1.753 1.746 1.740 1.734 1.729 1.725 1.721 1.717 1.714 1.711 1.708 1.706 1.703 1.701 1.699 1.697 1.684 1.676 1.671 1.667 1.664 1.662 1.660 1.645 0.025 12.706 4.303 3.182 2.776 2.571 2.447 2.365 2.306 2.262 2.228 2.201 2.179 2.160 2.145 2.131 2.120 2.110 2.101 2.093 2.086 2.080 2.074 2.069 2.064 2.060 2.056 2.052 2.048 2.045 2.042 2.021 2.009 2.000 1.994 1.990 1.987 1.984 1.960 0.01 31.821 6.965 4.541 3.747 3.365 3.143 2.998 2.896 2.821 2.764 2.718 2.681 2.650 2.624 2.602 2.583 2.567 2.552 2.539 2.528 2.518 2.508 2.500 2.492 2.485 2.479 2.473 2.467 2.462 2.457 2.423 2.403 2.390 2.381 2.374 2.368 2.364 2.326 0.005 63.657 9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.250 3.169 3.106 3.055 3.012 2.977 2.947 2.921 2.898 2.878 2.861 2.845 2.831 2.819 2.807 2.797 2.787 2.779 2.771 2.763 2.756 2.750 2.704 2.678 2.660 2.648 2.639 2.632 2.626 2.576 0.0025 127.32 14.089 7.453 5.598 4.773 4.317 4.029 3.833 3.690 3.581 3.497 3.428 3.372 3.326 3.286 3.252 3.222 3.197 3.174 3.153 3.135 3.119 3.104 3.091 3.078 3.067 3.057 3.047 3.038 3.030 2.971 2.937 2.915 2.899 2.887 2.878 2.871 2.807 0.001 318.31 23.326 10.213 7.173 5.893 5.208 4.785 4.501 4.297 4.144 4.025 3.930 3.852 3.787 3.733 3.686 3.646 3.610 3.579 3.552 3.527 3.505 3.485 3.467 3.450 3.435 3.421 3.408 3.396 3.385 3.307 3.261 3.232 3.211 3.195 3.183 3.174 3.090 0.0005 636.62 31.598 12.924 8.610 6.869 5.959 5.408 5.041 4.781 4.587 4.437 4.318 4.221 4.140 4.073 4.015 3.965 3.922 3.883 3.850 3.819 3.792 3.767 3.745 3.725 3.707 3.690 3.674 3.659 3.646 3.551 3.496 3.460 3.435 3.416 3.402 3.390 3.291

248

TABEL 3 Valorile hi patrat (2 ) : P (2 > 2 ) =

GL 0.9995 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 0.0639 0.001 0.02 0.06 0.16 0.30 0.48 0.71 0.97 1.26 1.50 1.93 2.30 2.70 3.11 3.54 3.98 4.44 4.91 5.40 5.90 6.40

0.995 0.0439 0.01 0.07 0.21 0.41 0.68 0.99 1.34 1.73 2.16 2.60 3.07 3.57 4.07 4.60 5.14 5.70 6.26 6.84 7.43 8.03 8.64

0.975 0.0398 0.05 0.22 0.48 0.83 1.24 1.69 2.18 2.70 3.25 3.92 4.40 5.01 5.63 6.87 6.91 7.56 8.23 8.91 9.59 10.28 10.98

0.05 3.84 5.99 7.81 9.49 11.07 12.59 14.07 15.51 16.92 18.31 19.68 21.03 22.36 23.68 25.00 26.20 27.59 28.87 30.14 31.41 32.67 33.92

0.025 5.02 7.38 9.35 11.14 12.83 14.45 16.01 17.53 19.02 20.48 21.92 23.34 24.74 26.12 27.49 28.85 30.19 31.53 32.85 34.17 35.48 36.78

0.01 6.63 9.21 11.34 13.28 15.09 16.81 16.48 20.09 21.67 23.21 24.72 26.22 27.69 29.14 30.58 32.00 33.41 34.81 36.19 37.57 38.93 40.29

0.005 7.88 10.60 12.84 14.86 16.75 18.55 20.28 21.96 23.59 25.19 26.76 28.30 29.82 31.32 32.80 34.27 35.72 37.16 38.58 40.00 41.40 42.80

0.001 10.83 13.82 16.27 18.47 20.51 22.46 24.32 26.12 27.88 29.59 31.26 32.91 34.53 36.12 37.70 39.25 40.79 42.31 43.82 45.31 46.80 48.27

0.0005 12.12 15.20 17.73 20.00 22.10 24.10 26.12 27.87 29.67 31.42 33.14 34.82 36.48 38.11 39.72 41.31 42.88 44.43 45.97 47.50 49.01 50.51

CONTINUARE N PAGINA URMTOARE

249

GL 0.9995 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 6.92 7.45 8.00 8.54 9.09 9.66 10.23 10.80 16.91 23.46 30.34 37.47 44.79 52.28 59.90

0.995 9.26 9.89 10.52 11.16 11.81 12.46 13.12 13.79 20.71 27.99 35.53 43.27 51.17 59.20 67.33

0.975 11.69 12.40 13.12 13.84 14.57 15.31 16.05 16.79 24.43 32.36 40.48 48.76 57.15 65.65 74.22

0.05 35.17 36.42 37.65 38.89 40.11 41.34 42.56 43.77 55.76 67.50 79.08 90.53 101.88 113.14 124.34

0.025 38.08 39.36 40.65 41.92 43.19 44.46 45.72 46.98 59.34 71.42 83.30 95.02 106.63 118.14 129.56

0.01 41.64 42.98 44.31 45.64 46.96 48.28 49.59 50.89 63.69 76.15 88.38 100.42 112.33 124.16 135.81

0.005 44.18 45.56 46.93 48.29 49.64 50.99 52.34 53.67 66.77 79.49 91.95 104.21 116.32 128.30 140.17

0.001 49.73 51.18 52.62 54.05 55.48 56.89 58.30 59.70 73.40 86.66 99.61 112.32 124.84 137.21 149.45

0.0005 52.00 53.48 54.95 56.41 57.86 59.30 60.73 62.16 76.09 89.56 102.69 115.58 128.26 140.78 153.17

250

TABEL 4 Valorile Fisher ( F0.05 ) : P ( F > F0.05 ) = 0.05


GL 1 GL 2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 1 161.4 18.51 10.13 7.71 6.61 5.99 5.59 5.32 5.12 4.96 4.84 4.75 4.67 4.60 4.54 4.49 4.45 4.41 4.38 4.35 4.32 4.30 4.28 4.26 4.24 4.23 4.21 4.20 4.18 4.17 4.08 4.00 3.93 3.84 2 199.5 19.00 9.55 6.94 5.79 5.14 4.74 4.46 4.26 4.10 3.98 3.89 3.81 3.74 3.68 3.63 3.59 3.55 3.52 3.49 3.47 3.44 3.42 3.40 3.39 3.37 3.35 3.34 3.33 3.32 3.23 4.15 3.07 3.00 3 215.7 19.16 9.28 6.59 5.41 4.76 4.35 4.07 3.86 3.71 3.59 3.49 3.41 3.34 3.29 3.24 3.20 3.16 3.13 3.10 3.07 3.05 3.03 3.01 2.99 2.98 2.96 2.95 2.93 2.92 2.84 2.76 2.29 2.60 4 224.6 19.25 9.12 6.39 5.19 4.53 4.12 3.84 3.63 3.48 3.36 3.26 3.18 3.11 3.06 3.01 2.96 2.93 2.90 2.87 2.84 2.82 2.80 2.78 2.76 2.74 2.73 2.71 2.70 2.69 2.61 2.53 2.45 2.37 5 230.2 19.30 9.01 6.26 5.05 4.39 3.97 3.69 3.48 3.33 3.20 3.11 3.83 2.96 2.90 2.85 2.81 2.77 2.74 2.71 2.68 2.66 2.64 2.62 2.60 2.59 2.57 2.56 2.55 2.53 2.45 2.37 2.29 2.21 6 234.0 19.33 8.94 6.16 4.95 4.28 3.87 3.58 3.37 3.22 3.09 3.00 2.92 2.85 2.79 2.74 2.70 2.66 2.63 2.60 2.57 2.55 2.53 2.51 2.49 2.47 2.46 2.45 2.43 2.42 2.34 2.25 2.17 2.10 7 236.8 19.35 8.89 6.09 4.88 4.21 3.79 3.50 3.29 3.14 3.01 2.91 2.83 2.76 2.71 2.66 2.61 2.58 2.54 2.51 2.49 2.46 2.44 2.42 2.40 2.39 2.37 2.36 2.35 2.33 2.25 2.17 2.09 2.01 8 238.9 19.37 8.85 6.04 4.82 4.15 3.73 3.44 3.23 3.07 2.95 2.85 2.77 2.70 2.64 2.59 2.55 2.51 2.48 2.45 2.42 2.40 2.37 2.36 2.34 2.32 2.31 2.29 2.28 2.27 2.18 2.10 2.02 1.94 9 240.5 19.38 8.81 6.00 4.77 4.10 3.68 3.39 3.18 3.02 2.90 2.80 2.71 2.65 2.59 2.54 2.49 2.46 2.42 2.39 2.37 2.34 2.32 2.30 2.28 2.27 2.25 2.24 2.22 2.21 2.12 2.04 1.96 1.88 10 241.9 19.40 8.79 5.96 4.74 4.06 3.64 3.35 3.14 2.98 2.85 2.75 2.67 2.60 2.54 2.49 2.45 2.41 2.38 2.35 2.32 2.30 2.27 2.25 2.24 2.22 2.20 2.19 2.18 2.16 2.08 1.99 1.91 1.83 12 243.9 19.41 8.74 5.91 4.68 4.00 3.57 3.28 3.07 2.91 2.79 2.69 2.60 2.53 2.48 2.42 2.38 2.34 2.31 2.28 2.25 2.23 2.20 2.18 2.16 2.15 2.13 2.12 2.10 2.09 2.00 1.92 1.83 1.75 15 245.9 19.43 8.70 5.86 4.62 3.94 3.51 3.22 3.01 2.85 2.72 2.62 2.53 2.46 2.40 2.35 2.31 2.27 2.23 2.20 2.18 2.15 2.13 2.11 2.09 2.07 2.06 2.04 2.03 2.01 1.92 1.84 1.75 1.67 20 248.0 19.45 8.66 5.80 4.56 3.87 3.44 3.15 2.94 2.77 2.65 2.54 2.46 2.39 2.33 2.28 2.23 2.19 2.16 2.12 2.10 2.07 2.05 2.03 2.01 1.99 1.97 1.96 1.94 1.93 1.84 1.75 1.66 1.57 24 249.1 19.45 8.64 5.77 4.53 3.84 3.41 3.12 2.90 2.74 2.61 2.51 2.42 2.35 2.29 2.24 2.19 2.15 2.11 2.08 2.05 2.03 2.01 1.98 1.96 1.95 1.93 1.91 1.90 1.89 1.79 1.70 1.61 1.52 30 250.1 19.46 8.62 5.75 4.50 3.81 3.38 3.08 2.86 2.70 2.57 2.47 2.38 2.31 2.25 2.19 2.15 2.11 2.07 2.04 2.01 1.98 1.96 1.94 1.92 1.90 1.88 1.87 1.85 1.84 1.74 1.65 1.55 1.46 40 251.1 19.47 8.59 5.72 4.46 3.77 3.34 3.04 2.83 2.66 2.53 2.43 2.34 2.27 2.20 2.15 2.10 2.06 2.03 1.99 1.96 1.94 1.91 1.89 1.87 1.85 1.84 1.82 1.81 1.79 1.69 1.59 1.50 1.39 60 252.2 19.48 8.57 5.69 4.43 3.74 3.30 3.01 2.79 2.62 2.49 2.38 2.30 2.22 2.16 2.11 2.06 2.02 1.98 1.95 1.92 1.89 1.86 1.84 1.82 1.80 1.79 1.77 1.75 1.74 1.64 1.53 1.43 1.32 120 253.3 19.49 8.55 5.66 4.40 3.70 3.27 2.97 2.75 2.58 2.45 2.34 2.25 2.18 2.11 2.06 2.01 1.97 1.93 1.90 1.87 1.84 1.81 1.79 1.77 1.75 1.73 1.71 1.70 1.68 1.58 1.47 1.35 1.22 254.3 19.50 8.53 5.63 4.36 3.67 3.23 2.93 2.71 2.54 2.40 2.30 2.21 2.13 2.07 2.01 1.96 1.92 1.88 1.84 1.81 1.78 1.76 1.73 1.71 1.69 1.67 1.65 1.64 1.62 1.51 1.39 1.25 1.00

TABEL 5 Valorile Fisher ( F0.01 ) : P ( F > F0.01 ) = 0.01


GL 1 GL 2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 1 4052 98.50 34.12 21.20 16.26 13.75 12.25 11.26 10.56 10.04 9.65 9.33 9.07 8.86 8.68 8.53 8.40 8.29 8.18 8.10 8.02 7.95 7.88 7.82 7.77 7.72 7.68 7.64 7.60 7.56 7.31 7.08 6.85 6.63 2 4999 99.00 30.82 18.00 13.27 10.92 9.55 8.65 8.02 7.56 7.21 6.93 6.70 6.51 6.36 6.23 6.11 6.01 5.93 5.85 5.78 5.72 5.66 5.61 5.57 5.53 5.49 5.45 5.42 5.39 5.18 4.98 4.79 4.61 3 5403 99.17 29.46 16.69 12.06 9.78 8.45 7.59 6.99 6.55 6.22 5.95 5.74 5.56 5.42 5.29 5.18 5.09 5.01 4.94 4.87 4.82 4.76 4.72 4.68 4.64 4.60 4.57 4.54 4.51 4.31 4.13 3.95 378 4 5625 99.25 28.71 15.98 11.39 9.15 7.85 7.01 6.42 5.99 5.67 5.41 5.21 5.04 4.89 4.77 4.67 4.58 4.50 4.43 4.37 4.31 4.26 4.22 4.18 4.14 4.11 4.07 4.04 4.02 3.83 3.65 3.48 3.32 5 5764 99.30 28.24 15.52 10.97 8.75 7.46 6.63 6.06 5.64 5.32 5.06 4.86 4.69 4.36 4.44 4.34 4.25 4.17 4.10 4.04 3.99 3.94 3.90 3.85 3.82 3.78 3.75 3.73 3.70 3.51 3.34 3.17 3.02 6 5859 99.33 27.91 15.21 10.67 8.47 7.19 6.37 5.80 5.39 5.07 4.82 4.62 4.46 4.32 4.20 4.10 4.01 3.94 3.87 3.81 3.76 3.71 3.67 3.63 3.59 3.56 3.53 3.50 3.47 3.29 3.12 2.96 2.80 7 5928 99.36 27.67 14.98 10.46 8.26 6.99 6.18 5.61 5.20 4.89 4.64 4.44 4.28 4.14 4.03 3.93 3.84 3.77 3.70 3.64 3.59 3.54 3.50 3.46 3.42 3.39 3.36 3.33 3.30 3.12 3.95 2.79 2.64 8 5982 99.37 27.49 14.80 10.29 8.10 6.84 6.03 5.47 5.06 4.74 4.50 4.30 4.14 4.00 3.89 3.79 3.71 3.63 3.56 3.51 3.45 3.41 3.36 3.32 3.29 3.26 3.23 3.20 3.17 2.99 2.82 2.66 2.51 9 6022 99.39 27.35 14.66 10.16 7.98 6.72 5.91 5.35 4.94 4.63 4.39 4.19 4.03 3.89 3.78 3.68 3.60 3.52 3.46 3.40 3.35 3.30 3.26 3.22 3.18 3.15 3.12 3.09 3.07 2.89 2.72 2.56 2.41 10 6056 99.40 27.23 14.55 10.05 7.87 6.62 5.81 5.26 4.85 4.54 4.30 4.10 3.94 3.80 3 .69 3.59 3.51 3.43 3.37 3.31 3.26 3.21 3.17 3.13 3.09 3.06 3.03 3.00 2.98 2.80 2.63 2.47 2.32 12 6106 99.42 27.05 14.37 9.89 7.72 6.47 5.67 5.11 4.71 4.40 4.16 3.96 3.80 3.67 3.55 3.46 3.37 3.30 3.23 3.17 3.12 3.07 3.03 2.99 2.96 2.93 2.90 2.87 2.84 2.66 2.50 2.34 2.18 15 6157 99.43 26.87 14.20 9.72 7.56 6.31 5.52 4.96 4.56 4.25 4.01 3.82 3.66 3.52 3.41 3.31 3.23 3.15 3.09 3.03 2.98 2.93 2.89 2.85 2.81 2.78 2.75 2.73 2.70 2.52 2.35 2.19 2.04 20 6209 99.45 26.69 14.02 9.55 7.40 6.16 5.36 4.81 4.41 4.10 3.86 3.66 3.51 3.37 3.26 3.16 3.08 3.00 2.94 2.88 2.83 2.78 2.74 2.70 2.66 2.63 2.60 2.57 2.55 2.37 2.20 2.03 1.88 24 6235 99.46 26.60 13.93 9.47 7.31 6.07 5.28 4.73 4.33 4.02 3.78 3.59 3.43 3.29 3.18 3.08 3.00 2.92 2.86 2.80 2.75 2.70 2.66 2.62 2.58 2.55 2.52 2.49 2.47 2.29 2.12 1.95 1.79 30 6261 99.47 26.50 13.84 9.38 7.23 5.99 5.20 4.65 4.25 3.94 3.70 3.51 3.35 3.21 3.10 3.00 2.92 2.84 2.78 2.72 2.67 2.62 2.58 2.54 2.50 2.47 2.44 2.41 2.39 2.20 2.03 1.86 1.70 40 6287 99.47 26.41 13.75 9.29 7.14 5.91 5.12 4.57 4.17 3.86 3.62 3.43 3.27 3.13 3.02 2.92 2.84 2.76 2.69 2.64 2.58 2.54 2.49 2.45 2.42 2.38 2.35 2.33 2.30 2.11 1.94 1.76 1.59 60 6313 99.48 26.32 13.65 9.20 7.06 5.82 5.03 4.48 4.08 3.78 3.54 3.34 3.18 3.05 2.93 2.83 2.75 2.67 2.61 2.55 2.50 2.45 2.40 2.36 2.33 2.29 2.26 2.23 2.21 2.02 1.84 1.66 1.47 120 6339 99.49 26.22 13.56 9.11 6.97 5.74 4.95 4.40 4.00 3.69 3.45 3.25 3.09 2.96 2.84 2.75 2.66 2.58 2.52 2.46 2.40 2.35 2.31 2.27 2.23 2.20 2.17 2.14 2.11 1.92 1.73 1.53 1.32 6366 99.50 26.13 13.46 9.02 6.88 5.65 4.46 4.31 3.91 3.60 3.36 3.17 3.00 2.87 2.75 2.65 2.57 2.49 2.42 2.36 2.31 2.26 2.21 2.17 2.13 2.10 2.06 2.03 2.01 1.80 1.60 1.38 1.00

251

252

TABEL 6 Valorile Fisher ( F0.001 ) : P ( F > F0.001 ) = 0.001


GL 1 GL 2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 1 40532 998.5 167.0 74.14 47.18 35.51 29.25 25.42 22.86 21.04 19.69 18.64 17.81 17.14 16.59 16.12 15.72 15.38 15.08 14.82 14.59 14.38 14.19 14.03 13.88 13.74 13.61 13.50 13.39 13.29 12.61 11.97 11.38 10.83 2 50002 999.0 148.5 61.25 37.12 27.00 21.69 18.49 16.39 14.91 13.81 12.97 12.31 11.78 11.34 10.97 10.66 10.39 10.16 9.95 9.77 9.61 9.47 9.34 9.22 9.12 9.02 8.93 8.85 8.77 8.24 7.76 7.32 6.91 3 54042 999.2 141.1 56.18 33.20 23.70 18.77 15.83 13.90 12.55 11.56 10.80 10.21 9.73 9.34 9.00 8.73 8.49 8.28 8.10 7.94 7.80 7.67 7.55 7.45 7.36 7.27 7.19 7.12 7.05 6.60 6.17 5.79 5.42 4 56252 999.2 137.1 53.44 31.09 21.92 17.19 14.39 12.56 11.28 10.35 9.63 9.07 8.62 8.25 7.94 7.68 7.46 7.26 7.10 6.95 6.81 6.69 6.59 6.49 6.41 6.33 6.25 6.19 6.12 5.70 5.31 4.95 4.62 5 57642 999.3 134.6 51.71 29.75 20.81 16.21 13.49 11.71 10.48 9.58 8.89 8.35 7.92 8.57 7.27 7.02 6.81 6.62 6.46 6.32 6.19 6.08 5.98 5.88 5.80 5.73 5.66 5.59 5.53 5.13 4.76 4.42 4.10 6 58592 999.3 132.8 50.53 28.84 20.03 15.52 12.86 11.13 9.92 9.05 8.38 7.86 7.43 7.09 6.81 6.56 6.35 6.18 6.02 5.88 5.76 5.65 5.55 5.46 5.38 5.31 5.24 5.18 5.12 4.73 4.37 4.04 3.74 7 59292 999.4 131.6 49.66 28.16 19.46 15.02 12.40 10.70 9.52 8.66 8.00 7.42 7.08 6.74 6.46 6.22 6.02 5.85 5.69 5.56 5.44 5.33 5.23 5.15 5.07 5.00 4.93 4.87 4.82 4.44 4.09 3.77 3.47 8 59812 999.4 130.6 49.00 27.64 19.03 14.63 12.04 10.37 9.20 8.35 7.71 7.21 6.80 6.47 6.19 5.96 5.76 5.59 5.44 5.31 5.19 5.09 4.99 4.91 4.83 4.76 4.69 4.64 4.58 4.21 3.87 3.55 3.27 9 60232 999.4 129.9 48.47 27.24 18.69 14.33 11.77 10.11 8.96 8.12 7.48 6.98 6.58 6.26 5.98 5.75 5.56 5.39 5.24 5.11 4.99 4.89 4.80 4.71 4.64 4.57 4.50 4.45 4.39 4.02 3.69 3.38 3.10 10 60562 999.4 129.2 48.05 26.92 18.41 14.08 11.54 9.89 8.75 7.92 7.29 6.80 6.40 6.08 5.81 5.58 5.39 5.22 5.08 4.95 4.83 4.73 4.64 4.56 4.48 4.41 4.35 4.29 4.24 3.87 3.54 3.24 2.96 12 61072 999.4 128.3 47.41 26.42 17.99 13.71 11.19 9.57 8.45 7.63 7.00 6.52 6.13 5.81 5.55 5.32 5.13 4.97 4.82 4.70 4.58 4.48 4.39 4.31 4.24 4.17 4.11 4.05 4.00 3.64 3.31 3.02 2.74 15 61582 999.4 127.4 46.76 25.91 17.56 13.32 10.84 9.24 8.13 7.32 6.71 6.23 5.85 5.54 5.27 5.05 4.87 4.70 4.56 4.44 4.33 4.23 4.14 4.06 3.99 3.92 3.86 3.80 3.75 3.40 3.08 2.78 2.51 20 62092 999.4 126.4 46.10 25.39 17.12 12.93 10.48 8.90 7.80 7.01 6.40 5.93 5.56 5.25 4.99 4.78 4.59 4.43 4.29 4.17 4.06 3.96 3.87 3.79 3.72 3.66 3.60 3.54 3.49 3.15 2.83 2.53 2.27 24 62352 999.5 125.9 45.77 25.14 16.89 12.73 10.30 8.72 7.64 6.85 6.25 5.78 5.41 5.10 4.85 4.63 4.45 4.29 4.15 4.03 3.92 3.82 3.74 3.66 3.59 3.52 3.46 3.41 3.36 3.01 2.69 2.40 2.13 30 62612 999.5 125.4 45.43 24.87 16.67 12.53 10.11 8.55 7.47 6.68 6.09 5.63 5.25 4.95 4.70 4.48 4.30 4.14 4.00 3.88 3.78 3.68 3.59 3.52 3.44 3.38 3.32 3.27 3.22 2.87 2.55 2.26 1.99 40 62872 999.5 125.0 45.09 24.60 16.44 12.33 9.92 8.37 7.30 6.52 5.93 5.47 5.10 4.80 4.54 4.33 4.15 3.99 3.86 3.74 3.63 3.53 3.45 3.37 3.30 3.23 3.18 3.12 3.07 2.73 2.41 2.11 1.84 60 63132 999.5 124.5 44.75 24.33 16.21 12.12 9.73 8.19 7.12 6.35 5.76 5.30 4.94 4.64 4.39 4.18 4.00 3.84 3.70 3.58 3.48 3.38 3.29 3.22 3.15 3.08 3.02 2.97 2.92 2.57 2.25 1.95 1.66 120 63402 999.5 124.0 44.40 24.06 15.99 11.91 9.53 8.00 6.94 6.17 5.59 5.14 4.77 4.47 4.23 4.02 3.84 3.68 3.54 3.42 3.32 3.22 3.14 3.06 2.99 2.92 2.86 2.81 2.76 2.41 2.08 1.76 1.45 63662 999.5 123.5 44.05 23.79 15.75 11.70 9.33 7.81 6.76 6.00 5.42 4.97 4.60 4.31 4.06 3.85 3.67 3.51 3.38 3.26 3.15 3.05 2.97 2.89 2.82 2.75 2.69 2.64 2.59 2.23 1.89 1.54 1.00

253

c m GLE 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 24 30 40 60 120

TABEL 7 Amplitudinea studentizat Tukey T(0.05)


2 3.64 3.46 3.34 3.26 3.20 3.15 3.11 3.08 3.06 3.03 3.01 3.00 2.98 2.97 2.96 2.95 2.92 2.89 2.86 2.83 2.80 2.77 3 4.60 4.34 4.16 4.04 3.95 3.88 3.82 3.77 3.73 3.70 3.67 3.65 3.63 3.61 3.59 3.58 3.53 3.49 3.44 3.40 3.36 3.31 4 5.22 4.90 4.68 4.53 4.42 4.33 4.26 4.20 4.15 4.11 4.08 4.05 4.0 4.00 3.98 3.96 3.90 3.84 3.79 3.74 3.69 3.63 5 5.67 5.31 5.06 4.89 4.76 4.65 4.57 4.51 4.45 4.41 4.37 4.33 4.30 4.28 4.25 4.23 4.17 4.10 4.04 3.98 3.92 3.86 6 6.03 5.63 5.36 5.17 5.02 4.91 4.82 4.57 4.69 4.64 4.60 4.56 4.52 4.49 4.47 4.45 4.37 4.30 4.23 4.16 4.10 4.03 7 6.33 5.89 5.61 5.40 5.24 5.12 5.03 4.95 4.88 4.83 4.78 4.74 4.71 4.67 4.65 4.62 4.54 4.46 4.39 4.31 4.24 4.17 8 6.58 6.12 5.82 5.60 5.43 5.30 5.20 5.12 5.05 4.99 4.94 4.90 4.86 4.82 4.79 4.77 4.68 4.60 4.52 4.44 4.36 4.29 9 6.80 6.32 6.00 5.77 5.60 5.46 5.35 5.27 5.19 5.13 5.08 5.03 4.99 4.96 4.92 4.90 4.81 4.72 4.63 4.55 4.48 4.39 10 6.99 6.49 6.16 5.92 5.74 5.60 5.49 5.40 5.32 5.25 5.20 5.15 5.11 5.06 5.04 5.01 4.92 4.83 4.74 4.65 4.56 4.47 11 7.17 6.65 6.30 6.05 5.87 5.72 5.61 5.51 5.43 5.36 5.31 5.26 5.21 5.17 5.14 5.11 5.01 4.92 4.82 4.73 4.64 4.55 12 7.32 6.79 6.43 6.18 5.98 5.83 5.71 5.62 5.53 5.46 5.40 5.35 5.31 5.27 5.23 5.20 5.10 5.00 4.91 4.81 4.72 4.62 13 7.47 6.92 6.55 6.29 6.09 5.93 5.81 5.71 5.63 5.55 5.49 5.44 5.39 5.35 5.32 5.28 5.18 5.08 4.98 4.88 4.78 4.68 14 7.60 7.03 6.66 6.39 6.19 6.03 5.90 5.80 5.71 5.64 5.58 5.52 5.47 5.43 5.39 5.36 5.25 5.15 5.05 4.94 4.84 4.74 15 7.72 7.14 6.76 6.48 6.28 6.11 5.99 5.88 5.79 5.72 5.65 5.59 5.55 5.50 5.46 5.43 5.32 5.21 5.11 5.00 4.90 4.80 16 7.83 7.24 6.85 6.57 6.36 6.20 6.06 5.95 5.86 5.79 5.72 5.66 5.61 5.57 5.53 5.49 5.38 5.27 5.16 5.06 4.95 4.85 17 7.93 7.34 6.94 6.65 6.44 6.27 6.14 6.03 5.93 5.85 5.79 5.72 5.68 5.63 5.59 5.55 5.44 5.33 5.22 5.11 5.00 4.89 18 8.03 7.43 7.02 6.73 6.51 6.34 6.20 6.09 6.00 5.92 5.85 5.79 5.74 5.69 5.65 5.61 5.50 5.38 5.27 5.16 5.05 4.93 19 8.12 7.51 7.09 6.80 6.58 6.40 6.26 6.15 6.05 5.97 5.90 5.84 5.79 5.74 5.70 5.66 5.54 5.43 5.31 5.20 5.09 4.97 20 8.21 7.59 7.17 6.87 6.64 6.47 6.33 6.21 6.11 6.03 5.96 5.90 5.84 5.79 5.75 5.71 5.59 5.48 5.36 5.24 5.13 5.01

254

TABEL 8 Amplitudinea studentizat Tukey T(0.01)


m GLE 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 24 30 40 60 120 2 5.70 5.24 4.95 4.74 4.60 4.48 4.39 4.32 4.26 4.21 4.17 4.13 4.10 4.07 4.05 4.02 3.96 3.89 3.82 3.76 3.70 3.64 3 6.97 6.33 5.92 5.63 5.43 5.27 5.14 5.04 4.96 4.89 4.83 4.78 4.74 4.70 4.67 4.64 4.54 4.45 4.37 4.28 4.20 4.12 4 7.80 7.03 6.54 6.20 5.96 5.77 5.62 5.50 5.40 5.32 5.25 5.19 5.14 5.09 5.05 5.02 4.91 4.80 4.70 4.60 4.50 4.40 5 8.42 7.56 7.01 6.63 6.35 6.14 5.97 5.84 5.73 5.63 5.56 5.49 5.43 5.38 5.33 5.29 5.17 5.05 4.93 4.82 4.71 4.60 6 8.91 7.97 7.37 6.96 6.66 6.43 6.25 6.10 5.98 5.88 5.80 5.72 5.66 5.60 5.55 5.51 5.37 5.24 5.11 4.99 4.87 4.76 7 9.32 8.32 7.68 7.24 6.91 6.67 6.48 6.32 6.19 6.08 5.99 5.92 5.85 5.79 5.73 5.69 5.54 5.40 5.27 5.13 5.01 4.88 8 9.67 8.61 7.94 7.47 7.13 6.87 6.67 6.51 6.37 6.26 6.16 6.08 6.01 5.94 5.89 5.84 5.69 5.54 5.39 5.25 5.12 4.99 9 9.97 8.87 8.17 7.68 7.32 7.05 6.84 6.67 6.53 6.41 6.31 6.22 6.15 6.08 6.02 5.97 5.81 5.65 5.50 5.36 5.21 5.08 10 10.24 9.10 8.37 7.87 7.49 7.21 6.99 6.81 6.67 6.54 6.44 6.35 6.27 6.20 6.14 6.09 5.92 5.76 5.60 5.46 5.30 5.16 11 10.48 9.30 8.55 8.03 7.65 7.36 7.13 6.94 6.79 6.66 6.55 6.46 6.38 6.31 6.25 6.19 6.02 5.85 5.69 5.53 5.38 5.23 12 10.70 9.49 8.71 8.18 7.78 7.48 7.25 7.06 6.90 6.77 6.66 6.56 6.48 6.41 6.34 6.29 6.11 5.93 5.77 5.60 5.44 5.29 13 10.89 9.65 8.86 8.31 7.91 7.60 7.36 7.17 7.01 6.87 6.76 6.66 6.57 6.50 6.43 6.37 6.19 6.01 5.84 5.67 5.51 5.35 14 11.08 9.81 9.00 8.44 8.03 7.71 7.46 7.26 7.10 6.96 6.84 6.74 6.66 6.58 6.51 6.45 6.26 6.08 5.90 5.73 5.56 5.40 15 11.24 9.95 9.12 8.55 8.13 7.81 7.56 7.36 7.19 7.05 6.93 6.82 6.73 6.65 6.58 6.52 6.33 6.14 5.96 5.79 5.61 5.45 16 11.40 10.08 9.24 8.66 8.23 7.91 7.65 7.44 7.27 7.12 7.00 6.90 6.80 6.72 6.65 6.59 6.39 6.20 6.02 5.84 5.66 5.49 17 11.55 10.21 9.35 8.76 8.32 7.99 7.73 7.52 7.34 7.20 7.07 6.97 6.87 6.79 6.72 6.65 6.45 6.26 6.07 5.89 5.71 5.54 18 11.68 10.32 9.46 8.85 8.41 8.07 7.81 7.59 7.42 7.27 7.14 7.03 6.94 6.85 6.78 6.71 6.51 6.31 6.12 5.93 5.75 5.57 19 11.81 10.43 9.55 8.94 8.49 8.15 7.88 7.66 7.48 7.33 7.20 7.09 7.00 6.91 6.84 6.76 6.56 6.36 6.17 5.98 5.79 5.61 20 11.93 10.54 9.65 9.03 8.57 8.22 7.95 7.73 7.55 7.39 7.26 7.15 7.05 6.96 6.89 6.82 6.61 6.41 6.21 6.02 5.83 5.65

255

TABEL 9 Valori critice


n 50 100 150 200 250 300 350 400 450 500 550 600 650 700 750 800 850 900 950 1000 1500 2000 2500 3000 3500 4000 4500 5000 ASIMETRIA 0.05 0.533 0.389 0.321 0.280 0.251 0.230 0.213 0.200 0.188 0.179 0.171 0.163 0.157 0.151 0.146 0.142 0.138 0.134 0.130 0.127 0.104 0.090 0.080 0.073 0.068 0.064 0.060 0.057 A 0.01 0.787 0.567 0.464 0.403 0.360 0.329 0.305 0.285 0.269 0.255 0.243 0.233 0.224 0.215 0.208 0.202 0.196 0.190 0.185 0.180 0.147 0.127 0.114 0.104 0.096 0.090 0.085 0.081 0.99 1.95 2.18 2.30 2.37 2.42 2.46 2.50 2.52 2.55 2.57 2.58 2.60 2.61 2.62 2.64 2.65 2.66 2.66 2.67 2.68 2.73 2.77 2.79 2.81 2.82 2.83 2.84 2.85

ale asimetriei i boltirii


BOLTIREA 0.95 2.13 2.35 2.45 2.51 2.55 2.59 2.62 2.64 2.66 2.67 2.69 2.70 2.71 2.72 2.73 2.74 2.74 2.75 2.76 2.76 2.80 2.83 2.85 2.86 2.87 2.88 2.88 2.89 B 0.05 4.01 3.77 3.66 3.57 3.51 3.47 3.44 3.41 3.39 3.37 3.35 3.34 3.33 3.31 3.30 3.29 3.28 3.28 3.27 3.26 3.22 3.18 3.16 3.15 3.14 3.13 3.12 3.12 0.01 4.92 4.40 4.14 3.98 3.87 3.79 3.72 3.67 3.63 3.60 3.57 3.54 3.52 3.50 3.48 3.46 3.45 3.43 3.42 3.41 3.33 3.28 3.25 3.22 3.21 3.19 3.18 3.17

256

TABEL 10 Valori critice R/2 ale coeficientului de corelaie liniar R


GL 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 0.05 0.997 0.950 0.878 0.811 0.754 0.707 0.666 0.632 0.602 0.576 0.553 0.532 0.514 0.497 0.482 0.468 0.456 0.444 0.433 0.423 0.413 0.404 0.396 0.01 0.999 0.990 0.959 0.917 0.874 0.834 0.798 0.765 0.735 0.708 0.684 0.661 0.641 0.623 0.606 0.590 0.575 0.561 0.549 0.537 0.526 0.515 0.505 0.001 1.000 0.999 0.991 0.974 0.951 0.925 0.898 0.872 0.847 0.823 0.801 0.780 0.760 0.742 0.725 0.708 0.693 0.679 0.665 0.652 0.641 0.630 0.619 GL 24 25 26 27 28 29 30 35 40 45 50 60 70 80 90 100 125 150 200 300 400 500 1000 0.05 0.388 0.381 0.374 0.367 0.361 0.355 0.349 0.325 0.304 0.288 0.273 0.250 0.232 0.217 0.202 0.195 0.174 0.159 0.138 0.113 0.098 0.088 0.062 0.01 0.496 0.487 0.478 0.470 0.463 0.456 0.449 0.418 0.393 0.372 0.354 0.325 0.302 0.283 0.267 0.254 0.228 0.208 0.181 0.148 0.128 0.115 0.081 0.001 0.608 0.597 0.588 0.579 0.571 0.563 0.554 0.519 0.490 0.465 0.443 0.408 0.380 0.357 0.338 0.321 0.293 0.260 0.230 0.190 0.160 0.150 0.110

257

Tabel 11 Transformarea Fisher : Z = 0.5 ln [(1+R) / (1- R)] R 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.99 0.00 0.0000 0.1003 0.2027 0.3095 0.4236 0.5493 0.6931 0.8673 1.0986 1.4722 2.6467 0.01 0.0100 0.1105 0.2132 0.3206 0.4356 0.5627 0.7089 0.8872 1.1270 1.5275 2.6996 0.02 0.0200 0.1206 0.2237 0.3317 0.4477 0.5763 0.7250 0.9076 1.1568 1.5890 2.7587 0.03 0.0300 0.1308 0.2342 0.3428 0.4599 0.5901 0.7414 0.9287 1.1881 1.6584 2.8257 0.04 0.0400 0.1409 0.2448 0.3541 0.4722 0.6042 0.7582 0.9505 1.2212 1.7380 2.9031 0.05 0.0501 0.1511 0.2554 0.3654 0.4847 0.6184 0.7753 0.9730 1.2562 1.8318 2.9945 0.06 0.0601 0.1614 0.2661 0.3769 0.4973 0.6328 0.7928 0.9962 1.2933 1.9459 3.1063 0.07 0.0701 0.1717 0.2769 0.3884 0.5101 0.6475 0.8107 1.0203 1.3331 2.0923 3.2504 0.08 0.0802 0.1820 0.2877 0.4001 0.5230 0.6625 0.8291 1.0454 1.3758 2.2976 3.4534 0.09 0.0902 0.1923 0.2986 0.4118 0.5361 0.6777 0.8480 1.0714 1.4219 2.6467 3.800

258 TABEL 12 Valori critice pentru fie de control al calitii Vol.sondaj n 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 w 1.128 1.693 2.059 2.326 2.534 2.704 2.847 2.970 3.078 3.173 3.258 3.336 3.407 3.472 3.532 3.588 3.640 3.689 3.735 3.778 3.819 3.858 3.895 3.931 1.880 1.023 0.729 0.577 0.483 0.419 0.373 0.337 0.308 0.285 0.266 0.249 0.235 0.223 0.212 0.203 0.194 0.187 0.180 0.173 0.167 0.16 0.157 0.153 D1 0 0 0 0 0 0.076 0.136 0.184 0.223 0.256 0.284 0.308 0.329 0.348 0.364 0.379 0.392 0.404 0.414 0.425 0.434 0.443 0.452 0.459 D2 3.267 2.575 2.282 2.115 2.004 1.924 1.864 1.816 1.777 1.744 1.716 1.692 1.671 1.652 1.636 1.621 1.608 1.596 1.586 1.575 1.566 1.557 1.548 1.541

S-ar putea să vă placă și