Sunteți pe pagina 1din 77

MOIU PETRIC TUDOR

BIOSTATISTIC
NOTE DE CURS

ORADEA 2008

CUPRINS CAPITOLUL 1: INTRODUCERE1 CAPITOLUL 2: DISTRIBUII EXPERIMENTALE ........................ 3 2.1. TERMINOLOGIE STATISTIC ..............3 2.2.NREGISTRAREA I PRELUCRAREA PR IMAR A INFORMAIILOR.............. ................................................. 4 2.2.1.SEPARAREA DE POP ULAII OMOGENE... 4 2.2.2.NREGISTRAREA OBSERVAIILOR N TABELE ....4 2.2.3.FRECVENELE DISTR IBUIILOR EMP IRICE... 5 2.2.4. REPREZENTRI GRAFICE ALE DISTRIBUIILOR UNIDIMENS IONALE... 6 2.3. INDIC II DISTRIBUIILOR EXPERIMENTALE . 7 2.3.1.PARAMETR I POPULAIEI I INDIC II PROBEI............. ..............7 2.3.2.MOMENTE............................................................................... ..8 2.3.3.VALOR I MEDII...................................................................... ..10 2.3.4.INDIC II DISPERSIEI ( INDICATORII VARIABILIT II)............13 2.3.5.ASIMETR IA I EXCESUL DISTRIBUIILOR EXPERIMENTALE (INDICATORII FORMEI) 15 2.4.EROR I DE REPREZENTATIVITATE...................................... ........17 CAPITOLUL 3 : DISRTIBUII TEORETICE CU AP LICABILITATE N SILVICULTUR.............................................................................. .18 3.1. INTRODUCERE....................................................................... ...18 3.2. NOIUNEA DE PROBABILITATE....................................... ........19 3.3. DISTR IBUIA BINOMIAL 19 3.4. DISTR IBUIA POISSON............................................................ .22 3.5. DISTR IBUIA NORMAL.................................... ...................... 24 3.6. DISTRIBUIA CHAR LIER (TIP A) ......... 29 3.7. SISTEMUL DISTRIBUIILOR PEARSON..................... ...............32 3.8. DISTR IBU IA BETA .32 3.9. DISTR IBUIA MEYER .35 CAPITOLUL 4 : EXAMINAREA SEMNIFICAIEI .... 38 4.1. GENERALITI. 38 4.2. INTERVALUL DE NCREDERE AL MEDIEI AR ITMETICE 40 4.3. TESTE DE CONFORMITATE ..... 41 4.3.1.EXAMINAREA DIFERENEI DINTRE O MEDIE EXPER IMENTAL I O VALOARE D AT..... 41 4.3.2.EXAMINAREA SEMN IFICAIEI VAR IANEI I A DIFERENEI DINTRE VAR IA NE..... 43 4.4. TESTE DE EGALITATE................................... ........................... 44 4.5. TESTE DE AJUSTARE ......................... 54

4.6. CRITER II PENTRU ELIMI NAREA OBSERVAIILOR EXTREME ..55 CAPITOLUL 5 : ANALIZA VAR IANEI ...... 57 5.1. ASPECTE TEORETICE.................................... ........................... 57 5.2 ANAIZA S IMPL A VAR IANEI...................... ........................... 58 5.3. FOLOS IREA TESTULUI DUNCAN...................................... ........62 5.4. ANALIZA DUBL A VAR IANEI .................. 64 5.5.METODE NEPARAMETR ICE PENTRU COMPARAREA MAI MULTOR GRUPE............................................................ ..................65 CAPITOLUL 6 : ANALIZA CORELAIEI .... 66 6.1. ASPECTE TEORETICE................................... ............................ 66 6.2. METODE DE CONSTATARE A CORELAIILOR...................... ...67 6.3. COVAR IANA............ .................................... ........................... 68 6.4. COEFIC IENTUL DE CORELAIE.................... ........................... 69 BIBLIOGRAFIE .. 73

CAPITOLUL 1: INTRODUCERE
Biostatistica se ocup cu gruparea, analiza i interpretarea datelor referitoare la fenomenele de mas, precum i cu unele previziuni privind producerea lor viitoare. Biostatistica (biostatistica forestier) este o ramur a statisticii, denumit aa datorit faptului c se studiaz, interpreteaz i analizeaz date din domeniul biologic (forestier), domeniu cu anumite particulariti. n silvicultur, aproape toate procesele au un caracter probabilistic. ncepnd cu tabelele de producie i ncheind cu indicii preurilor p entru lemnul pe picior, modelele statistice sunt larg folosite. Modelele statistice sunt folosite pentru : Clasificarea sistemelor biologice , de la specie la ecosistem (analiza topologic) ; Estimarea indirect a unei caracteristici dificil de msurat : co ncentrnd eforturile de analiz pe un eantion de date complete, ce includ i variabila dependent dificil de msurat n condiii obinuite, se obine o funcie matematic ce permite, pe viitor, estimarea caracteristicii rezultative, pe baza caracteristic ilor explicative, mai uor de msurat ; Aproximarea probabilitii producerii unui fenomen (un atac de insecte, o dobortur de vnt, sau chiar adjudecarea unei partizi ntr- o licitaie) tiute fiind condiiile n care se produc, de regul, aceste fenomene ; Aproximarea preurilor posibile de adjudecare a unor partizi sau loturi de lemn, n funcie de caracteristicile acestora, particularitile pieei i condiiile de exploatare ; Estimarea impactului economic i/sau ecologic al unor schimbri sau tendin e manifestate la nivel macroeconomic ; Compararea a dou sau mai multe valori medii, referitoare la tot attea stri n care un sistem poate fi adus prin mijloace tehnice sau ca urmare a modificrii factorilor naturali de producie. (de exemplu starea la c are este adus un arboret prin aplicarea unor rrituri de intensitate diferit) ; etc Dup scopul cunoaterii, statistica, ca disciplin tiinific, are urmtoarele subdiviziuni: statistica descriptiv, statistica inferenial, statistica analitic. Stati stica descriptiv (formal), care are ca obiectiv culegerea datelor statistice i prelucrarea acestora cu ajutorul sistemului de indicatori statistici Statistica inferenial , aprut abia dup descoperirea legilor probabilistice i constituirea teoriei pr obabilitilor ca tiin, are ca obiectiv cunoaterea caracteristicilor unei colectiviti oarecare pornind de la cunoaterea unei colectiviti pariale i presupune msurarea incertitudinii rezultatelor i calcularea riscurilor pe care le implic luarea unei decizii fundamentate pe baza unei informaii ce nu poate fi

exhaustiv. Principalele probleme ale inferenei statistice sunt estimarea parametrilor distribuiei unei colectiviti i testarea ipotezelor statistice. Statistica analitic urmrete descoperirea a ceea ce este permanent, esenial, legic , n variaia proceselor stocastice i msurarea influenei factorilor care le determin variaia n timp, n spaiu,i din punct de vedere calitativ. n acest scop se folosesc, n principal, analiza de reg resie, analiza de corelaie i analiza dispersional .

Modelarea statistic a fenomenelor


Fazele mai importante ale unei investigaii i modelri statistice sunt : 1. Observaia 2. Formularea ipotezelor privind caracteristicile identificate n timpul observaiei 3. Predicia, adic formularea unor noi elemente de cunoatere referitoare la caracteristici 4. Verificarea prediciilor

Observaii statistice pot fi :


cantitative - se obin valori prin msurtori sau numrtori (diametre, nlimi, nr.de arbori/ha, nr.ou/cuib , etc.). calitative se refer la caracteristici nemsurabile (culoarea cojii, gradul de infestare, etc), sau la nregistrri de atribute alternative (mascul - femel, sntos -bolnav, etc). Recoltarea datelor se poate realiza prin simpla observare sau prin efectuarea de experiene.

Variabilitatea observaiilor
Valorile observaiilor fcute asupra anumitor caracteristici atributive prezint o anumit fluctuaie, denumit n statistic variaie . Variaia poate fi: continu , cnd caracteristica cercetat se ex prim n numere fracionare (diametrul unui arbore) discontinu ( discret), cnd caracteristica poate fi exprimat numai n numere ntregi (nr.arbori/ha, nr.ou/cuib), alternativ , cnd exist numai dou posibiliti de variaie (apt-inapt, mascul - femel) Dup natura cauzelor pe care o provoac, variaia poate fi sistematic (determinat de cauze cunoscute, controlabile) sau ntmpltoare, accidental (determinat de cauze necunoscute, necontrolabile).

Populaia statistic
O populaie (colectivitate) stati stic reprezint o totalitate de observaii efectuate asupra unor uniti relativ omogene, avnd un anumit numr de nsuiri eseniale comune.

n domeniul silviculturii de cele mai multe ori se efectueaz observaii numai asupra unui numr restrns de unit i ale populaiei, respectiv asupra unuor sondaje sau probe (colectivitate de selecie, eantion). Prin intermediul probelor se tinde spre cunoaterea statistic a ntregii populaii. Pentru aceasta proba trebuie s fie reprezentativ, s fie aleas dup principii obiective. CAPITOLUL 2: DISTRIBUII EXPERIM ENTALE 2.1. TERMINOLOGIE STATISTIC
Colectivitatea statistic reprezint o mulime format din uniti statistice calitativ omogene ce prezint una sau mai multe nsuiri comune. - colectivitatea general (populaie) este constituit dintr - un numr finit sau infinit de uniti statistice. Ea poate fi unidimensional , cnd n atenia observatorului se afl o singur caracteristic de studiat, sau multidimensional , cnd n atenia observatorului se afl dou sau mai multe caracteristici. - colectivitatea de selecie (eantion, sondaj) reprezint numai o parte dintr- o populaie, extras dup anumite criterii n vederea cercetrii uneia sau mai multor caracteristici.Un eantion este rep rezentativ dac unitile de eantionaj sunt alese randomizat i dac are un volum minim care s poat asigura precizia necesar. Unitatea statistic ( unitatea de nregistrare, de observare ) constituie cea mai mic entitate luat n considerare, n raport cu natura colectivitii i scopul observrii.Unitatea statistic poate fi simpl sau complex (format din mai multe uniti simple) . irul statistic este reprezentat de totalitatea valorilor observate, corespunztor unitilor ce alctuiesc unitatea sta tistic cercetat, scrise ntr- o anumit ordine. Seria statistic reprezint ansamblul a dou iruri de date corespondente. n primul ir sunt nscrise valorile caracteristicii de grupare, iar n cel de al doilea ir valorile caracteristicii cu care este c orelat sau frecvenele statistice.

2.2. NREGISTRAREA I PRELUCRAREA PRIMAR A INFORMAIILOR


2.2.1. Separarea de populaii omogene n cazul populaiilor eterogene, nainte de a trece la nregistrarea i prelucrarea observaiilor, se impune separarea de populaii omogene, constituite din uniti identice din punct de vedere calitativ ( stratificarea).
Ex em p le : - to tal it at ea o b s er va ii lo r e fec t ua t e a s up ra d i a met relo r l a ar b o r i d e ac eea s i sp e c ie, vr s t, p ro ve n ie n i cre s c u i n co nd i i i st a io nal e id e nt ice. - to ta li tat ea o b ser v a i ilo r e fec t ua te as up r a n l i mi i p u ie ilo r d e acee as i sp eci e, vr st i p ro ve n ie n , p l a nta i n co nd i ii sta io n ale id e nt ice .

Separarea de populaii omogene (stratificarea) este necesar pentru a putea interpreta ntreaga pop ulaie studiat, n raport cu tipurile ei calitative. 2.2.2. nregistrarea observaiilor n tabele Rezultatele observrii se inregistreaz, pe msura obinerii lor, ntr-un tabel denumit tabelul datelor iniiale (carnet de inventar, fie de observare). Exemple : carnetul de inventar la punerea n valoare a masei lemnoase pe picior (tabelul 2.1); carnetul de inventar al creterilor n diametru msurate (tabelul 2.2)
Tabelu l 2 . 1

Nr. curent
1 2 3

Specia
Fa Ca Fa

Diametrul
20 22 36

Clasa de calitate
I II IV

Tabelu l 2 . 2

Nr. crt 1 2 3

diametrul 27.3 18.2 15.7

Cresterea in diametru 9.1 7.3 5.2

Pentru a se putea prelucra statistic datele iniiale, este necesar gruparea valorilor n clase (despuierea) (tabelele 2.3, 2.4).

Tabelu l 2 . 3

specia : FAG
categorii de diametre 8 10 12 14 16 18 20 22 24
Tabelu l 2 . 4

clasa de calitate I Punctaj Nr arbori Punctaj II Nr arbori III Punctaj Nr arbori IV Punctaj Nr arbori TOTAL ARBORI

Intervalul de clas n mm 0.6 - 1,5 1.6 - 2,5 2,6 - 3.5 .

Centrul clasei Punctaj mm 1 III 2 IIII IIII IIII II 3 IIII IIII III

Frecvene absolute 3 17 13

n urma gruprii datelor iniiale s - a obinut un ir statistic .La un ir statistic distingem: limitele clasei, centrul clasei, intervalul de clas (mrimea clasei), amplitudinea variaiei. 2.2.3. Frecvenele distribuiilo r empirice Distribuia empiric este o punere fa n fa a intervalelor de clas ale variabilei(sau numai a centrelor claselor) cu numrul de observaii cuprinse n fiecare clas. Frecvena absolut = numrul de observaii corespunztoare fiecrei clase . Frecvena absolut cumulat = frecvenele absolute ale claselor, cumulate succesiv. Frecvena relativ = raportul dintre frecvena absolut i numrul total de observaii. Frecvena relativ cumulat =sumele succesive ale frecvenelor relative.

Tabelu l 2 . 5

categorii de diametre

frecventa absoluta

f recventa absoluta cumulata

frecventa relativa

f recventa relativa cumulata

8 10 12 14 16 18 20 22 24 TOTAL

3 5 6 10 12 9 8 4 2 59

3 8 14 24 36 45 53 57 59

0.051 0.085 0.102 0.169 0.203 0.153 0.136 0.068 0.034 1.000

0.051 0.136 0.237 0.407 0.61 0.763 0.898 0.966 1

numrul de arbori

2.2.4. Reprezentri grafice ale distribuiilor unidimensionale Scopul reprezentrii grafice este de a pune n eviden mai clar caracteristicile de baz ale unei distribuii experimentale, de a o feri o imagine mai sugestiv asupra modului de structurare al colectivitii. n cadrul reprezentrii grafice, valorile variabilei observate (X) se trec pe abscis, iar pe ordonat se trec frecvenele (absolute sau relative, simple sau cumulate). ntocmirea graficului presupune: alegerea hrtiei alegerea scrilor pentru axele de coordonate marcarea diviziunilor pe axele de coordonate nscrierea valorilor centrale n dreptul diviziunilor stabilirea legturilor ntre valorile de pe abscis i cele de pe ordon at trasarea curbei prin punctele reprezentetive ntocmirea legendei precizarea sursei de prelucrare a delor i titlul graficului. La calculator, graficele se ntocmesc mult mai rapid i uor, ntr -o mare varietare de tipuri, folosind programe speciale (ca de exemplu Excel). Tipuri de reprezentri: Diadrama bar a frecvenelor absolute Diagrama bar histograme 14 poligoane frecvene absolute 12 diagrame
10 8 6 4 2 0 8 10 12 14 16 18 20 22 24

categoria de diametre

Poligonul frecvenelor absolute


14 12
numrul de arbori

Histograma frecvenelor absolute


frecvene absolute 16 14 12 10 8 6 4 2 0 8 10 12 14 16 18 20 22 24

frecvene absolute

10 8 6 4 2
70

Poligonul frecvenelor cumulate

categoria de diametre

0
60

10

frecvene 12 14 16 cumulate

18

20

22

24

Diagrama de structur

numr de arbori

50

categorii de diametre
7% 3% 5% 8% 14% 10%

40

30

20

10

15% 17%
8 10 12 14 16 18 20 22 24

categorii de diametre

21%

8 10 12 14 16 18 20 22 24

2.3 INDICII DISTRIBUIILOR EXPERIMENTALE


2.3.1 Parametri populaiei i indicii probei Indici i distribuiilor experimentale se refer la poziia i structura di stribuiei (mediile, mediana, modulul) variabilitatea observaiilor (dispersia, abaterea standard, amplitudinea variaiei, coeficientul de variaie, etc.) forma distribuiei (indicele asimetriei, indicele excesului) Indicii distribuiilor experimentale (pr obei) sunt estimaii ale parametrilor populaiei (indicii distribuiilor care s - ar obine dac s -ar observa ntreaga populaie) Pentru a diferenia indicii distribuiilor experimentale de parametr i se folosesc notaii diferite, respectiv litere latine pentru indicii distribuiilor experimentale i litere greceti pentru parametri populaiilor. Simbolurile principalilor parametri i indici ai distribuiilor statistice:

10

Denumirea caracteristicii M edia aritmetic V ariana ( disp ersia) Abaterea standard Coef icientul de variaie Covariana I ndicile asimetriei I ndicele excesului Coef icientul de corelaie Coef icientul de regresie

Simboluri pentru populaii

Simboluri pentru probe

xy

x 2 s s s% s xy A E r b

2.3.2. Momente Momentele uureaz calculul indicilor, mai ales pentru seriile statistice formate dintr - un mare numr de observaii. Momentele reprezint medii aritmetice ale abaterilor de la un anumit punct ales ca origine, ridicate la diferite puter i. Dac se alege ca origine media aritmetic, se obin momente centrate .Dac originea se alege arbitrar, rezult momente obinuite. Momentele obinuite se calculeaz cu formula( intervalul de clas =1): k xi x0 mk N iar cele centrate dup expresia: k xi x mk N unde : m k reprezint momentul obi nuit de ordin k m k momentul centrat de ordin K x i valorile observate x - media aritmetic a distribuiei x 0 valoarea aleas arbitrar N - numrul total al observaiilor Pentru valori grupate n clase ( h = intervalul de clas), avem:

mk '

xi xo h N

mk

xi x h N

Relaiile dintre m i m sunt urmtoarele: m o = m o = 1

11

m 1 =0 m 2 =m 2 -m 1 m 3 =m 3 -3m 2 m 1 +2m 1 3 m 4 =m 4 -4m 3 m 1 +6m 2 m 1 2 -3m 1 4 iar pentru verificare se folosesc formulele : m 3 =m 3 -3m 1 m 2 -m 1 3 m 4 =m 4 -4m 3 m 1 +6m 2 m 1 2 -3m 1 4 Calculul momentelor prin procedeul sumelor. Este un procedeu indirect, mai simplu in cazul calculului fcut fr calculatoare. Este bazat pe urmtoarele formule: S 1 2S 2 d1 m 2' m1' ; ; N N d 1 6d 2 6d 3 m 3' ; N S 1 14S 2 36S 3 24S 4 m 4' N Exemplu: vezi tabelul 2.6
4 0.0678 59 94 2 * 71 236 m 2' 4.00 59 59 4 6 * ( 7) 6 * ( 5) m3' N m1'
Tabelu l 2 . 6
categorii de diametre 8 10 12 14 16 18 20 22 24 TOTAL d
i

Frecvena absolut 3 5 6 10 12 9 8 4 2 59

= ai bi =

Si = ai + bi =

b1 49 3 8 14 24 23 14 6 2 45 a1 -4 d1 94 S1

b2 39 3 11 25 22 8 2 32 a2 -7 d2 71 S2

b3 17 3 14 -45 10 2 12 a3 -5 d3 29 S3

4 42 30 59

76 59

1.2881

Cu formula:
8 16 3 2

mk '
1

xi xo h N
1

k
calculul este mai laborios:
1 1

12 16 14 16 6 10 ...... 2 2 m1' 59 3 * 4 5 * 3 6 * 2 10 *1 12 * 0 9 *1 8 * 2 4 * 3 2 * 4 59 12 15 12 10 9 16 12 8 4 0.0678 59 59

10 16 5 2

12

12 16 14 16 6 10 ...... 2 2 m2 59 3 *16 5 * 9 6 * 4 10 *1 12 * 0 9 *1 8 * 4 4 * 9 2 *16 59 48 45 24 10 9 32 36 32 236 4.00 59 59 2.3.3. Valori medii Medii de poziie: Media aritmetic Pentru iruri statistice formate dintr - un numr redus de valori, media aritmetic ( x ) se calculeaz cu formula: x x1 x 2 x 3 ... x n x N N Pentru iruri statistice cu numr mare de valori, acestea se grupeaz mai nti n clase iar pentru media aritmetic se folosete procedeul multiplicrii: xi ni x1 n1 x 2 n 2 x 3 n3 ... x k n k x N N unde: x i reprezint diferitele valori ale centrelor de clas iar n i frecvenele absolute corespunztoare. Media aritmetic se poate calcu la mai simplu prin procedeul sumelor, bazat pe formula: x x 0 am1

8 16 3 2

10 16 5 2

unde: m1 este momentul obinuit de ordin 1, calculat n raport cu valoarea arbitrar x 0 , iar a este mrimea intervalului de clas. O alt modalitate, la fel de simpl, se bazeaz pe suma total a frecvenelor cumulate. Se aplic formula: D x x1 a 1 N unde x 1 reprez int centrul clasei cu cea mai mare valoare iar D suma frecvenelor cumulate, de la clasele mici la cele mari.

13

Tabelu l 2 . 7
categorii de diametre Frecvena absolut

Exemplu: x i ni x N

936 59

15.86

d ini 24 50 72 140 192 162 160 88 48 936

ni 3 8 14 24 36 45 53 57 59 299

xi 8 10 12 14 16 18 20 22 24 TOTAL

ni 3 5 6 10 12 9 8 4 2 59

x
x

x0

am1

16 2( 0.0678) 16 0.1356 15.86


24 2 299 1 59 24 8.14 15.86

x1 a

D 1 N

Media aritmetic ponderat Dac, pentru probe ale aceleeai populaii, se dispune de mai multe medii aritmetice, se poate calcula o singur medie general, utili znd formula mediei ponderate: x1 n1 x 2 n 2 ... x k n k x n1 n 2 ...n k

Media general x se calculeaz numai dup ce se demonstrea z prin teste statistice corespunztoare (analiza varianei), c mediile x1 , x 2, ...x k reprezint estimaii ale aceleeai medii generale .

Media armonic se determi n cu relaia: N xh pentru valori negrupate n clase, respectiv cu relaia : N 1 k 1 xk N xh pentru valori grupate n clase p nk k 1 xk unde N este numrul total al observaiilor; n k frecvena clasei k ; x k centrul clasei k , iar p numrul claselor formate Media geometric este rdcina de ordin n a produsului celor n valori observate i se utilizeaz n cazul valorilor situate n progresie geometric.
n

xg

N k 1

x k pentru valori negrupate


n nk xk pentru valori grupate , unde n k sunt frecven ele k 1

xg

absolute Media geometric este ntotdeauna mai mic sau cel mult egal cu media aritmetic.

14

Media ptratic se calculeaz cu relaiile:


xp
xp
2 xk

N
N

, n cazul valorilor negrupate , n cazul valorilor grupate

2 nk xk

Medii de structur: Mediana, cuantilele Mediana este valoarea x a irului statistic care, atunci cnd toate valorile irului sunt aranjate n ordine c resctoare, mparte acest ir n dou grupe egale ca numr. Quartilul poate fi: inferior i superior . Primul, Q 1 , corespunde valorii care separ primii 25% din termeni; al doilea, Q 3 , reprezint valoarea care separ ultimii 25% din termeni. Mediana i qu artilele rerprezint cazuri particulare ale quantilelor . Quantilele se pot defini ca fiind variabila creia i corespunde o frecven relativ cumulat dat. Astfel, mediana este valoarea cvreia i corespunde o frecven relativ cumulat egal cu 0,5. Q uantilele se pot uor detrermina pe cale grafic. n acest sens se folosete ogiva lui Galton .ntr-un sistem de coordonate rectangulare se trec valorile x pe abscis i frecvenele cumulate pe ordonat.Astfel, de exemplu, mediana este abscisa punctului car e rezult din intersecia ogivei cu o paralel dus la abscis prin punctul N/2 al frecvenelor absolute cumulate (sau punctul 0,5 al frecvenei relative cumulate). Analitic, mediana se calculeaz cu formula:

Me
unde:

x Me

N a 2

n n Me

x M e este limi ta inferioar a clasei n care se afl mediana a = amplitudinea clasei n = suma frecvenelor cumulate pn n dreptul clasei n care se afl mediana. Mediana este des utilizat n practic deoarece depinde mai puin dect media aritme tic de forma distribuiei sau de valorile extreme ale irului statistic. Exemplu de calcul (cu datele din tabelul 2.7) :

59 24 29.5 24 2 Me 15 2 15 2 15 12 12

5.5 15.92 6

15

Modulul Modulul este valoarea variabilei creia i corespunde cea mai mare frecven , adic valoarea variabil ei cea mai probabil. Distribuiile pot fi unimodale (cu un singur vrf) sau plurimodale (cu mai multe vrfuri). Modulul distribuiilor discrete se determin citind varianta cu cea mai mare frecven. n cazul unei distribuii continui, modulul este abscis a corespunztoare vrfului curbei de frecven i se calculeaz cu formula : n 0 n1 Mo x Mo a 2n 0 n1 n 2 unde: x M o este limita inferioar a clasei modale a este amplitudinea clasei n o este frecven a clasei modale n 1 , n 2 , sunt frecvenele clasei inferioa re i superioare celei modale. Exemplu de calcul (cu datele din tabelul 12 10 4 15 15.8 2.7): Mo 15 2 24 10 9 5 2.3.4. Indicii dispersiei (indicatorii variabilitii) Valorile medii indicnd doar centrul de grupare al valorilor observate, nu pot da o imagine cuprinztoare asupra unei distribuii. Valorile medii nu spun nimic despre gradul de variabilitate, despre amplitudinea de mprtiere a valorilor observate. Indicii dispersiei completeaz caracterizarea distribuiei din aceste puncte de vedere. Cei mai uzuali sunt: am plitudinea de variaie, variana (dispersia) i abaterea standard. Amplitudinea de variaie (W) reprezint diferena dintre valoarea observat maxim i cea minim adin cadrul unui ir statistic. Este un indice puin stabil, depinznd n mare msur de num rul observaiilor efectuate i de aceea este mai puin folosit.

x max

x min

Variana (dispersia) se calculeaz ca o medie aritmetic a ptratelor abaterilor valorilor individuale ale irului statistic de la media aritmetic a irului respecti v. Variana este aproximativ egal cu momentul centrat de ordinul doi (dac N este suficient de mare). Variana are o valoare concludent dac irul statistic studiat este relativ simetric. Calculul varianei:

Procedeul

Pt. valori negrupate n clase (n <30)

Pt. valori grupate n clase (n > 30)

16

Direct
s
2

xi

N 1
x
2 i

s
xi
2

n xi

ni 1
x ni
2 i

Multiplicrii
s
2

x i ni ni ni 1

N N 1

s2

Momentelor

s2

m2

s2

a 2 m2
' m2

m2
n xi x
2

m1'

ni xi2

2x

x i ni

x2
2

ni

dar:
2 2

x i ni ni

n xi

ni x

2 i

xi ni ni

xi ni ni

ni

ni x

2 i

xi ni ni

Valoarea dispersiei este tot timpul mai mare sau egal cu zero. Cazul s 2 =0 poate fi ntnit numai dac toate valorile individuale coincid cu media aritmetic. Suma ptratelor abaterilor se mparte la N-1 , i nu la N , pentru c prin calcularea mediei (folosit la stabilirea abaterilor) o observaie este deja blocat, rmnnd libere doar N-1 observaii. Acest termen (numitorul formulelor) poart denumirea de grade de libertate. Numrtorul formulelor poart denumirea de suma ptratelor abaterilor i se noteaz cu Q. Abaterea standard (abaterea medie ptratic) se calculeaz ca radical de ordin doi din varian. Ea caracterizeaz modul cum s e mprtie valorile observate n jurul valori i medii.

s2
s 100 x

Abaterea standard exprimat n procente fa de media aritmetic poart numele de coeficient de variaie (s% ) i se calculeaz cu relaia:

s%

Coeficientul de variaie este singurul indicator care ofer posibilitatea comparrii omogenitii (variabilitii) a dou sau mai multe variabile exprimate n uniti de msur diferite. Cu ct valoarea lui s% este mai mic cu att colectivitatea este mai omogen Coeficientul de variaie se compar cu coeficientu l de variaie limit. dac s% 0,3 (coeficientul limit ) colectivitate omogen dac s% > 0,3 (coeficientul limit ) colectivitate neomogen

17

Exemplu de calcul : 2 n xi x 3(8 15.86) 2 2 s ni 1

5(10 15.86) 2

6(12 15.86) 2 59 1

... 2(24 15.86) 2

3 * ( 7.86) 2

5 * ( 5.86) 2 58
x i ni ni ni 1
2

... 2 * 8.14 2

3 * 61.78 5 * 34.34 ... 2 * 66.26 58

... 16.25

x ni s2
Tabelu l 2 . 8
categorii de diametre Frecvena absolut

2 i

936 2 15792 59 59 1

15792 14849 58
' m2

943 16.25 58

m2
x ini 24 50 72 140 192 162 160 88 48 936 x
2 i

m1'

4 0.0678 2

3.9954

xi 8 10 12 14 16 18 20 22 24 TOTAL

i excesul distribuiilor experimentale ( indicatorii formei ) ASIMETRIA reprezint deplasarea pe orizontal a vrfului curbei experimentale fa de curba normal. Asimetria curbelor de frecven poate fi cauzat de numrul prea mic de observaii sau de alegerea necorespunztoare a claselor de frecven (asimetrie aparent). Aceast asimetrie dispare prin majorarea numrului deobservaii sau prin redimensionarea claselor de frecven. Asimetria real reprezint ns o particularitate obictiv a curbei de frecven i este determinat cel mai adesea de influena puternic a unui anumit factor. O msur a asimetriei este dat de relaia lui Pearson :

ni 3 5 6 10 12 9 8 4 2 59

nix

2 i

s2

a 2 m2

2 2 * 3.9954 15.98

64 100 144 196 256 324 400 484 576 2544

192 500 864 1960 3072 2916 3200 1936 1152 15792

2.3.5. Asimetria

x Mo s

Cnd media este egal cu modulul Mo , distribuia este simetric. Cnd x Mo asimetria este de st nga (pozitiv) Cnd x Mo asimetria este de dreapta (negativ) Exemple : n arboretele echiene sa constatat c, n general, curba de frecven a arborilor pe categorii de diametre prezint o asimetrie de

18

stnga n timp ce curba de frecven a arborilor pe categorii de nlimi prezint o asimetrie de dreapta Un calcul riguros a l asimetriei se face cu relaiile:
N

xi A
i 1

Ns 3
k

,pentru valori negrupate n clase, i


x ni
3

ni xi A
i 1 k

pentru valori grupate n clase,

3 i 1

sau utiliznd momentele centrate de ordin doi i trei :

m3 m2
3

Pentru A<0 , asimetr ia este negativ, iar pentru A>0 asimetria este pozitiv. Pentru ca indicele asimetriei s fie semnificativ, la o probabilitate de acoperire de 95%, trebuie ca valoarea lui s depeasc dublul erorii de reprezentativitate , calculat dup formula:

SA

6 N 3
A / sA > 2

Deci, indicele asimetriei este semnificativ, dac:

EXCESUL sau boltirea (E) este acea proprietate a curbei modale de a fi mai mai turtit sau mai ascuit dect curba normal corespunztoare. Excesul se calcu leaz cu formula:
N

xi E
i 1

Ns 4
k

3 pentru valori negrupate n clase, i

ni xi E
i 1 k

x ni

pentru valori grupate n clase,

4 i 1

sau utiliznd momentele centrate:


3 2 m2 Indicele este semnificativ, la o probabilitate de 95%, dac : E/ s E > 2 , unde: 24 SE N 5 E m4

19

Dac E > 0 curba este ascuit (leptocurtik), iar dac E < 0 curba este turtit (platikurtic). Pentru distribuiile normale E = 0 .

2.4.ERORI DE REPREZENTATIVITATE
Erorile de reprezentativitate exprim gradu l de deprtare dintre indicatorii eantionului i parametri populaiei. Cu ct volumul probei este mai mare cu att erorile sunt mai mici.
Eroarea standard a mediei aritmetice

Mediile unor eantioane de prob ale unor populaii se distribuie ntotdeauna n jurul mediei populaiei din care probele au fost extrase dup o curb normal, chiar dac distribuia variabilei x a eantioanelor n jurul mediei populaiei se face dup o curb asimetric. Variaia mediilor eantioanelor n jurul valorii medii a popula iei se numete eroare standard a mediei aritmetice , i se exprim cu relaia :
x

unde :

- abaterea standard n - volumul eantioanelor considerate Cnd observaiile se efectueaz la nivelul unei singure probe, eroarea stan dard a probei se noteaz cu s x i se determin cu relaia:

sx

s n

,
n N 0,1 i cu relaia:

pentru populaii infinite sau suficient de mari

sx

s n

N N

pentru populaii finite sau cu num r redus de uniti, unde se ia n N n considerare factorul de corecie . N Intervalul de ncredere se exprim n funcie de eroarea standard : x ts x unde t este criteriul statistic bilateral Student pentru un nivel de semnificaie adoptat n funcie de n-1 grade de libertate, n fiind numrul unitilor din eantion
Eroare admis

x e ts x reprezint eroarea admis sau acceptat i Expresia poate fi exprimat i procentual:

20

e%

ts x %

ts % n

pentru populaii infinite sau suficient de mari

respectiv

e%

ts x %

ts % n

N N

pentru populaii finite.

Determinarea mrimii eantionului Pe baza ultimelor relaii se poate determina numrul de observaii sau mrimea eantionului (n ), n condiile unei anumite erori i probabiliti admise ( e% i t ), valorile coeficienilor de variaie stabindu se pe baza unui sondaj prealabil sau a datelor existente n literatura de specialitate:

n
respectiv

t 2s2 % pentru pop ulaii infinite e2 % Nt 2 s 2 % pentru populaii finite. Ne 2 % t 2 s 2 %

CAPITOLUL 3 : DISRTIBUII TEORETICE CU APLICABILITATE N SILVICULTUR 3.1. INTRODUCERE


Distribuiile experimentale reprezint estimaii ale unor distribuii teoret ice, definite de teoria probabilitilor. Operaia de asimilare a unei distribuii experimentale cu o distribuie teoretic poart denumirea de ajustare . Ajustarea se poate face grafic ( mecanic) sau analitic (pe baza unei ecuaii). Ajustarea poate fi defi nit, deci, ca tehnica nlocuirii unui set de valori observate cu o ecuaie (ajustare analitic) sau cu o curb continu i neted (ajustare grafic), n stare s prezinte o imagine ct mai apropiat de realitatea fenomenului studiat. Pentru silvicultur p rezint importan urmtoarele distribuii : distribuia binomial, distribuia evenimentelor rare (Poisson), distribuia normal i distribuia Charlier(tip A), distribuia Pearson, distribuia Beta, distribuia Rollet, distribuia Weibull. Pentru examina rea semnificaiei i verificarea ipotezelor statistice, o larg aplicabilitate au distribuiile : Student (distribuia t), Fisher (distribuia F) i Pearson (distribuia Pentru orice distribuie teoretic trebuie s se cunoasc funcia de frecven sau probabilitatea teoretic , funcia de distribuie sau probabilitatea total precum i parametri distribuiei respective. Funcia de frecven este o relaie matematic care exprim, pentru o distribuie teoretic, frecvenele relative sau probabilitile ce corespund diferitelor valori ale variabilei aleatoare.

21

Funcia de distribuie exprim frecvenele cumulate sau probabilitile totale, funcie de diferite valori ale variabilei aleatoare. Toate distribuiile enumerate sunt bazate pe teoria probabilit ilor i de accea, nainte de a le prezenta, se impune s ne oprim asupra noiunii de probabilitate.

3.2. NOIUNEA DE PROBABILITATE


Numim eveniment orice rezultat al unui experiment. Evenimentele pot fi sigure, imposibile sau ntmpltoare. Probabilitate a (p) unui eveniment este raportul dintre numrul de cazuri favorabile producerii lui (n) i numrul total de cazuri posibile (N ).

n N

dac n=N atunci p=1 eveniment sigur dac n=0 atunci p=0 eveniment imposibil dac 0<n<N atunci O<p<1 eveniment ntmpltor Dac notm cu q probabilitatea evenimentului contrar, atunci N n p+q=1 i q N Noiunea de probabilitate este strns legat de noiunea de frecven relativ. Frecvenele relative reprezint valori experimentale, statistice sau estimaii ale probabilitii.

3.3. DISTRIBUIA BINOMIAL


Se numesc expriene binomiale toate experienele ntmpltoare care ne conduc la realizarea a dou evenimente complementare. Se numete ir binomial un ir de n experiene binomiale care satisfac urmtoarele condiii: numrul de experiene (n) care formeaz irul s fie determinat anticipat; toate experienele sunt riguros identice i sunt efectuate n aceleeai condiii; exist probabilitatea de a obine succe s n oricare din experimente. Presupunem c avem o populaie format din N uniti din care M=pN uniti posed caracteristica E , iar restul N-M uniti nu posed aceast caracteristic. Atunci , pN+qN=(p+q)N=N , deci p+q=1 Din aceast populaie se extrage o prob lund pe rnd n uniti independente, cu condiia ca dup fiecare extragere unitatea s fie reintrodus n populaie, astfel nct numrul de uniti naintea fiecrei

22

extrageri s fie acelai. n aceste condiii, probabilitatea ca din numrul total de n exemplare ale probei, x uniti s posede caracteristica E este dat de funcia de frecven a distribuiei binomiale, respectiv de expresia:

f ( x)
sau

n! p xqn x! (n x)!
x Cn pxqn x

f ( x)

Pentru aplicaii practice se recomand formula de rec uren :

f ( x 1) f ( x)

(x

n! p x 1q n 1)! (n x 1)! n! pxqn x x! (n x)!

x 1

x! (n x! ( x

x)(n 1)(n

x 1)! p x 1)! q

n x

x p 1 q

f (x

1)

f ( x)

n x

x p 1 q

Cu formula de baz se calculeaz F(0) pentru x=0 , iar cu formula de recuren se calculeaz probabilitatea (frecvena) pentru celelalte valori ale lui x . Funcia de distribuie F(x) a distribuiei binomiale este dat de relaia :
n

F ( x)
x o

n! pxqn x! (n x)!

Parametri distribuiei se calculeaz astfel : np media aritmetic : dispersia : 2 npq np(1 p) Pentru n=p distribuia este simetric. Cu ct diferena dintre p i q este mai mare cu att se accentueaz asimetria. Pentru distribuiile experimentale parametri (indicii) se calculeaz dup formulele cunoscute. Variabila este discontinu . n silvicultur aplicarea distribuiei binomiale prezint importan n domeniul vari aiei alternative (prezena sau absena unui unei nsuiri, apariia unui sex sau altul, prezena sau absena arborilor cu un anumit defect, etc). Exemple:
1. ntr- un arboret de fag de productivitate superioar, s - au fcut 70 de sondaje pentru identificarea a rborilor api pentru derulaj. n fiecare punct de sondaj s - au luat cei mai apropiai 10 arbori de centrul sondajului. Dat ele culese din teren mpreun cu calculele aferente ajustrii sunt prezentate n tabelul 3.1.

23

Tabelu l 3 . 1

Nr. arbori apti de derulaj x 0 1 2 3 4 5 6 7 8 9 10 Total

Frecvene experimentale n 14 22 10 7 4 2 1 0 0 0 0 60

n*x 0 22 20 21 16 10 6 0 0 0 0 95

n*x 2 0 22 40 63 64 50 36 0 0 0 0 275

Frecvene teoretice relative absolute 0.179 11 0.336 20 0.284 17 0.142 8 0.047 3 0.011 1 0.001 0 0 0 0 0.0 0 0.0 0 0.0 1 60

xi ni N

95 1.58 60

p
2

x n

1.58 10

0.158 sau p=15.8% i q=84.2%

x ni s2 s
f (0)

2 i

x i ni ni ni 1

275

95 2 60 60 1

275 150.42 59

124.58 59

2.11

s2

1.45 n! p xqn 0!(n 0)!

10! 0.158 0 0.84210 10!

0.84210

0.179

f (1)

f (0

1)

f (0)

n 0 p 0 1 q n 1p 1 1 q

0.179

10 * 0.158 1* 0.842

0.179 *1.876 1.422 1.684

0.336

f ( 2)

f (1

1)

f (1)

0.336

9 * 0.158 2 * 0.842

0.336

0.284

f ( 3)

f (2

1)

f ( 2)

n 2 p 2 1 q
n 3 p 3 1 q

0.284

8 * 0.158 3 * 0.842
7 * 0.158 4 * 0.842

0.284

1.264 2.526
1.106 3.368

0.142

f ( 4)

f (3

1)

f ( 3)

0.142

0.142

0.047

f (5)

f (4

1)

f ( 3)

n 4 p 4 1 q

0.142

6 * 0.158 5 * 0.842

0.047

0.948 4.210

0.011

24

f (6)

f (5

1)

f ( 3)

n 5 p 5 1 q

0.011

5 * 0.158 6 * 0.842

0.011

0.79 5.052

0.001

Compar nd frecven ele experimentale cu cele teoretice se observ o diferen semnificativ, deci i ali factori, n afara ntmplrii, au o onfluen puternic. O test are cu un criteriu tiinifiic (hi ptrat) ar fi n ecesar pentru a putea t rage concluzii bine fundamentate. 2. ntr- o plant aie de rinoase, 20% din puiei sunt atacai de insecte. Cu ajutorul distribuiei binomiale, s se stabileasc probalilit atea ca dint r - o pia de prob de 5 puiei un numr de 0,1,2, 3,4 sau 5 puiei s fie at acai.

f (0)

n! p xqn 0!(n 0)!

5! 0.2 0 0.8 5 5!

0.8 5

0.328

f (1) f ( 2)

f (0 f (1

1)

f (0)

1)

f ( 3)
f ( 4) f ( 5)

f (2
f (3 f (4

1)

1)

1)

n 0 n f (1) 1 n f ( 2) 2 n f ( 3) 3 n f ( 3) 4

0 p 5 * 0.2 0.328 0.328 *1.25 0.410 1 q 1* 0.8 1p 4 * 0.2 0.8 0.410 0.410 0.205 1 q 2 * 0.8 1.6 2 p 3 * 0.2 0.6 0.205 0.205 0.051 1 q 3 * 0.8 2.4 3 p 2 * 0.2 0.4 0.051 0.051 0.006 1 q 4 * 0.8 3.2 4 p 1* 0.2 0.2 0.006 0.006 0.000 1 q 5 * 0.8 4.0

3.4. DISTRIBUIA POISSON


Distribuia Poisson reprezint un caz particular al distribuiei binomiale. Se ntlnete atunci cnd probabilitatea evenimentului este foarte mic (de unde i denumirea de distribuia evenimentelor rare ), chiar i atunci cnd numrul observaiilor este mare. n domeniul forestier se ntlnete la: ano malii la speciile de vnat, apariia de arbori cu caliti deosebite (lemn de rezonan, arbori plus), apariia insectelor duntoare, etc. 0 i q 1 chiar dac Deci, acest tip de distribuie apare cnd p n , cu condiia ca produsul np s reprezinte o valoare finit. Funcia de frecven este :
x

f ( x)
unde: e =2,71828

e x!

25

- este singurul parametru al distribuiei, egal cu media aritmetic i n acelai timp cu dispersia
2

x = numrul de uniti statistice extrase din eantion ce prezint caracteristica cercetat. Distribuia este de tip discret, asimetric, apropiindu -se de cea binomial pe msur ce crete valoarea lui . Pentru x=0 avem f ( 0 ) =e - iar pentru x=1 ,2,3, se folosete relaia de recuren:

f (x
x 1

1)

f ( x)
x

x 1
f ( x) x 1

f (x

1)

e ( x 1)!

e ( x 1) x!

Ajustarea distribuiilor experimentale dup legea Poisson se face doar n cazul n care media aritmetic a distribuiei experimentale este foarte apropiat de dispersi a distribuiei i cnd observaiile s -au fcut pe uniti statistice discrete . Exemplu:
2000 de arbori dint r - un arboret au fost analizai din punct de vedere al prezen ei gelivurilor. n tabelul de mai jos sunt prezentat e rezultat ele observa iilor :
Numar de gelivuri pe arbore x i 0 1 2 3 4 5 T otal Numrul de arbori observai ni xini 0 605 310 75 16 5 1011 x i ni relative 0 605 620 225 64 25 1539 0.607 0.303 0.076 0.012 0.002 0.000 1.000 absolute
2

frecvene teoretice Poisson

1210 605 155 25 4 1


2000

1214 606 152 24 4 0


2000

x i ni N

1011 2000

0.506 0.5

x ni s2 s s2 ni 0.717

2 i

x i ni ni 1

1539

10112 2000 2000 1

1539 511 1028 1999 1999

0.514

Media aritmetic (0,506) este foarte apropiat de dispersia distribuiei (0,514) ceeea ce arat c n acest caz este aplicabil distribuia Poisson.

26

Cu

formula f ( x )
0.5

e x!

cal culm :

f (0)

0.5 0 e 0!

0.5

1 e

1 2.71828

0.607

Cu relaia de recuren

f (x

1)

f ( x)

x 1

, calculm:

f (1)

f ( 2)

f (1 1)
f ( 3)

f ( 4)

f (3 1) f (5)

0 1 0.5 f (1) 0.303 0.076 1 1 2 0.5 f ( 2 1) f ( 2) 0.076 0.012 2 1 3 0.5 f ( 3) 0.012 0.002 3 1 4 0.5 f ( 4 1) f ( 4) 0.002 0.000 4 1 5

f (0

1)

f (0)

0.607

0.5 0.303 1

3.5 DISTRIBUIA NORMAL


Distribuia normal este foarte rspndit n natur. Apare ori de cte ori o caracteristic este supus unui numr mare de influene ntmpltoare, de slab intensitate i totodat independente unele de altele. Este frecvent ntlnit la distribuia mediilor de selecie.Variabila este continu. Funcia de frecven este:
.

f ( x)

1 2

(x

)2
2

unde i repre zint abaterea standard i media populaiei respective. Aceti doi parametri nu se cunosc de obicei dar pot fi estimai prin extrageri de probe.n acest caz se nlocuiete prin s iar prin x . Funcia de frecven devine:
.

f ( x)

1 e s 2

( x x )2 2s2

27

Pentru simplificare i pentru a se putea compara distribuiile de la diferite populaii, se introduce variabila ajuttoare u , denumit variabil normat : x x u Figu ra 3. 1 Curba de frecvene (sus) i s curba de distribuie (jos) a distribuiei Funcia de frecven a normale normate distribuiei normale normate va fi:
.

f (u )

1 2

u2 2

n aceste condiii, media este egal cu 0 iar abaterea standard este egal cu unitatea (figura 1). Distribu ia normal este perfect simet ric , are un maximum i dou puncte de inflexiune corespunztoare absciselor - i + . Cu ct abaterea standard este mai mic cu att curba de frecven este mai turtit i invers. Curba este asimptotic la axa absciselor , ceea ce arat c i valorile mari sunt posibile, dar probabilitatea lor este redus. Funcia de distribuie , corespunztoare frecvenelor cumulate, este dat de integrala:

F ( x)
sau, n abateri normate:
u u2 2

1 2

(x

)2
2

dx

F (u )

1 2

du

Dac integrarea se face n limitele i + funcia F(u)=1 . Integrarea n limitele 0 i u definete funcia lui Laplace :

(u )

1 2

e
0

u2 2

du

Aceast expresie reprezint suprafaa de sub curba normal de la valoarea medie pn la u (figura 2a) Pentru u
F (u )

(u )

1 , deci 2 (u)=1. 2

cumulat

1 (u ) reprezint 2 (probabilitatea total)

frecvena i este Figura 2 : Suprafeele de sub curba normal, n diferite variante de integrare

28

suprafaa de sub curba normal cuprins ntre i valoarea u dat (figura 2d). Frecvent se utilizeaz dublul funciei Laplace:
u

2 (u )
u

f (u )du

care arat suprafaa de sub curb cuprins ntre limitele u, indicnd suma frecvenelor cuprinse n intervalul u (figura 2b). Aceast sum este denumit probabilitatea de acoperire . Probabilitatea de transgresiune (sau probabilitate de depire , nivel de semnificaie ) est e probabilitatea ca valorile variabilei s fie n afara intervalului u, deci funcia 1 -2 (u) (figura 2c). Valorile funciilor enumerate sunt calculate i prezentate n tabele pentru diferite valori ale lui u. Exprimnd n procente frecvenele se poate co nstata c:
n intervalul n afara intervalului

se gsesc urmtoarele % din numrul total al observaiilor : 68.27 95.45 99.73 31.73 4.55 0.27

O serie de distribuii asimetrice se aduc la forma normal prin 1 x ; x transformarea variabilei x. Exemple : x ; x lg(x a) ; x 1 x a . De fiecare dat se calculea z media x i abaterea x ; x x a standard s pentru variabilele transformate. Apoi se efectueaz calculele cu noile variabile.
Exem plu: Pentru seminele de br ad s -a stabilit, ca medie a populaiei, valoar ea de 55,4 grame(la 1000 semine), abaterea standard fiind de 7,85 gr ame. Se pun dou ntrebri: a) Cu ce probabilitate se poate afir ma c greutatea seminelor va depi o li mit inferioar de 35 grame ? b) Care este probabilitatea ca greut atea seminelor s se ncadreze n intervalul 40 -75 grame ? Rezolvare: a) Stabilim posibilitatea P=0,5 - ( u ) , corespunztoare prii din stnga a curbei, n funcie de valoarea: u

35.0 55.4 7.85

2.6 .

Din tabele, pentru u=2,6 P=0,5 - ( u ) =0,004661. Deci, n 0,46% din cazuri seminele vor avea greutatea sub 35grame. b) Stabilim probabilitatea P= ( u ) pentru dou valori ale lui u:

u1 u2

40.0 55.4 7.85 75.0 55.4 7.85

2.0 2.5

( u 1 ) =0,47725

sau 47,7% sau 49,4%

( u 2 ) =0,49379

Prin ur mare, frecvena valorilor cuprinse ntre li mitele date este de:

29

(u1)+ ( u 2 ) = 97,1%. n afara acestor li mite, se vor gsi 100 -97,1=2,9% din cazuri, din care: 0,5- ( 2 , 0 ) =2,3% sub limita da 40g i 0,5 - ( 2 , 5 ) =0,6% peste li mita de 75g.

Etapele ajustrii distribuiei experi mentale dup legea normal : Reprezentarea grafic a datelor experimentale. Dac rezult un profil clopot, atunci se poate emite ipoteza c distribuia experimental urmeaz legea distribuiei normale, ipotez ce se verific n final printr -un test de ajust are ( 2 ). Redactarea tabelului de ajustare (tabelul 3.2) Calculul valorii medii x m e d , al varianei s 2 ia al abaterii 2 x i ni 2 xi ni ni x i ni 2 standard s cu relaiile: x ; s ; N ni 1
s s2
xi s x

Calculul abaterilor normate u i : u i Caculul frecvenelor


.

teoretice

f(u i )

cu

funcia:

f (u i )

1 2

ui2 2

, funcie tabelat n unele cri de

statistic pentru valori ale lui u din 0,01 n 0,01. cu relaia: n Caculul frecvenelor teoretice absolute Nh i n f (u i ) , unde h este amplitudinea clasei, s abaterea s standard iar N numrul total de observaii Verificarea calitii ajustrii cu un criteriu riguros ( 2 ).

30

Tabelu l 3 . 2

Ajustarea distribuiei experimentale dup legea normal

xi
14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 total x med s2 s

frecvene experimentale n i

x ini
56 256 360 680 1100 1248 1534 1540 1200 960 680 576 342 160 84 10776 26.219 31.90 5.65

x i ni
784 4096 6480 13600 24200 29952 39884 43120 36000 30720 23120 20736 12996 6400 3528 295616

ui
-2.1633 -1.8092 -1.4551 -1.1010 -0.7469 -0.3929 -0.0388 0.3153 0.6694 1.0235 1.3776 1.7317 2.0858 2.4399 2.7939

f (ui )
0.0384 0.0777 0.1384 0.2177 0.3019 0.3694 0.3987 0.3797 0.3189 0.2363 0.1545 0.0891 0.0453 0.0203 0.0081

frecvene teoretice n i

exp

4 16 20 34 50 52 59 55 40 30 20 16 9 4 2 411

6 11 20 32 44 54 58 55 46 34 22 13 7 3 1 407

0.45 1.95 0.00 0.17 0.84 0.06 0.02 0.00 0.89 0.56 0.27 0.71 0.88 0.37 0.59 7.75 5.23

f =k-3=15-3=12 2 teoretic5% =
2 exp

>

teoretic5%

31

Figu ra 3. 2

Ajustarea distribuiei experimentale dup distribuia normal

70 60
frecvene absolute
frecvene experimentale ni frecvene teoretice ni

50 40 30 20 10 0

14 16 18 20 22 24 26 28 30 32 34 36 38 40 42
categorii de diametre

Verificarea calitii ajustrii se poate face cu criteriul relaia:


2

dat de

ni

i n ni

i sunt frecv enele teoretice unde n i sunt frecvenele experimentale iar n absolute.

3.6. DISTRIBUIA CHARLIER (TIP A)


Este o distribuie normal generalizat ce ia n considerare asimetria i excesul. Funcia de frecven este:

(u )
unde:
u (x s x)

f (u )

A f (u ) 6

E f 24

IV

(u )

este abaterea normat

32

f (u )

1 2
1 2 1 2

e
.

u2 2

este funcia de frecven a distribuiei normale

normate
f (u ) e
. u2 2

(3u

u 3 ) este derivata de ordin III a lui f(u)

IV

(u )

u2 2

(u 4

6u 2

3) este derivata de ordin IV a lui

f( u) A este asimetria E este excesul Pentru A=0 i E=0 distrib uia Charlier se distribuie normal. Frecvenele absolute, pe clase ale variabilei x , formula: Nh n (u ) s unde h este intervalul de clas. Funciile f(u), f (u ) , f IV (u ) se pot calcula sau se Pentru calculul indicilor acestei distribuii procedeul momentelor m3 m4 E 3 A 2 3 m 2 m2 transform ntr -o se obin aplicnd

iau din tabele. se poate folosi

n silvicultur acest tip de repartiie este frecvent aplicat la studiul distribuiei numrului de arbori pe clase de diematere sau pe clase de nlimi n arboretele echiene sau la alte distribuii la care indicii de asimetrie i exces prezint valori semnificative. Etapele ajustrii distribuiei experimentale dup distribuia Charlier tip A Redactarea tabelului de ajustare (tabelul 3.3) Calculul valorii medii x m e d , al varianei s 2 i al abaterii standard s .
k

ni xi

x ni

Determinarea indicelui de asimetrie: A

i 1 k

s3
i 1
N

xi

Determinarea indicelui de exces: E Calculul ab aterilor normate u i : u i


xi

i 1

Ns 4

x s

33

Caculul f(u i ) cu relaia: f (u i )

1 2

ui2 2

,
ui3 ) f (ui )

Calculul derivatei de oridn trei: f (ui ) Calculul derivatei de


f
IV

(3ui

oridn

patru: frecven:

(u i )

(u

4 i

6u

2 i

3) f (u i )

Calculul
(u i ) f (u i )

funciei

de

cu relaia: Caculul n Nh i n (u i ) , unde h este amplitudinea clasei, s abaterea s standard iar N numrul total de observaii Verificarea calitii ajustrii cu un criteriu riguros ( 2 ).
Tabelu l 3 . 3

A E IV f (u i ) f (u i ) 6 24 frecvenelor teoretice absolute

Ajustarea distribuiei experimentale dup funcia Charlier (tip A)

xi

n i exp x i n i

x i ni

ui
-2.1633 -1.8092 -1.4551 -1.1010 -0.7469 -0.3929 -0.0388 0.3153 0.6694 1.0235 1.3776 1.7317 2.0858 2.4399 2.7939 A= E=

f (ui )
0.0384 0.0777 0.1384 0.2177 0.3019 0.3694 0.3987 0.3797 0.3189 0.2363 0.1545 0.0891 0.0453 0.0203 0.0081 0.2394 -0.3070

III

(u i ) f

IV

(u i )

(u)
0.0344 0.0820 0.1548 0.2426 0.3240 0.3760 0.3853 0.3541 0.2951 0.2241 0.1546 0.0959 0.0528 0.0255 0.0106

n i teor
5 12 23 35 47 55 56 52 43 33 22 14 8 4 2 409

exp

14 4 16 16 18 20 20 34 22 50 24 52 26 59 28 55 30 40 32 30 34 20 36 16 38 9 40 4 42 2 total 411 x med = s2= s=

56 784 256 4096 360 6480 680 13600 1100 24200 1248 29952 1534 39884 1540 43120 1200 36000 960 30720 680 23120 576 20736 342 12996 160 6400 84 3528 10776 295616 26.2189781 31.90 5.65

0.1397 0.0384 -0.1778 -0.4284 -0.5507 -0.4130 -0.0464 0.3473 0.5448 0.4723 0.2346 0.0002 -0.1277 -0.1465 -0.1081

-0.1222 -0.4602 -0.7228 -0.6103 -0.0110 0.7749 1.1926 0.9163 0.1633 -0.5171 -0.7393 -0.5346 -0.1893 0.0553 0.1377

0.26 1.03 0.32 0.05 0.16 0.14 0.14 0.22 0.22 0.23 0.31 0.26 0.19 0.02 0.10 3.66 3.94

f =k-5=15-5=10 2 teoretic5% =
2 exp

<

teoretic5%

34

Figu ra 3. 3

Ajustarea distribuiei experimentale dup distribuia Charlier (tip A)


70 60

ni exp ni teor

frecvene absolute

50 40 30 20 10 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

categorii de diametre

3.7. SISTEMUL DISTRIBUIILOR PEARSON


Sistemul distribuiilor Pearson se bazeaz pe ecuaia diferenial: dy dy x b y x b dx sau 2 y c 0 c1 x c 2 x dx c 0 c1 x c 2 x 2 unde b, c 0 , c 1 i c 2 sunt parametri ce se stabilesc pe baza datelor experimentale. Sistemul de repartiii Pearson se determin pe baza indicilor de asimetrie i exces. Sistemul cuprinde, n afar de repartiia normal, nc apte tipuri de curbe diferite, numerotate de la I la VII. Unele tipuri de curbe conin 2 -3 subtipuri: I(i, j, u), II(i, u), III(i, j), VI(i,j) astfel nct sistemul complet cuprinde 13 curbe de forme diferite (i=curb cu vrf, u= curb convex, j= curb descresctoare). Sistemul s- a aplicat la ajustarea repartiiei numrului de arbori pe categorii de diametre.

3.8. DISTRIBU IA BETA


Funcia de distribuie ,corespunztoare valorilor cumulate, este:

35

( x)
a

( x a) (b x) dx

unde: a este limita inferioar a distribuiei experimentale; b este limita superioar a distribuiei experimentale iar , sunt exponenii funciei Beta. Funcia de repartiie (densitatea de repartiie), se calculeaz cu relaia: f ( x) C ( x a) (b x) , unde C este o constant aleas astfel nct suma frecvenelor absolute s fie egal cu N sau suma frecvenelor relative s fie 1. Deci, b N C ( x a) (b x) dx N C b
a
a

( x a ) (b x) dx
N
b

Funcia de repartiie devine: f ( x)

( x a ) (b x)

( x a ) (b x) dx
a

Fu ncia este foarte flexibil i se folosete pentru variabile continue. n silvicultur este foarte indicat pentru descrierea distribuiei arborilor n arboret pe categorii de diametre. Etapele ajustrii distribuiei experimentale dup distribuia Beta Redactarea tabelului de ajustare (tabelul 3.4) Calculul valorii medii x m e d , al varianei s 2 i al abaterii standard s . Stabilirea limitelor distribuiei: a=limita inferioar i b=limita superioar x a Calculul mediei aritmetice relative: x relativ b a 2 s 2 Calculul dispersiei relative: s relativ (b a ) 2 x relativ Calculul partametrului K: k 1 x relativ k 1 2 s r e l (1 k ) 2 n Calculul parametrilor n i m : ; 1 k x rel n m kn 1 x re m 1 ; n 1 Calculul exponenilor i cu relaiile: Calculul frecvenelor teoretice dup distribuia beta: i C ( x a) (b x) n

36

Compararea frecvenelor teoretice cu cele experimentale i verificarea calitii ajustrii cu un criteriu riguros. Figura 3. 4
Ajustarea distribiei experimentale dup distribuia Beta

ni exp
70 60

frecvene absolute

frecvene teoretice

50 40 30 20 10 0 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 categorii de diametre

Tabelu l 3 . 4

Ajustarea distribuiei experimentale dup funcia beta

xi
14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 total

n i exp
4 16 20 34 50 52 59 55 40 30 20 16 9 4 2 411 x med = s2= s= x r elativ = K= n= m=

x ini
56 256 360 680 1100 1248 1534 1540 1200 960 680 576 342 160 84 10776

x i ni
784 4096 6480 13600 24200 29952 39884 43120 36000 30720 23120 20736 12996 6400 3528 295616

frecvene teoretice relative absolute absolute rotujite

exp

26.22 31.90 5.65 0.441 0.788 3.330 2.623

0.007 2.79 0.034 14.04 0.065 26.89 0.093 38.23 0.113 46.50 0.124 51.01 0.126 51.63 0.118 48.65 0.104 42.71 0.084 34.67 0.062 25.55 0.040 16.49 0.021 8.62 0.007 2.97 0.001 0.26 1.000 411.01 C=2655x10-9 a= b= s 2 r elativ = =n-1= =m-1=

3 14 27 38 46 51 52 49 43 35 25 16 9 3 0

0.529 1.815 0.421 0.348 0.020 0.942 0.735 0.209 0.714 1.000 0.000 0.750

411 7.483 C=1091x10-6 13 43 0.035 2.330 1.623

37

3.9. DISTRIBU IA MEYER


Se utilizeaz frecvent n cazul distribuiilor descresctoare. n silvicultur este utilizat la ajustarea repartiiei numrului de arbori pe categorii de diametre n arboretele pluriene. Frecvenele teoretice se determin cu relaia:

i n

ke

xi

i reprezint frecvenele teoretice; unde: n e este baza logaritmilor naturali (e=2,71828) k i sunt parametri funciei Pentru determinarea parametrilor ecuaiei, se logaritmeaz funcia de frecven: i log k xi log e i ln k log n ln n xi dar ln e 1 n aceast relaie se introduc frecvenele experimentale ale celor dou valori extreme ale variabilei (notatecu A i B), rezultnd un sistem de dou ecuaii cu dou necunoscute: i k. log n A log k A log e ln n A ln k A sau ln n B ln k B log n B log k B log e i log k xi log e nlocuim: log n i y i ; logk a i Dac n relaia log n log e b , aceasta devine y i = a+bx i , care este ecuaia unei drepte Parametri a i b se pot determina i prin metoda celor mai mici ptrate, rezolvnd sistemul de ecuaii: aN b n i x i ni y i

ni x i

n i x i2

ni xi y i

i a bxi , iar apoi, Cu noscnd valorile a i b se pate determina y i y i se pot calcula frecvenele absolute compensate deoarece log n

10 yi n
Exemplu: ntr-un arboret plurien s - au inventariat arborii i au fost grupa i pe categorii de diametre rezultnd distribuia experimental din tabelul 3.5. Se cere s se ajusteze aceast distribuie experimental dup legea Meyer.

38

Tabelu l 3 . 5

Ajustarea distibuiei experimentale a numarul de arbori pe categorii de diametre dup distribuia Mayer xi 8 12 16 20 24 28 32 36 40 44 48 52 56 60 64 total ni 395 210 101 62 39 28 45 49 56 63 42 30 16 10 3 1149 log ni 2.597 2.322 2.004 1.792 1.591 1.447 1.653 1.690 1.748 1.799 1.623 1.477 1.204 1.000 0.477 24.426 n comp 395 279 197 139 98 69 49 34 24 17 12 9 6 4 3 1335
2

Elemente de calcul

0.0 16.9 46.5 42.5 35.5 24.4 0.3 6.2 41.4 122.8 74.0 54.0 16.5 7.8 0.0 488.9

a=8 b=64 n A= 395 n B =3 a=0.08716 k=793.2

lg 395 log k lg 3 log k 2.596 0.477

8 lg e 64 log e

2.596 0.477

log k 8 * 0.4343 log k 64 * 0.4343

log k 3.4744 log k 27.7952


0.477 27.7952
2.8992

2.596 3.4744
log k

2.119 24.3208

0.0871

2.5966 0.3026

k 10 2.8992

793.2

i n

793.2e

0.0871xi

Sau, n varianta a doua (tabelul 3.6): aN b n i x i ni y i


a
a b

1 1 a 42 93 b7 23 46 4 1 2 3 a7 73 46 8 b 0 4 9 3 6 7 5 6

ni x i
2.659

ni x

2 i

ni xi y i

0.0259

i y

2.659 0.0259 xi

10 yi n

39

Tabelu l 3 . 6

Ajustarea distibuiei experimentale a numarul de arbori pe categorii de diametre dup distribuia Mayer xi 8 12 16 20 24 28 32 36 40 44 48 52 56 60 64 540 b=
Figu ra 3. 5

ni 395 210 101 62 39 28 45 49 56 63 42 30 16 10 3 1149

log ni=yi

niyi 1025.7 487.7 202.4 111.1 62.1 40.5 74.4 82.8 97.9 113.4 68.2 44.3 19.3 10.0 1.4 2441

nixi 3160 2520 1616 1240 936 784 1440 1764 2240 2772 2016 1560 896 600 192 23736

nixi

nixi yi 8205 5852 3239 2223 1489 1135 2381 2982 3916 4988 3272 2304 1079 600 92 43756

yi comp 2.452 2.348 2.245 2.141 2.037 1.934 1.830 1.727 1.623 1.519 1.416 1.312 1.209 1.105 1.001 25.899

ni comp 283 223 176 138 109 86 68 53 42 33 26 21 16 13 10 1296

2.597 2.322 2.004 1.792 1.591 1.447 1.653 1.690 1.748 1.799 1.623 1.477 1.204 1.000 0.477 24.426

25280 30240 25856 24800 22464 21952 46080 63504 89600 121968 96768 81120 50176 36000 12288 748096 a=

-0.0259

2.659

Ajustarea distibuiei reale a numarul de arbori pe categorii de diametre dup distribuia Mayer
450 400 350 300
nr.arbori

curba real curba teoretic 2 curba teoretica 1

250 200 150 100 50 0

12 16 20 24 28 32 36 40 44 48 52 56 60 64
categ de diam .

40

CAPITOLUL 4 : EXAMINAREA SEMNIFICAIEI 4.1. GENERALITI


Semnificaia La fiecare extragere a unei probe dintr - o populaie, se obin alte valori pentru medie, varian, frecvene relative, coeficient de corelaie, etc., valori care se abat mai mult sau mai puin fa de valorile adevrate ale parametrilor populaiei. Abaterile vor fi cu att mai accentuate cu ct variabilitatea este mai mare. n situaia n care probele sunt extrase din populaii diferite apare o nou surs de variaie lega t de particularitile diferite ale fiecrei populaii n parte. Compararea indicilor statistici obinui prin probe luate din aceeai populaie sau din populaii diferite este ngreunat de prezena variabilitii individuale din cadrul fiecrei populai i. Influena cauzelor ntmpltoare asupra diferenelor dintre indicii statistici ai probelor se poate diminua pe msur ce se mrete numrul observaiilor, evideniindu - se mai pregnant diferenele cauzate de factorii obiectivi. n practic ns, posibili tile de majorare a numrului de observaiii sunt limitate aa nct suntem constrni a trage concluzii n baza unor probe de volum restrns. ntrebrile pe care ni le punem legat de semnificaie se refer la: - este sau nu semnificativ diferena dintre dintre o medie stabil (obinut pe cale teoretic sau din cercetri anterioare) i media rezultat din cercetarea unei probe; - este sau nu semnificativ o diferen dintre mediile privind dou sau mai multe probe; - este sau nu adevrat diferena dintr e varianele privind sau mai multe probe analizate. ntrebri asemntoare se pun i n ceea ce privete compararea distribuiilor, compararea coeficienilor de corelaie i a coeficienilor de regresie, compararea proporiilor, etc.: - care diferene pot fi considerate ntmpltoare i deci nesemnificative ? - cnd diferenele sunt semnificative (abateri veritabile) se datoreaz ele unor factori de influen sistematici, sau nu ? Ipoteza nul Pentru a putea rspunde la problema semnificaiei se formuleaz iniial o ipotez care n urma analizei va fi acceptat sau respins. Frecvent se folosete ipoteza nul (H 0 ) care const n presupunerea c abaterea indicilor estimai fa de parametri populaiei este zero (nul). Metodele statistice au drept scop de a v erifica dac aceast ipotez este sau nu adevrat. Verificarea ei se face prin comparaii. Respingnd ipoteza nul, se accept semnificaia abaterii respective. Acceptnd -o rezult c nu exist nici un temei pentru a accepta semnificaia diferenei.

41

Erorile n verificarea ipotezei nule sunt de dou genuri : Erori de genul I , prin care pe baza rezultatelor prelucrrii datelor caracteristice eantionului, se respinge ipoteza nul cnd ea este de fapt adevrat la nivelul populaiei ; Erori de genul II , cnd , pa baza aceluiai eantion, se accept ipoteza nul, ea fiind de fapt fals la nivelul populaiei. Pentru a reduce erorile de genul I trebuie respinse numai ipotezele care se realizeaz cu o probabilitate mai mic de 5%. n unele situaii se resping ipot ezele care se realizeaz cu o probabilitate mai mic de 1% sau 0,1%. Valoarea de 5%(sau 1% sau 0,1%) se numete probabilitate de transgresiune sau nivel de semnificaie i se noteaz de obicei cu . Pentru erorile de genul II probabilitatea de a accepta H 0 , cnd de fapt ea este fals, se noteaz cu , iar n practic se alege de obicei =0,10 sau =0,05. Teste de semnificaie Verificarea ipotezelor statistice se face cu ajutorul testelor de semnificaie. Testul statistic este o metod care permite luarea unei decizii cu privire la o populaie pornind de la o informaie incomplet furnizat de un eantion. Testele statistice se aplic pentru compararea valorilor parametrilor unei populaii cu valori fixate anterior, sau la compararea ntre ele a valorilor a dou sau mai multe eantioane sau populaii. Pentru verificarea semnificaiei se folosesc mai multe categorii de teste de semnificaie, n funcie de natura ipotezelor de verificat. Frecvent utilizate sunt : Testele de conformitate destinate pentru a com para ntre ele o populaie teoretic i o prob observat, din punctul de vedere al mediilor, abaterii standard, varianei, coeficientului de corelaie, coeficientului de regresie, etc. Testele de egalitate , sau de omogenitate, permit compararea unui anum it numr de populaii prin intermediul unui numr egal de probe extrase din aceste populaii. Se aplic pentru verificarea omogenitii mediilor, varianelor, coeficienilor de corelaie, etc. Testele de ajustare permit s se verifice dac din toate punc tele de vedere, o prob observat poate fi considerat ca fiind extras dintr- o populaie dat. Aceast verificare se realizeaz prin compararea frecvenelor observate ale probei cu frecvenele teoretice a le populaiei. Testele de independen permit s s e controleze, n baza unor probe , dac sunt independente dou sau mai multe criterii de clasificare, n general calitative.

42

Clase de semnificaie . n raport cu mrimea probabilitii de transgresiune acceptat s - au format urmtoarele clase de semnificaie :

Probabilitatea de transgresiune >5% 1-5% 0,1 - 1 % < 0,1 %

Dif erena este nesemnificativ (neasigurat) semnificativ (asigurat) distinct semnificativ (bine asigurat) foarte semnificativ (foarte bine asigurat)

Probabilitile de transgresiune, corespunztoare claselor de semnificaie, pot fi folosite pentru stabilirea limite lor n care se gsesc parametri populaiei. Aceste granie se numesc limite de ncredere. Prin intermediul lor se definete intervalul de ncredere.

4.2. INTERVALUL ARITMETICE

DE

NCREDERE

AL

MEDIEI

n practic nu se admite indicarea simpl a mediei arit metice, ea trebuind s fie nsoit de intervalul de ncredere corespunztor probabilitii de transgresiune acceptat (5%, 1% sau 0,1%). Aceast cerin este impus de variabilitatea individual i de faptul c majoritatea cercetrilor se fac pe probe mai mult sau mai puin numeroase. Formarea intervalului de ncredere difer dup cum distribuia din care s- a extras proba este normal, binomial, Poisson etc i dac abaterea standard teoretic este sau nu cunoscut. Intevalul de ncredere al mediei n cazu l distribuiei normale. CAZUL 1 : Abaterea standard teoretic se cunoate La extragerea mai multor probe intervine, n locul abaterii standard, eroarea standard a mediei aritmetice:

sx

cunoscnd c i mediile probei se distribuie tot n ormal, n jurul aceleeai medii a populaiei, limitele intervalului de ncredere vor fi:

x us x
Pentru u=1,96 ; 2,58 sau 3,29, exist o (probabilitate de acoperire) de 95 ; 99 respectiv populaiei (med ia adevrat) s se gseasc undeva n x us x . Probabilitile de transgresiune (de depire, 5%, 1% respectiv 0,1%. siguran statistic 99,9 %, ca media intervalul definit de de a grei) sunt de

Exem plu: ntr -un arboret de molid s -a deter minat valoarea coeficientului de for m natural, prin doborrea a cinci arbori. S - a obinut o valoare medie de 0,50. Valoarea medie a coeficientului de variaie a coeficientului de f or m (s%), cunoscut din cercetri anterioare, este de 8%. (Pe baza a doar cinci

43

msurtori precizia de deter min are a abateri i standard este foarte redus i nu este indicat s o folosi m). Pentru o probabilitate de transgresiune de 5%, se cere s se stabileasc ntre ce limite este cuprins valarea adevrat a mediei coeficient ului de for m.

s%

s 100 x

0,5 * 8 100

0,04

iar

eroarea

standard

mediei:

sx

0.04 N 5
=5%

0,021
u= 1,96

din tabele, pentru

Media adevrat va fi ntre limitele

x us x adic 0.50 1.96 * 0,021 0,50 0,041

CAZUL I1 : Abaterea standard teoretic nu se cun oate n acest caz, limitele intervalului de ncredere vor fi date de de expresia:

ts x

s N

Valoarea lui t se determin din tabela distribuiei Student n funcie de probabilitatea de transgresiune urmrit i de numrul gradelor de libertat e f ; f=N-1 . n cazul unui mare numr de observaii (N) , distriduiile t i u sunt identice i intevalul de ncredere va fi x us x .
Exem plu: ntr - o cultur de plop euramerican, s - au msurat 12 nlimi ale unor exemplare alese la nt mplar e, obinnd ur mtoarele rezultate:
arborele nlimea x (cm) 1 140 2 90 3 120 4 120 5 140 6 110 7 110 8 90 9 110 10 150 11 150 12 110

x 120cm

s= 20,8 cm

sx

s N

20,8 12

6,0
t= 1,96

din tabele, pentru

=1% i f=12-1=11 grade de libertate

intervalul de ncredere al mediei va fi:

x ts x

120 3.106 * 6 120 19

4.3. TESTE DE CONFORMITATE


Servesc la compararea unor parametri teoretici cu indicatorii unei probe. Prin intermediul acestor teste pot fi comparate mediile, varianele, abaterile standard, coeficienii de corelaie, coeficienii de regresie, etc. 4. 3.1. Examinarea diferenei dintre o medie experimental i o valoare dat. Folosirea testului u

44

Testul u se aplic atunci cnd abaterea standard teoretic este cunoscut, cnd valoarea x provine dintr - o prob normal distribuit de volum foarte mare. Se d : - x media experimental calculat n baza unei probe cu N observaii extras dintr - o populaie cu media necunoscut. 0 - media cunoscut a unei populaii ce poate rezulta din consideraii teoretice sau din observaii anterioare. abaterea standard cunoscut Se cere s se determine dac ntre media i 0 exist diferene, deci dac este valabil ipoteza H 0 : = 0 . Se calculeaz:

x
x

Dac u e x p e r i m e n t a l > u t e o r e t i c , atunci diferena ntre cele dou medii este semnificativ i ipoteza nul se va respinge
Pe nt r u se mi ne le de bra d s - a sta bil it ca va l oa r e med ie a p op ula iei gre uta te a de 55 , 4 g p e nt ru mi a de s emi ne i o a ba ter e sta nda rd de 7, 8 5 g. O cer ce ta re e fe ct ua t n tr - o a n u mit z o n ba za t pe un n um r de 2 76 ob ser va ii a sta bil it o n ou me d ie de 61 , 3 gra me . N e in tere sea z da c n o u a med ie e ste ma i m a re de c t c e a st a bil it ca med ie a p op ula iei :

Ex empl u :

u exp

u t a b e l a r = 1,64 . D e c i, u e x p >u t a b e l a r di fe re na e ste se m n i fi ca t iv , de ci gre uta te a se m i ne l or din ca re s - a u f c ut obs er va i ile se d eo s ebe te f oa rte sem ni fi ca ti v de m e di a sta b ili t a nte ri or .

61,3 55,4 276 7.85

12,48

Folosirea testulu t Testul t se aplic atunci cnd nu se cunoate valoarea teoretic a abaterii standard i cnd numrul d e msurtori estze relativ mic ( N<30 ) x 0 t N s Se pune problema i n acest caz dac ntre media eantionului ( x ) i media populaiei ( 0 ) exist sau nu diferene, deci dac este sau nu valabil ipoteza nul H 0 : x 0 Raportul t se distribuie dup legea Student i este tabelat n funcie de numrul gradelor de libertate f= N-1 i probabilitatea de transgresiune acceptat. Dac t c a l c u l a t > t t e o r e t i c atunci ipoteza nul se respinge.
Exem plu: Pentru o anumit localitate s- a nregistr at, ca medie multianual, cantitatea de precipitaii de 440 mm. n ultimii 10 ani precipitaiile au fost mai reduse, media fiind de numai 400 mm, iar abaterea standard de 20 mm. Ct de semnificativ este diferena dintre cele dou m edii ?

x s

400 440 10 20

0,5 10

1.58

45

Din tabele, pentru =5%unilateral , t t a b e l a r =1,833 Deci t e x p <t t a b abaterea este nesemnificativ pentru probabilitatea de transgresiune de 5%.

4.3.2. Examinarea semnificaiei varianei i a diferenei dintre variane Compararea unei variane experimentale ( s 2 ) cu o varian teoretic dat ( 0 2 ) se face cu ajutorul criteriului 2 . Dac notm: s 2 variana experimental 2 variana populaiei 2 0 variana teoretic dat pentru populaie Se cere s se stabileasc d ac 2 se deosebete de 0 2 , adic dac este sau nu valabil ipoteza nul H 0 : 2 > 0 2 s2 Se calculeaz raportul i se compar cu valoarea teoretic a 2
0 2

raportului

unde
s2
2

este luat din tabele n funcie de

i de f .

ipoteza este adevrat, deci 2 > 0 2 f De obicei intereseaz numai dac 2 > 0 2 sau dac 2 < 0 2 , i n aceste cazuri folosim testul unilatelal. Dac ne intereseaz ambele variante ( 2 > 0 2 i 2 < 0 2 ) folosim testul bilateral. Tabelele pentru 2 teoretic sunt ntocmite pentru testul unilateral. Dac
2 0

Pentru testul bilateral n tabel se intr cu dac se dorete verificarea ipotezei:


2

(respectiv p 100

<

).

Exem plu: Dintr -o ndelung at practic a cercetrilor, se cunote c var iana factorului de cubaj al lemnului de foc est e de 0 2 =0,0038 (sau 0 =0,062 ; %=10 ). La o nou cercetare, efectuat asupra a 59 uniti, a rezultat o abatere standard s=0,075 i o dispersie s 2 =0,0056 ( s 2 es ti meaz pe 2 ). Este oare semnificativ diferena dintre cele dou variane ( 0 2 i s 2 ) la o probabilitate de transgresiune de 5% ? H0:s2 > 02 Calculm

s2
2 0

0.0056 0.0038

1.47
2 teoretic=

Din tabele, pentru interpolare)

=5 %i f=59 -1=58

76,8

(prin

46

76.8 1.32 58

s2
2 0

, deci ipoteza este adevrat. Populaia

din care s - a extras pr oba are o dispersie mai mare dect cea cunoscut. Sti vele din care s - au extras cele 59 de probe sunt mai puin omogene n raport cu factorul de cubaj dect cele anterior studiate.

Limitele de ncredere ale varianei Limitele inferioar i superioar ale intervalului de ncredere, pentru o probabilitate de transgresiune , vor fi: s2 s2 2 2 s sup s inf . 2 2
1 2

f f unde: s este variana rezultat din experiment; 2 2 pentru probabilitatea p= 100- /2 1 este criteriul 2 2 pentru probabilitatea p= /2 2 este criteriul f este numrul gradelor de libertate f=N-1 Exemplu: Limitele de ncredere pentru varian a s 2 =0,0056 din exemplul anterior, pentru o probabilitate de transgresiune de 5% se calculeaz astfel: Din tabele, se ia valoarea lui 1 2 pentru probabilitatea p=1005/2=97,5 %i f=58 pentru f=50 1 2 =32,36 2 pentru f=60 pentru f=58 1 =40,48 8 2 32.36 (40.48 32.36) 38.9 1 10 se ia valoarea lui 2 2 pentru probabilitatea p=5/2=2,5% i f=58 pentru f=50 2 2 =71,42 2 pentru f=60 pentru f=58 2 =83,30 8 2 71.42 (83.30 71.42) 80.92 2 10 s2 0.0056 0.0056 s2 0.0056 0.0056 2 2 s sup 0 . 0084 s 0.0040 inf . 2 2 38.9 80.9 0.67 1.39 1 2 58 58 f f
2

Aadar, n 95% din cazuri, la repe tarea experienei, ne putem atepta la o varian cuprins ntre 0,0084 i 0,0040. Limitele abaterii standard vor fi: 0.0084 0.092 i respectiv 0.0040 0.063 .

4.4. TESTE DE EGALITATE


Servesc la compararea unui anumit numr de populai i prin intermediul unui numr egal de probe extrase din aceste populaii. Ele se

47

aplic pentru verificarea omogenitii mediilor, varianelor, coeficienilor de corelaie. 4.4.1. Verificarea semnificaiei diferenei dintre dou variane Se varianele i s 2 2 . Se Se verific ipoteza nul H 0 : 1 2 = 2 2 unde 1 2 i 2 2 reprezint teoretice corespunztoare celor dou variane experimentale s 1 2

folosete testul F (Fischer). calculeaz raportul dintre dispersia cea mai mare (pe care o s12 notm cu s 1 2 ) i dispersia cea mia mic (notat cu s 2 2 ): Fcalc 2 s2 F c a l c se compar cu F t e o r e t i c determinat din tabele, n funcie de probabilitatea de transgresiune acceptat ( ) i numrul gredelor de libertate f 1 i f 2 . F 1 =N 1 -1 gradele de libertate al dispersiei mai mari ( s 1 2 ) F 2 =N 2 -1 gradele de libertate al dispersiei mai mici ( s 2 2 ) Dac F c a l c <F t e o r e t i c ipoteza nul se accept , diferena dintre cele dou dispersii fiind considerat ca nesemnificativ, deci cele dou probe sunt extrase din aceeai populaie. Varianele fiin d omogene se poate calcula o varian reunit care se va apropia cel mai mult de variana populaiei: 2 2 s12 ( N 1 1) s 2 ( N 2 1) s12 f 1 s 2 f2 s2 N1 N 2 2 f1 f 2 Dac F c a l c >F t e o r e t i c diferena dintre cele dou dispersii este semnificativ, varianele nu sunt omogene, provenind din populaii diferite, i nu se poate calcula o varian comun. Deoarece intereseaz 1 2 = 2 2 se va aplica criteriul F bilateral (ne intereseaz abaterile n ambele sensuri). De aceea, din tabelele pentru F unilateral se iau valorile lui F teoretic la o probabilitate de /2. De exemplu, dac ne intereseaz F bilateral pentru =5%, din tabelele cu F unilateral lum valoarea corespunztoare probabilitii de 2,5%.
Exem plu: n aceleai condiii staionale au fost instalate dou culturi de plop euramerican: pri ma di n clona A i a doua di n clona B. Au fost fol osii puiei de aceeai vrst i nlime, iar prelucrarea solului a fost identic. Dup doi ani de la plantare au fost msurate nli mile la 35 de exemplare din clona A i la 45 de exemplare din clona B. Dup prelucr area datelor respective, a rezultat o varian de 0,70 pentr u clona A i de 1,38 pentru clona B. S se stabileasc dac variabilitatea nli milor la cele dou cultur i este sau nu identic. s 1 2 = 1,38 este variana cea mai mare (a clonei B) i s 2 2 = 0,70 est e variana cea mai mic (a clonei A) Numrul gr adelor de li bertate va fi: f 1 =N 1 -1=45-1=44 i f 2 =35-1=34

48

Fcalc

s12 s
2 2

1.38 1.97 0.7

Din tabelele, pentru = 5%, i f 1 =44, f 2 =34 F t a b e l a r =1,9 ( n tabelele pentru F unilateral fol osi m probabilitatea =2,5%) Deoarece F c a l c =1,97 > 1,9=F t e o r e t i c diferena dintre cele dou dispersii este semnificativ i putem susine c cele dou clone difer din punct de vedere al variabilitii nlimilor.Varianele nefiind omogene, nu se poate calcula o varian comun.

4.4.2. Exam inarea egalitii mai multor variane Se verific ipoteza nul H 0 : 1 2 = 2 2 = 3 2 ... = k 2 Bartlett a demonstrat c variabila ntmpltoare: s i2 1 k f i ln , C i 1 s unde
C 1 1 3k 1
2
k i 1

1 fi

1 f

urmeaz aproximativ legea distribuiei fiind numrul varianelor examinate. Se calculeaz unde s 2
fi s fi
2 i

cu f=k-1 grade de libertate, k


2

empiric cu relaia:

2.303 f lg s 2 C

f i lg s i2 ,
i 1

este variana medie ponderat.

Din tabele, n funcie de i de numrul gradelor de libertate f=k2 1 , se obine t e o r e t i c . 2 Dac 2 c a l c u l a t se accept ipoteza nul, deci ntre teoretic varianele considerate nu exist diferene semnificative. n acest caz, pentru caracterizarea populaiei din punct de vedera al variabilitii se va lucra cu variana medie. 2 Dac 2 c a l c u l a t se respinge ipoteza nul, deoarece teoretic ntre varianele considerate exist diferene semnificative. Nu se poate calcula o varian medie, deoarece cel puin una dintre dispersii se refer la alt populaie. Se poate trece la omogeniz area sistemului, prin eliminarea din calcul a varianei care se abate cel mai mult de la celelalte. Dac dup aceast excludere sistemul este omogen se poate calcula o varian comun. Dac nu, se poate continua omogenizarea prin eliminarea urmtoarei vari ane aleas n acelai mod. Testul Hartley este un mod mult mai simplu de verificare a omogenitii mai multor variane dar se poate aplica numai n cazul grupelor cu numr egal de observaii ( n ) .

49

care se comp ar cu H t e o r e t i c luat 2 s min im din tabele, n funcie de numrul gradelor de libertate f=n-1 i de p (numrul de grupe comparate) Dac H c a l c u l a t Hteoretic ntre variane nu exist diferene semnificative. Dac H c a l c u l a t Hteoretic ntre variane exist diferene semnificative. 4.4.3. Distribuia abaterii standard Abaterea standard, privit ca o variabil aleatoare, atunci cnd numrul de observaii este mare, are o distribuie aproximativ normal, cu 2 si f i 1 2 s 1 media , unde s i variana: s . Abaterea 2f 2f fi standard va fi: s
2f u s 2f

Se calculeaz raportul H calc

2 s max im

Limitele de ncredere ale abaterii standard vor fi : s 4.4.4. Distribuia coeficientului de variaie

Atunci cnd numrul de msurtori este mare, coeficientu l de variaie are o distribuie normal. Abaterea standard a coeficientului de variaie este dat de relaia:
ss % % 2f
%1

% 1 2 100
u 2f

Cu limitele de ncredere:

% 1 2 100

Dac nu se cunoate valoarea coeficientului de variaie teoretic ), s e admite folosirea estimaiei s%. 4.4.5. Examinarea semnificaiei diferenei dintre dou medii

Fie x11 , x12 ,...x1n i x 21 , x 22 ,...x 2 n dou sisteme de observaii extrase randomizat din dou populaii normal distribuite, cu parametrii: 1 1 i ; 2 i 2 . Pentru fiecare prob se calculeaz indicii: x1 x2 1 ; 2 2 2 s1 1 , cu f 1 =N 1 -1 grade de libertate ;

50

2 2 s2 2 , cu f 2 =N 2 -1 grade de libertate ; Dac se repet de un numr mare de ori observaiile, mediile x1 i

x 2 se distribuie dup legea normal cu parametri

2 1

N1

, respectiv

2 2

N2

.
x1 x 2 formeaz de asemenea o distribuie normal
1 2
2 2

Diferenele d cu media: i dispersia:

2 d

2 1

N1

N2
2 1 2 2

Pot aprea n continuare dou situaii distincte:


2 1 2 2

sau

Decizia de ncadrare n unul dintre cele dou cazuri s e ia dup 2 verificarea ipotezei nule H 0 : 12 2 . Verificarea se face cu testul F. Dac probele nu sunt extrase din populaii cu distribuii normale, se caut s se ajung la forma normal prin transformri.
2 2 CAZUL 1 : Compararea a dou medii n situaia cnd 1 2 2 Dup verificarea ipotezei H 0 : 12 2 cu testul F, dac aceasta este

just se trece la verificarea ipotezei H 0 : 1 2 Dac aceast ipotez este just, atunci diferenele d x1 x 2 0 i cu variana formeaz o distribuie normal, cu media 1 2
2 d 2

1 1 N1 N 2 Raportul:
u exp d
d

x1

x2

1 1 N1 N 2 constituie criteriul prin intermediul cruia se examineaz semnificaia diferenei dintre cele dou medii. Dac u e x p <u t e o r e t i c determinat n funcie de , diferena dintre medii este nesemnificativ. Criteriul u se poate folosi doar atunci cnd cele dou medii provin din eantioane de volum mare normal distribuite. Dac nu se cunoate valoarea lui 2 , cnd cele dou medii provin din eantioane cu volum mic i nu avem certitudinea normalitii eantionului, parametrul 2 se nlocuieta cu estimaia s 2 .

51

Prin nlocuirea lui

2 s12 f 1 s 2 f2 2 s f1 f 2 2 cu s se va apela la testul t : x1 x 2 t exp 1 1 s N1 N 2 2

Din tabele, n funcie de i f=N 1 +N 2 -2 , se obine t t e o r e t i c . Dac t e x p <t t e o r e t i c se accept ipoteza nul. n acest caz se poate calcula o medie ponderat: N 1 x1 N 2 x 2 x N1 N 2 i o varian comun: 2 2 x1i x x 2i x 2 2 s0 N1 N 2 1 Pentru noua valoare medie limitele inter valului de ncredere vor fi: x ts x Procedeul diferenelor limit (DL) se folosete la compararea 2 mediilor tot n cazul cnd 12 2 . Se aplic relaia: DL ts d Din tabele, se extrage valoarea t pentru =5%, =1% i =0,1%. s d eroarea standard a diferenei se calculeaz cu relaia:
sd s N1 N 2 , N1 N 2

unde s

s12 f 1 f1

2 s2 f2 f2

Se calculeaz diferena d x1 x 2 i se compar cu diferenele limit DL. Dac : DL 5 % >d diferena este nesemnificativ DL 1 % >d>DL 5 % diferena este semnificativ DL 0 , 1 % >d>DL 1 % diferena este distinct semnificativ d>DL 0 , 1 % diferena este foarte semnificativ d f o a r t e s e m n i f i c a t i v >DL 0 , 1 % > d d i s t i n c t >dn esemnificativ
semnificativ

>DL 1 % > d s e m n i f i c a t i v >DL 5 %

Exem plu: ntr -un arboret de larice s - au extras probe de cretere la 70 de arbori pe dou direcii (Nord i Sud) ale aceleeai seciuni transversale. S se stabileasc ce influen are asupra mediilor de selecie poziia de recoltare a probelor.

52

Poziia

Media de selecie

Dispersia s 2

Grade de libertate f=N-1

Nord Sud

15.42 13.64

4.1 3.7

70 70
2 1 2 2

69 69

Cu aj utorul testului F se verific ipoteza H 0 :

Fexp

s12 s
2 2

4.1 1.108 3.7

F t e o r e t i c =1,47
2 1 2 2

Deoarece F e x p <F t e o r e t i c se admite ipiteza potrivit creia poate calcula o va rian comun:

i se

s2

s12 f 1 f1

2 s2 f2 f2

4.1* 69 3.7 * 69 69 69

538.2 138

3.9

s
t exp

s2

3.9 1.97 x1 x 2 15.42 13.64


1 N2 1 1.97 69 1 69

1 s N1

1.78 0.335

5.313

Pentru =5 % i f=N 1 +N 2 -2=138 , se obine t t e o r e t i c =1,98 t e x p >t t e o r e t i c mediile nu sunt estima ii ale aceleeai medii a populaiei, deci poziia de recoltare a probelor de cretere influeneaz puternic valoarea medie a creterii. Prin procedeul diferenei lim it :

DL ts d unde s d DL0.05 DL0.01 t 0.05 s d t 0.01s d

N1 N 2 N1 N 2

1.97

70 70 70 * 70

1.97 *

140 4900

0.335

1.98 * 0.335 0.663 2.62 * 0.335 0.877 3.37 * 0.335 1.129


diferena este foarte semnificativ

DL0.001 t 0.001s d

x1

x2

15.42 13.64 1.78

d=1,78>1,129=DL 0 , 1 %

2 2 CAZUL 2: Compararea a dou medii n situaia cnd 1 2 n acest caz se lucreaz cu testul t. Deoarece n acest caz testul t nu poate fi aplicat n mod obinuit, se introduce o modifica re la calculul gradelor de libertate. Astfel, n locul formulei f=N 1 +N 2 -2 , intervine expresia: s12 N1 1 1 f , unde iar f 1 N1 1 i c 2 2 2 2 2 s1 s2 s2 N1 1 c c 1 2 f1 f2 N1 N 2 s1 N 2 f2 N2 1 Se parcurg urmtoarele etape: 2 - cu ajutorul testului F se verific ipoteza H 0 : 12 2

53

Fexp
2 1 2 2

s12 2 s2

dac

F e x p >F t e o r e t i c , se respinge ipoteza H 0 , deci

- se calculeaz

t exp

x1
2 sx 1

x2
2 sx 2

sx

s N

- se extrage din tabele t t e o r e t i c , n funcie de mai sus Dac t e x p >t t e o r e t i c distincte

i de f determinat

cele dou medii se refer la populaii

Exem plu: ntr -un arboret de molid s - au putut distinge dou poriuni: prima poriune, unde o perioad ndelungat s - a pr acticat punatul; a doua poriune ferit de punat, datorit unor mprj muiri efectuate din timp. S - a cerut s se stabileasc dac punatul a influenat asupra nlimii medii a arboretului. n acest scop, n cele dou poriuni au fost msurate cte 25 de nlimi la arbori cu diametre apropiate de diametrul mediu. n baza msurtorilor efectuate, au rezultat ur mtoarele valori ale indicilor statistici:
nlimea medie Poriuna punat Poriuna nepunat Dispersia s 2 N Grade de libertate f =N-1

25.7 27.5
2 1 2 2

2.35 1.05

25 25

24 24

- se verific ipoteza H 0 :
Fexp s12 s
2 2

cu testul F =5%
2 1 2 2

2.35 1.05

2.24

F t e o r e t i c =1,98 pentru

t exp

F e x p >F t e o r e t i c i se respinge ipoteza nul, deci se x1 x 2 x1 x 2 25.7 27.5 1.8 4.9 sx 2 2 2 2 2.35 1.05 0.369 s x1 s x2 s1 s2 25 25 N1 N 2

calculeaz
s N

s12 N1 s12 N1
1
2

2 s2 N2

2.35 25 2.35 1.05 25 25


1
2

0.69

iar

42 2 1 c 0.69 1 0.69 f2 24 24 - n funcie de =5% i de f=42, se extrage din tabele t t e o r e t i c =2,021 t e x p =4.9 > 2.021= t t e o r e t i c cele dou medii se refer la populaii distincte c f1
2

54

Concluzia rmne valabil i pentru

=0,1%. Prin punat, n arboret

s- au creat dou populaii distincte.


Prin procedeul diferene i lim it :

DL ts d unde s d DL0.05 DL0.01 t 0.05 s d t 0.01s d

s12 N1

2 s2 N2

2.35 1.05 25 25

0.37

2.021 * 0.37 0.75 2.704 * 0.37 1.00 3.551 * 0.37 1.31

DL0.001 t 0.001s d

x1

x2

25.7 27.5

1.8
diferena este foarte semnificativ

d=1,8>1,31=DL 0 , 1 %

4.4.6. Testarea semnificaiei diferenei din tre dou procedee sau metode prin utilizarea metodei cuplurilor n practic, frecvent este necesar s se cunoasc dac dou procedee, aplicate n aceleai condiii, conduc la rezultate diferite sub raportul preciziei i eficienei. Prin procedeu se poate nelege: dou metode de msurare, dou agregate folosite la efectuarea aceleeai operaii, dou metode de prelucrare (a solului, a arboretului) etc. Pentru a nltura inconvenientul cu privire la variabilitatea colectivitii cercetate, se adopt de la n ceput o schem sistematic de eantionaj, n cadrul creia, pentru cele dou procedee, se ridic cupluri de valori. Procednd n acest fel se elimin variabilitatea datorat unor cauze ntmpltoare i rmne de analizat numai abaterea sistematic proprie procedeelor analizate. Pentru fiecare cuplu (pereche) de valori se calculeaz diferena: di d i xi1 xi 2 i media diferenelor: d N Se calculeaz apoi variana i abaterea standard a diferenei: 2 di 2 di 2 N 2 sd sd ; sd N 1 x1 x 2 N i se compar cu t t e o r e t i c . Se calculeaz : t exp sd Dac t e x p >t t e o r e t i c diferen semnificativ ntre cele dou procedee. Exemplu: ntr- o pepinier s - au ales douzeci de parcele perechi pentru urmrirea efectului aplicrii unui ngrmnt asupra creterii n nlime a puieilor. O pereche este format din dou parcele vecine, din care una,

55

aleas prin tragere la sori, se trateaz iar cealalt rmne martor.Rezultatele obinute sunt cele din tabelul de mai jos d i 8.3 0.83 Compararea mediilor prin procedeul cuplurilor d N 10 2 nlimea medie n di 8.3 2 2 Perechea 2 d 12 . 89 d i =x 2 -x 1 di i nr. parcela tratat cu 2 N 10 sd martor ngramnt N 1 9
1 2 3 4 5 6 7 8 9 10 5.5 5.5 6.0 6.6 6.1 7.5 6.4 7.3 7.4 5.6 Total 6.2 5.6 5.6 7.7 7.7 8.6 6.4 8.0 8.4 8.0 0.7 0.1 -0.4 1.1 1.6 1.1 0.0 0.7 1.0 2.4 8.3 0.49 0.01 0.16 1.21 2.56 1.21 0.00 0.49 1.00 5.76 12.89

0.667

sd
t exp

2 sd

0.667
x2 N

0.817
0.83 10 0.817 3.21

x1 sd

pentru f=10-1=9 t 0 , 0 5 =2,262 t 0 , 0 1 =3,25 o semnificativ asupra dezvoltrii

influen, negativ, puieilor..

aplicrii

t e x p >t 0 , 0 5 ngrmntului,

4.4.7. Compararea a dou proporii (procente) Pentru stabilirea semnificaiei diferenei dintre dou proporii se utilizeaz testul u . 1 1 p1 p2 2N1 2N 2 u exp 1 1 p(1 p) N1 N 2 . unde: a1 p1 este proporia caracteristicii aflate n a 1 cazuri din N1 eantionul N 1 ; a2 p2 este proporia caracteristicii aflate n a 2 cazuri din N2 eantionul N 2 ; a1 a 2 p este proporia total. N1 N 2 Pentru N suficient de mare se poate renuna la coreciile 1/2N 1 i 1/2N 2 de la numrto rul relaiei de calcul a lui u. Dac u e x p > u t e o r e t i c diferena dintre proporii este semnificativ.

56

Dac uexp< nesemnificativ.

uteoretic

diferena

dintre

proporii

este

4.4.8. Compararea mai multor proporii Pentru stabilirea semnificaiei diferenei din tre mai multe proporii se utilizeaz testul hi ptrat ( 2 ) determinat cu relaia:
2

2 exp

pi

p (1 p ) Ni

N i ( pi p) 2 p (1 p )

ai este proporia i , dintre a i cazuri favorabile din numrul de Ni ai observaii N i , iar p , este proporia medie. Ni 2 2 Dac diferena dintre proporii este exp erimental> teoretic semnificativ. 2 t e o r e t i c se deetermin din tabele, n funcie de probabilitatea de transgresiune i de f=K-1 grede de libertate, unde K este numrul proporiilor analizate.

unde p i

4.5. TESTE DE AJUSTARE


Servesc la compararea unor disrtibuii experimentale cu distribuiile teoretice chiar la compararea ntre ele a unor distribuii experimentale. Se pornete de la ipoteza nul, potrivit creia ntre distribuiile i frecvenele comparate nu exist diferene.

Se folosete criteriul 2 . Este important ca la aplicarea acestui test s se respecte urmtoarele: - numrul observaiilor s fie suficient de mare - frecvenele teoretice s nu fie mai mici dect 5; n caz contrar se reunesc unele clase, astfel nct s se obin frecvene peste 5. - s se lucreze numai cu frecvene absolute.

57

Se calculeaz:
i n i sunt frecvenele teoretice absolute iar, n unde: n i sunt frecvenele experimenta le. Din tabele, se determin 2 t e o r e t i c , n funcie de probabilitatea de transgresiune i de numrul gradelor de libertate: f=k-n-1 unde: k reprezint numrul claselor rmase dup gruparea claselor cu frecvena sub 5, iar n reprezint numrul momentelor lu ate n considerare la calculul distribuiei teoretice. ( n=1 pentru distribuia binomial i Poisson; n=2 pentru distribuia normal; n=4 pentru distribuia Charlier; n=0 n cazul comparrii a dou distribuii empirice, deoarece nu se calculeaz nici un moment). 2 2 Dac diferena dintre distribuii este exp > teoretic semnificativ, se respinge ipoteza nul.
2 exp

ni

i n

4.6. CRITERII PENTRU ELIMINAREA OBSERVAIILOR EXTREME


Eliminarea valorilor extreme care se abat mult de la media distribuiei trebuie fcut dup cri terii statistice, eliminarea arbitrar nefiind indicat, mai ales atunci cnd numrul observaiilor este mic. Valori extreme foarte diferite de medie pot aprea ca urmare a unor greeli (de notare, de msurare) sau datorit apartenenei unor elemente la o alt colectivitate dect cea studiat. Criteriul Chouvenet , propune eliminarea variabilelor situate n afara intervalului: x kr x este media aritmetic, unde: r este eroarea probabil a unei singure msurtori ( r= 0,6745*s ), iar k este uncoeficient extras tabelar: Numrul valorilor observate 11 12-30 31-100 peste 100 Valoarea coeficientului k 3.0 3.5 4.0 4.5

Criteriul Irwin (criteriul ) Dup ce se calculeaz abaterea standard a irului cresctor, prntru valorile extreme suspecte se calculeaz:

ordonat

58

x2

x1

s s unde x 1 , x n sunt valorile extreme suspecte iar x 2 , x n - 1 sunt valori ce aparin irului. Din tabele, se extrag valorile lui t e o r e t i c : Numrul valorilor observate P 10 50 100 400 1000 valori ale lui eor etic : 0.95 1.5 1.1 1.0 0.9 0.8 0,99 2 1.6 1.5 1.3 1.2

xn

xn

exp<

teoretic teoretic

nou s 2 .

exp>

variabila dubioas se ncadreaz n irul statistic; variabila dubioas se elimin, i se calculeaz din

Criteriul Charlier Propune eliminarea valorilor situate n afara intervalului:

zq s

unde: x este media aritmetic, s abaterea standard, iar z q este un coeficient ce se determin din tabele, n funcie de probabilitatea de transgresiune acceptat i de numrul de observaii ( N ) Criteriul Romanovschi Pentru eliminarea valorilor suspecte, se propune efectuarea urmtoarelor calcule: a) Determinarea abaterii standard de selecie numai pentru N-1 mrurtori, cu relaia:
N 1 Calculul abaterii standard s pentru ntreaga colectivitate, n funcie de mrimea lui s , utiliznd relaia aproximativ: N 1 s s N Determinarea m rimii z cu relaia: xn x z exp s Determinarea lui z t e o r e t i c , din tabele, n funcie de probabilitatea de transgresiune q i de numrul de observaii ( N ). Comararea lui z c a l c u l a t cu z t e o r e t i c . Dac z c a l c u l a t > z t e o r e t i c , atunci valoarea lui x n trebuie eliminat din irul de date. s xi x ni
2

b)

c)

d)

e)

59

Criteriul Grubbs Pentru eliminarea valorilor aberante (fie x 1 , fie x n )se procedeaz astfel: a) Se ordoneaz datele irului x 1 , x 2 ,..x n n ordine cresctoare ; b) Se determin media aritmetic ( x ) i aba terea standard (s) ; c) Se calculeaz indicatorii: xn x v , pentru situaia n care x n este considerat s valoarea aberant, i x x1 v , pentru situaia n care x 1 este considerat s valoarea aberant. d) Se determin z q , din tabele , n funcie de probabilitatea de transgresiune q i de numrul de observaii ( N ). e) Se compar valorile lui v sau v cu valoarea lui z q . Dac v sau v > z q , atunci valoarea extrem trebuie eliminat. Dup ce o valoare dintr - un ir a fost eliminat printr -un criteriu oarecare, este posibil ca o nou valoare din cele rmase s par suspect. n acest caz, irul de dare rmas se supune din nou testri statistice. Dac eliminarea treptat a valorilor aberante nu mbuntete indicatorii preciziei, nseamn c materialul nu a fost omogen sau datele nu au fost culese corespunztor. n asemenea situaii rezultatele obinute nu mai pot fi considerate ca general valabile i nu pot conduce la stabilirea unor legiti cu caracter general.

CAPITOLUL 5 : ANALIZA VARIAN EI 5.1. ASPECTE TEORETICE


Asupra unei colectiviti pot aciona simultan mai muli factori care determin o anumit fluctuaie a mrimii statistice studiate, fluctuaie redat printr - o dispersie care poate fi mai mare sau mai mic. Pentru evidenierea aportului fiecrui factor la apariia fluctuaiei generale, se face apel la analiza varianei. Analiza varianei (analiza dispersional) este metoda statistic de prelucrare a datelor de observaie care depind de mai muli factori cu aciune concomitent, cu scopul de a stabili pe cei mai importani i a se estima influena lor. Analiza varianei are ca scop scindarea dispersiei totale n categorii de variaii potrivit cauzelor care le determin. Dup folosirea tuturor posibilitilor de analiz, n raport cu factorii controlai fa de dispersia total, mai rmne un rest a crui

60

cauzalitate nu se cunoate i el se poate datora aciunii unor factori neluai n considerare, unor erori de msurare. Aceast variaie rezidual ( s E 2 ) este folosit ca unitate de msur pentru examinarea semnificaiei celorlalte componente ale variaiei totale. n acest scop se folosete testul F : - dac F e x p e r i m e n t a l < F t e o r e t i c factorul studiat nu influeneaz caracteristica respectiv - dac F e x p e r i m e n t a l > F t e o r e t i c factorul studiat are o influen semnificativ. Dac prin testul F s- a constatat o influen semnificativ a unor anumii factori, se trece apoi la o analiza de detaliu, cu ajutorul testului t , stabilindu- se ntre care variane exist diferene semnificative. Analiz a este aplicabil atunci cnd: - varianele probelor luate n considerare sunt omogene - probele se formeaz randomizat (la ntmplare) - varianele reprezint probe extrase din populaii normal sau aproape normal distribuite - numrul observaiilor este suficient de mare Analiza varianei poate fi: - simpl cnd valorile individuale se grupeaz dup un singur criteriu - dubl cnd observaiile se grupeaz dup dou criterii - multipl cnd n experimente intervin mai mult e grupri.

5.2 ANAIZA SIMPL A VARIANEI


Const n compararea mediilor mai multor colectiviti statistice n ipoteza c dispersiile acestora sunt egale. Observaiile se prezint sub forma din tabelul 5.1 .
Tabelu l 5 . 1

Grupa

(varianele factorului T)

Valorile observate xij x11 x12 x13 ... X1n1 x21 x22 x23 ... X2n2

1 2

Nr. valori observate n1 n2

Suma Ti T1 T2

Media

x1
x2
xk
...

...

...

...

k Total

xk1 xk2 xk3 ... Xknk

nk N=Sn i

Tk G=ST i

...

G/N

n i numrul de repetiii pe variante n baza datelor din tabel, se calculeaz:

61

suma total a ptratelor abaterilor


Q x
2 ij

xij N
2

2 2 xij

G2 N

G 2 Q xij C N unde C este denumit termen de corecie - suma ptratelor abaterilor ntre grupe (variane) Ti 2 QT C ni - suma ptratelor abaterilor din interiorul grupelor (varianelor) QE Q QT QT 2 - variana ntre grupe (variane): sT fT QE 2 sE - variana rezidual (eroare): fE

dac se nlocuiete C

2 sT var ianta dintre grupe F - testul F: 2 varianta reziduala sE f T K 1 - numrul gradelor de libertate pentru variana ntre grupe f E N K - numrul gradelor de libertate al varianei reziduale Desfurarea calculelor este prezentat n tabelul 5.2.

Tabelu l 5 . 2
Sursa variaiei Suma ptratelor abaterilor Numrul gradelor de libertate Dispersia
s T2 QT K 1

ntre grupe n interiorul grupelor (rezidual,


rest, eroare)

QT

Ti 2 C ni

fT fE C

K 1 N
N -1

2 sT 2 sE

QE
Q

Q QT
2 x ij

2 sE

Total

s2

QE N K Q N 1

F 0.05 = F 0.01 =

Valoarea teoretic a lui F se extrage din tabele, n funcie de f 1 numrul gradelor de libertate al varianei mai mari ( f T sau f E ) i f 2 numrul gradelor de libertate al varianei m ai mici. Dac F c a l c u l a t > F t e o r e t i c ipoteza nul se respinge i, n acest caz, se trece la o analiz de detaliu privind stabilirea semnificaiei diferenelor dintre grupe , analiz ce se face prin intermediul testului t :

62

se calculeaz eroarea diferenei di ntre variane , folosind variana rezidual: 1 1 sd sE ni n j

dac numrul de observaii ( n ) este acelai pentru toate


2 2s E grupele, relaia devine: s d n - se determin diferenele limit pentru diferite probabiliti de transgresiune: DL5% t 0, 05 s d ; DL1% t 0, 01s d ; DL0,1% t 0, 001s d

unde t se determin n funcie de f=N-K grade de libertate. Dif renele d xi x j dintre media varianei i i media varianei j se compar cu diferenele limit calcula te pentru diferite probabiliti. Dac: - d< DL 5 % diferena este nesemnificativ - DL 5 % <d<DL 1 % diferena este semnificativ - DL 1 % <d<DL 0 , 1 % diferena este distinct semnificativ d>DL 0 , 1 % diferena este foarte semnificativ La analiza simp a varianei, se pot utiliza grupe cu numr egal de observaii sau grupe cu numr inegal de observaii . Exempu: n vederea extinderii molidului n afara arealului natural de vegetaie se cere s se stabileasc condiiile staionale n ca re se obin cele mai bune rezultate. Pentru aceasta s -au ales randomizat, n patru tipuri de staiuni (I, II, III, IV), cte cinci arborete arborete de aceeai vrst. Pentru fiecare arboret s - a determinat nlimea medie, nlime considerat drept criter iu de estimare a productivitii arboretului. S- au obinut urmtoarele date de teren:
Tabelu l 5 . 3

Grupa
(tipul de staiune)

nlimi medii msurate (m) 16 12 13 15 18 13 14 15 Total xij 17 11 13 15 14 13 15 13 20 11 10 12

ni 5 5 5 5 20

Sume Ti 85 60 65 70 280

Media

x
17.0 12.0 13.0 14.0 14.0

I II III IV

63

Pentru simplificarea calculelor se scade 10 din fiecare valoare observat, fr ca prin aceasta rezul tatul calculelor s se modifice cu ceva:
Tabelu l 5 . 4

Grupa
(tipul de staiune)

nlimi medii msurate (m) 6 2 3 5


2

ni 5 5 5 5 20
2 5 ; s II

Sume Ti 35 10 15 20 80

Media

si

I II III IV

8 3 4 5 Total

xij 7 1 3 5

x
7.0 2.0 3.0 4.0 4.0 5.0 1.0 3.5 2.0

4 3 5 3

10 1 0 2

2 I

x Ii

xI

12 12

N 1

0 32 4

32

20 4

0 2 12 12 12 12 4

4 1; 4

..... Se verific omogenitatea varianelor cu testul Hartley : 2 s max 5 H calc 5 2 s min 1 H t e o r e t i c = 20,6 - luat din tabele, n funcie de numrul gradelor de libertate f=5-1=4 i de p=4 (numrul de grupe comparate), pentru =0,05. Hcalculat Hteoretic ntre variane nu exist diferene semnificative Potrivit schemei de calcul, obinem: G 2 80 2 6400 C 320 N 20 20
Q
2 xij

(6 2

82

7 2 ...) 320 36 64 49 16 100 ... 4 320 116

Ti 2 35 2 10 2 25 2 20 2 QT C 320 70 cu f T K 1 4 1 3 ni 5 grade de libertate QE Q QT 116 70 46 cu f E N K 20 4 16 grade de libertate QT 70 2 23.3 variana ntre grupe: sT fT 3 Q E 46 2 sE 2.9 variana rezidual: f E 16 Q 116 6.1 variana total: s 2 f 19 Fexp
F0,05
2 sT

s 3.24

2 E

23.3 2. 9

8
F0,01 5,29

pentru f 1 =3 i f 2 =16

64

Fexp> Fteoretic diferen distinct semnificativ ntre tipurile de staiune i, n acest caz, se trece la o analiz de detaliu privind stabilirea semnificaiei diferenelor dintre grupe , analiz ce se face prin intermediul testului t :
2 2s E 2 * 2,9 1,077 n 5 - se determin diferenele limit pentru diferite probabiliti de transgresiune: DL5% t 0,05 s d 2.12 *1.077 2.27 pentru f=N-K =16 t 0 , 0 5 =2,12

- eroarea diferenei dintre variane : s d

DL1%

t 0 , 0 1 =2,921 t 0,01s d 2.921*1.077 3.13


DL0,1% t 0,001s d 4.015 *1.077 4.3

t 0 , 0 1 =4,015

- ntocmim tabelul cu difrenele d


Tabelu l 5 . 5

xi

xj :

Grupa I II III IV

x
7.0 4.0 3.0 2.0

I -

diferene fa de grupa ... II III IV 5,0 *** 4,0 ** 3,0 * 1 2 1 -

*** diferen foarte semnificativ ** diferen distinct semnificativ * diferen semnificativ

Deci, tipul I se deosebete semnificativ de tipul IV , distinct semnificativ de tipul III i foarte semnificativ de tipul II . Productivitatea mai ridicat a culturilor de molid din staiunea I este dovedit statistic. Deosebirile dintre celelalte tipuri de staiuni sunt statistic neasigurate.

5.3. FOLOSIREA TESTULUI DUNCAN


Prin acest test se poate face o comparare mai riguroas a mediilor Folosind datele din exemplul anterior, se procedeaz astfel : - Se ve rific omogenitatea varianelor cu testul Bartlett sau Hartley. Pentru a trece la etapa urmtoare varianele trebuie s fie omogene. - Se verific ipoteza nul (c nu exist diferene ntre grupele analizate) folosind testul F . - Dac F e x p >F t e o r se trece la s tabilirea semnificaiei diferenelor dintre medii o Se calculeaz eroarea standard a
2 sE 2.9 0.76 mediilor : s x n 5 Cu f=N-k=20-4=16 grade de libertate

65

o Mediile grupelor se ordonea z descresctor, dup cum urmeaz:


T ab elu l 5 . 6

Grupa

I 7.0

IV 4.0 2

III 3.0 3 2

II 2.0 4 3 2

x
rangul p fa de I rangul p fa de IV rangul p fa de III

o Din tabele, pentru f=16 grade de libertate, pentru probabilitatea de transgresiune aleas i n funcie de numrul mediilor cuprinse n serie (rang) p , se determin valorile q (amplitudini de variaie Student). Pentru exemplul c onsiderat obinem:
p q 5% q 1% 2 3.00 4.16 3 3.14 4.36 4 3.24 4.49

o Se calculeaz diferenele semnificative cele mai mici, respectiv DL5% q 5% s x i DL1% q1% s x :
p DL 5% DL 1% 2 2.3 3.2 3 2.4 3.3 4 2.5 3.4

o Diferena dintre dou medii oarecare dintr -un ir de k medii se c onsider semnificativ dac este mai mare dect DL 5 % .
T ab elu l 5 . 7

Se compar grupele I cu II I cu III I cu IV IV cu II IV cu III III cu II

Diferene dintre medii, d 7,0-2,0=5,0 7,0-3,0=4,0 7,0-4,0=3,0 4,0-2,0=2,0 4,0-3,0=1,0 3,0-2,0=1,0

p 4 3 2 3 2 2

q 5% 3.24 3.14 3.00 3.14 3.00 3.00

DL 5% 2.5 2.4 2.3 2.4 2.3 2.3

Diferena dintre medii este semnificativ semnificativ semnificativ nesemnificativ nesemnificativ nesemnificativ

Rezultatele se pot trece ntr -un tabel centralizator similar celui folosit la stabilirea semnificaiei diferenelor dintre grupe prin intermediul testului t .(tab.5.5) Testul Duncan este mai sever dect testul t, de aceea este mai folosit, n special n cazul cnd se compar un numr mare de variane.

66

5.4. ANALIZA DUBL A VARIANEI Valorile observate se grupeaz dup doi factori A i B. Metoda permite analiza influenei exercitate de cei doi factori A i B asupra caracteristicii luate n considerare (x i j ). Datele privind variaia caracteristicii x n raport cu facorii A, B se trec ntr-un tabel de forma: (tabelul 5.8)
Tabelu l 5 . 8
Variantele factorului A

Variantele factorului B 1 x11 x21 xi1 xm1 B1 xB1 2 x12 x22 xi2 xm2 B2 xB2 j x1j x2j xij xmj Bj xBj n X1n X2n Xin Xmn Bn xBn

Suma Ai A1 A2 Ai Am

Media

x
xn1 xn2 xni xnm

Variana si2

1 2
...

I
...

m Suma Bj Media Variana si2

Etape de calcul: - Se verific omogenitatea varianelor prin testul Hartley:


H exp
2 s max 2 s min Dac H e x p <H t e o r e t i c se trece la analiza dubl a varianei Se calculeaz suma ptratelor abaterilor Ai2 - ntre variantele factorului A Q A n Bi2 - ntre variantele factorului B Q B m - n interiorul grupelor QE Q Q A Q B

C C

Se Se -

pe total Q

2 x ij

C , unde C

G2 este termenul de mn

corecie. calcul eaz numrul gradelor de libertate ntre variantele factorului A f A m 1 ntre variantele factorului B f B n 1 fE m 1 n 1 n interiorul grupelor f mn 1 pe total calculeaz varian a QA 2 ntre variantele factorului A s A fA

67

2 ntre variantele factorului B s B

QB fB QE fE
2 sA 2 sE 2 sB

2 n interiorul grupelor (rezidual) s E

Se calculeaz valoarea testului F e x p : pentru variantele factorului A Fexp A pentru variantele factorului B Fexp B

2 sE Se stabilete valoarea teoretic a lui F , att pentru factorul A ct i pentru factorul B , n funcie de numrul gradelor de libertate f A sau f B i f E , precum i n funcie de probabilitatea de transgresiune. Dac Fexp>Fteoretic, att pentru A ct i pentru B, se trece la analiza de detaliu privind stabilirea semnificaiei diferenelor dintre grupe, analiz ce se face cu ajutorul diferenelor limit, analog celor prezentate la analiza simpl a varianei.

5.5. METODE NEPARAMETRICE PENTRU COMPARAREA MAI MULTOR GRUPE


Aceste metode permit o stabilire mai uoar a semnificaiei diferenelor dintre mai multe grupe. Ele pot fi aplicate i atunci cnd nu se cunoate tipul de distribuie. Prezint d ezavantajul de a fi mai puin precise dect metodele clasice (parametrice) Testul rangurilor se bazeaz pe statistica: S i2 12 2 3( N 1) N ( N 1) Ni unde: S i este suma rangurilor pentru grupa i N i este numrul observaiilor din grupa i N este numrul total de observaii Rangul se stabilete astfel : - se face o clasificare a observaiilor dup mrimea lor - cu 1 se noteaz observaia cea mai mic, cu 2 observaia urmtoare ca mrime, cu N se noteaz cea mai mare valoare. -n cazul n care n seria de observa ii se ntlnesc dou sau mai multe valori identice, rangul se va stabile calculnd medii aritmetice de rang. 2 2 c a l c u l a t se compar cu t e o r e t i c , extras din tabele n funcie de probabilitatea acceptat p i f=K-1 , unde K este numrul grupelor comparate.

68

Exemplu: S se stabileasc dac speciile de molid, brad i fag dintr -un arboret amestecat i plurien se deosebesc semnificativ ntre ele din punct de vedere al nlimilor medii. n acest scop au fost murate nlimi la arbori cu diametrul apropriat de di ametrul indicator de 50 cm.(tabelul 5.9).
Tabelu l 5 . 9

Molid 24.5 25.0 26.2 27.3 27.5 28.3 28.4 28.7 29.0 -

nlimile (m) Brad 25.3 25.7 25.9 26.3 26.9 27.0 27.2 27.5 28.0 29.0 Total Si

Fag 23.0 23.7 24.1 25.5 25.8 26.0 26.0 26.1 26.1 26.3

Molid 4 5 15 21 22.5 25 26 27 28.5 174.0

Ranguri Brad 6 8 10 16.5 18 19 20 22.5 24 28.5 172.5

Fag 1 2 3 7 9 11.5 11.5 13 14 16.5 88.5

2 calc

12 N ( N 1)

S i2 Ni

3( N 1)

12 174.0 2 29(29 1) 9

172.5 2 10

88.5 2 10
2 tab=

3(29 1) 8.24

pentru f=3- 1=2 grade libertate i


2calc> 2tab

=0,05 , din tabele

5,99

ipoteza nul se respinge, speciile se deosebesc semnificativ ntre ele din punct de vedere al nlimilor CAPITOLUL 6 : ANALIZA CORELAIEI 6.1. ASPECTE TEORETICE
Prin analiza varianei se pune n eviden influena unor factori asupra unei caracteristici studiate dar nu se determin gradul acestei influene, nu se spune nimic cu privire la forma legturii puse n eviden. n scopul evidenierii acestor aspecte se apeleaz la teoria corelaiei . Cercetarea este interesat s cunoasc, prin intermediul teoriei corelaiei, dependena care exi st ntre dou sau mai multe variabile. Analiza corelaiei este o metod prin care se cerceteaz i se exprim existena, natura i intensitatea legturilor dintre variabile, prin intermediul unor indicatori statistici. Distribuiile bidimensionale au dou variabile: - x , variabila independent, stabilit arbitrar i considerat ca nefiind afectat de erori - y , variabila dependent care se obine prin msurtori i care este afectat de erori.

69

Ca variabil independent se alege ntotdeauna acea mrime care se determin uor i direct iar ca variabil dependent se alege mrimea care se stabilete indirect, prin utilizarea unor instrumente. De exemplu: diametrul de baz d 1 , 3 - variabila independent iar nlimea arboretului h variabila dependent. Relaiile dint re dou variabile pot fi : r2 - relaii funcionale y f ( x) , de exemplu : S - relaii statistice (corelaii) , la care pentru aceeai valoare a lui x , pot fi valori diferite pentru y , ca de exemplu : pentru acelai diametru ( x ) putem avea nlimi diferite ( y ). n cazul relaiilor statistice corespondena nu are loc de la valoare la valoare ci de la valoare la distribuie, deci fiecrei valori x i corespunde o anumit distribuie cu caracteristicile ei statistice (medie, disper sie, etc.), caracteristici ce se modific odat cu x (pentru fiecare x distribuia este alta). Corelaia poate fi : simpl (cnd se refer la dou variabile x i y ) sau multipl (cnd asupra lui y influeneaz 2 sau mai multe caracteristici). Corelaia poate fi, de asemenea, pozitiv (direct) sau negativ (invers), liniar sau curbilinie.

6.2. M ETODE DE CONSTATARE A CORELAIILOR


Existena corelaiilor poate fi identificat cu ajutorul reprezentrilor grafice (pentru N<100) sau cu ajutorul tabelei de co relaie (pentru N>100). Cu ct axa mic a elipsei de corelaie este mai mic comparativ cu axa mare, cu att corelaia este mai strns. Forma norului de puncte ofer informaii asupra tipului corelaiei. Dac norul de puncte este foarte dispersat, nseam n c nu exist corelaii ntre cele dou variabile. Tabela de corelaie are dou intrri: una pentru variabila independent x, alta pentru variabila dependent y. n tabel se trec datele de baz, grupate pe clase. Sumele coloanelor reprezint distribuia marginal a variabilelor. Fiecare distribuie marginal are o medie i o abatere standard proprie.

70

y/x 10 10.5 11 11.5 12

10

Tabela de corelatie 12 14

ny

6.3. COVARIANA
n cazul a dou nsuiri corelate avem de a face cu dou distribuii de frecvene: o distribuie a variabilei x , caracterizat printr - o varian s 2 x , i o distribuie a variabilei y caracterizat prin variana s 2 y . Se poate vorbi ns i de o varian comun s 2 x y denumit covarian , care reprezint gradul de mprtiere a celor dou variabile x i i y i fa de mediile respective i este dat de relaia: xi x y i y 1 2 2 s xy s xy xi y i xy sau n 1 n Pentru valori grupate se folosete relaia: 1 1 2 s xy n ij x i y j ni xi nj yj n 1 n
2 n toate situaiile: s xy

nx

sx sy .

Covariana este un indice al corelaiei care indic i sensul acesteia. Valoarea covarianei trebuie s se ncadreze n intervalul dintre valorile celor doua variane, adic
2 s xy 2 s x2 , s y .

71

6.4. COEFICIENTUL DE CORELAIE


Coeficientul de corelaie teoretic
x xy y

exp rim

gradul

legturii liniare dintre cele dou variabile. Datorit faptului c de cele mai multe ori

nu se cunoate, n s xy locul lui se folosete coeficientul de corelaie empiric r determinat sx s y pe baza probei extras din populaie. Coef icientul de corelaie indic gradul de mprtiere al variabilei y n jurul dreptei de regresie, rednd totodat i intensitatea legturii dintre cele dou variabile. 2 2 2 r 1, 1 . Valoarea lui r , n mrime Deoarece xy x y a bsolut, indic intensitatea corelaiei. Cu ct r este mai apropiat de +1 sau 1 cu att legtura ntre variabile este mai strns. Pentru r= 1 legtura este funcional. Semnul plus indic o corelaie direct iar semnul minus o corelaie invers. Indicaiile coeficientului de corelaie sunt valabile numai n cazul distribuiilor bidimensionale normale sau apropiate de aceasta. Pentru calculul coeficientului de corelaie se calculeaz abaterile s xy standard s x , s y i covariana s x y , dup care se aplic formula: r . sx s y Calculul se mai poate face, pentru valori negrupate n clase, cu relaia: N xy x y r , 2 2 2 2 N x x N y y iar pentru valori grupate n clase cu relaia:
N r N
x x y 2 2 x

xyn xy
x

xn x
y

yn y
2

nx x

nx x

N
y

ny y

2 y

ny y

Se pot utiliza i momentele centrate de ordin II ( m x , m y , m z ) pentru seriile x,y,z : mz mx m y r 2 mx m y Seria z se obine fcnd sumele pe diagonal n tabelul de corelaie. Cu programele de calcul statistic sau tabelar coeficientul de corelaie se calculeaz direct. De exemplu, n programul EXCEL se

72

utilizeaz funcia CORREL a foii de lucru sau Correlation din pachetul Data Analys (analiz date) - meniul Tools (instrumente). Exemplu: nrt-un arboret de salcm s - au msurat creterile radiale pe ultimii 10 ani i diametrul de baz la 20 de arbori. S se stabi leasc intensitatea corelaiei folosind coeficientul de corelaie r , deoarece din cercetri anterioare se cunoate c regresia dintre creterea radial i diametru este liniar.
Nr cr t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
TOTAL Diamet Creter ea rul cm radial

xy 200 112 162 98 240 336 242 84 112 136 56 468 180 260 144 72 140 112 384 308 3846

x2 400 256 324 196 400 576 484 196 256 289 196 676 400 400 324 144 400 256 576 484 7233

y2 100 49 81 49 144 196 121 36 49 64 16 324 81 169 64 36 49 49 256 196 2129

mm y

20 16 18 14 20 24 22 14 16 17 14 26 20 20 18 12 20 16 24 22 373

10 7 9 7 12 14 11 6 7 8 4 18 9 13 8 6 7 7 16 14 193

Utiliznd funcia CORRELa foii de lucru, din programul EX CEL: r = 0,908089872

Utiliznd instrumentul Correlation din pachetul Data Analys (analiz date)- meniul Tools (instrumente) vom obine: Diametrul cm Creterea x radial mm y Diametrul cm x 1

Creterea 0,908089872 radial mm y

r N x

N
2

xy x
2

x N y
2

y y
2

20 * 3846 373 * 193 20 * 7233 373 2 20 * 2129 193 2

0,908

73

6.5 E XAMINAREA SEMNIFICA IEI COEFICIENTULUI DE CORELAIE


Coeficientul de corelaie r , al probei, estimeaz coeficientul de corelaie al populaiei din care a fost extras proba. Este necesar s se examineze dac valoarea calculat a lui r este real sau se datorete doar unor e rori de eantionaj. Verificarea se face printr -un test de conformitate, verificnd ipoteza nul H 0 : =0 . a) n toate cazurile cnd numrul de msurtori este mic (N <30) i r este apropiat de 1 , se folosete transformarea propus de Fisher: 1 1 r z ln 2 1 r n programul EXCEL se poate utilizeaz funcia Fisher a foii de lucru. Variabila z are proprietatea de a se distribui normal, spre deosebire de valorile lui r , care uneori prezint distribuii mult diferite de cea normal. Dup transformarea de m ai sus, se calculeaz statistica u : z z u , unde s z reprezint eroarea valorii z sz 1
N 3 Dac u c a l c u l a t < u t a b e l a r pentru probabilitatea de transgresiune acceptat, se accept ipoteza nul. Corelaia dintre variabile nu poate fi dovedit. Dac u c a l c u l a t >u t a b e l a r corelaia este dovedit. 1 n funcie de limitele de ncredere a valorii z: z us x z u 1 N 3 se pot stabili i limitele de ncredere pentru coeficientul de corelaie r . b) Cnd numrul de msurtori este mic (N <30) i r este apropiat de 0, se aplic testul t : r t exp N 2 1 r2 pentru f=N-2 grade de libertate. Dac t e x p <t t a b e l a r atunci corelaia este nesemnificativ. c) Dac numrul de msurtori este mare (N >30) i r este apropiat de 0, se aplic testul u: 1 r2 r u exp , unde s r sr N Dac u e x p <u t a b e l a r atunci se accept ipoteza nul, corelaia nu este semnificativ.

74

d) Dac numrul de msurtori este mare (N >30) i r este apropiat de 1, se poate folosi testul F a lui Fisher: ( N 2) r 2 Fexp 1 r2 Dac F e x p <F t a b e l a r corelaia este nesemnificativ.

6.6. C OMPARAREA A DOI COEFICIENI DE CORELAIE


Pentru examinarea semnificaiei diferenei dintre doi coeficieni de corelaie, r 1 i r 2 , se utilizeaz un test de egalitate ( testul t ), a valorilor transformate z : z1 z 2 1 1 s z21 s z22 t exp , unde s d N1 3 N 2 3 sd t t a b e l a r se stabilete n funcie de numrul gradelor de libertate f=N1+N26 i de probabilitatea de transgresiune . Dac t e x p <t t a b e l a r atunci diferena dintre r 1 i r 2 este nesemnifi cativ. La compararea unui coeficient de corelaie empiric r cu un coeficient de corelaie teoretic , se utilizeaz formula: zr z t exp , pentru f=N-3 grade de libertate. 1 N 3 Pentru un numr mare de observaii t=u . Dac t e x p <t t a b e l a r atunci difer ena dintre r i este nesemnificativ.

6.7. CORELAREA RANGURILOR


Metodele neparametrice fac abstracie de condiia cunoaterii anterioare a tipului de distribuie, condiie obligatorie n cazul metodelor parametrice, care nu pot fi aplicate dect pent ru distribuii bidimensionale normal distribuite. De aceea, metodele neparametrice se aplic atunci cnd avem indicii c ntre variabila dependent i cea independent exist o legtur de corelaie dar nu cunoatem tipul de distribuie. De asemenea, metod ele neparametrice se pot aplica n cazul caracteristicilor calitative, deoarece nu opereaz cu cu valorile reale a le caracteristicilor ci cu rangurile acestora. Coeficientul de corelaie a rangurilor indic intensitatea corelaiei i se calculeaz, dup Spearman , cu relaia: 6 d2 rs 1 , unde d reprezint diferena de rang. N ( N 2 1) Rangul se stabilete astfel: se clasific observaiile dup mrimea lor, att pentru irul de observaii x ct i pentru irul de observaii y . Cu

75

1 se noteaz observaia ce a mai mare, cu 2 observaia urmtoare ca mrime i aa mai departe. Rangul N l are cea mai mic valoare. n cazul cnd exist mai multe observaii cu aceeai mrime, se calculeaz medii aritmetice de rang. De exemplu, dac pe poziia 3,4,5 i 6 observaii le au aceeai mrime, la toate li se atribuie rangul 4,5. Suma rangurilor, att pentru variabila x ct i pentru variabila y , va fi: N ( N 1) xi yi , unde x i , respectiv y i reprezint rangurile 2 n cazul unei concordane perfecte ntre rangurile ce lor dou variabile, suma ptratelor diferenelor dintre ranguri este nul ( d 2 =0 ) iar r s =1 . Pe msur ce diferenele dintre ranguri sunt mai mari, r s va scdea. Semnificaia corelaiei de rang se stabilete comparnd valoarea obinut cu valorile limit, alese n funcie de numrul gradelor de libertate f=N-2 i probabilitatea de transgresiune . Exemplu: La 10 arborete de stejar din lstari, toate de aceeai vrst i situate n aceleai condiii staionale, s - au determinat consistena i procentul arbori lor n curs de uscare. S se determine dac corelaia ntre consisten i procentul de uscare este semnificativ. Datele sunt urmtoarele:
Nr.c Consistena arboretelor rt Procentul arborilor n curs de uscare 22 26 24 26 25 20 18 17 10 15 total RANGUL
dup consisten

RANGUL
dup procentul

Diferena de rang d 5 7,5 3,5 6 3 -1,5 -2,5 -5 -8 -8 0 d


2

arborilor n curs de uscare

1 2 3 4 5 6 7 8 9 10

0,3 0,4 0,5 0,5 0,6 0,7 0,7 0,8 0,9 1,0

10 9 7,5 7,5 6 4,5 4,5 3 2 1 55

5 1,5 4 1,5 3 6 7 8 10 9 55

25 56,25 12,25 36 9 2,25 6,25 25 64 64 300

6 * 300 1800 1 1 1,82 0,82 10(100 1) 990 N ( N 1) Pentru f=10- 2=8 , din tabele, se ia coeficientul limit : 0,632 pentru =5% , 0,765 pentru =1% i 0,872 pentru =0,1%. Din comparaie, rezult c, pentru o probabilitate de transgresiune de 1%, corelaia ntre procentul de uscare i consistena arboretelor este semnificativ. rs 1
2

76

BIBLIOGRAFIE

1. F.Wilcoxon: Individual comparisons by ranking methods, BiometricsBul.,180-83,1947 2. Hollander, Wolfe DA; Non methods, J.Wiley,New York, 1973 parametric statistical

3. Vaduva, I. (1970) Analiz dispersional . Bucuresti, Ed. Tehnic 4. Saporta, C. (1990) Probabilit, Analyse des donnes et statistique.Paris, Ed. Technip 5. M. Iosifescu, Gh. Mihoc, R. Teodorescu, Teoria probabilitatilor si statistica matematica, Ed. Tehnica, Bucuresti, 1966 6. M. Tiron, teoria erorilor de masurare si metoda celor mai mici patrate, Ed. Tehnica, Bucuresti, 1972 7. M. R. Spiegel, Probability and statistique, McGraw Hill, New York, 1980

77