Sunteți pe pagina 1din 77

MOIU PETRIC TUDOR

BIOSTATISTIC
NOTE DE CURS

ORADEA 2008

1
CUPRINS

CAPITOLUL 1:
INTRODUCERE1

CAPITOLUL 2:
DISTRIBUII EXPERIMENTALE ........................ 3
2.1. TERMINOLOGIE STATISTIC ..............3
2.2.NREGISTRAREA I PRELUCRAREA PR IMAR A
INFORMAIILOR.............. ................................................. 4
2.2.1.SEPARAREA DE POP ULAII OMOGENE... 4
2.2.2.NREGISTRAREA OBSERVAIILOR N TABELE ....4
2.2.3.FRECVENELE DISTR IBUIILOR EMP IRICE... 5
2.2.4.REPREZENTRI GRAFICE ALE DISTRIBUIILOR
UNIDIMENS IONALE... 6
2.3. INDIC II DISTRIBUIILOR EXPERIMENTALE .7
2.3.1.PARAMETR I POPULAIEI I INDIC II PROBEI............. ..............7
2.3.2.MOMENTE............................................................................... ..8
2.3.3.VALOR I MEDII...................................................................... ..10
2.3.4.INDIC II DISPERSIEI ( INDICATORII VARIABILIT II)............13
2.3.5.ASIMETR IA I EXCESUL DISTRIBUIILOR EXPERIMENTALE
(INDICATORII FORMEI) 15
2.4.EROR I DE REPREZENTATIVITATE...................................... ........17

CAPITOLUL 3 : DISRTIBUII TEORETICE CU AP LICABILITATE N


SILVICULTUR.............................................................................. .18
3.1. INTRODUCERE....................................................................... ...18
3.2. NOIUNEA DE PROBABILITATE....................................... ........19
3.3. DISTR IBUIA BINOMIAL 19
3.4. DISTR IBUIA POISSON............................................................ .22
3.5. DISTR IBUIA NORMAL.................................... ...................... 24
3.6. DISTRIBUIA CHAR LIER (TIP A)......... 29
3.7. SISTEMUL DISTRIBUIILOR PEARSON..................... ...............32
3.8. DISTR IBUIA BETA .32
3.9. DISTR IBUIA MEYER .35

CAPITOLUL 4 : EXAMINAREA SEMNIFICAIEI ....38


4.1. GENERALITI. 38
4.2. INTERVALUL DE NCREDERE AL MEDIEI AR ITMETICE 40
4.3. TESTE DE CONFORMITATE ..... 41
4.3.1.EXAMINAREA DIFERENEI DINTRE O MEDIE
EXPER IMENTAL I O VALOARE D AT..... 41
4.3.2.EXAMINAREA SEMN IFICAIEI VAR IANEI I A DIFERENEI
DINTRE VAR IANE..... 43
4.4. TESTE DE EGALITATE................................... ........................... 44
4.5. TESTE DE AJUSTARE ......................... 54

2
4.6. CRITER II PENTRU ELIMINAREA OBSERVAIILOR EXTREME ..55

CAPITOLUL 5 : ANALIZA VAR IANEI ......57


5.1. ASPECTE TEORETICE.................................... ........................... 57
5.2 ANAIZA S IMPL A VAR IANEI...................... ........................... 58
5.3. FOLOS IREA TESTULUI DUNCAN...................................... ........62
5.4. ANALIZA DUBL A VAR IANEI .................. 64
5.5.METODE NEPARAMETR ICE PENTRU COMPARAREA MAI
MULTOR GRUPE............................................................ ..................65

CAPITOLUL 6 : ANALIZA CORELAIEI .... 66


6.1. ASPECTE TEORETICE................................... ............................ 66
6.2. METODE DE CONSTATARE A CORELAIILOR...................... ...67
6.3. COVAR IANA............ .................................... ........................... 68
6.4. COEFIC IENTUL DE CORELAIE.................... ........................... 69
BIBLIOGRAFIE ..73

3
CAPITOLUL 1: INTRODUCERE
Biostatistica se ocup cu gruparea, analiza i interpretarea datelor
referitoare la fenomenele de mas, precum i cu unele previziuni privind
producerea lor viitoare.
Biostatistica (biostatistica forestier) este o ramur a statisticii,
denumit aa datorit faptului c se studiaz, interpreteaz i analizeaz
date din domeniul biologic (forestier), domeniu cu anumite particulariti.
n silvicultur, aproape toate procesele au un caracter
probabilistic. ncepnd cu tabelele de producie i ncheind cu indicii
preurilor pentru lemnul pe picior, modelele statistice sunt larg folosite.
Modelele statistice sunt folosite pentru :
Clasificarea sistemelor biologice , de la specie la ecosistem
(analiza topologic) ;
Estimarea indirect a unei caracteristici dificil de msurat :
concentrnd eforturile de analiz pe un eantion de date
complete, ce includ i variabila dependent dificil de
msurat n condiii obinuite, se obine o funcie matematic
ce permite, pe viitor, estimarea caracteristicii rezultative, pe
baza caracteristicilor explicative, mai uor de msurat ;
Aproximarea probabilitii producerii unui fenomen (un atac
de insecte, o dobortur de vnt, sau chiar adjudecarea unei
partizi ntr-o licitaie) tiute fiind condiiile n care se
produc, de regul, aceste fenomene ;
Aproximarea preurilor posibile de adjudecare a unor partizi
sau loturi de lemn, n funcie de caracteristicile acestora,
particularitile pieei i condiiile de exploatare ;
Estimarea impactului economic i/sau ecologic al unor
schimbri sau tendine manifestate la nivel macroeconomic ;
Compararea a dou sau mai multe valori medii, referitoare la
tot attea stri n care un sistem poate fi adus prin mijloace
tehnice sau ca urmare a modificrii factorilor naturali de
producie. (de exemplu starea la c are este adus un arboret
prin aplicarea unor rrituri de intensitate diferit) ; etc
Dup scopul cunoaterii, statistica, ca disciplin tiinific, are
urmtoarele subdiviziuni: statistica descriptiv, statistica inferenial,
statistica analitic.
Statistica descriptiv (formal), care are ca obiectiv culegerea
datelor statistice i prelucrarea acestora cu ajutorul sistemului de
indicatori statistici
Statistica inferenial , aprut abia dup descoperirea legilor
probabilistice i constituirea teoriei pr obabilitilor ca tiin, are ca
obiectiv cunoaterea caracteristicilor unei colectiviti oarecare pornind
de la cunoaterea unei colectiviti pariale i presupune msurarea
incertitudinii rezultatelor i calcularea riscurilor pe care le implic
luarea unei decizii fundamentate pe baza unei informaii ce nu poate fi

4
exhaustiv. Principalele probleme ale inferenei statistice sunt estimarea
parametrilor distribuiei unei colectiviti i testarea ipotezelor statistice.
Statistica analitic urmrete descoperirea a ceea ce este
permanent, esenial, legic , n variaia proceselor stocastice i msurarea
influenei factorilor care le determin variaia n timp, n spaiu,i din
punct de vedere calitativ. n acest scop se folosesc, n principal, analiza
de regresie, analiza de corelaie i analiza dispersional .

Modelarea statistic a fenomenelor


Fazele mai importante ale unei investigaii i modelri statistice
sunt :
1. Observaia
2. Formularea ipotezelor privind caracteristicile identificate
n timpul observaiei
3. Predicia, adic formularea unor noi elemente de
cunoatere referitoare la caracteristici
4. Verificarea prediciilor

Observaii statistice pot fi :


cantitative-se obin valori prin msurtori sau numrtori
(diametre, nlimi, nr.de arbori/ha, nr.ou/cuib , etc.).
calitativese refer la caracteristici nemsurabile (culoarea
cojii, gradul de infestare, etc), sau la nregistrri de atribute
alternative (mascul -femel, sntos-bolnav, etc).
Recoltarea datelor se poate realiza prin simpla observare sau prin
efectuarea de experiene.

Variabilitatea observaiilor
Valorile observaiilor fcute asupra anumitor caracteristici
atributive prezint o anumit fluctuaie, denumit n statistic variaie.
Variaia poate fi:
continu, cnd caracteristica cercetat se ex prim n
numere fracionare (diametrul unui arbore)
discontinu (discret), cnd caracteristica poate fi
exprimat numai n numere ntregi (nr.arbori/ha,
nr.ou/cuib),
alternativ, cnd exist numai dou posibiliti de variaie
(apt-inapt, mascul -femel)
Dup natura cauzelor pe care o provoac, variaia poate fi
sistematic (determinat de cauze cunoscute, controlabile)
sau
ntmpltoare, accidental (determinat de cauze
necunoscute, necontrolabile).

5
Populaia statistic
O populaie (colectivitate) stati stic reprezint o totalitate de
observaii efectuate asupra unor uniti relativ omogene, avnd un anumit
numr de nsuiri eseniale comune.
n domeniul silviculturii de cele mai multe ori se efectueaz observaii
numai asupra unui numr restrns de unit i ale populaiei, respectiv
asupra unuor sondaje sau probe (colectivitate de selecie, eantion).
Prin intermediul probelor se tinde spre cunoaterea statistic a ntregii
populaii. Pentru aceasta proba trebuie s fie reprezentativ, s fie
aleas dup principii obiective.

CAPITOLUL 2: DISTRIBUII EXPERIMENTALE

2.1. TERMINOLOGIE STATISTIC


Colectivitatea statistic reprezint o mulime format din uniti
statistice calitativ omogene ce prezint una sau mai multe nsuiri
comune.
- colectivitatea general (populaie) este constituit dintr -un numr
finit sau infinit de uniti statistice. Ea poate fi unidimensional, cnd
n atenia observatorului se afl o singur caracteristic de studiat, sau
multidimensional , cnd n atenia observatorului se afl dou sau mai
multe caracteristici.
- colectivitatea de selecie (eantion, sondaj) reprezint numai o parte
dintr-o populaie, extras dup anumite criterii n vederea cercetrii
uneia sau mai multor caracteristici.Un eantion este rep rezentativ dac
unitile de eantionaj sunt alese randomizat i dac are un volum
minim care s poat asigura precizia necesar.

Unitatea statistic (unitatea de nregistrare, de observare ) constituie cea


mai mic entitate luat n considerare, n raport cu natura colectivitii i
scopul observrii.Unitatea statistic poate fi simpl sau complex
(format din mai multe uniti simple) .
irul statistic este reprezentat de totalitatea valorilor observate,
corespunztor unitilor ce alctuiesc unitatea sta tistic cercetat, scrise
ntr-o anumit ordine.
Seria statistic reprezint ansamblul a dou iruri de date corespondente. n
primul ir sunt nscrise valorile caracteristicii de grupare, iar n cel de al
doilea ir valorile caracteristicii cu care este c orelat sau frecvenele
statistice.

6
2.2. NREGISTRAREA I PRELUCRAREA PRIMAR A
INFORMAIILOR

2.2.1. Separarea de populaii omogene


n cazul populaiilor eterogene, nainte de a trece la nregistrarea
i prelucrarea observaiilor, se impune separarea de populaii omogene,
constituite din uniti identice din punct de vedere calitativ (
stratificarea).
Ex em p le : - to tal it at ea o b s er va ii lo r e fec t ua t e a s up ra d i a met relo r l a
ar b o r i d e ac eea s i sp e c ie, vr s t, p ro ve n ie n i cre s c u i n co nd i i i
st a io nal e id e nt ice.
- to ta li tat ea o b ser v a i ilo r e fec t ua te as up r a n l i mi i p u ie ilo r
d e acee as i sp eci e, vr st i p ro ve n ie n , p l a nta i n co nd i ii sta io n ale
id e nt ice .
Separarea de populaii omogene (stratificarea) este necesar pentru
a putea interpreta ntreaga populaie studiat, n raport cu tipurile ei
calitative.

2.2.2. nregistrarea observaiilor n tabele


Rezultatele observrii se inregistreaz, pe msura obinerii lor,
ntr-un tabel denumit tabelul datelor iniiale (carnet de inventar, fie de
observare).
Exemple: carnetul de inventar la punerea n valoare a masei lemnoase pe
picior (tabelul 2.1); carnetul de inventar al creterilor n diametru
msurate (tabelul 2.2)
Tabelu l 2 . 1

Nr. curent Specia Diametrul Clasa de calitate


1 Fa 20 I
2 Ca 22 II
3 Fa 36 IV

Tabelu l 2 . 2
Nr. crt diametrul Cresterea in diametru
1 27.3 9.1
2 18.2 7.3
3 15.7 5.2
Pentru a se putea prelucra statistic datele iniiale, este necesar
gruparea valorilor n clase (despuierea) (tabelele 2.3, 2.4).

7
Tabelu l 2 . 3

specia : FAG
clasa de calitate
categorii
I II III IV TOTAL
de
Nr Nr Nr Nr ARBORI
diametre Punctaj Punctaj Punctaj Punctaj
arbori arbori arbori arbori
8
10
12
14
16
18
20
22
24

Tabelu l 2 . 4
Intervalul de Centrul clasei Frecvene
Punctaj
clas n mm mm absolute
0.6 - 1,5 1 III 3
1.6 - 2,5 2 IIII IIII IIII II 17
2,6 - 3.5 3 IIII IIII III 13
.

n urma gruprii datelor iniiale s -a obinut un ir statistic.La un


ir statistic distingem: limitele clasei, centrul clasei, intervalul de clas
(mrimea clasei), amplitudinea variaiei.

2.2.3. Frecvenele distribuiilo r empirice


Distribuia empiric este o punere fa n fa a intervalelor de
clas ale variabilei(sau numai a centrelor claselor) cu numrul de
observaii cuprinse n fiecare clas.
Frecvena absolut = numrul de observaii corespunztoare
fiecrei clase .
Frecvena absolut cumulat = frecvenele absolute ale claselor,
cumulate succesiv.
Frecvena relativ = raportul dintre frecvena absolut i numrul
total de observaii.
Frecvena relativ cumulat =sumele succesive ale frecvenelor
relative.

8
Tabelu l 2 . 5
f recventa f recventa
categorii de frecventa frecventa
absoluta relativa
diametre absoluta relativa
cumulata cumulata
8 3 3 0.051 0.051
10 5 8 0.085 0.136
12 6 14 0.102 0.237
14 10 24 0.169 0.407
16 12 36 0.203 0.61
18 9 45 0.153 0.763
20 8 53 0.136 0.898
22 4 57 0.068 0.966
24 2 59 0.034 1
TOTAL 59 1.000

2.2.4. Reprezentri grafice ale distribuiilor unidimensionale


Scopul reprezentrii grafice este de a pune n eviden mai clar
caracteristicile de baz ale unei distribuii experimentale, de a o feri o
imagine mai sugestiv asupra modului de structurare al colectivitii.
n cadrul reprezentrii grafice, valorile variabilei observate (X) se
trec pe abscis, iar pe ordonat se trec frecvenele (absolute sau relative,
simple sau cumulate).
ntocmirea graficului presupune:
alegerea hrtiei
alegerea scrilor pentru axele de coordonate
marcarea diviziunilor pe axele de coordonate
nscrierea valorilor centrale n dreptul diviziunilor
stabilirea legturilor ntre valorile de pe abscis i cele de pe
ordonat
trasarea curbei prin punctele reprezentetive
ntocmirea legendei
precizarea sursei de prelucrare a delor i titlul graficului.
La calculator, graficele se ntocmesc mult mai rapid i uor, ntr -o
mare varietare de tipuri, folosind programe speciale (ca de exemplu
Excel).
Tipuri de reprezentri:
Diagrama bar Diadrama bar a frecvenelor absolute
histograme
poligoane 14
12 frecvene absolute
diagrame
numrul de arbori

10
8
6
4
2
0
8 10 12 14 16 18 20 22 24
9
categoria de diametre
Histograma frecvenelor absolute
Poligonul frecvenelor absolute
frecvene absolute
16
14 14

numrul de arbori
12
12
10
frecvene absolute

10 8
6
8 4
2
6 0
8 10 12 14 16 18 20 22 24
4
Poligonul frecvenelor cumulate
categoria de diametre
2
70
0
60 frecvene
8 10 12 14 16 18 20 22 24 Diagrama de structur
cumulate
50 categorii de diametre 8
numr de arbori

10
40 7% 3% 5% 8%
12
30 14%
10% 14
20 16
10
18
15%
20
0 17%
8 10 12 14 16 18 20 22 24 22
21%
categorii de diametre 24

2.3 INDICII DISTRIBUIILOR EXPERIMENTALE

2.3.1 Parametri populaiei i indicii probei


Indicii distribuiilor experimentale se refer la
poziia i structura di stribuiei (mediile, mediana, modulul)
variabilitatea observaiilor (dispersia, abaterea standard,
amplitudinea variaiei, coeficientul de variaie, etc.)
forma distribuiei (indicele asimetriei, indicele excesului)
Indicii distribuiilor experimentale (pr obei) sunt estimaii ale
parametrilor populaiei (indicii distribuiilor care s -ar obine dac s -ar
observa ntreaga populaie)
Pentru a diferenia indicii distribuiilor experimentale de
parametri se folosesc notaii diferite, respectiv litere latine pentru indicii
distribuiilor experimentale i litere greceti pentru parametri
populaiilor.
Simbolurile principalilor parametri i indici ai distribuiilor
statistice:

10
Simboluri pentru Simboluri pentru
Denumirea caracteristicii
populaii probe
M edia aritmetic x
2
V ariana ( disp ersia) s
Abaterea standard s
Coef icientul de variaie s%
Covariana xy s xy
I ndicile asimetriei A
I ndicele excesului E
Coef icientul de corelaie r
Coef icientul de regresie b

2.3.2. Momente
Momentele uureaz calculul indicilor, mai ales pentru seriile
statistice formate dintr -un mare numr de observaii.
Momentele reprezint medii aritmetice ale abaterilor de la un
anumit punct ales ca origine, ridicate la diferite puter i. Dac se alege ca
origine media aritmetic, se obin momente centrate.Dac originea se
alege arbitrar, rezult momente obinuite.
Momentele obinuite se calculeaz cu formula( intervalul de clas
=1):
k
xi x0
mk
N
iar cele centrate dup expresia:
k
xi x
mk
N
unde :
m k reprezint momentul obi nuit de ordin k
m k momentul centrat de ordin K
x i valorile observate
x - media aritmetic a distribuiei
x 0 valoarea aleas arbitrar
N- numrul total al observaiilor
Pentru valori grupate n clase ( h= intervalul de clas), avem:
k k
xi xo xi x
h h
mk ' mk
N N

Relaiile dintre m i m sunt urmtoarele:


m o = m o = 1

11
m 1 =0
m 2 =m 2 -m 1
m 3 =m 3 -3m 2 m 1 +2m 1 3
m 4 =m 4 -4m 3 m 1 +6m 2 m 1 2 -3m 1 4
iar pentru verificare se folosesc formulele :
m 3 =m 3 -3m 1 m 2 -m 1 3
m 4 =m 4 -4m 3 m 1 +6m 2 m 1 2 -3m 1 4
Tabelu l 2 . 6
Calculul momentelor prin procedeul
sumelor. categorii de Frecvena b1 b2 b3
Este un procedeu indirect, mai diametre absolut 49 39 17
8 3 3 3 3
simplu in cazul calculului fcut fr 10 5 8 11 14
calculatoare. 12 6 14 25 -45
Este bazat pe urmtoarele 14 10 24 - -
formule: 16 12 - - -
d1 S 1 2S 2 18 9 23 - -
m1' ; m 2' ; 20 8 14 22 -
N N 22 4 6 8 10
d 1 6d 2 6d 3 24 2 2 2 2
m 3' ; 45 32 12
N TOTAL 59
a1 a2 a3
S 1 14S 2 36S 3 24S 4 -4 -7 -5
m 4' d i = ai bi =
N d1 d2 d3
Exemplu: vezi tabelul 2.6 Si = ai + bi = 94 71 29
S1 S2 S3

4
m1' 0.0678
59
94 2 * 71 236
m 2' 4.00
59 59
4 6 * ( 7) 6 * ( 5) 4 42 30 76
m3' 1.2881
N 59 59
k
xi xo
h
Cu formula: mk ' calculul este mai laborios:
N
1 1 1 1
8 16 10 16 12 16 14 16
3 5 6 10 ......
2 2 2 2
m1'
59
3 * 4 5 * 3 6 * 2 10 *1 12 * 0 9 *1 8 * 2 4 * 3 2 * 4
59
12 15 12 10 9 16 12 8 4
0.0678
59 59

12
2 2 2 2
8 16 10 16 12 16 14 16
3 5 6 10 ......
2 2 2 2
m2
59
3 *16 5 * 9 6 * 4 10 *1 12 * 0 9 *1 8 * 4 4 * 9 2 *16
59
48 45 24 10 9 32 36 32 236
4.00
59 59
2.3.3. Valori medii
Medii de poziie:
Media aritmetic
Pentru iruri statistice formate dintr -un numr redus de valori,
media aritmetic ( x ) se calculeaz cu formula:
x1 x 2 x 3 ... x n x
x
N N
Pentru iruri statistice cu numr mare de valori, acestea se
grupeaz mai nti n clase iar pentru media aritmetic se folosete
procedeul multiplicrii:
x1 n1 x 2 n 2 x 3 n3 ... x k n k xi ni
x
N N
unde: x i reprezint diferitele valori ale centrelor de clas iar n i frecvenele
absolute corespunztoare.
Media aritmetic se poate calcu la mai simplu prin procedeul
sumelor, bazat pe formula:
x x 0 am1
unde: m1 este momentul obinuit de ordin 1, calculat n raport cu valoarea
arbitrar x 0 , iar a este mrimea intervalului de clas.
O alt modalitate, la fel de simpl, se bazeaz pe suma total a
frecvenelor cumulate. Se aplic formula:
D
x x1 a 1
N
unde x 1 reprezint centrul clasei cu cea mai mare valoare iar D suma
frecvenelor cumulate, de la clasele mici la cele mari.

13
Exemplu:
Tabelu l 2 . 7 x i ni 936
x 15.86
categorii de Frecvena N 59
diametre absolut d ini ni x x0 am1 16 2( 0.0678) 16 0.1356 15.86
xi ni
8 3 24 3 D 299
10 5 50 8 x x1 a 1 24 2 1 24 8.14 15.86
N 59
12 6 72 14
14 10 140 24
16 12 192 36 Media aritmetic ponderat
Dac, pentru probe ale aceleeai
18 9 162 45
populaii, se dispune de mai multe medii
20 8 160 53 aritmetice, se poate calcula o singur medie
22 4 88 57 general, utiliznd formula mediei
24 2 48 59 ponderate:
TOTAL 59 936 299 x1 n1 x 2 n 2 ... x k n k
x
n1 n 2 ...n k
Media general x se calculeaz numai dup ce se demonstrea z prin teste
statistice corespunztoare (analiza varianei), c mediile x1 , x 2, ...x k
reprezint estimaii ale aceleeai medii generale .

Media armonic se determin cu relaia:


N
xh N
pentru valori negrupate n clase, respectiv cu relaia :
1
k 1 xk

N
xh p
pentru valori grupate n clase
nk
k 1 xk

unde N este numrul total al observaiilor; n k frecvena clasei k; x k


centrul clasei k, iar p numrul claselor formate

Media geometric este rdcina de ordin n a produsului


celor n valori observate i se utilizeaz n cazul valorilor situate n
progresie geometric.
n
xg N x k pentru valori negrupate
k 1

n
xg N x knk pentru valori grupate , unde n k sunt frecvenele
k 1

absolute
Media geometric este ntotdeauna mai mic sau cel mult egal cu
media aritmetic.

14
Media ptratic se calculeaz cu relaiile:
x k2
xp , n cazul valorilor negrupate
N
n k x k2
xp , n cazul valorilor grupate
N

Medii de structur:
Mediana, cuantilele
Mediana este valoarea x a irului statistic care, atunci cnd toate
valorile irului sunt aranjate n ordine c resctoare, mparte acest ir n
dou grupe egale ca numr.
Quartilul poate fi: inferior i superior. Primul, Q 1 , corespunde
valorii care separ primii 25% din termeni; al doilea, Q 3 , reprezint
valoarea care separ ultimii 25% din termeni.
Mediana i qu artilele rerprezint cazuri particulare ale
quantilelor . Quantilele se pot defini ca fiind variabila creia i
corespunde o frecven relativ cumulat dat. Astfel, mediana este
valoarea cvreia i corespunde o frecven relativ cumulat egal cu 0,5.
Quantilele se pot uor detrermina pe cale grafic. n acest sens se
folosete ogiva lui Galton .ntr-un sistem de coordonate
rectangulare se trec valorile x pe abscis i frecvenele cumulate pe
ordonat.Astfel, de exemplu, mediana este abscisa punctului car e rezult
din intersecia ogivei cu o paralel dus la abscis prin punctul N/2 al
frecvenelor absolute cumulate (sau punctul 0,5 al frecvenei relative
cumulate).
Analitic, mediana se calculeaz cu formula:
N
n
Me x Me a 2
n Me
unde:
x M e este limita inferioar a clasei n care se afl mediana
a = amplitudinea clasei
n = suma frecvenelor cumulate pn n dreptul clasei n care se
afl mediana.
Mediana este des utilizat n practic deoarece depinde mai puin
dect media aritmetic de forma distribuiei sau de valorile extreme ale
irului statistic.
Exemplu de calcul (cu datele din tabelul 2.7) :
59
24
2 29.5 24 5.5
Me 15 2 15 2 15 15.92
12 12 6

15
Modulul
Modulul este valoarea variabilei creia i corespunde cea mai
mare frecven , adic valoarea variabil ei cea mai probabil.
Distribuiile pot fi unimodale (cu un singur vrf) sau plurimodale
(cu mai multe vrfuri).
Modulul distribuiilor discrete se determin citind varianta cu cea
mai mare frecven. n cazul unei distribuii continui, modulul este
abscisa corespunztoare vrfului curbei de frecven i se calculeaz cu
formula :
n 0 n1
Mo x Mo a
2n 0 n1 n 2
unde:
x M o este limita inferioar a clasei modale
a este amplitudinea clasei
n o este frecvena clasei modale
n 1 , n 2 , sunt frecvenele clasei inferioa re i superioare celei modale.
Exemplu de calcul (cu datele din tabelul
12 10 4
2.7): Mo 15 2 15 15.8
24 10 9 5

2.3.4. Indicii dispersiei (indicatorii variabilitii)

Valorile medii indicnd doar centrul de grupare al valorilor


observate, nu pot da o imagine cuprinztoare asupra unei distribuii.
Valorile medii nu spun nimic despre gradul de variabilitate, despre
amplitudinea de mprtiere a valorilor observate.
Indicii dispersiei completeaz caracterizarea distribuiei din aceste
puncte de vedere. Cei mai uzuali sunt: amplitudinea de variaie, variana
(dispersia) i abaterea standard.
Amplitudinea de variaie (W)reprezint diferena dintre
valoarea observat maxim i cea minim adin cadrul unui ir
statistic. Este un indice puin stabil, depinznd n mare msur de
numrul observaiilor efectuate i de aceea este mai puin folosit.
W x max x min
Variana (dispersia) se calculeaz ca o medie aritmetic a
ptratelor abaterilor valorilor individuale ale irului statistic de la media
aritmetic a irului respecti v. Variana este aproximativ egal cu
momentul centrat de ordinul doi (dac N este suficient de mare).
Variana are o valoare concludent dac irul statistic studiat este relativ
simetric.
Calculul varianei:
Procedeul Pt. valori negrupate n Pt. valori grupate n
clase (n <30) clase (n > 30)

16
Direct xi x
2
n xi x
2
2 2
s s
N 1 ni 1
Multiplicrii xi
2
x i ni
2
2 2
x i x nii
s 2 N ni
N 1 s2
ni 1
Momentelor s2 m2 s2 a 2 m2
2
m2 m2' m1'
2 x i ni
n xi x ni xi2 2x x i ni x2 ni dar: x
ni
2 2 2
2 2
xi ni xi ni 2
xi ni
n xi x ni x i 2 2
ni ni x i
ni ni ni
Valoarea dispersiei este tot timpul mai mare sau egal cu zero.
Cazul s 2 =0 poate fi ntnit numai dac toate valorile individuale coincid
cu media aritmetic.
Suma ptratelor abaterilor se mparte la N-1, i nu la N, pentru c
prin calcularea mediei (folosit la stabilirea abaterilor) o observaie este
deja blocat, rmnnd libere doar N-1 observaii. Acest termen (numitorul
formulelor) poart denumirea de grade de libertate.
Numrtorul formulelor poart denumirea de suma ptratelor
abaterilor i se noteaz cu Q.

Abaterea standard (abaterea medie ptratic) se calculeaz ca


radical de ordin doi din varian. Ea caracterizeaz modul cum s e
mprtie valorile observate n jurul valori i medii.
s s2
Abaterea standard exprimat n procente fa de media aritmetic
poart numele de coeficient de variaie (s% ) i se calculeaz cu relaia:
s
s% 100
x
Coeficientul de variaie este singurul indicator care ofer
posibilitatea comparrii omogenitii (variabilitii) a dou sau mai multe
variabile exprimate n uniti de msur diferite. Cu ct valoarea lui s%
este mai mic cu att colectivitatea este mai omogen
Coeficientul de variaie se compar cu coeficientu l de variaie
limit.
dac s% 0,3 (coeficientul limit ) colectivitate
omogen
dac s% > 0,3 (coeficientul limit ) colectivitate
neomogen

17
Exemplu de calcul :
2
2
n xi x 3(8 15.86) 2 5(10 15.86) 2 6(12 15.86) 2 ... 2(24 15.86) 2
s
ni 1 59 1
3 * ( 7.86) 2 5 * ( 5.86) 2 ... 2 * 8.14 2 3 * 61.78 5 * 34.34 ... 2 * 66.26
... 16.25
58 58
2
x i ni
2
x ni 936 2
i
ni 15792
59 15792 14849 943
s2 16.25
ni 1 59 1 58 58
2
Tabelu l 2 . 8 m2 m2' m1' 4 0.0678 2 3.9954
categorii de Frecvena
diametre absolut x ini x
2
i nix
2
i s2 a 2 m2 2 2 * 3.9954 15.98
xi ni
8 3 24 64 192i 2.3.5. Asimetria
excesul
10 5 50 100 distribuiilor
500
12 6 72 144 864
experimentale (indicatorii
14 10 140 196 formei) 1960
16 12 192 256 ASIMETRIA 3072 reprezint
18 9 162 deplasarea
324 pe orizontal
2916 a
20 8 160 vrfului curbei experimentale fa
400 3200
de curba normal.
22 4 88 484 1936
Asimetria curbelor de
24 2 48 576 1152
frecven poate fi cauzat de
TOTAL 59 936 2544 15792
numrul prea mic de observaii
sau de alegerea necorespunztoare
a claselor de frecven (asimetrie aparent). Aceast asimetrie dispare
prin majorarea numrului deobservaii sau prin redimensionarea claselor
de frecven.
Asimetria real reprezint ns o particularitate obictiv a curbei
de frecven i este determinat cel mai adesea de influena puternic a
unui anumit factor.
O msur a asimetriei este dat de relaia lui Pearson :
x Mo
A
s

Cnd media este egal cu modulul Mo, distribuia este simetric.


Cnd x Mo asimetria este de st nga (pozitiv)
Cnd x Mo asimetria este de dreapta (negativ)
Exemple: n arboretele echiene sa constatat c, n general, curba
de frecven a arborilor pe categorii de diametre prezint o asimetrie de

18
stnga n timp ce curba de frecven a arborilor pe categorii de nlimi
prezint o asimetrie de dreapta
Un calcul riguros al asimetriei se face cu relaiile:
N
3
xi x
A i 1
,pentru valori negrupate n clase, i
Ns 3
k
3
ni xi x
i 1
A k
pentru valori grupate n clase,
3
s ni
i 1

sau utiliznd momentele centrate de ordin doi i trei :


m3
A 3
m2
Pentru A<0, asimetria este negativ, iar pentru A>0 asimetria este
pozitiv.
Pentru ca indicele asimetriei s fie semnificativ, la o probabilitate
de acoperire de 95%, trebuie ca valoarea lui s depeasc dublul erorii
de reprezentativitate , calculat dup formula:
6
SA
N 3
Deci, indicele asimetriei este semnificativ, dac: A / sA > 2

EXCESUL sau boltirea (E) este acea proprietate a curbei modale


de a fi mai mai turtit sau mai ascuit dect curba normal
corespunztoare.
Excesul se calculeaz cu formula:
N
4
xi x
E i 1
3 pentru valori negrupate n clase, i
Ns 4
k
4
ni xi x
i 1
E k
pentru valori grupate n clase,
4
s ni
i 1

sau utiliznd momentele centrate:


m4
3 E
m 22
Indicele este semnificativ, la o probabilitate de 95%, dac : E/ s E
> 2, unde:
24
SE
N 5

19
Dac E > 0 curba este ascuit (leptocurtik), iar dac E < 0 curba
este turtit (platikurtic). Pentru distribuiile normale E = 0.

2.4.ERORI DE REPREZENTATIVITATE
Erorile de reprezentativitate exprim gradu l de deprtare dintre
indicatorii eantionului i parametri populaiei. Cu ct volumul probei este
mai mare cu att erorile sunt mai mici.

Eroarea standard a mediei aritmetice


Mediile unor eantioane de prob ale unor populaii se distribuie
ntotdeauna n jurul mediei populaiei din care probele au fost extrase
dup o curb normal, chiar dac distribuia variabilei x a eantioanelor n
jurul mediei populaiei se face dup o curb asimetric.
Variaia mediilor eantioanelor n jurul valorii medii a popula iei
se numete eroare standard a mediei aritmetice , i se exprim cu relaia :

x
n
unde : - abaterea standard
n - volumul eantioanelor considerate
Cnd observaiile se efectueaz la nivelul unei singure probe,
eroarea stan dard a probei se noteaz cu s x i se determin cu relaia:
s
sx ,
n
n
pentru populaii infinite sau suficient de mari 0,1 i cu relaia:
N
s N n
sx
n N
pentru populaii finite sau cu num r redus de uniti, unde se ia n
N n
considerare factorul de corecie .
N
Intervalul de ncredere se exprim n funcie de eroarea standard
: x ts x
unde t este criteriul statistic bilateral Student pentru un nivel de
semnificaie adoptat n funcie de n-1 grade de libertate, n fiind numrul
unitilor din eantion

Eroare admis
Expresia x e ts x reprezint eroarea admis sau acceptat i
poate fi exprimat i procentual:

20
ts %
e% ts x % pentru populaii infinite sau suficient de
n
mari
ts % N n
respectiv e% ts x % pentru populaii finite.
n N
Determinarea mrimii eantionului
Pe baza ultimelor relaii se poate determina numrul de observaii
sau mrimea eantionului (n ), n condiile unei anumite erori i
probabiliti admise ( e% i t), valorile coeficienilor de variaie stabindu -
se pe baza unui sondaj prealabil sau a datelor existente n literatura de
specialitate:
t 2s2 %
n pentru populaii infinite
e2 %
Nt 2 s 2 %
respectiv n pentru populaii finite.
Ne 2 % t 2 s 2 %

CAPITOLUL 3 : DISRTIBUII TEORETICE CU


APLICABILITATE N SILVICULTUR

3.1. INTRODUCERE
Distribuiile experimentale reprezint estimaii ale unor distribuii
teoretice, definite de teoria probabilitilor.
Operaia de asimilare a unei distribuii experimentale cu o
distribuie teoretic poart denumirea de ajustare. Ajustarea se poate face
grafic (mecanic) sau analitic (pe baza unei ecuaii).
Ajustarea poate fi defi nit, deci, ca tehnica nlocuirii unui set de
valori observate cu o ecuaie (ajustare analitic) sau cu o curb continu
i neted (ajustare grafic), n stare s prezinte o imagine ct mai
apropiat de realitatea fenomenului studiat.
Pentru silvicultur p rezint importan urmtoarele distribuii :
distribuia binomial, distribuia evenimentelor rare (Poisson),
distribuia normal i distribuia Charlier(tip A), distribuia Pearson,
distribuia Beta, distribuia Rollet, distribuia Weibull. Pentru examina rea
semnificaiei i verificarea ipotezelor statistice, o larg aplicabilitate au
distribuiile : Student (distribuia t), Fisher (distribuia F) i Pearson
(distribuia
Pentru orice distribuie teoretic trebuie s se cunoasc funcia de
frecven sau probabilitatea teoretic , funcia de distribuie sau
probabilitatea total precum i parametri distribuiei respective.
Funcia de frecven este o relaie matematic care exprim,
pentru o distribuie teoretic, frecvenele relative sau probabilitile ce
corespund diferitelor valori ale variabilei aleatoare.

21
Funcia de distribuie exprim frecvenele cumulate sau
probabilitile totale, funcie de diferite valori ale variabilei aleatoare.
Toate distribuiile enumerate sunt bazate pe teoria probabilit ilor
i de accea, nainte de a le prezenta, se impune s ne oprim asupra
noiunii de probabilitate.

3.2. NOIUNEA DE PROBABILITATE


Numim eveniment orice rezultat al unui experiment. Evenimentele
pot fi sigure, imposibile sau ntmpltoare.
Probabilitate a (p) unui eveniment este raportul dintre numrul de
cazuri favorabile producerii lui (n) i numrul total de cazuri posibile (N).
n
p
N
dac n=N atunci p=1 eveniment sigur
dac n=0 atunci p=0 eveniment imposibil
dac 0<n<N atunci O<p<1 eveniment ntmpltor
Dac notm cu q probabilitatea evenimentului contrar, atunci
N n
p+q=1 i q
N
Noiunea de probabilitate este strns legat de noiunea de
frecven relativ. Frecvenele relative reprezint valori experimentale,
statistice sau estimaii ale probabilitii.

3.3. DISTRIBUIA BINOMIAL


Se numesc expriene binomiale toate experienele ntmpltoare
care ne conduc la realizarea a dou evenimente complementare.
Se numete ir binomial un ir de n experiene binomiale care
satisfac urmtoarele condiii:
numrul de experiene (n) care formeaz irul s fie
determinat anticipat;
toate experienele sunt riguros identice i sunt efectuate n
aceleeai condiii;
exist probabilitatea de a obine succe s n oricare din
experimente.
Presupunem c avem o populaie format din N uniti din care
M=pN uniti posed caracteristica E, iar restul N-M uniti nu posed
aceast caracteristic.
Atunci, pN+qN=(p+q)N=N , deci p+q=1
Din aceast populaie se extrage o prob lund pe rnd n uniti
independente, cu condiia ca dup fiecare extragere unitatea s fie
reintrodus n populaie, astfel nct numrul de uniti naintea fiecrei

22
extrageri s fie acelai. n aceste condiii, probabilitatea ca din numrul
total de n exemplare ale probei, x uniti s posede caracteristica E este
dat de funcia de frecven a distribuiei binomiale, respectiv de
expresia:
n!
f ( x) p xqn x

x! (n x)!
sau
f ( x) C nx p x q n x

Pentru aplicaii practice se recomand formula de recuren:


n!
p x 1q n x 1

f ( x 1) (x 1)! (n x 1)! x! (n x)(n x 1)! p n x p


f ( x) n! x! ( x 1)(n x 1)! q x 1 q
pxqn x
x! (n x)!

n x p
f (x 1) f ( x)
x 1 q
Cu formula de baz se calculeaz F(0)pentru x=0, iar cu formula
de recuren se calculeaz probabilitatea (frecvena) pentru celelalte
valori ale lui x .
Funcia de distribuie F(x) a distribuiei binomiale este dat de
relaia :
n
n!
F ( x) pxqn x

x o x! (n x)!

Parametri distribuiei se calculeaz astfel :


media aritmetic : np
dispersia : 2 npq np(1 p)
Pentru n=p distribuia este simetric. Cu ct diferena dintre p i q
este mai mare cu att se accentueaz asimetria.
Pentru distribuiile experimentale parametri (indicii) se calculeaz
dup formulele cunoscute. Variabila este discontinu .
n silvicultur aplicarea distribuiei binomiale prezint importan
n domeniul vari aiei alternative (prezena sau absena unui unei nsuiri,
apariia unui sex sau altul, prezena sau absena arborilor cu un anumit
defect, etc).
Exemple:
1. ntr-un arboret de fag de productivitate superioar, s -au fcut
70 de sondaje pentru identificarea a rborilor api pentru derulaj. n
fiecare punct de sondaj s -au luat cei mai apropiai 10 arbori de centrul
sondajului. Dat ele culese din teren mpreun cu calculele aferente
ajustrii sunt prezentate n tabelul 3.1.

23
Tabelu l 3 . 1
Nr. arbori apti de Frecvene Frecvene teoretice
n*x n*x 2
derulaj x experimentale n relative absolute
0 14 0 0 0.179 11
1 22 22 22 0.336 20
2 10 20 40 0.284 17
3 7 21 63 0.142 8
4 4 16 64 0.047 3
5 2 10 50 0.011 1
6 1 6 36 0.001 0
7 0 0 0 0 0
8 0 0 0 0 0.0
9 0 0 0 0 0.0
10 0 0 0 0 0.0
Total 60 95 275 1 60
xi ni 95 x 1.58
x 1.58 p 0.158 sau p=15.8% i q=84.2%
N 60 n 10
2
x i ni
2
x ni 95 2
i
ni 275
60 275 150.42 124.58
s2 2.11
ni 1 60 1 59 59
s s2 1.45
n! 10!
f (0) p xqn x
0.158 0 0.84210 0
0.84210 0.179
0!(n 0)! 10!
n 0 p 10 * 0.158
f (1) f (0 1) f (0) 0.179 0.179 *1.876 0.336
0 1 q 1* 0.842

n 1p 9 * 0.158 1.422
f ( 2) f (1 1) f (1) 0.336 0.336 0.284
1 1 q 2 * 0.842 1.684

n 2 p 8 * 0.158 1.264
f ( 3) f (2 1) f ( 2) 0.284 0.284 0.142
2 1 q 3 * 0.842 2.526

n 3 p 7 * 0.158 1.106
f ( 4) f (3 1) f ( 3) 0.142 0.142 0.047
3 1 q 4 * 0.842 3.368

n 4 p 6 * 0.158 0.948
f (5) f (4 1) f ( 3) 0.142 0.047 0.011
4 1 q 5 * 0.842 4.210

24
n 5 p 5 * 0.158 0.79
f (6) f (5 1) f ( 3) 0.011 0.011 0.001
5 1 q 6 * 0.842 5.052

Comparnd frecven ele experimentale cu cele teoretice se observ


o diferen semnificativ, deci i ali factori, n afara ntmplrii, au o
onfluen puternic. O test are cu un criteriu tiinifiic (hi ptrat) ar fi
necesar pentru a putea t rage concluzii bine fundamentate.

2. ntr-o plant aie de rinoase, 20% din puiei sunt atacai de


insecte. Cu ajutorul distribuiei binomiale, s se stabileasc
probalilit atea ca dint r -o pia de prob de 5 puiei un numr de 0,1,2, 3,4
sau 5 puiei s fie at acai.
n! 5!
f (0) p xqn x
0.2 0 0.8 5 0
0.8 5 0.328
0!(n 0)! 5!
n 0 p 5 * 0.2
f (1) f (0 1) f (0) 0.328 0.328 *1.25 0.410
0 1 q 1* 0.8
n 1p 4 * 0.2 0.8
f ( 2) f (1 1) f (1) 0.410 0.410 0.205
1 1 q 2 * 0.8 1.6
n 2 p 3 * 0.2 0.6
f ( 3) f (2 1) f ( 2) 0.205 0.205 0.051
2 1 q 3 * 0.8 2.4
n 3 p 2 * 0.2 0.4
f ( 4) f (3 1) f ( 3) 0.051 0.051 0.006
3 1 q 4 * 0.8 3.2
n 4 p 1* 0.2 0.2
f ( 5) f (4 1) f ( 3) 0.006 0.006 0.000
4 1 q 5 * 0.8 4.0

3.4. DISTRIBUIA POISSON


Distribuia Poisson reprezint un caz particular al distribuiei
binomiale. Se ntlnete atunci cnd probabilitatea evenimentului este
foarte mic (de unde i denumirea de distribuia evenimentelor rare ),
chiar i atunci cnd numrul observaiilor este mare. n domeniul forestier
se ntlnete la: ano malii la speciile de vnat, apariia de arbori cu caliti
deosebite (lemn de rezonan, arbori plus), apariia insectelor duntoare,
etc.
Deci, acest tip de distribuie apare cnd p 0 i q 1 chiar dac
n , cu condiia ca produsul np s reprezinte o valoare finit.
Funcia de frecven este :
x
e
f ( x)
x!
unde: e=2,71828

25
- este singurul parametru al distribuiei, egal cu
media aritmetic i n acelai timp cu dispersia
2

x = numrul de uniti statistice extrase din eantion ce


prezint caracteristica cercetat.
Distribuia este de tip discret, asimetric, apropiindu -se de cea
binomial pe msur ce crete valoarea lui .
Pentru x=0 avem f ( 0 ) =e - iar pentru x=1,2,3,se folosete relaia
de recuren:

f (x 1) f ( x)
x 1
x 1 x
e e
f (x 1) f ( x)
( x 1)! ( x 1) x! x 1
Ajustarea distribuiilor experimentale dup legea Poisson se
face doar n cazul n care media aritmetic a distribuiei experimentale
este foarte apropiat de dispersi a distribuiei i cnd observaiile s -au
fcut pe uniti statistice discrete .
Exemplu:
2000 de arbori dint r -un arboret au fost analizai din punct de
vedere al prezen ei gelivurilor. n tabelul de mai jos sunt prezentat e
rezultat ele observa iilor :
Numar de Numrul de frecvene teoretice Poisson
gelivuri pe arbori observai xini 2
x i ni
arbore x i ni relative absolute
0 1210 0 0 0.607 1214
1 605 605 605 0.303 606
2 155 310 620 0.076 152
3 25 75 225 0.012 24
4 4 16 64 0.002 4
5 1 5 25 0.000 0
T otal 2000 1011 1539 1.000 2000
x i ni 1011
x 0.506 0.5
N 2000
2
x i ni
2
x ni 10112
i
ni 1539
2000 1539 511 1028
s2 0.514
ni 1 2000 1 1999 1999
s s2 0.717
Media aritmetic (0,506) este foarte apropiat de dispersia
distribuiei (0,514) ceeea ce arat c n acest caz este aplicabil
distribuia Poisson.

26
x
e
Cu formula f ( x ) calculm:
x!
0.5 0 e 0.5
0.5 1 1
f (0) e 0.607
0! e 2.71828

Cu relaia de recuren f (x 1) f ( x) , calculm:


x 1
0.5
f (1) f (0 1) f (0) 0.607 0.303
0 1 1
0.5
f ( 2) f (1 1) f (1) 0.303 0.076
1 1 2
0.5
f ( 3) f ( 2 1) f ( 2) 0.076 0.012
2 1 3
0.5
f ( 4) f (3 1) f ( 3) 0.012 0.002
3 1 4
0.5
f (5) f ( 4 1) f ( 4) 0.002 0.000
4 1 5

3.5 DISTRIBUIA NORMAL


Distribuia normal este foarte rspndit n natur. Apare ori de
cte ori o caracteristic este supus unui numr mare de influene
ntmpltoare, de slab intensitate i totodat
independente unele de altele. Este frecvent
ntlnit la distribuia mediilor de
selecie.Variabila este continu.
Funcia de frecven este:
.
(x )2
1 2 2
f ( x) e
2
unde i reprezint abaterea standard i
media populaiei respective.
Aceti doi parametri nu se cunosc de
obicei dar pot fi estimai prin extrageri de
probe.n acest caz se nlocuiete prin s iar
prin x . Funcia de frecven devine:
.
( x x )2
1 2s2
f ( x) e
s 2

27
Pentru simplificare i pentru a se putea compara distribuiile de la
diferite populaii, se introduce variabila ajuttoare u, denumit variabil
normat :
x x
u Figu ra 3. 1 Curba de frecvene (sus) i
s
Funcia de frecven a curba de distribuie (jos) a distribuiei
distribuiei normale normate normale normate
va fi:
.
u2
1 2
f (u ) e
2
n aceste condiii, media este egal cu 0 iar abaterea standard este
egal cu unitatea (figura 1).
Distribuia normal este perfect simetric, are un maximum i dou
puncte de inflexiune corespunztoare absciselor - i + . Cu ct abaterea
standard este mai mic cu att curba de frecven este mai turtit i invers.
Curba este asimptotic la axa absciselor , ceea ce arat c i valorile mari
sunt posibile, dar probabilitatea lor este redus.
Funcia de distribuie , corespunztoare frecvenelor cumulate,
este dat de integrala:
x (x )2
1 2 2
F ( x) e dx
2
sau, n abateri normate:
u u2
1 2
F (u ) e du
2
Dac integrarea se face n limitele -
i + funcia F(u)=1.
Integrarea n limitele 0 i u definete
funcia lui Laplace :
u u2
1 2
(u ) e du
2 0
Aceast expresie reprezint suprafaa
de sub curba normal de la valoarea medie
pn la u (figura 2a)

1
Pentru u , (u ) , deci 2 (u)=1.
2
1
F (u ) (u ) reprezint frecvena
2
cumulat (probabilitatea total) i este

Figura 2 :Suprafeele de sub curba


normal, n diferite variante de
28 integrare
suprafaa de sub curba normal cuprins ntre - i valoarea u dat
(figura 2d).
Frecvent se utilizeaz dublul funciei Laplace:
u
P 2 (u ) f (u )du
u
care arat suprafaa de sub curb cuprins ntre limitele u, indicnd suma
frecvenelor cuprinse n intervalul u (figura 2b). Aceast sum este
denumit probabilitatea de acoperire .
Probabilitatea de transgresiune (sau probabilitate de depire ,
nivel de semnificaie) este probabilitatea ca valorile variabilei s fie n
afara intervalului u, deci funcia 1-2 (u) (figura 2c).
Valorile funciilor enumerate sunt calculate i prezentate n tabele
pentru diferite valori ale lui u.
Exprimnd n procente frecvenele se poate co nstata c:
n intervalul n afara intervalului
u u u u u u
se gsesc urmtoarele % din numrul total al observaiilor :
68.27 95.45 99.73 31.73 4.55 0.27
O serie de distribuii asimetrice se aduc la forma normal prin
1
transformarea variabilei x. Exemple : x x ; x ; x lg(x a) ;
x
1
x ; x x a . De fiecare dat se calculea z media x i abaterea
x a
standard s pentru variabilele transformate. Apoi se efectueaz calculele
cu noile variabile.
Exem plu:
Pentru seminele de br ad s -a stabilit, ca medie a populaiei, valoar ea de
55,4 grame(la 1000 semine), abaterea standard fiind de 7,85 gr ame. Se pun
dou ntrebri:
a) Cu ce probabilitate se poate afir ma c greutatea seminelor
va depi o li mit inferioar de 35 grame ?
b) Care este probabilitatea ca greut atea seminelor s se
ncadreze n intervalul 40 -75 grame ?
Rezolvare:
a) Stabilim posibilitatea P=0,5 - ( u ) , corespunztoare prii din
35.0 55.4
stnga a curbei, n funcie de valoarea: u 2.6 .
7.85
Din tabele, pentru u=2,6 P=0,5 - ( u ) =0,004661.
Deci, n 0,46% din cazuri seminele vor avea greutatea sub 35grame.
b) Stabilim probabilitatea P= ( u ) pentru dou valori ale lui u:
40.0 55.4
u1 2.0 ( u 1 ) =0,47725 sau 47,7%
7.85
75.0 55.4
u2 2.5 ( u 2 ) =0,49379 sau 49,4%
7.85
Prin ur mare, frecvena valorilor cuprinse ntre li mitele date este de:

29
(u1)+ ( u 2 ) = 97,1%.
n afara acestor li mite, se vor gsi 100 -97,1=2,9% din cazuri, din care:
0,5- ( 2 , 0 ) =2,3% sub limita da 40g i 0,5 - ( 2 , 5 ) =0,6% peste li mita de
75g.

Etapele ajustrii distribuiei experi mentale dup legea


normal:
Reprezentarea grafic a datelor experimentale. Dac rezult
un profil clopot, atunci se poate emite ipoteza c distribuia
experimental urmeaz legea distribuiei normale, ipotez ce
se verific n final printr -un test de ajust are ( 2 ).
Redactarea tabelului de ajustare (tabelul 3.2)
Calculul valorii medii x m e d , al varianei s 2 ia al abaterii
2
2
x i ni
xi ni
x i ni ni
standard s cu relaiile: x ; s 2
;
N ni 1
s s2
xi x
Calculul abaterilor normate u i : u i
s
Caculul frecvenelor teoretice f(u i ) cu funcia:
.
ui2
1 2
f (u i ) e , funcie tabelat n unele cri de
2
statistic pentru valori ale lui u din 0,01 n 0,01.
Caculul frecvenelor teoretice absolute n cu relaia:
Nh
n i f (u i ) , unde h este amplitudinea clasei, s abaterea
s
standard iar N numrul total de observaii
Verificarea calitii ajustrii cu un criteriu riguros ( 2 ).

30
Tabelu l 3 . 2

Ajustarea distribuiei experimentale dup legea normal


frecvene 2 frecvene 2
xi experimentale n i
x ini x i ni ui f (ui ) teoretice n i exp

14 4 56 784 -2.1633 0.0384 6 0.45


16 16 256 4096 -1.8092 0.0777 11 1.95
18 20 360 6480 -1.4551 0.1384 20 0.00
20 34 680 13600 -1.1010 0.2177 32 0.17
22 50 1100 24200 -0.7469 0.3019 44 0.84
24 52 1248 29952 -0.3929 0.3694 54 0.06
26 59 1534 39884 -0.0388 0.3987 58 0.02
28 55 1540 43120 0.3153 0.3797 55 0.00
30 40 1200 36000 0.6694 0.3189 46 0.89
32 30 960 30720 1.0235 0.2363 34 0.56
34 20 680 23120 1.3776 0.1545 22 0.27
36 16 576 20736 1.7317 0.0891 13 0.71
38 9 342 12996 2.0858 0.0453 7 0.88
40 4 160 6400 2.4399 0.0203 3 0.37
42 2 84 3528 2.7939 0.0081 1 0.59
total 411 10776 295616 407 7.75
x med 26.219 f =k-3=15-3=12
2
s2 31.90 teoretic5% = 5.23
2 2
s 5.65 exp > teoretic5%

31
Figu ra 3. 2

Ajustarea distribuiei experimentale dup distribuia normal

70
frecvene
experimentale ni
60
frecvene
teoretice ni
50
frecvene absolute

40

30

20

10

0
14 16 18 20 22 24 26 28 30 32 34 36 38 40 42
categorii de diametre

2
Verificarea calitii ajustrii se poate face cu criteriul dat de
relaia:
n i
2
2 ni
ni
unde n i sunt frecvenele experimentale iar n i sunt frecvenele teoretice
absolute.

3.6. DISTRIBUIA CHARLIER (TIP A)


Este o distribuie normal generalizat ce ia n considerare
asimetria i excesul.
Funcia de frecven este:
A E IV
(u ) f (u ) f (u ) f (u )
6 24
unde:
(x x)
u este abaterea normat
s

32
.
u2
1
f (u ) e 2
este funcia de frecven a distribuiei normale
2
normate
.
u2
1
f (u ) e 2
(3u u 3 ) este derivata de ordin III a lui f(u)
2
.
u2
IV 1
f (u ) e 2
(u 4 6u 2 3) este derivata de ordin IV a lui
2
f(u)
A este asimetria
E este excesul
Pentru A=0 i E=0 distribuia Charlier se transform ntr -o
distribuie normal.
Frecvenele absolute, pe clase ale variabilei x, se obin aplicnd
formula:
Nh
n (u )
s
unde h este intervalul de clas.
Funciile f(u), f (u ) , f IV (u ) se pot calcula sau se iau din tabele.
Pentru calculul indicilor acestei distribuii se poate folosi
procedeul momentelor
m3 m4
A 3
E 2
3
m2 m 2

n silvicultur acest tip de repartiie este frecvent aplicat la studiul


distribuiei numrului de arbori pe clase de diematere sau pe clase de
nlimi n arboretele echiene sau la alte distribuii la care indicii de
asimetrie i exces prezint valori semnificative.
Etapele ajustrii distribuiei experimentale dup distribuia
Charlier tip A
Redactarea tabelului de ajustare (tabelul 3.3)
Calculul valorii medii x m e d , al varianei s 2 i al abaterii
standard s.
k
3
ni xi x
i 1
Determinarea indicelui de asimetrie: A k
s3 ni
i 1
N
4
xi x
i 1
Determinarea indicelui de exces: E 3
Ns 4
xi x
Calculul ab aterilor normate u i : u i
s

33
.
ui2
1 2
Caculul f(u i ) cu relaia: f (u i ) e ,
2
Calculul derivatei de oridn trei: f (ui ) (3ui ui3 ) f (ui )
Calculul derivatei de oridn patru:
IV 4 2
f (u i ) (u i 6u i 3) f (u i )
Calculul funciei de frecven:
A E IV
(u i ) f (u i ) f (u i ) f (u i )
6 24
Caculul frecvenelor teoretice absolute
n cu relaia:
Nh
n i (u i ) , unde h este amplitudinea clasei, s abaterea
s
standard iar N numrul total de observaii
Verificarea calitii ajustrii cu un criteriu riguros ( 2 ).
Tabelu l 3 . 3

Ajustarea distribuiei experimentale dup funcia Charlier (tip A)


2 III IV
(u) 2
xi n i exp x i n i x i ni ui f (ui ) f (u i ) f (u i ) n i teor exp
14 4 56 784 -2.1633 0.0384 0.1397 -0.1222 0.0344 5 0.26
16 16 256 4096 -1.8092 0.0777 0.0384 -0.4602 0.0820 12 1.03
18 20 360 6480 -1.4551 0.1384 -0.1778 -0.7228 0.1548 23 0.32
20 34 680 13600 -1.1010 0.2177 -0.4284 -0.6103 0.2426 35 0.05
22 50 1100 24200 -0.7469 0.3019 -0.5507 -0.0110 0.3240 47 0.16
24 52 1248 29952 -0.3929 0.3694 -0.4130 0.7749 0.3760 55 0.14
26 59 1534 39884 -0.0388 0.3987 -0.0464 1.1926 0.3853 56 0.14
28 55 1540 43120 0.3153 0.3797 0.3473 0.9163 0.3541 52 0.22
30 40 1200 36000 0.6694 0.3189 0.5448 0.1633 0.2951 43 0.22
32 30 960 30720 1.0235 0.2363 0.4723 -0.5171 0.2241 33 0.23
34 20 680 23120 1.3776 0.1545 0.2346 -0.7393 0.1546 22 0.31
36 16 576 20736 1.7317 0.0891 0.0002 -0.5346 0.0959 14 0.26
38 9 342 12996 2.0858 0.0453 -0.1277 -0.1893 0.0528 8 0.19
40 4 160 6400 2.4399 0.0203 -0.1465 0.0553 0.0255 4 0.02
42 2 84 3528 2.7939 0.0081 -0.1081 0.1377 0.0106 2 0.10
total 411 10776 295616 409 3.66
x med = 26.2189781 A= 0.2394 f =k-5=15-5=10
2
s2= 31.90 E= -0.3070 teoretic5% = 3.94
2 2
s= 5.65 exp < teoretic5%

34
Figu ra 3. 3

Ajustarea distribuiei experimentale dup distribuia


Charlier (tip A)

70 ni exp
ni teor
60
frecvene absolute

50

40

30

20

10

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
categorii de diametre

3.7. SISTEMUL DISTRIBUIILOR PEARSON


Sistemul distribuiilor Pearson se bazeaz pe ecuaia
diferenial:
dy x b dy x b y
2
dx sau
y c 0 c1 x c 2 x dx c 0 c1 x c 2 x 2
unde b, c 0 , c 1 i c 2 sunt parametri ce se stabilesc pe baza datelor
experimentale.
Sistemul de repartiii Pearson se determin pe baza indicilor de
asimetrie i exces. Sistemul cuprinde, n afar de repartiia normal, nc
apte tipuri de curbe diferite, numerotate de la I la VII. Unele tipuri de
curbe conin 2 -3 subtipuri: I(i, j, u), II(i, u), III(i, j), VI(i,j) astfel nct
sistemul complet cuprinde 13 curbe de forme diferite (i=curb cu vrf, u=
curb convex, j= curb descresctoare).
Sistemul s-a aplicat la ajustarea repartiiei numrului de arbori pe
categorii de diametre.

3.8. DISTRIBUIA BETA


Funcia de distribuie,corespunztoare valorilor cumulate, este:

35
b
F , ( x) ( x a) (b x) dx
a

unde: a este limita inferioar a distribuiei experimentale; b este limita


superioar a distribuiei experimentale iar , sunt exponenii funciei
Beta.
Funcia de repartiie (densitatea de repartiie), se calculeaz cu
relaia:
f ( x) C ( x a) (b x) ,
unde C este o constant aleas astfel nct suma frecvenelor absolute s
fie egal cu N sau suma frecvenelor relative s fie 1. Deci,
b
N
C ( x a) (b x) dx N C b
a
( x a ) (b x) dx
a

N
Funcia de repartiie devine: f ( x) b
( x a ) (b x)
( x a ) (b x) dx
a
Funcia este foarte flexibil i se folosete pentru variabile
continue. n silvicultur este foarte indicat pentru descrierea distribuiei
arborilor n arboret pe categorii de diametre.
Etapele ajustrii distribuiei experimentale dup distribuia
Beta
Redactarea tabelului de ajustare (tabelul 3.4)
Calculul valorii medii x m e d , al varianei s 2 i al abaterii
standard s.
Stabilirea limitelor distribuiei: a=limita inferioar i
b=limita superioar
x a
Calculul mediei aritmetice relative: x relativ
b a
2
2 s
Calculul dispersiei relative: s relativ
(b a ) 2
x relativ
Calculul partametrului K: k
1 x relativ
k
1
s r e l (1 k ) 2
2
Calculul parametrilor n i m: n ;
1 k
x rel n
m kn
1 x re
Calculul exponenilor i cu relaiile: m 1 ; n 1
Calculul frecvenelor teoretice dup distribuia beta:
n i C ( x a) (b x)

36
Compararea frecvenelor teoretice cu cele experimentale i
verificarea calitii ajustrii cu un criteriu riguros.
Figura 3. 4
Ajustarea distribiei experimentale dup distribuia Beta

ni exp
70
frecvene
60
frecvene absolute teoretice
50

40

30

20
10

0
14 16 18 20 22 24 26 28 30 32 34 36 38 40 42
categorii de diametre

Tabelu l 3 . 4

Ajustarea distribuiei experimentale dup funcia beta


frecvene teoretice
2 2
xi n i exp x ini x i ni absolute exp
relative absolute
rotujite
14 4 56 784 0.007 2.79 3
16 16 256 4096 0.034 14.04 14 0.529
18 20 360 6480 0.065 26.89 27 1.815
20 34 680 13600 0.093 38.23 38 0.421
22 50 1100 24200 0.113 46.50 46 0.348
24 52 1248 29952 0.124 51.01 51 0.020
26 59 1534 39884 0.126 51.63 52 0.942
28 55 1540 43120 0.118 48.65 49 0.735
30 40 1200 36000 0.104 42.71 43 0.209
32 30 960 30720 0.084 34.67 35 0.714
34 20 680 23120 0.062 25.55 25 1.000
36 16 576 20736 0.040 16.49 16 0.000
38 9 342 12996 0.021 8.62 9
40 4 160 6400 0.007 2.97 3 0.750
42 2 84 3528 0.001 0.26 0
total 411 10776 295616 1.000 411.01 411 7.483
x med = 26.22 C=2655x10-9 C=1091x10-6
s2= 31.90 a= 13
s= 5.65 b= 43
x r elativ = 0.441 s 2 r elativ = 0.035
K= 0.788
n= 3.330 =n-1= 2.330
m= 2.623 =m-1= 1.623

37
3.9. DISTRIBUIA MEYER
Se utilizeaz frecvent n cazul distribuiilor descresctoare. n
silvicultur este utilizat la ajustarea repartiiei numrului de arbori pe
categorii de diametre n arboretele pluriene.
Frecvenele teoretice se determin cu relaia:
xi
ni ke
unde: n i reprezint frecvenele teoretice;
e este baza logaritmilor naturali (e=2,71828)
k i sunt parametri funciei
Pentru determinarea parametrilor ecuaiei, se logaritmeaz funcia
de frecven:
log n i log k xi log e dar ln e 1 ln n i ln k xi
n aceast relaie se introduc frecvenele experimentale ale celor
dou valori extreme ale variabilei (notatecu A i B), rezultnd un sistem
de dou ecuaii cu dou necunoscute: i k.
log n A log k A log e ln n A ln k A
sau
log n B log k B log e ln n B ln k B
Dac n relaia log n i log k xi log e nlocuim: log ni y i ; logk a i
log e b ,
aceasta devine y i = a+bx i , care este ecuaia unei drepte
Parametri a i b se pot determina i prin metoda celor mai mici
ptrate, rezolvnd sistemul de ecuaii:
aN b n i x i ni y i
a ni x i b n i x i2 ni xi y i
Cunoscnd valorile a i b se pate determina y i a bxi , iar apoi,
deoarece log ni y i se pot calcula frecvenele absolute compensate
n 10 yi
Exemplu:
ntr-un arboret plurien s -au inventariat arborii i au fost grupa i pe
categorii de diametre rezultnd distribuia experimental din tabelul 3.5.
Se cere s se ajusteze aceast distribuie experimental dup legea Meyer.

38
Tabelu l 3 . 5

Ajustarea distibuiei experimentale a numarul de arbori pe


categorii de diametre dup distribuia Mayer

2 Elemente de
xi ni log ni n comp
calcul
8 395 2.597 395 0.0
12 210 2.322 279 16.9 a=8
16 101 2.004 197 46.5
20 62 1.792 139 42.5
24 39 1.591 98 35.5 b=64
28 28 1.447 69 24.4
32 45 1.653 49 0.3
36 49 1.690 34 6.2 n A= 395
40 56 1.748 24 41.4
44 63 1.799 17 122.8
48 42 1.623 12 74.0 n B =3
52 30 1.477 9 54.0
56 16 1.204 6 16.5
60 10 1.000 4 7.8
a=0.08716
64 3 0.477 3 0.0
total 1149 24.426 1335 488.9
k=793.2
lg 395 log k 8 lg e 2.596 log k 8 * 0.4343
lg 3 log k 64 log e 0.477 log k 64 * 0.4343
2.596 log k 3.4744
0.477 log k 27.7952

2.119
2.596 3.4744 0.477 27.7952 0.0871
24.3208

log k 2.5966 0.3026 2.8992 k 10 2.8992 793.2

n i 793.2e 0.0871xi

Sau, n varianta a doua (tabelul 3.6):


aN b n i x i ni y i 1 1 a 42 93 b7 23 46 4 1
2
a ni x i b ni x i ni xi y i 2 3 a7 73 46 8b 04 93 67 5 6
a 2.659
b 0.0259

y i 2.659 0.0259 xi n 10 yi

39
Tabelu l 3 . 6

Ajustarea distibuiei experimentale a numarul de arbori pe categorii de diametre


dup distribuia Mayer
2 2
xi ni log ni=yi niyi nixi nixi nixi yi yi comp ni comp
8 395 2.597 1025.7 3160 25280 8205 2.452 283
12 210 2.322 487.7 2520 30240 5852 2.348 223
16 101 2.004 202.4 1616 25856 3239 2.245 176
20 62 1.792 111.1 1240 24800 2223 2.141 138
24 39 1.591 62.1 936 22464 1489 2.037 109
28 28 1.447 40.5 784 21952 1135 1.934 86
32 45 1.653 74.4 1440 46080 2381 1.830 68
36 49 1.690 82.8 1764 63504 2982 1.727 53
40 56 1.748 97.9 2240 89600 3916 1.623 42
44 63 1.799 113.4 2772 121968 4988 1.519 33
48 42 1.623 68.2 2016 96768 3272 1.416 26
52 30 1.477 44.3 1560 81120 2304 1.312 21
56 16 1.204 19.3 896 50176 1079 1.209 16
60 10 1.000 10.0 600 36000 600 1.105 13
64 3 0.477 1.4 192 12288 92 1.001 10
540 1149 24.426 2441 23736 748096 43756 25.899 1296
b= -0.0259 a= 2.659

Figu ra 3. 5

Ajustarea distibuiei reale a numarul de arbori pe


categorii de diametre dup distribuia Mayer
450
400
350
curba real
300
curba teoretic 2
nr.arbori

250
curba teoretica 1
200
150
100
50
0
8 12 16 20 24 28 32 36 40 44 48 52 56 60 64
categ de diam .

40
CAPITOLUL 4 : EXAMINAREA SEMNIFICAIEI

4.1. GENERALITI
Semnificaia
La fiecare extragere a unei probe dintr -o populaie, se obin alte
valori pentru medie, varian, frecvene relative, coeficient de corelaie,
etc., valori care se abat mai mult sau mai puin fa de valorile adevrate
ale parametrilor populaiei. Abaterile vor fi cu att mai accentuate cu ct
variabilitatea este mai mare.
n situaia n care probele sunt extrase din populaii diferite apare
o nou surs de variaie lega t de particularitile diferite ale fiecrei
populaii n parte. Compararea indicilor statistici obinui prin probe luate
din aceeai populaie sau din populaii diferite este ngreunat de prezena
variabilitii individuale din cadrul fiecrei populai i.
Influena cauzelor ntmpltoare asupra diferenelor dintre indicii
statistici ai probelor se poate diminua pe msur ce se mrete numrul
observaiilor, evideniindu -se mai pregnant diferenele cauzate de factorii
obiectivi. n practic ns, posibili tile de majorare a numrului de
observaiii sunt limitate aa nct suntem constrni a trage concluzii n
baza unor probe de volum restrns.
ntrebrile pe care ni le punem legat de semnificaie se refer la:
-este sau nu semnificativ diferena dintre dintre o medie stabil
(obinut pe cale teoretic sau din cercetri anterioare) i media rezultat
din cercetarea unei probe;
-este sau nu semnificativ o diferen dintre mediile privind dou
sau mai multe probe;
-este sau nu adevrat diferena dintr e varianele privind sau mai
multe probe analizate.
ntrebri asemntoare se pun i n ceea ce privete compararea
distribuiilor, compararea coeficienilor de corelaie i a coeficienilor de
regresie, compararea proporiilor, etc.:
-care diferene pot fi considerate ntmpltoare i deci
nesemnificative ?
-cnd diferenele sunt semnificative (abateri veritabile) se
datoreaz ele unor factori de influen sistematici, sau nu ?

Ipoteza nul
Pentru a putea rspunde la problema semnificaiei se formuleaz
iniial o ipotez care n urma analizei va fi acceptat sau respins.
Frecvent se folosete ipoteza nul (H 0 ) care const n presupunerea
c abaterea indicilor estimai fa de parametri populaiei este zero (nul).
Metodele statistice au drept scop de a v erifica dac aceast ipotez este
sau nu adevrat. Verificarea ei se face prin comparaii. Respingnd
ipoteza nul, se accept semnificaia abaterii respective. Acceptnd -o
rezult c nu exist nici un temei pentru a accepta semnificaia diferenei.

41
Erorile n verificarea ipotezei nule sunt de dou genuri :
Erori de genul I, prin care pe baza rezultatelor prelucrrii
datelor caracteristice eantionului, se respinge ipoteza nul
cnd ea este de fapt adevrat la nivelul populaiei ;
Erori de genul II, cnd, pa baza aceluiai eantion, se
accept ipoteza nul, ea fiind de fapt fals la nivelul
populaiei.
Pentru a reduce erorile de genul I trebuie respinse numai ipotezele
care se realizeaz cu o probabilitate mai mic de 5%. n unele situaii se
resping ipot ezele care se realizeaz cu o probabilitate mai mic de 1% sau
0,1%. Valoarea de 5%(sau 1% sau 0,1%) se numete probabilitate de
transgresiune sau nivel de semnificaie i se noteaz de obicei cu .
Pentru erorile de genul II probabilitatea de a accepta H 0 , cnd de
fapt ea este fals, se noteaz cu , iar n practic se alege de obicei
=0,10 sau =0,05.

Teste de semnificaie
Verificarea ipotezelor statistice se face cu ajutorul testelor de
semnificaie.
Testul statistic este o metod care permite luarea unei decizii cu
privire la o populaie pornind de la o informaie incomplet furnizat de
un eantion.
Testele statistice se aplic pentru compararea valorilor
parametrilor unei populaii cu valori fixate anterior, sau la compararea
ntre ele a valorilor a dou sau mai multe eantioane sau populaii.
Pentru verificarea semnificaiei se folosesc mai multe categorii de
teste de semnificaie, n funcie de natura ipotezelor de verificat. Frecvent
utilizate sunt :
Testele de conformitate destinate pentru a com para ntre ele o
populaie teoretic i o prob observat, din punctul de vedere al
mediilor, abaterii standard, varianei, coeficientului de corelaie,
coeficientului de regresie, etc.
Testele de egalitate, sau de omogenitate, permit compararea unui
anumit numr de populaii prin intermediul unui numr egal de
probe extrase din aceste populaii. Se aplic pentru verificarea
omogenitii mediilor, varianelor, coeficienilor de corelaie, etc.
Testele de ajustare permit s se verifice dac din toate punc tele de
vedere, o prob observat poate fi considerat ca fiind extras
dintr-o populaie dat. Aceast verificare se realizeaz prin
compararea frecvenelor observate ale probei cu frecvenele
teoretice a le populaiei.
Testele de independen permit s s e controleze, n baza unor probe
, dac sunt independente dou sau mai multe criterii de clasificare,
n general calitative.

42
Clase de semnificaie . n raport cu mrimea probabilitii de
transgresiune acceptat s -au format urmtoarele clase de semnificaie :
Probabilitatea de transgresiune Dif erena este
>5% nesemnificativ (neasigurat)
1-5% semnificativ (asigurat)
0,1 - 1 % distinct semnificativ (bine asigurat)
< 0,1 % foarte semnificativ (foarte bine asigurat)

Probabilitile de transgresiune, corespunztoare claselor de


semnificaie, pot fi folosite pentru stabilirea limite lor n care se gsesc
parametri populaiei. Aceste granie se numesc limite de ncredere. Prin
intermediul lor se definete intervalul de ncredere.

4.2. INTERVALUL DE NCREDERE AL MEDIEI


ARITMETICE
n practic nu se admite indicarea simpl a mediei arit metice, ea
trebuind s fie nsoit de intervalul de ncredere corespunztor
probabilitii de transgresiune acceptat (5%, 1% sau 0,1%). Aceast
cerin este impus de variabilitatea individual i de faptul c
majoritatea cercetrilor se fac pe probe mai mult sau mai puin
numeroase.
Formarea intervalului de ncredere difer dup cum distribuia din
care s-a extras proba este normal, binomial, Poisson etc i dac abaterea
standard teoretic este sau nu cunoscut.
Intevalul de ncredere al mediei n cazu l distribuiei normale.
CAZUL 1: Abaterea standard teoretic se cunoate
La extragerea mai multor probe intervine, n locul abaterii
standard, eroarea standard a mediei aritmetice:

sx
N
cunoscnd c i mediile probei se distribuie tot n ormal, n jurul aceleeai
medii a populaiei, limitele intervalului de ncredere vor fi:
x us x
Pentru u=1,96 ; 2,58 sau 3,29, exist o siguran statistic
(probabilitate de acoperire) de 95 ; 99 respectiv 99,9 %, ca media
populaiei (med ia adevrat) s se gseasc undeva n intervalul definit de
x us x . Probabilitile de transgresiune (de depire, de a grei) sunt de
5%, 1% respectiv 0,1%.
Exem plu:
ntr -un arboret de molid s -a deter minat valoarea coeficientului de for m
natural, prin doborrea a cinci arbori. S -a obinut o valoare medie de 0,50.
Valoarea medie a coeficientului de variaie a coeficientului de f or m
(s%), cunoscut din cercetri anterioare, este de 8%. (Pe baza a doar cinci

43
msurtori precizia de deter min are a abateri i standard este foarte redus i nu
este indicat s o folosi m).
Pentru o probabilitate de transgresiune de 5%, se cere s se stabileasc
ntre ce limite este cuprins valarea adevrat a mediei coeficient ului de for m.
s 0,5 * 8
s% 100 s 0,04 , iar eroarea standard a
x 100
0.04
mediei: sx 0,021
N 5
din tabele, pentru =5% u= 1,96
Media adevrat va fi ntre limitele x us x adic 0.50 1.96 * 0,021 0,50 0,041

CAZUL I1: Abaterea standard teoretic nu se cun oate


n acest caz, limitele intervalului de ncredere vor fi date de de
expresia:
s
x ts x x t
N
Valoarea lui t se determin din tabela distribuiei Student n
funcie de probabilitatea de transgresiune urmrit i de numrul gradelor
de libertat e f; f=N-1. n cazul unui mare numr de observaii (N) ,
distriduiile t i u sunt identice i intevalul de ncredere va fi x us x .
Exem plu:
ntr -o cultur de plop euramerican, s -au msurat 12 nlimi ale unor
exemplare alese la nt mplar e, obinnd ur mtoarele rezultate:
arborele 1 2 3 4 5 6 7 8 9 10 11 12
nlimea x (cm) 140 90 120 120 140 110 110 90 110 150 150 110

x 120cm s=20,8 cm
s 20,8
sx 6,0
N 12
din tabele, pentru =1% i f=12-1=11 grade de libertate t= 1,96
intervalul de ncredere al mediei va fi: x ts x 120 3.106 * 6 120 19

4.3. TESTE DE CONFORMITATE


Servesc la compararea unor parametri teoretici cu indicatorii unei
probe. Prin intermediul acestor teste pot fi comparate mediile, varianele,
abaterile standard, coeficienii de corelaie, coeficienii de regresie, etc.

4.3.1. Examinarea diferenei dintre o medie experimental i o


valoare dat.

Folosirea testului u

44
Testul u se aplic atunci cnd abaterea standard teoretic este
cunoscut, cnd valoarea x provine dintr -o prob normal distribuit de
volum foarte mare.
Se d: - x media experimental calculat n baza unei probe cu N
observaii extras dintr -o populaie cu media necunoscut.
- 0 - media cunoscut a unei populaii ce poate rezulta din
consideraii teoretice sau din observaii anterioare.
- abaterea standard cunoscut
Se cere s se determine dac ntre media i 0 exist diferene,
deci dac este valabil ipoteza H 0 : = 0 .
x 0 x 0
Se calculeaz: u N
x
Dac u e x p e r i m e n t a l > u t e o r e t i c , atunci diferena ntre cele dou medii
este semnificativ i ipoteza nul se va respinge
Ex empl u :
Pe nt r u se mi ne le de bra d s -a sta bil it ca va l oa r e med ie a p op ula iei
gre uta te a de 55 , 4 g p e nt ru mi a de s emi ne i o a ba ter e sta nda rd de 7, 8 5 g. O
cer ce ta re e fe ct ua t n tr - o a n u mit z o n ba za t pe un n um r de 2 76 ob ser va ii
a sta bil it o n ou me d ie de 61 , 3 gra me . N e in tere sea z da c n o u a med ie e ste
ma i m a re de c t c e a st a bil it ca med ie a p op ula iei :
x 0 61,3 55,4
u exp N 276 12,48
7.85
u t a b e l a r = 1,64 . D e c i, u e x p >u t a b e l a r di fe re na e ste se m n i fi ca t iv , de ci
gre uta te a se m i ne l or din ca re s -a u f c ut obs er va i ile se d eo s ebe te f oa rte
sem ni fi ca ti v de m e di a sta b ili t a nte ri or .

Folosirea testulu t
Testul t se aplic atunci cnd nu se cunoate valoarea teoretic a
abaterii standard i cnd numrul d e msurtori estze relativ mic ( N<30)
x 0
t N
s
Se pune problema i n acest caz dac ntre media eantionului ( x )
i media populaiei ( 0 ) exist sau nu diferene, deci dac este sau nu
valabil ipoteza nul H 0 : x 0

Raportul t se distribuie dup legea Student i este tabelat n


funcie de numrul gradelor de libertate f= N-1 i probabilitatea de
transgresiune acceptat.
Dac t c a l c u l a t > t t e o r e t i c atunci ipoteza nul se respinge.
Exem plu:
Pentru o anumit localitate s-a nregistr at, ca medie multianual,
cantitatea de precipitaii de 440 mm. n ultimii 10 ani precipitaiile au fost mai
reduse, media fiind de numai 400 mm, iar abaterea standard de 20 mm. Ct de
semnificativ este diferena dintre cele dou m edii ?
x 0 400 440
t N 10 0,5 10 1.58
s 20

45
Din tabele, pentru =5%unilateral , t t a b e l a r =1,833
Deci t e x p <t t a b abaterea este nesemnificativ pentru probabilitatea de
transgresiune de 5%.

4.3.2. Examinarea semnificaiei varianei i a diferenei dintre


variane

Compararea unei variane experimentale ( s 2 ) cu o varian


teoretic dat ( 0 2 ) se face cu ajutorul criteriului 2 .
Dac notm: s 2 variana experimental
2
variana populaiei
2
0 variana teoretic dat pentru populaie
Se cere s se stabileasc d ac 2 se deosebete de 0 2 , adic dac
este sau nu valabil ipoteza nul H 0 : 2 > 0 2
s2
Se calculeaz raportul 2
i se compar cu valoarea teoretic a
0
2
2
raportului unde este luat din tabele n funcie de i de f.
f
2
s2
Dac 2
ipoteza este adevrat, deci 2 > 0 2
f 0

De obicei intereseaz numai dac 2 > 0 2 sau dac 2 < 0 2 , i n


aceste cazuri folosim testul unilatelal.
Dac ne intereseaz ambele variante ( 2 > 0 2 i 2 < 0 2 ) folosim
testul bilateral.
Tabelele pentru 2 teoretic sunt ntocmite pentru testul unilateral.
Pentru testul bilateral n tabel se intr cu p (respectiv p 100 ,
2 2
2 2
dac se dorete verificarea ipotezei: < 0 ).
Exem plu:
Dintr -o ndelungat practic a cercetrilor, se cunote c var iana
factorului de cubaj al lemnului de foc est e de 0 2 =0,0038 (sau 0 =0,062 ;
%=10).
La o nou cercetare, efectuat asupra a 59 uniti, a rezultat o abatere
standard s=0,075 i o dispersie s 2 =0,0056 (s 2 esti meaz pe 2 ).
Este oare semnificativ diferena dintre cele dou variane ( 0 2 i s 2 ) la
o probabilitate de transgresiune de 5% ?
H 0 :s 2 > 0 2
s2 0.0056
Calculm 2
1.47
0 0.0038
Din tabele, pentru =5 %i f=59-1=58 2
teoretic= 76,8 (prin
interpolare)

46
2 2
76.8 s2
1.32 2
, deci ipoteza este adevrat. Populaia
f 58 0 f
din care s -a extras pr oba are o dispersie mai mare dect cea cunoscut. Sti vele
din care s -au extras cele 59 de probe sunt mai puin omogene n raport cu
factorul de cubaj dect cele anterior studiate.

Limitele de ncredere ale varianei


Limitele inferioar i superioar ale intervalului de ncredere,
pentru o probabilitate de transgresiune , vor fi:
2 s2 2 s2
s sup 2
s inf . 2
1 2

f f
2
unde: s este variana rezultat din experiment;
2 2
1 este criteriul pentru probabilitatea p= 100- /2
2 2
2 este criteriul pentru probabilitatea p= /2
f este numrul gradelor de libertate f=N-1
Exemplu:
Limitele de ncredere pentru varian a s 2 =0,0056 din exemplul
anterior, pentru o probabilitate de transgresiune de 5% se calculeaz
astfel:
Din tabele, se ia valoarea lui 1 2 pentru probabilitatea p=100-
5/2=97,5%i f=58
pentru f=50 1 2 =32,36
2
pentru f=60 1 =40,48 pentru f=58
2 8
1 32.36 (40.48 32.36) 38.9
10
se ia valoarea lui 2 2 pentru probabilitatea p=5/2=2,5% i f=58
pentru f=50 2 2 =71,42
2
pentru f=60 2 =83,30 pentru f=58
2 8
2 71.42 (83.30 71.42) 80.92
10
2 s2 0.0056 0.0056 2 s2 0.0056 0.0056
s sup 2
0 . 0084 s inf . 2
0.0040
1
38.9 0.67 2
80.9 1.39
f 58 f 58
Aadar, n 95% din cazuri, la repe tarea experienei, ne putem atepta la o
varian cuprins ntre 0,0084 i 0,0040. Limitele abaterii standard vor
fi: 0.0084 0.092 i respectiv 0.0040 0.063 .

4.4. TESTE DE EGALITATE


Servesc la compararea unui anumit numr de populai i prin
intermediul unui numr egal de probe extrase din aceste populaii. Ele se

47
aplic pentru verificarea omogenitii mediilor, varianelor, coeficienilor
de corelaie.

4.4.1. Verificarea semnificaiei diferenei dintre dou variane

Se verific ipoteza nul H 0 : 1 2 = 2 2 unde 1 2 i 2 2 reprezint


varianele teoretice corespunztoare celor dou variane experimentale s 1 2
i s 2 2 .
Se folosete testul F (Fischer).
Se calculeaz raportul dintre dispersia cea mai mare (pe care o
s12
notm cu s 1 2 ) i dispersia cea mia mic (notat cu s 2 2 ): Fcalc
s 22
F c a l c se compar cu F t e o r e t i c determinat din tabele, n funcie de
probabilitatea de transgresiune acceptat ( ) i numrul gredelor de
libertate f 1 i f 2 .
F 1 =N 1 -1 gradele de libertate al dispersiei mai mari ( s 1 2 )
F 2 =N 2 -1 gradele de libertate al dispersiei mai mici ( s 2 2 )
Dac F c a l c <F t e o r e t i c ipoteza nul se accept , diferena dintre cele
dou dispersii fiind considerat ca nesemnificativ, deci cele dou probe
sunt extrase din aceeai populaie. Varianele fiin d omogene se poate
calcula o varian reunit care se va apropia cel mai mult de variana
populaiei:
s12 ( N 1 1) s 22 ( N 2 1) s12 f 1 s 22 f 2
s2
N1 N 2 2 f1 f 2
Dac F c a l c >F t e o r e t i c diferena dintre cele dou dispersii este
semnificativ, varianele nu sunt omogene, provenind din populaii
diferite, i nu se poate calcula o varian comun.
Deoarece intereseaz 1 2 = 2 2 se va aplica criteriul F bilateral (ne
intereseaz abaterile n ambele sensuri). De aceea, din tabelele pentru F
unilateral se iau valorile lui F teoretic la o probabilitate de /2. De
exemplu, dac ne intereseaz F bilateral pentru =5%, din tabelele cu F
unilateral lum valoarea corespunztoare probabilitii de 2,5%.
Exem plu:
n aceleai condiii staionale au fost instalate dou culturi de plop
euramerican: pri ma di n clona A i a doua di n clona B. Au fost fol osii puiei de
aceeai vrst i nlime, iar prelucrarea solului a fost identic. Dup doi ani
de la plantare au fost msurate nli mile la 35 de exemplare din clona A i la
45 de exemplare din clona B. Dup prelucr area datelor respective, a rezultat o
varian de 0,70 pentr u clona A i de 1,38 pentru clona B.
S se stabileasc dac variabilitatea nli milor la cele dou cultur i este
sau nu identic.
s 1 2 = 1,38 este variana cea mai mare (a clonei B) i
s 2 2 = 0,70 est e variana cea mai mic (a clonei A)
Numrul gr adelor de li bertate va fi: f 1 =N 1 -1=45-1=44 i f 2 =35-1=34

48
s12 1.38
Fcalc 2
1.97
s 2 0.7
Din tabelele, pentru = 5%, i f 1 =44, f 2 =34 F t a b e l a r =1,9 (n tabelele
pentru F unilateral fol osi m probabilitatea =2,5%)
Deoarece F c a l c =1,97 > 1,9=F t e o r e t i c diferena dintre cele dou
dispersii este semnificativ i putem susine c cele dou clone difer din punct
de vedere al variabilitii nlimilor.Varianele nefiind omogene, nu se poate
calcula o varian comun.

4.4.2. Examinarea egalitii mai multor variane

Se verific ipoteza nul H 0 : 1 2 = 2 2 = 3 2 ... = k 2


Bartlett a demonstrat c variabila ntmpltoare:
1 k s i2
f i ln ,
C i 1 s
unde
k
1 1 1
C 1
3k 1 i 1 fi f
2
urmeaz aproximativ legea distribuiei cu f=k-1 grade de libertate, k
fiind numrul varianelor examinate.
k
2 2.303
Se calculeaz empiric cu relaia: 2
f lg s 2 f i lg s i2 ,
C i 1
2
fi s i
unde s 2 este variana medie ponderat.
fi
Din tabele, n funcie de i de numrul gradelor de libertate f=k-
2
1, se obine t e o r e t i c .
Dac 2 c a l c u l a t 2
teoretic se accept ipoteza nul, deci ntre
varianele considerate nu exist diferene semnificative. n acest caz,
pentru caracterizarea populaiei din punct de vedera al variabilitii se va
lucra cu variana medie.
Dac 2 c a l c u l a t 2
teoretic se respinge ipoteza nul, deoarece
ntre varianele considerate exist diferene semnificative. Nu se poate
calcula o varian medie, deoarece cel puin una dintre dispersii se refer
la alt populaie. Se poate trece la omogeniz area sistemului, prin
eliminarea din calcul a varianei care se abate cel mai mult de la celelalte.
Dac dup aceast excludere sistemul este omogen se poate calcula o
varian comun. Dac nu, se poate continua omogenizarea prin
eliminarea urmtoarei vari ane aleas n acelai mod.
Testul Hartley este un mod mult mai simplu de verificare a
omogenitii mai multor variane dar se poate aplica numai n cazul
grupelor cu numr egal de observaii (n).

49
2
s max
Se calculeaz raportul H calc 2
care se comp ar cu H t e o r e t i c luat
im

s min im
din tabele, n funcie de numrul gradelor de libertate f=n-1 i de p
(numrul de grupe comparate)
Dac H c a l c u l a t Hteoretic ntre variane nu exist diferene
semnificative.
Dac H c a l c u l a t Hteoretic ntre variane exist diferene
semnificative.

4.4.3. Distribuia abaterii standard

Abaterea standard, privit ca o variabil aleatoare, atunci cnd


numrul de observaii este mare, are o distribuie aproximativ normal, cu
si f i 2
1
media s 1 , unde s i variana: s 2
. Abaterea
2f fi 2f

standard va fi: s
2f
s
Limitele de ncredere ale abaterii standard vor fi : s u
2f

4.4.4. Distribuia coeficientului de variaie

Atunci cnd numrul de msurtori este mare, coeficientu l de


variaie are o distribuie normal. Abaterea standard a coeficientului de
variaie este dat de relaia:
2
% %
ss % 1 2
2f 100
2
u %
Cu limitele de ncredere: %1 1 2
2f 100
Dac nu se cunoate valoarea coeficientului de variaie teoretic
2
( ), se admite folosirea estimaiei s%.

4.4.5. Examinarea semnificaiei diferenei dintre dou medii

Fie x11 , x12 ,...x1n i x 21 , x 22 ,...x 2 n dou sisteme de observaii extrase


randomizat din dou populaii normal distribuite, cu parametrii: 1 i 1
; 2 i 2 .
Pentru fiecare prob se calculeaz indicii:
x1 1 ; x2 2
2 2
s1 1 , cu f 1 =N 1 -1 grade de libertate ;

50
s 22 2
2 , cu f 2 =N 2 -1 grade de libertate ;

Dac se repet de un numr mare de ori observaiile, mediile x1 i


2
x 2 se distribuie dup legea normal cu parametri 1 i 1
, respectiv 2
N1
2
i 2
.
N2
Diferenele d x1 x 2 formeaz de asemenea o distribuie normal
cu media:
1 2
i dispersia:
2 2
2 1 2
d
N1 N2
Pot aprea n continuare dou situaii distincte: 2
1
2
2 sau
2 2
1 2
Decizia de ncadrare n unul dintre cele dou cazuri s e ia dup
verificarea ipotezei nule H 0 : 12 2
2 . Verificarea se face cu testul F.
Dac probele nu sunt extrase din populaii cu distribuii normale,
se caut s se ajung la forma normal prin transformri.

CAZUL 1: Compararea a dou medii n situaia cnd 1


2 2
2

Dup verificarea ipotezei H 0 : 12 2 cu testul F, dac aceasta este


2

just se trece la verificarea ipotezei H 0 : 1 2

Dac aceast ipotez este just, atunci diferenele d x1 x 2


formeaz o distribuie normal, cu media 1 2 0 i cu variana
2 2 1 1
d
N1 N 2
Raportul:
d x1 x2
u exp
d1 1
N1 N 2
constituie criteriul prin intermediul cruia se examineaz semnificaia
diferenei dintre cele dou medii.
Dac u e x p <u t e o r e t i c determinat n funcie de , diferena dintre
medii este nesemnificativ.
Criteriul u se poate folosi doar atunci cnd cele dou medii provin
din eantioane de volum mare normal distribuite.
Dac nu se cunoate valoarea lui 2 , cnd cele dou medii provin
din eantioane cu volum mic i nu avem certitudinea normalitii
eantionului, parametrul 2 se nlocuieta cu estimaia s 2 .

51
2 s12 f 1 s 22 f 2 2
s
f1 f 2
2 2
Prin nlocuirea lui cu s se va apela la testul t :
x1 x 2
t exp
1 1
s
N1 N 2
Din tabele, n funcie de i f=N 1 +N 2 -2, se obine t t e o r e t i c .
Dac t e x p <t t e o r e t i c se accept ipoteza nul. n acest caz se poate
calcula o medie ponderat:
N 1 x1 N 2 x 2
x
N1 N 2
i o varian comun:
2 2
2
x1i x x 2i x 2
s0
N1 N 2 1
Pentru noua valoare medie limitele inter valului de ncredere vor fi:
x ts x
Procedeul diferenelor limit (DL) se folosete la compararea
mediilor tot n cazul cnd 12 2
2 .

Se aplic relaia: DL ts d
Din tabele, se extrage valoarea t pentru =5%, =1% i =0,1%.
s d eroarea standard a diferenei se calculeaz cu relaia:
N1 N 2 s12 f 1 s 22 f 2
sd s , unde s
N1 N 2 f1 f2
Se calculeaz diferena d x1 x 2 i se compar cu diferenele
limit DL.
Dac : DL 5 % >d diferena este nesemnificativ
DL 1 % >d>DL 5 % diferena este semnificativ
DL 0 , 1 % >d>DL 1 % diferena este distinct
semnificativ
d>DL 0 , 1 % diferena este foarte semnificativ

d f o a r t e s e m n i f i c a t i v >DL 0 , 1 % > d d i s t i n c t semnificativ >DL 1 % >d s e m n i f i c a t i v >DL 5 %


>d n e s e m n i f i c a t i v

Exem plu:
ntr -un arboret de larice s -au extras probe de cretere la 70 de arbori pe
dou direcii (Nord i Sud) ale aceleeai seciuni transversale. S se stabileasc
ce influen are asupra mediilor de selecie poziia de recoltare a probelor.

52
Poziia Media de selecie Dispersia s 2 N Grade de libertate f=N-1
Nord 15.42 4.1 70 69
Sud 13.64 3.7 70 69

2 2
Cu aj utorul testului F se verific ipoteza H 0 : 1 2

s12 4.1
Fexp 2
1.108 F t e o r e t i c =1,47
s 2 3.7
2 2
Deoarece F e x p <F t e o r e t i c se admite ipiteza potrivit creia 1 2 i se
poate calcula o va rian comun:
s12 f 1 s 22 f 2 4.1* 69 3.7 * 69 538.2
s2 3.9
f1 f2 69 69 138
s s2 3.9 1.97
x1 x 2 15.42 13.64 1.78
t exp 5.313
1 1 1 1 0.335
s 1.97
N1 N2 69 69
Pentru =5 % i f=N 1 +N 2 -2=138, se obine t t e o r e t i c =1,98
t e x p >t t e o r e t i c mediile nu sunt estima ii ale aceleeai medii a
populaiei, deci poziia de recoltare a probelor de cretere influeneaz puternic
valoarea medie a creterii.
Prin procedeul diferenei lim it :
N1 N 2 70 70 140
DL ts d unde s d s 1.97 1.97 * 0.335
N1 N 2 70 * 70 4900
DL0.05 t 0.05 s d 1.98 * 0.335 0.663
DL0.01 t 0.01s d 2.62 * 0.335 0.877
DL0.001 t 0.001s d 3.37 * 0.335 1.129
d x1 x2 15.42 13.64 1.78
d=1,78>1,129=DL 0 , 1 % diferena este foarte semnificativ

CAZUL 2: Compararea a dou medii n situaia cnd 2


1
2
2
n acest caz se lucreaz cu testul t.
Deoarece n acest caz testul t nu poate fi aplicat n mod obinuit,
se introduce o modifica re la calculul gradelor de libertate. Astfel, n locul
formulei f=N 1 +N 2 -2 , intervine expresia:
s12
1 N1 1
f 2
, unde c 2 2
iar f 1 N1 1 i
c 2
1 c s1 s2 s 22 N 1
1 2
f1 f2 N1 N 2 s1 N 2
f2 N2 1
Se parcurg urmtoarele etape:
- cu ajutorul testului F se verific ipoteza H 0 : 12 2
2

53
s12
Fexp dac F e x p >F t e o r e t i c , se respinge ipoteza H 0 , deci
s 22
2 2
1 2

x1 x2 s
- se calculeaz t exp sx
s x21 s x22 N
- se extrage din tabele t t e o r e t i c , n funcie de i de f determinat
mai sus
Dac t e x p >t t e o r e t i c cele dou medii se refer la populaii
distincte

Exem plu:
ntr -un arboret de molid s -au putut distinge dou poriuni: prima
poriune, unde o perioad ndelungat s -a pr acticat punatul; a doua poriune
ferit de punat, datorit unor mprj muiri efectuate din timp. S -a cerut s se
stabileasc dac punatul a influenat asupra nlimii medii a arboretului.
n acest scop, n cele dou poriuni au fost msurate cte 25 de nlimi
la arbori cu diametre apropiate de diametrul mediu. n baza msurtorilor
efectuate, au rezultat ur mtoarele valori ale indicilor statistici:
nlimea medie Dispersia s 2 N Grade de libertate f =N-1
Poriuna punat 25.7 2.35 25 24
Poriuna nepunat 27.5 1.05 25 24

- se verific ipoteza H 0 : 2
1
2
2 cu testul F
s12 2.35
Fexp 2
2.24 F t e o r e t i c =1,98 pentru =5%
s 2 1.05
F e x p >F t e o r e t i c i se respinge ipoteza nul, deci 2
1
2
2
- se calculeaz
x1 x 2 x1 x 2 25.7 27.5 1.8 s
t exp 4.9 sx
2 2
s x1 s x2 s12 2
s2 2.35 1.05 0.369 N
N1 N 2 25 25
s12 2.35
N1 25
c 0.69 iar
s12 s 22 2.35 1.05
N1 N2 25 25
1 1
f 2 2 2 2
42
c 1 c 0.69 1 0.69
f1 f2 24 24
- n funcie de =5% i de f=42, se extrage din tabele
t t e o r e t i c =2,021
t e x p =4.9>2.021=t t e o r e t i c cele dou medii se refer la populaii
distincte

54
Concluzia rmne valabil i pentru =0,1%. Prin punat, n arboret
s-au creat dou populaii distincte.
Prin procedeul diferene i lim it:
s12 s 22 2.35 1.05
DL ts d unde s d 0.37
N1 N2 25 25
DL0.05 t 0.05 s d 2.021 * 0.37 0.75
DL0.01 t 0.01s d 2.704 * 0.37 1.00
DL0.001 t 0.001s d 3.551 * 0.37 1.31
d x1 x2 25.7 27.5 1.8
d=1,8>1,31=DL 0 , 1 % diferena este foarte semnificativ

4.4.6. Testarea semnificaiei diferenei din tre dou procedee


sau metode prin utilizarea metodei cuplurilor

n practic, frecvent este necesar s se cunoasc dac dou


procedee, aplicate n aceleai condiii, conduc la rezultate diferite sub
raportul preciziei i eficienei.
Prin procedeu se poate nelege: dou metode de msurare, dou
agregate folosite la efectuarea aceleeai operaii, dou metode de
prelucrare (a solului, a arboretului) etc.
Pentru a nltura inconvenientul cu privire la variabilitatea
colectivitii cercetate, se adopt de la n ceput o schem sistematic de
eantionaj, n cadrul creia, pentru cele dou procedee, se ridic cupluri
de valori. Procednd n acest fel se elimin variabilitatea datorat unor
cauze ntmpltoare i rmne de analizat numai abaterea sistematic
proprie procedeelor analizate.
Pentru fiecare cuplu (pereche) de valori se calculeaz diferena:
di
d i xi1 xi 2 i media diferenelor: d
N

Se calculeaz apoi variana i abaterea standard a diferenei:


2
2
di
di
s d2 N ; sd s d2
N 1
x1 x 2
Se calculeaz : t exp N i se compar cu t t e o r e t i c .
sd
Dac t e x p >t t e o r e t i c diferen semnificativ ntre cele dou
procedee.
Exemplu:
ntr-o pepinier s-au ales douzeci de parcele perechi pentru
urmrirea efectului aplicrii unui ngrmnt asupra creterii n nlime
a puieilor. O pereche este format din dou parcele vecine, din care una,

55
aleas prin tragere la sori, se trateaz iar cealalt rmne
martor.Rezultatele obinute sunt cele din tabelul de mai jos
d i 8.3
Compararea mediilor prin procedeul cuplurilor d N 10
0.83
nlimea medie n di
2
Perechea 2 8.3 2
d i =x 2 -x 1 di 2 d i 12 . 89
nr. parcela tratat cu N 10
martor s d2 0.667
ngramnt N 1 9
1 5.5 6.2 0.7 0.49
2 5.5 5.6 0.1 0.01
3 6.0 5.6 -0.4 0.16
sd sd2 0.667 0.817
4 6.6 7.7 1.1 1.21 x1 x2 0.83
5 6.1 7.7 1.6 2.56 t exp N 10 3.21
sd 0.817
6 7.5 8.6 1.1 1.21
7 6.4 6.4 0.0 0.00
8 7.3 8.0 0.7 0.49 pentru f=10-1=9
9 7.4 8.4 1.0 1.00 t 0 , 0 5 =2,262 t 0 , 0 1 =3,25
10 5.6 8.0 2.4 5.76
Total 8.3 12.89 t e x p >t 0 , 0 5 o semnificativ
influen, negativ, a aplicrii ngrmntului, asupra dezvoltrii
puieilor..

4.4.7. Compararea a dou proporii (procente)

Pentru stabilirea semnificaiei diferenei dintre dou proporii se


utilizeaz testul u.
1 1
p1 p2
2N1 2N 2
u exp
1 1
p(1 p)
N1 N 2
.
unde:
a1
p1 este proporia caracteristicii aflate n a 1 cazuri din
N1
eantionul N 1 ;
a2
p2 este proporia caracteristicii aflate n a 2 cazuri din
N2
eantionul N 2 ;
a1 a 2
p este proporia total.
N1 N 2
Pentru N suficient de mare se poate renuna la coreciile 1/2N 1 i
1/2N 2 de la numrto rul relaiei de calcul a lui u.
Dac u e x p > u t e o r e t i c diferena dintre proporii este semnificativ.

56
Dac uexp< uteoretic diferena dintre proporii este
nesemnificativ.

4.4.8. Compararea mai multor proporii

Pentru stabilirea semnificaiei diferenei din tre mai multe proporii


se utilizeaz testul hi ptrat ( 2 ) determinat cu relaia:
2

2 pi p N i ( pi p) 2
exp
p (1 p ) p (1 p )
Ni
ai
unde p i este proporia i, dintre a i cazuri favorabile din numrul de
Ni
ai
observaii N i , iar p , este proporia medie.
Ni
2 2
Dac exp erimental> teoretic diferena dintre proporii este
semnificativ.
2
t e o r e t i c se deetermin din tabele, n funcie de probabilitatea de
transgresiune i de f=K-1 grede de libertate, unde K este numrul
proporiilor analizate.

4.5. TESTE DE AJUSTARE


Servesc la compararea unor disrtibuii experimentale cu
distribuiile teoretice chiar la compararea ntre ele a unor distribuii
experimentale.
Se pornete de la ipoteza nul, potrivit creia ntre distribuiile i
frecvenele comparate nu exist diferene.

Se folosete criteriul 2 . Este important ca la aplicarea acestui test


s se respecte urmtoarele:
- numrul observaiilor s fie suficient de mare
- frecvenele teoretice s nu fie mai mici dect 5; n caz
contrar se reunesc unele clase, astfel nct s se obin
frecvene peste 5.
- s se lucreze numai cu frecvene absolute.

57
Se calculeaz:
n i
2
2 ni
exp
n i
unde: n i sunt frecvenele teoretice absolute iar,
n i sunt frecvenele experimenta le.
Din tabele, se determin 2 t e o r e t i c , n funcie de probabilitatea de
transgresiune i de numrul gradelor de libertate:
f=k-n-1
unde:
k reprezint numrul claselor rmase dup gruparea
claselor cu frecvena sub 5, iar
n reprezint numrul momentelor lu ate n considerare
la calculul distribuiei teoretice. ( n=1 pentru distribuia
binomial i Poisson; n=2 pentru distribuia normal; n=4
pentru distribuia Charlier; n=0 n cazul comparrii a dou
distribuii empirice, deoarece nu se calculeaz nici un
moment).
2 2
Dac exp > teoretic diferena dintre distribuii este
semnificativ, se respinge ipoteza nul.

4.6. CRITERII PENTRU ELIMINAREA OBSERVAIILOR


EXTREME
Eliminarea valorilor extreme care se abat mult de la media
distribuiei trebuie fcut dup cri terii statistice, eliminarea arbitrar
nefiind indicat, mai ales atunci cnd numrul observaiilor este mic.
Valori extreme foarte diferite de medie pot aprea ca urmare a
unor greeli (de notare, de msurare) sau datorit apartenenei unor
elemente la o alt colectivitate dect cea studiat.

Criteriul Chouvenet, propune eliminarea variabilelor situate n


afara intervalului:
x kr
unde: x este media aritmetic,
r este eroarea probabil a unei singure msurtori
(r= 0,6745*s), iar
k este uncoeficient extras tabelar:
Numrul valorilor observate 11 12-30 31-100 peste 100
Valoarea coeficientului k 3.0 3.5 4.0 4.5

Criteriul Irwin (criteriul )


Dup ce se calculeaz abaterea standard a irului ordonat
cresctor, prntru valorile extreme suspecte se calculeaz:

58
x2 x1 xn xn 1
;
s s
unde x 1 , x n sunt valorile extreme suspecte iar x 2 , x n - 1 sunt valori ce aparin
irului.
Din tabele, se extrag valorile lui t e o r e t i c :
Numrul valorilor observate
P 10 50 100 400 1000
valori ale lui eor etic :
0.95 1.5 1.1 1.0 0.9 0.8
0,99 2 1.6 1.5 1.3 1.2

exp< teoretic variabila dubioas se ncadreaz n irul statistic;


exp> teoretic variabila dubioas se elimin, i se calculeaz din
nou s 2 .

Criteriul Charlier
Propune eliminarea valorilor situate n afara intervalului:
x zq s
unde: x este media aritmetic, s abaterea standard, iar z q este un
coeficient ce se determin din tabele, n funcie de probabilitatea de
transgresiune acceptat i de numrul de observaii ( N)

Criteriul Romanovschi
Pentru eliminarea valorilor suspecte, se propune efectuarea
urmtoarelor calcule:
a) Determinarea abaterii standard de selecie numai pentru N-1
mrurtori, cu relaia:
2
xi x ni
s
N 1
b) Calculul abaterii standard s pentru ntreaga colectivitate, n
funcie de mrimea lui s , utiliznd relaia aproximativ:
N 1
s s
N
c) Determinarea mrimii z cu relaia:
xn x
z exp
s
d) Determinarea lui z t e o r e t i c , din tabele, n funcie de
probabilitatea de transgresiune q i de numrul de observaii
(N).
e) Comararea lui z c a l c u l a t cu z t e o r e t i c . Dac z c a l c u l a t > z t e o r e t i c ,
atunci valoarea lui x n trebuie eliminat din irul de date.

59
Criteriul Grubbs
Pentru eliminarea valorilor aberante (fie x 1 , fie x n )se
procedeaz astfel:
a) Se ordoneaz datele irului x 1 , x 2 ,..x n n ordine
cresctoare ;
b) Se determin media aritmetic ( x ) i abaterea standard
(s) ;
c) Se calculeaz indicatorii:
xn x
v , pentru situaia n care x n este considerat
s
valoarea aberant, i
x x1
v , pentru situaia n care x 1 este considerat
s
valoarea aberant.
d) Se determin z q , din tabele, n funcie de probabilitatea
de transgresiune q i de numrul de observaii ( N).
e) Se compar valorile lui v sau v cu valoarea lui z q . Dac v
sau v >z q , atunci valoarea extrem trebuie eliminat.

Dup ce o valoare dintr -un ir a fost eliminat printr -un criteriu


oarecare, este posibil ca o nou valoare din cele rmase s par suspect.
n acest caz, irul de dare rmas se supune din nou testri statistice.
Dac eliminarea treptat a valorilor aberante nu mbuntete
indicatorii preciziei, nseamn c materialul nu a fost omogen sau datele
nu au fost culese corespunztor. n asemenea situaii rezultatele obinute
nu mai pot fi considerate ca general valabile i nu pot conduce la
stabilirea unor legiti cu caracter general.

CAPITOLUL 5 : ANALIZA VARIANEI

5.1. ASPECTE TEORETICE


Asupra unei colectiviti pot aciona simultan mai muli factori
care determin o anumit fluctuaie a mrimii statistice studiate,
fluctuaie redat printr -o dispersie care poate fi mai mare sau mai mic.
Pentru evidenierea aportului fiecrui factor la apariia fluctuaiei
generale, se face apel la analiza varianei.
Analiza varianei (analiza dispersional) este metoda statistic de
prelucrare a datelor de observaie care depind de mai muli factori cu
aciune concomitent, cu scopul de a stabili pe cei mai importani i a se
estima influena lor.
Analiza varianei are ca scop scindarea dispersiei totale n
categorii de variaii potrivit cauzelor care le determin.
Dup folosirea tuturor posibilitilor de analiz, n raport cu
factorii controlai fa de dispersia total, mai rmne un rest a crui

60
cauzalitate nu se cunoate i el se poate datora aciunii unor factori
neluai n considerare, unor erori de msurare. Aceast variaie rezidual
(s E 2 ) este folosit ca unitate de msur pentru examinarea semnificaiei
celorlalte componente ale variaiei totale.
n acest scop se folosete testul F :
- dac F e x p e r i m e n t a l <F t e o r e t i c factorul studiat nu
influeneaz
caracteristica
respectiv
- dac F e x p e r i m e n t a l >F t e o r e t i c factorul studiat are o
influen
semnificativ.
Dac prin testul F s-a constatat o influen semnificativ a unor
anumii factori, se trece apoi la o analiza de detaliu, cu ajutorul testului t,
stabilindu-se ntre care variane exist diferene semnificative.
Analiza este aplicabil atunci cnd:
- varianele probelor luate n considerare sunt omogene
- probele se formeaz randomizat (la ntmplare)
- varianele reprezint probe extrase din populaii normal
sau aproape normal distribuite
- numrul observaiilor este suficient de mare
Analiza varianei poate fi:
- simpl cnd valorile individuale se grupeaz dup un
singur criteriu
- dubl cnd observaiile se grupeaz dup dou criterii
- multipl cnd n experimente intervin mai mult e
grupri.

5.2 ANAIZA SIMPL A VARIANEI


Const n compararea mediilor mai multor colectiviti statistice n
ipoteza c dispersiile acestora sunt egale.
Observaiile se prezint sub forma din tabelul 5.1.
Tabelu l 5 . 1
Grupa (varianele Nr. valori
Valorile observate xij Suma Ti Media
factorului T) observate
1 x11 x12 x13 ... X1n1 n1 T1 x1
2 x21 x22 x23 ... X2n2 n2 T2 x2
...

...

...

...

...

k xk1 xk2 xk3 ... Xknk nk Tk xk


Total N=Sn i G=ST i x G/N
n i numrul de repetiii pe variante

n baza datelor din tabel, se calculeaz:

61
- suma total a ptratelor abaterilor
2
2
xij G2
Q x ij xij2
N N
2
G
dac se nlocuiete C Q xij2 C
N
unde C este denumit termen de corecie
- suma ptratelor abaterilor ntre grupe (variane)
Ti 2
QT C
ni
- suma ptratelor abaterilor din interiorul grupelor
(varianelor)
QE Q QT
QT
- variana ntre grupe (variane): sT2
fT
QE
- variana rezidual (eroare): s E2
fE
sT2 var ianta dintre grupe
- testul F: F
s E2 varianta reziduala
f T K 1 -numrul gradelor de libertate pentru variana
ntre grupe
f E N K - numrul gradelor de libertate al varianei
reziduale
Desfurarea calculelor este prezentat n tabelul 5.2.
Tabelu l 5 . 2

Suma ptratelor Numrul gradelor de


Sursa variaiei Dispersia F
abaterilor libertate
Ti 2 QT sT2
ntre grupe QT C fT K 1 s T2 F
K 1
ni s E2
n interiorul QE
grupelor (rezidual, QE Q QT fE N K sE2 F 0.05 =
N K
rest, eroare)
Q
Q x ij2 C s2 F 0.01 =
Total N -1 N 1

Valoarea teoretic a lui F se extrage din tabele, n funcie de f 1


numrul gradelor de libertate al varianei mai mari ( f T sau f E ) i f 2
numrul gradelor de libertate al varianei m ai mici.
Dac F c a l c u l a t > F t e o r e t i c ipoteza nul se respinge i, n acest caz,
se trece la o analiz de detaliu privind stabilirea semnificaiei
diferenelor dintre grupe , analiz ce se face prin intermediul testului t:

62
- se calculeaz eroarea diferenei di ntre variane ,
folosind variana rezidual:
1 1
sd sE
ni n j
dac numrul de observaii ( n) este acelai pentru toate
2s E2
grupele, relaia devine: s d
n
- se determin diferenele limit pentru diferite
probabiliti de transgresiune:
DL5% t 0, 05 s d ; DL1% t 0, 01s d ; DL0,1% t 0, 001s d
unde t se determin n funcie de f=N-K grade de
libertate.
Difrenele d xi x j dintre media varianei i i media varianei j
se compar cu diferenele limit calcula te pentru diferite probabiliti.
Dac:
- d< DL 5 % diferena este nesemnificativ
- DL 5 % <d<DL 1 % diferena este semnificativ
- DL 1 % <d<DL 0 , 1 % diferena este distinct
semnificativ
- d>DL 0 , 1 % diferena este foarte
semnificativ
La analiza simp a varianei, se pot utiliza grupe cu numr egal de
observaii sau grupe cu numr inegal de observaii .

Exempu:
n vederea extinderii molidului n afara arealului natural de
vegetaie se cere s se stabileasc condiiile staionale n ca re se obin
cele mai bune rezultate. Pentru aceasta s -au ales randomizat, n patru
tipuri de staiuni (I, II, III, IV), cte cinci arborete arborete de aceeai
vrst. Pentru fiecare arboret s -a determinat nlimea medie, nlime
considerat drept criter iu de estimare a productivitii arboretului.
S-au obinut urmtoarele date de teren:
Tabelu l 5 . 3

Grupa nlimi medii msurate (m) Sume Media


(tipul de ni
staiune) xij Ti x
I 16 18 17 14 20 5 85 17.0
II 12 13 11 13 11 5 60 12.0
III 13 14 13 15 10 5 65 13.0
IV 15 15 15 13 12 5 70 14.0
Total 20 280 14.0

63
Pentru simplificarea calculelor se scade 10 din fiecare valoare
observat, fr ca prin aceasta rezul tatul calculelor s se modifice cu
ceva:
Tabelu l 5 . 4

Grupa nlimi medii msurate (m) Sume Media 2


(tipul de ni si
staiune) xij Ti x
I 6 8 7 4 10 5 35 7.0 5.0
II 2 3 1 3 1 5 10 2.0 1.0
III 3 4 3 5 0 5 15 3.0 3.5
IV 5 5 5 3 2 5 20 4.0 2.0
Total 20 80 4.0
2
2
x Ii xI 12 12 0 32 32 20 0 2 12 12 12 12 4
s I 5 ; s II2 1;
N 1 4 4 4 4
.....
Se verific omogenitatea varianelor cu testul Hartley :
2
s max 5
H calc 2
5
s min 1
H t e o r e t i c = 20,6 - luat din tabele, n funcie de numrul gradelor de
libertate f=5-1=4 i de p=4 (numrul de grupe comparate), pentru =0,05.
Hcalculat Hteoretic ntre variane nu exist diferene semnificative
Potrivit schemei de calcul, obinem:
G 2 80 2 6400
C 320
N 20 20
Q xij2 C (6 2 82 7 2 ...) 320 36 64 49 16 100 ... 4 320 116

Ti 2 35 2 10 2 25 2 20 2
QT C 320 70 cu f T K 1 4 1 3
ni 5
grade de libertate
QE Q QT 116 70 46 cu f E N K 20 4 16 grade de
libertate
QT 70
variana ntre grupe: sT2 23.3
fT 3
Q E 46
variana rezidual: s E2 2.9
f E 16
Q 116
variana total: s 2 6.1
f 19
s T2 23.3
Fexp 2
8
s E 2. 9
F0,05 3.24 F0,01 5,29 , pentru f 1 =3 i f 2 =16

64
Fexp> Fteoretic diferen distinct semnificativ ntre tipurile de
staiune i, n acest caz, se trece la o analiz de detaliu privind stabilirea
semnificaiei diferenelor dintre grupe , analiz ce se face prin intermediul
testului t:
2s E2 2 * 2,9
-eroarea diferenei dintre variane : s d 1,077
n 5
-se determin diferenele limit pentru diferite probabiliti de
transgresiune:
pentru f=N-K =16 t 0 , 0 5 =2,12 DL5% t 0,05 s d 2.12 *1.077 2.27
t 0 , 0 1 =2,921
DL1% t 0,01s d 2.921*1.077 3.13
] t 0 , 0 1 =4,015 DL0,1% t 0,001s d 4.015 *1.077 4.3
-ntocmim tabelul cu difrenele d xi xj :
Tabelu l 5 . 5
diferene fa de grupa ...
Grupa x *** diferen foarte semnificativ
I II III IV
I 7.0 - 5,0 *** 4,0 ** 3,0 *
** diferen distinct semnificativ
II 4.0 - - 1 2
III 3.0 - - - 1
* diferen semnificativ
IV 2.0 - - - -

Deci, tipul I se deosebete semnificativ de tipul IV, distinct


semnificativ de tipul III i foarte semnificativ de tipul II. Productivitatea
mai ridicat a culturilor de molid din staiunea I este dovedit statistic.
Deosebirile dintre celelalte tipuri de staiuni sunt statistic neasigurate.

5.3. FOLOSIREA TESTULUI DUNCAN


Prin acest test se poate face o comparare mai riguroas a mediilor
Folosind datele din exemplul anterior, se procedeaz astfel :
- Se verific omogenitatea varianelor cu testul Bartlett
sau Hartley. Pentru a trece la etapa urmtoare
varianele trebuie s fie omogene.
- Se verific ipoteza nul (c nu exist diferene ntre
grupele analizate) folosind testul F.
- Dac F e x p >F t e o r se trece la stabilirea semnificaiei
diferenelor dintre medii
o Se calculeaz eroarea standard a
s E2 2.9
mediilor : s x 0.76
n 5
Cu f=N-k=20-4=16 grade de libertate

65
o Mediile grupelor se ordonea z descresctor, dup
cum urmeaz:
T ab elu l 5 . 6
Grupa I IV III II
x 7.0 4.0 3.0 2.0
rangul p fa de I 2 3 4
rangul p fa de IV 2 3
rangul p fa de III 2
o Din tabele, pentru f=16 grade de libertate, pentru
probabilitatea de transgresiune aleas i n funcie
de numrul mediilor cuprinse n serie (rang) p, se
determin valorile q (amplitudini de variaie
Student). Pentru exemplul c onsiderat obinem:
p 2 3 4
q 5% 3.00 3.14 3.24
q 1% 4.16 4.36 4.49
o Se calculeaz diferenele semnificative cele mai
mici, respectiv DL5% q 5% s x i DL1% q1% s x :
p 2 3 4
DL 5% 2.3 2.4 2.5
DL 1% 3.2 3.3 3.4
o Diferena dintre dou medii oarecare dintr -un ir de
k medii se consider semnificativ dac este mai
mare dect DL 5 % .
T ab elu l 5 . 7
Se compar Diferene dintre Diferena dintre
p q 5% DL 5%
grupele medii, d medii este
I cu II 7,0-2,0=5,0 4 3.24 2.5 semnificativ
I cu III 7,0-3,0=4,0 3 3.14 2.4 semnificativ
I cu IV 7,0-4,0=3,0 2 3.00 2.3 semnificativ
IV cu II 4,0-2,0=2,0 3 3.14 2.4 nesemnificativ
IV cu III 4,0-3,0=1,0 2 3.00 2.3 nesemnificativ
III cu II 3,0-2,0=1,0 2 3.00 2.3 nesemnificativ

Rezultatele se pot trece ntr -un tabel centralizator similar celui


folosit la stabilirea semnificaiei diferenelor dintre grupe prin
intermediul testului t.(tab.5.5)
Testul Duncan este mai sever dect testul t, de aceea este
mai folosit, n special n cazul cnd se compar un numr mare de
variane.

66
5.4. ANALIZA DUBL A VARIANEI

Valorile observate se grupeaz dup doi factori A i B.


Metoda permite analiza influenei exercitate de cei doi factori A i
B asupra caracteristicii luate n considerare (x i j ).
Datele privind variaia caracteristicii x n raport cu facorii A, B se
trec ntr-un tabel de forma: (tabelul 5.8)
Tabelu l 5 . 8
Variantele Variantele factorului B Media Variana
Suma Ai
factorului A
1 2 j n x si2
1 x11 x12 x1j X1n A1 xn1
2 x21 x22 x2j X2n A2 xn2
...

I xi1 xi2 xij Xin Ai xni


...

m xm1 xm2 xmj Xmn Am xnm


Suma Bj B1 B2 Bj Bn
Media xB1 xB2 xBj xBn
Variana si2
Etape de calcul:
-Se verific omogenitatea varianelor prin testul Hartley:
2
s max
H exp 2
s min
Dac H e x p <H t e o r e t i c se trece la analiza dubl a varianei
Se calculeaz suma ptratelor abaterilor
Ai2
- ntre variantele factorului A Q A C
n
Bi2
- ntre variantele factorului B Q B C
m
- n interiorul grupelor QE Q Q A Q B
G2
- pe total Q x ij2 C , unde C este termenul de
mn
corecie.
Se calculeaz numrul gradelor de libertate
- ntre variantele factorului A f A m 1
- ntre variantele factorului B f B n 1
- n interiorul grupelor fE m 1 n 1
- pe total f mn 1
Se calculeaz varian a
QA
- ntre variantele factorului A s A2
fA

67
QB
- ntre variantele factorului B s B2
fB
QE
- n interiorul grupelor (rezidual) s E2
fE
Se calculeaz valoarea testului F e x p :
s A2
- pentru variantele factorului A Fexp A
s E2
s B2
- pentru variantele factorului B Fexp B
s E2
Se stabilete valoarea teoretic a lui F, att pentru
factorul A ct i pentru factorul B, n funcie de
numrul gradelor de libertate f A sau f B i f E , precum i
n funcie de probabilitatea de transgresiune.
Dac Fexp>Fteoretic, att pentru A ct i pentru B, se
trece la analiza de detaliu privind stabilirea
semnificaiei diferenelor dintre grupe, analiz ce se
face cu ajutorul diferenelor limit, analog celor
prezentate la analiza simpl a varianei.

5.5. METODE NEPARAMETRICE PENTRU COMPARAREA


MAI MULTOR GRUPE
Aceste metode permit o stabilire mai uoar a semnificaiei
diferenelor dintre mai multe grupe. Ele pot fi aplicate i atunci cnd nu
se cunoate tipul de distribuie. Prezint d ezavantajul de a fi mai puin
precise dect metodele clasice (parametrice)
Testul rangurilor se bazeaz pe statistica:
2 12 S i2
3( N 1)
N ( N 1) Ni
unde: S i este suma rangurilor pentru grupa i
N i este numrul observaiilor din grupa i
N este numrul total de observaii
Rangul se stabilete astfel :
-se face o clasificare a observaiilor dup mrimea lor
-cu 1 se noteaz observaia cea mai mic, cu 2 observaia
urmtoare ca mrime, cu N se noteaz cea mai mare valoare.
-n cazul n care n seria de observa ii se ntlnesc dou sau mai
multe valori identice, rangul se va stabile calculnd medii aritmetice de
rang.
2 2
c a l c u l a t se compar cu t e o r e t i c , extras din tabele n funcie de
probabilitatea acceptat p i f=K-1, unde K este numrul grupelor
comparate.

68
Exemplu:
S se stabileasc dac speciile de molid, brad i fag dintr -un
arboret amestecat i plurien se deosebesc semnificativ ntre ele din punct
de vedere al nlimilor medii. n acest scop au fost murate nlimi la
arbori cu diametrul apropriat de di ametrul indicator de 50 cm.(tabelul
5.9).
Tabelu l 5 . 9
nlimile (m) Ranguri
Molid Brad Fag Molid Brad Fag
24.5 25.3 23.0 4 6 1
25.0 25.7 23.7 5 8 2
26.2 25.9 24.1 15 10 3
27.3 26.3 25.5 21 16.5 7
27.5 26.9 25.8 22.5 18 9
28.3 27.0 26.0 25 19 11.5
28.4 27.2 26.0 26 20 11.5
28.7 27.5 26.1 27 22.5 13
29.0 28.0 26.1 28.5 24 14
- 29.0 26.3 - 28.5 16.5
Total Si 174.0 172.5 88.5

2 12 S i2 12 174.0 2 172.5 2 88.5 2


calc 3( N 1) 3(29 1) 8.24
N ( N 1) Ni 29(29 1) 9 10 10

2
pentru f=3-1=2 grade libertate i =0,05 , din tabele tab= 5,99
2calc> 2tab ipoteza nul se respinge, speciile se deosebesc
semnificativ ntre ele din punct de vedere al nlimilor

CAPITOLUL 6 : ANALIZA CORELAIEI

6.1. ASPECTE TEORETICE


Prin analiza varianei se pune n eviden influena unor factori
asupra unei caracteristici studiate dar nu se determin gradul acestei
influene, nu se spune nimic cu privire la forma legturii puse n eviden.
n scopul evidenierii acestor aspecte se apeleaz la teoria corelaiei .
Cercetarea este interesat s cunoasc, prin intermediul teoriei
corelaiei, dependena care exi st ntre dou sau mai multe variabile.
Analiza corelaiei este o metod prin care se cerceteaz i se
exprim existena, natura i intensitatea legturilor dintre variabile, prin
intermediul unor indicatori statistici.
Distribuiile bidimensionale au dou variabile:
- x, variabila independent, stabilit arbitrar i considerat ca
nefiind afectat de erori
- y, variabila dependent care se obine prin msurtori i care
este afectat de erori.

69
Ca variabil independent se alege ntotdeauna acea mrime care
se determin uor i direct iar ca variabil dependent se alege mrimea
care se stabilete indirect, prin utilizarea unor instrumente. De exemplu:
diametrul de baz d 1 , 3 -variabila independent iar nlimea arboretului h
variabila dependent.
Relaiile dint re dou variabile pot fi :
- relaii funcionale y f (x) , de exemplu : S r2
- relaii statistice (corelaii) , la care pentru aceeai valoare a
lui x, pot fi valori diferite pentru y, ca de exemplu : pentru
acelai diametru (x) putem avea nlimi diferite ( y).
n cazul relaiilor statistice corespondena nu are loc de la valoare
la valoare ci de la valoare la distribuie, deci fiecrei valori x i
corespunde o anumit distribuie cu caracteristicile ei statistice (medie,
dispersie, etc.), caracteristici ce se modific odat cu x (pentru fiecare x
distribuia este alta).
Corelaia poate fi : simpl (cnd se refer la dou variabile x i y)
sau multipl (cnd asupra lui y influeneaz 2 sau mai multe
caracteristici).
Corelaia poate fi, de asemenea, pozitiv (direct) sau negativ
(invers), liniar sau curbilinie.

6.2. METODE DE CONSTATARE A CORELAIILOR


Existena corelaiilor poate fi identificat cu ajutorul
reprezentrilor grafice (pentru N<100) sau cu ajutorul tabelei de
corelaie (pentru N>100).
Cu ct axa mic a elipsei de corelaie este mai mic comparativ cu
axa mare, cu att corelaia este mai strns. Forma norului de puncte
ofer informaii asupra tipului corelaiei. Dac norul de puncte este foarte
dispersat, nseam n c nu exist corelaii ntre cele dou variabile.
Tabela de corelaie are dou intrri: una pentru variabila
independent x, alta pentru variabila dependent y. n tabel se trec datele
de baz, grupate pe clase. Sumele coloanelor reprezint distribuia
marginal a variabilelor. Fiecare distribuie marginal are o medie i o
abatere standard proprie.

70
Tabela de corelatie
y/x 8 10 12 14 ny
10
10.5
11
11.5
12

nx

6.3. COVARIANA
n cazul a dou nsuiri corelate avem de a face cu dou distribuii
de frecvene: o distribuie a variabilei x, caracterizat printr -o varian
s 2 x , i o distribuie a variabilei y caracterizat prin variana s 2 y . Se poate
vorbi ns i de o varian comun s 2 x y denumit covarian, care
reprezint gradul de mprtiere a celor dou variabile x i i y i fa de
mediile respective i este dat de relaia:
xi x y i y 1
s xy2 sau s xy2 xi y i xy
n 1 n
Pentru valori grupate se folosete relaia:
1 1
s xy2 n ij x i y j ni xi nj yj
n 1 n
n toate situaiile: s xy2 sx sy .
Covariana este un indice al corelaiei care indic i sensul
acesteia.
Valoarea covarianei trebuie s se ncadreze n intervalul dintre
valorile celor doua variane, adic s xy2 s x2 , s y2 .

71
6.4. COEFICIENTUL DE CORELAIE

xy
Coeficientul de corelaie teoretic exprim gradul
x y

legturii liniare dintre cele dou variabile.


Datorit faptului c de cele mai multe ori nu se cunoate, n
s xy
locul lui se folosete coeficientul de corelaie empiric r determinat
sx s y
pe baza probei extras din populaie.
Coeficientul de corelaie indic gradul de mprtiere al variabilei
y n jurul dreptei de regresie, rednd totodat i intensitatea legturii
dintre cele dou variabile.
Deoarece 2
xy
2 2
x y r 1, 1 . Valoarea lui r, n mrime
absolut, indic intensitatea corelaiei. Cu ct r este mai apropiat de +1
sau 1 cu att legtura ntre variabile este mai strns. Pentru r= 1
legtura este funcional. Semnul plus indic o corelaie direct iar
semnul minus o corelaie invers.
Indicaiile coeficientului de corelaie sunt valabile numai n cazul
distribuiilor bidimensionale normale sau apropiate de aceasta.
Pentru calculul coeficientului de corelaie se calculeaz abaterile
s xy
standard s x , s y i covariana s x y , dup care se aplic formula: r .
sx s y
Calculul se mai poate face, pentru valori negrupate n clase, cu
relaia:
N xy x y
r ,
2 2 2 2
N x x N y y
iar pentru valori grupate n clase cu relaia:

N xyn xy xn x yn y
x y x y
r
2 2
2 2
N nx x nx x N ny y ny y
x x y y

Se pot utiliza i momentele centrate de ordin II ( m x , m y , m z ) pentru


seriile x,y,z:
mz mx m y
r
2 mx m y
Seria z se obine fcnd sumele pe diagonal n tabelul de corelaie.
Cu programele de calcul statistic sau tabelar coeficientul de
corelaie se calculeaz direct. De exemplu, n programul EXCEL se

72
utilizeaz funcia CORRELa foii de lucru sau Correlation din
pachetul Data Analys (analiz date)- meniul Tools (instrumente).
Exemplu:
nrt-un arboret de salcm s -au msurat creterile radiale pe ultimii
10 ani i diametrul de baz la 20 de arbori. S se stabi leasc intensitatea
corelaiei folosind coeficientul de corelaie r, deoarece din cercetri
anterioare se cunoate c regresia dintre creterea radial i diametru este
liniar.
Diamet Creter
Nr cr ea
rul cm
radial xy x2 y2
t
x mm y

1 20 10 200 400 100


2 16 7 112 256 49 Utiliznd funcia CORRELa foii de lucru,
3 18 9 162 324 81 din programul EX CEL:
4 14 7 98 196 49 r = 0,908089872
5 20 12 240 400 144
6 24 14 336 576 196
7 22 11 242 484 121
8 14 6 84 196 36 Utiliznd instrumentul Correlation din
9 16 7 112 256 49 pachetul Data Analys (analiz date)- meniul
10 17 8 136 289 64 Tools (instrumente) vom obine:
11 14 4 56 196 16
Diametrul cm Creterea
12 26 18 468 676 324
x radial mm y
13 20 9 180 400 81
14 20 13 260 400 169
Diametrul cm
15 18 8 144 324 64 1
x
16 12 6 72 144 36
17 20 7 140 400 49
18 16 7 112 256 49 Creterea
0,908089872 1
19 24 16 384 576 256 radial mm y
20 22 14 308 484 196
TOTAL 373 193 3846 7233 2129

N xy x y 20 * 3846 373 * 193


r 0,908
2 2
N x 2
x N y 2
y 20 * 7233 373 2 20 * 2129 193 2

73
6.5 EXAMINAREA SEMNIFICAIEI COEFICIENTULUI DE
CORELAIE
Coeficientul de corelaie r, al probei, estimeaz coeficientul de
corelaie al populaiei din care a fost extras proba. Este necesar s se
examineze dac valoarea calculat a lui r este real sau se datorete doar
unor erori de eantionaj.
Verificarea se face printr -un test de conformitate, verificnd
ipoteza nul H 0 : =0.
a) n toate cazurile cnd numrul de msurtori este mic
(N <30) i r este apropiat de 1 , se folosete transformarea propus de
Fisher:
1 1 r
z ln
2 1 r
n programul EXCEL se poate utilizeaz funcia Fisher a foii de
lucru.
Variabila z are proprietatea de a se distribui normal, spre
deosebire de valorile lui r, care uneori prezint distribuii mult diferite de
cea normal.
Dup transformarea de m ai sus, se calculeaz statistica u:
z z
u , unde s z reprezint eroarea valorii z
sz 1
N 3
Dac u c a l c u l a t < u t a b e l a r pentru probabilitatea de transgresiune
acceptat, se accept ipoteza nul. Corelaia dintre variabile nu poate fi
dovedit. Dac u c a l c u l a t >u t a b e l a r corelaia este dovedit.
1
n funcie de limitele de ncredere a valorii z: z us x z u
1
N 3
se pot stabili i limitele de ncredere pentru coeficientul de corelaie r.
b) Cnd numrul de msurtori este mic (N <30) i r este apropiat
de 0, se aplic testul t :
r
t exp N 2
1 r2
pentru f=N-2 grade de libertate. Dac t e x p <t t a b e l a r atunci corelaia este
nesemnificativ.
c) Dac numrul de msurtori este mare (N >30) i r este
apropiat de 0, se aplic testul u:
r 1 r2
u exp , unde s r
sr N
Dac u e x p <u t a b e l a r atunci se accept ipoteza nul, corelaia nu este
semnificativ.

74
d) Dac numrul de msurtori este mare (N >30) i r este
apropiat de 1, se poate folosi testul F a lui Fisher:
( N 2) r 2
Fexp
1 r2
Dac F e x p <F t a b e l a r corelaia este nesemnificativ.

6.6. COMPARAREA A DOI COEFICIENI DE CORELAIE


Pentru examinarea semnificaiei diferenei dintre doi coeficieni de
corelaie, r 1 i r 2 , se utilizeaz un test de egalitate ( testul t), a valorilor
transformate z:
z1 z 2 1 1
t exp , unde s d s z21 s z22
sd N1 3 N 2 3
t t a b e l a r se stabilete n funcie de numrul gradelor de libertate f=N1+N2-
6 i de probabilitatea de transgresiune . Dac t e x p <t t a b e l a r atunci diferena
dintre r 1 i r 2 este nesemnifi cativ.
La compararea unui coeficient de corelaie empiric r cu un
coeficient de corelaie teoretic , se utilizeaz formula:
zr z
t exp , pentru f=N-3 grade de libertate.
1
N 3
Pentru un numr mare de observaii t=u. Dac t e x p <t t a b e l a r atunci diferena
dintre r i este nesemnificativ.

6.7. CORELAREA RANGURILOR


Metodele neparametrice fac abstracie de condiia cunoaterii
anterioare a tipului de distribuie, condiie obligatorie n cazul metodelor
parametrice, care nu pot fi aplicate dect pent ru distribuii bidimensionale
normal distribuite. De aceea, metodele neparametrice se aplic atunci
cnd avem indicii c ntre variabila dependent i cea independent exist
o legtur de corelaie dar nu cunoatem tipul de distribuie. De
asemenea, metod ele neparametrice se pot aplica n cazul caracteristicilor
calitative, deoarece nu opereaz cu cu valorile reale a le caracteristicilor
ci cu rangurile acestora.
Coeficientul de corelaie a rangurilor indic intensitatea corelaiei
i se calculeaz, dup Spearman , cu relaia:
6 d2
rs 1 , unde d reprezint diferena de rang.
N ( N 2 1)
Rangul se stabilete astfel: se clasific observaiile dup mrimea
lor, att pentru irul de observaii x ct i pentru irul de observaii y. Cu

75
1 se noteaz observaia ce a mai mare, cu 2 observaia urmtoare ca
mrime i aa mai departe. Rangul N l are cea mai mic valoare. n cazul
cnd exist mai multe observaii cu aceeai mrime, se calculeaz medii
aritmetice de rang. De exemplu, dac pe poziia 3,4,5 i 6 observaii le au
aceeai mrime, la toate li se atribuie rangul 4,5.
Suma rangurilor, att pentru variabila x ct i pentru variabila y,
va fi:
N (N 1)
xi yi , unde x i , respectiv y i reprezint rangurile
2
n cazul unei concordane perfecte ntre rangurile ce lor dou
variabile, suma ptratelor diferenelor dintre ranguri este nul ( d 2 =0) iar
r s =1. Pe msur ce diferenele dintre ranguri sunt mai mari, r s va scdea.
Semnificaia corelaiei de rang se stabilete comparnd valoarea
obinut cu valorile limit, alese n funcie de numrul gradelor de
libertate f=N-2 i probabilitatea de transgresiune .
Exemplu:
La 10 arborete de stejar din lstari, toate de aceeai vrst i
situate n aceleai condiii staionale, s -au determinat consistena i
procentul arborilor n curs de uscare. S se determine dac corelaia ntre
consisten i procentul de uscare este semnificativ. Datele sunt
urmtoarele:
Procentul RANGUL Diferena de
Nr.c Consistena arborilor n RANGUL dup procentul rang
dup
rt arboretelor curs de arborilor n
consisten
uscare curs de uscare 2
d d
1 0,3 22 10 5 5 25
2 0,4 26 9 1,5 7,5 56,25
3 0,5 24 7,5 4 3,5 12,25
4 0,5 26 7,5 1,5 6 36
5 0,6 25 6 3 3 9
6 0,7 20 4,5 6 -1,5 2,25
7 0,7 18 4,5 7 -2,5 6,25
8 0,8 17 3 8 -5 25
9 0,9 10 2 10 -8 64
10 1,0 15 1 9 -8 64
total 55 55 0 300
2
6 d 6 * 300 1800
rs 1 2
1 1 1 1,82 0,82
N ( N 1) 10(100 1) 990
Pentru f=10-2=8 , din tabele, se ia coeficientul limit :
0,632 pentru =5% ,
0,765 pentru =1% i
0,872 pentru =0,1%.
Din comparaie, rezult c, pentru o probabilitate de transgresiune de 1%,
corelaia ntre procentul de uscare i consistena arboretelor este
semnificativ.

76
BIBLIOGRAFIE

1. F.Wilcoxon: Individual comparisons by ranking methods,


BiometricsBul.,180-83,1947

2. Hollander, Wolfe DA; Non parametric statistical


methods, J.Wiley,New York, 1973

3. Vaduva, I. (1970) Analiz dispersional. Bucuresti, Ed.


Tehnic

4. Saporta, C. (1990) Probabilit, Analyse des donnes et


statistique.Paris, Ed. Technip

5. M. Iosifescu, Gh. Mihoc, R. Teodorescu, Teoria


probabilitatilor si statistica matematica, Ed. Tehnica,
Bucuresti, 1966

6. M. Tiron, teoria erorilor de masurare si metoda celor mai


mici patrate, Ed. Tehnica, Bucuresti, 1972

7. M. R. Spiegel, Probability and statistique, McGraw


Hill, New York, 1980

77