Sunteți pe pagina 1din 214

CUPRINS

INTRODUCERE ................................................................................................................. 7
1. CONCEPTE GENERALE .............................................................................................. 8
2. APRECIEREA I PREZENTAREA DATELOR ...................................................... 12
2.1. SCALE DE MSURARE I TIPURI DE VARIABILE .......................................................... 12
2.2. REPREZENTAREA DATELOR ....................................................................................... 17
3. DESCRIEREA STATISTIC A PROBELOR ECOLOGICE ................................. 23

3.1. TENDINA CENTRAL ............................................................................................... 23


3.2. VARIABILITATEA ...................................................................................................... 29

ES

4. DISTRIBUII PROBABILISTICE ............................................................................. 34

ZA

FI
R

4.1. DISTRIBUIA BINOMIAL .......................................................................................... 36


4.2. DISTRIBUIA POISSON............................................................................................... 40
4.3. DISTRIBUIA BINOMIAL NEGATIV ......................................................................... 42
4.4. ESTIMAREA DISPERSIEI UNEI POPULAII .................................................................... 44
4.4.1. Indici de dispersie ............................................................................................ 44
4.4.2. Modelul binomial ............................................................................................. 49
4.4.3. Modelul Poisson ............................................................................................... 51
4.4.4. Modelul binomial negativ................................................................................. 53
4.5. DISTRIBUIA NORMAL ............................................................................................ 55
4.5.1. Aprecierea normalitii datelor........................................................................ 61

5. STATISTIC INFERENIAL: ELEMENTE INTRODUCTIVE ........................ 65


5.1. ESTIMAREA MEDIEI POPULAIONALE ........................................................................ 65
5.2. ESTIMAREA UNEI PROPORII ..................................................................................... 71
5.3. ESTIMAREA EFECTIVULUI POPULAIONAL ................................................................ 71
5.4. ESTIMAREA INDICELUI DE DIVERSITATE.................................................................... 72
5.5. TESTAREA IPOTEZELOR STATISTICE .......................................................................... 74
6. TESTAREA UNEI IPOTEZE PRIVIND MEDIA UNEI SINGURE
POPULAII ............................................................................................................. 79
7. TESTAREA DIFERENEI DINTRE DOU PROBE .............................................. 85
7.1. COMPARAREA A DOU PROBE INDEPENDENTE .......................................................... 85

7.1.1. Testul (Student) pentru probe independente .................................................. 85


7.1.2. Testul (Mann-Whitney) ................................................................................. 89
7.2. COMPARAREA A DOU PROBE NEINDEPENDENTE ...................................................... 92
7.2.1. Testul (Student) pentru perechi de observaii ................................................ 93
7.2.2. Testul (Wilcoxon) .......................................................................................... 96
8. TESTAREA DIFERENELOR DINTRE TREI SAU MAI MULTE PROBE...... 102

ES

8.1. PRINCIPIUL ANOVA .............................................................................................. 103


8.1.1. Testarea omogenitii varianei interne ......................................................... 104
8.2. TIPURI DE ANOVA................................................................................................. 107
8.2.1. ANOVA unifactorial ..................................................................................... 108
8.2.2. ANOVA unifactorial neparametric Kruskal-Wallis .................................... 116
8.2.3. ANOVA bifactorial fr replicare ................................................................ 118
8.2.4. ANOVA bifactorial neparametric Friedman .............................................. 126
8.2.5. ANOVA bifactorial cu replicare ................................................................... 128
9. CORELAIA I REGRESIA..................................................................................... 143

FI
R

9.1. ANALIZA CORELAIEI ............................................................................................. 144


9.1.1. Analiza corelaiei parametrice ....................................................................... 147
9.1.2. Analiza corelaiei neparametrice ................................................................... 153
9.2. ANALIZA REGRESIEI ................................................................................................ 157
10. ANALIZA FRECVENELOR I A DATELOR NOMINALE ............................ 171

ZA

10.1. TESTUL
DE CONCORDAN ............................................................................. 173
10.2. TESTUL
DE ASOCIERE ...................................................................................... 177
10.3. TESTUL EXACT AL LUI FISHER............................................................................... 183
10.4. TESTUL MCNEMAR ............................................................................................... 187
BIBLIOGRAFIE ............................................................................................................. 192
ANEXA 1: CHEIE DIHOTOMIC PENTRU DETERMINAREA TIPULUI DE
ANALIZ STATISTIC ...................................................................................... 195
ANEXA 2: TABELE CU VALORI CRITICE .............................................................. 198
ANEXA 3: FUNCII MICROSOFT OFFICE EXCEL ............................................... 205
INDEX ALFABETIC ...................................................................................................... 215

INTRODUCERE

ZA

FI
R

ES

n prezent, valorificarea investigaiilor ecologice nu poate fi


conceput fr o analiz statistic a datelor, fr aa-numita asigurare
statistic ce red msura n care concluziile acestor investigaii ar putea fi
reale. Analiza statistic a datelor, fr a fi un scop n sine al demersului
tiinific n ecologie, reprezint o unealt ce permite o mai bun
comprehensiune i prezentare a informaiei coninute de rezultatele
cercetrilor.
n prezent, prelucrarea statistic a datelor este facilitat de utilizarea
computerului i a programelor corespunztoare. Utilizarea acestora trebuie
s fie fcut numai dup nelegerea conceptelor i procedurilor metodelor
statistice. Altfel, aceste instrumente vor reprezenta un fel de cutie neagr
n care se introduc rezultatele cercetrilor i din care rezult nite concluzii
despre a cror corectitudine nu se poate spune mare lucru.
Prezenta lucrare ncearc s ofere o baz conceptual pentru cei care
se dedic cercetrilor cu caracter ecologic. Din acest motiv, pe parcursul
capitolelor apar numeroase exemple inspirate din cercetri ecologice.
Lucrarea poate fi ns de ajutor i pentru analiza datelor rezultate n urma
investigaiilor din diverse ramuri ale biologiei sau ale tiinelor conexe.
n prima parte a crii sunt prezentate o serie de noiuni de baz n
statistic, care s asigure nelegerea limbajului intrinsec al acestei tiine.
Urmeaz o parte dedicat statisticii descriptive i principalelor distribuii
probabilistice cu aplicativitate n ecologie. Partea urmtoare trateaz
aspectele de principiu ale statisticii inductive i prezint principalele teste
care se utilizeaz pentru comparaia probelor. n continuare sunt prezentate
modaliti de analiz a asocierii dintre dou variabile, iar ultima parte
cuprinde metode de analiz ale frecvenelor. La finalul crii sunt trei anexe:
prima reprezint o cheie de decizie asupra metodelor statistice, prin care pot
fi prelucrate date, a doua cuprinde tabelele cu valorile critice necesare
pentru diferite teste statistice, iar a treia cuprinde funciile statistice din
programul MS-Excel. Cartea se termin cu un index alfabetic al termenilor
statistici folosii pe parcursul lucrrii.

1. CONCEPTE GENERALE

ZA

FI
R

ES

Statistica reprezint o parte important din preocuprile actuale ale


biologilor i ecologilor. Termenul statistic este folosit n dou ipostaze:
fie se refer la colecii de informaie cantitativ i la metode de procesare a
acestora, fie la procesul de stabilire a unor concluzii privind grupuri de
dimensiuni mari, n urma analizei unor pri din aceste grupuri.
Statistica este tiina care se ocup cu organizarea, descrierea i
analiza numeric a fenomenelor cuantificabile, dezvluind particularitile
lor de volum, structur, dinamic, conexiune, precum i regulile sau legile
care le guverneaz.
Pentru ecologi i pentru cei care, n general, studiaz fenomene
variabile cu implicaii preponderent probabilistice, statistica este util pentru
dirijarea colectrii, organizrii i prezentrii datelor, precum i pentru
tragerea concluziilor cu o anumit probabilitate sau grad de incertitudine de
pe urma analizei datelor.
Trebuie menionat c o analiz statistic nu demonstreaz nimic, ci
doar indic probabilitatea unui anumit rezultat sau concluzii trase n urma
analizei datelor.
Att n statistic, ct i n cadrul ecologiei i a celorlalte ramuri ale
biologiei, apare noiunea de populaie. Accepiunea biologic a acestui
termen este de grup de indivizi ce aparin unei anumite specii, ntre care se
stabilesc interaciuni i ale cror gene alctuiesc un genofond omogen. Din
punct de vedere statistic, populaia are un neles mai larg dect cel biologic,
referindu-se la o colecie de uniti individuale, ce constituie obiectul unei
investigaii. Populaia statistic reprezint un grup de entiti de un anumit
tip din univers sau dintr-o subdiviziune specificat a universului. Este
grupul de dimensiuni mari pe care dorim s-l cunoatem. Aa cum spuneam
n primul paragraf, cunoaterea unui astfel de grup sau populaii se poate
face prin intermediul analizei unei pri. O astfel de parte, care este extras
din populaie pentru a fi studiat, se numete n general eantion sau prob.
Noi vom folosi n continuare noiunea de prob bine ncetenit n

Concepte generale

ZA

FI
R

ES

comunitatea tiinific ecologic. Deci proba este un grup mai mic, dar
reprezentativ pentru populaia din care a fost extras.
Studiul unei populaii presupune investigarea uneia sau mai multor
caracteristici ale unitilor din probe, caracteristici care se numesc variabile.
Valorile unei variabile corespunztoare entitilor unei populaii se numesc
valori individuale. Valorile individuale cunoscute, corespunztoare
unitilor din probe, se numesc date sau observaii.
n ecologie, de multe ori, se numr entitile dintr-un grup sau
dintr-o colecie. Pentru ca o astfel de numrtoare s aib valoare, trebuie
specificat dimensiunea grupului sau coleciei, care se numete unitatea de
prob. Un set de uniti de prob alctuiesc o prob, iar observaia este
numrul de entiti dintr-o anumit unitate de prob.
Principala diferen dintre numrtori i msurtori este, n cazul
msurtorilor, lipsa unui control asupra dimensiunii unitilor de prob.
Atunci cnd se numr entiti, se poate decide care este unitatea de prob.
Coninutul unei capcane sau ptrat de prob reprezint o prob dac
entitile investigate sunt msurate, i o unitate de prob dac entitile sunt
doar numrate.
O ntrebare cu un rspuns nu ntotdeauna evident se refer la
identificarea populaiei din care provin unitile de prob. Dac ceea ce s-a
capturat din zece capcane de sol constituie o prob, care este populaia din
care a fost extras aceast prob? n acest caz, populaia este reprezentat de
numrul total de capcane care ar fi putut fi instalate n ntreaga suprafa de
studiu. O astfel de populaie este una ipotetic.
Pentru ca o prob s fie reprezentativ pentru populaia din care a
fost extras este necesar ca prelevarea acesteia s fie fcut aleator,
randomizat sau la ntmplare. Aceasta nseamn c unicul criteriu folosit
n extragerea unitilor de prob este ca toate unitile s aib anse egale de
a face parte din prob. De exemplu, dac proba se obine cu ajutorul unor
capcane cu momeal, animalele care vor cdea n acestea vor fi cele mai
flmnde i eventual cu o greutate mai mic. Astfel, proba obinut nu va fi
reprezentativ pentru populaie, deoarece animalele cu o greutate mai mic
au anse mai mari s fie capturate dect cele cu o greutate mai mare i care
sunt mai stule. Dac proba nu este reprezentativ, atunci generalizrile care
se vor face pornind de la aceasta, cu privire la ntreaga populaie, vor fi
eronate. Dac ne referim la exemplul anterior, proba obinut cu ajutorul

10

Elemente de statistic aplicate n ecologie

ZA

FI
R

ES

capcanelor cu momeal este reprezentativ pentru populaia statistic a


animalelor flmnde din populaia biologic. Obinerea unor probe aleatoare
este asigurat de metodele de lucru utilizate n funcie de caracteristicile
entitilor urmrite. n cazul n care exist suspiciunea c o prob nu este
aleatoare, acest lucru trebuie specificat sau concluziile rezultate prin
extrapolare trebuie legate de populaia statistic din care proba a fost
extras.
Un alt aspect important este reprezentat de independena
observaiilor din probe. Aceasta se refer la faptul c apariia unei anumite
valori individuale ntr-o prob nu influeneaz probabilitatea de apariie n
prob a altei valori. De exemplu, dac se studiaz o populaie ipotetic
format din zece entiti, probabilitatea de a extrage o entitate este de 1/10,
iar dac nu se face reintroducere, probabilitatea de a extrage urmtoarea
entitate este de 1/9 i aa mai departe. Deci extragerea unei entiti
modific probabilitatea de extragere a celorlalte i observaiile nu sunt
independente. O astfel de situaie nu trebuie s constituie un motiv de
preocupare n cazul populaiilor mari, aa cum sunt majoritatea populaiilor
biologice.
Uneori, obinerea unor observaii neindependente este intenionat.
De exemplu, cnd se dorete studierea efectului unui anumit tratament
asupra variabilei, se fac observaii repetate asupra acelorai entiti pentru a
evidenia dac deosebirile dintre observaii sunt diferite semnificativ, adic
dac tratamentul a modificat valorile variabilei semnificativ. Dac ns se
fac observaii repetate asupra unei singure entiti, atunci concluziile
rezultate nu pot fi extrapolate la populaia de provenien a entitii
respective, deoarece proba cu dimensiunea unu nu este reprezentativ.
Un descriptor sau o msur a unei variabile n prob se numete
statistic. O statistic a unei probe se folosete de obicei pentru a estima un
parametru al populaiei. De exemplu, media valorilor dintr-o prob este o
statistic, iar media populaiei din care a fost extras proba, un parametru.
Dat fiind faptul c n ecologie sunt rare cazurile n care se poate afla media
unei populaii prin investigarea fiecrei uniti de prob, media populaiei
respective poate fi estimat pornind de la statistica probei reprezentative.
Populaiile ipotetice au parametri ipotetici i sunt de obicei folosite
pentru comparaii. De exemplu, media numrului de plante dintr-o anumit
specie din zece ptrate de 1
este o estimare a mediei numrului de plante

Concepte generale

11

ZA

FI
R

ES

per ptrat sau metru ptrat, adic parametrul populaiei de ptrate care s-ar
putea delimita n aria de studiu. Astfel de parametri sunt utili atunci cnd se
compar diferite zone de studiu (dou zone stepice, dou zone de pdure,
dou bazine acvatice etc.).
Atunci cnd se estimeaz un parametru populaional pornind de la
statistica corespunztoare, dimensiunea probei sau numrul unitilor de
prob are o mare importan. n general, cu ct proba are o dimensiune mai
mare, cu att va fi mai reprezentativ pentru populaia de provenien i
estimarea parametrilor mai precis. Totui obinerea unor probe extrem de
numeroase este uneori imposibil sau presupune un efort foarte mare care ar
putea fi investit n alte direcii de cercetare. Astfel, este bine s existe un
echilibru ntre aceste dou aspecte, ntre dimensiunea probei i efortul
necesar obinerii acesteia.

2. APRECIEREA I PREZENTAREA DATELOR

Variabilele sunt caracteristici sau caractere care au valori ce pot fi


diferite de la un individ la altul, ntr-o populaie. Deci o variabil poate lua
mai multe valori individuale n populaia studiat. Valorile individuale
determinate prin investigarea unor indivizi sau uniti dintr-o prob se
numesc date.

ES

2.1. SCALE DE MSURARE I TIPURI DE VARIABILE

ZA

FI
R

De exemplu, ntr-o populaie de peti dintr-o anumit specie, se


investigheaz lungimea indivizilor. Lungimea reprezint o caracteristic sau
un caracter al tuturor indivizilor din populaie, deci este o variabil.
Lungimea petilor are valori diferite de la un individ la altul sau de la un
grup de indivizi la altul. Aceste valori ale tuturor indivizilor din populaie se
numesc valori individuale. Dac se captureaz un anumit numr de peti (se
extrage o prob) din populaia de studiu i se msoar lungimea fiecrui
individ, valorile individuale astfel determinate constituie datele.
n funcie de relaiile ce se pot stabili ntre valorile individuale ale
unei variabile, aceasta poate aparine unui anumit tip de variabil, care la
rndul su poate fi apreciat pe o anumit scal cu anumite reguli i limitri.
n general, sunt recunoscute patru astfel de scale de apreciere a variabilelor:
nominal, ordinal, de interval i de raport. Relaia dintre aceste scale
este una ierarhic, adic o scal de nivel superior ncorporeaz proprietile
scalelor inferioare acesteia.
Scala nominal. Este cea mai simpl modalitate de apreciere a
variabilelor. n esen, permite doar identificarea categoriilor n care valorile
individuale pot fi clasificate. Categoriile se exclud reciproc, adic o anumit
valoare poate aparine doar unei singure categorii din scal. Variabilele
corespunztoare acestei scale se numesc variabile nominale sau atribute.

Aprecierea i prezentarea datelor

13

Oricare dou valori ale unei astfel de variabile pot aparine aceleiai
categorii sau la dou categorii diferite ale scalei ordinale, cu alte cuvinte pot
fi egale sau diferite (tab. 2.2).
De exemplu, sexul indivizilor unei populaii este o variabil
nominal, ale crei valori individuale posibile sunt mascul i femel. Doi
indivizi dintr-o populaie pot avea acelai sex (mascul sau femel) sau pot
avea sexe diferite (unul este mascul, cellalt este femel) la un moment dat.
Deci valorile variabilei sex pot fi egale (aparin aceleiai categorii a scalei
nominale) sau diferite (aparin la categorii diferite ale scalei nominale). Alte
exemple de variabile nominale ntlnite n ecologie sunt: culoarea, tipul de
habitat, specia.

ZA

FI
R

ES

Scala ordinal. Aceasta include proprietile scalei nominale


(identificare i clasificare), la care se mai adaug posibilitatea de ordonare a
categoriilor ntr-o serie, de la valoarea cea mai mic la cea mai mare, sau de
specificare a magnitudinii acestora. Variabilele corespunztoare acestei
scale se numesc variabile ordinale. Oricare dou valori ale unei astfel de
variabile pot fi egale sau diferite. n cazul n care sunt diferite, valorile se
pot ordona, adic se poate spune c una dintre valori este mai mare dect
cealalt (tab. 2.2). n general, valorile variabilelor ordinale se reprezint sub
form de magnitudine relativ.
De exemplu, dac ntr-o populaie de lupi urmrim variabila
agresivitate, valorile individuale pot fi neagresiv, puin agresiv,
agresiv i foarte agresiv. Doi indivizi pot fi egali sau diferii din punctul
de vedere al agresivitii, iar dac sunt diferii, atunci se poate determina c
unul este mai agresiv dect cellalt (c o valoare este mai mare dect
cealalt), dar nu se poate spune exact cu ct.
O alt modalitate de a reprezenta valorile pe scala ordinal const n
folosirea unor simboluri numerice corespunztoare magnitudinii valorilor,
numite ranguri. Rangurile sunt utile mai ales cnd se urmrete
reprezentarea unei variabile pe o scal cu mai multe categorii ordinale.
Astfel, valoarea cea mai mic, neagresiv din exemplul anterior, primete
rangul unu, urmtoarea doi i aa mai departe.
Un exemplu de scal ordinal este scala DAFOR (acronimul este
format prin preluarea primei litere a valorilor scalei), utilizat pentru
aprecierea abundenei unei specii de plante ntr-un ptrat de prob (tab. 2.1).

14

Elemente de statistic aplicate n ecologie

Valoare
Rang

Dominat
5

Tabelul 2.1
Abundent Frecvent
4
3

Ocazional
2

Rar
1

Trebuie reinut c valorile numerice ale rangurilor nu pot fi folosite


pentru a efectua operaii simple, deoarece acestea nu au sens valoarea
abundent nu este de dou ori mai mare dect valoarea ocazional sau
diferena dintre valoare dominant i valoarea abundent poate s nu fie
egal cu cea dintre valorile ocazional i rar. Rangurile sunt doar
simboluri numerice care arat magnitudinea valorilor sau poziia lor n setul
de valori ordonate.

ZA

FI
R

ES

Scala de interval. Permite att ordonarea datelor, ct i precizarea


distanei dintre unitile scalei. Valorile exprimate pe aceast scal pot fi
sczute unele din altele pentru a afla exact care este diferena dintre ele. Din
cauza faptului c scala de interval nu are o valoare zero absolut, nu se
poate realiza mprirea valorilor pentru a afla cu ct una este mai mare
dect cealalt (tab. 2.2).
De exemplu, variabila de tip dat este apreciat pe o scal de
interval. Dac trei specii de psri de talie mic (paseriforme) revin din
migraie pe 5, 10 i 15 mai, putem spune c a treia specie ajunge cu zece zile
mai trziu dect prima, dar nu putem spune c are nevoie de trei ori mai
mult timp pentru a ncheia migraia. Un alt exemplu de scal de interval este
scala Celsius de apreciere a temperaturii: 0 este o valoare convenional,
aleas s desemneze temperatura de nghe a apei. Ca urmare, o temperatur
de 10 nu nseamn de dou ori mai cald dect 5 . Datorit faptului c
scala Celsius de apreciere a temperaturii nu are un zero absolut, aceasta
prezint i valori negative care nu ar putea exista n cazul unei valori zero
absolute.
Scala de raport. Pe lng proprietile celorlalte scale (identificare,
clasificare, ordonare, precizarea diferenei), aceasta mai permite i
mprirea valorilor unele la altele pentru a putea afla de cte ori una este
mai mare dect cealalt (tab. 2.2).
De exemplu, lungimea se apreciaz pe scal de raport, iar o lungime
de 30
este de trei ori mai mare dect una de 10 .

Aprecierea i prezentarea datelor

15

Aceast proprietate este posibil datorit faptului c scalele de raport


au valori zero absolute, adic zero nseamn nimic, vid. Ca urmare, aceste
scale nu pot prezenta valori negative.
De exemplu, scala Kelvin de apreciere a temperaturii este o scal de
raport, deoarece valoarea 0 ( 273,15 ) reprezint temperatura fa de
care nimic nu poate fi mai rece i la care n materie nu mai exist energie
sub form de cldur.

ZA

FI
R

ES

Variabilele corespunztoare scalei de interval i scalei de raport pot


fi de dou tipuri: discontinui i continui.
Variabilele discontinui sau discrete pot lua anumite valori (de
obicei, ntregi i pozitive), ntre care nu exist valori intermediare. Aceste
variabile reprezint caractere numrabile sau meristice (numr de solzi,
numr de ou, numr de elemente florale, numr de pui etc.). De exemplu,
dimensiunea pontei unei psri este o variabil discret, ale crei valori sunt
ntregi i pozitive; nu exist cuiburi cu numr fracionar de ou.
Variabilele continui pot lua orice valoare dintr-un anumit interval,
iar ntre oricare dou valori exist o infinitate de valori posibile. Aceste
variabile reprezint caractere msurabile sau metrice (lungime, lime,
nlime, greutate, temperatur etc.). De exemplu, ntre 10
i 11
pot
exista, n principiu, o infinitate de valori posibile, n funcie de numrul
zecimalelor considerate.

Tabelul 2.2. Caracteristicile eseniale ale tipurilor de variabile


Scala de apreciere a variabilelor Semnele care se pot pune ntre valori
Nominal
;
Ordinal
; ; ;
De interval
; ; ; ;
De raport
; ; ; ; ;

Conversia datelor de la o scal la alta


Conversia datelor se poate face doar n sensul pierderii unei pri din
informaia deinut de acestea. Ca urmare, conversia se poate face doar de la
o scal superioar ierarhic ctre una de nivel inferior. Astfel, datele
msurate pe o scal de interval sau de raport pot fi convertite la o scal
ordinal sau nominal. Datele msurate pe o scal ordinal pot fi convertite
doar la o scal nominal.

16

Elemente de statistic aplicate n ecologie

FI
R

ES

Exemplul 2.1. Dac s-au determinat nlimile unor plante de step


n centimetri, variabila urmrit, nlimea, este una continu, exprimat pe
o scal de raport. Pentru a realiza conversia la o scal ordinal, se dau
ranguri valorilor iniiale. Astfel, valoarea cea mai mic va primi rangul 1,
urmtoarea 2, iar valoarea cea mai mare va primi rangul maxim. nlimea
de 13
va primi rangul 1, ceea ce arat c este vorba de valoarea cea mai
mic, iar nlimea de 23
va primi rangul 9, adic valoarea maxim din
prob. Valorile egale ale nlimii vor primi media rangurilor pe care le-ar fi
primit dac ar fi fost diferite. Observm n tabelul 2.3 c exist trei valori
egale, de 15 , i alte dou valori egale ntre ele, de 17 . Cele trei
valori de 15 , dac ar fi fost diferite, ar fi primit rangurile 2, 3 i 4. Fiind
egale, primesc media rangurilor pe care le-ar fi primit dac ar fi fost diferite,
adic 2 3 4 /3 3. La fel se procedeaz i n cazul celor dou valori
de 17
media rangurilor pe care le-ar fi primit dac ar fi fost diferite
este 5 6 /2 5,5. n continuare, pentru conversia la o scal ordinal,
se consider o valoare de referin a nlimii din prob, dup care toate
celelalte valori se exprim n relaie cu aceasta: egale cu valoarea de
referin sau diferite de aceasta. Dac din anumite motive ne intereseaz
plantele cu nlimea de 17 , atunci vom avea dou valori 17 i
apte valori 17
Tabelul 2.3

ZA

nlimea (cm), scal de


interval sau raport
Ranguri intermediare
(dac valorile ar fi diferite)
Ranguri, scal ordinal
Valori nominale, scal
nominal

13

15

15

15

17

17

19

21

23

5,5

5,5

17

17

17

17

=17

=17

17

17

17

Cea mai frecvent conversie este cea de la datele apreciate pe o scal


de interval sau de raport, la una ordinal. O astfel de conversie este necesar
atunci cnd datele vor fi analizate prin metode neparametrice, deoarece nu
sunt ndeplinite condiiile de aplicare ale metodelor parametrice.
Variabile derivate
n anumite situaii, variabilele originale sunt procesate matematic,

Aprecierea i prezentarea datelor

17

ZA

FI
R

ES

astfel nct s rezulte variabile derivate cum ar fi: rapoarte, proporii,


procente i rate.
Raportul este o relaie simpl ntre dou numere. De exemplu, dac
lungimea capului la o viper de step este 17,7
i limea de 11,7
,
raportul lungime:lime este de 17,7: 11,7. Implicit, raportul lime:lungime
este de 11,7: 17,7. Uneori, una dintre valori poate fi convertit prin
mprire la unitate. De exemplu, dac ntr-o prob sunt 19
i
27
, atunci raportul masculi:femele este 19: 27 sau 1: 27/19, adic
1: 1,421. Raportul poate fi scris i ca o fracie. n cazul exemplului anterior,
raportul dintre masculi i femele este de 19/27 1/1,421. Rezultatul
calculrii fraciei se numete coeficient; astfel, 1/1,421 0,704.
Proporia este raportul dintre parte i ntreg. Dac lungimea total a
, proporia
unei vipere de step este 490
, iar lungimea cozii este 65
reprezentat de coad este 65: 490 0,13. Dac se calculeaz o proporie
pornind de la raportul dintre numrul de valori dintr-o categorie i numrul
total de valori din toate categoriile, atunci aceasta se numete frecven
proporional.
Procentul se obine prin nmulirea valorii unei proporii cu 100.
Rata reprezint raportarea unei observaii la unitatea de timp. Ratele
se folosesc pentru a exprima anumite variabile cum ar fi creterea, dinamica
unei populaii, micarea.
De exemplu, dac o plantul crete 15
n 10
, atunci rata de
cretere este de 15/10 1,5 / .

Numeroi indici ecologici cum ar fi indicii de diversitate sunt de fapt


variabile derivate. Uneori acestea pot fi analizate prin metode statistice dar
numai dup o conversie sau transformare prealabil a datelor.
2.2. REPREZENTAREA DATELOR
Unul dintre inconvenientele majore ale prezentrii datelor sub form
de tabele const n faptul c informaia nu este evident imediat. Ea poate fi
perceput doar dup o analiz n detaliu a fiecrei valori sau a majoritii
valorilor din tabel. Pentru facilitarea percepiei informaiei coninute de
date, este necesar procesarea i transformarea acestora ntr-o prezentare
vizual. Modalitatea cea mai des utilizat de prezentare a datelor const n

18

Elemente de statistic aplicate n ecologie

folosirea reprezentrilor grafice. Tipul de reprezentare grafic se alege n


funcie de tipul de variabil.
Reprezentarea variabilelor discrete. Procesarea datelor const n
acest caz n aranjarea lor n tabelul de distribuie a frecvenelor, adic se
prezint fiecare valoare a variabilei i frecvena corespunztoare acesteia,
adic de cte ori se ntlnete o anumit valoare n prob.
Exemplul 2.2. ntr-un studiu se urmrete numrul de fitoindivizi
(de plante) din specia Crambe tataria n 20 de ptrate de 10x10 m dintr-o
pajite stepic. Tabelul de distribuie a frecvenelor se prezint astfel:
7
1

10
2

16
1

19
1

Tabelul 2.4
0 1 2 5
5 4 3 1

38
1

60
1

Nr. fitoindivizi/ptrat ( )
Frecvena ( )

ZA

FI
R

ES

n continuare se reprezint grafic pe abscis valorile ordonate ale


variabilei ( ), iar pe ordonat valorile frecvenelor ( ) corespunztoare
valorilor variabilei. Practic, frecvena fiecrei valori a variabilei este
reprezentat printr-o coloan cu nlime corespunztoare. Se obine astfel o
diagram n coloane (dreptunghiuri) a distribuiei frecvenelor unei variabile
discrete. Trebuie remarcat spaiul dintre coloanele corespunztoare valorilor
ordonate ale variabilei acesta sugereaz absena valorilor intermediare
dintre valorile alturate ale unei variabile discrete (fig. 2.1).

f 3
2
1
0
0

10

16

19

38

60

x
Figura 2.1. Diagrama reprezentrii frecvenelor prin coloane

Diagrama poate fi realizat i prin reprezentarea frecvenelor prin

Aprecierea i prezentarea datelor

19

puncte (fig. 2.2). n acest caz, se impune ca acestea s nu fie unite, pentru a
sugera, ca i n cazul spaiului dintre coloanele graficului anterior, c este
vorba de valorile unei variabile discontinue.
6
5
4
f 3
2

0
2

10 16 19 38 60
x
Figura 2.2. Diagrama reprezentrii frecvenelor prin puncte

ES

FI
R

ZA

Aceleai tipuri de reprezentri pot fi utilizate i pentru reprezentarea


distribuiei frecvenelor variabilelor nominale i a celor ordinale. n cazul
variabilelor nominale, ordinea valorilor acestora pe abscis este arbitrar.
Reprezentarea variabilelor continui. Datorit faptului c
variabilele continui iau valori din aproape n aproape, exist posibilitatea ca
o prob s nu conin nici mcar dou valori identice. Ca urmare, nu se mai
poate opera cu frecvena unei singure valori, pentru c, ntr-o astfel de
situaie, toate valorile fiind diferite, vor avea frecvena egal cu 1, adic vor
aprea n prob o singur dat. Astfel, n cazul n care se dorete
reprezentarea distribuiei frecvenelor valorilor unei variabile continui, este
necesar gruparea valorilor din prob n clase de frecven, ceea ce implic
parcurgerea mai multor etape de procesare a datelor:
1. Aflarea numrului de clase. Numrul de clase ( ) este rezultatul
rotunjit la cel mai apropiat ntreg, ce se poate afla folosind una din
urmtoarele dou relaii:
1 3,3
sau
5
numrul de valori din prob.

20

Elemente de statistic aplicate n ecologie

2. Aflarea intervalului de clas. Intervalul de clas ( ) este rezultatul


relaiei:

valoarea maxim (cea mai mare) din prob;


valoarea minim (cea mai mic) din prob.
3. Aflarea limitelor fiecrei clase. Pentru fiecare clas trebuie aflat
limita inferioar (
) i limita superioar (
). n general, relaia dintre
cele dou valori pentru oricare clas este:

FI
R

ES

Limita inferioar a primei clase va fi egal cu valoarea cea mai mic


din prob dac aceasta este un numr ntreg, adic pentru
1,
. Dac
nu este un ntreg, atunci
va fi ntregul aflat prin
. Limita superioar a primei clase se va afla
rotunjirea prin lips al lui
adunnd la valoarea minim sau la limita inferioar a clasei valoarea
intervalului de clas, conform relaiei:
.

ZA

sau

Pentru a afla
, la
se va aduga 1. Astfel, ntre cele dou
clase nu va exista nici un fel de suprapunere, adic o valoare din prob egal
cu
va face parte doar din prima clas. n acest fel se vor afla limitele
celorlalte clase. Ultima clas, , va trebui s includ valoarea cea mai mare
.
din prob, adic pe
4. Aflarea frecvenei fiecrei clase. Frecvena claselor se va afla prin
numrarea valorilor din prob cuprinse ntre limita inferioar i cea
superioar a fiecrei clase. n final, trebuie ca fiecare valoare din prob s
fie inclus ntr-una din clase. Suma frecvenelor tuturor claselor trebuie s
fie egal cu numrul de valori din probe, adic
.
Frecvenele claselor se pot reprezenta sub forma unei histograme.
Spre deosebire de diagrama frecvenelor prezentat pentru variabilele

Aprecierea i prezentarea datelor

21

discrete, histograma are coloanele unite, ceea ce sugereaz continuitatea


dintre clasele de frecven ale valorilor unei variabile continui.
O alt modalitate de reprezentare a frecvenelor claselor este i
poligonul frecvenelor. Acesta se construiete prin unirea punctelor ale cror
coordonate sunt reprezentate de mijlocul intervalului de clas i de frecvena
clasei respective. Mijlocul intervalului de clas se afl calculnd media
aritmetic dintre limitele fiecrei clase:
mijloculclasei

Toate rezultatele obinute n urma procesrii datelor se nscriu n


tabelul de frecvene (tab. 2.5), care trebuie s cuprind: clasa, limitele clasei,
mijlocul intervalului de clas i frecvena fiecrei clase.

269
307
236
164
253
351
241
283
321
338

284
285
198
137
286
267
289
214
303
269

243
180
288
357
190
265
278
300
254
224

226
233
307
275
227
244
289
235
218
220

ZA

140
262
224
273
280
234
245
328
233
305

194
206
154
299
229
225
288
208
194
223

FI
R

ES

Exemplul 2.3. n cadrul unui studiu s-a msurat lungimea n mm a


100 de peti dintr-o anumit specie.

100
1

3,3

100

385
137
31

7,6

303
248
241
246
291
239
255
228
225
319

235
205
252
271
297
283
253
204
232
259

229
284
385
246
296
190
240
343
196
240

239
191
220
276
288
244
153
228
245
293

Elemente de statistic aplicate n ecologie


Tabelul 2.5. Tabelul de distribuie a frecvenelor claselor de lungime (mm)
xsup
mijloc
f
F (f cumulat)
k
xinf
1
137
168
152,5
5
5
2
168
199
183,5
8
13
3
199
230
214,5
19
32
4
230
261
245,5
27
59
5
261
292
276,5
23
82
6
292
323
307,5
12
94
7
323
354
338,5
4
98
8
354
385
369,5
2
100
30

U
C

20
15

ES

Frecvena (f)

25

10

FI
R

5
0

338.5

369.5

Clasa (k)

ZA

Figura 2.3. Histograma frecvenelor

30
25

Frecvena (f)

22

20
15
10
5
0
152.5

183.5

214.5

245.5

276.5

307.5

Clasa (mijloc)
Figura 2.4. Poligonul frecvenelor

3. DESCRIEREA STATISTIC A PROBELOR


ECOLOGICE

FI
R

ES

Statistica descriptiv este partea statisticii care se ocup de culegerea


i de clasificarea datelor statistice i, pe aceast baz, de descrierea
fenomenelor investigate. Rolul ei este de a rezuma cantitativ informaia
culeas, de a descrie i de a pune n eviden esenialul, n fine, de a realiza
sinteze cu ajutorul unui limbaj numeric.
n natur, atunci cnd investigm o populaie, rareori ntlnim valori
individuale identice ale unor variabile. La o privire mai atent a datelor, se
poate observa existena unor valori n jurul crora tind s se distribuie
majoritatea, dac nu toate celelalte valori individuale. Descrierea statistic a
probelor prelevate din populaii scoate n eviden dou aspecte eseniale:
tendina central i variabilitatea valorilor individuale.

3.1. TENDINA CENTRAL

ZA

Tendina central a unor date reprezint o valoare sau o condiie


reprezentativ pentru toate datele din prob sau pentru valorile individuale
din populaie. De exemplu, enunuri ca majoritatea florilor dintr-o prob au
culoarea roie sau diametrul mediu al florilor este de 2 cm surprind
tocmai aceast tendin central a valorilor individuale din probe.
n funcie de scala de apreciere a datelor din prob i implicit a
caracteristicilor tipului de variabil urmrit, exist mai multe msuri sau
descriptori ai tendinei centrale, dintre care cei mai des utilizai sunt: modul,
mediana i media.
Modul (Mo). Msura tendinei centrale, reprezentat de valoarea din
prob cu frecvena cea mai mare, adic cel mai des ntlnit, se numete
mod. De exemplu, dac o prob este reprezentat de 20 de plante la care se
urmrete culoarea florilor, iar zece dintre acestea au flori de culoare roie,
apte au flori de culoare violet i trei sunt grena, atunci modul probei va fi

24

Elemente de statistic aplicate n ecologie

masculi

ZA

FI
R

ES

valoarea rou a variabilei culoarea florilor. Aa cum reiese din acest


exemplu, modul se poate folosi pentru descrierea tendinei centrale a unei
variabile apreciate pe o scal nominal; de fapt este singurul descriptor de
acest fel ce se poate folosi pentru valorile unei variabile nominale. Modul se
poate folosi i pentru celelalte tipuri de variabile ordinale, discrete i
continui. n cazul variabilelor continui, se poate ca modul s nu poat fi
aplicat. Dat fiind faptul c aceste variabile iau valori din aproape n aproape
i c ntre oricare valori alturate exist un numr infinit de valori posibile,
se poate ntmpla ca ntr-o prob toate valorile s fie diferite, caz n care
frecvena fiecrei valori va fi egal cu unu. Deci, ntr-o astfel de situaie, nu
exist nici o valoare cu frecven mai mare dect celelalte i modul nu se
poate calcula dect pentru clasele de frecven.
n exemplul 2.3 lungimea petilor este o variabil continu. Modul
probei este 288, pentru care exist 3 valori. Dac toate valorile ar fi fost
diferite, atunci s-ar fi putut afla clasa modal de distribuie a frecvenelor ca
fiind clasa cu frecvena cea mai mare. n cazul exemplului luat n discuie,
clasa modal este clasa nr. 4 cu frecvena 27.
Dac ntr-o distribuie a frecvenelor apar mai multe vrfuri de
frecven sau moduri, aceasta va fi numit distribuie multimodal. Multe
caractere rspunztoare de dimorfismul sexual prezint n populaii o
distribuie bimodal. n figura 3.1 apare o astfel de distribuie bimodal:
modul pentru femele este 29 de plci subcaudale, iar pentru masculi este 37.

6
5

f 4

femele

3
2
1
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41

0
Nr. subcaudale
Figura 3.1. Diagrama distribuiei frecvenelor numrului de subcaudale la
Vipera ursinii moldavica

Descrierea statistic a probelor ecologice

25

n cazul unor astfel de distribuii, care nu sunt simetrice fa de o


singur valoare a tendinei centrale, se recomand ca analiza statistic s se
fac separat, pe categorii discrete din prob masculi, femele, juvenili
pentru care datele se prezint mai mult sau mai puin simetrice.

1, atunci

sau

ZA

pt.

FI
R

ES

Mediana (Me). Este msura tendinei centrale care reprezint


valoarea central sau media valorilor centrale ale unui set de date ordonate
cresctor. Valoarea central este cea care, n setul de date ordonat cresctor,
este precedat i succedat de acelai numr de valori individuale. Rezult
c mediana se poate utiliza pentru date care se pot ordona, adic pentru date
msurate pe o scal de raport, interval sau ordinal, i se poate folosi pentru
datele apreciate pe o scal nominal. Este considerat una dintre cele mai
robuste msuri ale tendinei centrale, deoarece nu este influenat de
eventualele valori atipice, cum se poate ntmpla n cazul mediei, i se poate
utiliza chiar i n cazurile n care se cunosc doar magnitudinile (sau
rangurile) unor valori ce nu au fost nregistrate.
Modalitatea de calcul a medianei depinde de numrul valorilor din
prob ( ):
dac proba are un numr par de date (
2
1), atunci mediana
va fi reprezentat de valoarea central:
.
3, pentru

De exemplu, pentru seria de date 1, 2, 2, 3, 4, 4, 5,


c are un numr egal de valori la stnga i la dreapta sa.

dac proba are un numr par de date (


2 ), atunci mediana va
fi reprezentat de media celor dou valori centrale sau de intervalul median:
pt.

2 , atunci

sau

De exemplu, pentru seria de date 1, 2, 2, 3, 4, 5, 6, 7, cele dou


valori centrale sunt 3 i 4, deci
3 4 /2 3,5.
n cazul n care exist numeroase observaii cu aceeai valoare cu
cea a medianei datorit prezentrii datelor sub form de intervale de clas,

26

Elemente de statistic aplicate n ecologie

atunci formulele de calcul se modific astfel:


pt.

1, atunci

pt.

2 , atunci

limita inferioar a clasei mediane (clasa de frecven ce


conine valoarea median);
valoarea intervalului de clas;
suma frecvenelor tuturor claselor;
frecvena cumulat a clasei dinaintea clasei mediane (suma
frecvenelor claselor care preced clasa median);
frecvena clasei mediane.

80-100%
1

60-80%
2

40-60%
9

FI
R

Acoperire
Frecvena (f)

ES

Exemplu 3.1. ntr-un studiu s-a urmrit acoperirea procentual


realizat de o specie de ierburi de step, n 20 de suprafee de prob.
20-40%
6

0-20%
2

f
20

10
50

ZA

Conform definiiei medianei, aceasta ar trebuie s reprezinte media


acoperirilor din suprafeele de prob 10 i 11. Valorile exacte ale acoperirii
nu sunt accesibile, acestea fiind aproximate prin clase de acoperire. Acestea
sunt echivalente din punct de vedere statistic unor clase de distribuie a
frecvenelor. Dac simbolizm fiecare observaie prin procentul mediu al
fiecrei clase, datele se prezint astfel:
10
50

30
50

30
50

30
50

30
50

30
50

30
70

50
70

50
90

Cifrele scrise ngroat ar reprezenta cele dou valori centrale


necesare calculrii medianei n cazul unui numr par de date. Se observ c
sunt mai multe valori egale cu 50; sunt 9 valori n clasa (intervalul)
median. Frecvena cumulat a clasei de dinaintea celei mediane este
2 6 8. Deci, pn la prima valoare central, mai sunt 2 suprafee de
prob. Rezult c prima valoare central se gsete la 2/9 din intervalul
clasei mediane. Intervalul de clas este egal cu 20%; 2/9 din 20 reprezint

Descrierea statistic a probelor ecologice

27

20

40

20

ES

40

4,45. Dac la aceast valoare adugm limita inferioar a clasei mediane


(40), obinem 44,45, adic prima valoare central a acoperirii. Folosind
acelai raionament, se obine i a doua valoare central: 40 20 3/9
46,67. Mediana va fi egal cu media celor dou valori centrale: 44,45
46,67 /2 45,56.
O alt modalitate const n aplicarea formulei de mai sus, care are la
baz acelai raionament:
40

20

20

9
45,56 .

ZA

FI
R

Media ( , ). Este unul dintre cei mai cunoscui i mai utili


descriptori ai tendinei centrale. Exist mai multe tipuri de medie, dar cel
mai utilizat este media aritmetic. Dac se calculeaz media lund n
consideraie toi indivizii unei populaii, atunci aceasta se numete medie
populaional, este un parametru populaional i se noteaz cu . Media
obinut n urma analizei datelor dintr-o prob sau media probei este o
statistic a probei simbolizat cu . Media probei poate fi un estimator
direct al mediei populaionale ( estimeaz pe ).
Formula de calcul a mediei este suma tuturor valorilor supra
numrul acestora:

pentru populaie
;

,
pentru prob
fiecare valoare individual din populaie sau prob;
numrul tuturor valorilor individuale din populaie;
numrul tuturor valorilor din proba prelevat din populaie.
Relaia dintre medie, median i mod.
n cazul unei variabile a crei valori individuale sunt distribuite
perfect simetric, media, mediana i modul sunt egale. n cazul unei

28

Elemente de statistic aplicate n ecologie

distribuii uor asimetrice unimodale, mediana se dispune ntre medie i


mod. n majoritatea distribuiilor biologice se observ o abatere pozitiv,
adic media are valoare mai mare dect mediana, care la rndul ei este mai
mare dect modul (fig. 3.2).
Mo<Me<x

Mo=Me=x

ES

Figura 3.2. Relaia dintre mod, median i medie: A distribuie simetric; B


distribuie asimetric

ZA

FI
R

Dintre cele trei msuri ale tendinei centrale, media este singura care
ine cont de toate datele din probe i astfel sintetizeaz ntreaga informaie
furnizat de acestea. Valoarea mediei este folosit n numeroase tehnici de
analiz statistic. De asemenea, poate fi combinat cu mediile altor probe
din aceeai populaie, n cadrul mediei generale, atunci cnd datele sunt rare
sau greu de obinut.
mediageneral

media probei

numrul de valori din proba

Media este ns uor influenat de apariia unor valori atipice (foarte


mari sau foarte mici fa de majoritatea valorilor). n astfel de situaii,
mediana reprezint un descriptor mai robust al tendinei centrale a probei.
Mediana este util i n analiza preliminar, deoarece scoate n eviden
tendinele generale ale datelor.
Modul reprezint o modalitate rapid i aproximativ de a aprecia
tendina central a probei i de a indica centrul distribuiei observaiilor,
apreciate pe o scal ordinal sau nominal.

Descrierea statistic a probelor ecologice

29

3.2. VARIABILITATEA

ES

Variabilitatea este o trstur general a sistemelor naturale. Este


foarte puin probabil ca indivizii dintr-o populaie biologic s fie identici
din punctul de vedere al unui caracter sau al unei variabile. Dac nu ar
exista variabilitate, nu ar mai fi nevoie de analiza statistic o singur
valoare ar fi suficient pentru a descrie variabila cercetat pentru ntreaga
populaie (implicit, nici tendina central ca noiune nu i-ar mai avea
rostul). Deci, pentru a surprinde informaia intrinsec a unei probe, pe lng
tendina central, trebuie descris i variabilitatea acesteia.
n general, variabilitatea este surprins de modul n care valorile
individuale ale unei variabile graviteaz n jurul tendinei centrale sau se
distribuie fa de aceasta.
Cei mai comuni descriptori ai variabilitii unei probe sunt
amplitudinea i deviaia standard.

intervaluldevariaie

ZA

FI
R

Amplitudinea ( ). Este o msur simplu de calculat a dispersiei


datelor dintr-o prob. Amplitudinea reprezint diferena dintre valoarea
maxim (
) i valoarea minim (
) dintr-o prob, adic diferena
dintre cele dou limite ale intervalului de variaie.

Cnd datele sunt sub forma claselor de distribuie a frecvenelor i


valorile extreme (
i
) nu se cunosc cu exactitate, amplitudinea se
calculeaz ca diferena dintre centrele intervalelor primei i ultimei clase.
Dac ne referim la exemplul 2.3 i presupunem c avem la dispoziie doar
tabelul 2.5, atunci amplitudinea poate fi apreciat astfel:
369,5

152,5

217 .

Este msura cea mai util a variabilitii, atunci cnd o decizie este
condiionat de valorile extreme ale unei variabile. Prezint ns i o serie de
neajunsuri: depinde doar de valorile extreme care adesea sunt excepionale,
prezint fluctuaii mari de la o prob la alta i nu este influenat de simetria
repartiiei dintre extreme (poate avea aceeai valoare pentru o repartiie

30

Elemente de statistic aplicate n ecologie

simetric i pentru una puternic asimetric).

FI
R

ES

Deviaia standard ( , ). Este descriptorul variabilitii cel mai


frecvent i mai util, care se folosete n analiza statistic a datelor. Atunci
cnd valoarea sa se obine prin folosirea tuturor valorilor individuale ale
unei variabile dintr-o populaie, se numete deviaia standard a populaiei
i se noteaz cu . Dac se calculeaz pornind de la datele dintr-o prob
extras din populaia de cercetat, se numete deviaia standard a probei i
se noteaz cu . n ambele cazuri, deviaia standard reprezint media
abaterilor valorilor individuale fa de valoarea mediei. Abaterea unei valori
individuale fa de medie poate fi scris ca diferena dintre valoarea
respectiv i valoarea mediei ( ). n continuare, pentru a afla media
abaterilor, ar trebui ca abaterile tuturor valorilor s se nsumeze i apoi s se
mpart la numrul valorilor individuale luate n analiz ( sau ). Totui
exist o problem cu privire la acest raionament:

0.

ZA

Deci suma abaterilor este zero, ceea ce reprezint un impas n


calcularea mediei abaterilor, aceasta fiind egal cu 0/
0. Aceasta ar
nsemna c valorile individuale se confund cu cea a medie, ceea ce este n
majoritatea cazurilor (dac nu n toate) imposibil, din cauza variabilitii
naturale. Ca urmare, pentru a depi acest impas, este nevoie s pozitivm
toate abaterile printr-un procedeu reversibil care s nu influeneze rezultatul
final. Un astfel de procedeu const n ridicarea abaterilor la ptrat. Se obine
astfel suma ptratelor abaterilor care, mprit la numrul de valori, d
media aritmetic a ptratelor abaterilor sau variana ( , ).

sau

n cazul varianei, unitile de apreciere ale variabilei se modific


de exemplu, mm devin mm2, g devine g2 , pierzndu-i sensul. Pentru a
reveni la unitile originale de msur, se extrage radicalul din valoarea
varianei i se obine astfel deviaia standard.

Descrierea statistic a probelor ecologice

31

sau

Printr-o rearanjare algebric a formulelor de mai sus se poate obine


una mai uor de utilizat n practic.

sau

ES

Atunci cnd deviaia standard a probei se utilizeaz pentru estimarea


deviaiei standard a populaiei (se estimeaz pe baza ), suma ptratelor
abaterilor se mparte la 1 i nu la , ceea ce are drept efect creterea
valorii s.

FI
R

sau formula cea mai uzual

ZA

Creterea valorii s reprezint o marj ce trebuie luat pentru folosirea


mediei probei (o statistic) n loc de media populaiei (un parametru)
pentru estimarea deviaiei standard populaionale . Valoarea se
numete n statistic numrul gradelor de libertate i reprezint un
concept general desemnnd numrul de elemente independente (variabile
aleatoare, statistici etc.) pentru a defini starea unui sistem sau a unui
ansamblu (numrul de elemente considerate simultan minus numrul de
relaii independente care le leag). De exemplu, dac presupunem c avem o
prob
10, cu
20, i trebuie s inventm valorile observaiilor,
avem libertatea s desemnm primele 9 valori (adic 1 10 1 9). A
zecea valoare nu mai avem libertatea s o inventm, deoarece aceasta
trebuie s fie o valoare care s permit obinerea mediei egale cu 20. Cu alte
cuvinte, media constituie o relaie independent, o constrngere a valorilor
din prob. Deci, dac media este 20, suma celor 10 valori va fi 20 10
200. Desemnm primele patru valori: 26, 18, 14, 25, 20, 28, 35, 17 i 7.
Suma lor este 190. Pentru ca suma s fie 200, nseamn c al zecelea numr

32

Elemente de statistic aplicate n ecologie

poate fi doar 10 (200 190 10) i astfel media s fie 20 (200/10 20).
Deviaiile standard ale probelor pot fi utilizate pentru a compara
variabilitatea acestora. Compararea direct a deviaiilor standard obinute n
urma analizei unor probe cu medii diferite (de exemplu, o medie de ordinul
zecilor i o alta de ordinul sutelor) nu are nici o valoare. Astfel, pentru
compararea variabilitii probelor din populaii cu medii diferite, se
folosete coeficientul de variaie ( ).
%

sau

100

60,6
67,1
69,4
73,6
77,7

60,9
67,2
69,6
74,1
78,8

62,6
67,5
70
75
79,3

FI
R

60,3
66,6
69
73,4
77,5

59,3 59,6
65,5 65,8
69 69
71,9 72,6
77 77,5

ES

Exemplul 3.1. ntr-un studiu s-a urmrit nlimea fitoindivizilor de


migdal pitic (Amygdalus nana). n acest sens s-a msurat nlimea a 50 de
tulpini n cm dintr-un plc compact. S-a realizat apoi descrierea statistic a
probei.
62,7
67,8
70,2
75,1
81,5

62,8
68,1
71,1
75,2
82,8

63,7
68,9
71,4
76,3
86,7

63,7
69
71,6
76,9
89,6

ZA

Valoarea cea mai frecvent ntlnit este 69, deci


69.
Mediana va fi egal cu media celor dou valori centrale, deoarece
50, un numr par.
,

69,8

Media este suma tuturor valorilor mprit la 50.


,

70,85

Amplitudinea este dat de diferena dintre valoarea maxim i cea


minim din prob.

Descrierea statistic a probelor ecologice

89,6

59,3

33

30,3

Deviaia standard se calculeaz conform formulei utilizate pentru


estimarea deviaiei standard populaionale.
,

47,83

6,92

47,83

,
,

0,098, adic 9,8% .

ES

Coeficientul de variaie se afl mprind deviaia standard la medie.

ZA

FI
R

Datele din proba cercetat prezint o distribuie simetric, pentru c


cele trei msuri ale tendinei centrale au valori foarte apropiate.

4. DISTRIBUII PROBABILISTICE

ZA

FI
R

ES

Teoria matematic a probabilitilor a aprut n urma studiului


jocurilor i arat care va fi rezultatul, n general, dac se extrag probe n
mod repetat din aceeai populaie statistic.
Probabilitatea de apariie a unui anumit eveniment reprezint ansa
ca evenimentul respectiv s se ntmple, exprimat de la 0 la 1 sau de la 0 la
100%. O probabilitate apropiat de 1 nseamn c evenimentul este unul
probabil, iar o probabilitate apropiat de 0 nseamn c evenimentul
respectiv este puin probabil.
Exist mai multe modaliti de aflare a probabilitii unui eveniment,
dintre care dou sunt mai des utilizate. Prima modalitate este cea empiric,
bazat pe cunotine anterioare cu privire la evenimentul respectiv n
populaie. De exemplu, dac se tie c ntr-o populaie doi din 5 indivizi
aparin sexului masculin, atunci se poate spune c probabilitatea ca un
individ selectat la ntmplare din populaie s fie mascul este de 2/3 sau
0,67 (sau 67%). Pentru a afla aceast probabilitate, sunt necesare cunotine
asupra raportului dintre sexe n populaia studiat. A doua modalitate de
aflare a probabilitii este cea bazat pe consideraii teoretice. De exemplu,
probabilitatea de a obine un anumit numr prin aruncarea unui zar este de
1/6 adic 0,1667. n acest caz, nu este nevoie ca zarul s fie aruncat pentru
a ajunge la acest rezultat.
n cele dou situaii de mai sus, probabilitatea a fost calculat sub
forma unui raport. Acest aspect este surprins de regula mpririi conform
creia probabilitatea unui eveniment este dat de numrul de posibiliti n
care evenimentul respectiv poate s apar mprit la numrul total de
evenimente ce pot s apar.
n primul exemplu de mai sus, erau dou posibiliti de apariie a
unui mascul din trei indivizi pentru care nu se specific sexul. n al doilea
exemplu, era o posibilitate de a obine un anumit numr din ase numere
posibile.
n general, se pot face operaii cu probabiliti, dintre care cele mai

Distribuii probabilistice

35

ZA

FI
R

ES

frecvent utilizate sunt adunarea sau nmulirea. Deoarece probabilitile sunt


fracii, adunarea probabilitilor duce la o cretere a probabilitii compuse,
n timp ce nmulirea, la o scdere a acesteia.
Dac se cunoate probabilitatea de apariie a unui rezultat i cea de
apariie a unui rezultat , probabilitatea apariiei simultane a ambelor
rezultate este, conform regulii nmulirii, egal cu produsul probabilitilor
individuale:
i

. De exemplu, dac probabilitatea ca


dintr-un ou s ias o anumit specie este de 0,2 i probabilitatea ca
respectivul individ s fie mascul este de 0,5, atunci probabilitatea ca din ou
s apar un individ mascul din specia de interes va fi egal cu produsul
probabilitilor individuale ale celor dou rezultate: 0,2 0,5 0,10.
Dac se cunoate probabilitatea de apariie a unui rezultat i cea de
apariie a unui rezultat , probabilitatea apariiei unuia din cele dou
rezultate la un moment dat este, conform regulii adunrii, egal cu suma
probabilitilor individuale:
sau
. De exemplu, dac
probabilitatea ca dintr-un ou s ias o anumit specie este de 0,2 i
probabilitatea de apariie a unei alte specii este 0,3, atunci probabilitatea ca
din ou s ias prima sau a doua specie va fi egal cu suma probabilitilor
individuale ale celor dou rezultate: 0,2 0,3 0,5.
O distribuie probabilistic este o distribuie a probabilitilor
similar cu o distribuie a frecvenelor (seciunea 2.2), cu deosebirea c
prima red probabilitatea de apariie a evenimentelor i nu frecvena
acestuia. Deci distribuiile probabilistice se bazeaz pe probabilitile,
calculate pornind de la anumite premise ca evenimentele s apar i nu pe
frecvenele observate ale evenimentelor. O distribuie a frecvenelor poate fi
convertit la o distribuie a probabilitilor, dac fiecare frecven este
convertit la probabilitate prin mprirea la numrul total de observaii
(dimensiunea probei).
Utilitatea distribuiilor probabilistice este multipl: permite
estimarea probabilitii ca un anumit eveniment s aib un anumit rezultat i
poate fi folosit pentru a calcula o distribuie de frecvene de ateptat
(estimate). Aa cum o probabilitate poate fi estimat prin mprirea
frecvenei unei anumite observaii la numrul total de observaii, tot aa, o
frecven estimat poate fi calculat prin nmulirea probabilitii estimate
cu numrul total de observaii.
Astfel, se pot compara frecvenele observate cu cele estimate, dup

36

Elemente de statistic aplicate n ecologie

ES

4.1. DISTRIBUIA BINOMIAL

un anumit model. Dac diferenele dintre cele dou tipuri de frecvene nu


sunt semnificative, atunci modelul dup care s-au calculat frecvenele
estimate este valabil i pentru cele observate.
Modelele folosite n calcularea probabilitilor teoretice sunt modele
matematice. Dintre acestea, o parte au o importan practic deosebit
pentru cercetarea ecologic. Astfel, exist trei distribuii probabilistice
asociate cu variabile discrete (caractere numrabile), folosite drept model n
studiile ecologice: distribuia binomial, distribuia Poisson i distribuia
binomial negativ. Dintre distribuiile probabilistice folosite pentru
variabile continui (caractere msurabile), probabil cea mai important, mai
ales din punct de vedere conceptual, este distribuia normal.

Aceast distribuie are urmtoarele particulariti:

ZA

FI
R

1. Observaiile sunt sub form de numr de entiti;


2. O observaie se poate clasifica n una din dou categorii posibile,
distincte (mascul sau femel, specia A sau A, adult sau adult);
3. Variana unei probe de frecvene este mai mic dect media;
4. Dispersia entitilor numrate este uniform.

Dac se ia n considerare sexul unui individ dintr-o populaie,


aceast variabil poate lua doar dou valori: mascul sau femel. Dac se
selecteaz aleator un singur individ dintr-o populaie, ansele ca acesta s fie
mascul sunt egale cu ansele s fie femel. Cum rezultatul poate fi doar unul
singur, nseamn c probabilitatea de a obine un mascul este 1/2 0,05,
iar probabilitatea de a obine o femel este tot 1/2 0,05. Dac este
probabilitatea de a obine mascul i este probabilitatea de a obine femel,
atunci suma probabilitilor va fi
1, iar
1
i
1
.
Distribuia probabilistic n cazul sexului unui individ este reprezentat n
figura 4.1.
Dac se extrag doi indivizi din populaie, atunci exist patru
rezultate posibile (tab. 4.1). Probabilitile fiecrui rezultat pot fi obinute
conform regulii nmulirii. Astfel, probabilitatea de a obine doi masculi va

Distribuii probabilistice

37

fi 0,5 0,5 0,5


0,25. Probabilitatea de a obine dou femele se
calculeaz n acelai fel. Probabilitatea de a obine un mascul i o femel
este egal cu probabilitatea de a obine o femel i apoi un mascul, adic
0,5 0,5 0,25.
0.6

0.4
0.3

0.2

Probabilitate

0.5

0
mascul

ES

0.1

femel

FI
R

Rezultat
Figura 4.1. Distribuia probabilistic a sexului n cazul unui individ

Tabelul 4.1. Probabilitile diferitelor rezultate la extragerea a doi indivizi

ZA

Individul 1

Individul 2
Mascul (M)
0,5
Femel (F)
0,5

Mascul (M)
0,5
MM

0,25
MF

0,25

Femel (F)
0,5
FM

0,25
FF

0,25

Dac nu se ia n consideraie ordinea n cadrul rezultatului masculfemel, probabilitatea obinerii unui mascul i a unei femele va fi dat,
conform regulii adunrii, de suma dintre probabilitatea de a obine masculfemel i probabilitatea de a obine femel-mascul, adic
0,25
0,25 0,5.
Suma probabilitilor tuturor rezultatelor este 1. Dac se
generalizeaz suma probabilitilor tuturor rezultatelor, atunci se obine:

38

Elemente de statistic aplicate n ecologie

1.

Dac se repet distribuia probabilistic pentru trei indivizi, atunci


relaia general devine:
3

1.

Deci, pentru indivizi, probabilitile tuturor rezultatelor posibile


vor fi date prin descompunerea binomului:

1.

FI
R

ES

n aceast relaie general a distribuiei binomiale,


reprezint
numrul de ncercri, este probabilitatea de a obine un anumit rezultat
dintr-o singur ncercare, iar este probabilitatea ca rezultatul vizat s nu
apar. Distribuia binomial depinde de i de (valoarea lui depinde de
cea a lui ).
O formul mai practic pentru calculul probabilitii n distribuia
binomial este:
,

ZA

probabilitatea de a obine un anumit numr de rezultate;


numrul de rezultate de interes;
numrul de evenimente sau ncercri;
probabilitatea de a obine un rezultat de interes;
probabilitatea de a nu obine un rezultat de interes.
Exemplul 4.1. Dac o pont conine 6 ou, iar probabilitatea ca
dintr-un ou s apar un mascul este 0,5, care sunt probabilitile de a obine
4 sau mai puini masculi?
n aceast problem datele sunt urmtoarele:
6
0,5
1
1 0,5 0,5
4.

Distribuii probabilistice

39

Aceasta nseamn c probabilitatea de a obine 4 sau 3 sau 2 sau 1


sau 0 masculi va fi, conform regulii adunrii, suma probabilitilor 4
3
2
1
0 .
Probabilitatea de a obine 4 masculi este:
4

!
!

0,5 0,5

0,234375 .

La fel se procedeaz i pentru celelalte valori ale lui .

4
3
2
1
0
4
0,2343 0,3125 0,2343 0,0937 0,0156 0,8906

FI
R

ES

Probabilitatea de a obine patru sau mai puini masculi este de


aproximativ 89,1%.
Distribuia probabilistic pentru toate combinaiile posibile de
masculi i femele din ase indivizi se prezint astfel:

0.35
0.3

ZA

0.2

0.15

p(x)

0.25

0.1

0.05
0
0

3
x

Distribuia este simetric deoarece


. n general, cu ct este
mai mare i are o valoare apropiat de cea a lui , cu att distribuia
binomial este mai simetric, iar diferenele dintre probabiliti (coloanele
diagramei) sunt mai mici.

40

Elemente de statistic aplicate n ecologie

4.2. DISTRIBUIA POISSON


Aceast distribuie are urmtoarele particulariti:

FI
R

ES

1. Observaiile sunt sub form de numr de entiti;


2. Observaiile se obin din uniti de prob definite (ptrate de
prob, intervale de timp etc.) i pot fi organizate ntr-o distribuie
a frecvenelor;
3. Variana probei este aproximativ egal cu media acesteia;
4. Entitile numrate sunt relativ rare (mult mai puine dect ar
putea s conin unitatea de prob).
5. Dispersia entitilor n timp i spaiu este aleatoare, ceea ce
nseamn c entitile nici nu se atrag, nici nu se resping, adic
sunt independente unele fa de altele.

ZA

Dei aceast distribuie este greu de ntlnit n natur, ea este util n


ecologie, fiind singurul model ce poate fi folosit pentru descrierea obiectelor
cu dispersie ntmpltoare.
Distribuia Poisson este determinat de un singur parametru , care
este egal cu media populaional i cu variana populaional :

.
Deoarece aceti parametri rareori ajung s fie cunoscui, formula de
calcul a probabilitii se bazeaz pe media probei ( ) ca estimare a mediei
populaionale, pe un anumit numr de entiti dintr-o unitate de prob ( ) i
pe constanta matematic, baza logaritmului natural
2,7183:

Exemplul 4.2. S se estimeze distribuia probabilistic Poisson


pentru 10 sau mai puini indivizi pe unitate de prob, tiind c numrul
mediu de indivizi pe unitate de prob este 5.

Distribuii probabilistice

41

Datele acestei probleme sunt:


5
2,7183
10 .
Trebuie calculat probabilitatea Poisson de a identifica 10 sau mai
puini indivizi pe unitate de prob.
Probabilitatea de a identifica 10 indivizi pe unitate de prob este:

2,7183

0,0181 ,

!
!

0,0363 .

2,7183

10

ES

La fel se procedeaz i pentru celelalte valori.


0.18

0.16

FI
R

0,0067
0,0337
0,0842
0,1404
0,1755
0,1755
0,1462
0,1044
0,0653
0,0363
0,0181
0,9863

0.14
0.12

p(x)

ZA

0
1
2
3
4
5
6
7
8
9
10

0.1

0.08
0.06
0.04
0.02
0
0 1 2 3 4 5 6 7 8 9 10
x

Suma probabilitilor valorilor de la zero la zece este mai mic dect


1, deoarece distribuia este trunchiat la valoarea 10. Probabilitile
valorilor mai mari de 10 sunt extrem de mici. Distribuia este uor
asimetric. Dac
depete valoarea 10, distribuia tinde s devin
aproximativ simetric.

42

Elemente de statistic aplicate n ecologie

4.3. DISTRIBUIA BINOMIAL NEGATIV


Aceast distribuie are urmtoarele particulariti:

ES

1. Observaiile sunt sub form de numr de entiti;


2. Observaiile se obin din uniti de prob definite (ptrate de
prob, intervale de timp etc.) i pot fi organizate ntr-o distribuie
a frecvenelor;
3. Variana probei este evident mai mare dect media acesteia;
4. Entitile numrate sunt relativ rare (mult mai puine dect ar
putea s conin unitatea de prob).
5. Dispersia entitilor nu este nici uniform, nici aleatoare, ci poate
s fie grupat sau agregat.

ZA

FI
R

Spre deosebire de celelalte distribuii discrete, distribuia binomial


negativ este un model robust ce descrie dispersia a numeroase populaii
naturale.
Aceast distribuie probabilistic este definit de doi parametri:
media populaional ( ) i un exponent . Spre deosebire de
din
distribuia binomial, care ia valori ntregi, fiind o variabil discret, n
distribuia binomial negativ, este o variabil continu, ce ia valori din
aproape n aproape i exprim heterogenitatea unei distribuii.
n practic, cei doi parametri sunt estimai pe baza probei. Media
probei este o estimare a lui , iar se estimeaz pornind de la media i
variana probei, conform urmtoarei relaii:
.
Probabilitile individuale, adic probabilitile obinerii unui anumit
numr de entiti dintr-o unitate de prob, se pot afla prin descompunerea
expresiei
, unde
/ , iar
1
.
Din motive practice, probabilitatea n distribuia binomial negativ
se calculeaz urmnd urmtoarele etape:

Distribuii probabilistice

43

1. Se calculeaz valoarea .
2. Se calculeaz probabilitatea pentru
0

.
0, se calculeaz probabilitatea astfel:

3. Pentru oricare

0:

1 .

Exemplul 4.3. Care sunt probabilitile ca pe nite suprafee de


prob s apar zece sau mai puini indivizi? Media numrului de indivizi pe
suprafa de prob este trei, iar deviaia standard este cinci.

FI
R

ES

3
5

Trebuie calculat valoarea lui :

4,5 .

ZA

Se calculeaz probabilitatea pentru


,

0:

0,1004 .

n continuare se pot calcula probabilitile pentru celelalte valori mai


mari ca unu, cu ajutorul formulei recurente:
1

,
,

0,1004

0,1807

0,1807

0,1988 .

n acelai mod se continu i pentru celelalte valori. Rezultatele


probabilitilor pentru valorile mai mici sau egale cu zece sunt trecute n
tabelul urmtor:

44

Elemente de statistic aplicate n ecologie


0.2
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0

0.02

0 1 2 3 4 5 6 7 8 9 10
x

ES

0.18

0,1004
0,1807
0,1988
0,1723
0,1292
0,0879
0,0556
0,0334
0,0192
0,0107
0,0058
0,9938

p(x)

0
1
2
3
4
5
6
7
8
9
10

ZA

FI
R

Se poate observa c suma probabilitilor valorilor este mai mic


dect 1. Probabilitile pentru valorile mai mari de 10 vor fi extrem de mici.
Pe msur ce valoarea crete i deviaia standard ( ) scade n raport cu
media ( ), gradul de simetrie al distribuiei crete. Pentru valori ale lui
20, distribuia probabilistic este aproape simetric.
4.4. ESTIMAREA DISPERSIEI UNEI POPULAII

4.4.1. Indici de dispersie


Dispersia unei populaii se refer la modul de repartizare a
indivizilor n spaiu. Dispersia se apreciaz pe baza poziiei unor indivizi,
relativ la poziia celorlali.
n general, dispersia unei populaii poate fi de trei tipuri: uniform,
aleatoare i grupat (fig. 4.2). n cele mai multe cazuri, dispersia este
privit din perspectiv spaial, dar se poate investiga i dispersia n timp a
unor evenimente. n primul caz, unitatea de prob poate fi un ptrat, n timp
ce n al doilea caz, poate fi un interval de timp. Dac se urmresc organisme
parazite, atunci unitatea de prob poate fi organismul gazd.
n principiu, aprecierea dispersiei se face n funcie de variabilitatea

Distribuii probabilistice

45

ES

densitii entitilor pe unitate de prob. n cazul unei dispersii uniforme,


densitile entitilor pe unitate de prob vor fi cam aceleai i variabilitatea
acestor densiti va fi relativ mic. n cazul unei dispersii grupate, densitile
vor avea valori extreme, fie foarte mari, fie aproape nule, iar variabilitatea
acestor densiti va fi relativ mare. n cazul dispersiei aleatoare, vor exista
densiti cu valori mari, mici i intermediare i, ca urmare, variabilitatea
acestor densiti va fi intermediar fa de variabilitatea densitilor din
celelalte tipuri de dispersie.

FI
R

Figura 4.2. Tipuri de dispersie: I uniform, II aleatoare, III grupat

ZA

Pornind de la acest principiu, dac se folosete variana densitilor


pe unitate de prob ca descriptor al variabilitii i media densitilor pe
unitate de prob ca termen de comparaie a magnitudinii varianei, se poate
calcula un indice de dispersie astfel:
.

Indice de dispersie

Cnd datele sunt prezentate sub form de tabel de distribuie a


frecvenelor, atunci formulele varianei i mediei pot fi adaptate pentru
facilitarea calculelor astfel:

46

Elemente de statistic aplicate n ecologie

Indicele de dispersie poate fi subunitar, egal cu unitatea sau


supraunitar. Astfel, n funcie de valoarea raportului, se poate decide care
este tipul de dispersie:
dac

1, dispersia este uniform;

dac

1, dispersia este aleatoare;

dac

1, dispersia este grupat.

FI
R

ES

Ce se ntmpl dac valoarea indicelui de dispersie este foarte


apropiat de 1? Valoarea respectiv poate fi considerat ca aproximativ
egal cu 1 sau, la fel de bine, poate fi considerat n funcie de situaie ca
fiind mai mare sau mai mic dect 1.
ntr-o astfel de situaie, pentru a lua o decizie obiectiv trebuie ca
acesteia s i se atribuie o probabilitate, adic s se realizeze o estimare
statistic. Pentru aceasta se impune o standardizare a indicelui de dispersie
prin nmulirea acestuia cu numrul gradelor de libertate, adic cu numrul
unitilor de prob minus unu (
1), obinndu-se o statistic de tip :

ZA

1 .

Cnd numrul unitilor de prob este relativ mic (


30), se
cu valorile critice ale distribuiei
pentru
1
compar statistica
grade de libertate i pentru pragul de confiden 0,975 i, respectiv, 0,025:
dac
dac
dac

dispersia este uniform;


dispersia este aleatoare;
,
,
dispersia este grupat.

n oricare dintre situaiile de mai sus, nivelul de confiden al


estimrii este de 0,05 (cele dou valori critice exclud fiecare cte 0,025 din
fiecare coad a distribuiei ). Deci probabilitatea ca dispersia s fie de un
anumit tip este de 0,95 sau 95%.

Distribuii probabilistice

47

Cnd numrul unitilor de prob este relativ mare (


se calculeaz o statistic conform relaiei:
2

30), atunci

1.

Aceast statistic se compar cu valoarea critic 1,96, care este o


valoare ce exclude 0,05 din distribuia normal standard (seciunea 4.5):
dispersia este uniform;
dispersia este aleatoare;
dispersia este grupat.

dac
1,96
dac | | 1,96
dac
1,96

ES

i n acest caz, nivelul de ncredere este de 0,05, deci probabilitatea


ca dispersia s fie de un anumit tip este de 0,95 sau 95%.

ZA

FI
R

Indicele de dispersie face distincia dintre cele trei tipuri, dar nu


poate indica gradul de aglomerare n cazul unei dispersii grupate, deoarece
este puternic influenat de numrul total de entiti individuale din toate
unitile de prob. Pentru a aprecia gradul de aglomerare dintr-o dispersie
grupat, se folosete indicele Green ( ), care elimin dependena de
numrul tuturor indivizilor din toate unitile de prob. Numrul total de
indivizi din toate unitile de prob va fi egal cu
n cazul n care
datele sunt sub form de tabel de frecvene sau cu
dac datele sunt sub
form de densiti pe unitatea de prob.

sau

Acest indice ia valori ntre 0, pentru dispersie aleatoare, i 1, pentru


dispersie grupat, cu grad maxim de aglomerare (toate entitile au fost
identificate ntr-o singur unitate de prob). Acest indice poate fi folosit
pentru compararea gradului de aglomerare a unor probe diferite ca numr de
entiti, medie sau numr de uniti de prob.

48

Elemente de statistic aplicate n ecologie

Exemplul 4.4. ntr-o populaie de plante, prin investigarea a 14


ptrate de prob s-au obinut densitile indivizilor. Care este tipul de
dispersie al populaiei?
0
2

0
30

0
5

5
9

3
22

48
1

1
0

9
207,69
,

23,08 .

14

1 23,08

ES

Indicele de dispersie este evident mai mare ca 1. n continuare vom


verifica dac dispersia aglomerat este semnificativ.
300,04

5,009
24,736 .

ZA

FI
R

Aceast valoare se compar cu valorile critice calculate pentru 13


grade de libertate i pentru nivelurile de semnificaie 0,975 i, respectiv,
0,025 (anexa 3):

Valoarea calculat (
300,04) este mai mare dect limita
superioar ( , ,
24,736) a intervalului de confiden pentru
dispersia aleatoare, deci populaia investigat are o dispersie aglomerat, cu
o probabilitate de 0,95 sau 95%.
Se estimeaz gradul de aglomerare cu indicele Green ( ). Datele
sunt sub form de densitate pe ptrat de prob, deci numrul total de indivizi
identificai n cele 14 ptrate este dat de suma numrului de indivizi din
fiecare ptrat.
,

0,177

Distribuii probabilistice

49

Avnd n vedere c
ia valori ntre 0 i 1, se poate concluziona c
gradul de aglomerare nu este destul de sczut.

ES

n situaia n care numrul unitilor de prob este mai mare de 30,


se poate verifica dac frecvenele observate ale variabilei concord cu
frecvenele estimate cu ajutorul uneia dintre distribuiile probabilistice
discrete (binomial, Poisson, binomial negativ) ce servete drept model.
Practic, se calculeaz probabilitatea de a obine o anumit valoare a
variabilei pe unitate de prob, dup care se convertete n frecven prin
nmulirea cu numrul unitilor de prob. Concordana frecvenelor
observate cu cele estimate (cu modelul) se poate face prin reprezentarea
de concordan (seciunea 10.1).
grafic a ambelor frecvene i prin testul
n seciunile urmtoare ne vom referi la compararea grafic a frecvenelor.

ZA

FI
R

4.4.2. Modelul binomial


Calcularea probabilitii binomiale de obinere a unei valori a
variabilei pe unitate de prob se bazeaz pe procedura descris n exemplul
4.1, cu deosebirea c numrul de ncercri ( ) se estimeaz ca fiind valoarea
rotunjit obinut prin calcularea expresiei:

Parametrii i reprezint probabilitatea ca o anumit poziie dintr-o


unitate de prob s fie ocupat de o entitate.
,

iar

Pe baza acestor parametrii se calculeaz probabilitatea binomial


(
) de a obine o anumit valoare a variabilei ( ) pe unitate de prob.
Ulterior se afl frecvena estimat a valorii prin nmulirea probabilitii
acesteia cu numrul unitilor de prob
.

50

Elemente de statistic aplicate n ecologie

Exemplul 4.5. S-au determinat densitile indivizilor unei specii de


plante din 50 de ptrate de prob cu o anumit suprafa. Care este tipul de
dispersie al populaiei de plante?
Nr. indivizi pe ptrat 16 17 18 19 20 21 22
3 5 8 14 11 6 3
Frecvena

Variabila este numrul indivizilor pe ptrat de prob i o vom nota


cu . Frecvenele observate le vom nota cu .
Pentru a calcula numrul mediu de indivizi pe ptrat ( ), trebuie aflat
numrul total de indivizi din toate ptratele. Deoarece datele sunt prezentate
sub form de tabel de frecven, numrul total de indivizi identificai va fi

FI
R

ES

16 17 18 19 20 21 22 Suma
50
3 5
8
14 11
6
3
48 85 144 266 220 126 66 955
19,1

2,38

ZA

Indicele de dispersie este evident subunitar, deci se poate ca


populaia s aib o dispersie uniform.
Indicele de dispersie =
0,124 50
2 6,099
6,356
1,96

,
,

0,124

1
6,099
2 50 1
1
6,356
dispersie uniform semnificativ

n continuare se calculeaz valorile


,
,
,

21,82
0,876

i :

22
1

0,876

0,124 .

Distribuii probabilistice

51

Pornind de la aceste valori, se pot calcula probabilitile pentru


indivizi la ptrat de prob (anexa 3):
16

!
!

0,876

0,124

0,0331 .

C
16

f'

ES

16
14
12
10
8
6
4
2
0

FI
R

16 3 0,033 1,654
17 5 0,082 4,107
18 8 0,160 8,024
19 14 0,238 11,881
20 11 0,251 12,534
21 6 0,168 8,396
22 3 0,054 2,684

frecvena

La fel se procedeaz i pentru celelalte valori, dup care se nmulesc


cu numrul unitilor de prob, obinndu-se frecvenele estimate ( ).

17

18

19

20

21

22

ZA

Se poate observa c exist o concordan destul de mare ntre


frecvenele observate i cele estimate pe baza modelului binomial. Deci
putem concluziona c dispersia populaiei este uniform.
4.4.3. Modelul Poisson
Calcularea probabilitii de obinere a unei valori a variabilei pe
unitate de prob, conform distribuiei Poisson, se bazeaz pe procedura
descris n exemplul 4.2.
Exemplul 4.6. ntr-un studiu s-a urmrit densitatea indivizilor unei
specii de arpe n 100 de ptrate de prob, ntr-o formaiune ierboas. Ce tip
de dispersie prezint populaia studiat?

52

Elemente de statistic aplicate n ecologie

Nr. indivizi/ptrat 0 1 2 3 4 5 6 7 8
7 16 25 18 16 10 5 2 1
Frecvena
Se calculeaz media i deviaia standard la fel ca n exemplul 4.5.
0 1 2 3 4 5 6 7 8 Suma
7 16 25 18 16 10 5 2 1 100
0 16 50 54 64 50 30 14 8 286

3,11

2,86

FI
R

ES

Indicele de dispersie poate fi considerat fie aproximativ egal cu 1, fie


supraunitar.
,

Indicele de dispersie

1,088

ZA

1,088 100 1
107,706
2 100 1
1 0,641
2 107,76
0,641 1,96
dispersie aleatoare semnificativ

n continuare se calculeaz probabilitatea Poisson (


) pentru
toate valorile variabilei (anexa 3). Se obin astfel probabilitile de apariie
a indivizi la ptrat de prob. Probabilitatea de a obine indivizi n 100
de ptrate se obine nmulind
cu 100. Valorile astfel obinute
reprezint frecvenele teoretice ( ).
0

2,7183

2,7183

!
!

0,05727
0,16379

La fel se procedeaz i pentru celelalte valori, dup care se nmulesc


cu numrul unitilor de prob, obinndu-se frecvenele estimate ( ).

Distribuii probabilistice

53

0,05727 100
0,16379 100

5,727
16,379 .
30

f'

20
15
10
5
0
0

5,727
16,379
23,422
22,329
15,965
9,132
4,353
1,778
0,636

4
x

0,057
0,164
0,234
0,223
0,160
0,091
0,044
0,018
0,006

ES

7
16
25
18
16
10
5
2
1

frecvena

0
1
2
3
4
5
6
7
8

25

FI
R

Se poate observa c exist o concordan destul de mare ntre


frecvenele observate i cele estimate pe baza modelului Poisson. Deci
putem concluziona c dispersia populaiei studiate este aleatoare.

ZA

4.4.4. Modelul binomial negativ


Calcularea probabilitii de obinere a unei valori a variabilei pe
unitate de prob, conform distribuiei binomiale negative, se bazeaz pe
procedura descris n exemplul 4.3.

Exemplul 4.7. ntr-un studiu s-a urmrit densitatea indivizilor unei


specii de plante n 100 de ptrate de prob. Care este tipul de dispersie al
populaiei?
Nr. indivizi/ptrat
Frecvena

0 1 2 3 4 5 6 7 8 9 10 11
20 27 18 12 10 4 2 3 2 0 1 1

Se calculeaz media i deviaia standard la fel ca n exemplul 4.5.


0 1 2 3 4 5 6 7 8 9 10 11 Suma
20 27 18 12 10 4 2 3 2 0 1 1
100
0 27 36 36 40 20 12 21 16 0 10 11
229

54

Elemente de statistic aplicate n ecologie

2,29
,

5,16

Indicele de dispersie este evident supraunitar.


,

Indicele de dispersie

2,252

2,252 100 1
222,965
2 222,965
2 100 1
1 7,081
7,081 1,96
dispersie grupat semnificativ

ES

Pentru distribuia binomial negativ este necesar calcularea


parametrului . Acesta este o variabil continu, motiv pentru care valoarea
sa nu se rotunjete ca n cazul distribuiei binomiale.

FI
R

,
,

1,829

1
,

ZA

n continuare se calculeaz probabilitatea Poisson (


toate valorile variabilei :

,
,

) pentru

0,2265 ;
,
,

,
,

0,2265

0,2304 ;

0,2304

0,1811 .

La fel se procedeaz pentru restul valorilor lui . Probabilitile de


apariie a indivizi la ptrat de prob se nmulesc cu numrul unitilor de
prob (100), obinndu-se astfel frecvenele estimate ( ) conform
modelului binomial negativ.
0,227 100 22,65
0,2304 100 23,04
0,1815 100 18,15

Distribuii probabilistice

55
30

22,65
23,04
18,11
12,85
8,63
5,59
3,54
2,20
1,35
0,82
0,49
0,29

f'

25
20
15
10
5
0

0,2265
0,2304
0,1811
0,1285
0,0863
0,0559
0,0354
0,0220
0,0135
0,0082
0,0049
0,0029

0 1 2 3 4 5 6 7 8 9 10 11

20
27
18
12
10
4
2
3
2
0
1
1

frecvena

0
1
2
3
4
5
6
7
8
9
10
11

ES

FI
R

Se poate observa c exist o concordan destul de mare ntre


frecvenele observate i cele estimate pe baza modelului distribuiei
binomiale negative. Deci se poate concluziona c dispersia populaiei
studiate este aglomerat.

ZA

4.5. DISTRIBUIA NORMAL

Distribuia normal este una dintre distribuiile continui. Aceasta


descrie, mai mult sau mai puin, distribuia unui mare numr de variabile,
motiv pentru care reprezint o baz conceptual pentru multe procedee de
analiz statistic.
Variabilele continui pot lua orice valoare ntre anumite limite. Dac
se reprezint grafic distribuia frecvenelor unei astfel de variabile ntr-o
populaie, prin intermediul unei linii continui, aceasta va avea o form
simetric, de clopot. De aceea, aceast distribuie mai este numit i
clopotul lui Gauss, care este unul din autorii (Moivre 1733, Legendre
1805, Laplace 1812) care a descris riguros aceast distribuie (Gauss 1809).
Teoretic, dac se realizeaz histograma folosind un numr infinit de valori
individuale, iar intervalul de clas este cel mai mic posibil, histograma sau
poligonul frecvenelor tinde s devin o curb continu (fig. 4.3).

Elemente de statistic aplicate n ecologie

ES

56

FI
R

x
Figura 4.3. Distribuia frecvenelor valorilor unei variabile

ZA

Numeroase variabile continui ntlnite n natur au o distribuie


normal. De asemenea, multe variabile care au o amplitudine mare a
valorilor prezint o distribuie aproximativ normal. Unele distribuii
discrete tind s devin aproximativ normale sau simetrice pe msur ce
parametrii legai de numrul de valori cresc.

Proprietile distribuiei normale


1. Distribuia este definit de medie ( ) i de deviaia standard ( ).
Poziia distribuiei pe abscis este determinat de valoarea mediei,
iar lrgimea acesteia, de deviaia standard (fig. 4.4). Cum aceti
parametri pot avea o infinitate de valori diferite, nseamn c
exist un numr infinit de distribuii normale.
2. nlimea curbei fa de ordonat este dat de funcia de repartiie
pentru fiecare valoare individual a variabilei:

Distribuii probabilistice

57

s1
s2

m2

m1

Figura 4.4. Distribuii normale diferite dup medii (m) i deviaii standard (s)

ZA

FI
R

ES

3. Curba este perfect simetric fa de medie, motiv pentru care


media i mediana sunt egale n distribuia normal. De asemenea,
valorile variabilei egale cu media sunt cele mai frecvente i astfel
media este egal cu modul valorilor individuale. n concluzie,
media, mediana i modul valorilor unei variabile normal
distribuite sunt egale.
4. Curba distribuiei cuprinde probabilitatea total, adic 1. Dac se
consider suprafaa delimitat de curb ca fiind 100%, atunci
suprafaa delimitat de valoarea
i
reprezint
aproximativ 68,26% din total. Adic n jur de 68% dintre valorile
variabilei sunt cuprinse n acest interval sau probabilitatea ca o
valoare selectat aleator din populaie s fie cuprins de acest
interval este de 0,68. ntre
2 i
2 se gsete 95,44%
din suprafaa curbei, adic probabilitatea de a observa o valoare
3 ,
3
din acest interval este de 0,9544, iar intervalul
cuprinde 99,74% din valorile individuale sau probabilitatea de a
extrage o valoare din acest interval este de 0,9974 (fig. 4.5). n
practic se folosesc probabilitile 0,95 i 0,99, pentru care
intervalele sunt
1,96 i, respectiv,
2,58 . Probabilitatea
ca o valoare s fie n afara celor dou intervale va fi 1 0,95
0,05 i, respectiv, 1 0,99 0,01. Aceste proprieti pot fi
folosite pentru aprecierea posibilitilor de apariie a unor
rezultate.

58

Elemente de statistic aplicate n ecologie

0,9974
0,9544

+ +2 +3

-3 -2

0,6826

ES

Figura 4.5. Suprafee ale distribuiei normale

ZA

FI
R

Distribuia normal standard


Orice distribuie normal particular (
, ) poate fi convertit la
distribuia normal standard care se caracterizeaz prin faptul c are media
zero i deviaia standard unu ( 0,1 ). Aceast conversie se realizeaz prin
calcularea scorului pentru fiecare valoare individual a variabilei , n
funcie de media i de deviaia standard populaional ( i ):
.

n practic, parametrii populaionali nu pot fi cunoscui cu exactitate,


caz n care pot fi substituii cu statisticile probei ( i ), cu condiia ca
dimensiunea probei sa fie mai mare sau egal cu 30 (
30).

Astfel, pentru valorile mai mici dect media, va avea o valoare


negativ, iar pentru cele mai mari dect media, o valoare pozitiv. Scorul
arat la ce distan de medie exist o anumit valoare, unitatea de referin
fiind deviaia standard.
Intervalele de probabilitate ale distribuiei normale standard vor fi

Distribuii probabilistice

59

1, 1 pentru aproximativ 0,6826 sau 68,26%, 2, 2 pentru 0,9544 sau


95,44% i 3, 3 pentru 09974 sau 99,74%. Pentru probabilitile de 0,95
i 0,99, intervalele vor fi cuprinse ntre 1,96, 1,96 i, respectiv,
2,58, 2,58 (fig. 4.6).

0,95

-1

+1 +1,96 +2,58

FI
R

-2,58 -1,96

ES

0,6826

0,99

Figura 4.6. Suprafee ale distribuiei normale standard

ZA

Probabilitile pentru diferite valori ale lui sunt tabelate (anexa 2)


sau pot fi calculate (anexa 3) pornind de la coada din stnga (cu valori
extreme negative) a 0,1 i pn la valoarea calculat.

Exemplul 4.8. Considernd datele din exemplul 3.1 reprezentnd


nlimile a 50 de indivizi de migdal pitic (Amygdalus nana), s se estimeze:
a) Ce procent din populaie are nlimea cuprins ntre 60
i
80 ?
b) ntre ce interval de nlime sunt cuprinse 95% din valorile
nlimii n populaie?
Se cunoate c
70,85 i
6,92.
Pentru a rspunde la prima ntrebare trebuie fcut conversia celor
dou valori la distribuia normal standard, adic trebuie calculate scorurile
pentru cele dou nlimi, dup care se afl probabilitile sau procentele
celor corespunztoare. Simplificnd, se parcurge urmtoarea schem
.

60

Elemente de statistic aplicate n ecologie

Pentru

60 scorul

Pentru

80 scorul

,
,

Probabilitile celor dou scoruri


calculeaz (anexa 3)

1,568 .

1,322 .

se caut n tabel (anexa 2) sau se

1,568
0,058
1,322
0,907 .

0,907

0,058

FI
R

ES

Prima probabilitate arat c din coada stng (cu valori negative) a


0,1 i pn la
1,568 sunt cuprinse 5,8% din suprafaa delimitat
de curb. A doua arat c din coada stng a
0,1 i pn la
1,322
sunt cuprinse 90,7% din suprafaa delimitat de curb.
Ca s aflm ce procent din valorile nlimii se gsesc ntre 60
i
70 , trebuie sczute probabilitile:
0,849 .

sunt

ZA

Rspunsul la prima ntrebare este c ntre 60


i 70
cuprinse aproximativ 85% din valorile nlimii n populaie.

Pentru a rspunde la a doua ntrebare este nevoie s se parcurg


schema de raionament de la prima, dar n sens invers:
.
Scorul pentru o anumit probabilitate se afl din tabel (anexa 2)
sau se calculeaz (anexa 3). Avnd n vedere c att tabelul din anexa 2, ct
i funcia din anexa 3 consider probabilitatea din coada stng a
0,1 ,
nseamn c aflarea scorului pentru
0,95 va returna limita superioar
a unui interval dispus asimetric fa de medie, limita inferioar fiind ctre
. Astfel, pentru a obine scorurile care s delimiteze o suprafa de
0,95 din
0,1 simetric fa de medie, trebuie ca diferena 1 0,95
0,05 s fie mprit n mod egal n ambele cozi ale distribuiei (ca n fig.
4.6). Deci se afl scorurile pentru
0,025 i, respectiv, pentru
1
0,025 0,975. La fel ca la punctul a), primul separ 0,025 pn n coada
stng, al doilea, 0,975 pn n coada stng, iar ntre cei doi se gsete o
suprafa ce reprezint 0,95 din suprafaa total de sub clopot.

Distribuii probabilistice

61

1,96
1,96

,
,

Mai departe se calculeaz cele dou valori ale nlimii ( ) pornind


de la cele dou scoruri , pe baza relaiei pentru aflarea scorurilor .

1,96 6,92 57,29


1,96 6,92 84,41

70,85
70,85

i 84,41

sunt

ES

Rspunsul de la punctul b) este c ntre 57,29


cuprinse 95% din valorile nlimii n populaie.

ZA

FI
R

4.5.1. Aprecierea normalitii datelor


Metodele statistice utilizate n ecologie sunt de dou categorii:
parametrice i neparametrice. Cele parametrice sunt mai puternice, dar
totodat mai restrictive n sensul c se pot aplica doar dac datele ntrunesc
o serie de condiii. O condiie comun pentru toate testele parametrice este
ca datele s fie aproximativ normal distribuite. Metodele neparametrice nu
prevd aceast condiie i din aceast perspectiv se mai numesc i
independente de distribuie. Ele pot fi utilizate pentru o gam mai variat de
situaii, dar sunt mai puin puternice (seciunea 5.5, Erori statistice).
Deci, pentru a putea utiliza metode statistice parametrice, trebuie s
se verifice normalitatea distribuiei datelor. Din start trebuie subliniat c
variabilele trebuie s fie apreciate pe o scal de interval sau raport, cu alte
cuvinte trebuie s fie continui sau discrete (n cazul celor discrete trebuie s
existe un numr relativ mare de valori posibile).
n statistic exist teste dedicate, care verific dac datele au o
distribuie aproximativ normal, dar care sunt relativ complicate i rareori
utilizate, motiv pentru care doar le menionm pe cele mai cunoscute: testul
Shapiro-Wilk, testul Kolmogorov-Smirnov, testul Cramr-von-Mises, testul
Jarque-Bera.
de
Testarea normalitii se poate face i cu ajutorul testului
concordan ntre frecvenele valorilor variabilelor din prob i frecvenele
estimate pe baza funciei de repartiie a distribuiei normale. Acest procedeu

62

Elemente de statistic aplicate n ecologie

ES

este i el destul de laborios.


O verificare simpl, dar laborioas a normalitii distribuiei datelor,
o reprezint aprecierea empiric a similaritii dintre poligonul frecvenelor
valorilor variabilei investigate i curba n form de clopot a distribuiei
normale. n cadrul exerciiului din exemplul 2.3 (fig. 2.3, 2.4) se poate
spune c frecvenele observate au o distribuie ce poate fi considerat
aproximativ normal.
Verificarea normalitii datelor se poate face i pornind de la
proprietile matematice ale distribuiei normale. Astfel, dac valorile sunt
distribuite simetric fa de medie, adic ntre medie i median nu exist o
diferen mare (seciunea 3.1 Relaia dintre descriptorii tendinei centrale),
i aproximativ 70% din valori sunt cuprinse n intervalul delimitat de
valorile
i
, atunci se poate aprecia c variabila analizat este
aproximativ normal distribuit n prob.

FI
R

Exemplul 4.9. S se verifice rapid dac datele din exemplul 3.1 au o


distribuie apropiat de cea normal.

ZA

69
69,8
70,85

Simpla vizualizare a descriptorilor tendinei centrale arat c


distribuia valorilor din prob este aproximativ normal deoarece acetia au
valori foarte apropiate.

Intervalul

are urmtoarele limite:

70,85
70,85

63,93
77,77 .

6,92
6,92

ntre aceste dou valori se gsesc 34 din 50 de valori, adic 68% din
valorile din prob. Acest procent este apropiat de cel cuprins n intervalul
,
al unei distribuii normale, adic de 68,26%.
Dac datele nu sunt normal distribuite, atunci cel mai simplu este s

Distribuii probabilistice

63

ZA

FI
R

ES

se foloseasc o metod statistic alternativ, neparametric. Folosirea


metodelor parametrice n astfel de situaii este totui permis dac se
realizeaz o transformare a datelor care s corecteze distribuia acestora.
Transformarea datelor este necesar dac datele sunt sub form de
numr de entiti. Astfel de variabile discrete au o distribuie evident
asimetric. n astfel de situaii se folosesc transformri care au rolul de a
normaliza distribuia datelor.
Numeroase tehnici parametrice compar mediile probelor care se
presupune c au variane suficient de asemntoare i care, din aceast
cauz, pot fi ignorate. Datele discrete ce reprezint numrtori de entiti nu
ndeplinesc aceast condiie, deoarece variana este dependent de medie n
sensul c populaiile la care media are o valoare mare, mprtierea valorilor
fa de medie este mai mare i, implicit, variana va fi mai mare. n astfel de
situaii transformrile au rolul de a ntrerupe relaia dintre medie i varian,
adic de a stabiliza variana datelor.
Transformrile cele mai utilizate n ecologie sunt logaritmul,
radicalul i transformarea arcsin (anexa 3). Acestea se calculeaz n diferite
condiii pentru toate valorile individuale din probe.
Transformarea logaritmic se utilizeaz atunci cnd variana
probei este mai mare dect media acesteia. De asemenea, are si rolul de a
normaliza distribuia datelor. Valoarea transformat
a unei valori
individuale se calculeaz folosind cel mai adesea logaritmul zecimal sau
pe cel natural:
.

sau

Dac n prob exist valori egale cu zero, atunci logaritmul nu are


sens i transformarea se poate face fie adugnd o unitate la toate valorile,
fie folosind transformarea arcsinh (sinus hiperbolic invers) returneaz
valoarea zero dac
0.
1
Transformarea prin extragerea radicalului se folosete atunci
cnd variana datelor de tip numr de entiti este aproape egal cu media i

64

Elemente de statistic aplicate n ecologie

pentru normalizarea distribuiei. i aici, n cazul existenei valorilor nule, se


poate aduna o constant la toate valorile din prob (1 sau 0,5):

1 sau

0,5 .

FI
R

ES

pentru procente

pentru proporii

Transformarea arcsin se folosete atunci cnd datele sunt sub


form de proporii sau procente. n cazul unor astfel de variabile distribuia
valorilor este trunchiat de cele dou valori extreme: 0 i 1 pentru proporii
i 0 i 100 pentru procente. Rezultatul transformrii n radian se transform
n grade (anexa 3).

ZA

n anumite situaii este nevoie de realizarea transformrii inverse


(anexa 3) pentru raportarea rezultatului n forma iniial a datelor (
).
Transformarea invers se realizeaz astfel:
Pentru transformarea prin logaritmare:
1.

Pentru transformarea arcsinh:


.
Pentru transformarea prin radical:
1

sau

Pentru transformarea arcsin:


sin
sin
100 .

0,5 .

5. STATISTIC INFERENIAL: ELEMENTE


INTRODUCTIVE

ES

Statistica inferenial (inductiv sau analitic) este partea statisticii


care cuprinde metode de apreciere critic a variabilitii parametrilor
empirici. Inferena statistic reprezint tratarea teoretic a datelor pentru a se
ajunge la concluzii logice, asociate observaiilor efectuate. Din punct de
vedere ecologic, inferena statistic reprezint stabilirea unor concluzii
despre populaii pornindu-se de la analiza probelor prelevate din populaiile
respective.
n general, se recunosc dou categorii largi de inferene statistice:
estimarea unor parametri populaionali i testarea ipotezelor statistice.

FI
R

5.1. ESTIMAREA MEDIEI POPULAIONALE

ZA

Dac dintr-o populaie se preleveaz o prob aleatoare, aceasta va fi


una din numeroasele probe aleatoare care se pot extrage din populaia
respectiv. Fiecare dintre aceste populaii va avea statistici diferite: medii
diferite, deviaii standard diferite. Cu toate acestea, statisticile acestor
populaii sunt estimatori ai parametrilor populaionali (fig. 5.1). Diferenele
dintre aceste probe sunt cauze ale erorii de eantionare, ce rezult din faptul
c unele probe vor cuprinde mai multe valori mari, n timp ce altele, mai
multe valori mici din populaia de cercetat. Eroarea de eantionare nu este
rezultatul unor greeli realizate de observator, ci reflect mprtierea
aleatoare ce se regsete n probe. Mediile probelor prelevate aleator din
populaie se distribuie n jurul mediei populaionale, la fel cum valorile
individuale ntr-o prob se distribuie n jurul mediei probei (fig. 5.2). Acest
concept are o valoare fundamental i este surprins de Teorema limit
central (Moivre 1738, Laplace 1813): mediile probelor (x ) extrase dintr-o
populaie normal distribuit sunt la rndul lor normal distribuite n jurul
mediei populaionale (). Mediile probelor extrase dintr-o populaie
nenormal distribuit au o distribuie aproximativ normal dac dimensiunea
probei este mare (n > 30).

66

Elemente de statistic aplicate n ecologie

Populaie
,

Populaie 3
x 3, s3

Populaie 2
x 2, s2

Populaie 1
x 1, s1

Populaie i
x i, si

ZA

FI
R

ES

Figura 5.1. Reprezentarea grafic a prelevrii repetate a probelor din populaie. (linie
continu sensul prelevrii; line ntrerupt sensul estimrii)

x 1

x 2

x 3

x 4

x 5

x 6

Figura 5.2. Distribuia normal a mediilor probelor fa de media populaiei

Utilitatea acestei teoreme const n faptul c nu este necesar


prelevarea repetat a probelor din populaie pentru a cunoate modul lor de
distribuire; ele vor avea o distribuie normal. Astfel, putem lua n
considerare doar o singur medie a unei probe prelevate dintr-o populaie ca
fiind una dintre numeroasele medii a cror distribuie ar fi normal. La fel
cum deviaia standard surprinde mprtierea valorilor individuale fa de
media probei, tot aa, mprtierea mediilor probelor poate fi surprins de o
deviaie standard a mediilor probelor, care se numete eroarea standard a
mediei.
Estimarea mediei populaionale se poate face pornind de la media i

Statistic inferenial: elemente introductive

67

ZA

FI
R

ES

deviaia standard ale unei probe i cu ajutorul erorii standard a mediei. Dat
fiind faptul c distribuia mediilor probelor se abate de la normalitate pe
msur ce dimensiunea probei scade, se apeleaz la o distribuie care descrie
mai bine distribuia mediilor probelor atunci cnd deviaia standard a
populaiei este estimat prin deviaia standard a probei. Aceast distribuie
se numete distribuia sau distribuia Student.
Distribuia Student este similar n multe privine cu distribuia
normal, dar, spre deosebire de aceasta, este definit, pe lng media i
deviaia standard, i de numrul gradelor de libertate ( 1). Aa cum o
valoare
corespunde unei anumite proporii din distribuia normal
standard, tot aa o valoare corespunde unei proporii a distribuiei Student,
dar n plus ia n consideraie i dimensiunea probei prin intermediul gradelor
de libertate. Valorile lui scad odat cu creterea diferenei 1, astfel c o
valoare critic , , ce definete 0,95 sau exclude 0,05 din distribuia
Student pentru o infinitate de valori ca grade de libertate are valoarea 1,96,
adic exact valoarea lui , ce definete aceeai proporie din distribuia
normal standard. Deci distribuia t tinde s devin normal odat cu
creterea dimensiunii probei.
Valorile distribuiei t sunt tabelate sau se pot calcula n funcie de
proporia exclus din distribuie i de numrul gradelor de libertate. De
exemplu, valoare ce exclude 0,05 din distribuia Student pentru 1 4
grade de libertate este 2,776. Proporia (0,05) sau procentul (5%) exclus
este repartizat n mod egal n cele dou cozi ale distribuiei (fig. 5.3).

0,025

0,025
-2.776

0
Figura 5.3

Deci exist de fapt dou valori :

2.776

2,776 care exclude 0,05/2

68

Elemente de statistic aplicate n ecologie

ES

0,025 din coada din dreapta a distribuiei i 2,776 care exclude 0,025 din
coada stng a distribuiei.
Dac dorim s reprezentm valoarea
care exclude 0,05 din
distribuie doar n coada dreapt pentru 4 grade de libertate, atunci trebuie
cutat n tabel valoarea ce exclude 0,1 din distribuie, care exclude cte
0,05 n fiecare coad din distribuie (fig. 5.4). Aceast valoare este 2,132.
Deci, dac ne intereseaz o singur coad a distribuiei, trebuie cutat
valoarea care exclude o proporie dubl din distribuie.

0,05

FI
R

0,05

-2.132

2.132

Figura 5.4

ZA

Estimarea intervalului de confiden al mediei populaionale pe baza


deviaiei standard a probei i cu ajutorul distribuiei are urmtoarele
condiii de aplicare:

1. proba este prelevat aleator din populaia de interes;


2. datele sunt apreciate pe o scal de raport sau de interval;
3. variabila este aproximativ normal distribuit n prob.
Pentru a realiza estimarea este nevoie de valoarea mediei probei i
a deviaiei standard estimate .
Cu ajutorul deviaiei standard se calculeaz eroarea standard a
mediei:

Statistic inferenial: elemente introductive

69

Se estimeaz intervalul de confiden pentru o probabilitate de 0,95


(95%) a mediei populaiei pornind de la relaia:

Din aceast relaie rezult limita inferioar ( ) i cea superioar


) a intervalului de confiden:

Concluzia estimrii este c intervalul - include media populaiei


din care a fost extras proba, cu o probabilitate de 95% (0,95).

440
340
470

66
363
360

215
491
370

228
500
435

ZA

390
330
389

FI
R

ES

Exemplul 5.1. La o prob format din 30 de indivizi de viper de


step (Vipera ursinii moldavica) extras aleatoriu dintr-o populaie s-a
msurat lungimea n mm de la vrful botului i pn la cloac. S-a estimat
apoi intervalul de confiden al mediei pentru o probabilitate de 95%.
146
325
400

443
390
390

375
425
430

450
418
164

260
422
340

Se verific dac datele ndeplinesc condiiile de aplicare: proba a fost


prelevat aleatoriu din populaia de interes; lungimea este o variabil
continu apreciat pe o scal de raport; pentru a verifica normalitatea datelor
putem folosi elemente din statistica descriptiv a probei.
390
389,5
362,17
Cele trei msuri ale tendinei centrale au valori relativ apropiate. Se
poate considera c datele sunt aproximativ normal distribuite.
n continuare se calculeaz deviaia standard a probei:
96,62 .

70

Elemente de statistic aplicate n ecologie

Cu ajutorul acestei valori se afl eroarea standard a mediei:


,

,
,

17,64 .

Se estimeaz limitele intervalului de confiden al mediei. n acest


sens, se caut valoarea n tabel.
,

2,045
36,08

ES

362,17 17,64 2,045 362,17


362,17 36,08 326,09
362,17 36,08 398,25

FI
R

Intervalul 326,09-398,25 include media populaional a lungimii de


la vrful botului la cloac cu o probabilitate de 95%.
Reprezentarea grafic a intervalului de confiden al mediei se
realizeaz prin intermediul unor segmente dispuse deasupra i dedesubtul
mediei, ce simbolizeaz limita inferioar i cea superioar (fig. 5.5).

400

326,09

380

ZA

420

362,17

360
340

398,25

320
300
x

Figura 5.5. Intervalul de confiden al mediei (95%)

Acest tip de reprezentare poate fi folosit i atunci cnd se compar


mediile mai multor probe din populaii diferite. Suprapunerea intervalelor

Statistic inferenial: elemente introductive

71

indic absena unei diferene marcante ntre mediile celor dou populaii din
care au fost prelevate probele analizate.
5.2. ESTIMAREA UNEI PROPORII

FI
R

. .

ES

n ecologie, se folosesc adesea frecvenele de apariie ale unei valori


n probe reprezentat sub forma unei proporii sau procent din total.
Proporia unei specii n prob reprezint o estimare a proporiei populaiei n
comunitatea analizat. Probele ulterioare reprezint estimatori ai proporiei
populaiei din specia de interes n comunitate. Proporiile rezultate din
analiza acestor probe vor fi diferite datorit erorii de selecie. Aceste
proporii ale probelor se vor distribui n jurul proporiei populaiei n acelai
fel cu modul n care se distribuie mediile probelor n jurul mediei populaiei.
Deviaia standard a distribuiei se numete eroare standard i se estimeaz
astfel:

proporia speciei

numrul total de specii.

ZA

Intervalul de confiden al proporiei populaiei este:


1,96 . . .

5.3. ESTIMAREA EFECTIVULUI POPULAIONAL


Indicele Lincon-Petersen este un estimator al numrului de indivizi
dintr-o populaie, pe baza proporiei indivizilor marcai n prima prob care
se regsesc (sunt recapturai) n a doua prob.
1,
estimarea efectivului populaiei;
nr. indivizilor capturai, marcai i eliberai n prima prob;
nr. total al indivizilor capturai n a doua prob;
nr. indivizilor marcai, recapturai n a doua prob.
Deviaia standard aproximativ a acestui estimator este:

72

Elemente de statistic aplicate n ecologie

.
Intervalul de confiden al efectivului populaiei ( ) pornind de la
relaia:
1,96 .
5.4. ESTIMAREA INDICELUI DE DIVERSITATE

FI
R

ES

Indicii de diversitate sunt utili n aprecierea biodiversitii unei zone.


Cel mai simplu indicator al diversitii biologice este bogia specific sau
numrul de specii. Exist o serie de indici ai diversitii care, pe lng
numrul de specii, iau n consideraie i ct de echitabil sunt reprezentate
speciile din comunitate, prin intermediul numrului de indivizi. Unul dintre
cei mai folosii astfel de indici este indicele Shannon-Weaver:

ZA


proporia indivizilor speciei i din suma nr. de indivizi ai tuturor
speciilor.

Estimarea deviaiei standard care s descrie mprtierea valorilor


indicilor calculai pentru aceeai comunitate, n jurul unei medii
populaionale, este dificil. Din raiuni practice, valoarea indicelui trebuie
tratat ca o variabil ordinal. Astfel, o valoare a indicelui egal cu 4,0 nu
trebuie considerat ca fiind de dou ori mai mare dect una egal cu 2,0.
Tehnicile statistice care se pot aplica valorilor apreciate pe o scal ordinal
sunt n general neparametrice sau independente de distribuie. De exemplu,
un set de indici obinui prin analiza mai multor probe extrase din aceeai
zon poate fi comparat cu un alt set extras rezultat din alt zon prin
intermediul testului Mann-Whitney (seciunea 7.1.2).
O alt modalitate de comparare a indicilor const n transformarea
), exprimate proporional sau procentual:
acestora n diversiti relative (

Statistic inferenial: elemente introductive

73

diversitatea maxim pentru acelai numr de specii


(diversitatea unei comuniti ideale cu acelai nr. de specii
cu cea real, n care toate speciile sunt reprezentate prin
acelai nr. de indivizi);
bogia specific sau nr. de specii identificate n comunitate.

Cnd se compar valorile indicilor de diversitate ( ) trebuie avute n


vedere dou aspecte: se compar indici pentru comuniti asemntoare (de
exemplu, se compar o comunitate de psri cu alta tot de psri, nu de
mamifere); se compar indici rezultai din analiza unor probe cu numere
apropiate de organisme.

FI
R
0,438
0,454
0,579
0,637
0,662
0,554
0,423

1,519
1,543
1,971
2,051
2,130
1,843
1,639

ZA

Releveu
1
2
3
5
4
Media
A

ES

Exemplul 5.2. ntr-un studiu al vegetaiei de step din rezervaia de


la Valea lui David s-au calculat diversitile pentru cinci comuniti vegetale
din asociaia Taraxaco serotinae-Festucetum valesiacae i diversitatea unei
comuniti din aceeai asociaie, studiat nainte de 1969 i notat cu A.
0,143
0,156
0,239
0,311
0,337
0,237
0,107

32,0
30,0
30,0
25,0
25,0
28,4
48,0

-1,947
-1,858
-1,430
-1,168
-1,089
-1,498
-2,232

3,466
3,401
3,401
3,219
3,219
3,341
3,871

Se poate observa c media indicilor de diversitate a celor cinci


relevee actuale este ceva mai mare dect valoarea indicelui pentru releveul
A, dei numrul de specii ( ) n cel din urm este evident mai mare. Acest
fapt poate fi explicat prin echitabilitatea redus a speciilor n releveul A.
Echitabilitatea n acest exemplu a fost calculat pe baza relaiei:
.
Cum echitabilitatea este un numr subunitar, logaritmul va fi un

74

Elemente de statistic aplicate n ecologie

numr negativ, deci indicele de diversitate


este egal cu diversitatea
maxim
care este micorat de echitabilitatea sczut a
abundenei speciilor
5.5. TESTAREA IPOTEZELOR STATISTICE

ZA

FI
R

ES

n orice tiin, progresul se obine prin realizarea observaiilor


asupra unor procese sau fenomene i prin experimente ale cror concluzii
sunt utilizate sub forma unor generalizri sau teorii care s explice
observaiile. Demersul tiinific debuteaz cu realizarea observaiilor i cu
explicarea lor. Explicaia unei observaii tiinifice se numete ipotez i are
urmtoarele caracteristici: este n concordan cu observaiile fcute, adic,
dac este adevrat, atunci va explica ceea ce s-a observat; poate fi testat
prin experimente, adic, dac este fals, atunci acest lucru poate fi dovedit.
De ce trebuie dovedit falsitatea unei ipoteze i nu veridicitatea ei?
n filosofia tiinei, se consider c s poate dovedi c o ipotez fals este
fals, n timp ce o ipotez adevrat poate s nu se dovedeasc niciodat c
este adevrat. Ca urmare, o ipotez este considerat adevrat att timp ct
nu poate fi infirmat prin alte observaii, experimente i testri. Cnd
ncercrile de a dovedi falsitatea unei ipoteze eueaz, atunci ncrederea,
confidena n ipoteza respectiv crete. Dac o astfel de ipotez are o
aplicativitate larg i explic numeroase evenimente, atunci ea devine o
teorie. La fel ca n cazul ipotezelor, o teorie adevrat s-ar putea s nu poat
fi dovedit a fi adevrat, n timp ce una fals se poate dovedi a fi fals.
Se poate astfel spune c tiina avanseaz mai degrab infirmnd
dect afirmnd i c pn la urm teoriile incorecte vor fi invalidate.
Metodologia tiinific de confirmare a unei ipoteze opereaz pe
baza logicii dac atunci: dac ipoteza este corect, atunci rezultatul
testrii trebuie s fie unul anume. Dac rezultatul testrii este altul dect cel
prezis de ipotez, aceasta se respinge i trebuie cutat o explicaie mai
bun. Acest proces tipic pentru tiin este numit testarea ipotezelor.
Testarea unor concluzii tiinifice prin procedee statistice se numete
testarea ipotezelor statistice i reprezint o aplicare specific a
metodologiei tiinifice. Formularea ipotezelor statistice se face astfel nct
s existe doar dou rezultate posibile. De exemplu, se pot formula dou

Statistic inferenial: elemente introductive

75

ZA

FI
R

ES

ipoteze: afirmaia A este adevrat i afirmaia A nu este adevrat.


Dac primul enun este cel adevrat, atunci, conform filosofiei tiinei, nu se
poate dovedi acest fapt. Dac ns se testeaz al doilea enun i acesta se
dovedete a fi incorect (o ipotez fals se poate dovedi c este fals), atunci
se respinge enunul testat afirmaia A este fals i se accept cellalt
enun afirmaia A este adevrat ca unic alternativ corect.
Cnd se lucreaz pe probe extrase din populaii, deci doar cu o parte
din ntregul la care n final se va face referin, va exista ntotdeauna o
probabilitate ca proba s nu fie reprezentativ pentru toat populaia. Cu
toate acestea, se va putea preciza probabilitatea ca o ipotez din cele dou s
fie corect sau incorect. Dac probabilitatea ca ea s fie incorect este
foarte mic, atunci se poate considera c ipoteza respectiv este corect i
invers, dac probabilitatea ca ipoteza s fie corect este foarte mic, atunci
se poate concluziona c ipoteza este incorect.
n orice testare a ipotezelor statistice, ipotezele formulate sunt
ntotdeauna contradictorii. Ipoteza testat prin diferite procedee numite teste
statistice este aa-numita ipotez nul ( ). Aceasta presupune n general
lipsa efectului, lipsa diferenei i, ca urmare, conine sau implic o egalitate.
Cealalt ipotez, ipoteza alternativ (
sau
), se numete ipotez
alternativ. De exemplu, dac dorim s artm c este diferit de , atunci
va fi
(conine o egalitate), iar cea
va fi
. Ipoteza care se
testeaz este de fapt
. Dac aceasta se dovedete adevrat, atunci se
accept ca atare. Dac
se dovedete a fi fals, atunci se respinge i se
accept
ca unic alternativ.
Orice test statistic const ntr-o serie de calcule aplicate datelor din
probe care au ca rezultat o singur valoare numit statistica testului.
Statistica unui test reprezint o translaie a datelor din probe la o distribuie
cunoscut. Este un proces similar cu cel de trecere a unei valori de la o
distribuie normal particular la o valoare a distribuiei normale standard,
valoare ce corespunde unei anumite proporii din distribuie sau unei
anumite probabiliti (seciunea 4), conform schemei .
Statistica testului, proprie unui anumit tip de distribuie, este comparat cu o
valoare cu semnificaie de prag pentru o anumit probabilitate, numit
valoare critic. n funcie de poziionarea statisticii testului fa de valoarea
critic, se ia decizia de acceptare sau respingere a ipotezei nule. Valorile
critice pentru fiecare test statistic sunt calculate i aranjate n tabele sau se

76

Elemente de statistic aplicate n ecologie

ZA

FI
R

ES

pot calcula pornind de la funciile specifice distribuiilor.


n funcie de ntrebarea la care trebuie s rspund testul statistic,
ipotezele acestuia se pot scrie n mai multe variante. Dac ipotezele conin
semnele
i , atunci se realizeaz un test n variant bilateral
; :
). Denumirea provine de la faptul c exist dou
( :
situaii n care se poate respinge ipoteza nul i accepta ipoteza alternativ:
cnd
i cnd
. Dac ipotezele conin semnele
, , i ,
; :
atunci se realizeaz un test n variant unilateral ( :
sau
:
; :
). n oricare din cele dou variante exist doar o
singur situaie n care se poate respinge ipoteza nul i se poate accepta
ipoteza alternativ: dac i numai dac
, pentru prima pereche de
ipoteze, i dac i numai dac
, pentru a doua pereche de ipoteze.
n general, testele unilaterale se utilizeaz doar dac exist un motiv
apriori care s sugereze o tendin direcional a datelor. Este bine ca testele
bilaterale s se fac dup o testare n variant bilateral. ntre cele dou
variante ale unui test nu exist nici o diferen n privina modului de calcul
al statisticii testului, ci difer doar ipotezele i pragul de semnificaie mai
mic n cazul testelor unilaterale (seciunea 5.1, fig. 5.3, 5.4 i explicaiile
aferente).
Luarea unei decizii statistice se realizeaz n funcie de pragul de
probabilitate. Acesta se mai numete i nivel de confiden, de ncredere
sau prag de semnificaie i se noteaz cu . Valorile cel mai des utilizate
n ecologie sunt 0,05 sau 0,01 i se desemneaz nainte de derularea
testului. Pragul de semnificaie ( ) sau probabilitatea calculat pentru o
anumit statistic a unui test ( ) trebuie precizat n concluziile oricrei
cercetri n care s-au folosit teste statistice (de exemplu, rezultatul este
semnificativ n proporie de 95% sau pentru 0,05 sau
pentru
0,05 sau pentru 0,0003).
Se poate ntmpla ca
s fie respins pentru o valoare a
probabilitii egale cu 0,05, dar s nu poat fi respins dac nivelul de
ncredere stabilit apriori este de 0,01. Aceast situaie se datoreaz faptului
c, pentru majoritatea distribuiilor, valoarea critic crete pe msur ce
nivelul de ncredere scade. Ce decizie se ia ntr-o astfel de situaie i cum
poate fi ea argumentat pentru a elimina subiectivismul?
n orice test statistic pot s apar dou genuri de erori statistice (tab.

Statistic inferenial: elemente introductive

77

5.1):
cnd este
eroare de genul I, ce const n respingerea eronat a
adevrat; riscul sau probabilitatea de a face o astfel de eroare este ;
eroare de genul II, ce const n acceptarea eronat a
cnd este
fals; riscul sau probabilitatea de a face o astfel de eroare este .
Tabelul 5.1. Consecinele posibile ale unei decizii statistice

Ipoteza adevrat

Ipoteza acceptat

Corect Eroare II
1
Eroare I Corect
1

ZA

FI
R

ES

Dac se dorete reducerea riscului de a comite o eroare I, atunci


trebuie s scad, ceea ce conduce la creterea riscului de a comite o eroare
II i invers. Se consider c 0,05 asigur un echilibru ntre riscul de a
comite o eroare de genul I i cel de a comite o eroare de genul II.
Dac valoarea se decide de la nceput sau se poate calcula pentru o
anumit statistic a unui test corespunztor unei funcii de distribuie,
valoarea lui
nu se calculeaz. Valoarea lui
scade pe msur ce
dimensiunea probelor ( ) crete i crete pe msur ce diferena dintre
valorile comparate ( i ) scade. Riscul variaz de la un test la altul. Un
test puternic nseamn de fapt c are un risc mic, adic este mai puin
influenat de dimensiunea probei i de diferenele mici dintre valorile
comparate.
Legat de puterea unui test sau de riscul de a comite o eroare de genul
II, trebuie menionat c testele neparametrice sau independente de distribuie
sunt mai puin puternice dect cele parametrice, mai restrictive. Din aceast
cauz un cercettor ar putea manifesta o tendin de evitare a testelor
neparametrice n ideea folosirii unor teste mai puternice. O astfel de
atitudine se poate dovedi eronat nu trebuie sacrificat validitatea utilizrii
unui test n favoarea puterii acestuia! Regula de siguran n privina alegerii
unui test parametric sau neparametric este c, dac exist o ndoial orict
de mic cu privire la modul n care datele din probe satisfac condiiile
restrictive ale unui anumit test parametric, atunci mai bine se apeleaz la un

78

Elemente de statistic aplicate n ecologie

test neparametric alternativ celui parametric.


Rezumnd aspectele prezentate pn acum, testarea ipotezelor
statistice se realizeaz prin parcurgerea urmtoarelor etape:

ZA

FI
R

ES

1. Enunarea clar a ntrebrii la care se dorete aflarea rspunsului


n urma prelucrrii datelor din probe.
2. Identificarea tipului de variabil i a scalei de apreciere a acesteia
i aprecierea distribuiei probei. Aceast etap permite luarea
deciziei privind utilizarea unui test parametric sau a unuia
neparametric.
3. Pe baza rspunsurilor din primele dou etape se formuleaz cele
dou ipoteze statistice (practic se alege o variant bilateral sau
una unilateral a testului) i se stabilete regula de decizie (se
desemneaz nivelul de ncredere sau de confiden ).
4. Se calculeaz statistica sau statisticile testului.
5. Se compar statistica obinut cu valoarea critic corespunztoare
valorii
i gradelor de libertate i se ia o decizie privind
acceptarea sau respingerea ipotezei nule. Decizia mai poate fi
luat i prin calcularea probabilitii corespunztoare statisticii
testului (aceasta va fi de fapt probabilitatea ca
s fie adevrat)
cu ajutorul funciei distribuiei acesteia sau folosind un sistem de
programe pentru computere adecvat (un software).

6. TESTAREA UNEI IPOTEZE PRIVIND MEDIA UNEI


SINGURE POPULAII

FI
R

ES

Aceast testare permite compararea mediei unei probe (x ) cu o


valoare de interes care de obicei reprezint media cunoscut a unei populaii
(). Altfel spus, se verific ce probabilitate exist ca proba luat n analiz
s provin dintr-o populaie cu o anumit medie cunoscut. Populaia din
care a fost extras proba poate fi diferit de cea de referin, caz n care se
testeaz o ipotez nul conform creia nu exist o diferen semnificativ
ntre mediile celor dou populaii.
Testul care se folosete ntr-o astfel de situaie se numete Testul
(Student) pentru o prob. Fiind un test parametric, condiiile de aplicare
ale acestuia sunt urmtoarele:

ZA

1. proba trebuie s fie extras aleator din populaie;


2. variabila trebuie s fie exprimat pe o scal de raport sau de
interval;
3. valorile probei trebuie s fie aproximativ normal distribuite.

Dac este media populaiei din care a fost extras proba i


este
media populaiei de referin sau o valoare de referin, atunci ipotezele
testului pot fi:
:
:

:
:

:
:

Prima pereche de ipoteze se scrie n cazul variantei bilaterale a


testului, adic atunci cnd ntrebarea este: Exist o diferen semnificativ
ntre i ?.
Ultimele dou perechi de ipoteze se scriu n cazul unui test
unilateral dreapta (Este semnificativ mai mare dect ?) i, respectiv,
unui test unilateral stnga (Este semnificativ mai mic dect ?).

80

Elemente de statistic aplicate n ecologie

Indiferent de varianta n care se realizeaz testul, statistica sa este:


.
n aceast relaie este un estimator al mediei populaiei din care a
fost extras proba ( ).
Condiia testului const n compararea statisticii acestuia cu o
:
valoare critic ,

ES

dac
se respinge i se accept
pentru o
,
probabilitate de 1 sau 100 1 %. Deci se accept c i
difer semnificativ una de alta. Dac , , atunci se accept
pentru aceeai probabilitate, adic nu exist o diferen
semnificativ ntre i .

ZA

FI
R

Dac este semnificativ diferit de , nseamn c este ori mai


Aceasta implic faptul c este mai mic sau
mare, ori mai mic dect
mai mare dect .
n situaia n care
este mai mare dect , atunci numrtorul
statisticii va fi negativ i, implicit, statistica va avea o valoare negativ.
Deci trebuie comparat cu valoarea critic pozitiv aflat n dreapta cozii
distribuiei . n acelai mod, dac este mai mic dect , statistica va fi
negativ i trebuie comparat cu valoarea critic negativ din coada stng a
cozii distribuiei.
Condiia testului ar trebui n realitate scris astfel:
dac t este mai mic dect valoarea critic negativ i mai mare dect
se respinge i se accept
valoarea critic pozitiv, atunci
pentru o probabilitate de 1 sau 100 1 %.
Astfel rezult c dac se gsete ntre valoarea critic negativ i
cea pozitiv,
va fi acceptat. Deci ntre cele dou valori critice exist
zona de acceptare a ipotezei nule (1 ), n afara creia se gsesc zonele de
respingere a acesteia i de acceptare a ipotezei alternative (cte /2 n
fiecare coad a distribuiei) (fig. 6.1).

Testarea unei ipoteze privind media unei singure populaii

/2

81

/2

1-
H0

pentru un test bilateral

Figura 6.1. Zonele de respingere a

+t H1

H1 -t

ZA

FI
R

ES

Atunci cnd se aplic testul n variant unilateral, atunci exist o


singur zon de respingere a
cantonat doar ntr-o singur coad a
distribuiei: dreapt sau stng. Dac se vizeaz coada din dreapta
distribuiei ( :
), atunci statistica testului ( ) trebuie comparat cu
valoarea critic pozitiv (fig. 6.2).

1-

H0

Figura 6.2. Zona de respingere a

+t H1
pentru un test unilateral dreapta

Dac se urmrete coada din stnga a distribuiei ( :


),
atunci statistica testului ( ) trebuie comparat cu valoarea critic negativ
(zona de respingere a
se afl n partea opus fa de cum este prezentat
n figura 6.2).

82

Elemente de statistic aplicate n ecologie

Pentru a simplifica lucrurile, se poate scrie condiia testului astfel


nct s fie valabil i n cazul unui test bilateral, i n cazul testelor
unilaterale, anume cu statistica testului n modul:
dac | |

se respinge i se accept

probabilitate de 1

sau 100 1

cu o

%.

Reamintim c valoarea critic pentru un anumit prag de confiden


pentru un test unilateral este egal cu valoarea critic pentru un prag de
confiden 2 pentru un test bilateral (seciunea 5.1, fig. 5.2, 5.4).

94
102
110

94
103
111

94
104
117

95
105
118

FI
R

90
102
110

95
106
123

98
106
124

98
106
130

101
107
137

87
101
108

ES

Exemplul 6.1. ntr-un studiu s-a urmrit concentraia unui


biomarker al polurii apei n corpul unei specii de pete. O concentraie mai
mare de 100 uniti/g indic o poluare a apei n care triesc petii. Este
poluat apa din care s-a extras aleatoriu o prob format din 30 de peti?

ZA

Se parcurg etapele unei testri statistice (seciunea 5.5). Astfel, prima


etap const n clarificarea ntrebrii problemei. Din punct de vedere
statistic, ntrebarea este urmtoarea: Este media concentraiei biomarker-ului
n populaia din care s-a extras proba semnificativ mai mare dect media
populaiei de referin? sau mai concret Este media populaiei din care s-a
extras proba semnificativ mai mare dect 100?. Dac ntrebarea problemei
ar fi fost pus invers Provin petii din prob dintr-o ap nepoluat? ,
atunci ntrebarea din punct de vedere statistic ar fi fost Este media
populaiei din care s-a extras proba semnificativ mai mic dect 100?.
A doua etap const n identificarea tipului de variabil. Aa cum
reiese din textul problemei, variabila este concentraia biomarker-ului pe
gram. Concentraia este apreciat pe o scal de raport, deoarece valoarea
zero este absolut. Un alt aspect ce trebuie urmrit n aceast etap este
distribuia valorilor. Pentru a aprecia distribuia ne folosim de relaia dintre
msurile tendinei centrale ntr-o prob normal distribuit (seciunea 3.1).

Testarea unei ipoteze privind media unei singure populaii

83

Deci vom compara media cu mediana i, dac este posibil, i cu modul


probei:
3176/30
104,5
106 .

105,87

100
100 .

FI
R

:
:

ES

Putem concluziona c cei trei descriptori ai tendinei centrale au


valori apropiate i, ca urmare, distribuia valorilor n probe este aproximativ
normal.
n urma parcurgerii acestei etape se poate spune c se ndeplinesc
toate condiiile de aplicare ale testului pentru o prob.
Ipotezele testului vor corespunde unei variante unilaterale, aa cum
am stabilit n prima etap:

2,739 .

ZA

Cu ajutorul mediei (
105,87), valorii de referin (
100) i
2,142) se calculeaz statistica testului:
erorii standard a mediei (

n continuare se verific condiia testului. Pentru aceasta trebuie


din tabelul valorilor critice ale
aflat valoarea critic a testului
,
distribuiei (Student) (anexa 2). n cazul nostru, numrul gradelor de
libertate este 1 30 1 29, iar nivelul de confiden
0,05. Avnd
n vedere c facem un test unilateral, , , va fi egal cu , , , care sar folosi n cazul unui test unilateral, adic 1,699.
2,739

1,699

se respinge,
se accept
0,95 sau 95%.

O alt modalitate de rezolvare a problemei const n calcularea


exact a probabilitii asociate valorii statisticii testului, adic s aflm

84

Elemente de statistic aplicate n ecologie

proporia din distribuia Student exclus de statistica testului (anexa 3).


Aceast proporie reprezint probabilitatea ( ) ca
s fie adevrat, ceea
ce nseamn c probabilitatea ca
s fie fals sau ca
s fie adevrat va
fi 1 :
0,0052, adic statistica testului

Deci probabilitatea exact ca media concentraiei biomarker-ului n


populaia de peti s fie mai mic sau egal ca 100 ( ) este de 0,0052
(0,52%), ceea ce nseamn c probabilitatea s fie mai mare ca 100 este
1 0,0052 0,9948 sau 99,48%.

ZA

FI
R

ES

Concluzia testului este cea surprins de


: media concentraiei
biomarker-ului n populaia de peti din care a fost extras proba este
semnificativ mai mare dect valoarea de referin.
Pentru a rspunde la ntrebarea problemei, putem spune c apa din
care a fost extras proba de 30 de peti este poluat.

7. TESTAREA DIFERENEI DINTRE DOU PROBE

ES

O astfel de inferen statistic se refer la compararea tendinelor


centrale a dou probe. Cele dou probe pot fi prelevate din dou populaii
diferite, caz n care se numesc probe independente. Denumirea este
argumentat de faptul c eantionarea valorilor primei probe nu influeneaz
probabilitatea de extragere a valorilor celei de a doua probe, deoarece
prelevarea se face din populaii distincte.
Uneori, testarea diferenei se poate face pornindu-se de la probe
neindependente. ntr-un astfel de caz, cele dou probe pot fi prelevate din
aceeai populaie sau se obin prin investigarea unitilor de prob de dou
ori: nainte i dup aplicarea unui anumit tratament unitilor de prob.

FI
R

7.1. COMPARAREA A DOU PROBE INDEPENDENTE

ZA

Cnd se face o astfel de comparaie, se vizeaz de fapt compararea


mediilor populaiilor din care au fost extrase probele. Deci mediile probelor
reprezint estimatori ai mediilor populaiilor din care au fost prelevate.
Cele mai utilizate teste ce pot fi folosite pentru compararea a dou
probe sunt testul (Student) pentru probe independente i testul
(Mann-Whitney).
7.1.1. Testul (Student) pentru probe independente
Acesta este unul dintre cele mai utilizate teste parametrice ce se
folosesc frecvent pentru o astfel de comparaie n ecologie. Fiind un test
parametric, prezint o serie de condiii de aplicare:
1. cele dou probe trebuie s fie prelevate aleator din dou populaii
distincte;
2. variabila trebuie s fie apreciat pe o scal de interval sau de
raport;
3. valorile din cele dou probe trebuie s fie aproximativ normal
distribuite.

86

Elemente de statistic aplicate n ecologie

n funcie de tipul de comparaie, testul poate fi aplicat n variant


bilateral sau unilateral, n funcie de care se scriu ipotezele testului. Fie
populaia din care se extrage aleator proba i populaia din care se
preleveaz aleator proba . Atunci ipotezele testului pot fi:
Bilateral
:
:

Unilateral
:
:

:
:

Statistica testului este urmtoarea:

FI
R

ES

media valorilor din proba


media valorilor din proba B
media populaiei
media populaiei
variana probei
variana probei
dimensiunea probei
dimensiunea probei .

ZA

Atenie, diferena dintre mediile probelor


i
este 0 conform
ipotezelor nule!
Valoarea critic cu care se compar statistica testului se afl (anexa
2) n funcie de i de numrul gradelor de libertate
care se estimeaz
conform ecuaiei Welch-Satterthwaite:

Exist i o variant mai simpl de estimare a gradelor de libertate:


,

1.

Testarea diferenei dintre dou probe

87

Condiia testului este:


dac | |

se respinge,

1 .

se accept,

se poate calcula exact (anexa 3),


Probabilitatea asociat lui sau
iar probabilitatea
se afl prin scderea acesteia din 1:
1

32
28
37
35
37

29
27
38
36
37

29
31
38
37
38

ES

31
28
Masculi (m): 35
39
36

FI
R

Femele (f):

Exemplul 7.1. La o prob extras aleator dintr-o populaie de viper


de step (Vipera ursinii moldavica) s-a determinat numrul de perechi de
plci subcaudale. Este numrul de plci subcaudale semnificativ mai mare la
masculi dect la femele?
29
30
38
31
37

25
28
36
36
32

29
38
38

ZA

Dac diferena dintre masculi i femele este semnificativ, nseamn


c este ca i cum ar proveni din dou populaii statistice diferite.
Datele ndeplinesc condiiile de aplicare ale testului : datele au fost
extrase aleator din populaie, variabila este exprimat pe o scal de raport,
36,45,
37;
datele sunt aproximativ normal distribuite (
28,923,
29). Intervalul
cuprinde aproximativ 62% din valorile
femelelor i 85% din valorile masculilor. Pentru ca datele s fie mai normal
distribuite, se realizeaz o normalizare a acestora prin logaritmare cu
ajutorul logaritmului natural (
).
f: 3,4340 3,4657 3,3673 3,3673 3,3673 3,2189 3,3673 3,3322
3,3322 3,2958 3,4340 3,4012 3,3322
m: 3,5553 3,6109 3,6376 3,6376 3,6376 3,5835 3,6376 3,6636
3,5553 3,5835 3,6109 3,4340 3,5835 3,6376 3,5835 3,6109
3,6109 3,6376 3,6109 3,4657

88

Elemente de statistic aplicate n ecologie

Dup transformare, intervalul


cuprinde aproximativ 85% din
valorile femelelor i 90% din valorile masculilor
n continuare trebuie emise ipotezele testului. Cum ntrebarea la care
trebuie s rspund testul este dac numrul subcaudalelor la masculi este
mai mare dect cel de la femele, atunci ipoteza alternativ va exprima
aceast inegalitate.
:
:

10,482 .

ES

Se calculeaz statistica testului:

FI
R

Numrul gradelor de libertate se poate afla n dou moduri:


23,6

13

12 .

ZA

13,20

23

Valoarea critic pentru un test unilateral, pentru 0,05 nivel de


ncredere i
grade de libertate, se poate cuta n tabel (anexa 2) sau
calcula (anexa 3):
,

1,714

1,782 .

Valoarea absolut a statisticii testului | 10,482| este mai mare dect


ambele valori critice, deci se respinge
i se accept
, adic media
numrului de subcaudale de la masculi este semnificativ mai mare dect cel
de la femele, cu o probabilitate de 0,95 sau n 95% din cazuri.
Probabilitatea ca
s fie adevrat (anexa 3) este de 1,6 10
pentru 23 grade de libertate i 1,1 10 pentru 12 grade de libertate. n
ambele situaii, probabilitatea este foarte mic i se poate accepta ipoteza
nul a crei probabilitate este de 1
, adic foarte mare.

Testarea diferenei dintre dou probe

89

7.1.2. Testul (Mann-Whitney)


Acest test se utilizeaz ca alternativ neparametric a testului
(Student) pentru probe independente. Unicele condiii ale testului (MannWhitney) sunt:
1. probele trebuie s fie prelevate aleator din dou populaii distincte;
2. variabila trebuie s fie apreciat pe o scal ordinal, de interval
sau de raport.

Unilateral

Bilateral
:
:

pentru

Ipotezele testului sunt n esen similare cu cele ale testului


probe independente:
:
:

ES

:
:

ZA

FI
R

Aplicarea testului presupune ca valorile celor dou probe s


primeasc ranguri mpreun. Pentru aceasta, valorile din ambele probe se
ordoneaz cresctor ntr-o singur serie. Valoarea cea mai mic va primi
rangul 1, urmtoarea rangul 2 i aa mai departe. Valorile egale vor primi
media rangurilor pe care le-ar fi primit dac ar fi fost diferite (seciunea 2.1,
tab. 2.3).
Ulterior se nsumeaz rangurile corespunztoare valorilor fiecrei
probe, obinndu-se
suma rangurilor corespunztoare valorilor din
proba i, respectiv,
suma rangurilor corespunztoare valorilor din
proba . Cu valorile celor dou sume i dimensiunile probelor ( i ) se
calculeaz statisticile testului
i :

Suma celor dou statistici ale testului trebuie s fie egal cu suma
tuturor rangurilor, adic
. De unde rezult c, pentru
simplificare, putem scrie una dintre statistici, s zicem
, n funcie de
cealalt:

90

Elemente de statistic aplicate n ecologie

Decizia privind respingerea sau acceptarea


poate fi luat n dou
moduri, n funcie de dimensiunile celor dou probe ( i ).
1. Dac
20 i
20, atunci condiia testului este:
Dac valoarea mai mic dintre statisticile testului este mai mic
i se
dect valoarea critic tabelat (anexa 2), atunci se respinge
accept .
,

se respinge,

se accept

1 .

Dac
pentru

FI
R

ES

Valoarea critic trebuie aleas n funcie de varianta bilateral sau


unilateral n care se aplic testul.

ZA

2. Dac
20 i
20, atunci distribuia probabilistic a lui
este aproximativ normal i se poate face conversia la distribuia
normal standard:
Pentru aceasta este nevoie s se calculeze media ( ) i deviaia
este adevrat:
standard ( ) ale lui , dac

Cu acestea se calculeaz valoarea z corespunztoare


este una dintre cele dou statistici ale testului ( sau

0,1 , unde
):

.
Dac | |
,
pentru p=0,95.

1,96

se respinge i se accept

Testarea diferenei dintre dou probe

91

Exemplul 7.2. S se rspund la ntrebarea de la exemplul 7.1,


considerndu-se c una dintre sau ambele condiii 2 i 3 ale testului Student
pentru probe independente nu sunt ndeplinite.
n acest caz se utilizeaz alternativa neparametric a testului Student,
adic testul Mann-Whitney. Pentru a realiza acest test se dau ranguri
valorilor din cele dou probe mpreun, dup metoda prezentat n seciunea
2.1.
f

25

27

28

28

28

29

29

29

29

30

31

31

32

31

32

35

35

Ri

10

11

12

14

13

15

16

17

Rx

7,5

7,5

7,5

7,5

10

12

12

14,5

12

14,5

16,5

16,5

37

37

36

36

36

37

37

37

18

19

20

21

22

23

24

25

26

19,5

19,5

19,5

19,5

24

24

24

24

24

38

38

38

38

38

39

27

28

29

30

31

32

33

29,5

29,5

29,5

29,5

29,5

29,5

33

ZA

Ipotezele testului sunt similare cu cele de la exemplul 7.1:


.

:
:

Se calculeaz suma rangurilor valorilor de la femele:

14,5

93,5 .

93,5
2,5 .

257,5

Statisticile testului vor fi:


13 20
13 20

257,5

38

FI
R

36

ES

continuare

Sex

92

Elemente de statistic aplicate n ecologie

Deoarece dimensiunea probelor este mai mic sau egal cu 20,


trebuie aflat valoarea critic (anexa 2). Cum testul se aplic n variant
unilateral, atunci valoarea critic din tabelul cu valorile critice
, ,
din anexa 2 va fi considerat pentru un nivel de confiden de 0,025:
,

76 .

76

184

257,5

2,5

FI
R

ES

De fapt, pentru testul Mann-Whitney exist un interval de acceptare


. Suma limitelor acestui interval este egal cu produsul dintre
a
dimensiunile probelor, n cazul exemplului fiind egal cu 13 20 260.
Cum una dintre limite este valoarea critic egal cu 76, nseamn c cealalt
este egal cu 260 76 184. Deci intervalul de acceptare a
are limita
inferioar 76 i limita superioar 184. Cele dou statistici calculate sunt n
afara acestui interval, deci ipoteza nul se respinge i se accept n
consecin ipoteza alternativ.

ZA

Concluzia este c numrul de subcaudale la masculi este


semnificativ mai mare dect la femele, cu o probabilitate de 0,975 sau n
97,25% din cazuri.
7.2. COMPARAREA A DOU PROBE NEINDEPENDENTE
Aceste comparaii au drept scop evidenierea efectului unui anumit
tratament asupra valorilor variabilei investigate. Tratamentul poate fi
aciunea unei substane, a unui factor de mediu etc. ce ar putea modifica
valorile individuale ale unei variabile.
n cazul unor astfel de comparaii, probele trebuie s fie
neindependente, deoarece se presupune c astfel s-ar elimina posibilitatea
apariiei unor diferene semnificative datorate deosebirilor dintre populaii.
Astfel, diferenele, dac apar, vor reprezenta efectul tratamentului asupra
unitilor de prob.

Testarea diferenei dintre dou probe

93

Atunci cnd este posibil, este bine ca cele dou probe s rezulte n
urma a dou investigaii repetate asupra unitilor de prob: prima, nainte
de aplicarea tratamentului, i a doua, dup aplicarea acestuia. Astfel, rezult
cte o pereche de valori pentru fiecare unitate de prob.
Existena perechilor de valori este absolut necesar n cazul testelor
ce compar probe neindependente, motiv pentru care acestea se mai numesc
i teste pentru perechi de valori sau pentru observaii perechi.
Testele cele mai uzuale care se folosesc pentru astfel de observaii
sunt testul
(Student) pentru perechi de observaii i testul
(Wilcoxon).

ES

7.2.1. Testul (Student) pentru perechi de observaii


Ca i testul pentru probe independente, i acesta este un test
parametric care necesit ca datele s ndeplineasc o serie de condiii de
aplicare:

ZA

FI
R

1. probele trebuie s fie extrase aleator din aceeai populaie sau s


provin n urma unor investigaii repetate asupra acelorai uniti
de prob, iar dimensiunea probelor trebuie s fie aceeai astfel
nct s existe perechi de observaii;
2. variabila trebuie s fie apreciat pe o scal de interval sau de raport;
3. distribuia valorilor n probe trebuie s fie aproximativ normal.

n funcie de ntrebarea la care testul trebuie s rspund, se scriu


ipotezele n variant bilateral sau unilateral. n esen, ipotezele se
refer la media diferenelor ( ) dintre perechile de valori n
populaie:
Bilateral
:
0
:
0

:
:

Unilateral
0
:
0
:

0
0.

Dac se noteaz diferena dintre valorile unei perechi, iar fiecare


dintre valorile perechii aparin probei i, respectiv, probei , atunci:
.

94

Elemente de statistic aplicate n ecologie

Dac media acestor diferene n populaie este zero, atunci nseamn


c tratamentul aplicat nu a modificat semnificativ valorile variabilei. O
medie a diferenelor mai mare ca zero arat c tratamentul a dus la creterea
semnificativ a valorilor, n timp ce una mai mic dect zero arat c
tratamentul a sczut semnificativ valorile.
Principalul estimator al mediei populaionale a diferenelor este
media diferenelor dintre perechile de valori din probe ( ). Deci se
calculeaz diferenele corespunztoare fiecrei perechi de valori, iar suma
diferenelor se mparte la numrul perechilor de valori ( ) sau la numrul
valorilor dintr-o prob.

ES

ZA

FI
R

O alt valoare necesar pentru aflarea statisticii testului este eroarea


standard a mediei diferenelor ( ), care se calculeaz mprind deviaia
standard a mediei diferenelor ( ) la radical din numrul perechilor de
observaii ( ):

Statistica testului ( ) va fi egal cu raportul dintre media diferenelor


( ) i eroarea standard a mediei diferenelor ( ):
.
Condiia testului, att pentru varianta bilateral, ct i pentru
variantele unilaterale, este:
dac | |

se respinge,

se accept, pentru p=1.

Valoarea critic se poate afla din tabele (anexa 2) sau se poate


calcula (anexa 3).

Testarea diferenei dintre dou probe

95

Cnd se calculeaz probabilitatea asociat valorii (anexa 3) (adic


probabilitatea ca ipoteza nul s fie adevrat), atunci ipoteza nul se
respinge dac
este mai mic de nivelul
i se va accepta ipoteza
.
alternativ pentru o probabilitate de 1

17
43

33
27

24
36

15
45

23
37

21
39

28
32

ES

scunde n mijloc ( )
secunde lng perete ( )

Exemplul 7.3. ntr-un experiment s-a urmrit reacia gndacilor de


buctrie la lumin. Pentru aceasta s-au pus 12 indivizi selectai aleatoriu n
12 incinte cu perei transpareni i la aprinderea luminii s-a urmrit cte
secunde dintr-un minut a petrecut fiecare gndac n mijlocul incintei i lng
pereii incintei. Au gndacii o tendin semnificativ de a se ascunde n
condiii de lumin?
21
39

21
39

32
28

27
33

34
26

ZA

FI
R

n acest exemplu, sunt prezentate dou probe rezultate prin


investigarea acelorai uniti de prob (cei 12 gndaci) de dou ori: pentru
fiecare gndac exist timpul petrecut n mijlocul incintei i timpul petrecut
lng perei. Deci probele nu sunt independente i pentru fiecare unitate de
prob (gndac) exist o pereche de valori (timpul petrecut n mijlocul
incintei i timpul petrecut lng pereii acesteia).
n continuare trebuie verificate condiiile de aplicare ale testului
Student pentru perechi de valori: probele sunt aleatoare i exist observaii
perechi, variabila este exprimat pe o scal de raport, probele au o distribuie
aproximativ normal (
24,67,
23,5;
35,33,
36,5).
Condiiile sunt ndeplinite.
Pentru a emite ipotezele testului, trebuie analizat ntrebarea
problemei: dac gndacii ar avea o tendin semnificativ s se ascund,
atunci ar trebui ca timpii petrecui lng perei s fie semnificativ mai mari
dect cei petrecui n centru. Dac se calculeaz diferena
,
atunci diferenele pozitive trebuie s fie dominante, fapt ce trebuie surprins
de ipoteza alternativ.
:
:

0
0

96

Elemente de statistic aplicate n ecologie

Se calculeaz diferenele dintre valorile fiecrei perechi:


28
32
4

17
43
26

33
27
6

24
36
12

15
45
30

23
37
14

21
39
18

21
39
18

21
39
18

32
28
4

27
33
6

34
26
8

Se calculeaz media diferenelor i eroarea standard a mediei


diferenelor care sunt necesare pentru aflarea statisticii testului:
10,67

2,98 .

3,579

ES

,
,

12,397

1,796 .

FI
R

Se afl valoarea critic pentru testul unilateral, pentru un nivel de


confiden de 0,05 i 12 1 grade de libertate (anexa 2 sau anexa 3):

ZA

Valoarea statisticii testului este mai mare dect valoarea critic, deci
se respinge ipoteza nul i se accept ipoteza alternativ, adic numrul de
secunde petrecut lng pereii incintei este semnificativ mai mare dect
numrul de secunde petrecute n centrul incintei, cu o probabilitate de 0,95
sau n 95% din cazuri.
Probabilitatea ca ipoteza nul s fie adevrat (anexa 3) este de
0,0063, deci probabilitatea ca ipoteza nul s nu fie adevrat i s fie
adevrat ipoteza alternativ este de 1 0,0063 0,9937.
7.2.2. Testul (Wilcoxon)
Acest test reprezint alternativa neparametric a testului t pentru
observaii perechi, deci se utilizeaz pentru dou probe neindependente sau
pentru observaii perechi realizate asupra unitilor de prob, nainte sau
dup aplicarea unui tratament. Se folosete atunci cnd nu se respect

Testarea diferenei dintre dou probe

97

condiia 2 sau 3 a testului Student pentru perechi de observaii. Condiiile de


aplicare a testului Wilcoxon sunt:
1. probele trebuie s fie extrase aleator din aceeai populaie sau s
provin n urma unor investigaii repetate asupra acelorai uniti
de prob, iar dimensiunea probelor trebuie s fie aceeai astfel
nct s existe perechi de observaii;
2. variabila trebuie s fie apreciat pe o scal ordinal, de interval
sau de raport.

ES

n cazul acestui test, se calculeaz diferena ( ) dintre observaiile


fiecrei perechi de valori din cele dou probe.

ZA

FI
R

Diferenele n modul primesc apoi ranguri (| |


) la fel ca n
cazul testului Mann-Whitney. n dreptul fiecrui rang se specific ntre
paranteze semnul diferenei corespunztoare.
Valorile ale cror diferene sunt nule se elimin din analiz, ceea ce
atrage dup sine reducerea corespunztoare a gradelor de libertate.
)
Ulterior se calculeaz suma rangurilor diferenelor pozitive (
i suma rangurilor diferenelor negative (
).
Ipotezele care se scriu n acest test sunt n esen similare cu cele ale
testului t pentru probe neindependente, cu excepia faptului c se refer la
sumele rangurilor diferenelor:
Bilateral
:

:
:

Unilateral

Ce reprezint aceste diferene? Dac suma rangurilor diferenelor


pozitive este mai mare dect cea a rangurilor diferenelor negative,
nseamn c exist mai multe diferene pozitive, deci valorile din proba B,
influenate de tratament, sunt n general mai mari dect cele din proba A.
Aceasta nseamn c tratamentul aplicat a dus la creterea valorilor. Dac
suma rangurilor diferenelor pozitive este mai mic dect cea a rangurilor

98

Elemente de statistic aplicate n ecologie

diferenelor negative, nseamn c sunt mai multe diferene negative i


valorile din proba A sunt n general mai mari dect cele din B. Deci
tratamentul aplicat a determinat scderea valorilor probei B. Dac cele dou
sume sunt egale, nseamn c exist diferene negative i pozitive n egal
msur i tratamentul nu a modificat semnificativ valorile din proba B.
Statisticile testului (T i T) sunt reprezentate de suma rangurilor
diferenelor pozitive i suma rangurilor diferenelor negative:
,

sau

ES

Inspectarea formulelor de mai sus arat c suma celor dou statistici


este egal cu suma rangurilor tuturor diferenelor (diferite de 0) att
pozitive, ct i negative:

FI
R

se ia n funcie de

Decizia de acceptare sau de respingere a


numrul gradelor de libertate ( ).

ZA

1. Dac
33 (sau dect 25), condiia testului const n
compararea statisticilor cu valoarea critic
care se gsete n
,
tabele (anexa 2) i se alege n funcie de varianta n care se aplic
testul i numrul gradelor de libertate egal cu numrul diferenelor
nenule.
Dac sau
1 .

se respinge,

se accept, pentru

Dac se accept
n cazul unei variante bilaterale, concluzia este
c tratamentul a modificat semnificativ variabila. n cazul variantei
unilaterale dreapta ( :

), concluzia va fi c
tratamentul a determinat o cretere a valorilor variabilei, iar n cazul
variantei unilaterale stnga ( :

), c acesta le-a
sczut.

Testarea diferenei dintre dou probe

99

2. Dac
33, atunci distribuia
poate fi aproximat prin cea
normal standard. Pentru a putea calcula valoarea trebuie mai
nti calculate media
i deviaia standard .

se respinge,

1,96

0,95

se accept,

ES

dac | |
pentru

Condiia testului este:

FI
R

Exemplul 7.4. S se rezolve problema din exemplul 7.4,


considerndu-se c una dintre ultimele dou condiii ale testului Student
pentru perechi de observaii nu este ndeplinit.

ZA

n acest caz se aplic alternativa neparametric a testului Student


pentru perechi de observaii, adic testul Wilcoxon. Pentru efectuarea
acestui test se calculeaz diferenele dintre valorile fiecrei perechi.
Modulelor diferenelor li se dau ranguri, iar n dreptul fiecrui rang se
specific semnul diferenei corespunztoare.
Ipotezele testului sunt asemntoare cu cele de la exemplul 7.3. Dac
diferenele dintre valorile fiecrei perechi se calculeaz scznd din timpul
petrecut lng perete pe cel petrecut n mijlocul incintei, atunci, dac exist
o tendin semnificativ de ascundere la gndacii de buctrie, ar trebui s
se obin mai multe diferene pozitive i suma rangurilor diferenelor
pozitive ar trebui s fie mai mare dect cea a diferenelor negative. Acest
aspect trebuie surprins n ipoteza alternativ.
:
:

Elemente de statistic aplicate n ecologie

|
4
4
6
6
8
12
14
18
18
18
26
30

1
2
3
4
5
6
7
8
9
10
11
12

4
4
6
6
8
12
14
18
18
18
26
30

|
1,5
1,5
3,5
3,5
5
6
7
9
9
9
11
12

semnul
diferenei
+

+
+
+
+
+
+
+

ES

Secunde n Secunde lng


centru ( )
perete ( )
28
32
32
28
33
27
27
33
34
26
24
36
23
37
21
39
21
39
21
39
17
43
15
45

100

3,5

5
10

10
68 .

1,5

FI
R

Se calculeaz statisticile testului:

ZA

Deoarece numrul perechilor de observaii este mai mic de 33, se


afl valoarea critic pentru varianta bilateral n funcie de nivelul de
confiden i de numrul gradelor de libertate:
,

17 .

i pentru testul Wilcoxon exist un interval de acceptare a


limitelor acestui interval este egal cu suma tuturor rangurilor:

. Suma

78 .

Cum una dintre limite este reprezentat de valoarea critic egal cu


17, nseamn c cealalt este egal cu 78 17 61. Deci intervalul de
acceptare a
are limita inferioar 17 i limita superioar 61. Cele dou
statistici calculate sunt n afara acestui interval, deci ipoteza nul se respinge

Testarea diferenei dintre dou probe

101

i se accept n consecin ipoteza alternativ.


10

17

61

68

ZA

FI
R

ES

Concluzia este c timpul petrecut lng perete este semnificativ mai


mare dect cel petrecut n centrul incintei, cu o probabilitate de 0,95 sau n
95% din cazuri.

8. TESTAREA DIFERENELOR DINTRE TREI SAU MAI


MULTE PROBE

ZA

FI
R

ES

Exist situaii n care, n cadrul unor investigaii ecologice, este


necesar testarea semnificaiei diferenelor dintre trei sau mai multe probe
din punctul de vedere al unei variabile. Dac datele ndeplinesc condiiile de
aplicare ale unor teste parametrice, atunci o astfel de situaie s-ar putea
rezolva printr-o serie de teste care s verifice semnificaia diferenei pentru
fiecare pereche de probe pn la epuizarea tuturor combinaiilor unice
posibile. De exemplu, dac exist trei probe A, B i C, atunci se face cte un
test Student pentru verificarea semnificaiei diferenei dintre A i B, dintre A
i C i dintre B i C. Dac ns se compar 10 probe n loc de 3, atunci
analiza devine ceva mai dificil, pentru c trebuie efectuate 45 de teste
Student. Pe lng aceasta, ntr-o astfel de situaie mai apare si un aspect
statistic n defavoarea unei asemenea abordri.
Aa cum s-a artat n seciunea 5.5, orice test presupune un risc de
a efectua o eroare de genul I, ce const n respingerea unei ipoteze nule care
n realitate este adevrat. Cum valoarea cea mai uzual a lui este 0,05,
nseamn c pentru cele 45 de teste Student riscul apariiei unei astfel de
erori crete la 45 0,05 2,25. Conform acestei valori, nseamn c exist
anse mari de a ajunge la cel puin dou concluzii greite cu privire la
diferenele dintre cele zece probe. O posibil rezolvare ar consta n scderea
valorii de la 0,05 la 0,01, ceea ce ar micora riscul n cazul exemplului la
45 0,01 0,45. ns scznd valoarea nivelului de semnificaie, crete
riscul de a comite o eroare de genul II, adic de a accepta o ipotez nul
care n realitate s fie fals.
Aceste neajunsuri care pot s apar cnd se compar trei sau mai
multe probe pot fi depite cu ajutorul analizei varianei. Aceast tehnic
de analiz statistic este simbolizat prin acronimul ANOVA provenit de la
denumirea sa n limba englez (ANalysis Of VAriance), acronim pe care l
vom folosi n continuare pentru a ne referi la aceast tehnic.
ANOVA este o tehnic versatil ce poate fi utilizat pentru

Testarea diferenelor dintre trei sau mai multe probe

103

compararea a trei sau mai multor probe, grupate dup unul sau mai muli
factori, n cadrul unui singur test.
8.1. PRINCIPIUL ANOVA

ES

n esen, ANOVA este o tehnic ce permite descompunerea


variabilitii unui set de probe n componentele sale. Dac ne imaginm c
avem de comparat trei probe, atunci variabilitatea total a acestora va fi
dat de variabilitatea valorilor individuale fa de media fiecrei probe,
adic variabilitatea intern a probelor, i de variabilitatea dintre probe
datorat diferenelor dintre mediile populaiilor din care au fost extrase
probele, adic variabilitatea extern. Dac descriptorul folosit al
variabilitii este variana ( ), atunci descompunerea variabilitii poate fi
rezumat prin relaia:

FI
R

variana total;
variana extern sau dintre probe;
variana intern sau din probe.

ZA

n ANOVA varianele nu se folosesc ca atare, ci se consider ca


fiind sume de ptrate medii ( ) obinute prin mprirea sumelor de ptrate
( ) la numrul gradelor de libertate ( ).

Astfel vom vorbi de sume de ptrate medii, sume de ptrate i grade


de libertate, totale, externe i interne.
Dac probele au fost extrase aleatoriu din populaii normal
distribuite cu medii i variane egale, atunci variana intern va fi aceeai cu
cea extern. n cazul n care probele provin din populaii cu medii i variane
diferite, atunci diferenele dintre probe vor avea drept cauz principal
variabilitatea sau variana extern. Statistica ANOVA, notat cu ,
reprezint tocmai raportul dintre variana extern i cea intern i are o
distribuie particular Snedecor-Fisher n funcie de nivelul de semnificaie
) i de gradele de libertate interne
( ), de gradele de libertate externe (

104

Elemente de statistic aplicate n ecologie

(
). Cu ct valoarea lui va fi mai mare, cu att variabilitatea total va
rezulta mai mult din variabilitatea extern i mai puin din cea intern, i
invers.
ANOVA este o tehnic statistic parametric, deci presupune ca
datele analizate s ndeplineasc urmtoarele condiii:

1. probele trebuie s fie prelevate aleator;


2. variabila trebuie s fie apreciat pe o scal de interval sau de raport;
3. datele din probe trebuie s fie aproximativ normal distribuite;
4. varianele interne trebuie s nu difere semnificativ.

Ipotezele generale care se pot scrie n ANOVA sunt:

FI
R

ES

: probele au fost prelevate din populaii normal distribuite cu


variane i medii egale.
: deoarece se presupune c varianele populaiilor sunt egale,
probele au fost prelevate din populaii cu medii diferite.

ZA

Dac datele nu respect condiiile enumerate mai sus, se poate apela


la transformri ale valorilor variabilelor sau la alternative neparametrice ale
ANOVA.
Se observ c se face referire la egalitatea varianelor interne ale
probelor att la nivelul condiiilor de aplicare ale ANOVA, ct i la nivelul
ipotezelor generale. Deci, dup verificarea ndeplinirii condiiilor comune
testelor parametrice, trebuie testat dac varianele interne ale probelor difer
semnificativ.
8.1.1. Testarea omogenitii varianei interne
n acest sens se pot utiliza dou teste diferite. Cel mai rapid i mai
simplu este testul
sau Hartley. Acesta const n calcularea raportului
ntre variana cea mai mare (
) i cea mai mic (
) dintre varianele
probelor analizate.

Testarea diferenelor dintre trei sau mai multe probe

105

Valoarea
se compar cu o valoare critic pentru un anumit ,
pentru un anumit numr de probe ( ) i grade de libertate (
1) (anexa 2).
Dac
nu exist diferene semnificative ntre
, ,
varianele interne ale probelor pentru
1
.

FI
R

ES

Acest test se poate folosi doar dac toate probele conin acelai
).
numr de valori (
Dac probele au dimensiuni diferite, atunci se recomand aplicarea
testului Bartlett. Statistica testului Bartlett este una de tip
i se
1, unde
calculeaz pornind de la gradele de libertate ale fiecrei probe (
ia valori de la 1 la numrul de probe ), de la variana fiecrei probe ( )
i de la variana medie balansat ( ).

ZA

Statistica testului se compar cu o valoare critic


n funcie de un
anumit nivel de confiden i numrul de probe minus unu (
1) grade
de libertate (anexele 2 i 3).

Dac
nu exist diferene semnificative ntre
,
varianele interne ale probelor pentru
1
.
Probabilitatea asociat valorii statisticii testului poate fi calculat i
exact (anexa 3). Cnd se calculeaz probabilitatea asociat valorii
se
accept c nu exist diferene semnificative ntre varianele probelor dac
este mai mare de nivelul .
Exemplul 8.1. S-a urmrit numrul de exemplare ale unei plante n
cte 12 suprafee de prob din 4 zone diferite (notate de la la ). Urmeaz
s se realizeze o analiz a varianei i este nevoie s se testeze dac
varianele probelor difer semnificativ. Datele sunt urmtoarele:

106

59
63
71
53
66
74
35
62
53
49
53
29

24,33
25,66
38,66
55,58

25
26,5
40
56

Se poate considera c probele au o distribuie


aproximativ normal.
n continuare se verific omogenitatea
, pentru efectuarea
varianei cu ajutorul testului
cruia este necesar calcularea varianelor probelor:

54
46
39
21
41
25
23
46
29
52
31
57

32
10
12
25
38
14
37
43
16
20
28
33

Se examineaz normalitatea distribuiei datelor


n probe.

76,97

FI
R

159,88

ES

28
41
25
13
25
33
13
30
21
22
12
29

Elemente de statistic aplicate n ecologie

124,97
180,63 .

2,347 .

ZA

Se calculeaz statistica testului:

Valoarea critic a testului se afl n funcie de nivelul de confiden,


numrul probelor i numrul de valori per prob minus unu (anexa 2).
Pentru c valoarea pentru 4 i 11 grade de libertate lipsete din tabel, vom
considera valoarea pentru 4 i 10:
,

, ,

5,67 .

Valoarea calculat este mai mic dect valoarea critic, deci se poate
considera c varianele probelor nu difer semnificativ sau variana intern
este omogen.
Dac se folosete testul Bartlett pentru aceleai date, trebuie
calculat media balansat a varianei:

Testarea diferenelor dintre trei sau mai multe probe


,

107

135,612 .

Se calculeaz suma produselor dintre variana logaritmat a probei i


numrul gradelor de libertate:

1
76,97 12 1
124,97 12 1
159,88 12 1
180,63 12 1
213,866 .

213,866

2,165 .

135,612 44

Se calculeaz statistica testului:

7,815 .

FI
R

ES

Se afl valoarea critic (anexa 2 sau anexa 3):

ZA

Statistica testului este mai mic dect valoarea critic, deci variana
intern poate fi considerat omogen. Probabilitatea ca s nu existe diferene
semnificative ntre varianele probelor este de 0,54, adic mai mare de 0,05.
8.2. TIPURI DE ANOVA

ANOVA este una dintre cele mai versatile tehnici de statistic


inferenial, putnd fi aplicat n numeroase variante n funcie de
planificarea investigaiilor, att n teren, ct i n laborator.
n cadrul ANOVA, gruparea valorilor variabilei investigate se poate
face dup unul sau mai muli factori. Un factor reprezint un grup de
tratamente similare, care la rndul lor reprezint niveluri ale factorului
respectiv. Aceast terminologie i are originea n experimentele din
agricultur, ns n prezent a cptat o extindere mult mai mare, depind
semnificaia iniial. Astfel, ntr-un experiment, nivelurile unui factor sau
tratamentele pot fi obinute n urma unor manipulri. De exemplu, trei loturi
de animale primesc fiecare un anumit tip de hran i se urmrete efectul

108

Elemente de statistic aplicate n ecologie

ZA

FI
R

ES

acestuia asupra greutii corporale. n acest exemplu, factorul este


reprezentat de hran, iar tratamentele sau nivelurile factorului sunt tipurile
de hran. Datele vor fi reprezentate de greutile animalelor i vor fi grupate
n probe, n funcie de tipul de hran. Dac ns se urmrete o anumit
variabil n trei populaii conspecifice din trei locaii diferite, atunci factorul
va fi locaia n general, iar nivelurile acestuia vor fi reprezentate de locaiile
fiecrei populaii n parte. Valorile variabilei urmrite vor fi grupate n trei
probe, n funcie de locaia fiecrei populaii. n concluzie, factorul poate fi
orice factor ecologic ale crui niveluri (tratamente) difer de la o
populaie la alta.
n funcie de numrul factorilor dup care se grupeaz datele,
ANOVA poate fi unifactorial dac ia n consideraie un singur factor, sau
multifactorial, dac se iau n calcul mai muli factori. Modelele cele mai
frecvent utilizate n cercetrile ecologice sunt modelul unifactorial i cel
bifactorial.
Un alt aspect caracteristic pentru ANOVA bifactorial este
interaciunea factorilor. Dac exist interaciune ntre factori, atunci se
utilizeaz modelul bifactorial cu replicare (cu numr egal de observaii n
celul), iar dac nu exist interaciune ntre factori atunci se folosete
modelul bifactorial fr replicare (cu o singur observaie n celul sau cu
observaii repetate). Din perspectiva ANOVA, interaciunea reprezint o
parte a variabilitii totale, datorat modificrilor unui factor, i este legat
de variabilitatea unui alt factor sau a unei combinaii de ali factori.

8.2.1. ANOVA unifactorial


n cazul acestui model datele sunt grupate n probe n funcie de un
singur factor ( ). Astfel, probele coincid nivelurilor factorului sau
) (tab. 8.1).
tratamentelor (
Conform acestui model orice observaie poate fi definit ca:
Obs. =

Media
+ Efectul
general

Eroarea
ntmpltoare.

Efectul nivelurilor factorului d variabilitatea extern (dintre probe),


iar eroarea ntmpltoare este rezultatul variabilitii interne (din cadrul
probelor).

Testarea diferenelor dintre trei sau mai multe probe

109

Din aceste dou relaii rezult:


.

FI
R

ES

Tabelul 8.1. Distribuia valorilor n probe n ANOVA unifactorial

ZA

Ipotezele care se testeaz prin intermediul acestui model pot fi


formulate diferit, n funcie de sensul care se atribuie noiunii de tratament.
n cazul unor date obinute n urma unui experiment, ipotezele sunt de
forma:

: nu exist diferene semnificative ntre efectele tratamentelor


asupra variabilei;
: diferenele dintre efectele tratamentelor asupra variabilei sunt
semnificative.

n cazul unor date obinute n urma realizrii unor observaii


efectuate asupra unei variabile n populaii diferite, ipotezele pot fi
formulate astfel:
: mediile populaiilor din care s-au extras probele nu difer
semnificativ;
: mediile populaiilor din care s-au extras probele difer
semnificativ.

110

Elemente de statistic aplicate n ecologie

Dac se aplic ANOVA unifactorial pentru


probe, trebuie
parcurse urmtoarele etape:
1. Se calculeaz suma de ptrate a tuturor valorilor ( ) prin
adunarea sumelor de ptrate a valorilor pentru fiecare prob
( ):

2. Se calculeaz ptratul sumei totale (


prin adunarea
sumelor valorilor din fiecare prob ( ), urmat de ridicarea la
ptrat:

FI
R

ES

3. Se calculeaz numrul total de valori din toate probele ( ) prin


nsumarea dimensiunilor tuturor probelor ( ):
.

ZA

4. Se calculeaz suma rapoartelor dintre ptratul sumei i


dimensiunea fiecrei probe:

5. Se calculeaz sumele de ptrate total (


intern (
):

), extern (

) i

6. Se calculeaz numrul gradelor de libertate totale (


(
) i interne (
):
1

1
.

), externe

Testarea diferenelor dintre trei sau mai multe probe

111

7. Sumele de ptrate medii ( ) se calculeaz mprind sumele de


ptrate ( ) la gradele de libertate corespunztoare ( ):
.
8. Cu rezultatele obinute se completeaz aa-numitul tabel ANOVA
n care se va gsi i statistica testului ( ):
/

ES

Sursa de variaie
Extern (ntre probe)
Intern (n probe)
Total

se respinge i se accept

pentru o

ZA

Dac
probabilitate

FI
R

Condiia testului const n compararea statisticii


cu o valoare
critic a distribuiei Snedecor-Fisher tabelat n funcie de , gradele de
libertate externe (
) i gradele de libertate interne (
) (anexa 2).

Valoarea critic, precum i probabilitatea statisticii testului (adic


probabilitatea ca ipoteza nul s fie adevrat) se pot calcula (anexa 3).
Cnd se calculeaz probabilitatea asociat valorii , atunci ipoteza nul se
respinge dac
este mai mic de nivelul
i se va accepta ipoteza
alternativ pentru o probabilitate de 1
.
n cazul n care la sfritul testului se respinge ipoteza nul i se
accept n consecin c exist o diferen semnificativ, atunci analiza
poate continua n sensul detectrii diferenelor semnificative dintre mediile
tuturor combinaiilor de probe. O evaluare rapid a diferenelor dintre
mediile perechilor de probe const n inspectarea sau compararea grafic a
intervalelor de confiden a mediilor populaiilor (seciunea 5.1, fig. 5.5) din
care au fost extrase probele. n general, exist anse mari ca diferena dintre
dou probe s fie semnificativ, dac intervalele de confiden
corespunztoare nu se suprapun.

112

Elemente de statistic aplicate n ecologie

O modalitate mai sensibil de detectare a diferenelor semnificative


dintre medii este reprezentat de testul Tukey.
n cadrul acestui test se calculeaz diferenele n modul dintre
mediile tuturor perechilor unice de probe:
Media
Probei

| |
|

|
|
|

|
|

|
|

, ,

ZA

FI
R

ES

Se calculeaz apoi pentru fiecare pereche de probe cte o statistic


a testului, pornind de la o valoare critic Tukey ( , ,
, anexa 2), suma
de ptrate medie intern (
) i o medie armonic dintre dimensiunile
probelor din fiecare pereche ( ). Dac probele au aceeai dimensiune, n
loc de
se ia .

|
Dac |
diferena dintre mediile populaiilor din
,
care au fost extrase probele 1 i 2 este semnificativ pentru
1
.
), atunci
Dac probele au aceeai dimensiune (
diferenierea probelor se poate face prin investigarea sau compararea grafic
a suprapunerii intervalelor de confiden a mediilor fiecrei probe. Limitele
intervalului de confiden a unei medii rezult din adunarea i scderea la
aceasta a statisticii Tukey mprit la doi:
.
Exemplul 8.2. Pe baza datelor din exemplul 8.1 s se afle dac cele
patru probe sunt diferite semnificativ.

Testarea diferenelor dintre trei sau mai multe probe

113

Datele din exemplul 8.1 sunt distribuite n probe dup un singur


factor (zona), deci se realizeaz ANOVA unifactorial.
Ipotezele testului sunt:
: mediile probelor nu difer semnificativ;
:mediile probelor difer semnificativ.
Se calculeaz suma ptratelor tuturor valorilor prin adunarea sumelor
ptratelor valorilor din fiecare prob:

9280

19700

39061

75993 .

7952

292

308

ES

Se calculeaz ptratul sumei totale prin adunarea sumelor valorilor


din fiecare prob i ridicarea sumei la ptrat:
464

667

1731

2996361 .

12

12

12

48 .

12

FI
R

Se calculeaz numrul total de valori din toate probele:

70026,083 .

ZA

Se calculeaz suma rapoartelor dintre ptratul sumei i dimensiunea


fiecrei probe:

Se calculeaz cele trei sume de ptrate:


75993

13568,813

70026,083
13568,813

7601,896
7601,896 5966,917 .

Se calculeaz cele trei grade de libertate:


48

47

47

44 .

114

Elemente de statistic aplicate n ecologie

Se calculeaz sumele de ptrate medii:


,

2533,965

135,612 .

Cu cele dou sume de ptrate medii se calculeaz statistica testului:


,

18,685 .

Se completeaz tabelul ANOVA:

ES

Sursa de variaie
Extern
7601,896 3 2533,965 18,685
Intern
5966,917 44 135,612
Total
13568,813 47

FI
R

Se afl valoarea critic tabelat (anexa 2) sau se calculeaz n funcie


de nivelul de confiden, de gradele de libertate externe i de gradele de
libertate interne (anexa 3):
2,816 .

, ,

ZA

Statistica testului este mai mare dect valoarea critic i se poate


respinge ipoteza nul. Deci se accept c mediile probelor difer
semnificativ.
Probabilitatea ca ipoteza nul s fie adevrat este 5,8 10 , adic
extrem de mic.
n continuare, pentru a compara probele dou cte dou se folosete
testul Tukey, pentru care trebuie calculate modulele diferenelor dintre
perechile de probe:
Media
Probei
,
,
,

1,33

14,33
13

31,25
29,92
16,92

Testarea diferenelor dintre trei sau mai multe probe

115

Se calculeaz statistica testului pornind de la valoarea critic Tukey


(anexa 2):
,

3,79

, ,

3,79

12,74 .

FI
R

ES

Probele pentru care diferenele sunt mai mari dect statistica testului
sunt diferite semnificativ: proba difer semnificativ de probele i ,
proba difer semnificativ de probele i i proba difer semnificativ
de proba . Probele i nu difer semnificativ.
Pentru c probele au acelai numr de valori, se poate reprezenta
grafic intervalul de confiden pentru fiecare prob adunnd i scznd din
,
6,37).
valoarea fiecrei medii statistica testului mprit la doi (
Modul n care aceste intervale se suprapun arat care sunt probele diferite
semnificativ.

70

50
40
30

ZA

60

20
10
0

Proba

n grafic se observ cum intervalele probelor i se suprapun, n


timp ce intervalele celorlalte probe sunt separate pe vertical.

116

Elemente de statistic aplicate n ecologie

ES

8.2.2. ANOVA unifactorial neparametric Kruskal-Wallis


Acest tip de ANOVA este o alternativ neparametric a modelului
unifactorial. Ca urmare, se utilizeaz atunci cnd datele nu respect
condiiile de aplicare ale modelului unifactorial parametric.
Aranjarea datelor i ipotezele sunt similare cu cele de la ANOVA
unifactorial parametric.
Valorile din probe primesc ranguri mpreun, la fel ca n cazul
testului Mann-Whitney (seciunea 7.1.2).
Se calculeaz apoi suma rapoartelor dintre ptratele sumelor
rangurilor i numrul valorilor pentru fiecare prob:

FI
R

Statistica testului se calculeaz pornind de la valoarea prezentat


anterior i numrul total de valori din toate probele ( ).

se respinge i se accept

pentru

Dac
1

ZA

Condiia testului const n compararea statisticii cu o valoare critic


n funcie de i de
1 grade de libertate (anexele 2 i 3).

Probabilitatea pentru valoarea lui , asociat ipotezei nule, se poate


calcula exact (anexa 3). n cazul n care
este mai mic dect valoarea
, ipoteza nul se respinge i se accept ipoteza alternativ pentru o
probabilitate de 1
.
La fel ca n cazul ANOVA unifactorial parametric, i n cazul
ANOVA unifactorial neparametric se pot face comparaii multiple dac
diferenele testate sunt semnificative. Pentru a compara probele dou cte
dou se poate face pentru fiecare pereche cte un test
Mann-Whitney
(seciunea 7.1.2).

Testarea diferenelor dintre trei sau mai multe probe

117

Exemplul 8.3. Pe baza datelor din exemplul 8.1 s se afle dac cele
patru probe sunt diferite semnificativ, considernd c nu sunt ndeplinite
condiiile pentru a realiza ANOVA unifactorial parametric.
n acest caz, se folosete alternativa neparametric a ANOVA
unifactorial, adic ANOVA Kruskal-Wallis.
Ipotezele sunt similare cu cele de la exemplul 8.2.
Se dau ranguri valorilor din cele patru probe mpreun:
Proba

ZA

21
23
25
29
31
39
41
46
46
52
54
57
29
35
49
53
53
53
59
62
63
66
71
74

10
12
16
20
23
30
32
34
35
37
41
42
21
27
36
38
39
40
43
44
45
46
47
48

9,5
12
14,5
20
23
30
31,5
34,5
34,5
37
41
42
20
27
36
39
39
39
43
44
45
46
47
48

C
C
C
C
C
C
C
C
C
C
C
C
D
D
D
D
D
D
D
D
D
D
D
D

ES

2,5
4,5
4,5
9,5
11
14,5
14,5
17,5
20
22
25,5
31,5
1
2,5
6
7
8
14,5
17,5
24
25,5
28
29
33

FI
R

2
4
5
9
11
13
14
17
19
22
25
31
1
3
6
7
8
15
18
24
26
28
29
33

12
13
13
21
22
25
25
28
29
30
33
41
10
12
14
16
20
25
28
32
33
37
38
43

Proba
A
A
A
A
A
A
A
A
A
A
A
A
B
B
B
B
B
B
B
B
B
B
B
B

Se calculeaz apoi suma rapoartelor dintre ptratele sumelor


rangurilor i numrul valorilor pentru fiecare prob:

118

Elemente de statistic aplicate n ecologie

33518,458 .

Se calculeaz statistica testului:


33518,458

3 48

24,013 .

Se afl valoarea critic pin cutare n tabel (anexa 2) sau prin


calculare (anexa 3).
,

7,815 .

se respinge i se accept

ES

24,013 7,815
1 0,05 0,95 .

Se verific condiia testului:

pentru

FI
R

Probabilitatea ca ipoteza nul s fie adevrat (anexa 3) este de


2,5 10 , adic extrem de mic.
Concluzia testului este c probele difer semnificativ unele de altele.

ZA

8.2.3. ANOVA bifactorial fr replicare


Acest model se mai numete i model cu o singur observaie n
celul sau model cu observaii repetate.
n cazul acestui model datele sunt grupate n probe n funcie de doi
) i ,
factori: , care determin aranjarea datelor n coloane (
care determin aranjarea datelor n rnduri sau linii (
) (tab.
8.2). ntre cei doi factori nu exist interaciune (seciunea 8.2.5).
Tabelul 8.2. Distribuia valorilor n probe n ANOVA bifactorial

Testarea diferenelor dintre trei sau mai multe probe

119

+ Efectul

Media
+ Efectul
general

Eroarea
ntmpltoare.

ES

Obs. =

Denumirea de model cu o singur observaie n celul vine de la


faptul c, ntr-o celul a tabelului, adic la intersecia unui nivel al unui
factor cu un nivel al celuilalt factor ( , ) sau, mai simplu, la intersecia
unui rnd cu o coloan, se gsete o singur valoare ( , ).
Denumirea de model cu observaii repetate provine de la un caz
particular n care rndurile sunt reprezentate de uniti de prob asupra
crora se fac observaii repetate. O astfel de situaie este similar cu cea n
care se compar dou probe neindependente cu ajutorul testului Student
pentru perechi de observaii (seciunea 7.2.1), cu deosebirea c n cazul
ANOVA se compar efectul a trei sau mai multe tratamente.
Conform acestui model orice observaie poate fi definit ca:

ZA

FI
R

Efectul nivelurilor factorilor d variabilitatea extern (dintre probe),


iar eroarea ntmpltoare este rezultatul variabilitii interne (din cadrul
probelor).
n cazul acestui model, variabilitatea extern (
) poate fi la rndul
ei descompus n variabilitatea dintre coloane i variabilitatea dintre rnduri
(
), astfel c relaia de principiu a ANOVA bifactorial devine:
.

Dac varianele sau sumele de ptrate medii ( ) le considerm


rapoarte ntre sumele de ptrate ( ) i grade de libertate ( ), atunci:

.
Ipotezele care se testeaz prin intermediul acestui model pot viza
semnificaia efectului unui singur factor sau a ambilor factori, caz n care se
vor emite dou ipoteze nule i dou ipoteze alternative pentru acelai test.
Pentru date experimentare ipotezele sunt formulate astfel:

120

Elemente de statistic aplicate n ecologie

: nu exist diferene semnificative ntre efectele nivelurilor


primului factor ( ) asupra variabilei;
: nu exist diferene semnificative ntre efectele nivelurilor celui
de-al doilea factor ( ) asupra variabilei;
: diferenele dintre efectele nivelurilor primului factor ( ) asupra
variabilei sunt semnificative;
: diferenele dintre efectele nivelurilor celui de-al doilea factor
( ) asupra variabilei sunt semnificative.

n cazul unor date obinute n urma realizrii unor observaii


efectuate asupra unei variabile n populaii diferite, ipotezele pot fi
formulate astfel:

ZA

FI
R

ES

: mediile populaiilor corespunztoare nivelurilor primului factor


( ) nu difer semnificativ;
: mediile populaiilor corespunztoare nivelurilor celui de-al
doilea factor ( ) nu difer semnificativ;
: mediile populaiilor corespunztoare nivelurilor primului factor
( ) difer semnificativ;
: mediile populaiilor corespunztoare nivelurilor primului factor
( ) difer semnificativ.

Dac se aplic ANOVA unifactorial pentru coloane i rnduri,


trebuie parcurse urmtoarele etape:
1. Se calculeaz suma ptratelor tuturor valorilor ( ) prin
adunarea sumelor ptratelor valorilor pe coloane sau pe rnduri
(
sau ):

Sau

2. Se calculeaz ptratul sumei totale (


prin adunarea
sumelor valorilor din fiecare coloan ( ) sau rnd ( ),
urmat de ridicarea la ptrat:

Testarea diferenelor dintre trei sau mai multe probe

sau

121

3. Se calculeaz numrul total de valori din toate probele ( ) prin


nsumarea dimensiunilor coloanelor ( ) sau rndurilor ( ):

sau

FI
R

ES

4. Se calculeaz suma rapoartelor dintre ptratul sumei i


dimensiunea fiecrei coloane:
.

ZA

5. Se calculeaz suma rapoartelor dintre ptratul sumei i


dimensiunea fiecrui rnd:

6. Se calculeaz sumele de ptrate: total ( ), dintre coloane (


dintre rnduri ( ) i cea intern (
):

),

122

Elemente de statistic aplicate n ecologie

7. Se calculeaz numrul gradelor de libertate totale ( ), pentru


coloane ( ), pentru rnduri ( ) i cele interne (
):
1
1
1

1 .

ES

8. Sumele de ptrate medii ( ) se calculeaz mprind sumele de


ptrate ( ) la gradele de libertate corespunztoare ( ):

FI
R

9. Cu rezultatele obinute se completeaz aa-numitul tabel ANOVA


n care se va gsi i statistica testului ( ):

Sursa de variaie
Extern, ntre coloane
Extern, ntre rnduri
Intern
Total

ZA

/
/

Condiia testului const n compararea statisticii


critic tabelat n funcie de , gradele de libertate externe (
de libertate interne (
) (anexa 2).
Dac
,
o probabilitate
Dac
,
o probabilitate

,
,

1
1

cu o valoare
) i gradele

se respinge i se accept

pentru

se respinge i se accept

pentru

.
.

Valoarea critic, precum i probabilitatea statisticii testului (adic

Testarea diferenelor dintre trei sau mai multe probe

123

probabilitatea ca ipoteza nul s fie adevrat) se pot calcula (anexa 3).


Cnd se calculeaz probabilitatea asociat valorii , atunci ipoteza nul se
respinge dac
este mai mic de nivelul
i se va accepta ipoteza
.
alternativ pentru o probabilitate de 1
Exemplul 8.4. S-a urmrit densitatea realizat de o anumit specie
de plant n cinci suprafee de prob (de la la ) urmrite timp de patru
ani (de la la ) dintr-o zon supus reconstruciei ecologice. A crescut
semnificativ densitatea plantei n timp?

1,9459
2,3026
3,4012
2,3979
1,0986

18
20
65
60
15

ES

10
15
33
31
17

FI
R

1,0986
2,0794
2,8332
2,0794
0,6931

2,3026
2,7081
3,4965
3,4340
2,8332

ZA

Proba

7
10
30
11
3

2,8904
2,9957
4,1744
4,0943
2,7081

3
8
17
8
2

Se poate observa c
datele sunt organizate dup doi
factori: an i prob. Deci se poate
realiza un model bifactorial de
ANOVA. Dat fiind faptul c n
fiecare celul exist o singur
valoare, se va realiza ANOVA
bifactorial fr replicare.
Fiind vorba de relativ
puine date ce reprezint numr
de entiti, se poate face o
transformare care s normalizeze
distribuia i s stabilizeze
variana probelor.

An

ntrebarea problemei se refer doar la diferenele semnificative


dintre ani (coloane). Dac s-ar fi dorit i evidenierea diferenelor dintre
suprafeele de prob (rnduri), atunci trebuie testate dou seturi de ipoteze:
una nul i una alternativ pentru fiecare factor:
: nu exist diferene semnificative ntre densiti pe ani;
: nu exist diferene semnificative ntre densiti pe probe;
: diferenele dintre densitile pe ani sunt semnificative;
: diferenele dintre densitile pe probe sunt semnificative.

124

Elemente de statistic aplicate n ecologie

Se calculeaz suma ptratelor tuturor valorilor logaritmate:

18,363

27,613

44,680

58,851

149,508 .

Se calculeaz ptratul sumei totale la ptrat:

8,784 11,146
2659,185 .

14,774

16,863

51,567

Se calculeaz numrul total de valori din toate probele


5

20 .

FI
R

ES

Se calculeaz suma rapoartelor dintre ptratul sumei i dimensiunea


fiecrei coloane:
,

140,806 .

ZA

Se calculeaz suma rapoartelor dintre ptratul sumei i dimensiunea


fiecrui rnd:
,

140,212 .

Se calculeaz sumele de ptrate:


149,508

16,549

140,806

7,847

140,212
16,549

7,252
7,252

7,847

1,450 .

Testarea diferenelor dintre trei sau mai multe probe

125

Se calculeaz numrul gradelor de libertate:


20 1 19
5 1 4

1 5

12 .

Se calculeaz sumele de ptrate medii:


,

2,616

1,813

0,121 .

Se calculeaz statisticile testului i se completeaz tabelul ANOVA:


,

21,620

14,983 .

FI
R

ES

Sursa de variaie
Extern, ntre coloane 7,847 3 2,616 21,620
Extern, ntre rnduri 7,252 4 1,813 14,983
Intern
1,450 12 0,121
Total
16,549 19

, ,

3,490

, ,

3,259 .

ZA

Se afl valorile critice pentru fiecare surs de variaie extern (anexa


2 sau 3):

Se verific condiia testului:


21,620 3,490
probabilitate
1
14,983 3,259
probabilitate
1

se
0,05
se
0,05

respinge i se accept
0,95.
respinge i se accept
0,95.

pentru o
pentru o

Probabilitile celor dou ipoteze nule se pot calcula (anexa 3):


3,92 10 i

1,18 10 .

126

Elemente de statistic aplicate n ecologie

Concluzia testului este c modificrile induse de trecerea anilor


densitii plantei analizate sunt semnificative. De asemenea, exist i o
diferen semnificativ ntre suprafeele de prob din punctul de vedere al
densitii speciei analizate.

ZA

FI
R

ES

8.2.4. ANOVA bifactorial neparametric Friedman


Se utilizeaz ca alternativ neparametric a modelului bifactorial
atunci cnd se fac observaii repetate asupra acelorai uniti de prob,
obinndu-se probe neindependente. Din acest punct de vedere ANOVA
bifactorial neparametric este similar testului Wilcoxon (seciunea 7.2.2),
doar c se folosete pentru trei sau mai multe probe.
Aranjarea datelor i ipotezele sunt similare cu cele de la ANOVA
i
bifactorial parametric, cu deosebirea c se testeaz doar ipotezele
referitoare la factorul ce determin aranjarea datelor n coloane.
Valorile fiecrui rnd primesc ranguri n mod independent.
Rangurile pentru fiecare rnd se atribuie conform algoritmului prezentat n
seciunea 2.1, tab. 2.3.
Logica acestui test este c, dac nu exist diferene ntre efectele
nivelului primului factor ( ) sau, mai simplu, dac nu exist diferene ntre
coloane, sumele rangurilor coloanelor ar trebui s fie aproximativ egale,
deoarece orice rang are anse egale s apar n orice coloan.
Se calculeaz suma rangurilor valorilor din fiecare coloan (
),
dup care se ridic la ptrat:

Se calculeaz suma ptratelor sumelor rangurilor pe coloan:


Statistica testului se calculeaz cu ajutorul formulei:


1 .

Testarea diferenelor dintre trei sau mai multe probe

127

Condiia testului compar valoarea statisticii cu o valoare critic


tabelat (anexa 2) sau calculat (anexa 3) n funcie de i de numrul de
coloane minus unu grade de libertate (
1).
Dac
1

se respinge,

se accept pentru

ES

Probabilitatea pentru valoarea lui , asociat ipotezei nule, se poate


calcula exact (anexa 3). n cazul n care
este mai mic de valoarea ,
ipoteza nul se respinge i se accept ipoteza alternativ pentru o
probabilitate de 1
.
Deci acesta verific doar setul de ipoteze care se refer la factorul
dup care se aranjeaz datele pe coloane. Cu alte cuvinte, dac se respinge
ipoteza nul, concluzia este c exist o diferen semnificativ ntre coloane.

FI
R

Exemplul 8.5. S se rspund la ntrebarea de la exemplul 8.4


considernd c nu sunt ndeplinite condiiile de aplicare a ANOVA
bifactoriale fr replicare, parametrice.

ZA

n acest caz se apeleaz la alternativa neparametric a acestui tip de


ANOVA, adic la ANOVA Freidman.
Ipotezele testului sunt similare celor de la exemplul 8.4, cu
deosebirea c ANOVA Friedman testeaz doar un singur set de ipoteze, cele
care vizeaz coloanele. Pentru a testa i ipotezele referitoare la rnduri,
datele trebuie rearanjate astfel nct coloanele s devin rnduri i rndurile
coloane. Altfel spus, tabelul de date trebuie rotit.
Pentru a efectua testul trebuie ca valorile din fiecare rnd s
primeasc ranguri, dup care se calculeaz suma rangurilor pe coloane:

1
1
1
1
1
5

2
2
2
2
2
10

3
3
3
3
4
16

4
4
4
4
3
19

128

Elemente de statistic aplicate n ecologie

Se calculeaz apoi suma sumelor ridicate la ptrat ale rangurilor pe


coloane:

10

16

19

742 .

Se calculeaz statistica testului:

742

35 4

14,04 .

FI
R

ES

Se afl valoarea critic


(anexa 2 sau anexa 3):
7,815 .
, ,
Statistica testului este mai mare dect valoarea critic, deci se
respinge ipoteza nul ( ) i se accept ipoteza alternativ ( ).
Probabilitatea ca ipoteza nul s fie adevrat se poate calcula
(anexa 3) i este egal cu 0,0029.
Concluzia testului este c probele (coloanele) difer semnificativ.

8.2.5. ANOVA bifactorial cu replicare


Acest model se mai numete si model cu numr egal de observaii n
celul.

ZA

La fel ca i la ANOVA bifactorial fr replicare, datele sunt grupate


n probe n funcie de doi factori: , care determin aranjarea datelor n
coloane (
), i , care determin aranjarea datelor n rnduri
sau linii (
) (tab. 8.3). n cazul acestui model particularitatea de
form const n faptul c ntr-o celul a tabelului, adic la intersecia unui
nivel al unui factor cu un nivel al celuilalt factor ( , ) sau, mai simplu, la
intersecia unui rnd cu o coloan, se gsesc mai multe valori ( , , ), adic
observaii replicate.
Particularitatea de principiu a acestui model este reprezentat de
faptul c presupune o interaciune ntre cei doi factori. Practic, interaciunea
este evident dac efectul unor anumite niveluri ale factorilor asupra
variabilei investigate se modific ntr-o manier neaditiv.

Testarea diferenelor dintre trei sau mai multe probe


Tabelul 8.3. Distribuia valorilor n probe n ANOVA bifactorial

129

ES

ZA

FI
R

Evidenierea interaciunii se poate realiza prin vizualizarea grafic a


mediilor celulelor (a mediilor valorilor de la 1 la din fiecare celul). Dac
liniile care unesc mediile dup un factor sunt mai mult sau mai puin
paralele, atunci ntre factori nu exist interaciune. n figura 8.1 se poate
observa c trecerea de la un nivel al factorului la altul (trecerea de la la
) modific variabila n sensul descreterii mediilor cu aceeai valoare i
pentru rndul 1, i pentru rndul 2. Modificarea variabilei se realizeaz n
acelai sens i sub aciunea nivelurilor factorului . Deci, n acest caz,
factorii
i
au o aciune aditiv negativ (de scdere) a variabilei
investigate.

R1

R2

C1

C2

Figura 8.1. Interaciune absent

130

Elemente de statistic aplicate n ecologie

Dac liniile ce unesc mediile dup un factor sunt evident neparalele,


nseamn c ntre cei doi factori exist o interaciune sau efectele factorilor
asupra variabilei sunt neaditive. n figura 8.2, efectele factorului asupra
variabilei modific efectele factorului
n sensul c pentru
efectul
trecerii de la la const ntr-o scdere mai mare dect pentru .

R1
R2

ES

C2

FI
R

C1

Figura 8.2. Interaciune:

ZA

n figura 8.3 este vorba tot de interaciune ntre factori, dar n acest
caz interaciunea const ntr-o descretere mai ampl n cazul
sub
aciunea factorului .

R1
R2

C1

C2

Figura 8.3. Interaciune:

Testarea diferenelor dintre trei sau mai multe probe

131

Conform acestui model orice observaie poate fi definit ca:


Efect
Efect
Efect
Media
Eroarea
+
+ Interaciune +
Obs.=
+
general
ntmpltoare.

Efectul nivelurilor factorilor d variabilitatea extern (dintre probe),


iar eroarea ntmpltoare este rezultatul variabilitii interne (din cadrul
probelor).
) poate fi rndul ei
n cazul acestui model variabilitatea extern (
descompus n variabilitatea dintre coloane, variabilitatea dintre rnduri i
variabilitatea cauzat de interaciune (
), astfel c relaia de
principiu a ANOVA bifactorial devine:

FI
R

ES

.
Dac varianele sau sumele de ptrate medii ( ) le considerm
rapoarte ntre sumele de ptrate ( ) i grade de libertate ( ), atunci:

ZA

Ipotezele care se testeaz prin intermediul acestui model pot viza


semnificaia efectului unui singur factor sau a ambilor factori, caz n care se
vor emite dou ipoteze nule i dou ipoteze alternative pentru acelai test.
Pentru date experimentale ipotezele sunt formulate astfel:
: nu exist diferene semnificative ntre efectele nivelurilor
primului factor ( ) asupra variabilei;
: nu exist diferene semnificative ntre efectele nivelurilor celui
de-al doilea factor ( ) asupra variabilei;
: efectul interaciunii nu este semnificativ;
: diferenele dintre efectele nivelurilor primului factor ( ) asupra
variabilei sunt semnificative;
: diferenele dintre efectele nivelurilor celui de-al doilea factor
( ) asupra variabilei sunt semnificative;
: efectul interaciunii este semnificativ.

132

Elemente de statistic aplicate n ecologie

n cazul unor date obinute n urma realizrii unor observaii


efectuate asupra unei variabile n populaii diferite, ipotezele pot fi
formulate astfel:

FI
R

ES

: mediile populaiilor corespunztoare nivelurilor primului factor


( ) nu difer semnificativ;
: mediile populaiilor corespunztoare nivelurilor celui de-al
doilea factor ( ) nu difer semnificativ;
: mediile corespunztoare interaciunii nivelurilor factorilor
( , ) nu difer semnificativ;
: mediile populaiilor corespunztoare nivelurilor primului factor
( ) difer semnificativ;
: mediile populaiilor corespunztoare nivelurilor primului factor
( ) difer semnificativ;
: mediile corespunztoare interaciunii nivelurilor factorilor
( , ) difer semnificativ.

sau

ZA

Dac se aplic ANOVA unifactorial pentru coloane, rnduri i


valori n fiecare celul, trebuie parcurse urmtoarele etape:
1. Se calculeaz suma ptratelor tuturor valorilor ( ) prin
adunarea ptratelor tuturor valorilor pe coloane sau pe rnduri
(
sau ):

2. Se calculeaz ptratul sumei totale (


prin adunarea
sumelor valorilor din fiecare coloan ( ) sau rnd ( ),
urmat de ridicarea la ptrat:

sau

Testarea diferenelor dintre trei sau mai multe probe

133

3. Se calculeaz numrul total de valori din toate probele ( ) prin


nsumarea dimensiunilor coloanelor ( ) sau rndurilor ( ) sau
prin nmulirea numrului de valori din celul cu numrul
celulelor egal cu produsul dintre numrul coloanelor i rndurilor:
sau
sau

FI
R

ES

4. Se calculeaz suma rapoartelor dintre ptratul sumei i


dimensiunea fiecrei coloane:

ZA

5. Se calculeaz suma rapoartelor dintre ptratul sumei i


dimensiunea fiecrui rnd:

6. Se calculeaz suma rapoartelor dintre ptratul sumei i


):
dimensiunea fiecrei celule (

sau

134

Elemente de statistic aplicate n ecologie

7. Se calculeaz sumele de ptrate: total ( ), dintre coloane ( ),


dintre rnduri ( ), de interaciune ( ) i cea intern (
):

ES

FI
R

8. Se calculeaz numrul gradelor de libertate totale ( ) pentru


coloane ( ), pentru rnduri ( ), pentru interaciune ( ) i
):
pentru cele interne (

ZA

1
1
1

1
.

9. Sumele de ptrate medii ( ) se calculeaz mprind sumele de


ptrate ( ) la gradele de libertate corespunztoare ( ):

Testarea diferenelor dintre trei sau mai multe probe

135

10. Cu rezultatele obinute se completeaz aa-numitul tabel


ANOVA n care se va gsi i statistica testului ( ):

Sursa de variaie
Extern, ntre coloane

Extern, ntre rnduri


Extern, de interaciune
(ntre celule)
Intern

ES

Total

ZA

Dac
,
o probabilitate
Dac
,
o probabilitate
Dac
,
o probabilitate

FI
R

Condiia testului const n compararea statisticii


cu o valoarea
critic tabelat n funcie de , gradele de libertate externe (
) i gradele
) (anexa 2 sau anexa 3).
de libertate interne (

1
1

se respinge i se accept

pentru

se respinge i se accept

pentru

se respinge i se accept

pentru

.
.

Valoarea critic, precum i probabilitatea statisticii testului (adic


probabilitatea ca ipoteza nul s fie adevrat) se pot calcula (anexa 3).
Cnd se calculeaz probabilitatea asociat valorii , atunci ipoteza nul se
respinge dac
este mai mic de nivelul
i se va accepta ipoteza
alternativ pentru o probabilitate de 1
.
Dac diferenele testate sunt semnificative, atunci se pot face
comparaii multiple. Pentru aceasta se utilizeaz testul Tukey, n cadrul
cruia se calculeaz diferenele n modul dintre mediile tuturor perechilor
unice de probe (celule):

136

Elemente de statistic aplicate n ecologie

Media
probei

FI
R

ES

Se calculeaz apoi pentru statistica


a testului pornind de la o
valoare critic Tukey ( , ,
,
anexa
2),
suma
de ptrate medie intern

(
) i numrul valorilor dintr-o celul ( ).

ZA

Dac diferena absolut dintre oricare dou medii |


diferena este semnificativ pentru
1
.

Exemplul 8.6. ntr-un experiment s-a urmrit efectul tipului de


hran i al stresului ambiental asupra greutii unor obolani de laborator.
Pentru aceasta s-au format 4 grupuri a cte 10 obolani, care au fost supuse
urmtoarelor tratamente: un grup a primit hran normal n condiii
nestresante, un grup a primit hran normal n condiii stresante, un grup a
primit hran hipercaloric n condiii nestresante i ultimul grup a primit
hran hipercaloric n condiii stresante. Dup un timp s-au determinat
greutile la toi indivizii. Exist o interaciune semnificativ ntre cei doi
factori: tipul de hran i stres?
Avnd n vedere modul de organizare al datelor, se poate folosi
ANOVA bifactorial cu replicare (cu numr egal de observaii n celul). La
intersecia unui rnd i a unei coloane sunt zece valori. Acest model poate
rspunde la ntrebarea problemei.

137

FI
R

ES

Testarea diferenelor dintre trei sau mai multe probe


Hran
Mediu
Normal
Hipercaloric
130
157
142
155
131
162
124
153
124
158
Stresant
131
152
143
159
131
161
130
160
127
157
120
132
130
128
122
142
118
131
120
135
Nestresant
119
120
127
139
118
133
119
135
122
136

ZA

Pentru a vedea dac exist interaciune ntre factori la nivel de probe


(celule), trebuie reprezentate grafic mediile valorilor din fiecare celul.

165
160
155
150
145
x 140
135
130
125
120
115

stresant

157,4

nestresant

131,3

133,1

121,5

normal

hipercaloric
Hran

138

Elemente de statistic aplicate n ecologie

Din analiza acestui grafic rezult c hrana hipercaloric determin o


cretere n greutate mai mare dect cea normal. Condiiile stresante
determin o cretere n greutate mai mare. Creterea n greutate cnd s-a
administrat hran hipercaloric i n condiii stresante este mai puternic
dect atunci cnd s-a administrat hran normal n condiii stresante. Deci sar putea s existe o interaciune ntre cei doi factori.
Ipotezele acestui test sunt:

ZA

FI
R

ES

: tipul de hran nu are un efect semnificativ asupra greutii


(coloanele nu difer semnificativ);
: stresul nu are un efect semnificativ asupra greutii (rndurile
nu difer semnificativ);
: interaciunea dintre tipul de hran i stres nu este semnificativ
(celulele nu difer semnificativ);
: tipul de hran are un efect semnificativ asupra greutii
(coloanele difer semnificativ);
: stresul are un efect semnificativ asupra greutii (rndurile
difer semnificativ);
: interaciunea dintre tipul de hran i stres este semnificativ
(celulele difer semnificativ).

Pentru a verifica dac interaciunea este semnificativ trebuie s se


parcurg etapele de realizare ale ANOVA bifactorial cu replicare.
Se calculeaz suma ptratelor tuturor valorilor:
320544

425335

745879 .

Se calculeaz ptratul sumei totale:

2528

2905

5433

29517489 .

Se calculeaz numrul total de valori din toate probele:


20

20

40 .

Testarea diferenelor dintre trei sau mai multe probe

139

Se calculeaz suma rapoartelor dintre ptratul sumei i dimensiunea


fiecrei coloane:

741490,45 .

Se calculeaz suma rapoartelor dintre ptratul sumei i dimensiunea


fiecrui rnd:

740844,25 .

744923,1 .

FI
R

ES

Se calculeaz suma rapoartelor dintre ptratul sumei i dimensiunea


fiecrei celule:

ZA

Se calculeaz sumele de ptrate:


745879

741490,45

740844,25

744923,1
7941,775

7941,775
3553,225
2907,025
3553,225 2907,025
525,625
3553,225 2907,025 525,625
955,9.

Se calculeaz numrul gradelor de libertate:


40 1 39
2 1 1
40 4 36 .

2 1 1
2 1 2

140

Elemente de statistic aplicate n ecologie

Se calculeaz sumele de ptrate medii:


,
,

3553,225

2907,025
,

525,625

26,553 .

Se calculeaz statisticile testului i se completeaz tabelul ANOVA:


,
,

133,82
,

109,48

19,80 .

FI
R

ES

Sursa de variaie
Extern, ntre coloane
3553,225 1 3553,225 133,82
Extern, ntre rnduri
2907,025 1 2907,025 109,48
Extern, de interaciune
525,625 1 525,625
19,80
(ntre celule)
Intern
955,9
36 26,553
Total
7941,775 39

ZA

Deoarece gradele de libertate externe sunt toate egale cu 1, valoarea


critic va fi aceeai (anexa 2 sau 3) pentru toate cele trei seturi de ipoteze:
4,113.
, , ,

133,82 4,113
probabilitate
1
109,48 4,113
probabilitate
1
19,80 4,113
probabilitate
1

se respinge i se accept
0,05.
se respinge i se accept
.
se respinge i se accept
.

pentru o
pentru o
pentru o

Probabilitile ca ipotezele nule s fie adevrate pot fi calculate


pentru fiecare statistic (anexa 3). Ele sunt 1,1 10
pentru , 1,9
10
pentru i 7,9 10 pentru .
Concluzia testului este c hrana are un efect semnificativ asupra

Testarea diferenelor dintre trei sau mai multe probe

141

greutii, stresul are un efect semnificativ asupra greutii i interaciunea


dintre hran i stres este i ea semnificativ.
n continuare, pentru evidenierea diferenelor semnificative dintre
celule luate cte dou se poate realiza testul Tukey. Pentru aceasta se
calculeaz modulele diferenelor dintre mediile celulelor:
Hipercaloric
Stresant
157,4

Normal
Nestresant
121,5

Hipercaloric
Nestresant
133,1

Normal
Stresant
131,3

26,1

9,8

1,8

35,9

ES

157,4

Hran
Mediu

121,5

24,3
11,6

3,85 .

, ,

FI
R

Se afl valoarea critic Tukey (anexa 2):

ZA

Se calculeaz statistica testului:

3,85

6,27 .

Comparaia dintre modulele diferenelor dintre medii i statistica


testului evideniaz c exist diferene semnificative ntre toate perechile de
grupuri, cu excepia perechii formate de grupul hrnit normal n condiii de
stres i grupul hrnit cu hran hipercaloric n condiii nestresante, ntre care
nu exist o diferen semnificativ.
Diferenele semnificative pot fi observate i prin analiza grafic a
suprapunerii dintre intervalele de confiden ale mediilor grupurilor.
Limitele intervalelor de confiden se calculeaz scznd i adunnd la
media fiecrui grup valoarea obinut prin mprirea statisticii testului
,
Tukey la doi (
3,135).

142

Elemente de statistic aplicate n ecologie

stresant

157,4

nestresant

133,1

131,3

Hran

hipercaloric

ZA

FI
R

ES

normal

121,5

165
160
155
150
145
x 140
135
130
125
120
115

9. CORELAIA I REGRESIA

ZA

FI
R

ES

O cercetare ecologic poate urmri posibilele relaii ntre dou sau


mai multe fenomene. De cele mai multe ori se urmrete relaia dintre dou
variabile apreciate pe o scal ordinal, de interval sau de raport. Analiza
unei astfel de relaii se face prin corelaie sau regresie, aplicarea uneia din
cele dou depinznd de modalitatea de obinere a datelor i de problema
care se pune n legtur cu acestea.
Corelaia este folosit pentru a determina dac exist asociere ntre
dou variabile i ct de puternic este aceast asociere. Prin asociere se
nelege c atunci cnd o variabil se modific cealalt se modific i ea
ntr-un anumit mod. De remarcat c n cazul corelaiei nu se fac presupuneri
viznd asocieri de tipul cauz-efect ntre cele dou variabile, dei acestea ar
putea exista. Exist posibilitatea ca dinamica celor dou variabile s fie
determinat de o a treia.
Regresia, pe de alt parte, evideniaz cu precdere relaiile de tip
cauz-efect dintre dou variabile, astfel nct o proporie substanial dintre
valorile unei variabile, numit variabil dependent, s fie o funcie sau s
fie explicate de valorile celeilalte variabile, numit variabil independent.
O alt deosebire notabil dintre corelaie i regresie este faptul c n
majoritatea cazurilor de analiz a regresiei valorile variabilei independente
nu sunt obinute aleator din populaie, nu sunt normal distribuite, ci, mai
curnd, selecia lor se afl sub controlul experimentatorului.
n general, se fac suficiente confuzii privind care dintre cele dou
analize pot fi aplicate unor anumite date. Pentru a simplifica decizia privind
utilizarea analizei corelaiei sau regresiei s analizm urmtoarele trei
cazuri:
A. Se extrage aleator o prob format din oprle gravide dintr-o
populaie. Dup depunerea oulor se nregistreaz greutatea i numrul de
ou produse. Datele se reprezint grafic, desemnndu-se arbitrar care
dintre cele dou variabile va fi reprezentat pe abscis i care pe ordonat.
B. Se urmrete efectul temperaturii asupra frecvenei cardiace la

144

Elemente de statistic aplicate n ecologie

FI
R

ES

proba reprezentat de oprle. Pentru aceasta fiecare dintre ele este supus
unei anumite temperaturi cuprins ntre anumite limite. Se nregistreaz
apoi la fiecare individ frecvena cardiac. Temperatura, variabila
independent fixat arbitrar, va fi reprezentat pe abscis. Frecvena
cardiac, variabila dependent de prima, va fi reprezentat pe ordonat.
C. Se alege un anumit numr de oprle gravide dintr-o populaie
dup un anumit criteriu s aib o anumit greutate. Se urmrete mai
departe cte ou va produce fiecare animal. Greutatea, variabila
independent aleas arbitrar i n funcie de valorile creia s-a selecionat
proba, va fi reprezentat pe abscis, iar dimensiunea pontei, variabila
dependent de prima, va fi reprezentat pe ordonat.
Dintre cele 3 situaii descrise mai sus, prima (A) este o problem de
analiz a corelaiei, n timp ce situaiile B i C sunt probleme de analiz a
regresiei. Dei situaiile A i C pot conduce aparent la ideea c ambele
analize pot fi aplicate pe aceleai date, n realitate, aplicarea corelaiei sau
regresiei este dictat de modul n care a fost obinut proba: n cazul A
proba era prelevat aleator, n timp ce n cazul C proba era prelevat
arbitrar, dup un anumit criteriu.

9.1. ANALIZA CORELAIEI

ZA

Analiza corelaie are rolul de a rspunde la mai multe ntrebri:

1. Exist o relaie ntre dou 2 variabile studiate?


2. Care este tipul acestei relaii?
3. Ct de puternic este aceast relaie?
4. Este relaia detectat semnificativ?
Rspunsurile la aceste ntrebri pot fi intuite din analiza datelor prin
intermediul unor reprezentri grafice (diagram de mprtiere a punctelor
de coordonate i ). Astfel, analiza graficelor de mai jos (fig. 9.1) permite
urmtoarele concluzii:
primul grafic prezint o corelaie direct sau pozitiv (variabilele
sunt direct proporionale), adic cele dou variabile se modific n acelai
sens cnd crete, crete, iar cnd scade, scade;

Corelaia i regresia

145

al doilea grafic prezint o corelaie invers sau negativ


(variabilele sunt invers proporionale), adic cele dou variabile se modific
n sens diferit cnd crete, scade, iar cnd scade, crete;
al treilea grafic arat c, ntre cele dou variabile, corelaia practic
nu exist;
n cazul celui de-al patrulea grafic, tragerea unei concluzii este
dificil, implicnd un grad nalt de subiectivism: fie nu exist corelaie, fie
este o corelaie pozitiv, slab (mprtierea punctelor este relativ mare).
y

Corelaie negativ

ES

Corelaie pozitiv

FI
R

ZA

Corelaiei absent

Corelaie?

Figura 9.1. Tipuri de corelaie

Examinarea graficelor de corelaie poate fi ns subiectiv, motiv


pentru care este necesar completarea metodei grafice cu una statistic, mai
obiectiv. O astfel de metod ce surprinde msura n care dou variabile
sunt asociate const n calcularea coeficientului de corelaie .
Valoarea coeficientului de corelaie este cuprins ntre 1, valoarea
unei corelaii maxime negative, i 1, valoarea unei corelaii maxime
pozitive. Dac este cuprins ntre 0 i 1, corelaia este pozitiv, iar dac
este cuprins ntre 0 i 1, corelaia este negativ. Cnd este egal cu 0,
corelaia este absent. Cnd
este egal cu 1 sau 1, punctele de
coordonate , sunt dispuse perfect liniar, n lungul unei drepte imaginare
(fig. 9.2, A i B). Dac variabilele urmrite sunt apreciate pe o scal

146

Elemente de statistic aplicate n ecologie

ordinal, exist o corelaie perfect cnd toate valorile cresc sau descresc
succesiv. n acest caz, punctele din graficul de corelaie pot s nu se afle
dispuse liniar (fig. 9.2, C).
y

Figura 9.2. Corelaii perfecte: A pozitiv, B negativ, C perfect monoton (a


rangurilor)

FI
R

ES

Corelaiile pentru care valoarea coeficientului este mai apropiat de


1 sau 1 sunt corelaii puternice, pozitive sau, respectiv, negative, iar cele
pentru care valoarea coeficientului este mai apropiat de 0 sunt corelaii
slabe (tab. 9.1).

Tabelul 9.1. Puterea corelaiei n funcie de valoarea lui

ZA

0,00 0,19
0,20 0,39
0,40 0,69
0,70 0,89

0,90 1,00

Puterea corelaiei
Corelaie foarte slab
Corelaie slab
Corelaie moderat
Corelaie puternic
Corelaie foarte
puternic

n funcie de caracteristicile datelor celor dou variabile, corelaia


poate fi parametric sau neparametric. Pentru fiecare din cele dou se
folosesc coeficieni diferii: pentru corelaia parametric se folosete
coeficientul de corelaie Pearson; pentru corelaia neparametric se
utilizeaz coeficientul de corelaie Spearman. n funcie de utilizarea
unuia dintre cei doi coeficieni, analiza corelaiei poate fi parametric i,
respectiv, neparametric. Analiza corelaie n general const n calcularea
valorii coeficientului de corelaie i n testarea semnificaiei acestuia la
nivelul populaiei din care a fost extras proba.

Corelaia i regresia

147

Semnificaia unei corelaii se apreciaz independent de puterea


acesteia. Astfel, se poate pune n eviden o corelaie puternic, pozitiv sau
negativ, care ns s nu fie semnificativ i invers, una slab care ns s se
dovedeasc a fi semnificativ.
9.1.1. Analiza corelaiei parametrice
Ca i n cazul celorlalte teste parametrice prezentate n capitolele
anterioare, analiza corelaiei parametrice presupune ca datele s
ndeplineasc urmtoarele condiii:

ES

1. proba trebuie s fie prelevat aleator din populaia cercetat;


2. ambele variabile, i , trebuie s fie apreciate pe o scal de
raport sau de interval;
3. valorile ambelor trebuie variabile s fie aproximativ normal
distribuite;
4. relaia dintre cele dou variabile, dac exist, trebuie s fie liniar.

ZA

FI
R

Liniaritatea relaiei poate fi verificat prin inspectarea graficului de


corelaie n care norul de puncte de coordonate , trebuie s nu fie curbat.
Dac datele nu ndeplinesc condiiile 2, 3, i 4, atunci trebuie
utilizat o analiz neparametric a corelaiei. n cazul n care nu este
ndeplinit numai condiia 4, se poate lua n consideraie i o transformare
care s ndrepte relaia (seciunea 9.2 Abordarea relaiilor curbilinii).
n cazul corelaiei parametrice se calculeaz coeficientul de corelaie
Pearson. Acesta msoar ct de puternic este relaia dintre dou variabile
i , pornind de la covariana lor n prob.
Covariana este o msur a variabilitii legate a dou variabile fa
de mediile lor. Este de fapt media produselor abaterilor celor dou variabile
fa de media fiecreia sau produsul deviaiilor variabilelor. Ca i deviaia
standard i variana, covariana poate fi o statistic a unei probe ( ) sau un
parametru populaional (
). Cnd statistica se folosete ca estimator al
parametrului, atunci suma produselor abaterilor variabilelor se mparte la
numrul gradelor de libertate 1.

148

Elemente de statistic aplicate n ecologie

FI
R

ES

Pentru dou valori x i y, fiecare mai mare dect media sa (


i
), abaterile ( i ) lor vor fi pozitive i produsul lor, tot pozitiv.
Dac o pereche de valori i sunt mai mici dect mediile lor, atunci
ambele abateri vor fi negative. Produsul lor ns va fi pozitiv.
Dac o valoare este mai mic dect , iar o valoare este mai
mare dect , atunci abaterea lui va fi negativ, iar abaterea lui va fi
pozitiv. Ca urmare, produsul abaterilor va fi negativ. La fel se ntmpl
dac x este mai mare dect , iar y este mai mic dect .
Din punct de vedere grafic, produsele abaterilor vor fi pozitive sau
negative n funcie de poziia punctului de coordonate , fa de poziia
punctului de coordonate , , numit i centru mediu (fig. 9.3).

ZA

Figura 9.3. Semnul produselor abaterilor n funcie de poziia fa de centrul mediu

Referindu-ne la datele dintr-o prob, din analiza figurii 9.3 rezult


c, dac majoritatea punctelor de coordonate ,
se vor dispune n
cadranele notate cu + i mai puine puncte se vor afla n cadranele notate
cu , atunci covariana va fi pozitiv. Dac vor predomina punctele din
cadranele negative, iar cele din cadranele pozitive vor fi mai puine, atunci
covariana probei va fi negativ. Deci, fcnd legtura dintre covarian i
coeficientul de corelaie, se poate spune c semnul corelaiei, al
coeficientului, este acelai cu cel al covarianei valorilor dintr-o prob.
Acest lucru este evident i dac suprapunem primele dou grafice din figura
9.1 peste cel din figura 9.3 (fig. 9.4).

Corelaia i regresia
y

149

y
+

y
+

Figura 9.4. Relaia dintre semnul covarianei i cel al corelaiei

ZA

FI
R

ES

Se poate pune urmtoarea ntrebare: dac relaia dintre variabile este


surprins de covariana lor, de ce nu se utilizeaz acest descriptor ( ) n
loc de coeficientul de corelaie ( )? Din perspectiva corelaiei, covariana
prezint un dezavantaj: valoarea sa este influenat de unitile de msur
ale variabilelor i , ceea ce face dificil comparaia. Pentru a elimina
acest neajuns, este nevoie s se realizeze o standardizare a covarianei ( )
prin mprirea acesteia la produsul deviaiilor standard ale celor dou
variabile ( ). Astfel, ctul acestei mpriri va lua valori de la 1 la 1
i va reprezenta coeficientul de corelaie Pearson:

Prin rearanjarea algebric a formulei se obine una mai uor de


folosit n practic:

Odat calculat valoarea coeficientului de corelaie se poate trece la


testarea semnificaiei acestuia care se face sub forma unui test. Testarea
semnificaiei arat n ce msur relaia surprins de coeficientul de corelaie
a probei ( ) este semnificativ la nivel de populaie ( ).

150

Elemente de statistic aplicate n ecologie

n funcie de ntrebarea cu privire la relaia dintre variabile (corelaie


semnificativ, corelaie semnificativ pozitiv i corelaie semnificativ
negativ) la care trebuie s rspund testul se aleg ipotezele ce vizeaz
coeficientul de corelaie n populaie:
Bilateral
:
0
:
0

Unilateral
:
0
:
0

:
:

0
0.

ZA

FI
R

ES

Primul set de ipoteze se folosete dac se dorete evidenierea unei


corelaii semnificative n populaia din care s-a extras proba, fr a se
preciza semnul acesteia. Dac se urmrete punerea n eviden a unei
corelaii pozitive semnificative, se utilizeaz al doilea set de ipoteze, iar n
cazul n care se urmrete semnificaia unei corelaii negative, se folosete
ultimul set de ipoteze.
Statistica testului este una de tip Student ( ) i se calculeaz cu
ajutorul numrului de perechi de valori
i
( ) i cu valoarea
coeficientului de corelaie Pearson ( ):

Condiia testului este similar cu cea a unui test , cu meniunea c


valoarea critic se alege n funcie de i de numrul gradelor de libertate
2.
Dac | |
1 .

se respinge,

se accept pentru

Coeficientul de determinare
Valoarea coeficientului de corelaie Pearson ridicat la ptrat
reprezint o statistic util a datelor. Acesta arat proporia n care
variabilitatea uneia dintre cele dou variabile poate fi pus pe seama
variabilitii celeilalte. Coeficientul de determinare reprezint o proporie,
dar dac se nmulete cu 100, rezult procentul de valori ale celor dou
variabile care sunt realmente corelate. De exemplu, dac pentru dou

Corelaia i regresia

151

variabile oarecare
0,81, nseamn c 81% din valorile celor dou
variabile sunt realmente corelate. Coeficientul de determinare poate fi
considerat un descriptor standardizat al puterii corelaiei dintre dou
variabile.
Exemplul 9.1. La 24 de indivizi de viper de step extrai aleatoriu
din populaie s-a determinat lungimea trunchiului i greutatea. Exist o
corelaie pozitiv semnificativ ntre cele dou variabile?
3
153
3,6
15
390
33,5

4
146
3,8
16
373
38,4

5
164
4
17
425
40

6
66
4,5
18
450
41

7
160
4,7
19
389
46,3

8
215
9,3
20
422
49,8

9
228
10,5
21
418
53,3

2
150
3,6
14
430
30

1
49
2,5
13
340
22

ES

Nr. crt.
cm (x)
g (y)
Nr. crt.
cm (x)
g (y)

10
222
10,9
22
435
57

11
260
14
23
459
72,2

12
325
21
24
470
76,7

FI
R

Inspectarea graficului de corelaie arat o relaie uor curb ntre cele


dou variabile, ceea ce nseamn c ultima condiie de aplicare a corelaiei
parametrice nu este respectat.

90
70
60
50

ZA

80

40
30
20
10
0

100

200

300
x

400

500

152

Elemente de statistic aplicate n ecologie

n urma logaritmrii valorilor i n diferite combinaii se observ


c logaritmarea doar a valorilor greutilor ndreapt cel mai bine relaia
dintre cele dou variabile.
9
10
11
12
228 222 260 325
2,351 2,389 2,639 3,045
21
22
23
24
418 435 459 470
3,976 4,043 4,279 4,340

FI
R

ES

5
4.5
4
3.5
3
2.5
2
1.5
1
0.5
0

y'=ln(y)

Nr, crt,
1
2
3
4
5
6
7
8
49
150 153 146 164
66
160 215
x
y=ln(y) 0,916 1,281 1,281 1,335 1,386 1,504 1,548 2,230
Nr, crt, 13
14
15
16
17
18
19
20
340 430 390 373 425 450 389 422
x
y=ln(y) 3,091 3,401 3,512 3,648 3,689 3,714 3,835 3,908

100

200

300

ZA

400

500

n continuare, se calculeaz valoarea coeficientului de corelaie


Pearson dintre lungime i greutatea transformat:

,
,

0,975 .

Valoarea coeficientului arat c este vorba de o corelaie pozitiv


foarte puternic. Puterea corelaiei mai poate fi reflectat i de valoarea
coeficientului de determinare:
0,975

0,95 .

Corelaia i regresia

153

Valoarea coeficientului de determinare arat c 95% din valorile


celor dou variabile sunt realmente corelate.
Pentru a afla dac aceast corelaie evideniat la nivel de prob este
semnificativ i la nivel de populaie, trebuie efectuat testul de semnificaie
a corelaiei. Avnd n vedere modul de formulare a ntrebrii problemei,
ipotezele testului sunt:
:
:

0
0.

20,54 .

ES

0,975

Se calculeaz statistica testului:

Se afl valoarea critic pentru un test unilateral (anexa 2 sau 3):


1,717 .

FI
R

ZA

Statistica testului este mai mare dect valoarea critic, deci se


respinge ipoteza nul i se accept ipoteza alternativ pentru o probabilitate
de 0,95 sau n 95% din cazuri.
Probabilitatea ca ipoteza nul s fie adevrat poate fi calculat
(anexa 3). Aceast probabilitate este foarte mic (3,8 10 ).
Concluzia testului este c exist o corelaie pozitiv i semnificativ
ntre lungimea corpului i greutate n populaia de vipere de step
investigat.
9.1.2. Analiza corelaiei neparametrice
n cazul n care datele nu respect condiiile corelaiei parametrice (x
i/sau y sunt apreciate pe o scal ordinal, valorile x i/sau y din prob nu
sunt aproximativ normal distribuite, relaia dintre variabile nu este liniar),
atunci se va calcula coeficientul de corelaie neparametric Spearman.
Acest coeficient, notat cu
pentru prob i pentru populaie, a
fost obinut prin prelucrarea formulei coeficientului Pearson cnd n loc de

154

Elemente de statistic aplicate n ecologie

ES

datele brute se folosesc rangurile acestora. Deci exist o legtur strns


ntre cei doi coeficieni.
Pentru a putea calcula valoarea este nevoie ca mai nti s se dea
ranguri valorilor lui ( ) i valorilor lui ( ), separat. Algoritmul de
acordare a rangurilor este similar cu cel folosit n celelalte teste
neparametrice (seciunea 2.1, tab. 2.3). Ulterior, se calculeaz diferenele
dintre rangurile corespunztoare fiecrei perechi de valori i , originale
), iar fiecare diferen se ridic la puterea a doua ( ). Ptratele
(
tuturor diferenelor se nsumeaz obinndu-se suma ptratelor diferenelor
( ). Formula de calcul a coeficientului Spearman include suma ptratelor
diferenelor i numrul perechilor de valori i ( ):

ZA

FI
R

Valoarea coeficientului Spearman are aceleai proprieti


informaionale ca i cea a coeficientului Pearson: ia valori ntre 1 i 1,
semnul valorii indic, dup caz, o corelaie pozitiv sau negativ; o valoare
egal cu 1 sau 1 semnific o corelaie maxim, n timp ce una egal cu 0
arat absena corelaiei; apropierea valorii de
1indic o corelaie
puternic, n timp ce o valoare mai apropiat de 0, o corelaie slab.
Testarea semnificaiei n analiza corelaiei neparametrice se face la
fel ca n cazul corelaiei parametrice, cu deosebirea c la calcularea
statisticii testului ( ) n loc de valoarea coeficientului Pearson ( ) se
folosete valoarea coeficientului Spearman ( ):
.
Coeficientul Spearman pierde din precizie dac exist un numr
relativ mare de valori egale. n general, dac mai mult de jumtate din
ranguri au valori egale, atunci se recomand calcularea coeficientului de
corelaie a rangurilor conform formulei lui Pearson, n care se nlocuiesc
valorile originale cu rangurile acestora.

Corelaia i regresia

155

Exemplul 9.2. S se rezolve problema de la exemplul 9.1


considerndu-se c datele nu ndeplinesc condiiile de aplicare ale corelaiei
parametrice.
Pentru calcularea coeficientului de corelaie parametric trebuie date
ranguri valorilor originale ale lungimii i greutii, dup care se calculeaz
suma ptratelor diferenelor dintre rangurile fiecrei perechi , :

ZA

0
1.5
2.5
-1
2
-4
-1
0
1
-1
0
0
0
6
1
-2
2
4
-4
-2
-4
-1
0
0

Se calculeaz coeficientul de corelaie Spearman:


1

0,943 .

0
2,25
6,25
1
4
16
1
0
1
1
0
0
0
36
1
4
4
16
16
4
16
1
0
0
130,5

1
2,5
2,5
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

1
4
5
3
7
2
6
8
10
9
11
12
13
20
16
14
19
22
15
18
17
21
23
24

ES

2,5
3,6
3,6
3,8
4
4,5
4,7
9,3
10,5
10,9
14
21
22
30
33,5
38,4
40
41
46,3
49,8
53,3
57
72,2
76,7

FI
R

49
150
153
146
164
66
160
215
228
222
260
325
340
430
390
373
425
450
389
422
418
435
459
470

156

Elemente de statistic aplicate n ecologie

Acest rezultat arat c este vorba de o corelaie pozitiv foarte


puternic.
30
25
20
Ry 15
10

10

15

25

30

ES

Rx

20

FI
R

Pentru testarea semnificaiei se aplic testul la fel ca n exemplul 9.1.


Se scriu ipotezele testului:
:
0
:
0.

ZA

Se calculeaz statistica testului:

0,943

13,324 .

Se afl valoarea critic pentru testul unilateral (anexa 2 sau 3):


,

1,717 .

13,324 1,717
probabilitate de 0,95.

se respinge i se accept

pentru o

Probabilitatea ipotezei nule (anexa 3) este de 2,6 10 .


Concluzia testului este c exist o corelaie pozitiv semnificativ
ntre lungimea i greutatea viperelor de step din populaia studiat.

Corelaia i regresia

157

9.2. ANALIZA REGRESIEI

Analiza regresiei este similar n unele aspecte cu analiza corelaiei,


dar este diferit de aceasta prin faptul c presupune o relaie de tip cauzefect ntre variabila independent, aflat sub controlul cercettorului, i cea
dependent.
n esen, se presupune c ar exista o relaie funcional care permite
prezicerea unei valori a variabilei
corespunztoare unei valori date a
variabilei independente , adic:

eroarea aleatoare.

ES

n cazul regresiei liniare simple, relaia are urmtoarea form:

ZA

FI
R

media populaional a valorilor corespunztoare unei valori


coeficient de regresie nlimea dreptei de regresie
coeficient de regresie panta dreptei de regresie.

y=+x

x
y

Figura 9.5. Explicaia grafic a funcie regresiei liniare

158

Elemente de statistic aplicate n ecologie

Analiza regresiei presupune urmtoarele aspecte:

1. Regresia este folosit pentru aproximarea unei ecuaii ce descrie


relaia liniar dintre 2 variabile. Aceasta se numete ecuaie sau
funcie de regresie. Parametrii i pot fi estimai pe baza unei
probe din populaie.
2. Pe baza ecuaiei se poate construi o dreapt de regresie.
3. Ecuaia de regresie poate fi folosit pentru aflarea valorilor
variabilei dependente ( ) corespunztoare valorilor variabilei
independente ( ).
4. Regresia poate fi folosit pentru a surprinde msura n care
variabila dependent se afl sub controlul variabilei independente.

ES

Analiza regresiei presupune o serie de condiii:

ZA

FI
R

1. Variabila independent ( ) este fixat, adic valorile acesteia sunt


alese arbitrar i nu aleator din populaie.
2. Pentru orice valoare a variabilei independente ( ) exist o
populaie normal distribuit de valori ale variabilei dependente
.
( ). Media populaional a valorilor lui este:
3. Din condiia 2 rezult c pentru oricare valoare exist o valoare
particular :
4.
.
5. reziduu sau eroare ntmpltoare; arat msura n care o
valoare observat a lui difer de media valorilor lui ( ); are
o distribuie normal standard.
6. Varianele variabilei pentru toate valorile variabilei sunt egale.
7. Observaiile sunt independente, adic fiecare pereche de valori
, provin prin investigarea unei singure uniti de prob.
Dac prima condiie nu este ndeplinit, atunci analiza regresiei nu
poate fi aplicat. n schimb, s-ar putea folosi analiza corelaiei.
Estimarea funciei i dreptei de regresie
Coeficienii de regresie, adic parametrii funciei, se estimeaz
pornind de la o prob, astfel i vor fi estimai prin i, respectiv, .

Corelaia i regresia

159

ZA

FI
R

ES

Dreapta descris de estimatorii i reprezint linia care se potrivete cel


mai bine funciei de regresie i care se mai numete i dreapt de regresie
estimat. Avnd n vedere c ecuaia definete dreapta, estimarea acestora
se va face n paralel.
Dreapta de regresie va trece ntotdeauna prin punctul de coordonate
, . Dac pe orizontala ce trece prin acest punct se traseaz perpendiculare
din fiecare punct de coordonate , , atunci fiecare perpendicular va
reprezenta abaterea valorilor lui
fa de , adic . Suma acestor
abateri va fi aproximativ egal cu 0, dar suma ptratelor abaterilor va fi ns
mai mare dect 0 (
0;
0). Deci se obine suma
ptratelor abaterilor lui fr a se ine cont de valorile lui (fig. 9.6).

Figura 9.6. Variaia variabilei dependente cnd variabila independent nu este luat
n consideraie

S presupunem c orizontala poate pivota n jurul punctului ,


astfel nct distanele de la valorile lui la dreapt s fie minime sau suma
ptratelor abaterilor valorilor lui fa de linie s fie minim (metoda celor
mai mici ptrate). Corespondenta unei anumite valori
pe dreapt se
noteaz cu . Abaterea valorilor fa de linie va fi egal cu . Suma
ptratelor abaterilor lui fa de linie, cnd se ine cont i de valorile lui ,
va fi mai mic dect cea precedent, adic
concluzie, incertitudinea lui a fost redus prin luarea lui


. n
n consideraie.

160

Elemente de statistic aplicate n ecologie

ES

Diferena dintre o valoare i corespondenta sa pe dreapta de regresie este

;
are o distribuie normal i media egal cu 0, adic are o
distribuie normal standard (fig. 9.7).

FI
R

Figura 9.7. Variaia variabilei dependente cnd variabila independent este luat n
consideraie

ZA

Estimarea funciei (ecuaiei) de regresie


Se calculeaz coeficienii de regresie i conform formulelor:

Estimarea funciei de regresie este:


.
Cu ajutorul funciei de regresie se calculeaz valorile
corespunztoare fiecrei valori . Trasarea dreptei de regresie se face unind
punctele de coordonate , .

Corelaia i regresia

161

Testarea semnificaiei funciei de regresie


Semnificaia ecuaiei de regresie estimate se face sub forma unei
analize a varianei (ANOVA).
Principiul de descompunere a variabilitii este urmtorul: variana
total ( ) este dat de variana extern sau de regresie (
) plus variana
intern sau rezidual (
):
.

ES

Ipotezele testului sunt similare cu cele de la corelaie, doar c n


cazul regresiei se testeaz coeficientul de regresie (panta sau nclinaia
dreptei) pentru populaia din care a fost prelevat proba. Dac este zero,
atunci nseamn c variabila nu este dependent de (aceast proprietate
a lui este similar cu cea a coeficientului de corelaie populaional ).

FI
R

H0: =0
H1: 0

), suma de
), conform

ZA

n continuare se calculeaz suma de ptrate total (


) i suma de ptrate intern (
ptrate extern (
formulelor:

Se calculeaz sumele de ptrate medii ( ) ca raportul dintre sumele


de ptrate ( ) i gradele de libertate corespunztoare ( ). Gradele de
libertate externe reprezint diferena dintre numrul variabilelor considerate
( ) din care se scade 1. Gradele de libertate totale reprezint numrul
perechilor de valori , ( ) minus 1. Gradele de libertate interne se afl la
fel ca i suma de ptrate intern, adic din numrul gradelor de libertate
totale se scad cele externe ( 1
1 ). Raportul dintre suma de
ptrate medie extern i cea intern reprezint statistica testului ( ).

162

Elemente de statistic aplicate n ecologie

Sursa de variabilitate
Extern
Intern
Total

Condiia testului const n compararea statisticii testului ( ) cu o


valoare critic pentru un anumit nivel de ncredere i gradele de libertate
externe ( 1) i interne ( ).
Dac
1 .

se respinge,

se accept pentru

ZA

FI
R

ES

Intervalul de confiden al coeficientului de regresie


Coeficientul de regresie n prob b este o estimare a coeficientului de
regresie populaional . Deci
i
sunt diferii, dar se poate calcula
intervalul de confiden pentru cu ajutorul erorii standard a lui ( ):

Limitele inferioar ( ) i cea superioar (


confiden a lui se vor afla prin calcularea relaiei:

) ale intervalului de

,
,
,

n concluzie, intervalul
include coeficientul de regresie
populaional , cu o probabilitate de 1 sau 100 1 .
Coeficientul de determinare
Se tie c variana lui
poate fi explicat n bun msur de
cunoaterea variabilei , totui o parte rmne neexplicat. Este vorba de

Corelaia i regresia

163

variana intern. Dac valorile lui ar fi complet dependente de valorile lui


, atunci erorile aleatoare ( ) ar fi egale cu zero, adic toate punctele de
coordonate , ar fi exact pe dreapta de regresie.
n cazul analizei regresiei, coeficientul de determinare ( ) arat
proporia varianei lui explicat prin dependena de .
Formula de calcul a lui
este la fel ca n cazul analizei corelaiei.
Totui, pentru a simplifica calculul i pentru a folosi valori deja calculate n
etapele anterioare ale analizei regresiei,
se poate calcula i dup
urmtoarea formul:

FI
R

ES

Ca i n cazul analizei corelaiei, valoarea coeficientului de


determinare se poate nmuli cu 100 pentru a obine un procent, care, n
analiza regresiei, arat ct la sut dintre valorile lui sunt dependente sau
determinate de valorile lui . Diferena 100 % arat variana individual
sau rezidual care nu poate fi explicitat de valorile lui .

ZA

Zona de confiden a dreptei de regresie


Limitele de confiden ale dreptei de regresie se pot afla calculnd
eroarea standard pentru fiecare punct de coordonate , de pe dreapt,
pentru fiecare valoare a lui
din prob. Pentru fiecare valoare
se
calculeaz eroarea standard :

Limitele inferioar ( ) i superioar ( ) ale intervalului de


confiden a fiecrui corespunztor unei valori din prob se calculeaz
pornind de la relaia:

,
,
,

164

Elemente de statistic aplicate n ecologie

Concluzia va fi c intervalele - pentru fiecare valoare x includ


mediile populaiilor de valori ( ) cu o probabilitate de 1 .
Unirea limitelor inferioare ntre ele i a celor superioare ntre ele,
obinute pentru fiecare valoare , duce la reprezentarea grafic a zonei de
confiden a dreptei n ansamblu (fig. 9.8). Deci dreapta de regresie n
populaia din care s-a extras proba se poate gsi ntre liniile ce unesc
limitele inferioare i cele superioare, cu o probabilitate de 1 .

FI
R

ES

Limitele de confiden ale unei estimri individuale


Estimarea unei valori pentru o valoare individual x care nu se
regsete n prob poate fi afectat de o surs de eroare adiional, anume de
mprtierea fa de dreapt. Astfel, intervalul de confiden pentru o
valoare va fi mai larg dect cel al dreptei de regresie. Intervalul se afl
folosind relaiile de mai sus, doar c se modific formula erorii standard a
unui punct de pe dreapt prin adugarea unei uniti la valoarea dintre
parantezele ptrate.
1

ZA

Limita inferioar ( ) i cea superioar ( ) a intervalului de


confiden pentru o valoare corespunztoare unei valori x din prob se
calculeaz pornind de la relaia:

,
,
,

Concluzia va fi c intervalul - pentru o valoare include media


populaiei de valori ( ) cu o probabilitate de 1 .
Unirea limitelor inferioare ntre ele i a celor superioare ntre ele,
obinute pentru fiecare valoare , duce la reprezentarea grafic a zonei de
confiden pentru estimarea lui pornind de la o valoare unic (fig. 9.8).

Corelaia i regresia

165

zona de confiden a
dreptei de regresie

intervalul de confiden al lui


pentru o singur valoare x

ES

Figura 9.8. Zona de confiden a dreptei de regresie i pentru o valoare unic

ZA

FI
R

Abordarea relaiilor neliniare


Numeroase relaii dintre variabile biologice nu sunt rectilinii. Un
exemplu n acest sens l constituie creterea populaiilor i relaia dintre
mortalitate i vrst.
n astfel de cazuri, relaiile curbilinii pot fi ndreptate prin
transformarea datelor (seciunea 4.5 Transformarea datelor).
La nceput trebuie observat care din cele dou variabile trebuie
transformat. Aceasta se poate face prin ncercri repetate, adic prin
reprezentarea grafic a corelaiei cu cte o variabil transformat sau cu
amndou.
pentru fiecare transformare
O alt modalitate const n calcularea
alternativ ( , ; , ; , ; , ). Transformarea care va duce la obinerea
valorii celei mai mari a va fi folosit n analiza regresiei.
Transformarea variabilelor determin i modificarea funciei:
dac
dac

, atunci
i
i
, atunci

;
.

Dac se apeleaz la o transformare a datelor, se impune n final o


transformare invers a rezultatelor (coeficieni de regresie, limitele
intervalelor de confiden).

166

Elemente de statistic aplicate n ecologie

Exemplul 9.3. S se afle dac exist o relaie de tip cauz-efect


semnificativ ntre lungimea i greutatea viperelor din exemplul 9.1,
considernd c proba a fost selectat astfel nct indivizii s aib anumite
greuti. S se estimeze intervalul de confiden al greutii pentru un
individ la care lungimea este de 30 .
Deoarece existena unei relaii liniare reprezint o condiie a
regresiei, se vor lua n consideraie valorile transformate prin logaritmare ale
greutii.
n continuare se estimeaz coeficienii funciei de regresie:

ZA

xy
44,898
192,140
195,983
194,910
227,352
99,269
247,610
479,453
536,114
530,305
686,155
989,470
1050,954
1462,515
1369,503
1360,725
1567,774
1671,107
1491,870
1649,182
1661,941
1758,727
1964,263
2039,754
23471,976

ln(g) (y)
0,916
1,281
1,281
1,335
1,386
1,504
1,548
2,230
2,351
2,389
2,639
3,045
3,091
3,401
3,512
3,648
3,689
3,714
3,835
3,908
3,976
4,043
4,279
4,340
67,341
2,806
4534,757
218,368

ES

cm (x)
49
150
153
146
164
66
160
215
228
222
260
325
340
430
390
373
425
450
389
422
418
435
459
470
7139
297,458
50965321
2546985

FI
R

Nr. Crt.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Suma
Media
(Suma)2
Suma de ptrate

Corelaia i regresia

167

0,00813

2,806

0,00813 297,458

0,3886 .

Deci ecuaia dreptei de regresie sau funcia de regresie este:


0,3886

0,00813 .

Estimarea funciei de regresie se face prin ANOVA. Ipotezele


testului sunt:

29,42

FI
R

218,368

ES

Se calculeaz sumele de ptrate:

H0: =0
H1: 0 .

27,96

0,00813 23471,976
29,42 27,96 1,46 .

ZA

Se calculeaz numrul gradelor de libertate:

24 1 23
2 1 1
24 2 22 .

Se calculeaz sumele de ptrate medii:


,

27,96

Se calculeaz statistica testului:


,
,

422,05 .

0,0663 .

168

Elemente de statistic aplicate n ecologie

Se completeaz tabelul Anova:


Sursa de variabilitate

Extern
27,96 1 27,96 422,05
Intern
1,46 22 0,0663

Total
29,42 23

Se afl valoarea critic (anexa 2 sau 3):


,

4,301 .

, ,

FI
R

ES

Statistica testului este mai mare dect valoarea critic, deci se


respinge ipoteza nul i se accept ipoteza alternativ pentru o probabilitate
de 0,95. Probabilitatea calculat a ipotezei nule pentru statistica testului
(anexa 3) este 7,6 10 .
Concluzia testului este c exist o relaie de tip cauz-efect
semnificativ ntre cele dou variabile, definit de funcia de regresie
estimat.

ZA

Cu ajutorul funciei de regresie se pot calcula valorile estimate


pentru valorile . Prin punctele de coordonate , se poate trasa dreapta de
regresie. Valoarea pentru prima valoare
49 se calculeaz astfel:
0,00813 49

0,7868 .

0,3886

La fel se procedeaz i pentru celelalte valori ale variabilei .


Pentru a construi zona de confiden a dreptei de regresie trebuie
reprezentate grafic limitele intervalului de confiden ale mediei populaiei
de valori corespunztoare fiecrei valori . Pentru aceasta este nevoie s
se afle valoarea critic , , (anexa 2 sau 3):
,

2,074 .

Limitele intervalului de confiden pentru prima valoare


calculeaz astfel:

49 se

Corelaia i regresia

169

0,7868

2,074 0,0663

0,7868

2,074 0,0663

0,5557
,

1,0179 .

La fel se procedeaz i pentru celelalte valori ale variabilei .

1,0179
1,7704
1,7929
1,7403
1,8758
1,1439
1,8456
2,2640
2,3644
2,3180
2,6147
3,1410
3,2660
4,0369
3,6907
3,5451
3,9934
4,2114
3,6821
3,9673
3,9326
4,0804
4,2902
4,3866

0,5557
1,4448
1,4709
1,4098
1,5669
0,7060
1,5320
2,0075
2,1185
2,0673
2,3882
2,9184
3,0372
3,7290
3,4251
3,2944
3,6912
3,8795
3,4174
3,6686
3,6383
3,7667
3,9470
4,0294

0,1114
0,0785
0,0776
0,0797
0,0745
0,1056
0,0756
0,0618
0,0593
0,0604
0,0546
0,0537
0,0552
0,0742
0,0640
0,0604
0,0728
0,0800
0,0638
0,0720
0,0710
0,0756
0,0827
0,0861

ES

0,7868
1,6076
1,6319
1,5751
1,7213
0,9249
1,6888
2,1358
2,2414
2,1927
2,5015
3,0297
3,1516
3,8829
3,5579
3,4197
3,8423
4,0455
3,5498
3,8179
3,7854
3,9236
4,1186
4,2080

FI
R

ln(g) ( )
0,9163
1,2809
1,2809
1,3350
1,3863
1,5041
1,5476
2,2300
2,3514
2,3888
2,6391
3,0445
3,0910
3,4012
3,5115
3,6481
3,6889
3,7136
3,8351
3,9080
3,9759
4,0431
4,2794
4,3399

ZA

cm ( )
49
150
153
146
164
66
160
215
228
222
260
325
340
430
390
373
425
450
389
422
418
435
459
470

Pentru a afla intervalul de confiden al mediei populaiei de valori


pentru
300 se calculeaz relaiile:
0,3886

0,00813 300

2,8265

170

Elemente de statistic aplicate n ecologie

2,8265

2,074 0,0663 1

2,2295
2,8265

2,074 0,0663 1

3,4235 .

9,2956

30,6760 .

ES

16,8864

Valorile obinute sunt modificate de transformarea iniial a


greutilor. Pentru a obine valorile n grame este necesar transformarea
invers (anexa 3) a valorilor obinute:

FI
R

Concluzia este c o viper de 300


poate avea o greutate ntre
9,3 i 30,7 cu o probabilitate de 0,95 sau n 95% din cazuri.
4.5

ZA

3.5

2.5

y'=ln(y)

Li

1.5

Ls
300 cm

1
0.5
0

100

200

300
x

400

500

10. ANALIZA FRECVENELOR I A DATELOR


NOMINALE

ZA

FI
R

ES

Numeroase cercetri ecologice presupun numrarea i clasificarea


lucrurilor folosind diferite scale nominale, cum ar fi speciile, culorile,
habitatele etc. Din aceast cauz tehnicile statistice care analizeaz
frecvenele sunt deosebit de utile. Metoda clasic de analiz a frecvenelor
. Statistica testului este comparat cu distribuia . Acesta
este testul
este o distribuie a varianei probei. Distribuia
este asimetric fa de
variana populaional ( ). Partea stng a distribuiei ajunge la 0, n timp
ce cea dreapt poate atinge, teoretic, infinitul. Cu ct numrul gradelor de
libertate crete, cu att distribuia devine mai simetric, iar n cazul probelor
cu mai mult de 100 de uniti de prob (
100) distribuia tinde s devin
normal.
mprirea frecvenelor la numrul total de observaii duce la
transformarea distribuiei frecvenelor ntr-o distribuie a probabilitilor.
Standardizarea axei orizontale prin nmulirea varianei cu numrul gradelor
de libertate i mprirea produsului la variana populaiei duce la obinerea
distribuiei .
1 gl
3 gl

10 gl

s2
Figura 10.1. Distribuia varianei probei pentru 1, 3 i 10 grade de libertate

172

Elemente de statistic aplicate n ecologie

p
9 gl
p=0,05

p=0,95

ES

16,92

FI
R

Figura 10.2. Distribuia 2 cu zona de respingere a ipotezei nule pentru o probabilitate


de 0,05

ZA

pot fi pentru omogenitate, asociere, independen i de


Testele
concordan. Principiul acestor teste este acelai: frecvenele observate sunt
comparate cu cele calculate teoretic sau estimate. Dac ntre frecvenele
observate i cele estimate exist o diferen semnificativ, atunci statistica
va fi mai mare dect valoarea critic pentru gradele de libertate
respective, caz n care
se respinge, iar
se accept n consecin cu
1
.
Distribuia este una asimetric. O diferen mare ntre frecvenele
observate i cele estimate va conduce la o valoare a
plasat n coada din
dreapta a distribuiei. Dac ns se obine o valoare
foarte mic plasat n
coada stng (redus) a distribuiei, aceasta arat c frecvenele observate
concord foarte bine cu cele teoretice. Dat fiind faptul c sunt anse reduse
s se obin valori foarte mici sau foarte mari, n practic interesul const
doar n a arta absena concordanei.
Dificultatea testului nu const att n calcularea statisticii acestuia,
ct n calcularea frecvenelor estimate (teoretice). Acestea se pot afla
pornind de la datele din prob sau pe baza unui model matematic.

Analiza frecvenelor i a datelor nominale

10.1. TESTUL

173

DE CONCORDAN

Acesta verific dac distribuia frecvenelor observate n probe


concord sau nu ntr-o oarecare msur cu o distribuie teoretic, cum ar fi
Poisson, binomial sau normal, sau cu orice alt tip specificat de distribuie.
Testul de concordan verific ct de bine se potrivete un set de
frecvene observate aparinnd la dou sau mai multe categorii distincte cu o
anumit distribuie ateptat. Testul este neparametric i necesit doar
observaii nominale sau sub form de frecvene.

Testul se folosete dac datele ndeplinesc urmtoarele condiii:

FI
R

ES

1. Variabila trebuie s fie nominal; categoriile scalei nominale ale


cror frecvene sunt urmrite trebuie s nu se suprapun.
2. Observaiile sunt independente.
3. Frecvenele estimate trebuie s fie mai mari sau egale cu 5 sau,
dac exist mai multe categorii, 80% dintre acestea trebuie s aib
frecvenele estimate mai mari sau egale cu 5.

ZA

Dac a treia condiie nu este ndeplinit, categoriile cu frecvenele


estimate mai mici de 5 se reunesc ntr-o singur categorie pn cnd
frecvena estimat a acesteia egaleaz sau depete valoarea 5. Aceasta
determin o reducere corespunztoare a gradelor de libertate.
Ipotezele testului sunt:
: frecvenele observate nu difer semnificativ de cele estimate;
: frecvenele observate difer semnificativ de cele estimate.

Statistica testului se calculeaz n funcie de frecvenele observate


( ) i cele estimate ( ):

Dac
probabilitate de 1

.
,

(100

se respinge i se accept
1
%).

pentru o

174

Elemente de statistic aplicate n ecologie

1
numrul categoriilor (claselor de frecven)
numrul parametrilor populaionali estimai.

FI
R

ES

Dac frecvenele teoretice se obin prin folosirea modelului Poisson,


atunci
1 deoarece se estimeaz media populaiei necesar calculului
probabilitii n aceast distribuie (seciunea 4.2), iar dac se folosete
modelul binomial sau binomial negativ, atunci
2 deoarece se estimeaz
i (seciunile 4.1 i, respectiv, 4.3).
Cnd exist doar dou categorii de distribuie, atunci vom avea 1
grad de libertate (
1), iar statisticii testului i se aplic corecia Yates
pentru continuitate. Aceasta nltur posibilitatea obinerii unor valori prea
mari ale statisticii testului. Corecia const n scderea valorii 0,5 din
valoarea absolut a diferenei dintre frecvena observat i cea teoretic a
fiecrei componente a formulei lui . Astfel, formula devine:

ZA

Exemplul 10.1. ntr-o prob extras aleator de pe fundul unui bazin


acvatic au fost identificate 16 larve ale unei specii de chironomid. Larvele
au fost crescute pn la stadiul de adult, dup care s-a determinat sexul
indivizilor, rezultnd 12 masculi i 4 femele. Exist o diferen
semnificativ ntre raportul dintre sexe (sex ratio) observat i cel de 1:1?
Sexul este o variabil nominal ale crei categorii se exclud reciproc.
Observaiile sunt independente. Dac sex ratio ar fi egal cu 1, atunci
frecvenele estimate ale celor dou sexe ar trebui s fie egale, adic din 16
indivizi, 8 ar trebui s fie masculi, iar 8 s fie femele. Putem concluziona c
datele ndeplinesc condiiile de aplicare ale testului 2 de concordan.
Ipotezele n cazul exemplului sunt urmtoarele:
: sex ratio este egal cu 1, adic
: sex ratio este diferit de 1.

1: 1;

Analiza frecvenelor i a datelor nominale

175

Frecvene
observate ( )
12
4
16

Masculi
Femele
Total

Frecvene
estimate ( )
8
8
16

Cum sunt doar dou categorii de frecvene (dou valori ale


variabilei) nseamn c numrul gradelor de libertate va fi 1. Ca urmare,
trebuie aplicat formula cu corecia pentru continuitate.
,

3,0625

FI
R

ES

Valoarea critic
3,84 (anexa 2 sau 3). Deoarece statistica
, ,
testului este mai mic dect valoarea critic, nu se poate respinge ipoteza
nul pentru
0,05. Probabilitatea ca ipoteza nul s fie adevrat (anexa
3) este 0,08, adic mai mare dect pragul de confiden de 0,05.
Concluzia testului este c nu exist o deosebire semnificativ ntre
sex ratio observat i cel teoretic de 1:1.

ZA

Exemplul 10.2. Pornind de la datele i rezultatele din exemplul 4.6


s se verifice semnificaia concordanei dintre frecvenele estimate i cele
teoretice.

Era vorba de densitatea indivizilor unei specii de arpe din 100 de


suprafee de prob. Indicele de dispersie indic o dispersie aleatoare. S-au
calculat frecvenele observate pe baza probabilitilor estimate conform
distribuiei Poisson.
Dac primele condiii de aplicare a testului
de concordan sunt
ndeplinite, se observ c ultima nu este ndeplinit frecvenele estimate
pentru valorile 6, 7 i 8 sunt mai mici dect valoarea 5. Pentru a putea
continua testul se impune nsumarea frecvenelor, att observate, ct i
estimate, corespunztoare acestor valori. Ca urmare, frecvenele estimate i
cele teoretice se prezint astfel:

176

Elemente de statistic aplicate n ecologie

7
16
25
18
16
10
5
2
1

5,727
16,379
23,422
22,329
15,965
9,132
4,353
1,778
0,636

0
1
2
3
4
5
6+7+8

7
16
25
18
16
10
8

5,727
16,379
23,422
22,329
15,965
9,132
6,767

0
1
2
3
4
5
6
7
8

FI
R

ES

Statistica testului se poate afla calculnd valoarea raportului pentru


fiecare pereche de frecvene, dup care se nsumeaz.

,
,

1,544

ZA

Numrul gradelor de libertate se reduce datorit nsumrii ultimelor


trei clase de frecven. Astfel, din numrul de clase redus se scade 1 (a fost
estimat media populaional prin media probei pentru calcularea funciei
distribuiei Poisson) i nc 1:
1

5.

Valoarea critic n cazul acestui exemplu (anexa 2 sau 3) este


11,07. Deoarece statistica testului este mai mic dect valoarea
, ,
critic, se accept ipoteza nul pentru
0,95. Probabilitatea ca ipoteza
nul s fie adevrat (anexa 3) este 0,91, adic foarte mare.
Conform ipotezei nule nu exist o diferen semnificativ ntre
frecvenele observate i cele estimate conform distribuiei Poisson.
Cum distribuia Poisson descrie probabilitatea de apariie a unor
fenomene aleatoare, iar distribuia frecvenelor observate nu difer
semnificativ de aceast distribuie, se poate concluziona c distribuia
indivizilor din populaia cercetat este aleatoare, cu o probabilitate de 0,95.

Analiza frecvenelor i a datelor nominale

177

n exemplul 4.6 spuneam c exist o asemnare evident ntre


de
frecvenele observate i cele estimate. Prin realizarea testului
concordan s-a completat rezolvarea problemei, n sensul c se poate
specifica faptul c asemnarea sesizat anterior este semnificativ pentru un
anumit nivel de ncredere.
10.2. TESTUL

DE ASOCIERE

FI
R

ES

n analiza concordanei dintre frecvenele observate i cele calculate


teoretic, era urmrit o singur variabil a crei valori apreciate pe o scal
nominal reprezentau categorii de frecven. Exist ns situaii n care se
folosesc dou variabile. De exemplu, un individ poate fi clasificat n funcie
de sex i clas de vrst, specie i habitat etc. n astfel de cazuri, frecvenele
se distribuie pe dou sau mai multe rnduri, rezultnd aa-numitul tabel sau
matrice de contingen. Acestea permit investigarea asocierii dintre
variabile. Unul dintre cele mai frecvent utilizate teste care verific
semnificaia asocierii dintre variabilele apreciate pe o scal nominal este
testul
de asociere. Acesta reprezint echivalentul corelaiei pentru
variabilele nominale.

ZA

Condiii de aplicare:

1. Datele trebuie s fie sub form de frecvene.


2. Observaiile sunt independente (o unitate de prob poate ocupa o
singur poziie n matricea de contingen).
3. 80% dintre frecvenele estimate trebuie s fie mai mari sau egale
cu 5 i nici o frecven estimat s nu fie 0; deci, pentru o matrice
de contingen de 2 2, toate celulele trebuie s aib o valoare
calculat teoretic mai mare sau egal cu 5.
Ipotezele testului sunt:
: nu exist asociere ntre variabile
: exist asociere ntre variabile.

178

Elemente de statistic aplicate n ecologie

Datele se aranjeaz ntr-un tabel cu dou intrri, numit i matrice de


contingen:
Variabila

(Coloan)
( )
(

Valori
( )
( )

(Rnd)

Total pe coloan (

Total pe rnd (

Total general (

Valorile teoretice se calculeaz pentru fiecare celul n parte. De


exemplu, valoarea estimat pentru prima celul este:

ES

ZA

FI
R

La fel se procedeaz i pentru celelalte celule ale matricei de


contingen:

Statistica testului se calculeaz conform formulei:

Analiza frecvenelor i a datelor nominale

179

Dac matricea de contingen are dou linii i dou coloane, atunci


se utilizeaz corecia Yates pentru continuitate, la fel ca n cazul testului
de concordan.

Dac

se respinge i se accept

o probabilitate de 1

pentru

FI
R

ES

Cnd exist mai multe categorii nominale ale celor dou variabile
analizate, atunci matricea de contingen poate avea mai mult de dou
rnduri i dou coloane. n acest caz, metoda de calcul a frecvenelor
estimate i a statisticii testului este aceeai cu cea folosit pentru o matrice
de contingen cu dou rnduri i dou coloane (
), cu excepia
faptului c n formula de calcul a statisticii testului nu se mai aplic corecia
Yates pentru continuitate.

ZA

Exemplul 10.3. Se crede ca femelele unei specii de arpe acvatic


dintr-un lac migreaz toamna n apropierea blilor adiacente pentru
depunerea pontei. Dac este aa, atunci femelele ar trebui sa migreze mai
intens dect masculii. Dac din 27 de femele 25 au migrat i 2 nu au migrat,
iar din 34 de masculi 4 au migrat, iar 30 nu, exista o asociere semnificativ
ntre migraie i sex?

Datele sunt sub form de frecvene, iar erpii pot aparine doar la una
din cele dou categorii definite de valorile variabilei nominale sex. Deci
primele dou condiii de aplicare a testului sunt respectate de datele obinute
n urma analizei probelor.
Se alctuiete tabelul de contingen:
Variabila
Sex

Migraia
Valori Migratori Nemigratori
25
2
Femel
4
30
Mascul
29
32

27
34
=61

180

Elemente de statistic aplicate n ecologie

Se calculeaz valorile estimate:


Sex

Migraia
25 (2729)/61=12,8360
Migratori
Femel
Nemigratori 2 (2732)/61=14,1639
4 (3429)/61=16,1639
Migratori
Mascul
Nemigratori 30 (3432)/61=17,8360

Frecvenele teoretice ( ) sunt toate mai mari ca 5, deci este


ndeplinit i condiia a treia a testului
de asociere.
Ipotezele testului sunt:

ES

: nu exist asociere semnificativ ntre migraie i sex


: exist o asociere semnificativ ntre migraie i sex.

|
|

,
,
|

36,2484

ZA

FI
R

Dat fiind c numrul gradelor de libertate este 1 (


1
1 2 1 ) se aplic formula cu corecia pentru continuitate.

3,841.

Se afl valoarea critic (anexa 2 sau 3):

Statistica testului este mai mare dect valoarea critic i, n


consecin, ipoteza nul se respinge i se accept ipoteza alternativ pentru o
probabilitate
0,05 (95%). Probabilitatea ca ipoteza nul s fie
adevrat este de 1,7 10 .
Se poate trage concluzia c exist o asociere semnificativ ntre sex
i migraie n populaia de erpi de ap analizat.
Exemplul 10.4. ntr-un studiu s-a investigat preferina pentru habitat
a larvelor aparinnd la trei specii de insecte ( , , ), prin prelevarea
aleatoare a pupelor din trei ape curgtoare cu grade diferite de eutrofizare

Analiza frecvenelor i a datelor nominale

181

(oligotrofic, mezotrofic i eutrofic). Exist o asociere semnificativ ntre


preferina pentru un anumit tip de habitat i apartenena specific?
Datele sunt sub form de frecvene, iar o pup poate aparine doar la
o singur specie i poate proveni doar dintr-o singur ap curgtoare. Deci
de asociere sunt ndeplinite.
primele dou condiii ale testului
Se scrie matricea de contingen 3 3.
Variabila
Valori

57
44
50
=151

ES

Specia

Habitat
Oligotrofic Mezotrofic Eutrofic
10
12
35
7
26
11
28
13
9
45
51
55

Habitat
Oligotrofic
Mezotrofic
Eutrofic
Oligotrofic
Mezotrofic
Eutrofic
Oligotrofic
Mezotrofic
Eutrofic

ZA

sp.

FI
R

Se calculeaz valorile estimate:


10
12
35
7
26
11
28
13
9

(4557)/151=16,9868
(5157)/151=19,2517
(5557)/151=20,7614
(4544)/151=13,1126
(5144)/151=14,8609
(5544)/151=16,0265
(4550)/151=14,9007
(5150)/151=16,8874
(5550)/151=18,2119

Frecvenele teoretice ( ) sunt toate mai mari ca 5, deci este


ndeplinit i condiia a treia a testului
de asociere.
Ipotezele testului sunt:
: nu exist asociere semnificativ ntre apartenena specific i
tipul de habitat
: exist o asociere semnificativ ntre apartenena specific i tipul
de habitat.

182

Elemente de statistic aplicate n ecologie

Numrul gradelor de libertate este 4 (


1
1
3 1 3
1 ). Astfel, se aplic formula statisticii testului fr corecia pentru
continuitate.
,

,
,
,
,

45,2155

9,488.

Se afl valoarea critic (anexa 2 sau 3):

FI
R

ES

Valoarea statisticii testului este mai mare dect valoarea critic,


ipoteza nul se respinge i se accept ipoteza alternativ pentru o
probabilitate
0,05 (95%). Probabilitatea ca ipoteza nul s fie
adevrat este 8,3 10 , deci foarte mic.
Se poate trage concluzia c exist o asociere semnificativ ntre
apartenena specific i gradul de eutrofizare al habitatelor.

ZA

Pentru a determina care dintre speciile analizate este asociat cu un


anumit grad de eutrofizare, trebuie comparate valorile observate cu cele
estimate (ateptate, dac nu ar fi existat nici o preferin pentru habitat):
pentru specia , frecvena observat a fost mai mare dect cea estimat n
apele eutrofe; pentru specia , frecvena observat a depit-o pe cea
estimat n apele mezotrofe; pentru specia , frecvena observat a fost mai
mare dect cea estimat n apele oligotrofe.
Din acest exemplu se poate trage i o concluzie de ordin general:
unde frecvenele observate sunt mai mari dect cele estimate nseamn c
exist o asociere pozitiv ntre cele dou variabile i invers, unde frecvenele
estimate sunt mai mari dect cele observate nseamn c exist o asociere
negativ ntre variabile.

Analiza frecvenelor i a datelor nominale

183

10.3. TESTUL EXACT AL LUI FISHER

Este asemntor cu testul


pentru asociere i se folosete pentru
testarea asocierii dintre dou variabile nominale. Diferena dintre cele dou
teste const n faptul c testul Fisher nu prevede a treia condiie de aplicare a
testul . Primele dou condiii (privind datele sub form de frecvene i
independena probelor) trebuie ndeplinite. Acest test este foarte util pentru
analiza probelor de dimensiuni mici. Un alt avantaj fa de testul
se
refer la faptul c testul Fisher se poate aplica i n variant unilateral.
Pentru calcularea testului, datele trebuie ordonate ntr-o matrice de
contingen:

ES

Valoarea
variabilei

FI
R

prezent
( )

absent
( )

Total
Rnd (

coloan (

ZA

Total

prezent ( )
absent ( )

Ipotezele testului sunt:

Bilateral
Unilateral
:
nu
exist
: indivizii care prezint
nu au tendina s
asociere ntre i . prezinte , iar cei care nu prezint au tendina s
prezinte .
: exist asociere
: indivizii care prezint
au tendina s
ntre i .
prezinte i , iar cei care nu prezint au tendina
s nu prezinte nici .
Deosebirea ntre ipotezele bilaterale i cele unilaterale, n cazul
testului Fisher, este similar cu cea dintre aceleai ipoteze n situaia unei
analize a corelaiei: ipotezele bilaterale ale testului Fisher sunt analoage

184

Elemente de statistic aplicate n ecologie

ipotezelor privind nonexistena sau existena unei asocieri ntre dou


variabile, fr a preciza tipul corelaiei; ipotezele unilaterale ale testului
Fisher sunt similare ipotezelor care specific tipul corelaiei (pozitiv sau
negativ).
Se scriu apoi toate matricele posibile pentru aceleai totaluri
,
,
marginale, adic se modific frecvenele , , , i astfel nct
,
i
s rmn constante. Astfel, rezult o serie de matrice n
care la un capt poziia va avea o valoare minim, iar la cellalt va avea o
valoare maxim.
Se calculeaz disproporionalitatea pentru fiecare matrice obinut,
dup relaia:

ES

! ! ! ! !

FI
R

Se calculeaz probabilitatea ( ) pentru fiecare matrice a crei


disproporii ( ) este mai mare sau egal cu disproporia matricei iniiale,
conform relaiei

ZA

Suma probabilitilor acestor matrice reprezint probabilitatea ca


s fie adevrat. Se respinge ipoteza nul dac suma probabilitilor este mai
mic dect pragul de semnificaie (0,05).
Dac testul se aplic n varianta bilateral, atunci se nsumeaz
probabilitile date de toate matricele din ambele capete ale seriei cu
disproporionalitatea mai mare sau egal cu cea a matricei iniiale. Cnd se
formuleaz ipoteze unilaterale, atunci se nsumeaz doar probabilitile
matricelor dintr-o singur parte a seriei, ale cror disproporionalitate este
mai mare sau egal cu cea a matricei iniiale.
Exemplul 10.5. ntr-un experiment s-a urmrit dac juvenilii unei
specii de arpe tind s prezinte o reacie de fug la un stimul amenintor de
deasupra sau din lateral. Ca urmare, 7 erpi au fost stimulai de deasupra
capului, iar ali 7, din lateral i s-au nregistrat tentativele de scpare.

Analiza frecvenelor i a datelor nominale

185

n aceast situaie este vorba de dou probe independente, deoarece


un individ a fost supus unui singur tratament (a fost stimulat fie de deasupra,
fie din lateral), i de categorii care se exclud reciproc (au prezentat reacia
sau nu au prezentat-o). n aceste condiii, pentru a realiza testarea, datele
trebuie aranjate ntr-un tabel de contingen. Acesta poate fi alctuit astfel
nct s reflecte dac se urmrete o ipotez bilateral sau unilateral:
Tabel de contingen pentru varianta bilateral
Stimul de deasupra
Stimul din lateral

Reacie prezent
6
1

Reacie absent
1
6

Tabel de contingen pentru varianta unilateral

ES

da
nu

Reacie de scpare
da
Nu
6
1
1
6

Stimul de deasupra capului

ZA

FI
R

de
Dac se calculeaz frecvenele estimate conform testului
asociere, se observ c toate acestea sunt mai mici dect 5 (frecvenele
estimate sunt egale cu 3,5), deci condiia a treia a testului nu este
ndeplinit. Ca urmare, testul
de asociere nu poate fi aplicat pentru acest
exemplu.
Ipotezele testului:

Bilateral
Unilateral
: nu exist asociere ntre
: indivizii care au fost stimulai
stimulare i apariia reaciei.
deasupra nu tind s prezinte reacia
scpare.
: exist asociere ntre
: indivizii care au fost stimulai
stimulare i apariia reaciei.
deasupra tind s manifeste o reacie
scpare.

de
de
de
de

Indiferent de varianta n care se aplic testul, trebuie scris seria de


matrice. Cel mai simplu este ca la valoarea din poziia s se adune cte o
unitate pn se ajunge la captul din dreapta al seriei, iar apoi din aceeai

186

Elemente de statistic aplicate n ecologie

valoare s se scad cte o unitate pn se obine captul din stnga al seriei.


n funcie de valoarea
i totalurile marginale se completeaz celelalte
poziii ale matricelor.
0
7

#3

#2
7
0

1
6

2
5

6
1
,

3
4
0,14

5
2

3
4

4
3
0,14

#7

2
5
0,42

6
1

#8
1
6

7
0

0
7

ES

4
3

#6

5
2
0,42

#5

#4

#1

#8

0,00029

#2

! ! ! !
! ! ! ! !
! ! ! !
! ! ! ! !
! ! ! !

ZA

#1

FI
R

Matricele care au mai mare sau egal cu matricei iniiale (#7)


sunt matricele #1, #2 i #8. Deci pentru acestea se vor calcula
probabilitile:

! ! ! ! !

0,01427
0,00029 .

Pentru a calcula probabilitatea ipotezei nule este nevoie i de


probabilitatea dat de matricea iniial:
#7

! ! ! !
! ! ! ! !

0,00029 .

Dac testul se aplic n variant bilateral, atunci probabilitatea


ipotezei nule va fi dat de suma probabilitilor celor patru matrice:
#1
0,00029

#2
#7
#8
0,01427 0,01427 0,00029

0,0291 .

Analiza frecvenelor i a datelor nominale

187

Dac testul se aplic n variant unilateral, atunci probabilitatea


ipotezei nule va fi suma probabilitilor calculate pe baza matricelor #7 i
#8:
#7
0,01427

#8
0,00029

0,0145 .

Indiferent de varianta aplicat, condiia testului este urmtoarea:


0,05

dac

se respinge i se accept

FI
R

ES

n cazul exemplului, ambele rezultate arat c ipotezele nule


corespunztoare celor dou variante au o probabilitate foarte mic (mai mic
de 0,05). Deci se poate accepta fie c exist o asociere semnificativ ntre
stimulare i reacia de scpare, fie c exist o asociere semnificativ ntre
stimularea de deasupra capului i apariia reaciei de scpare. Evident, al
doilea rezultat (varianta unilateral) este n cazul experimentului prezentat
mai valoros, deoarece ofer un plus de informaie.

ZA

10.4. TESTUL MCNEMAR

n anumite situaii nu se dorete ca observaiile s fie independente


(de exemplu, dac se investigheaz aciunea unui tratament asupra unor
animale). Astfel, pentru a elimina diferenele individuale, aceiai indivizi
vor fi investigai de dou ori nainte i dup tratament.
n astfel de cazuri se folosete testul McNemar pentru testarea
semnificaiei schimbrilor rspunsurilor organismelor sub influena unui
tratament. Acest test este echivalentul testului pentru perechi de valori n
cazul variabilelor nominale.
Condiii de aplicare:
1. variabila trebuie s fie nominal;
2. observaiile trebuie s fie neindependente (fiecare individ trebuie
s fie investigat de dou ori).

188

Elemente de statistic aplicate n ecologie

Se alctuiete matricea de contingen:


Tratament

Tratament 1
Rspuns 1
Rspuns 2

Rspuns
Rspuns 1
Rspuns 2

Tratament 2

Ipotezele testului sunt urmtoarele:

: rspunsul nu se modific semnificativ sub aciunea tratamentului


: rspunsul se modific semnificativ sub aciunea tratamentului

ZA

FI
R

ES

Indivizii care i-au modificat comportamentul ocup poziiile i


(indivizii din
au dat rspunsul 2 la tratamentul 1 i rspunsul 1 la
tratamentul 2; indivizii din au dat rspunsul 1 la tratamentul 1 i rspunsul
2 la tratamentul 2). Indivizii din poziiile i d nu i-au modificat rspunsul
(indiferent de tratament ei au dat fie rspunsul 1, fie 2).
Statistica testului consider doar indivizii care i-au modificat
rspunsul n funcie de tratament:

Statistica testului de compar cu o valoare critic aleas (anexa 2 sau


3) n funcie de pragul de confiden i numrul gradelor de libertate.
Dac

se respinge i se accept

pentru

Dac
5, se poate calcula probabilitatea
cu ajutorul funciei
distribuiei binomiale. n acest caz parametrii distribuiei se calculeaz
astfel:
!
!

0,5

,
.

Analiza frecvenelor i a datelor nominale

Dac
1

0,05

0,05
0,95 .

189

se respinge i se accept

pentru

FI
R

ES

Exemplul 10.6. La unele specii de amfibieni anuri, la care


dimorfismul sexual nu este evident, din repertoriul masculilor fac parte
printre altele i sunetele de eliberare. Acestea sunt emise de un mascul
atunci cnd este abordat de un altul (care l confund cu o femel) pentru a
realiza mperecherea (amplexus sau mbriare). Astfel, masculul abordat
semnalizeaz sonor c i el este tot mascul. n acest sens, ntr-un studiu
efectuat pe 31 de masculi de Pelophylax (Rana) lessonae, s-a aplicat un
stimul tactil n zona axilar (zona n care masculul prinde femela n
amplexus) i apoi un altul n zona spatelui. Rezultatele au fost urmtoarele:
25 au reacionat prin emiterea sunetului de eliberare doar n urma stimulrii
axilare, 2 au emis sunetul cnd au fost stimulai doar dorsal, 3 au emis
sunetul n urma ambelor stimulri i 1 nu a reacionat la niciunul dintre
stimuli. Exist o modificare semnificativ a comportamentului n funcie de
zona n care este aplicat stimulul?

ZA

n cazul acestui experiment, nu se poate aplica testul


de asociere
i nici testul Fisher, deoarece aplicarea ambelor teste este condiionat de
existena unor observaii independente, iar n acest experiment acelai
individ a fost supus ambelor tratamente: o dat a fost stimulat axilar, iar a
doua oar, dorsal. Deci pentru testarea semnificaiei asocierii dintre
comportament i zona stimulat trebuie aplicat testul McNemar.
Matricea de contingen n acest caz este urmtoarea:
Zona stimulat
Dorsal

Axilar
Sunet de eliberare Prezent Absent
Prezent
3
2
Absent
25
1

Ipotezele testului sunt:

190

Elemente de statistic aplicate n ecologie

: nu exist o schimbare semnificativ a comportamentului n


funcie de zona stimulat.
: exist o schimbare semnificativ a comportamentului n funcie
de zona stimulat.

n matricea de contingen, masculii care i-au schimbat


comportamentul n funcie de zona stimulat sunt cei din poziiile (2 au
reacionat la stimulul dorsal i nu au reacionat la cel axilar) i (25 au
reacionat la stimulul axilar i nu au reacionat la cel dorsal). Cei din
poziiile i nu i-au schimbat comportamentul (3 au reacionat la ambele
stimulri i, respectiv, 1 nu a reacionat la nici un stimul).

17,926 .

ES

a testului McNemar:

Pe baza acestor date se calculeaz statistica

3,841 .

FI
R

Se afl valoarea critic (anexa 2 sau 3) pentru


0,05 i 1 grad de
libertate (tabelul are 2 rnduri i 2 coloane, deci 2 1 2 1
1).

ZA

Valoarea statisticii testului este mai mare dect valoarea critic, deci
se respinge ipoteza nul i se accept ipoteza alternativ. Probabilitatea ca
ipoteza nul s fie adevrat (anexa 3) este foarte mic (2,3 10 ).
Concluzia testului este c exist o schimbare semnificativ a
comportamentului ce const n emiterea sunetului de eliberare n funcie de
zona stimulat la masculii speciei investigate.
S presupunem c rezultatul experimentului mai sus menionat se
prezint astfel:
Zona stimulat
Dorsal

Axilar
Sunet de eliberare Prezent Absent
Prezent
3
0
Absent
9
1

Analiza frecvenelor i a datelor nominale

191

n acest caz, media dintre i este 4,5 (o valoare mai mic dect
5) i, ca urmare, statistica testului nu mai este aproximat de distribuia 2.
n aceast situaie se folosete un test exact bazat pe distribuia binomial,
cu
0,5 i
.
0,5;

Parametrii necesari calculrii probabilitii sunt:


9 0 9.
0

!
!

0,5 0,5

0;

0,0019

ZA

FI
R

ES

Valoarea obinut este mai mic dect 0,05 sau probabilitatea


ipotezei nule este 0,0019, deci putem accepta ipoteza alternativ conform
creia exist o schimbare semnificativ a comportamentului n funcie de
locul unde s-a aplicat stimulul.

BIBLIOGRAFIE

ZA

FI
R

ES

Andrei T., Stancu S. (1995): Statistica teorie i aplicaie. Editura All.


Armitage P., Colton T. (2005): Encyclopedia of Biostatistics, 2nd edition.
John Wiley and Sons, Ltd.
Bailey T.J.N. (1981): Statistical Methods in Biology, 2nd edition.
Cambridge University Press.
Bart J., Fligner M.A., Notz W.I. (2004): Sampling and statistical methods
for behavioral ecologists. Cambridre University Press.
Bennett P.D., Humphries A.D. (1977): Introduction to Field Biology.
Edward Arnold (Publishers) Ltd.
Bishop O.N. (1971): The Principles of Modern Biology Statistics for
Biology, 2nd edition. Longman.
Cann A.J. (2002): Maths from Scratch for Biologists. John Wiley & Sons,
Ltd.
Ceapoiu M. (1968): Metode statistice aplicate n experienele agricole i
biologice. Editura Agro-Silvic, Bucureti.
Cox W.G. (1996): Laboratory Manual of General Ecology, 7th edition.
Wm. C. Brown Publishers.
Dragomirescu L. (1998): Biostatistic pentru nceptori. Editura
Constelaii, Bucureti.
Dragomirescu L. (1999): Lucrri practice de biostatistic. Editura Ars
Docendi, Bucureti.
Dytham C. (2003): Choosing and Using Statistics: A Biologists Guide, 2nd
edition. Blackwell Publishing.
Everitt B.S. (2002): The Cambridge Dictionary of Statistics, 2nd edition.
Cambridge University Press.
Forthofer R.N., Lee E.S., Hernandez M. (2007): Biostatistics: A Guide to
Design, Analysis, and Discovery. Elsevier Inc.
Fowler J., Cohen L., Javris P. (2000): Practical Statistics for Field Biology,
2nd edition. John Wiley and Sons, Ltd.
Glantz S.A. (2005): Primer of Biostatistics, 6th edition. McGraw-Hill.
Glaser A.N. (2001): High-YeldTM Biostatistics. Lippincott Williams &
Wilkins.

Bibliografie

193

ZA

FI
R

ES

Hampton E.R. (1994): Introductory Biological Statistics. Wm. C. Brown


Publishers.
Hrdle W., Mori Y., Vieu P. (2007): Statistical Methods for Biostatistics
and Related Fields. Springer-Verlag Berlin Heidelberg.
Iosifescu M., Moineagu C., Trebici V., Ursianu E. (1985): Mica
enciclopedie de statistic. Editura tiinific i Enciclopedic,
Bucureti.
Le C.T. (2003): Introductory Biostatistics. John Wiley and Sons, Ltd.
Ludwig J.A., Reynolds J.F. (1988): Statistical Ecology: A primer on
Methods and Computing. John Wiley and Sons, Ltd.
Manly B.F.J., McDonald L.L., Thomas D.L., McDonald T.L., Erikson W.P.
(2004): Resource Selection by Animals: Statistical Design and
Analysis for Field Studies, 2nd edition. Kluwer Academic
Publishers.
Michelson S., Schofield S. (2002): The Biostatistics Cookbook: The most
user-friendly guide for the bio/medical scientist. Kluwer Academic
Publishers.
Morisita M. (1962): I-Index, a measure of dispersion of individuals. Res.
Popul. Ecol., 4: 1-7.
Neacu P. (1987): Lucrri practice de ecologie. Bucureti.
Neacu P., Apostolache-Stoicescu Z. (1982): Dicionar de ecologie. Editura
tiinific i Enciclopedic, Bucureti.
Norman G.R., Streiner D.L. (1998): Biostatistics: The Bare Essentials. B.C.
Decker Inc.
Prvu C. (1999): Ecologie general. Editura Tehnic, Bucureti.
Petrie A., Sabin C. (2000): Medical Statistics at a Glance. Blackwell
Science Ltd.
Postelnicu V., Coatu S. (1980): Mica enciclopedie matematic (traducere
dup Kleine Enzyklopadie der Mathematik ed. VI-a, 1971 i
Mathematics at a glance, 1975). Editura Tehnic, Bucureti.
Simionescu V. (1983): Lucrri practice de ecologie. Editura Universitii
Al.I. Cuza Iai.
Slingsby D., Cook C. (1992): Practical Ecology. Macmillan Distribution
Ltd.
Smith R.L. (1996): Ecology and Field Biology, 5th edition. Harper Collins
College Publishers.

194

Elemente de statistic aplicate n ecologie

ZA

FI
R

ES

Snedecor W.G. (1968): Metode statistice aplicate n cercetrile de


agricultur i biologie (traducere din limba englez). Bucureti.
Southwood T.R.E. (1966): Ecological Methods with Particular Reference to
the Study of Insect Populations. London, Methuen and co. LTD.
Stan Gh. (1994): Metode statistice cu aplicaii n cercetrile entomologice
(IV). Bul. Inf. Soc. Lepid. Rom., 5 (1): 13-25.
Stan Gh., 1994, Metode statistice cu aplicaii n cercetrile entomologice
(V). Bul. Inf. Soc. Lepid. Rom., 5 (2): 113-126.
Stan Gh. (1994): Metode statistice cu aplicaii n cercetrile entomologice
(VI). Bul. Inf. Soc. Lepid. Rom., 5 (3-4): 257-280.
Stan Gh. (1995): Metode statistice cu aplicaii n cercetrile entomologice
(VII). Bul. Inf. Soc. Lepid. Rom., 6 (1-2): 67-96.
Stiling, P.D. (2001): Ecology Theories and Applications, 4th edition.
Prentice Hall.
Varvara M. (2000): Curs de Ecologie, vol. 1. Editura Universitii Al.I.
Cuza Iai.
Varvara M., Zamfirescu .R., Neacu V. (2001): Lucrri practice de
ecologie manual. Editura Universitii Al.I. Cuza Iai.
Zamfirescu O., Zamfirescu .R. (2007): Aspects Regarding the Vegetation
From the Floristic Reserve The Secular Hayfields From Valea Lui
David Iai, Romnia. Journal of Ecology and Safety, International
Scientific Publication, 1:32-39.
Zamfirescu .R. (2002): The Experimental Induction of the Release Calls of
Some Anuran Species (Amphibia, Anura). In: Tomescu, N., Popa,
V. (eds.), In Memoriam Prof. Dr. Doc. Vasile Ghe. Radu
Coresponding Member of Romanian Academy of Sciences. Cluj
University Press, Cluj-Napoca, pp. 169-172.
Zamfirescu .R., Zamfirescu O., Popescu I.E., Ion C., Strugariu A. (2008):
Vipera de step (Vipera ursinii moldavica) i habitatele sale din
Moldova (Romania). Editura Universitii Al.I. Cuza Iai.

ANEXA 1: CHEIE DIHOTOMIC PENTRU


DETERMINAREA TIPULUI DE ANALIZ STATISTIC
Aprecierea datelor:
a.
datele sunt apreciate pe o scal ordinal, de interval, de raport
2
b.
datele sunt apreciate pe o scal nominal i/sau sub form de
frecvene 15

2.

Numrul variabilelor analizate:


a.
o singur variabil (ex: lungimea, greutatea, numr de
indivizi) 3
b.
dou variabile (ex: lungimea i greutatea) 13

3.

Numrul probelor analizate:


a.
o singur prob 4
b.
mai multe probe 5

4.

Scopul analizei:
a.
descrierea tendinei centrale i a variabilitii probei
Statistica descriptiv.
b.
compararea mediei cu o valoare control Testul Student
(t) pentru o prob.

5.

Numrul probelor:
a.
2 probe 6 (Teste pentru 2 probe) 6
b.
3 sau mai multe probe 9 (ANOVA) 9

6.

Independena observaiilor:
a.
observaii independente (probele provin din populaii
diferite) 7
b.
observaii neindependente (probele provin din aceeai
populaie sau sunt obinute prin efectuarea unor observaii
repetate asupra acelorai uniti de prob) 8

ZA

FI
R

ES

1.

196

Elemente de statistic aplicate n ecologie

Distribuia valorilor i scala de apreciere a variabilei:


a.
distribuie aproximativ normal, scal de interval sau de
raport Testul Student (t) pentru observaii
independente.
b.
distribuie diferit de cea normal, scal de interval, de raport
sau ordinal Testul Mann-Whitney (U).

8.

Distribuia valorilor i scala de apreciere a variabilei:


a.
distribuie aproximativ normal, scal de interval sau de
raport Testul Student (t) pentru observaii perechi.
b.
distribuie diferit de cea normal, scal de interval, de raport
sau ordinal Testul Wilcoxon (W) pentru observaii
perechi.

9.

Numrul factorilor (tratamente) care influeneaz probele:


a.
1 singur factor (tratament) 10
b.
2 factori (tratamente) 11

10.

Distribuia valorilor i scala de apreciere a variabilei:


a.
distribuie aproximativ normal, scal de interval sau de
raport, variana intern omogen ANOVA unifactorial.
b.
distribuie diferit de cea normal, scal de interval, de raport
sau ordinal, varian intern heterogen ANOVA
unifactorial neparametric Kruskal-Wallis.

11.

Numrul de observaii n celul, interaciunea dintre factori:


a.
o singur observaie n celul, nu exist interaciune 12
b.
mai multe observaii n celul, exist interaciune
ANOVA bifactorial cu replicare.

12.

Distribuia valorilor i scala de apreciere a variabilei:


a.
distribuie aproximativ normal, scal de interval sau de
raport, varian intern omogen ANOVA bifactorial
fr replicare.
b.
distribuie diferit de cea normal, scal de interval, de raport
sau ordinal, varian intern heterogen ANOVA
bifactorial neparametric Friedman.

ZA

FI
R

ES

7.

ANEXA 1: Cheie dihotomic pentru determinarea tipului de analiz statistic

197

Relaia dintre variabile, prelevarea probei:


a.
asociere liniar, proba este prelevat aleator 14 (Analiza
Corelaiei)
b.
relaie liniar cauz-efect, proba este prelevat n funcie de
valorile variabilei independente Analiza Regresiei.

14.

Distribuia valorilor i scala de apreciere a variabilei:


a.
distribuie aproximativ normal, scal de interval sau de
raport Corelaia parametric (Coeficientul de corelaie
Pearson).
b.
distribuie diferit de cea normal, scal de interval, de raport
sau ordinal Corelaia neparametric (Coeficientul de
corelaie Spearman).

15.

Scopul analizei:
a.
concordana dintre distribuia frecvenelor observate i cea a
frecvenelor estimate conform unei distribuii teoretice,
cunoscute Testul Chi-Ptrat de concordan.
b.
asocierea dintre 2 variabile apreciate pe o scal nominal sau
sub form de frecvene 16

16.

Independena observaiilor:
a.
observaii independente (fiecare unitate de prob este
investigat o singur data) 17
b.
observaii neindependente (sunt obinute prin efectuarea unor
investigaii repetate asupra acelorai uniti de prob)
Testul McNemar pentru semnificaia schimbrii.

17.

Magnitudinea frecvenelor estimate:


a.
frecvenele estimate mai mari ca 0 i cel mult 20% dintre ele
sunt mai mici ca 5 Testul Chi-Ptrat de Asociere.
b.
exist frecvene estimate egale cu 0 i mai mult de 20% din
frecvenele estimate sunt mai mici ca 5 Testul exact al lui
Fisher.

ZA

FI
R

ES

13.

ANEXA 2: TABELE CU VALORI CRITICE


Scorul z i probabilitile corespunztoare n distribuia normal standard
0,07
0,5279
0,5675
0,6064
0,6443
0,6808
0,7157
0,7486
0,7794
0,8078
0,8340
0,8577
0,8790
0,8980
0,9147
0,9292
0,9418
0,9525
0,9616
0,9693
0,9756
0,9808
0,9850
0,9884
0,9911
0,9932
0,9949
0,9962
0,9972
0,9979
0,9985
0,9989
0,9992
0,9995
0,9996
0,9997
0,9998

0,06
0,5239
0,5636
0,6026
0,6406
0,6772
0,7123
0,7454
0,7764
0,8051
0,8315
0,8554
0,8770
0,8962
0,9131
0,9279
0,9406
0,9515
0,9608
0,9686
0,9750
0,9803
0,9846
0,9881
0,9909
0,9931
0,9948
0,9961
0,9971
0,9979
0,9985
0,9989
0,9992
0,9994
0,9996
0,9997
0,9998

A doua zecimal
0,04
0,05
0,5160 0,5199
0,5557 0,5596
0,5948 0,5987
0,6331 0,6368
0,6700 0,6736
0,7054 0,7088
0,7389 0,7422
0,7704 0,7734
0,7995 0,8023
0,8264 0,8289
0,8508 0,8531
0,8729 0,8749
0,8925 0,8944
0,9099 0,9115
0,9251 0,9265
0,9382 0,9394
0,9495 0,9505
0,9591 0,9599
0,9671 0,9678
0,9738 0,9744
0,9793 0,9798
0,9838 0,9842
0,9875 0,9878
0,9904 0,9906
0,9927 0,9929
0,9945 0,9946
0,9959 0,9960
0,9969 0,9970
0,9977 0,9978
0,9984 0,9984
0,9988 0,9989
0,9992 0,9992
0,9994 0,9994
0,9996 0,9996
0,9997 0,9997
0,9998 0,9998

ES

0,03
0,5120
0,5517
0,5910
0,6293
0,6664
0,7019
0,7357
0,7673
0,7967
0,8238
0,8485
0,8708
0,8907
0,9082
0,9236
0,9370
0,9484
0,9582
0,9664
0,9732
0,9788
0,9834
0,9871
0,9901
0,9925
0,9943
0,9957
0,9968
0,9977
0,9983
0,9988
0,9991
0,9994
0,9996
0,9997
0,9998

FI
R

0,02
0,5080
0,5478
0,5871
0,6255
0,6628
0,6985
0,7324
0,7642
0,7939
0,8212
0,8461
0,8686
0,8888
0,9066
0,9222
0,9357
0,9474
0,9573
0,9656
0,9726
0,9783
0,9830
0,9868
0,9898
0,9922
0,9941
0,9956
0,9967
0,9976
0,9982
0,9987
0,9991
0,9994
0,9995
0,9997
0,9998

0,01
0,5040
0,5438
0,5832
0,6217
0,6591
0,6950
0,7291
0,7611
0,7910
0,8186
0,8438
0,8665
0,8869
0,9049
0,9207
0,9345
0,9463
0,9564
0,9649
0,9719
0,9778
0,9826
0,9864
0,9896
0,9920
0,9940
0,9955
0,9966
0,9975
0,9982
0,9987
0,9991
0,9993
0,9995
0,9997
0,9998

ZA

0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5

0,00
0,5000
0,5398
0,5793
0,6179
0,6554
0,6915
0,7257
0,7580
0,7881
0,8159
0,8413
0,8643
0,8849
0,9032
0,9192
0,9332
0,9452
0,9554
0,9641
0,9713
0,9772
0,9821
0,9861
0,9893
0,9918
0,9938
0,9953
0,9965
0,9974
0,9981
0,9987
0,9990
0,9993
0,9995
0,9997
0,9998

0,08
0,5319
0,5714
0,6103
0,6480
0,6844
0,7190
0,7517
0,7823
0,8106
0,8365
0,8599
0,8810
0,8997
0,9162
0,9306
0,9429
0,9535
0,9625
0,9699
0,9761
0,9812
0,9854
0,9887
0,9913
0,9934
0,9951
0,9963
0,9973
0,9980
0,9986
0,9990
0,9993
0,9995
0,9996
0,9997
0,9998

0,09
0,5359
0,5753
0,6141
0,6517
0,6879
0,7224
0,7549
0,7852
0,8133
0,8389
0,8621
0,8830
0,9015
0,9177
0,9319
0,9441
0,9545
0,9633
0,9706
0,9767
0,9817
0,9857
0,9890
0,9916
0,9936
0,9952
0,9964
0,9974
0,9981
0,9986
0,9990
0,9993
0,9995
0,9997
0,9998
0,9998

ANEXA 2: Tabele cu valori critice

199

Valorile critice ale distribuiei t (Student)

ZA

FI
R

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
100
120

(bilateral)
0,05
0,1
(unilateral)
0,025
0,05
12,706
6,314
4,303
2,920
3,182
2,353
2,776
2,132
2,571
2,015
2,447
1,943
2,365
1,895
2,306
1,861
2,262
1,833
2,228
1,812
2,201
1,796
2,179
1,782
2,160
1,771
2,145
1,761
2,131
1,753
2,120
1,746
2,110
1,740
2,101
1,734
2,093
1,729
2,086
1,725
2,080
1,721
2,074
1,717
2,069
1,714
2,064
1,711
2,060
1,708
2,056
1,706
2,052
1,703
2,048
1,701
2,045
1,699
2,042
1,697
2,021
1,684
2,000
1,671
1,984
1,660
1,980
1,658
1,960
1,645

ES

Grade de
libertate

93

99

106

112 105

13

19

25

32

38

45

52

58

65

72

78

85

92

99

14

20

27

34

41

48

55

62

69

76

83

90

98

105

112 106

119 113

127 119

86

80

74

67

61

55

48

42

36

30

24

18

12

99

93

87

81

75

67

63

57

51

45

39

34

28

22

17

11

17

18

19

20

98

92

86

81

75

70

64

59

53

47

42

37

31

26

21

15

11

16

90

85

80

75

70

64

59

54

49

44

39

34

29

24

19

14

10

83

78

74

67

64

59

55

50

45

40

36

31

26

22

17

13

14

15

76

72

67

63

59

54

50

45

41

37

33

28

24

20

16

69

65

61

57

53

49

45

41

37

33

29

26

62

58

55

51

47

44

40

37

33

30

26

23

19

16

13

11

55

52

48

45

42

39

36

33

29

26

23

20

17

14

11

10

48

45

42

39

37

34

31

28

26

23

21

17

15

12

10

41

38

36

34

31

29

26

24

22

19

17

34

32

30

28

26

24

22

20

18

16

14

27

25

24

22

21

19

17

16

20

19

18

17

15

14

13

12

11

14

13

ES

11

10

10

15

13

10

12

FI
R

22

18

14

11

12

ZA
12

13

13

13

12

11

11

10

20

19

18

17

16

15

14

13

12

11

10

200
Elemente de statistic aplicate n ecologie

Valorile critice ale statisticii U pentru testul Mann-Whitney pentru


,
(bilateral),
,
(unilateral)

ANEXA 2: Tabele cu valori critice

201

ZA

FI
R

ES

Valorile critice ale statisticii T a testului Wilcoxon


n
Bilateral =0,05 Unilateral =0,05
0
5
2
6
2
3
7
3
5
8
5
8
9
8
10
10
10
13
11
13
17
12
17
21
13
21
25
14
25
30
15
29
35
16
34
41
17
40
47
18
46
53
19
52
60
20
58
67
21
65
75
22
73
83
23
81
91
24
89
100
25
98
110
26
107
119
27
116
130
28
126
140
29
137
151
30
195
213
35
264
286
40
343
371
45
434
466
50
648
690
60
907
960
70
1211
1276
80
1560
1638
90
1955
2045
100

Elemente de statistic aplicate n ecologie


(Hatley) pentru
,

2
39,0
15,4
9,6
7,15
5,82
4,99
4,43
4,03
3,72
3,28
2,86
2,46
2,07
1,67
1,00

3
87,5
27,8
15,5
10,8
8,38
6,94
6,00
5,34
4,85
4,16
3,54
2,95
2,40
1,85
1,00

4
142
39,2
20,6
13,7
10,4
8,44
7,18
6,31
5,67
4,79
4,01
3,29
2,61
1,96
1,00

5
202
50,7
25,2
16,3
12,1
9,70
8,12
7,11
6,34
5,30
4,37
3,54
2,78
2,04
1,00

6
266
62,0
29,5
18,7
13,7
10,8
9,03
7,80
6,92
5,72
4,68
3,76
2,91
2,11
1,00

7
333
72,9
33,6
20,8
15,0
11,8
9,78
8,41
7,42
6,09
4,95
3,94
3,02
2,17
1,00

8
403
83,5
37,5
22,9
16,3
12,7
10,5
8,95
7,87
6,42
5,19
4,10
3,12
2,22
1,00

9
475
93,9
41,1
24,7
17,5
13,5
11,1
9,45
8,28
6,72
5,40
4,24
3,21
2,26
1,00

ES

2
3
4
5
6
7
8
9
10
12
15
20
30
60

10
550
104
44,6
26,5
18,6
14,3
11,7
9,91
8,66
7,00
5,59
4,37
3,29
2,30
1,00

Valorile critice pentru testul

202

11
626
114
48,0
28,2
19,7
15,1
12,2
10,3
9,01
7,25
5,77
4,49
3,36
2,33
1,00

12
704
124
51,4
29,9
20,7
15,8
12,7
10,7
9,34
7,48
5,93
4,59
3,39
2,36
1,00

3
26,98
8,33
5,91
5,04
4,60
4,34
4,16
4,04
3,95
3,88
3,82
3,77
3,73
3,70
3,67
3,65
3,63
3,61
3,59
3,58
3,53
3,49
3,44
3,40
3,36

4
32,82
9,80
6,82
5,76
5,22
4,90
4,68
4,53
4,41
4,33
4,26
4,20
4,15
4,11
4,08
4,05
4,02
4,00
3,98
3,96
3,90
3,85
3,79
3,74
3,68

5
37,08
10,88
7,50
6,29
5,67
5,30
5,06
4,89
4,76
4,65
4,57
4,51
4,45
4,41
4,37
4,33
4,30
4,28
4,25
4,23
4,17
4,10
4,04
3,98
3,92

2
17,97
6,08
4,50
3,93
3,64
3,46
3,34
3,26
3,20
3,15
3,11
3,08
3,06
3,03
3,01
3,00
2,98
2,97
2,96
2,95
2,92
2,89
2,86
2,83
2,80

ZA

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
24
30
40
60
120

FI
R

Valorile critice q pentru testul Tukey (=0,05).


6
40,41
11,74
8,04
6,71
6,03
5,63
5,36
5,17
5,02
4,91
4,82
4,75
4,69
4,64
4,59
4,56
4,52
4,49
4,47
4,45
4,37
4,30
4,23
4,16
4,10

7
43,12
12,44
8,48
7,05
6,33
5,90
5,61
5,40
5,24
5,12
5,03
4,95
4,88
4,83
4,78
4,74
4,70
4,67
4,65
4,62
4,54
4,46
4,39
4,31
4,24

8
45,40
13,03
8,85
7,35
6,58
6,12
5,82
5,60
5,43
5,30
5,20
5,12
5,05
4,99
4,94
4,90
4,86
4,82
4,79
4,77
4,68
4,60
4,52
4,44
4,36

9
47,36
13,54
9,18
7,60
6,80
6,32
6,00
5,77
5,59
5,46
5,35
5,27
5,19
5,13
5,08
5,03
4,99
4,96
4,92
4,90
4,81
4,72
4,63
4,55
4,47

10
49,07
13,99
9,46
7,83
6,99
6,49
6,16
5,92
5,74
5,60
5,49
5,39
5,32
5,25
5,20
5,15
5,11
5,07
5,04
5,01
4,92
4,82
4,73
4,65
4,56

ANEXA 2: Tabele cu valori critice

ES

FI
R

1
18,5
10,1
7,71
6,61
5,99
5,59
5,32
5,12
4,96
4,84
4,75
4,54
4,35
4,24
4,17
4,08
4,00
3,92

ZA

2
3
4
5
6
7
8
9
10
11
12
15
20
25
30
40
60
120

Valorile critice ale distribuiei F pentru =0,05.


glext
2
3
4
5
6
7
8
9
19,0 19,2 19,3 19,4 19,4 19,4 19,4 19,4
9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81
6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00
5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77
5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10
4,74 4,35 4,12 3,97 3,87 3,77 3,73 3,68
4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39
4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18
4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02
3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90
3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80
3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59
3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39
3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28
3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21
3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12
3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04
3,07 2,68 2,45 2,29 2,17 2,09 2,02 1,96

glint

203

10
19,4
8,79
5,96
4,74
4,06
3,64
3,35
3,14
2,98
2,85
2,75
2,54
2,35
2,24
2,16
2,08
1,99
1,91

204

Elemente de statistic aplicate n ecologie

0,01
6,635
9,210
11,345
13,277
15,086
16,812
18,475
20,090
21,666
23,209
24,725
26,217
27,688
29,141
30,578
32,000
33,409
34,805
36,191
37,566
38,932
40,289
41,638
42,980
44,314
45,642
46,963
48,278
49,588
50,892

ES

FI
R

ZA

0,99
0,000157
0,0201
0,115
0,297
0,554
0,872
1,239
1,646
2,088
2,558
3,053
3,571
4,107
4,660
5,229
5,812
6,408
7,015
7,633
8,260
8,897
9,542
10,196
10,856
11,524
12,198
12,879
13,565
14,256
14,953

Grade de
libertate
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

Valorile critice ale distribuiei 2

0,95
0,90
0,10
0,05
0,00393 0,0158 2,706
3,841
0,103
0,211
4,605
5,991
0,352
0,584
6,251
7,815
0,711
1,064
7,779
9,488
1,145
1,610
9,236 11,070
1,635
2,204 10,645 12,592
2,167
2,833 12,017 14,067
2,733
3,490 13,362 15,507
3,325
4,168 14,684 16,919
3,940
4,865 15,987 18,307
4,575
5,578 17,275 19,675
5,226
6,304 18,549 21,026
5,892
7,042 19,812 22,362
6,571
7,790 21,064 23,685
7,261
8,547 22,307 24,996
7,962
9,312 23,542 26,296
8,672
10,085 24,769 27,587
9,390
10,865 25,989 28,869
10,117 11,651 27,204 30,144
10,851 12,443 28,412 31,410
11,591 13,240 29,615 32,671
12,338 14,041 30,813 33,924
13,091 14,848 32,007 35,172
13,848 15,659 33,196 36,415
14,611 16,473 34,382 37,652
15,379 17,292 35,563 38,885
16,151 18,114 36,741 40,113
16,928 18,939 37,916 41,337
17,708 19,768 39,087 42,557
18,493 20,599 40,256 43,773

0,001
10,828
13,816
16,266
18,467
20,515
22,458
24,322
26,124
27,877
29,588
31,264
32,909
34,528
36,123
37,697
39,252
40,790
42,312
43,820
45,315
46,797
48,268
49,728
51,179
52,620
54,052
55,476
56,892
58,301
59,703

ANEXA 3: FUNCII MICROSOFT OFFICE EXCEL


n general, n acest program se poate realiza orice calcul prin tastarea
=, urmat de numerele sau referinele csuelor (liter coloan_numr rnd)
ce conin valorile de interes, ntre care se introduc semnele de operaie ale
formulei (+, -, *, /, sum, sqrt, power, abs, round, log pentru detalii
consultai meniu-ul Help al programului).

ES

Modulul Data Analysis exist n meniu Tools n versiunea 972003 sau Data n versiunea 2007. Dac nu apare n meniu, modulul se
poate activa astfel: pentru versiunea 97-2003 se alege Tools > Add-Ins;
n versiunea 2007 se alege Office Button > Excel Options > Add-Ins.
FUNCII SPECIALE N ORDINEA SECIUNILOR DIN CARTE:
SCALE DE MSURARE I TIPURI DE VARIABILE

FI
R

2.1.

REPREZENTAREA DATELOR
=LOG10(nr)
Returneaz valoarea logaritmului zecimal al unui numr (nr)
=MAX(ref)
Returneaz valoarea maxim a unui set de date (ref).
=MIN(ref)
Returneaz valoarea minim a unui set de date (ref).
=FREQUENCY(ref 1, ref 2)
Returneaz frecvena cumulat a valorilor unui set de date (ref 1)
cuprinse ntre valoarea minim i limita superioar a unei clase de
frecven (ref 2).

2.2.

ZA

=RANK(nr, ref, 1)+(COUNT(ref) + 1 RANK(nr, ref, 0)


RANK(nr, ref, 1)/2
Returneaz rangul unei valori (nr) dintr-un set de date (ref).

206

Elemente de statistic aplicate n ecologie

TENDINA CENTRAL
=MODE(ref)
Returneaz valoarea modului unui set de date (ref).
=MEDIAN(ref)
Returneaz valoarea medianei unui set de date (ref).
=AVERAGE(ref)

3.2.

VARIABILITATEA
Returneaz valoarea mediei aritmetice a unui set de date (ref).
=MAX(ref)
Returneaz valoarea maxim a unui set de date (ref).
=MIN(ref)
Returneaz valoarea minim a unui set de date (ref).
=SUMSQ(ref)
Returneaz suma ptratelor valorilor dintr-un set de date (ref).
=STDEV(ref)
Returneaz valoarea deviaiei standard calculat ca radical din suma
ptratelor mprit la numrul gradelor de libertate ( 1), a unui set
de date (ref).
=STDEVP(ref)
Returneaz valoarea deviaiei standard a populaiei calculat ca
radical din suma ptratelor mprit la numrul valorilor ( ), a unui
set de date (ref).
=VAR(ref)
Returneaz valoarea varianei calculat ca suma ptratelor mprit
la numrul gradelor de libertate ( 1), a unui set de date (ref).
=VARA(ref)
Returneaz valoarea varianei populaiei calculat ca suma ptratelor
mprit la numrul valorilor ( ), a unui set de date (ref).

ZA

FI
R

ES

3.1.

Descrierea statistic a unei probe mai poate fi obinut prin apelarea


meniului DATA > DATA ANALYSIS > DESCRIPTIVE
STATISTICS i completarea cmpurilor din fereastra de dialog
urmat de bifarea Summary statistics.

ANEXA 3: Funcii Microsoft Office Excel

207

DISTRIBUII PROBABILISTICE
=BINOMDIST(x, k, p, cumulativ)
Returneaz probabilitatea binomial asociat numrului rezultatelor
de interes ( ), n funcie de numrul total de ncercri ( ), i
probabilitatea obinerii unui anumit rezultat ( ), exprimat
necumulat (cumulative = false).
=POISSONDIST(x, x , cumulativ)
Returneaz probabilitatea Poisson asociat numrului rezultatelor de
interes ( ), n funcie de valoarea medie ( ), exprimat necumulat
(cumulative = false).
=NORMALIZE(x, x , s)
Returneaz valoarea a unei anumite valori a unei variabile ( ) n
funcie de media valorilor ( ) i de deviaia standard a acesteia ( ).
=NORMSINV(prob)
Returneaz scorul corespunztor unei anumite probabiliti (prob)
exprimat ca o proporie din distribuia normal standard.
=NORMSDIST(z)
Returneaz probabilitatea ca proporie din distribuia normal
standard, din coada stng a distribuiei i pn la un anumit scor .
=STANDARDIZE(nr, x , s)
Returneaz scorul al unei valori (nr) n funcie de medie ( ) i
deviaie standard ( ).

ZA

FI
R

ES

4.

Transformarea datelor
=LOG10(x)
Returneaz logaritmul zecimal ( ) al unei valori ce trebuie
transformate ( ).
=POWER(10,x)
Returneaz antilogaritmul zecimal al unei valori transformate prin
logaritmare n baza10.
=LN(x)
Returneaz logaritmul natural ( ) al unei valori ce trebuie
transformate ( ).
=EXP(x)
Returneaz antilogaritmul natural al unei valori transformate prin
logaritmare n baza .

208

Elemente de statistic aplicate n ecologie

5.1.

ZA

FI
R

ES

=LOG(x, baz)
Returneaz logaritmul ntr-o baz specificat (baz) al unei valori ce
trebuie transformate ( ).
=POWER(baz,x)
Returneaz antilogaritmul unei valori transformate
prin
logaritmare ntr-o baz specificat (baz).
=ASINH(x)
Returneaz valoarea transformat prin funcia arcsinh a unei valori
ce trebuie transformat.
=SINH(x)
Returneaz valoarea transformrii inverse a unei valori
transformat cu funcia arcsinh.
=SQRT(x)
Returneaz valoarea transformat prin extragerea radicalului dintr-o
valoare ce trebuie transformat.
=POWER(x,2)
Returneaz valoarea transformrii inverse a unei valori
transformat prin extragerea radicalului.
=DEGREES(ASIN(SQRT(x)))
Returneaz valoarea transformrii unei proporii (0
1) cu
ajutorul funciei arcsin.
=POWER(SIN(RADIANS(x)), 2)
Returneaz o proporie ( ) prin transformarea invers a unei valori
obinut cu ajutorul funciei arcsin ( ).
ESTIMAREA MEDIEI POPULAIONALE
Estimarea mediei populaionale poate fi obinut prin apelarea
meniului DATA > DATA ANALYSIS > DESCRIPTIVE
STATISTICS i completarea cmpurilor din fereastra de dialog
urmat de bifarea Summary statistics i Confidence Level for
Mean. Ultimul rnd din tabelul de rezultate conine valoarea
produsului dintre eroarea standard a mediei i valoarea critic a
distribuiei Student pentru (valoarea implicit este de 0,05) i 1
grade de libertate.

ANEXA 3: Funcii Microsoft Office Excel

209

=TINV(prob, gl)
Returneaz valoarea critic (Student) pentru un anumit nivel de
semnificaie (prob = ) i un anumit numr de grade de libertate (gl
= 1).

FI
R

ES

6.
TESTAREA UNEI IPOTEZE PRIVIND MEDIA UNEI
SINGURE POPULAII
=TINV(prob, gl)
Returneaz valoarea critic (Student) pentru un anumit nivel de
semnificaie (prob = ) i un anumit numr de grade de libertate (gl
= 1).
=TDIST(t, gl, cozi)
Returneaz probabilitatea asociat unei valori (Student) pentru un
anumit numr de grade de libertate (gl = 1) i n funcie de
varianta testului (cozi: 1 unilateral, 2 bilateral).

ZA

7.1.1. Testul t (Student) pentru probe independente


=TINV(prob, gl)
Returneaz valoarea critic (Student) pentru un anumit nivel de
semnificaie (prob = ) i un anumit numr de grade de libertate (gl
= 1).
=TDIST(t, gl, cozi)
Returneaz probabilitatea asociat unei valori (Student) pentru un
anumit numr de grade de libertate (gl = 1) i n funcie de
varianta testului (cozi: 1 unilateral, 2 bilateral).
Testul Student pentru probe independente se poate realiza prin
apelarea meniului DATA > DATA ANALYSIS > t-Test:
Two-Sample Assuming Unequal Variances i completarea
cmpurilor din fereastra de dialog. n cmpul Hypothesized Mean
Diference se completeaz valoarea 0.

210

Elemente de statistic aplicate n ecologie

7.2.1. Testul t (Student) pentru perechi de observaii


=TINV(prob, gl)
Returneaz valoarea critic (Student) pentru un anumit nivel de
semnificaie (prob = ) i un anumit numr de grade de libertate (gl
= 1).
=TDIST(t, gl, cozi)
Returneaz probabilitatea asociat unei valori (Student) pentru un
anumit numr de grade de libertate (gl = 1) i n funcie de
varianta testului (cozi: 1 unilateral, 2 bilateral).

ES

Testul Student pentru perechi de observaii se poate realiza prin


apelarea meniului DATA > DATA ANALYSIS > t-Test:
Paired Two Sample for Means i completarea cmpurilor din
fereastra de dialog. n cmpul Hypothesized Mean Diference se
completeaz valoarea 0.

ZA

FI
R

8.1.1. Testarea omogenitii varianei interne


=VAR(ref)
Returneaz valoarea varianei calculat ca suma ptratelor mprit
la gradele de libertate ( 1), a unui set de date (ref).
=LN(nr)
Returneaz valoarea logaritmului natural a unui numr (nr).
=CHIINV(prob, gl)
Returneaz valoarea critic
pentru un anumit nivel de
semnificaie (prob = ), un anumit numr de grade de libertate (gl =
1).
=CHIDIST(2, gl)
Returneaz probabilitatea asociat unei valori
pentru un anumit
numr de grade de libertate (gl =
1).
8.2.1. ANOVA model unifactorial
=FINV(prob, glext, glint)
Returneaz valoarea critic pentru un anumit nivel de semnificaie
(prob = ), un anumit numr de grade de libertate externe (glext =
1) i un anumit numr de grade de libertate interne (glint =
).

ANEXA 3: Funcii Microsoft Office Excel

211

=FDIST(F, glext, glint)


Returneaz probabilitatea asociat unei valori
pentru un anumit
numr de grade de libertate externe (glext =
1) i un anumit
numr de grade de libertate interne (glint = ).
Testul ANOVA model unifactorial se poate realiza prin apelarea
meniului DATA > DATA ANALYSIS > Anova: Single
Factor i completarea cmpurilor din fereastra de dialog.

FI
R

ES

8.2.2. ANOVA Kruskal-Wallis


=CHIINV(prob, gl)
Returneaz valoarea critic
pentru un anumit nivel de
semnificaie (prob = ) i un anumit numr de grade de libertate (gl
=
1).
=CHIDIST(2, gl)
Returneaz probabilitatea asociat unei valori
pentru un anumit
numr de grade de libertate (gl =
1).

ZA

8.2.3. ANOVA model bifactorial fr replicare


=FINV(prob, glext, glint)
Returneaz valoarea critic pentru un anumit nivel de semnificaie
(prob = ), un anumit numr de grade de libertate externe (glext =
1 sau glext =
1) i un anumit numr de grade de libertate
1).
interne (glint =
1
1
=FDIST(F, glext, glint)
Returneaz probabilitatea asociat unei valori
pentru un anumit
numr de grade de libertate externe (glext =
1 sau glext =
1)
i un anumit numr de grade de libertate interne (gl =
1
1
1).
Testul ANOVA model bifactorial cu o singur observaie n celul
se poate realiza prin apelarea meniului DATA > DATA
ANALYSIS > Anova: Two Factor Without Replication i
completarea cmpurilor din fereastra de dialog.

212

Elemente de statistic aplicate n ecologie

8.2.4. ANOVA Friedman


=CHIINV(prob, gl)
Returneaz valoarea critic
pentru un anumit nivel de
semnificaie (prob = ), un anumit numr de grade de libertate (gl =
1).
=CHIDIST(2, gl)
pentru un anumit
Returneaz probabilitatea asociat unei valori
numr de grade de libertate (gl =
1).

FI
R

ES

8.2.5. ANOVA model bifactorial cu replicare


=FINV(prob, glext, glint)
Returneaz valoarea critic pentru un anumit nivel de semnificaie
(prob = ), un anumit numr de grade de libertate externe (glext =
1 sau glext =
1 sau glext = (c1)(r1)) i un anumit numr
de grade de libertate interne (glint =
).
=FDIST(F, glext, glint)
Returneaz probabilitatea asociat unei valori
pentru un anumit
numr de grade de libertate externe (glext =
1 sau glext =
1
sau glext = (c1)(r1)) i un anumit numr de grade de libertate
interne (glint =
).

9.1.

ZA

Testul ANOVA model bifactorial cu o singur observaie n celul


se poate realiza prin apelarea meniului DATA > DATA
ANALYSIS > Anova: Two Factor With Replication i
completarea cmpurilor din fereastra de dialog.
Analiza Corelaiei
=CORREL(ref x, ref y)
Returneaz valoarea coeficientului de corelaie parametric Pearson
dintre valorile variabilei (ref x) i valorile variabilei (ref y).
=TINV(prob, gl)
Returneaz valoarea critic (Student) pentru un anumit nivel de
semnificaie (prob = ) i un anumit numr de grade de libertate (gl
= 2).

ANEXA 3: Funcii Microsoft Office Excel

213

=TDIST(t, gl, cozi)


Returneaz probabilitatea asociat unei valori (Student) pentru un
anumit numr de grade de libertate (gl = 2) i n funcie de
varianta testului (cozi: 1 unilateral, 2 bilateral).
Coeficientul de corelaie parametric Pearson se poate realiza prin
apelarea meniului DATA > DATA ANALYSIS >
Correlation i completarea cmpurilor din fereastra de dialog.
Analiza Regresiei
Analiza regresiei se poate realiza prin apelarea meniului DATA >
DATA ANALYSIS > Regression i completarea cmpurilor
din fereastra de dialog.

10.1.

Testul 2 de concordan
=CHIINV(prob, gl)
Returneaz valoarea critic
pentru un anumit nivel de
semnificaie (prob = ), un anumit numr de grade de libertate (gl =
1).
=CHIDIST(2, gl)
Returneaz probabilitatea asociat unei valori
pentru un anumit
numr de grade de libertate (gl =
1).
=BINOMDIST(x, k, p, cumulativ)
Returneaz probabilitatea binomial asociat numrului rezultatelor
de interes ( ), n funcie de a numrului total de ncercri ( ), i a
probabilitii obinerii unui anumit rezultat ( ), exprimat necumulat
(cumulative = false).
=POISSONDIST(x, x , cumulativ)
Returneaz probabilitatea Poisson asociat numrului rezultatelor de
interes ( ), n funcie de valoarea medie ( ), exprimat necumulat
(cumulative = false).

ZA

FI
R

ES

9.2.

214

Elemente de statistic aplicate n ecologie


2

Testul de asociere
=CHIINV(prob, gl)
Returneaz valoarea critic
pentru un anumit nivel de
semnificaie (prob = ) i un anumit numr de grade de libertate (gl
=
1
1 ).
2
=CHIDIST( , gl)
pentru un anumit
Returneaz probabilitatea asociat unei valori
numr de grade de libertate (gl =
1
1 ).

10.3.

Testul exact al lui Fisher


=FACT(x)
Returneaz valoarea !.

10.4.

Testul McNemar
=CHIINV(prob, gl)
Returneaz valoarea critic
pentru un anumit nivel de
semnificaie (prob = ) i un anumit numr de grade de libertate (gl
=
1
1 ).
=CHIDIST(2, gl)
pentru un anumit
Returneaz probabilitatea asociat unei valori
numr de grade de libertate (gl =
1
1 ).
=BINOMDIST(x, k, p, cumulativ)
Returneaz probabilitatea binomial asociat numrului rezultatelor
de interes ( ), n funcie de a numrului total de ncercri ( ), i a
probabilitii obinerii unui anumit rezultat ( ), exprimat necumulat
(cumulative = false).

ZA

FI
R

ES

10.2.

INDEX ALFABETIC

Bartlett, 105

ZA

FI
R

aleator, 9
amplitudine, 29
analiza varianei, 102
ANOVA, 102
ANOVA bifactorial cu replicare, 128
ANOVA bifactorial fr replicare, 118
ANOVA bifactorial neparametric
Friedman, 126
ANOVA unifactorial, 108
ANOVA unifactorial neparametric
Kruskal-Wallis, 116
atribut, 12

ES

coeficientul de corelaie Spearman, 146


coeficientul de determinare n corelaie,
150
compararea a dou probe
neindependente, 92
corelaie, 144
corelaie direct sau pozitiv, 144
corelaie invers sau negativ, 145
corelaie neparametric, 153
corelaie parametric, 147
corelaie, puterea, 146
covarian, 147

clasa modal, 24
clas median, 26
clase de frecven, 19
coeficient, 17
coeficient de corelaie, 145
coeficient de determinare n regresie, 162
coeficient de regresie, nlimea dreptei,
157
coeficient de regresie, panta dreptei, 157
coeficient de variaie, 32
coeficientul de corelaie Pearson, 146

date, 9, 12
deviaie standard, 30
deviaie standard a populaiei, 30
deviaie standard a probei, 30
diagrama frecvenelor, 18
dispersie, 44
dispersie aleatoare, 44
dispersie grupat, 44
dispersie uniform, 44
dispersie, indici de, 44
disproporionalitate, 184
distribuia binomial, 36
distribuia binomial negativ, 42
distribuia normal, 55
distribuia normal standard, 58
distribuia Poisson, 40
distribuia Student, 67

216
distribuia t, 67
distribuie bimodal, 24
distribuie multimodal, 24
distribuii probabilistice, 34

Elemente de statistic aplicate n ecologie


interval de confiden al mediei
populaionale, 68
interval de variaie, 29
ipotez, 74
ipotez alternativ, 75
ipotez nul, 75

E
eroare de genul I, 77
eroare de genul II, 77
eroare standard a mediei, 66
eroare , 77
eroare , 77
erori statistice, 77

K
Kruskal-Wallis, 116

Laplace, 65
Lincon-Petersen, 71

ES

ZA

grade de libertate, 31

Mann-Whitney, 89
matrice de contingen, 178
McNemar, 187
media probei, 27
median, 25
medie, 27
medie populaional, 27
meristic, 15
metode neparametrice, 61
metode parametrice, 61
metric, 15
mod, 23
model binomial, 49
model binomial negativ, 53
model Poisson, 51
Moivre, 65

FI
R

factor, 107
Fisher, 183
frecven proporional, 17
Friedman, 126

Hartley, 104
histograma frecvenelor, 20

I
independen, 10
indice de dispersie, 45
indice Green, 47
indicele Lincon-Petersen, 71
indicele Shannon-Weaver, 72
interaciunea factorilor, 108
interval de clas, 20

N
nivel al factorului, 107
nivel de confiden, 76

Index alfabetic
nivel de ncredere, 76
normalizare, 63

217

O
observaie, 9
omogenitatea varianei interne, 104

ES

rang, 13
raport, 17
rat, 17
regresie, 157
regresie, estimare individual, 164
regresie, estimarea funciei, 160
regresie, interval de confiden al
coeficientului, 162
regresie, testarea semnificaiei funciei,
161
regresie, zona de confiden a dreptei,
163
regula adunrii, 35
regula mpririi, 34

scal, 12
scal de interval, 14
scal de raport, 14
scal nominal, 12
scal ordinal, 13
scor , 58
Shannon-Weaver, 72
Snedecor-Fisher, 103
Spearman, 146, 153
stabilizarea varianei, 63
statistica inferenial, 65
statistica testului, 75
statistic, 10
statistic descriptiv, 23
Student, 67, 79, 85, 93

FI
R

ZA

parametru, 10
Pearson, 146, 149
Poisson, 40
poligonul frecvenelor, 21
populaie, 8
prag de semnificaie, 76
probabilitate, 34
prob, 8
probe independente, 85
probe neindependente, 85
procent, 17
proporie, 17

regula nmulirii, 35
relaii neliniare, 165
reprezentarea datelor, 17
reprezentarea variabilelor continui, 19
reprezentarea variabilelor discrete, 18

T
tendina central, 23
teorema limit central, 65
teorie, 74
test n variant bilateral, 76
test n variant unilateral, 76
test puternic, 77
test unilateral dreapta, 79
test unilateral stnga, 79
testarea diferenei dintre dou probe, 85
testarea diferenelor dintre trei sau mai
multe probe, 102
testarea ipotezelor statistice, etape, 78
teste statistice, 75

Elemente de statistic aplicate n ecologie

ES

valoare critic, 75
valoare individual, 9, 12
variabil, 9, 12
variabil continu, 15
variabil dependent, 143
variabil derivat, 16
variabil discontinu, 15
variabil discret, 15
variabil independent, 143
variabil nominal, 12
variabil ordinal, 13
variabil, tipuri, 12
variabilitate extern, 103
variabilitate intern, 103
variabilitate total, 103
variabilitatea, 29
varian, 30

ZA

FI
R

218
testul
sau Hartley, 104
testul 2 de asociere, 177
testul 2 de concordan, 173
testul Bartlett, 105
testul exact al lui Fisher, 183
testul McNemar, 187
testul Tukey, 112
testul (Wilcoxon), 96
testul (Mann-Whitney), 89
testul (Student) pentru o prob, 79
testul (Student) pentru perechi de
observaii, 93
testul (Student) pentru probe
independente, 85
transformarea arcsin, 64
transformarea arcsinh, 63
transformarea datelor, 63
transformarea invers, 64
transformarea logaritmic, 63
transformarea prin extragerea radicalului,
63
Tukey, 112

unitate de prob, 9

Wilcoxon, 96

Z
zon de acceptare a ipotezei nule, 80
zon de respingere a ipotezei nule, 80

S-ar putea să vă placă și