Sunteți pe pagina 1din 214

CUPRINS

INTRODUCERE ................................................................................................................. 7
1. CONCEPTE GENERALE .............................................................................................. 8
2. APRECIEREA I PREZENTAREA DATELOR ...................................................... 12
2.1. SCALE DE MSURARE I TIPURI DE VARIABILE .......................................................... 12
2.2. REPREZENTAREA DATELOR ....................................................................................... 17
3. DESCRIEREA STATISTIC A PROBELOR ECOLOGICE ................................. 23
3.1. TENDINA CENTRAL ............................................................................................... 23

U
3.2. VARIABILITATEA ...................................................................................................... 29

C
4. DISTRIBUII PROBABILISTICE ............................................................................. 34
ES
4.1. DISTRIBUIA BINOMIAL .......................................................................................... 36
4.2. DISTRIBUIA POISSON............................................................................................... 40
4.3. DISTRIBUIA BINOMIAL NEGATIV ......................................................................... 42
R

4.4. ESTIMAREA DISPERSIEI UNEI POPULAII .................................................................... 44


FI

4.4.1. Indici de dispersie ............................................................................................ 44


4.4.2. Modelul binomial ............................................................................................. 49
M

4.4.3. Modelul Poisson ............................................................................................... 51


4.4.4. Modelul binomial negativ................................................................................. 53
ZA

4.5. DISTRIBUIA NORMAL ............................................................................................ 55


4.5.1. Aprecierea normalitii datelor........................................................................ 61
5. STATISTIC INFERENIAL: ELEMENTE INTRODUCTIVE ........................ 65

5.1. ESTIMAREA MEDIEI POPULAIONALE ........................................................................ 65


5.2. ESTIMAREA UNEI PROPORII ..................................................................................... 71
5.3. ESTIMAREA EFECTIVULUI POPULAIONAL ................................................................ 71
5.4. ESTIMAREA INDICELUI DE DIVERSITATE.................................................................... 72
5.5. TESTAREA IPOTEZELOR STATISTICE .......................................................................... 74
6. TESTAREA UNEI IPOTEZE PRIVIND MEDIA UNEI SINGURE
POPULAII ............................................................................................................. 79
7. TESTAREA DIFERENEI DINTRE DOU PROBE .............................................. 85
7.1. COMPARAREA A DOU PROBE INDEPENDENTE .......................................................... 85
7.1.1. Testul (Student) pentru probe independente .................................................. 85
7.1.2. Testul (Mann-Whitney) ................................................................................. 89
7.2. COMPARAREA A DOU PROBE NEINDEPENDENTE ...................................................... 92
7.2.1. Testul (Student) pentru perechi de observaii ................................................ 93
7.2.2. Testul (Wilcoxon) .......................................................................................... 96
8. TESTAREA DIFERENELOR DINTRE TREI SAU MAI MULTE PROBE...... 102
8.1. PRINCIPIUL ANOVA .............................................................................................. 103
8.1.1. Testarea omogenitii varianei interne ......................................................... 104
8.2. TIPURI DE ANOVA................................................................................................. 107
8.2.1. ANOVA unifactorial ..................................................................................... 108
8.2.2. ANOVA unifactorial neparametric Kruskal-Wallis .................................... 116
8.2.3. ANOVA bifactorial fr replicare ................................................................ 118

U
8.2.4. ANOVA bifactorial neparametric Friedman .............................................. 126

C
8.2.5. ANOVA bifactorial cu replicare ................................................................... 128
ES
9. CORELAIA I REGRESIA..................................................................................... 143
9.1. ANALIZA CORELAIEI ............................................................................................. 144
9.1.1. Analiza corelaiei parametrice ....................................................................... 147
R

9.1.2. Analiza corelaiei neparametrice ................................................................... 153


FI

9.2. ANALIZA REGRESIEI ................................................................................................ 157


M

10. ANALIZA FRECVENELOR I A DATELOR NOMINALE ............................ 171


10.1. TESTUL DE CONCORDAN ............................................................................. 173
ZA

10.2. TESTUL DE ASOCIERE ...................................................................................... 177


10.3. TESTUL EXACT AL LUI FISHER............................................................................... 183
10.4. TESTUL MCNEMAR ............................................................................................... 187

BIBLIOGRAFIE ............................................................................................................. 192


ANEXA 1: CHEIE DIHOTOMIC PENTRU DETERMINAREA TIPULUI DE
ANALIZ STATISTIC ...................................................................................... 195
ANEXA 2: TABELE CU VALORI CRITICE .............................................................. 198
ANEXA 3: FUNCII MICROSOFT OFFICE EXCEL ............................................... 205
INDEX ALFABETIC ...................................................................................................... 215
INTRODUCERE

n prezent, valorificarea investigaiilor ecologice nu poate fi


conceput fr o analiz statistic a datelor, fr aa-numita asigurare
statistic ce red msura n care concluziile acestor investigaii ar putea fi
reale. Analiza statistic a datelor, fr a fi un scop n sine al demersului
tiinific n ecologie, reprezint o unealt ce permite o mai bun
comprehensiune i prezentare a informaiei coninute de rezultatele

U
cercetrilor.
n prezent, prelucrarea statistic a datelor este facilitat de utilizarea

C
computerului i a programelor corespunztoare. Utilizarea acestora trebuie
ES
s fie fcut numai dup nelegerea conceptelor i procedurilor metodelor
statistice. Altfel, aceste instrumente vor reprezenta un fel de cutie neagr
n care se introduc rezultatele cercetrilor i din care rezult nite concluzii
R

despre a cror corectitudine nu se poate spune mare lucru.


FI

Prezenta lucrare ncearc s ofere o baz conceptual pentru cei care


se dedic cercetrilor cu caracter ecologic. Din acest motiv, pe parcursul
M

capitolelor apar numeroase exemple inspirate din cercetri ecologice.


Lucrarea poate fi ns de ajutor i pentru analiza datelor rezultate n urma
ZA

investigaiilor din diverse ramuri ale biologiei sau ale tiinelor conexe.
n prima parte a crii sunt prezentate o serie de noiuni de baz n
statistic, care s asigure nelegerea limbajului intrinsec al acestei tiine.

Urmeaz o parte dedicat statisticii descriptive i principalelor distribuii


probabilistice cu aplicativitate n ecologie. Partea urmtoare trateaz
aspectele de principiu ale statisticii inductive i prezint principalele teste
care se utilizeaz pentru comparaia probelor. n continuare sunt prezentate
modaliti de analiz a asocierii dintre dou variabile, iar ultima parte
cuprinde metode de analiz ale frecvenelor. La finalul crii sunt trei anexe:
prima reprezint o cheie de decizie asupra metodelor statistice, prin care pot
fi prelucrate date, a doua cuprinde tabelele cu valorile critice necesare
pentru diferite teste statistice, iar a treia cuprinde funciile statistice din
programul MS-Excel. Cartea se termin cu un index alfabetic al termenilor
statistici folosii pe parcursul lucrrii.
1. CONCEPTE GENERALE

Statistica reprezint o parte important din preocuprile actuale ale


biologilor i ecologilor. Termenul statistic este folosit n dou ipostaze:
fie se refer la colecii de informaie cantitativ i la metode de procesare a
acestora, fie la procesul de stabilire a unor concluzii privind grupuri de
dimensiuni mari, n urma analizei unor pri din aceste grupuri.
Statistica este tiina care se ocup cu organizarea, descrierea i

U
analiza numeric a fenomenelor cuantificabile, dezvluind particularitile

C
lor de volum, structur, dinamic, conexiune, precum i regulile sau legile
care le guverneaz.
ES
Pentru ecologi i pentru cei care, n general, studiaz fenomene
variabile cu implicaii preponderent probabilistice, statistica este util pentru
dirijarea colectrii, organizrii i prezentrii datelor, precum i pentru
R

tragerea concluziilor cu o anumit probabilitate sau grad de incertitudine de


FI

pe urma analizei datelor.


Trebuie menionat c o analiz statistic nu demonstreaz nimic, ci
M

doar indic probabilitatea unui anumit rezultat sau concluzii trase n urma
ZA

analizei datelor.
Att n statistic, ct i n cadrul ecologiei i a celorlalte ramuri ale
biologiei, apare noiunea de populaie. Accepiunea biologic a acestui
termen este de grup de indivizi ce aparin unei anumite specii, ntre care se

stabilesc interaciuni i ale cror gene alctuiesc un genofond omogen. Din


punct de vedere statistic, populaia are un neles mai larg dect cel biologic,
referindu-se la o colecie de uniti individuale, ce constituie obiectul unei
investigaii. Populaia statistic reprezint un grup de entiti de un anumit
tip din univers sau dintr-o subdiviziune specificat a universului. Este
grupul de dimensiuni mari pe care dorim s-l cunoatem. Aa cum spuneam
n primul paragraf, cunoaterea unui astfel de grup sau populaii se poate
face prin intermediul analizei unei pri. O astfel de parte, care este extras
din populaie pentru a fi studiat, se numete n general eantion sau prob.
Noi vom folosi n continuare noiunea de prob bine ncetenit n
Concepte generale 9
comunitatea tiinific ecologic. Deci proba este un grup mai mic, dar
reprezentativ pentru populaia din care a fost extras.
Studiul unei populaii presupune investigarea uneia sau mai multor
caracteristici ale unitilor din probe, caracteristici care se numesc variabile.
Valorile unei variabile corespunztoare entitilor unei populaii se numesc
valori individuale. Valorile individuale cunoscute, corespunztoare
unitilor din probe, se numesc date sau observaii.
n ecologie, de multe ori, se numr entitile dintr-un grup sau
dintr-o colecie. Pentru ca o astfel de numrtoare s aib valoare, trebuie
specificat dimensiunea grupului sau coleciei, care se numete unitatea de
prob. Un set de uniti de prob alctuiesc o prob, iar observaia este
numrul de entiti dintr-o anumit unitate de prob.

U
Principala diferen dintre numrtori i msurtori este, n cazul
msurtorilor, lipsa unui control asupra dimensiunii unitilor de prob.

C
Atunci cnd se numr entiti, se poate decide care este unitatea de prob.
ES
Coninutul unei capcane sau ptrat de prob reprezint o prob dac
entitile investigate sunt msurate, i o unitate de prob dac entitile sunt
doar numrate.
R

O ntrebare cu un rspuns nu ntotdeauna evident se refer la


FI

identificarea populaiei din care provin unitile de prob. Dac ceea ce s-a
capturat din zece capcane de sol constituie o prob, care este populaia din
M

care a fost extras aceast prob? n acest caz, populaia este reprezentat de
numrul total de capcane care ar fi putut fi instalate n ntreaga suprafa de
ZA

studiu. O astfel de populaie este una ipotetic.


Pentru ca o prob s fie reprezentativ pentru populaia din care a
fost extras este necesar ca prelevarea acesteia s fie fcut aleator,

randomizat sau la ntmplare. Aceasta nseamn c unicul criteriu folosit


n extragerea unitilor de prob este ca toate unitile s aib anse egale de
a face parte din prob. De exemplu, dac proba se obine cu ajutorul unor
capcane cu momeal, animalele care vor cdea n acestea vor fi cele mai
flmnde i eventual cu o greutate mai mic. Astfel, proba obinut nu va fi
reprezentativ pentru populaie, deoarece animalele cu o greutate mai mic
au anse mai mari s fie capturate dect cele cu o greutate mai mare i care
sunt mai stule. Dac proba nu este reprezentativ, atunci generalizrile care
se vor face pornind de la aceasta, cu privire la ntreaga populaie, vor fi
eronate. Dac ne referim la exemplul anterior, proba obinut cu ajutorul
10 Elemente de statistic aplicate n ecologie
capcanelor cu momeal este reprezentativ pentru populaia statistic a
animalelor flmnde din populaia biologic. Obinerea unor probe aleatoare
este asigurat de metodele de lucru utilizate n funcie de caracteristicile
entitilor urmrite. n cazul n care exist suspiciunea c o prob nu este
aleatoare, acest lucru trebuie specificat sau concluziile rezultate prin
extrapolare trebuie legate de populaia statistic din care proba a fost
extras.
Un alt aspect important este reprezentat de independena
observaiilor din probe. Aceasta se refer la faptul c apariia unei anumite
valori individuale ntr-o prob nu influeneaz probabilitatea de apariie n
prob a altei valori. De exemplu, dac se studiaz o populaie ipotetic
format din zece entiti, probabilitatea de a extrage o entitate este de 1/10,

U
iar dac nu se face reintroducere, probabilitatea de a extrage urmtoarea
entitate este de 1/9 i aa mai departe. Deci extragerea unei entiti

C
modific probabilitatea de extragere a celorlalte i observaiile nu sunt
ES
independente. O astfel de situaie nu trebuie s constituie un motiv de
preocupare n cazul populaiilor mari, aa cum sunt majoritatea populaiilor
biologice.
R

Uneori, obinerea unor observaii neindependente este intenionat.


FI

De exemplu, cnd se dorete studierea efectului unui anumit tratament


asupra variabilei, se fac observaii repetate asupra acelorai entiti pentru a
M

evidenia dac deosebirile dintre observaii sunt diferite semnificativ, adic


dac tratamentul a modificat valorile variabilei semnificativ. Dac ns se
ZA

fac observaii repetate asupra unei singure entiti, atunci concluziile


rezultate nu pot fi extrapolate la populaia de provenien a entitii
respective, deoarece proba cu dimensiunea unu nu este reprezentativ.

Un descriptor sau o msur a unei variabile n prob se numete


statistic. O statistic a unei probe se folosete de obicei pentru a estima un
parametru al populaiei. De exemplu, media valorilor dintr-o prob este o
statistic, iar media populaiei din care a fost extras proba, un parametru.
Dat fiind faptul c n ecologie sunt rare cazurile n care se poate afla media
unei populaii prin investigarea fiecrei uniti de prob, media populaiei
respective poate fi estimat pornind de la statistica probei reprezentative.
Populaiile ipotetice au parametri ipotetici i sunt de obicei folosite
pentru comparaii. De exemplu, media numrului de plante dintr-o anumit
specie din zece ptrate de 1 este o estimare a mediei numrului de plante
Concepte generale 11
per ptrat sau metru ptrat, adic parametrul populaiei de ptrate care s-ar
putea delimita n aria de studiu. Astfel de parametri sunt utili atunci cnd se
compar diferite zone de studiu (dou zone stepice, dou zone de pdure,
dou bazine acvatice etc.).
Atunci cnd se estimeaz un parametru populaional pornind de la
statistica corespunztoare, dimensiunea probei sau numrul unitilor de
prob are o mare importan. n general, cu ct proba are o dimensiune mai
mare, cu att va fi mai reprezentativ pentru populaia de provenien i
estimarea parametrilor mai precis. Totui obinerea unor probe extrem de
numeroase este uneori imposibil sau presupune un efort foarte mare care ar
putea fi investit n alte direcii de cercetare. Astfel, este bine s existe un
echilibru ntre aceste dou aspecte, ntre dimensiunea probei i efortul

U
necesar obinerii acesteia.

C
ES
R
FI
M
ZA

2. APRECIEREA I PREZENTAREA DATELOR

Variabilele sunt caracteristici sau caractere care au valori ce pot fi


diferite de la un individ la altul, ntr-o populaie. Deci o variabil poate lua
mai multe valori individuale n populaia studiat. Valorile individuale
determinate prin investigarea unor indivizi sau uniti dintr-o prob se
numesc date.

U
C
2.1. SCALE DE MSURARE I TIPURI DE VARIABILE
ES
De exemplu, ntr-o populaie de peti dintr-o anumit specie, se
investigheaz lungimea indivizilor. Lungimea reprezint o caracteristic sau
un caracter al tuturor indivizilor din populaie, deci este o variabil.
R

Lungimea petilor are valori diferite de la un individ la altul sau de la un


FI

grup de indivizi la altul. Aceste valori ale tuturor indivizilor din populaie se
numesc valori individuale. Dac se captureaz un anumit numr de peti (se
M

extrage o prob) din populaia de studiu i se msoar lungimea fiecrui


ZA

individ, valorile individuale astfel determinate constituie datele.


n funcie de relaiile ce se pot stabili ntre valorile individuale ale
unei variabile, aceasta poate aparine unui anumit tip de variabil, care la
rndul su poate fi apreciat pe o anumit scal cu anumite reguli i limitri.

n general, sunt recunoscute patru astfel de scale de apreciere a variabilelor:


nominal, ordinal, de interval i de raport. Relaia dintre aceste scale
este una ierarhic, adic o scal de nivel superior ncorporeaz proprietile
scalelor inferioare acesteia.

Scala nominal. Este cea mai simpl modalitate de apreciere a


variabilelor. n esen, permite doar identificarea categoriilor n care valorile
individuale pot fi clasificate. Categoriile se exclud reciproc, adic o anumit
valoare poate aparine doar unei singure categorii din scal. Variabilele
corespunztoare acestei scale se numesc variabile nominale sau atribute.
Aprecierea i prezentarea datelor 13
Oricare dou valori ale unei astfel de variabile pot aparine aceleiai
categorii sau la dou categorii diferite ale scalei ordinale, cu alte cuvinte pot
fi egale sau diferite (tab. 2.2).
De exemplu, sexul indivizilor unei populaii este o variabil
nominal, ale crei valori individuale posibile sunt mascul i femel. Doi
indivizi dintr-o populaie pot avea acelai sex (mascul sau femel) sau pot
avea sexe diferite (unul este mascul, cellalt este femel) la un moment dat.
Deci valorile variabilei sex pot fi egale (aparin aceleiai categorii a scalei
nominale) sau diferite (aparin la categorii diferite ale scalei nominale). Alte
exemple de variabile nominale ntlnite n ecologie sunt: culoarea, tipul de
habitat, specia.

U
Scala ordinal. Aceasta include proprietile scalei nominale
(identificare i clasificare), la care se mai adaug posibilitatea de ordonare a

C
categoriilor ntr-o serie, de la valoarea cea mai mic la cea mai mare, sau de
ES
specificare a magnitudinii acestora. Variabilele corespunztoare acestei
scale se numesc variabile ordinale. Oricare dou valori ale unei astfel de
variabile pot fi egale sau diferite. n cazul n care sunt diferite, valorile se
R

pot ordona, adic se poate spune c una dintre valori este mai mare dect
FI

cealalt (tab. 2.2). n general, valorile variabilelor ordinale se reprezint sub


form de magnitudine relativ.
M

De exemplu, dac ntr-o populaie de lupi urmrim variabila


agresivitate, valorile individuale pot fi neagresiv, puin agresiv,
ZA

agresiv i foarte agresiv. Doi indivizi pot fi egali sau diferii din punctul
de vedere al agresivitii, iar dac sunt diferii, atunci se poate determina c
unul este mai agresiv dect cellalt (c o valoare este mai mare dect

cealalt), dar nu se poate spune exact cu ct.


O alt modalitate de a reprezenta valorile pe scala ordinal const n
folosirea unor simboluri numerice corespunztoare magnitudinii valorilor,
numite ranguri. Rangurile sunt utile mai ales cnd se urmrete
reprezentarea unei variabile pe o scal cu mai multe categorii ordinale.
Astfel, valoarea cea mai mic, neagresiv din exemplul anterior, primete
rangul unu, urmtoarea doi i aa mai departe.
Un exemplu de scal ordinal este scala DAFOR (acronimul este
format prin preluarea primei litere a valorilor scalei), utilizat pentru
aprecierea abundenei unei specii de plante ntr-un ptrat de prob (tab. 2.1).
14 Elemente de statistic aplicate n ecologie

Tabelul 2.1
Valoare Dominat Abundent Frecvent Ocazional Rar
Rang 5 4 3 2 1

Trebuie reinut c valorile numerice ale rangurilor nu pot fi folosite


pentru a efectua operaii simple, deoarece acestea nu au sens valoarea
abundent nu este de dou ori mai mare dect valoarea ocazional sau
diferena dintre valoare dominant i valoarea abundent poate s nu fie
egal cu cea dintre valorile ocazional i rar. Rangurile sunt doar
simboluri numerice care arat magnitudinea valorilor sau poziia lor n setul
de valori ordonate.

U
Scala de interval. Permite att ordonarea datelor, ct i precizarea

C
distanei dintre unitile scalei. Valorile exprimate pe aceast scal pot fi
ES
sczute unele din altele pentru a afla exact care este diferena dintre ele. Din
cauza faptului c scala de interval nu are o valoare zero absolut, nu se
poate realiza mprirea valorilor pentru a afla cu ct una este mai mare
R

dect cealalt (tab. 2.2).


De exemplu, variabila de tip dat este apreciat pe o scal de
FI

interval. Dac trei specii de psri de talie mic (paseriforme) revin din
M

migraie pe 5, 10 i 15 mai, putem spune c a treia specie ajunge cu zece zile


mai trziu dect prima, dar nu putem spune c are nevoie de trei ori mai
ZA

mult timp pentru a ncheia migraia. Un alt exemplu de scal de interval este
scala Celsius de apreciere a temperaturii: 0 este o valoare convenional,
aleas s desemneze temperatura de nghe a apei. Ca urmare, o temperatur

de 10 nu nseamn de dou ori mai cald dect 5 . Datorit faptului c


scala Celsius de apreciere a temperaturii nu are un zero absolut, aceasta
prezint i valori negative care nu ar putea exista n cazul unei valori zero
absolute.

Scala de raport. Pe lng proprietile celorlalte scale (identificare,


clasificare, ordonare, precizarea diferenei), aceasta mai permite i
mprirea valorilor unele la altele pentru a putea afla de cte ori una este
mai mare dect cealalt (tab. 2.2).
De exemplu, lungimea se apreciaz pe scal de raport, iar o lungime
de 30 este de trei ori mai mare dect una de 10 .
Aprecierea i prezentarea datelor 15
Aceast proprietate este posibil datorit faptului c scalele de raport
au valori zero absolute, adic zero nseamn nimic, vid. Ca urmare, aceste
scale nu pot prezenta valori negative.
De exemplu, scala Kelvin de apreciere a temperaturii este o scal de
raport, deoarece valoarea 0 ( 273,15 ) reprezint temperatura fa de
care nimic nu poate fi mai rece i la care n materie nu mai exist energie
sub form de cldur.

Variabilele corespunztoare scalei de interval i scalei de raport pot


fi de dou tipuri: discontinui i continui.
Variabilele discontinui sau discrete pot lua anumite valori (de
obicei, ntregi i pozitive), ntre care nu exist valori intermediare. Aceste

U
variabile reprezint caractere numrabile sau meristice (numr de solzi,
numr de ou, numr de elemente florale, numr de pui etc.). De exemplu,

C
dimensiunea pontei unei psri este o variabil discret, ale crei valori sunt
ES
ntregi i pozitive; nu exist cuiburi cu numr fracionar de ou.
Variabilele continui pot lua orice valoare dintr-un anumit interval,
iar ntre oricare dou valori exist o infinitate de valori posibile. Aceste
R

variabile reprezint caractere msurabile sau metrice (lungime, lime,


FI

nlime, greutate, temperatur etc.). De exemplu, ntre 10 i 11 pot


exista, n principiu, o infinitate de valori posibile, n funcie de numrul
M

zecimalelor considerate.
ZA

Tabelul 2.2. Caracteristicile eseniale ale tipurilor de variabile


Scala de apreciere a variabilelor Semnele care se pot pune ntre valori
Nominal ;

Ordinal ; ; ;
De interval ; ; ; ;
De raport ; ; ; ; ;

Conversia datelor de la o scal la alta


Conversia datelor se poate face doar n sensul pierderii unei pri din
informaia deinut de acestea. Ca urmare, conversia se poate face doar de la
o scal superioar ierarhic ctre una de nivel inferior. Astfel, datele
msurate pe o scal de interval sau de raport pot fi convertite la o scal
ordinal sau nominal. Datele msurate pe o scal ordinal pot fi convertite
doar la o scal nominal.
16 Elemente de statistic aplicate n ecologie
Exemplul 2.1. Dac s-au determinat nlimile unor plante de step
n centimetri, variabila urmrit, nlimea, este una continu, exprimat pe
o scal de raport. Pentru a realiza conversia la o scal ordinal, se dau
ranguri valorilor iniiale. Astfel, valoarea cea mai mic va primi rangul 1,
urmtoarea 2, iar valoarea cea mai mare va primi rangul maxim. nlimea
de 13 va primi rangul 1, ceea ce arat c este vorba de valoarea cea mai
mic, iar nlimea de 23 va primi rangul 9, adic valoarea maxim din
prob. Valorile egale ale nlimii vor primi media rangurilor pe care le-ar fi
primit dac ar fi fost diferite. Observm n tabelul 2.3 c exist trei valori
egale, de 15 , i alte dou valori egale ntre ele, de 17 . Cele trei
valori de 15 , dac ar fi fost diferite, ar fi primit rangurile 2, 3 i 4. Fiind
egale, primesc media rangurilor pe care le-ar fi primit dac ar fi fost diferite,

U
adic 2 3 4 /3 3. La fel se procedeaz i n cazul celor dou valori
de 17

C
media rangurilor pe care le-ar fi primit dac ar fi fost diferite
este 5 6 /2 5,5. n continuare, pentru conversia la o scal ordinal,
ES
se consider o valoare de referin a nlimii din prob, dup care toate
celelalte valori se exprim n relaie cu aceasta: egale cu valoarea de
referin sau diferite de aceasta. Dac din anumite motive ne intereseaz
R

plantele cu nlimea de 17 , atunci vom avea dou valori 17 i


FI

apte valori 17
M

Tabelul 2.3
nlimea (cm), scal de
ZA

13 15 15 15 17 17 19 21 23
interval sau raport
Ranguri intermediare
1 2 3 4 5 6 7 8 9
(dac valorile ar fi diferite)

Ranguri, scal ordinal 1 3 3 3 5,5 5,5 7 8 9


Valori nominale, scal
17 17 17 17 =17 =17 17 17 17
nominal

Cea mai frecvent conversie este cea de la datele apreciate pe o scal


de interval sau de raport, la una ordinal. O astfel de conversie este necesar
atunci cnd datele vor fi analizate prin metode neparametrice, deoarece nu
sunt ndeplinite condiiile de aplicare ale metodelor parametrice.

Variabile derivate
n anumite situaii, variabilele originale sunt procesate matematic,
Aprecierea i prezentarea datelor 17
astfel nct s rezulte variabile derivate cum ar fi: rapoarte, proporii,
procente i rate.
Raportul este o relaie simpl ntre dou numere. De exemplu, dac
lungimea capului la o viper de step este 17,7 i limea de 11,7 ,
raportul lungime:lime este de 17,7: 11,7. Implicit, raportul lime:lungime
este de 11,7: 17,7. Uneori, una dintre valori poate fi convertit prin
mprire la unitate. De exemplu, dac ntr-o prob sunt 19 i
27 , atunci raportul masculi:femele este 19: 27 sau 1: 27/19, adic
1: 1,421. Raportul poate fi scris i ca o fracie. n cazul exemplului anterior,
raportul dintre masculi i femele este de 19/27 1/1,421. Rezultatul
calculrii fraciei se numete coeficient; astfel, 1/1,421 0,704.
Proporia este raportul dintre parte i ntreg. Dac lungimea total a

U
unei vipere de step este 490 , iar lungimea cozii este 65 , proporia
reprezentat de coad este 65: 490 0,13. Dac se calculeaz o proporie

C
pornind de la raportul dintre numrul de valori dintr-o categorie i numrul
ES
total de valori din toate categoriile, atunci aceasta se numete frecven
proporional.
Procentul se obine prin nmulirea valorii unei proporii cu 100.
R

Rata reprezint raportarea unei observaii la unitatea de timp. Ratele


FI

se folosesc pentru a exprima anumite variabile cum ar fi creterea, dinamica


unei populaii, micarea.
M

De exemplu, dac o plantul crete 15 n 10 , atunci rata de


ZA

cretere este de 15/10 1,5 / .

Numeroi indici ecologici cum ar fi indicii de diversitate sunt de fapt


variabile derivate. Uneori acestea pot fi analizate prin metode statistice dar

numai dup o conversie sau transformare prealabil a datelor.

2.2. REPREZENTAREA DATELOR

Unul dintre inconvenientele majore ale prezentrii datelor sub form


de tabele const n faptul c informaia nu este evident imediat. Ea poate fi
perceput doar dup o analiz n detaliu a fiecrei valori sau a majoritii
valorilor din tabel. Pentru facilitarea percepiei informaiei coninute de
date, este necesar procesarea i transformarea acestora ntr-o prezentare
vizual. Modalitatea cea mai des utilizat de prezentare a datelor const n
18 Elemente de statistic aplicate n ecologie
folosirea reprezentrilor grafice. Tipul de reprezentare grafic se alege n
funcie de tipul de variabil.
Reprezentarea variabilelor discrete. Procesarea datelor const n
acest caz n aranjarea lor n tabelul de distribuie a frecvenelor, adic se
prezint fiecare valoare a variabilei i frecvena corespunztoare acesteia,
adic de cte ori se ntlnete o anumit valoare n prob.
Exemplul 2.2. ntr-un studiu se urmrete numrul de fitoindivizi
(de plante) din specia Crambe tataria n 20 de ptrate de 10x10 m dintr-o
pajite stepic. Tabelul de distribuie a frecvenelor se prezint astfel:

Tabelul 2.4
Nr. fitoindivizi/ptrat ( ) 0 1 2 5 7 10 16 19 38 60

U
Frecvena ( ) 5 4 3 1 1 2 1 1 1 1

C
n continuare se reprezint grafic pe abscis valorile ordonate ale
ES
variabilei ( ), iar pe ordonat valorile frecvenelor ( ) corespunztoare
valorilor variabilei. Practic, frecvena fiecrei valori a variabilei este
reprezentat printr-o coloan cu nlime corespunztoare. Se obine astfel o
R

diagram n coloane (dreptunghiuri) a distribuiei frecvenelor unei variabile


discrete. Trebuie remarcat spaiul dintre coloanele corespunztoare valorilor
FI

ordonate ale variabilei acesta sugereaz absena valorilor intermediare


M

dintre valorile alturate ale unei variabile discrete (fig. 2.1).


ZA

6
5

4
f 3
2
1
0
0 1 2 5 7 10 16 19 38 60
x
Figura 2.1. Diagrama reprezentrii frecvenelor prin coloane

Diagrama poate fi realizat i prin reprezentarea frecvenelor prin


Aprecierea i prezentarea datelor 19
puncte (fig. 2.2). n acest caz, se impune ca acestea s nu fie unite, pentru a
sugera, ca i n cazul spaiului dintre coloanele graficului anterior, c este
vorba de valorile unei variabile discontinue.

6
5
4

f 3
2
1

U
0

C
0 1 2 5 7 10 16 19 38 60
ES
x
Figura 2.2. Diagrama reprezentrii frecvenelor prin puncte
R

Aceleai tipuri de reprezentri pot fi utilizate i pentru reprezentarea


distribuiei frecvenelor variabilelor nominale i a celor ordinale. n cazul
FI

variabilelor nominale, ordinea valorilor acestora pe abscis este arbitrar.


M

Reprezentarea variabilelor continui. Datorit faptului c


variabilele continui iau valori din aproape n aproape, exist posibilitatea ca
ZA

o prob s nu conin nici mcar dou valori identice. Ca urmare, nu se mai


poate opera cu frecvena unei singure valori, pentru c, ntr-o astfel de
situaie, toate valorile fiind diferite, vor avea frecvena egal cu 1, adic vor

aprea n prob o singur dat. Astfel, n cazul n care se dorete


reprezentarea distribuiei frecvenelor valorilor unei variabile continui, este
necesar gruparea valorilor din prob n clase de frecven, ceea ce implic
parcurgerea mai multor etape de procesare a datelor:
1. Aflarea numrului de clase. Numrul de clase ( ) este rezultatul
rotunjit la cel mai apropiat ntreg, ce se poate afla folosind una din
urmtoarele dou relaii:

1 3,3 sau 5
numrul de valori din prob.
20 Elemente de statistic aplicate n ecologie
2. Aflarea intervalului de clas. Intervalul de clas ( ) este rezultatul
relaiei:

valoarea maxim (cea mai mare) din prob;


valoarea minim (cea mai mic) din prob.

3. Aflarea limitelor fiecrei clase. Pentru fiecare clas trebuie aflat


limita inferioar ( ) i limita superioar ( ). n general, relaia dintre
cele dou valori pentru oricare clas este:

U
C
Limita inferioar a primei clase va fi egal cu valoarea cea mai mic
ES
din prob dac aceasta este un numr ntreg, adic pentru 1,
. Dac nu este un ntreg, atunci va fi ntregul aflat prin
rotunjirea prin lips al lui . Limita superioar a primei clase se va afla
R

adunnd la valoarea minim sau la limita inferioar a clasei valoarea


FI

intervalului de clas, conform relaiei:


M

sau .
ZA

Pentru a afla , la se va aduga 1. Astfel, ntre cele dou


clase nu va exista nici un fel de suprapunere, adic o valoare din prob egal
cu va face parte doar din prima clas. n acest fel se vor afla limitele

celorlalte clase. Ultima clas, , va trebui s includ valoarea cea mai mare
din prob, adic pe .

4. Aflarea frecvenei fiecrei clase. Frecvena claselor se va afla prin


numrarea valorilor din prob cuprinse ntre limita inferioar i cea
superioar a fiecrei clase. n final, trebuie ca fiecare valoare din prob s
fie inclus ntr-una din clase. Suma frecvenelor tuturor claselor trebuie s
fie egal cu numrul de valori din probe, adic .
Frecvenele claselor se pot reprezenta sub forma unei histograme.
Spre deosebire de diagrama frecvenelor prezentat pentru variabilele
Aprecierea i prezentarea datelor 21
discrete, histograma are coloanele unite, ceea ce sugereaz continuitatea
dintre clasele de frecven ale valorilor unei variabile continui.
O alt modalitate de reprezentare a frecvenelor claselor este i
poligonul frecvenelor. Acesta se construiete prin unirea punctelor ale cror
coordonate sunt reprezentate de mijlocul intervalului de clas i de frecvena
clasei respective. Mijlocul intervalului de clas se afl calculnd media
aritmetic dintre limitele fiecrei clase:

mijloculclasei .

Toate rezultatele obinute n urma procesrii datelor se nscriu n


tabelul de frecvene (tab. 2.5), care trebuie s cuprind: clasa, limitele clasei,

U
mijlocul intervalului de clas i frecvena fiecrei clase.

C
Exemplul 2.3. n cadrul unui studiu s-a msurat lungimea n mm a
ES
100 de peti dintr-o anumit specie.
R

194 140 226 269 284 243 303 235 229 239
206 262 233 307 285 180 248 205 284 191
FI

154 224 307 236 198 288 241 252 385 220
M

299 273 275 164 137 357 246 271 246 276
229 280 227 253 286 190 291 297 296 288
ZA

225 234 244 351 267 265 239 283 190 244
288 245 289 241 289 278 255 253 240 153
208 328 235 283 214 300 228 204 343 228

194 233 218 321 303 254 225 232 196 245
223 305 220 338 269 224 319 259 240 293

100
1 3,3 100 7,6 8
385
137
31
22 Elemente de statistic aplicate n ecologie
Tabelul 2.5. Tabelul de distribuie a frecvenelor claselor de lungime (mm)
k xinf xsup mijloc f F (f cumulat)
1 137 168 152,5 5 5
2 168 199 183,5 8 13
3 199 230 214,5 19 32
4 230 261 245,5 27 59
5 261 292 276,5 23 82
6 292 323 307,5 12 94
7 323 354 338,5 4 98
8 354 385 369,5 2 100

30
25

U
Frecvena (f)

20

C
15
ES
10
5
R

0
FI

1 2 3 4 5 6 7 8
M

Clasa (k)
ZA

Figura 2.3. Histograma frecvenelor

30

25
Frecvena (f)

20
15
10
5
0
152.5 183.5 214.5 245.5 276.5 307.5 338.5 369.5

Clasa (mijloc)
Figura 2.4. Poligonul frecvenelor
3. DESCRIEREA STATISTIC A PROBELOR
ECOLOGICE

Statistica descriptiv este partea statisticii care se ocup de culegerea


i de clasificarea datelor statistice i, pe aceast baz, de descrierea
fenomenelor investigate. Rolul ei este de a rezuma cantitativ informaia
culeas, de a descrie i de a pune n eviden esenialul, n fine, de a realiza
sinteze cu ajutorul unui limbaj numeric.

U
n natur, atunci cnd investigm o populaie, rareori ntlnim valori

C
individuale identice ale unor variabile. La o privire mai atent a datelor, se
poate observa existena unor valori n jurul crora tind s se distribuie
ES
majoritatea, dac nu toate celelalte valori individuale. Descrierea statistic a
probelor prelevate din populaii scoate n eviden dou aspecte eseniale:
R

tendina central i variabilitatea valorilor individuale.


FI

3.1. TENDINA CENTRAL


M

Tendina central a unor date reprezint o valoare sau o condiie


ZA

reprezentativ pentru toate datele din prob sau pentru valorile individuale
din populaie. De exemplu, enunuri ca majoritatea florilor dintr-o prob au
culoarea roie sau diametrul mediu al florilor este de 2 cm surprind

tocmai aceast tendin central a valorilor individuale din probe.


n funcie de scala de apreciere a datelor din prob i implicit a
caracteristicilor tipului de variabil urmrit, exist mai multe msuri sau
descriptori ai tendinei centrale, dintre care cei mai des utilizai sunt: modul,
mediana i media.

Modul (Mo). Msura tendinei centrale, reprezentat de valoarea din


prob cu frecvena cea mai mare, adic cel mai des ntlnit, se numete
mod. De exemplu, dac o prob este reprezentat de 20 de plante la care se
urmrete culoarea florilor, iar zece dintre acestea au flori de culoare roie,
apte au flori de culoare violet i trei sunt grena, atunci modul probei va fi
24 Elemente de statistic aplicate n ecologie
valoarea rou a variabilei culoarea florilor. Aa cum reiese din acest
exemplu, modul se poate folosi pentru descrierea tendinei centrale a unei
variabile apreciate pe o scal nominal; de fapt este singurul descriptor de
acest fel ce se poate folosi pentru valorile unei variabile nominale. Modul se
poate folosi i pentru celelalte tipuri de variabile ordinale, discrete i
continui. n cazul variabilelor continui, se poate ca modul s nu poat fi
aplicat. Dat fiind faptul c aceste variabile iau valori din aproape n aproape
i c ntre oricare valori alturate exist un numr infinit de valori posibile,
se poate ntmpla ca ntr-o prob toate valorile s fie diferite, caz n care
frecvena fiecrei valori va fi egal cu unu. Deci, ntr-o astfel de situaie, nu
exist nici o valoare cu frecven mai mare dect celelalte i modul nu se
poate calcula dect pentru clasele de frecven.

U
n exemplul 2.3 lungimea petilor este o variabil continu. Modul
probei este 288, pentru care exist 3 valori. Dac toate valorile ar fi fost

C
diferite, atunci s-ar fi putut afla clasa modal de distribuie a frecvenelor ca
ES
fiind clasa cu frecvena cea mai mare. n cazul exemplului luat n discuie,
clasa modal este clasa nr. 4 cu frecvena 27.
Dac ntr-o distribuie a frecvenelor apar mai multe vrfuri de
R

frecven sau moduri, aceasta va fi numit distribuie multimodal. Multe


FI

caractere rspunztoare de dimorfismul sexual prezint n populaii o


distribuie bimodal. n figura 3.1 apare o astfel de distribuie bimodal:
M

modul pentru femele este 29 de plci subcaudale, iar pentru masculi este 37.
ZA

8
masculi
7

6
5
femele
f 4
3
2
1
0
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41

Nr. subcaudale
Figura 3.1. Diagrama distribuiei frecvenelor numrului de subcaudale la
Vipera ursinii moldavica
Descrierea statistic a probelor ecologice 25
n cazul unor astfel de distribuii, care nu sunt simetrice fa de o
singur valoare a tendinei centrale, se recomand ca analiza statistic s se
fac separat, pe categorii discrete din prob masculi, femele, juvenili
pentru care datele se prezint mai mult sau mai puin simetrice.

Mediana (Me). Este msura tendinei centrale care reprezint


valoarea central sau media valorilor centrale ale unui set de date ordonate
cresctor. Valoarea central este cea care, n setul de date ordonat cresctor,
este precedat i succedat de acelai numr de valori individuale. Rezult
c mediana se poate utiliza pentru date care se pot ordona, adic pentru date
msurate pe o scal de raport, interval sau ordinal, i se poate folosi pentru
datele apreciate pe o scal nominal. Este considerat una dintre cele mai

U
robuste msuri ale tendinei centrale, deoarece nu este influenat de
eventualele valori atipice, cum se poate ntmpla n cazul mediei, i se poate

C
utiliza chiar i n cazurile n care se cunosc doar magnitudinile (sau
ES
rangurile) unor valori ce nu au fost nregistrate.
Modalitatea de calcul a medianei depinde de numrul valorilor din
prob ( ):
R

dac proba are un numr par de date ( 2 1), atunci mediana


FI

va fi reprezentat de valoarea central:


M

pt. 2 1, atunci sau / .


ZA

De exemplu, pentru seria de date 1, 2, 2, 3, 4, 4, 5, 3, pentru


c are un numr egal de valori la stnga i la dreapta sa.

dac proba are un numr par de date ( 2 ), atunci mediana va


fi reprezentat de media celor dou valori centrale sau de intervalul median:

/ /
pt. 2 , atunci sau .

De exemplu, pentru seria de date 1, 2, 2, 3, 4, 5, 6, 7, cele dou


valori centrale sunt 3 i 4, deci 3 4 /2 3,5.

n cazul n care exist numeroase observaii cu aceeai valoare cu


cea a medianei datorit prezentrii datelor sub form de intervale de clas,
26 Elemente de statistic aplicate n ecologie
atunci formulele de calcul se modific astfel:

pt. 2 1, atunci ;

pt. 2 , atunci ,
limita inferioar a clasei mediane (clasa de frecven ce
conine valoarea median);
valoarea intervalului de clas;
suma frecvenelor tuturor claselor;
frecvena cumulat a clasei dinaintea clasei mediane (suma
frecvenelor claselor care preced clasa median);
frecvena clasei mediane.

U
C
Exemplu 3.1. ntr-un studiu s-a urmrit acoperirea procentual
realizat de o specie de ierburi de step, n 20 de suprafee de prob.
ES
Acoperire 80-100% 60-80% 40-60% 20-40% 0-20% f
R

Frecvena (f) 1 2 9 6 2 20
FI

Conform definiiei medianei, aceasta ar trebuie s reprezinte media


acoperirilor din suprafeele de prob 10 i 11. Valorile exacte ale acoperirii
M

nu sunt accesibile, acestea fiind aproximate prin clase de acoperire. Acestea


ZA

sunt echivalente din punct de vedere statistic unor clase de distribuie a


frecvenelor. Dac simbolizm fiecare observaie prin procentul mediu al
fiecrei clase, datele se prezint astfel:

10 10 30 30 30 30 30 30 50 50
50 50 50 50 50 50 50 70 70 90

Cifrele scrise ngroat ar reprezenta cele dou valori centrale


necesare calculrii medianei n cazul unui numr par de date. Se observ c
sunt mai multe valori egale cu 50; sunt 9 valori n clasa (intervalul)
median. Frecvena cumulat a clasei de dinaintea celei mediane este
2 6 8. Deci, pn la prima valoare central, mai sunt 2 suprafee de
prob. Rezult c prima valoare central se gsete la 2/9 din intervalul
clasei mediane. Intervalul de clas este egal cu 20%; 2/9 din 20 reprezint
Descrierea statistic a probelor ecologice 27
4,45. Dac la aceast valoare adugm limita inferioar a clasei mediane
(40), obinem 44,45, adic prima valoare central a acoperirii. Folosind
acelai raionament, se obine i a doua valoare central: 40 20 3/9
46,67. Mediana va fi egal cu media celor dou valori centrale: 44,45
46,67 /2 45,56.
O alt modalitate const n aplicarea formulei de mai sus, care are la
baz acelai raionament:
40
20

20
8
9

U
C
,
40 20 40 20 45,56 .
ES
Media ( , ). Este unul dintre cei mai cunoscui i mai utili
R

descriptori ai tendinei centrale. Exist mai multe tipuri de medie, dar cel
mai utilizat este media aritmetic. Dac se calculeaz media lund n
FI

consideraie toi indivizii unei populaii, atunci aceasta se numete medie


populaional, este un parametru populaional i se noteaz cu . Media
M

obinut n urma analizei datelor dintr-o prob sau media probei este o
ZA

statistic a probei simbolizat cu . Media probei poate fi un estimator


direct al mediei populaionale ( estimeaz pe ).
Formula de calcul a mediei este suma tuturor valorilor supra

numrul acestora:

pentru populaie ;

pentru prob ,
fiecare valoare individual din populaie sau prob;
numrul tuturor valorilor individuale din populaie;
numrul tuturor valorilor din proba prelevat din populaie.

Relaia dintre medie, median i mod.


n cazul unei variabile a crei valori individuale sunt distribuite
perfect simetric, media, mediana i modul sunt egale. n cazul unei
28 Elemente de statistic aplicate n ecologie
distribuii uor asimetrice unimodale, mediana se dispune ntre medie i
mod. n majoritatea distribuiilor biologice se observ o abatere pozitiv,
adic media are valoare mai mare dect mediana, care la rndul ei este mai
mare dect modul (fig. 3.2).

Mo=Me=x Mo<Me<x

U
A B

C
Figura 3.2. Relaia dintre mod, median i medie: A distribuie simetric; B
ES
distribuie asimetric

Dintre cele trei msuri ale tendinei centrale, media este singura care
R

ine cont de toate datele din probe i astfel sintetizeaz ntreaga informaie
furnizat de acestea. Valoarea mediei este folosit n numeroase tehnici de
FI

analiz statistic. De asemenea, poate fi combinat cu mediile altor probe


M

din aceeai populaie, n cadrul mediei generale, atunci cnd datele sunt rare
sau greu de obinut.
ZA


mediageneral
media probei numrul de valori din proba

Media este ns uor influenat de apariia unor valori atipice (foarte


mari sau foarte mici fa de majoritatea valorilor). n astfel de situaii,
mediana reprezint un descriptor mai robust al tendinei centrale a probei.
Mediana este util i n analiza preliminar, deoarece scoate n eviden
tendinele generale ale datelor.
Modul reprezint o modalitate rapid i aproximativ de a aprecia
tendina central a probei i de a indica centrul distribuiei observaiilor,
apreciate pe o scal ordinal sau nominal.
Descrierea statistic a probelor ecologice 29
3.2. VARIABILITATEA

Variabilitatea este o trstur general a sistemelor naturale. Este


foarte puin probabil ca indivizii dintr-o populaie biologic s fie identici
din punctul de vedere al unui caracter sau al unei variabile. Dac nu ar
exista variabilitate, nu ar mai fi nevoie de analiza statistic o singur
valoare ar fi suficient pentru a descrie variabila cercetat pentru ntreaga
populaie (implicit, nici tendina central ca noiune nu i-ar mai avea
rostul). Deci, pentru a surprinde informaia intrinsec a unei probe, pe lng
tendina central, trebuie descris i variabilitatea acesteia.
n general, variabilitatea este surprins de modul n care valorile
individuale ale unei variabile graviteaz n jurul tendinei centrale sau se

U
distribuie fa de aceasta.
Cei mai comuni descriptori ai variabilitii unei probe sunt

C
amplitudinea i deviaia standard.
ES
Amplitudinea ( ). Este o msur simplu de calculat a dispersiei
datelor dintr-o prob. Amplitudinea reprezint diferena dintre valoarea
R

maxim ( ) i valoarea minim ( ) dintr-o prob, adic diferena


FI

dintre cele dou limite ale intervalului de variaie.


M

intervaluldevariaie ,
ZA

Cnd datele sunt sub forma claselor de distribuie a frecvenelor i


valorile extreme ( i ) nu se cunosc cu exactitate, amplitudinea se
calculeaz ca diferena dintre centrele intervalelor primei i ultimei clase.

Dac ne referim la exemplul 2.3 i presupunem c avem la dispoziie doar


tabelul 2.5, atunci amplitudinea poate fi apreciat astfel:

369,5 152,5 217 .

Este msura cea mai util a variabilitii, atunci cnd o decizie este
condiionat de valorile extreme ale unei variabile. Prezint ns i o serie de
neajunsuri: depinde doar de valorile extreme care adesea sunt excepionale,
prezint fluctuaii mari de la o prob la alta i nu este influenat de simetria
repartiiei dintre extreme (poate avea aceeai valoare pentru o repartiie
30 Elemente de statistic aplicate n ecologie
simetric i pentru una puternic asimetric).

Deviaia standard ( , ). Este descriptorul variabilitii cel mai


frecvent i mai util, care se folosete n analiza statistic a datelor. Atunci
cnd valoarea sa se obine prin folosirea tuturor valorilor individuale ale
unei variabile dintr-o populaie, se numete deviaia standard a populaiei
i se noteaz cu . Dac se calculeaz pornind de la datele dintr-o prob
extras din populaia de cercetat, se numete deviaia standard a probei i
se noteaz cu . n ambele cazuri, deviaia standard reprezint media
abaterilor valorilor individuale fa de valoarea mediei. Abaterea unei valori
individuale fa de medie poate fi scris ca diferena dintre valoarea
respectiv i valoarea mediei ( ). n continuare, pentru a afla media

U
abaterilor, ar trebui ca abaterile tuturor valorilor s se nsumeze i apoi s se

C
mpart la numrul valorilor individuale luate n analiz ( sau ). Totui
exist o problem cu privire la acest raionament:
ES

0.
R
FI

Deci suma abaterilor este zero, ceea ce reprezint un impas n


calcularea mediei abaterilor, aceasta fiind egal cu 0/ 0. Aceasta ar
M

nsemna c valorile individuale se confund cu cea a medie, ceea ce este n


majoritatea cazurilor (dac nu n toate) imposibil, din cauza variabilitii
ZA

naturale. Ca urmare, pentru a depi acest impas, este nevoie s pozitivm


toate abaterile printr-un procedeu reversibil care s nu influeneze rezultatul
final. Un astfel de procedeu const n ridicarea abaterilor la ptrat. Se obine

astfel suma ptratelor abaterilor care, mprit la numrul de valori, d


media aritmetic a ptratelor abaterilor sau variana ( , ).


sau

n cazul varianei, unitile de apreciere ale variabilei se modific


de exemplu, mm devin mm2, g devine g2 , pierzndu-i sensul. Pentru a
reveni la unitile originale de msur, se extrage radicalul din valoarea
varianei i se obine astfel deviaia standard.
Descrierea statistic a probelor ecologice 31

sau

Printr-o rearanjare algebric a formulelor de mai sus se poate obine


una mai uor de utilizat n practic.



sau

Atunci cnd deviaia standard a probei se utilizeaz pentru estimarea


deviaiei standard a populaiei (se estimeaz pe baza ), suma ptratelor

U
abaterilor se mparte la 1 i nu la , ceea ce are drept efect creterea

C
valorii s.
ES


sau formula cea mai uzual
R
FI

Creterea valorii s reprezint o marj ce trebuie luat pentru folosirea


M

mediei probei (o statistic) n loc de media populaiei (un parametru)


pentru estimarea deviaiei standard populaionale . Valoarea se
ZA

numete n statistic numrul gradelor de libertate i reprezint un


concept general desemnnd numrul de elemente independente (variabile
aleatoare, statistici etc.) pentru a defini starea unui sistem sau a unui

ansamblu (numrul de elemente considerate simultan minus numrul de


relaii independente care le leag). De exemplu, dac presupunem c avem o
prob 10, cu 20, i trebuie s inventm valorile observaiilor,
avem libertatea s desemnm primele 9 valori (adic 1 10 1 9). A
zecea valoare nu mai avem libertatea s o inventm, deoarece aceasta
trebuie s fie o valoare care s permit obinerea mediei egale cu 20. Cu alte
cuvinte, media constituie o relaie independent, o constrngere a valorilor
din prob. Deci, dac media este 20, suma celor 10 valori va fi 20 10
200. Desemnm primele patru valori: 26, 18, 14, 25, 20, 28, 35, 17 i 7.
Suma lor este 190. Pentru ca suma s fie 200, nseamn c al zecelea numr
32 Elemente de statistic aplicate n ecologie
poate fi doar 10 (200 190 10) i astfel media s fie 20 (200/10 20).
Deviaiile standard ale probelor pot fi utilizate pentru a compara
variabilitatea acestora. Compararea direct a deviaiilor standard obinute n
urma analizei unor probe cu medii diferite (de exemplu, o medie de ordinul
zecilor i o alta de ordinul sutelor) nu are nici o valoare. Astfel, pentru
compararea variabilitii probelor din populaii cu medii diferite, se
folosete coeficientul de variaie ( ).

sau % 100

Exemplul 3.1. ntr-un studiu s-a urmrit nlimea fitoindivizilor de


migdal pitic (Amygdalus nana). n acest sens s-a msurat nlimea a 50 de

U
tulpini n cm dintr-un plc compact. S-a realizat apoi descrierea statistic a

C
probei.
ES
59,3 59,6 60,3 60,6 60,9 62,6 62,7 62,8 63,7 63,7
65,5 65,8 66,6 67,1 67,2 67,5 67,8 68,1 68,9 69
R

69 69 69 69,4 69,6 70 70,2 71,1 71,4 71,6


71,9 72,6 73,4 73,6 74,1 75 75,1 75,2 76,3 76,9
FI

77 77,5 77,5 77,7 78,8 79,3 81,5 82,8 86,7 89,6


M

Valoarea cea mai frecvent ntlnit este 69, deci 69.


ZA

Mediana va fi egal cu media celor dou valori centrale, deoarece


50, un numr par.

,
69,8

Media este suma tuturor valorilor mprit la 50.


,
70,85

Amplitudinea este dat de diferena dintre valoarea maxim i cea


minim din prob.
Descrierea statistic a probelor ecologice 33
89,6 59,3 30,3

Deviaia standard se calculeaz conform formulei utilizate pentru


estimarea deviaiei standard populaionale.

,
, , , ,

47,83 6,92
47,83

U
Coeficientul de variaie se afl mprind deviaia standard la medie.

C
,
0,098, adic 9,8% .
ES
,

Datele din proba cercetat prezint o distribuie simetric, pentru c


R

cele trei msuri ale tendinei centrale au valori foarte apropiate.


FI
M
ZA

4. DISTRIBUII PROBABILISTICE

Teoria matematic a probabilitilor a aprut n urma studiului


jocurilor i arat care va fi rezultatul, n general, dac se extrag probe n
mod repetat din aceeai populaie statistic.
Probabilitatea de apariie a unui anumit eveniment reprezint ansa
ca evenimentul respectiv s se ntmple, exprimat de la 0 la 1 sau de la 0 la
100%. O probabilitate apropiat de 1 nseamn c evenimentul este unul

U
probabil, iar o probabilitate apropiat de 0 nseamn c evenimentul

C
respectiv este puin probabil.
Exist mai multe modaliti de aflare a probabilitii unui eveniment,
ES
dintre care dou sunt mai des utilizate. Prima modalitate este cea empiric,
bazat pe cunotine anterioare cu privire la evenimentul respectiv n
populaie. De exemplu, dac se tie c ntr-o populaie doi din 5 indivizi
R

aparin sexului masculin, atunci se poate spune c probabilitatea ca un


FI

individ selectat la ntmplare din populaie s fie mascul este de 2/3 sau
0,67 (sau 67%). Pentru a afla aceast probabilitate, sunt necesare cunotine
M

asupra raportului dintre sexe n populaia studiat. A doua modalitate de


ZA

aflare a probabilitii este cea bazat pe consideraii teoretice. De exemplu,


probabilitatea de a obine un anumit numr prin aruncarea unui zar este de
1/6 adic 0,1667. n acest caz, nu este nevoie ca zarul s fie aruncat pentru
a ajunge la acest rezultat.

n cele dou situaii de mai sus, probabilitatea a fost calculat sub


forma unui raport. Acest aspect este surprins de regula mpririi conform
creia probabilitatea unui eveniment este dat de numrul de posibiliti n
care evenimentul respectiv poate s apar mprit la numrul total de
evenimente ce pot s apar.
n primul exemplu de mai sus, erau dou posibiliti de apariie a
unui mascul din trei indivizi pentru care nu se specific sexul. n al doilea
exemplu, era o posibilitate de a obine un anumit numr din ase numere
posibile.
n general, se pot face operaii cu probabiliti, dintre care cele mai
Distribuii probabilistice 35
frecvent utilizate sunt adunarea sau nmulirea. Deoarece probabilitile sunt
fracii, adunarea probabilitilor duce la o cretere a probabilitii compuse,
n timp ce nmulirea, la o scdere a acesteia.
Dac se cunoate probabilitatea de apariie a unui rezultat i cea de
apariie a unui rezultat , probabilitatea apariiei simultane a ambelor
rezultate este, conform regulii nmulirii, egal cu produsul probabilitilor
individuale: i . De exemplu, dac probabilitatea ca
dintr-un ou s ias o anumit specie este de 0,2 i probabilitatea ca
respectivul individ s fie mascul este de 0,5, atunci probabilitatea ca din ou
s apar un individ mascul din specia de interes va fi egal cu produsul
probabilitilor individuale ale celor dou rezultate: 0,2 0,5 0,10.
Dac se cunoate probabilitatea de apariie a unui rezultat i cea de

U
apariie a unui rezultat , probabilitatea apariiei unuia din cele dou

C
rezultate la un moment dat este, conform regulii adunrii, egal cu suma
probabilitilor individuale: sau . De exemplu, dac
ES
probabilitatea ca dintr-un ou s ias o anumit specie este de 0,2 i
probabilitatea de apariie a unei alte specii este 0,3, atunci probabilitatea ca
din ou s ias prima sau a doua specie va fi egal cu suma probabilitilor
R

individuale ale celor dou rezultate: 0,2 0,3 0,5.


FI

O distribuie probabilistic este o distribuie a probabilitilor


similar cu o distribuie a frecvenelor (seciunea 2.2), cu deosebirea c
M

prima red probabilitatea de apariie a evenimentelor i nu frecvena


ZA

acestuia. Deci distribuiile probabilistice se bazeaz pe probabilitile,


calculate pornind de la anumite premise ca evenimentele s apar i nu pe
frecvenele observate ale evenimentelor. O distribuie a frecvenelor poate fi
convertit la o distribuie a probabilitilor, dac fiecare frecven este

convertit la probabilitate prin mprirea la numrul total de observaii


(dimensiunea probei).
Utilitatea distribuiilor probabilistice este multipl: permite
estimarea probabilitii ca un anumit eveniment s aib un anumit rezultat i
poate fi folosit pentru a calcula o distribuie de frecvene de ateptat
(estimate). Aa cum o probabilitate poate fi estimat prin mprirea
frecvenei unei anumite observaii la numrul total de observaii, tot aa, o
frecven estimat poate fi calculat prin nmulirea probabilitii estimate
cu numrul total de observaii.
Astfel, se pot compara frecvenele observate cu cele estimate, dup
36 Elemente de statistic aplicate n ecologie
un anumit model. Dac diferenele dintre cele dou tipuri de frecvene nu
sunt semnificative, atunci modelul dup care s-au calculat frecvenele
estimate este valabil i pentru cele observate.
Modelele folosite n calcularea probabilitilor teoretice sunt modele
matematice. Dintre acestea, o parte au o importan practic deosebit
pentru cercetarea ecologic. Astfel, exist trei distribuii probabilistice
asociate cu variabile discrete (caractere numrabile), folosite drept model n
studiile ecologice: distribuia binomial, distribuia Poisson i distribuia
binomial negativ. Dintre distribuiile probabilistice folosite pentru
variabile continui (caractere msurabile), probabil cea mai important, mai
ales din punct de vedere conceptual, este distribuia normal.

U
4.1. DISTRIBUIA BINOMIAL

C
ES
Aceast distribuie are urmtoarele particulariti:

1. Observaiile sunt sub form de numr de entiti;


R

2. O observaie se poate clasifica n una din dou categorii posibile,


FI

distincte (mascul sau femel, specia A sau A, adult sau adult);


3. Variana unei probe de frecvene este mai mic dect media;
M

4. Dispersia entitilor numrate este uniform.


ZA

Dac se ia n considerare sexul unui individ dintr-o populaie,


aceast variabil poate lua doar dou valori: mascul sau femel. Dac se
selecteaz aleator un singur individ dintr-o populaie, ansele ca acesta s fie

mascul sunt egale cu ansele s fie femel. Cum rezultatul poate fi doar unul
singur, nseamn c probabilitatea de a obine un mascul este 1/2 0,05,
iar probabilitatea de a obine o femel este tot 1/2 0,05. Dac este
probabilitatea de a obine mascul i este probabilitatea de a obine femel,
atunci suma probabilitilor va fi 1, iar 1 i 1 .
Distribuia probabilistic n cazul sexului unui individ este reprezentat n
figura 4.1.
Dac se extrag doi indivizi din populaie, atunci exist patru
rezultate posibile (tab. 4.1). Probabilitile fiecrui rezultat pot fi obinute
conform regulii nmulirii. Astfel, probabilitatea de a obine doi masculi va
Distribuii probabilistice 37
fi 0,5 0,5 0,5 0,25. Probabilitatea de a obine dou femele se
calculeaz n acelai fel. Probabilitatea de a obine un mascul i o femel
este egal cu probabilitatea de a obine o femel i apoi un mascul, adic
0,5 0,5 0,25.

0.6

0.5
Probabilitate

0.4

0.3

0.2

U
C
0.1 ES
0
mascul femel
Rezultat
R

Figura 4.1. Distribuia probabilistic a sexului n cazul unui individ


FI

Tabelul 4.1. Probabilitile diferitelor rezultate la extragerea a doi indivizi


M

Individul 1
Mascul (M) Femel (F)
0,5 0,5
ZA

Individul 2
Mascul (M) MM FM
0,5 0,25 0,25

Femel (F) MF FF
0,5 0,25 0,25

Dac nu se ia n consideraie ordinea n cadrul rezultatului mascul-


femel, probabilitatea obinerii unui mascul i a unei femele va fi dat,
conform regulii adunrii, de suma dintre probabilitatea de a obine mascul-
femel i probabilitatea de a obine femel-mascul, adic 0,25
0,25 0,5.
Suma probabilitilor tuturor rezultatelor este 1. Dac se
generalizeaz suma probabilitilor tuturor rezultatelor, atunci se obine:
38 Elemente de statistic aplicate n ecologie
2 1 1.

Dac se repet distribuia probabilistic pentru trei indivizi, atunci


relaia general devine:

3 3 1 1.

Deci, pentru indivizi, probabilitile tuturor rezultatelor posibile


vor fi date prin descompunerea binomului:

1.

U
n aceast relaie general a distribuiei binomiale, reprezint

C
numrul de ncercri, este probabilitatea de a obine un anumit rezultat
dintr-o singur ncercare, iar este probabilitatea ca rezultatul vizat s nu
ES
apar. Distribuia binomial depinde de i de (valoarea lui depinde de
cea a lui ).
O formul mai practic pentru calculul probabilitii n distribuia
R

binomial este:
FI

!

M

,
! !
probabilitatea de a obine un anumit numr de rezultate;
ZA

numrul de rezultate de interes;


numrul de evenimente sau ncercri;
probabilitatea de a obine un rezultat de interes;

probabilitatea de a nu obine un rezultat de interes.

Exemplul 4.1. Dac o pont conine 6 ou, iar probabilitatea ca


dintr-un ou s apar un mascul este 0,5, care sunt probabilitile de a obine
4 sau mai puini masculi?

n aceast problem datele sunt urmtoarele:


6 0,5
1 1 0,5 0,5
4.
Distribuii probabilistice 39

Aceasta nseamn c probabilitatea de a obine 4 sau 3 sau 2 sau 1


sau 0 masculi va fi, conform regulii adunrii, suma probabilitilor 4
3 2 1 0 .
Probabilitatea de a obine 4 masculi este:
!
4 0,5 0,5 0,234375 .
! !

La fel se procedeaz i pentru celelalte valori ale lui .

4 3 2 1 0 4

U
0,2343 0,3125 0,2343 0,0937 0,0156 0,8906

C
Probabilitatea de a obine patru sau mai puini masculi este de
ES
aproximativ 89,1%.
Distribuia probabilistic pentru toate combinaiile posibile de
masculi i femele din ase indivizi se prezint astfel:
R
FI

0.35
M

0.3
0.25
ZA

0.2
p(x)

0.15

0.1
0.05
0
0 1 2 3 4 5 6
x

Distribuia este simetric deoarece . n general, cu ct este


mai mare i are o valoare apropiat de cea a lui , cu att distribuia
binomial este mai simetric, iar diferenele dintre probabiliti (coloanele
diagramei) sunt mai mici.
40 Elemente de statistic aplicate n ecologie

4.2. DISTRIBUIA POISSON

Aceast distribuie are urmtoarele particulariti:

1. Observaiile sunt sub form de numr de entiti;


2. Observaiile se obin din uniti de prob definite (ptrate de
prob, intervale de timp etc.) i pot fi organizate ntr-o distribuie
a frecvenelor;
3. Variana probei este aproximativ egal cu media acesteia;

U
4. Entitile numrate sunt relativ rare (mult mai puine dect ar
putea s conin unitatea de prob).

C
5. Dispersia entitilor n timp i spaiu este aleatoare, ceea ce
ES
nseamn c entitile nici nu se atrag, nici nu se resping, adic
sunt independente unele fa de altele.
R

Dei aceast distribuie este greu de ntlnit n natur, ea este util n


FI

ecologie, fiind singurul model ce poate fi folosit pentru descrierea obiectelor


cu dispersie ntmpltoare.
M

Distribuia Poisson este determinat de un singur parametru , care


este egal cu media populaional i cu variana populaional :
ZA

.
Deoarece aceti parametri rareori ajung s fie cunoscui, formula de

calcul a probabilitii se bazeaz pe media probei ( ) ca estimare a mediei


populaionale, pe un anumit numr de entiti dintr-o unitate de prob ( ) i
pe constanta matematic, baza logaritmului natural 2,7183:


.
!

Exemplul 4.2. S se estimeze distribuia probabilistic Poisson


pentru 10 sau mai puini indivizi pe unitate de prob, tiind c numrul
mediu de indivizi pe unitate de prob este 5.
Distribuii probabilistice 41
Datele acestei probleme sunt:
5
2,7183
10 .

Trebuie calculat probabilitatea Poisson de a identifica 10 sau mai


puini indivizi pe unitate de prob.
Probabilitatea de a identifica 10 indivizi pe unitate de prob este:

10 2,7183 0,0181 ,
!
9 2,7183 0,0363 .
!

U
C
La fel se procedeaz i pentru celelalte valori. ES
0.18
0 0,0067 0.16
R

1 0,0337 0.14
2 0,0842
FI

0.12
3 0,1404
0.1
M p(x)

4 0,1755
0.08
5 0,1755
ZA

6 0,1462 0.06
7 0,1044 0.04
8 0,0653 0.02

9 0,0363 0
10 0,0181 0 1 2 3 4 5 6 7 8 9 10
0,9863
x

Suma probabilitilor valorilor de la zero la zece este mai mic dect


1, deoarece distribuia este trunchiat la valoarea 10. Probabilitile
valorilor mai mari de 10 sunt extrem de mici. Distribuia este uor
asimetric. Dac depete valoarea 10, distribuia tinde s devin
aproximativ simetric.
42 Elemente de statistic aplicate n ecologie

4.3. DISTRIBUIA BINOMIAL NEGATIV

Aceast distribuie are urmtoarele particulariti:

1. Observaiile sunt sub form de numr de entiti;


2. Observaiile se obin din uniti de prob definite (ptrate de
prob, intervale de timp etc.) i pot fi organizate ntr-o distribuie
a frecvenelor;
3. Variana probei este evident mai mare dect media acesteia;
4. Entitile numrate sunt relativ rare (mult mai puine dect ar

U
putea s conin unitatea de prob).
5. Dispersia entitilor nu este nici uniform, nici aleatoare, ci poate

C
s fie grupat sau agregat.
ES
Spre deosebire de celelalte distribuii discrete, distribuia binomial
negativ este un model robust ce descrie dispersia a numeroase populaii
R

naturale.
FI

Aceast distribuie probabilistic este definit de doi parametri:


media populaional ( ) i un exponent . Spre deosebire de din
M

distribuia binomial, care ia valori ntregi, fiind o variabil discret, n


distribuia binomial negativ, este o variabil continu, ce ia valori din
ZA

aproape n aproape i exprim heterogenitatea unei distribuii.


n practic, cei doi parametri sunt estimai pe baza probei. Media
probei este o estimare a lui , iar se estimeaz pornind de la media i

variana probei, conform urmtoarei relaii:

Probabilitile individuale, adic probabilitile obinerii unui anumit


numr de entiti dintr-o unitate de prob, se pot afla prin descompunerea
expresiei , unde / , iar 1 .
Din motive practice, probabilitatea n distribuia binomial negativ
se calculeaz urmnd urmtoarele etape:
Distribuii probabilistice 43
1. Se calculeaz valoarea .
2. Se calculeaz probabilitatea pentru 0:

0 1 .

3. Pentru oricare 0, se calculeaz probabilitatea astfel:

0 1 .

Exemplul 4.3. Care sunt probabilitile ca pe nite suprafee de


prob s apar zece sau mai puini indivizi? Media numrului de indivizi pe

U
suprafa de prob este trei, iar deviaia standard este cinci.

3
C
ES
5
R

Trebuie calculat valoarea lui :


FI

4,5 .
M

Se calculeaz probabilitatea pentru 0:


ZA

,
0 1 0,1004 .
,

n continuare se pot calcula probabilitile pentru celelalte valori mai


mari ca unu, cu ajutorul formulei recurente:
,
1 0,1004 0,1807
,
,
2 0,1807 0,1988 .
,

n acelai mod se continu i pentru celelalte valori. Rezultatele


probabilitilor pentru valorile mai mici sau egale cu zece sunt trecute n
tabelul urmtor:
44 Elemente de statistic aplicate n ecologie
0.2
0.18
0 0,1004 0.16
1 0,1807
0.14
2 0,1988
0.12
3 0,1723

p(x)
0.1
4 0,1292
5 0,0879 0.08
6 0,0556 0.06
7 0,0334 0.04
8 0,0192 0.02

U
9 0,0107 0
10 0,0058 0 1 2 3 4 5 6 7 8 9 10

C
0,9938 x
ES
Se poate observa c suma probabilitilor valorilor este mai mic
dect 1. Probabilitile pentru valorile mai mari de 10 vor fi extrem de mici.
R

Pe msur ce valoarea crete i deviaia standard ( ) scade n raport cu


FI

media ( ), gradul de simetrie al distribuiei crete. Pentru valori ale lui


20, distribuia probabilistic este aproape simetric.
M
ZA

4.4. ESTIMAREA DISPERSIEI UNEI POPULAII

4.4.1. Indici de dispersie


Dispersia unei populaii se refer la modul de repartizare a


indivizilor n spaiu. Dispersia se apreciaz pe baza poziiei unor indivizi,
relativ la poziia celorlali.
n general, dispersia unei populaii poate fi de trei tipuri: uniform,
aleatoare i grupat (fig. 4.2). n cele mai multe cazuri, dispersia este
privit din perspectiv spaial, dar se poate investiga i dispersia n timp a
unor evenimente. n primul caz, unitatea de prob poate fi un ptrat, n timp
ce n al doilea caz, poate fi un interval de timp. Dac se urmresc organisme
parazite, atunci unitatea de prob poate fi organismul gazd.
n principiu, aprecierea dispersiei se face n funcie de variabilitatea
Distribuii probabilistice 45
densitii entitilor pe unitate de prob. n cazul unei dispersii uniforme,
densitile entitilor pe unitate de prob vor fi cam aceleai i variabilitatea
acestor densiti va fi relativ mic. n cazul unei dispersii grupate, densitile
vor avea valori extreme, fie foarte mari, fie aproape nule, iar variabilitatea
acestor densiti va fi relativ mare. n cazul dispersiei aleatoare, vor exista
densiti cu valori mari, mici i intermediare i, ca urmare, variabilitatea
acestor densiti va fi intermediar fa de variabilitatea densitilor din
celelalte tipuri de dispersie.

U
C
ES
Figura 4.2. Tipuri de dispersie: I uniform, II aleatoare, III grupat
R
FI

Pornind de la acest principiu, dac se folosete variana densitilor


pe unitate de prob ca descriptor al variabilitii i media densitilor pe
M

unitate de prob ca termen de comparaie a magnitudinii varianei, se poate


calcula un indice de dispersie astfel:
ZA

Indice de dispersie .

Cnd datele sunt prezentate sub form de tabel de distribuie a


frecvenelor, atunci formulele varianei i mediei pot fi adaptate pentru
facilitarea calculelor astfel:






.


46 Elemente de statistic aplicate n ecologie
Indicele de dispersie poate fi subunitar, egal cu unitatea sau
supraunitar. Astfel, n funcie de valoarea raportului, se poate decide care
este tipul de dispersie:

dac 1, dispersia este uniform;


dac 1, dispersia este aleatoare;
dac 1, dispersia este grupat.

Ce se ntmpl dac valoarea indicelui de dispersie este foarte


apropiat de 1? Valoarea respectiv poate fi considerat ca aproximativ

U
egal cu 1 sau, la fel de bine, poate fi considerat n funcie de situaie ca
fiind mai mare sau mai mic dect 1.

C
ntr-o astfel de situaie, pentru a lua o decizie obiectiv trebuie ca
ES
acesteia s i se atribuie o probabilitate, adic s se realizeze o estimare
statistic. Pentru aceasta se impune o standardizare a indicelui de dispersie
prin nmulirea acestuia cu numrul gradelor de libertate, adic cu numrul
R

unitilor de prob minus unu ( 1), obinndu-se o statistic de tip :


FI

1 .
M
ZA

Cnd numrul unitilor de prob este relativ mic ( 30), se


compar statistica cu valorile critice ale distribuiei pentru 1
grade de libertate i pentru pragul de confiden 0,975 i, respectiv, 0,025:

dac , , dispersia este uniform;


dac , , , , dispersia este aleatoare;
dac , , dispersia este grupat.

n oricare dintre situaiile de mai sus, nivelul de confiden al


estimrii este de 0,05 (cele dou valori critice exclud fiecare cte 0,025 din
fiecare coad a distribuiei ). Deci probabilitatea ca dispersia s fie de un
anumit tip este de 0,95 sau 95%.
Distribuii probabilistice 47
Cnd numrul unitilor de prob este relativ mare ( 30), atunci
se calculeaz o statistic conform relaiei:

2 2 1 1.

Aceast statistic se compar cu valoarea critic 1,96, care este o


valoare ce exclude 0,05 din distribuia normal standard (seciunea 4.5):

dac 1,96 dispersia este uniform;


dac | | 1,96 dispersia este aleatoare;
dac 1,96 dispersia este grupat.

U
i n acest caz, nivelul de ncredere este de 0,05, deci probabilitatea

C
ca dispersia s fie de un anumit tip este de 0,95 sau 95%.
ES
Indicele de dispersie face distincia dintre cele trei tipuri, dar nu
poate indica gradul de aglomerare n cazul unei dispersii grupate, deoarece
R

este puternic influenat de numrul total de entiti individuale din toate


unitile de prob. Pentru a aprecia gradul de aglomerare dintr-o dispersie
FI

grupat, se folosete indicele Green ( ), care elimin dependena de


M

numrul tuturor indivizilor din toate unitile de prob. Numrul total de


indivizi din toate unitile de prob va fi egal cu n cazul n care
ZA

datele sunt sub form de tabel de frecvene sau cu dac datele sunt sub
form de densiti pe unitatea de prob.


sau

Acest indice ia valori ntre 0, pentru dispersie aleatoare, i 1, pentru


dispersie grupat, cu grad maxim de aglomerare (toate entitile au fost
identificate ntr-o singur unitate de prob). Acest indice poate fi folosit
pentru compararea gradului de aglomerare a unor probe diferite ca numr de
entiti, medie sau numr de uniti de prob.
48 Elemente de statistic aplicate n ecologie
Exemplul 4.4. ntr-o populaie de plante, prin investigarea a 14
ptrate de prob s-au obinut densitile indivizilor. Care este tipul de
dispersie al populaiei?

0 0 0 5 3 48 1
2 30 5 9 22 1 0

9
207,69
,
23,08 .

U
Indicele de dispersie este evident mai mare ca 1. n continuare vom
verifica dac dispersia aglomerat este semnificativ.

C
ES
14 1 23,08 300,04

Aceast valoare se compar cu valorile critice calculate pentru 13


R

grade de libertate i pentru nivelurile de semnificaie 0,975 i, respectiv,


FI

0,025 (anexa 3):


M

, , 5,009
ZA

, , 24,736 .

Valoarea calculat ( 300,04) este mai mare dect limita


superioar ( , , 24,736) a intervalului de confiden pentru


dispersia aleatoare, deci populaia investigat are o dispersie aglomerat, cu
o probabilitate de 0,95 sau 95%.
Se estimeaz gradul de aglomerare cu indicele Green ( ). Datele
sunt sub form de densitate pe ptrat de prob, deci numrul total de indivizi
identificai n cele 14 ptrate este dat de suma numrului de indivizi din
fiecare ptrat.
,
0,177
Distribuii probabilistice 49

Avnd n vedere c ia valori ntre 0 i 1, se poate concluziona c


gradul de aglomerare nu este destul de sczut.

n situaia n care numrul unitilor de prob este mai mare de 30,


se poate verifica dac frecvenele observate ale variabilei concord cu
frecvenele estimate cu ajutorul uneia dintre distribuiile probabilistice
discrete (binomial, Poisson, binomial negativ) ce servete drept model.
Practic, se calculeaz probabilitatea de a obine o anumit valoare a
variabilei pe unitate de prob, dup care se convertete n frecven prin
nmulirea cu numrul unitilor de prob. Concordana frecvenelor
observate cu cele estimate (cu modelul) se poate face prin reprezentarea

U
grafic a ambelor frecvene i prin testul de concordan (seciunea 10.1).
n seciunile urmtoare ne vom referi la compararea grafic a frecvenelor.

C
ES
4.4.2. Modelul binomial
Calcularea probabilitii binomiale de obinere a unei valori a
variabilei pe unitate de prob se bazeaz pe procedura descris n exemplul
R

4.1, cu deosebirea c numrul de ncercri ( ) se estimeaz ca fiind valoarea


FI

rotunjit obinut prin calcularea expresiei:


M

.
ZA

Parametrii i reprezint probabilitatea ca o anumit poziie dintr-o


unitate de prob s fie ocupat de o entitate.

, iar 1 .

Pe baza acestor parametrii se calculeaz probabilitatea binomial


( ) de a obine o anumit valoare a variabilei ( ) pe unitate de prob.
Ulterior se afl frecvena estimat a valorii prin nmulirea probabilitii
acesteia cu numrul unitilor de prob .
50 Elemente de statistic aplicate n ecologie
Exemplul 4.5. S-au determinat densitile indivizilor unei specii de
plante din 50 de ptrate de prob cu o anumit suprafa. Care este tipul de
dispersie al populaiei de plante?

Nr. indivizi pe ptrat 16 17 18 19 20 21 22


Frecvena 3 5 8 14 11 6 3

Variabila este numrul indivizilor pe ptrat de prob i o vom nota


cu . Frecvenele observate le vom nota cu .
Pentru a calcula numrul mediu de indivizi pe ptrat ( ), trebuie aflat
numrul total de indivizi din toate ptratele. Deoarece datele sunt prezentate
sub form de tabel de frecven, numrul total de indivizi identificai va fi

U
.

16 17 18 19 20 21 22 Suma
C
ES
3 5 8 14 11 6 3 50
48 85 144 266 220 126 66 955
R

19,1
FI

, , ,
2,38
M
ZA

Indicele de dispersie este evident subunitar, deci se poate ca


populaia s aib o dispersie uniform.

,
Indicele de dispersie = 0,124
,
0,124 50 1 6,099
2 6,099 2 50 1 1 6,356
6,356 1,96 dispersie uniform semnificativ

n continuare se calculeaz valorile i :

,
21,82 22
, ,
,
0,876 1 0,876 0,124 .
Distribuii probabilistice 51

Pornind de la aceste valori, se pot calcula probabilitile pentru


indivizi la ptrat de prob (anexa 3):
!
16 0,876 0,124 0,0331 .
! !

La fel se procedeaz i pentru celelalte valori, dup care se nmulesc


cu numrul unitilor de prob, obinndu-se frecvenele estimate ( ).

16
f f'
14

U
16 3 0,033 1,654 12
17 5 0,082 4,107 10
frecvena

C
18 8 0,160 8,024 8
ES
19 14 0,238 11,881 6
20 11 0,251 12,534 4
21 6 0,168 8,396 2
R

22 3 0,054 2,684 0
FI

16 17 18 19 20 21 22
x
M

Se poate observa c exist o concordan destul de mare ntre


ZA

frecvenele observate i cele estimate pe baza modelului binomial. Deci


putem concluziona c dispersia populaiei este uniform.

4.4.3. Modelul Poisson


Calcularea probabilitii de obinere a unei valori a variabilei pe
unitate de prob, conform distribuiei Poisson, se bazeaz pe procedura
descris n exemplul 4.2.

Exemplul 4.6. ntr-un studiu s-a urmrit densitatea indivizilor unei


specii de arpe n 100 de ptrate de prob, ntr-o formaiune ierboas. Ce tip
de dispersie prezint populaia studiat?
52 Elemente de statistic aplicate n ecologie
Nr. indivizi/ptrat 0 1 2 3 4 5 6 7 8
Frecvena 7 16 25 18 16 10 5 2 1

Se calculeaz media i deviaia standard la fel ca n exemplul 4.5.

0 1 2 3 4 5 6 7 8 Suma
7 16 25 18 16 10 5 2 1 100
0 16 50 54 64 50 30 14 8 286

2,86

U
, , ,
3,11

C
Indicele de dispersie poate fi considerat fie aproximativ egal cu 1, fie
ES
supraunitar.
R

,
Indicele de dispersie 1,088
,
FI

1,088 100 1 107,706


2 107,76 2 100 1 1 0,641
M

0,641 1,96 dispersie aleatoare semnificativ


ZA

n continuare se calculeaz probabilitatea Poisson ( ) pentru


toate valorile variabilei (anexa 3). Se obin astfel probabilitile de apariie
a indivizi la ptrat de prob. Probabilitatea de a obine indivizi n 100

de ptrate se obine nmulind cu 100. Valorile astfel obinute


reprezint frecvenele teoretice ( ).

, ,
0 2,7183 0,05727
!
, ,
1 2,7183 0,16379
!

La fel se procedeaz i pentru celelalte valori, dup care se nmulesc


cu numrul unitilor de prob, obinndu-se frecvenele estimate ( ).
Distribuii probabilistice 53
0,05727 100 5,727
0,16379 100 16,379 .
30
f f'
25
0 7 0,057 5,727
20
1 16 0,164 16,379

frecvena
2 25 0,234 23,422 15
3 18 0,223 22,329
10
4 16 0,160 15,965
5 10 0,091 9,132 5
6 5 0,044 4,353

U
0
7 2 0,018 1,778
0 1 2 3 4 5 6 7 8

C
8 1 0,006 0,636
x
ES
Se poate observa c exist o concordan destul de mare ntre
frecvenele observate i cele estimate pe baza modelului Poisson. Deci
R

putem concluziona c dispersia populaiei studiate este aleatoare.


FI

4.4.4. Modelul binomial negativ


M

Calcularea probabilitii de obinere a unei valori a variabilei pe


unitate de prob, conform distribuiei binomiale negative, se bazeaz pe
ZA

procedura descris n exemplul 4.3.

Exemplul 4.7. ntr-un studiu s-a urmrit densitatea indivizilor unei


specii de plante n 100 de ptrate de prob. Care este tipul de dispersie al


populaiei?

Nr. indivizi/ptrat 0 1 2 3 4 5 6 7 8 9 10 11
Frecvena 20 27 18 12 10 4 2 3 2 0 1 1

Se calculeaz media i deviaia standard la fel ca n exemplul 4.5.

0 1 2 3 4 5 6 7 8 9 10 11 Suma
20 27 18 12 10 4 2 3 2 0 1 1 100
0 27 36 36 40 20 12 21 16 0 10 11 229
54 Elemente de statistic aplicate n ecologie

2,29
, , ,
5,16

Indicele de dispersie este evident supraunitar.


,
Indicele de dispersie 2,252
,
2,252 100 1 222,965
2 222,965 2 100 1 1 7,081
7,081 1,96 dispersie grupat semnificativ

U
Pentru distribuia binomial negativ este necesar calcularea

C
parametrului . Acesta este o variabil continu, motiv pentru care valoarea
ES
sa nu se rotunjete ca n cazul distribuiei binomiale.

,
R

1,829
, ,
FI

n continuare se calculeaz probabilitatea Poisson ( ) pentru


M

toate valorile variabilei :


ZA

, ,
0 1 0,2265 ;
,
, ,
1 0,2265 0,2304 ;

, ,
, ,
2 0,2304 0,1811 .
, ,

La fel se procedeaz pentru restul valorilor lui . Probabilitile de


apariie a indivizi la ptrat de prob se nmulesc cu numrul unitilor de
prob (100), obinndu-se astfel frecvenele estimate ( ) conform
modelului binomial negativ.

0,227 100 22,65


0,2304 100 23,04
0,1815 100 18,15
Distribuii probabilistice 55

30
0 20 0,2265 22,65 f f'
1 27 0,2304 23,04 25
2 18 0,1811 18,11
20
3 12 0,1285 12,85

frecvena
4 10 0,0863 8,63 15
5 4 0,0559 5,59
6 2 0,0354 3,54 10
7 3 0,0220 2,20
8 2 0,0135 1,35 5
9 0 0,0082 0,82
0
10 1 0,0049 0,49

U
11 1 0,0029 0,29 0 1 2 3 4 5 6 7 8 9 10 11

C
x
ES
Se poate observa c exist o concordan destul de mare ntre
frecvenele observate i cele estimate pe baza modelului distribuiei
R

binomiale negative. Deci se poate concluziona c dispersia populaiei


studiate este aglomerat.
FI
M

4.5. DISTRIBUIA NORMAL


ZA

Distribuia normal este una dintre distribuiile continui. Aceasta


descrie, mai mult sau mai puin, distribuia unui mare numr de variabile,

motiv pentru care reprezint o baz conceptual pentru multe procedee de


analiz statistic.
Variabilele continui pot lua orice valoare ntre anumite limite. Dac
se reprezint grafic distribuia frecvenelor unei astfel de variabile ntr-o
populaie, prin intermediul unei linii continui, aceasta va avea o form
simetric, de clopot. De aceea, aceast distribuie mai este numit i
clopotul lui Gauss, care este unul din autorii (Moivre 1733, Legendre
1805, Laplace 1812) care a descris riguros aceast distribuie (Gauss 1809).
Teoretic, dac se realizeaz histograma folosind un numr infinit de valori
individuale, iar intervalul de clas este cel mai mic posibil, histograma sau
poligonul frecvenelor tinde s devin o curb continu (fig. 4.3).
56 Elemente de statistic aplicate n ecologie

U
C
ES
x
Figura 4.3. Distribuia frecvenelor valorilor unei variabile
R

Numeroase variabile continui ntlnite n natur au o distribuie


normal. De asemenea, multe variabile care au o amplitudine mare a
FI

valorilor prezint o distribuie aproximativ normal. Unele distribuii


M

discrete tind s devin aproximativ normale sau simetrice pe msur ce


parametrii legai de numrul de valori cresc.
ZA

Proprietile distribuiei normale


1. Distribuia este definit de medie ( ) i de deviaia standard ( ).


Poziia distribuiei pe abscis este determinat de valoarea mediei,
iar lrgimea acesteia, de deviaia standard (fig. 4.4). Cum aceti
parametri pot avea o infinitate de valori diferite, nseamn c
exist un numr infinit de distribuii normale.
2. nlimea curbei fa de ordonat este dat de funcia de repartiie
pentru fiecare valoare individual a variabilei:

.

Distribuii probabilistice 57

s1
s2

m1 m2

U
Figura 4.4. Distribuii normale diferite dup medii (m) i deviaii standard (s)

C
3. Curba este perfect simetric fa de medie, motiv pentru care
media i mediana sunt egale n distribuia normal. De asemenea,
ES
valorile variabilei egale cu media sunt cele mai frecvente i astfel
media este egal cu modul valorilor individuale. n concluzie,
R

media, mediana i modul valorilor unei variabile normal


distribuite sunt egale.
FI

4. Curba distribuiei cuprinde probabilitatea total, adic 1. Dac se


M

consider suprafaa delimitat de curb ca fiind 100%, atunci


suprafaa delimitat de valoarea i reprezint
ZA

aproximativ 68,26% din total. Adic n jur de 68% dintre valorile


variabilei sunt cuprinse n acest interval sau probabilitatea ca o
valoare selectat aleator din populaie s fie cuprins de acest

interval este de 0,68. ntre 2 i 2 se gsete 95,44%


din suprafaa curbei, adic probabilitatea de a observa o valoare
din acest interval este de 0,9544, iar intervalul 3 , 3
cuprinde 99,74% din valorile individuale sau probabilitatea de a
extrage o valoare din acest interval este de 0,9974 (fig. 4.5). n
practic se folosesc probabilitile 0,95 i 0,99, pentru care
intervalele sunt 1,96 i, respectiv, 2,58 . Probabilitatea
ca o valoare s fie n afara celor dou intervale va fi 1 0,95
0,05 i, respectiv, 1 0,99 0,01. Aceste proprieti pot fi
folosite pentru aprecierea posibilitilor de apariie a unor
rezultate.
58 Elemente de statistic aplicate n ecologie

0,9974

0,9544
0,6826

U
-3 -2 - + +2 +3 x

C
Figura 4.5. Suprafee ale distribuiei normale
ES
Distribuia normal standard
Orice distribuie normal particular ( , ) poate fi convertit la
R

distribuia normal standard care se caracterizeaz prin faptul c are media


zero i deviaia standard unu ( 0,1 ). Aceast conversie se realizeaz prin
FI

calcularea scorului pentru fiecare valoare individual a variabilei , n


M

funcie de media i de deviaia standard populaional ( i ):


ZA

n practic, parametrii populaionali nu pot fi cunoscui cu exactitate,


caz n care pot fi substituii cu statisticile probei ( i ), cu condiia ca


dimensiunea probei sa fie mai mare sau egal cu 30 ( 30).

Astfel, pentru valorile mai mici dect media, va avea o valoare


negativ, iar pentru cele mai mari dect media, o valoare pozitiv. Scorul
arat la ce distan de medie exist o anumit valoare, unitatea de referin
fiind deviaia standard.
Intervalele de probabilitate ale distribuiei normale standard vor fi
Distribuii probabilistice 59
1, 1 pentru aproximativ 0,6826 sau 68,26%, 2, 2 pentru 0,9544 sau
95,44% i 3, 3 pentru 09974 sau 99,74%. Pentru probabilitile de 0,95
i 0,99, intervalele vor fi cuprinse ntre 1,96, 1,96 i, respectiv,
2,58, 2,58 (fig. 4.6).

0,99

U
0,95

0,6826
C
ES
-2,58 -1,96 -1 0 +1 +1,96 +2,58 z
R

Figura 4.6. Suprafee ale distribuiei normale standard


FI

Probabilitile pentru diferite valori ale lui sunt tabelate (anexa 2)


M

sau pot fi calculate (anexa 3) pornind de la coada din stnga (cu valori
extreme negative) a 0,1 i pn la valoarea calculat.
ZA

Exemplul 4.8. Considernd datele din exemplul 3.1 reprezentnd


nlimile a 50 de indivizi de migdal pitic (Amygdalus nana), s se estimeze:

a) Ce procent din populaie are nlimea cuprins ntre 60 i


80 ?
b) ntre ce interval de nlime sunt cuprinse 95% din valorile
nlimii n populaie?

Se cunoate c 70,85 i 6,92.


Pentru a rspunde la prima ntrebare trebuie fcut conversia celor
dou valori la distribuia normal standard, adic trebuie calculate scorurile
pentru cele dou nlimi, dup care se afl probabilitile sau procentele
celor corespunztoare. Simplificnd, se parcurge urmtoarea schem
.
60 Elemente de statistic aplicate n ecologie
, ,
Pentru 60 scorul 1,568 .
, ,
, ,
Pentru 80 scorul 1,322 .
, ,

Probabilitile celor dou scoruri se caut n tabel (anexa 2) sau se


calculeaz (anexa 3)

1,568 0,058
1,322 0,907 .

Prima probabilitate arat c din coada stng (cu valori negative) a


0,1 i pn la 1,568 sunt cuprinse 5,8% din suprafaa delimitat

U
de curb. A doua arat c din coada stng a 0,1 i pn la 1,322

C
sunt cuprinse 90,7% din suprafaa delimitat de curb.
Ca s aflm ce procent din valorile nlimii se gsesc ntre 60 i
ES
70 , trebuie sczute probabilitile:
R

0,907 0,058 0,849 .


FI

Rspunsul la prima ntrebare este c ntre 60 i 70 sunt


cuprinse aproximativ 85% din valorile nlimii n populaie.
M
ZA

Pentru a rspunde la a doua ntrebare este nevoie s se parcurg


schema de raionament de la prima, dar n sens invers: .
Scorul pentru o anumit probabilitate se afl din tabel (anexa 2)

sau se calculeaz (anexa 3). Avnd n vedere c att tabelul din anexa 2, ct
i funcia din anexa 3 consider probabilitatea din coada stng a 0,1 ,
nseamn c aflarea scorului pentru 0,95 va returna limita superioar
a unui interval dispus asimetric fa de medie, limita inferioar fiind ctre
. Astfel, pentru a obine scorurile care s delimiteze o suprafa de
0,95 din 0,1 simetric fa de medie, trebuie ca diferena 1 0,95
0,05 s fie mprit n mod egal n ambele cozi ale distribuiei (ca n fig.
4.6). Deci se afl scorurile pentru 0,025 i, respectiv, pentru 1
0,025 0,975. La fel ca la punctul a), primul separ 0,025 pn n coada
stng, al doilea, 0,975 pn n coada stng, iar ntre cei doi se gsete o
suprafa ce reprezint 0,95 din suprafaa total de sub clopot.
Distribuii probabilistice 61

, 1,96
, 1,96

Mai departe se calculeaz cele dou valori ale nlimii ( ) pornind


de la cele dou scoruri , pe baza relaiei pentru aflarea scorurilor .

70,85 1,96 6,92 57,29


70,85 1,96 6,92 84,41

U
Rspunsul de la punctul b) este c ntre 57,29 i 84,41 sunt
cuprinse 95% din valorile nlimii n populaie.

C
ES
4.5.1. Aprecierea normalitii datelor
Metodele statistice utilizate n ecologie sunt de dou categorii:
parametrice i neparametrice. Cele parametrice sunt mai puternice, dar
R

totodat mai restrictive n sensul c se pot aplica doar dac datele ntrunesc
FI

o serie de condiii. O condiie comun pentru toate testele parametrice este


ca datele s fie aproximativ normal distribuite. Metodele neparametrice nu
M

prevd aceast condiie i din aceast perspectiv se mai numesc i


independente de distribuie. Ele pot fi utilizate pentru o gam mai variat de
ZA

situaii, dar sunt mai puin puternice (seciunea 5.5, Erori statistice).
Deci, pentru a putea utiliza metode statistice parametrice, trebuie s
se verifice normalitatea distribuiei datelor. Din start trebuie subliniat c

variabilele trebuie s fie apreciate pe o scal de interval sau raport, cu alte


cuvinte trebuie s fie continui sau discrete (n cazul celor discrete trebuie s
existe un numr relativ mare de valori posibile).
n statistic exist teste dedicate, care verific dac datele au o
distribuie aproximativ normal, dar care sunt relativ complicate i rareori
utilizate, motiv pentru care doar le menionm pe cele mai cunoscute: testul
Shapiro-Wilk, testul Kolmogorov-Smirnov, testul Cramr-von-Mises, testul
Jarque-Bera.
Testarea normalitii se poate face i cu ajutorul testului de
concordan ntre frecvenele valorilor variabilelor din prob i frecvenele
estimate pe baza funciei de repartiie a distribuiei normale. Acest procedeu
62 Elemente de statistic aplicate n ecologie
este i el destul de laborios.
O verificare simpl, dar laborioas a normalitii distribuiei datelor,
o reprezint aprecierea empiric a similaritii dintre poligonul frecvenelor
valorilor variabilei investigate i curba n form de clopot a distribuiei
normale. n cadrul exerciiului din exemplul 2.3 (fig. 2.3, 2.4) se poate
spune c frecvenele observate au o distribuie ce poate fi considerat
aproximativ normal.
Verificarea normalitii datelor se poate face i pornind de la
proprietile matematice ale distribuiei normale. Astfel, dac valorile sunt
distribuite simetric fa de medie, adic ntre medie i median nu exist o
diferen mare (seciunea 3.1 Relaia dintre descriptorii tendinei centrale),
i aproximativ 70% din valori sunt cuprinse n intervalul delimitat de

U
valorile i , atunci se poate aprecia c variabila analizat este
aproximativ normal distribuit n prob.

C
ES
Exemplul 4.9. S se verifice rapid dac datele din exemplul 3.1 au o
distribuie apropiat de cea normal.
R

Simpla vizualizare a descriptorilor tendinei centrale arat c


FI

distribuia valorilor din prob este aproximativ normal deoarece acetia au


valori foarte apropiate.
M

69
ZA

69,8
70,85

Intervalul are urmtoarele limite:

70,85 6,92 63,93


70,85 6,92 77,77 .

ntre aceste dou valori se gsesc 34 din 50 de valori, adic 68% din
valorile din prob. Acest procent este apropiat de cel cuprins n intervalul
, al unei distribuii normale, adic de 68,26%.

Dac datele nu sunt normal distribuite, atunci cel mai simplu este s
Distribuii probabilistice 63
se foloseasc o metod statistic alternativ, neparametric. Folosirea
metodelor parametrice n astfel de situaii este totui permis dac se
realizeaz o transformare a datelor care s corecteze distribuia acestora.
Transformarea datelor este necesar dac datele sunt sub form de
numr de entiti. Astfel de variabile discrete au o distribuie evident
asimetric. n astfel de situaii se folosesc transformri care au rolul de a
normaliza distribuia datelor.
Numeroase tehnici parametrice compar mediile probelor care se
presupune c au variane suficient de asemntoare i care, din aceast
cauz, pot fi ignorate. Datele discrete ce reprezint numrtori de entiti nu
ndeplinesc aceast condiie, deoarece variana este dependent de medie n
sensul c populaiile la care media are o valoare mare, mprtierea valorilor

U
fa de medie este mai mare i, implicit, variana va fi mai mare. n astfel de
situaii transformrile au rolul de a ntrerupe relaia dintre medie i varian,

C
adic de a stabiliza variana datelor.
ES
Transformrile cele mai utilizate n ecologie sunt logaritmul,
radicalul i transformarea arcsin (anexa 3). Acestea se calculeaz n diferite
condiii pentru toate valorile individuale din probe.
R

Transformarea logaritmic se utilizeaz atunci cnd variana


FI

probei este mai mare dect media acesteia. De asemenea, are si rolul de a
normaliza distribuia datelor. Valoarea transformat a unei valori
M

individuale se calculeaz folosind cel mai adesea logaritmul zecimal sau


pe cel natural:
ZA

sau .

Dac n prob exist valori egale cu zero, atunci logaritmul nu are


sens i transformarea se poate face fie adugnd o unitate la toate valorile,
fie folosind transformarea arcsinh (sinus hiperbolic invers) returneaz
valoarea zero dac 0.

Transformarea prin extragerea radicalului se folosete atunci


cnd variana datelor de tip numr de entiti este aproape egal cu media i
64 Elemente de statistic aplicate n ecologie
pentru normalizarea distribuiei. i aici, n cazul existenei valorilor nule, se
poate aduna o constant la toate valorile din prob (1 sau 0,5):


1 sau 0,5 .

Transformarea arcsin se folosete atunci cnd datele sunt sub


form de proporii sau procente. n cazul unor astfel de variabile distribuia
valorilor este trunchiat de cele dou valori extreme: 0 i 1 pentru proporii
i 0 i 100 pentru procente. Rezultatul transformrii n radian se transform
n grade (anexa 3).

U
pentru proporii
pentru procente
C
ES
R

n anumite situaii este nevoie de realizarea transformrii inverse


FI

(anexa 3) pentru raportarea rezultatului n forma iniial a datelor ( ).


Transformarea invers se realizeaz astfel:
M

Pentru transformarea prin logaritmare:


ZA

1.

Pentru transformarea arcsinh:


Pentru transformarea prin radical:

1 sau 0,5 .

Pentru transformarea arcsin:


sin
sin 100 .
5. STATISTIC INFERENIAL: ELEMENTE
INTRODUCTIVE
Statistica inferenial (inductiv sau analitic) este partea statisticii
care cuprinde metode de apreciere critic a variabilitii parametrilor
empirici. Inferena statistic reprezint tratarea teoretic a datelor pentru a se
ajunge la concluzii logice, asociate observaiilor efectuate. Din punct de
vedere ecologic, inferena statistic reprezint stabilirea unor concluzii
despre populaii pornindu-se de la analiza probelor prelevate din populaiile

U
respective.

C
n general, se recunosc dou categorii largi de inferene statistice:
estimarea unor parametri populaionali i testarea ipotezelor statistice.
ES
5.1. ESTIMAREA MEDIEI POPULAIONALE
R

Dac dintr-o populaie se preleveaz o prob aleatoare, aceasta va fi


FI

una din numeroasele probe aleatoare care se pot extrage din populaia
M

respectiv. Fiecare dintre aceste populaii va avea statistici diferite: medii


diferite, deviaii standard diferite. Cu toate acestea, statisticile acestor
ZA

populaii sunt estimatori ai parametrilor populaionali (fig. 5.1). Diferenele


dintre aceste probe sunt cauze ale erorii de eantionare, ce rezult din faptul
c unele probe vor cuprinde mai multe valori mari, n timp ce altele, mai

multe valori mici din populaia de cercetat. Eroarea de eantionare nu este


rezultatul unor greeli realizate de observator, ci reflect mprtierea
aleatoare ce se regsete n probe. Mediile probelor prelevate aleator din
populaie se distribuie n jurul mediei populaionale, la fel cum valorile
individuale ntr-o prob se distribuie n jurul mediei probei (fig. 5.2). Acest
concept are o valoare fundamental i este surprins de Teorema limit
central (Moivre 1738, Laplace 1813): mediile probelor (x ) extrase dintr-o
populaie normal distribuit sunt la rndul lor normal distribuite n jurul
mediei populaionale (). Mediile probelor extrase dintr-o populaie
nenormal distribuit au o distribuie aproximativ normal dac dimensiunea
probei este mare (n > 30).
66 Elemente de statistic aplicate n ecologie

Populaie
,

Populaie 1 Populaie 2 Populaie 3 Populaie i


x 1, s1 x 2, s2 x 3, s3 x i, si

Figura 5.1. Reprezentarea grafic a prelevrii repetate a probelor din populaie. (linie

U
continu sensul prelevrii; line ntrerupt sensul estimrii)

C
ES
R
FI
M
ZA

x 1 x 2 x 3 x 4 x 5 x 6
Figura 5.2. Distribuia normal a mediilor probelor fa de media populaiei

Utilitatea acestei teoreme const n faptul c nu este necesar


prelevarea repetat a probelor din populaie pentru a cunoate modul lor de
distribuire; ele vor avea o distribuie normal. Astfel, putem lua n
considerare doar o singur medie a unei probe prelevate dintr-o populaie ca
fiind una dintre numeroasele medii a cror distribuie ar fi normal. La fel
cum deviaia standard surprinde mprtierea valorilor individuale fa de
media probei, tot aa, mprtierea mediilor probelor poate fi surprins de o
deviaie standard a mediilor probelor, care se numete eroarea standard a
mediei.
Estimarea mediei populaionale se poate face pornind de la media i
Statistic inferenial: elemente introductive 67
deviaia standard ale unei probe i cu ajutorul erorii standard a mediei. Dat
fiind faptul c distribuia mediilor probelor se abate de la normalitate pe
msur ce dimensiunea probei scade, se apeleaz la o distribuie care descrie
mai bine distribuia mediilor probelor atunci cnd deviaia standard a
populaiei este estimat prin deviaia standard a probei. Aceast distribuie
se numete distribuia sau distribuia Student.
Distribuia Student este similar n multe privine cu distribuia
normal, dar, spre deosebire de aceasta, este definit, pe lng media i
deviaia standard, i de numrul gradelor de libertate ( 1). Aa cum o
valoare corespunde unei anumite proporii din distribuia normal
standard, tot aa o valoare corespunde unei proporii a distribuiei Student,
dar n plus ia n consideraie i dimensiunea probei prin intermediul gradelor

U
de libertate. Valorile lui scad odat cu creterea diferenei 1, astfel c o

C
valoare critic , , ce definete 0,95 sau exclude 0,05 din distribuia
Student pentru o infinitate de valori ca grade de libertate are valoarea 1,96,
ES
adic exact valoarea lui , ce definete aceeai proporie din distribuia
normal standard. Deci distribuia t tinde s devin normal odat cu
R

creterea dimensiunii probei.


Valorile distribuiei t sunt tabelate sau se pot calcula n funcie de
FI

proporia exclus din distribuie i de numrul gradelor de libertate. De


M

exemplu, valoare ce exclude 0,05 din distribuia Student pentru 1 4


grade de libertate este 2,776. Proporia (0,05) sau procentul (5%) exclus
ZA

este repartizat n mod egal n cele dou cozi ale distribuiei (fig. 5.3).

0,025 0,025

-2.776 0 2.776

Figura 5.3
Deci exist de fapt dou valori : 2,776 care exclude 0,05/2
68 Elemente de statistic aplicate n ecologie
0,025 din coada din dreapta a distribuiei i 2,776 care exclude 0,025 din
coada stng a distribuiei.
Dac dorim s reprezentm valoarea care exclude 0,05 din
distribuie doar n coada dreapt pentru 4 grade de libertate, atunci trebuie
cutat n tabel valoarea ce exclude 0,1 din distribuie, care exclude cte
0,05 n fiecare coad din distribuie (fig. 5.4). Aceast valoare este 2,132.
Deci, dac ne intereseaz o singur coad a distribuiei, trebuie cutat
valoarea care exclude o proporie dubl din distribuie.

U
C
ES
0,05 0,05
R

-2.132 0 2.132
FI

Figura 5.4
M

Estimarea intervalului de confiden al mediei populaionale pe baza


deviaiei standard a probei i cu ajutorul distribuiei are urmtoarele
ZA

condiii de aplicare:

1. proba este prelevat aleator din populaia de interes;


2. datele sunt apreciate pe o scal de raport sau de interval;


3. variabila este aproximativ normal distribuit n prob.

Pentru a realiza estimarea este nevoie de valoarea mediei probei i


a deviaiei standard estimate .
Cu ajutorul deviaiei standard se calculeaz eroarea standard a
mediei:

.

Statistic inferenial: elemente introductive 69
Se estimeaz intervalul de confiden pentru o probabilitate de 0,95
(95%) a mediei populaiei pornind de la relaia:

, , .

Din aceast relaie rezult limita inferioar ( ) i cea superioar


( ) a intervalului de confiden:

, ,
, , .

Concluzia estimrii este c intervalul - include media populaiei

U
din care a fost extras proba, cu o probabilitate de 95% (0,95).

C
Exemplul 5.1. La o prob format din 30 de indivizi de viper de
ES
step (Vipera ursinii moldavica) extras aleatoriu dintr-o populaie s-a
msurat lungimea n mm de la vrful botului i pn la cloac. S-a estimat
R

apoi intervalul de confiden al mediei pentru o probabilitate de 95%.


FI

390 228 440 66 215 146 443 375 450 260


M

330 500 340 363 491 325 390 425 418 422
389 435 470 360 370 400 390 430 164 340
ZA

Se verific dac datele ndeplinesc condiiile de aplicare: proba a fost


prelevat aleatoriu din populaia de interes; lungimea este o variabil

continu apreciat pe o scal de raport; pentru a verifica normalitatea datelor


putem folosi elemente din statistica descriptiv a probei.

390
389,5
362,17

Cele trei msuri ale tendinei centrale au valori relativ apropiate. Se


poate considera c datele sunt aproximativ normal distribuite.
n continuare se calculeaz deviaia standard a probei:
96,62 .
70 Elemente de statistic aplicate n ecologie

Cu ajutorul acestei valori se afl eroarea standard a mediei:


, ,
17,64 .
,

Se estimeaz limitele intervalului de confiden al mediei. n acest


sens, se caut valoarea n tabel.

, , 2,045

362,17 17,64 2,045 362,17 36,08


362,17 36,08 326,09

U
362,17 36,08 398,25

C
ES
Intervalul 326,09-398,25 include media populaional a lungimii de
la vrful botului la cloac cu o probabilitate de 95%.
Reprezentarea grafic a intervalului de confiden al mediei se
R

realizeaz prin intermediul unor segmente dispuse deasupra i dedesubtul


FI

mediei, ce simbolizeaz limita inferioar i cea superioar (fig. 5.5).


M

420
ZA

400

380 326,09

360 362,17

340

320 398,25

300
x
Figura 5.5. Intervalul de confiden al mediei (95%)

Acest tip de reprezentare poate fi folosit i atunci cnd se compar


mediile mai multor probe din populaii diferite. Suprapunerea intervalelor
Statistic inferenial: elemente introductive 71
indic absena unei diferene marcante ntre mediile celor dou populaii din
care au fost prelevate probele analizate.

5.2. ESTIMAREA UNEI PROPORII

n ecologie, se folosesc adesea frecvenele de apariie ale unei valori


n probe reprezentat sub forma unei proporii sau procent din total.
Proporia unei specii n prob reprezint o estimare a proporiei populaiei n
comunitatea analizat. Probele ulterioare reprezint estimatori ai proporiei
populaiei din specia de interes n comunitate. Proporiile rezultate din
analiza acestor probe vor fi diferite datorit erorii de selecie. Aceste
proporii ale probelor se vor distribui n jurul proporiei populaiei n acelai

U
fel cu modul n care se distribuie mediile probelor n jurul mediei populaiei.
Deviaia standard a distribuiei se numete eroare standard i se estimeaz

C
astfel:
ES
. .
R

proporia speciei numrul total de specii.


FI

Intervalul de confiden al proporiei populaiei este:


M
ZA

1,96 . . .

5.3. ESTIMAREA EFECTIVULUI POPULAIONAL


Indicele Lincon-Petersen este un estimator al numrului de indivizi


dintr-o populaie, pe baza proporiei indivizilor marcai n prima prob care
se regsesc (sunt recapturai) n a doua prob.

1,
estimarea efectivului populaiei;
nr. indivizilor capturai, marcai i eliberai n prima prob;
nr. total al indivizilor capturai n a doua prob;
nr. indivizilor marcai, recapturai n a doua prob.
Deviaia standard aproximativ a acestui estimator este:
72 Elemente de statistic aplicate n ecologie

Intervalul de confiden al efectivului populaiei ( ) pornind de la


relaia:

1,96 .

5.4. ESTIMAREA INDICELUI DE DIVERSITATE

Indicii de diversitate sunt utili n aprecierea biodiversitii unei zone.

U
Cel mai simplu indicator al diversitii biologice este bogia specific sau

C
numrul de specii. Exist o serie de indici ai diversitii care, pe lng
numrul de specii, iau n consideraie i ct de echitabil sunt reprezentate
ES
speciile din comunitate, prin intermediul numrului de indivizi. Unul dintre
cei mai folosii astfel de indici este indicele Shannon-Weaver:
R


FI

proporia indivizilor speciei i din suma nr. de indivizi ai tuturor


speciilor.
M
ZA

Estimarea deviaiei standard care s descrie mprtierea valorilor


indicilor calculai pentru aceeai comunitate, n jurul unei medii
populaionale, este dificil. Din raiuni practice, valoarea indicelui trebuie
tratat ca o variabil ordinal. Astfel, o valoare a indicelui egal cu 4,0 nu

trebuie considerat ca fiind de dou ori mai mare dect una egal cu 2,0.
Tehnicile statistice care se pot aplica valorilor apreciate pe o scal ordinal
sunt n general neparametrice sau independente de distribuie. De exemplu,
un set de indici obinui prin analiza mai multor probe extrase din aceeai
zon poate fi comparat cu un alt set extras rezultat din alt zon prin
intermediul testului Mann-Whitney (seciunea 7.1.2).
O alt modalitate de comparare a indicilor const n transformarea
acestora n diversiti relative ( ), exprimate proporional sau procentual:
Statistic inferenial: elemente introductive 73
diversitatea maxim pentru acelai numr de specii
(diversitatea unei comuniti ideale cu acelai nr. de specii
cu cea real, n care toate speciile sunt reprezentate prin
acelai nr. de indivizi);
bogia specific sau nr. de specii identificate n comunitate.

Cnd se compar valorile indicilor de diversitate ( ) trebuie avute n


vedere dou aspecte: se compar indici pentru comuniti asemntoare (de
exemplu, se compar o comunitate de psri cu alta tot de psri, nu de
mamifere); se compar indici rezultai din analiza unor probe cu numere
apropiate de organisme.

U
Exemplul 5.2. ntr-un studiu al vegetaiei de step din rezervaia de
la Valea lui David s-au calculat diversitile pentru cinci comuniti vegetale

C
din asociaia Taraxaco serotinae-Festucetum valesiacae i diversitatea unei
ES
comuniti din aceeai asociaie, studiat nainte de 1969 i notat cu A.

Releveu
R

1 1,519 0,438 0,143 32,0 -1,947 3,466


FI

2 1,543 0,454 0,156 30,0 -1,858 3,401


3 1,971 0,579 0,239 30,0 -1,430 3,401
M

5 2,051 0,637 0,311 25,0 -1,168 3,219


ZA

4 2,130 0,662 0,337 25,0 -1,089 3,219


Media 1,843 0,554 0,237 28,4 -1,498 3,341
A 1,639 0,423 0,107 48,0 -2,232 3,871

Se poate observa c media indicilor de diversitate a celor cinci


relevee actuale este ceva mai mare dect valoarea indicelui pentru releveul
A, dei numrul de specii ( ) n cel din urm este evident mai mare. Acest
fapt poate fi explicat prin echitabilitatea redus a speciilor n releveul A.
Echitabilitatea n acest exemplu a fost calculat pe baza relaiei:

Cum echitabilitatea este un numr subunitar, logaritmul va fi un


74 Elemente de statistic aplicate n ecologie
numr negativ, deci indicele de diversitate este egal cu diversitatea
maxim care este micorat de echitabilitatea sczut a
abundenei speciilor

5.5. TESTAREA IPOTEZELOR STATISTICE

n orice tiin, progresul se obine prin realizarea observaiilor


asupra unor procese sau fenomene i prin experimente ale cror concluzii
sunt utilizate sub forma unor generalizri sau teorii care s explice
observaiile. Demersul tiinific debuteaz cu realizarea observaiilor i cu
explicarea lor. Explicaia unei observaii tiinifice se numete ipotez i are

U
urmtoarele caracteristici: este n concordan cu observaiile fcute, adic,
dac este adevrat, atunci va explica ceea ce s-a observat; poate fi testat

C
prin experimente, adic, dac este fals, atunci acest lucru poate fi dovedit.
ES
De ce trebuie dovedit falsitatea unei ipoteze i nu veridicitatea ei?
n filosofia tiinei, se consider c s poate dovedi c o ipotez fals este
fals, n timp ce o ipotez adevrat poate s nu se dovedeasc niciodat c
R

este adevrat. Ca urmare, o ipotez este considerat adevrat att timp ct


FI

nu poate fi infirmat prin alte observaii, experimente i testri. Cnd


ncercrile de a dovedi falsitatea unei ipoteze eueaz, atunci ncrederea,
M

confidena n ipoteza respectiv crete. Dac o astfel de ipotez are o


aplicativitate larg i explic numeroase evenimente, atunci ea devine o
ZA

teorie. La fel ca n cazul ipotezelor, o teorie adevrat s-ar putea s nu poat


fi dovedit a fi adevrat, n timp ce una fals se poate dovedi a fi fals.
Se poate astfel spune c tiina avanseaz mai degrab infirmnd

dect afirmnd i c pn la urm teoriile incorecte vor fi invalidate.


Metodologia tiinific de confirmare a unei ipoteze opereaz pe
baza logicii dac atunci: dac ipoteza este corect, atunci rezultatul
testrii trebuie s fie unul anume. Dac rezultatul testrii este altul dect cel
prezis de ipotez, aceasta se respinge i trebuie cutat o explicaie mai
bun. Acest proces tipic pentru tiin este numit testarea ipotezelor.
Testarea unor concluzii tiinifice prin procedee statistice se numete
testarea ipotezelor statistice i reprezint o aplicare specific a
metodologiei tiinifice. Formularea ipotezelor statistice se face astfel nct
s existe doar dou rezultate posibile. De exemplu, se pot formula dou
Statistic inferenial: elemente introductive 75
ipoteze: afirmaia A este adevrat i afirmaia A nu este adevrat.
Dac primul enun este cel adevrat, atunci, conform filosofiei tiinei, nu se
poate dovedi acest fapt. Dac ns se testeaz al doilea enun i acesta se
dovedete a fi incorect (o ipotez fals se poate dovedi c este fals), atunci
se respinge enunul testat afirmaia A este fals i se accept cellalt
enun afirmaia A este adevrat ca unic alternativ corect.
Cnd se lucreaz pe probe extrase din populaii, deci doar cu o parte
din ntregul la care n final se va face referin, va exista ntotdeauna o
probabilitate ca proba s nu fie reprezentativ pentru toat populaia. Cu
toate acestea, se va putea preciza probabilitatea ca o ipotez din cele dou s
fie corect sau incorect. Dac probabilitatea ca ea s fie incorect este
foarte mic, atunci se poate considera c ipoteza respectiv este corect i

U
invers, dac probabilitatea ca ipoteza s fie corect este foarte mic, atunci
se poate concluziona c ipoteza este incorect.

C
n orice testare a ipotezelor statistice, ipotezele formulate sunt
ES
ntotdeauna contradictorii. Ipoteza testat prin diferite procedee numite teste
statistice este aa-numita ipotez nul ( ). Aceasta presupune n general
lipsa efectului, lipsa diferenei i, ca urmare, conine sau implic o egalitate.
R

Cealalt ipotez, ipoteza alternativ ( sau ), se numete ipotez


FI

alternativ. De exemplu, dac dorim s artm c este diferit de , atunci


va fi (conine o egalitate), iar cea va fi . Ipoteza care se
M

testeaz este de fapt . Dac aceasta se dovedete adevrat, atunci se


ZA

accept ca atare. Dac se dovedete a fi fals, atunci se respinge i se


accept ca unic alternativ.
Orice test statistic const ntr-o serie de calcule aplicate datelor din
probe care au ca rezultat o singur valoare numit statistica testului.

Statistica unui test reprezint o translaie a datelor din probe la o distribuie


cunoscut. Este un proces similar cu cel de trecere a unei valori de la o
distribuie normal particular la o valoare a distribuiei normale standard,
valoare ce corespunde unei anumite proporii din distribuie sau unei
anumite probabiliti (seciunea 4), conform schemei .
Statistica testului, proprie unui anumit tip de distribuie, este comparat cu o
valoare cu semnificaie de prag pentru o anumit probabilitate, numit
valoare critic. n funcie de poziionarea statisticii testului fa de valoarea
critic, se ia decizia de acceptare sau respingere a ipotezei nule. Valorile
critice pentru fiecare test statistic sunt calculate i aranjate n tabele sau se
76 Elemente de statistic aplicate n ecologie
pot calcula pornind de la funciile specifice distribuiilor.
n funcie de ntrebarea la care trebuie s rspund testul statistic,
ipotezele acestuia se pot scrie n mai multe variante. Dac ipotezele conin
semnele i , atunci se realizeaz un test n variant bilateral
( : ; : ). Denumirea provine de la faptul c exist dou
situaii n care se poate respinge ipoteza nul i accepta ipoteza alternativ:
cnd i cnd . Dac ipotezele conin semnele , , i ,
atunci se realizeaz un test n variant unilateral ( : ; :
sau : ; : ). n oricare din cele dou variante exist doar o
singur situaie n care se poate respinge ipoteza nul i se poate accepta
ipoteza alternativ: dac i numai dac , pentru prima pereche de
ipoteze, i dac i numai dac , pentru a doua pereche de ipoteze.

U
n general, testele unilaterale se utilizeaz doar dac exist un motiv
apriori care s sugereze o tendin direcional a datelor. Este bine ca testele

C
bilaterale s se fac dup o testare n variant bilateral. ntre cele dou
ES
variante ale unui test nu exist nici o diferen n privina modului de calcul
al statisticii testului, ci difer doar ipotezele i pragul de semnificaie mai
mic n cazul testelor unilaterale (seciunea 5.1, fig. 5.3, 5.4 i explicaiile
R

aferente).
FI

Luarea unei decizii statistice se realizeaz n funcie de pragul de


probabilitate. Acesta se mai numete i nivel de confiden, de ncredere
M

sau prag de semnificaie i se noteaz cu . Valorile cel mai des utilizate


ZA

n ecologie sunt 0,05 sau 0,01 i se desemneaz nainte de derularea


testului. Pragul de semnificaie ( ) sau probabilitatea calculat pentru o
anumit statistic a unui test ( ) trebuie precizat n concluziile oricrei
cercetri n care s-au folosit teste statistice (de exemplu, rezultatul este

semnificativ n proporie de 95% sau pentru 0,05 sau


pentru 0,05 sau pentru 0,0003).
Se poate ntmpla ca s fie respins pentru o valoare a
probabilitii egale cu 0,05, dar s nu poat fi respins dac nivelul de
ncredere stabilit apriori este de 0,01. Aceast situaie se datoreaz faptului
c, pentru majoritatea distribuiilor, valoarea critic crete pe msur ce
nivelul de ncredere scade. Ce decizie se ia ntr-o astfel de situaie i cum
poate fi ea argumentat pentru a elimina subiectivismul?

n orice test statistic pot s apar dou genuri de erori statistice (tab.
Statistic inferenial: elemente introductive 77
5.1):
eroare de genul I, ce const n respingerea eronat a cnd este
adevrat; riscul sau probabilitatea de a face o astfel de eroare este ;
eroare de genul II, ce const n acceptarea eronat a cnd este
fals; riscul sau probabilitatea de a face o astfel de eroare este .

Tabelul 5.1. Consecinele posibile ale unei decizii statistice


Ipoteza adevrat

Corect Eroare II
1
Ipoteza acceptat
Eroare I Corect

U
1

C
Dac se dorete reducerea riscului de a comite o eroare I, atunci
ES
trebuie s scad, ceea ce conduce la creterea riscului de a comite o eroare
II i invers. Se consider c 0,05 asigur un echilibru ntre riscul de a
comite o eroare de genul I i cel de a comite o eroare de genul II.
R

Dac valoarea se decide de la nceput sau se poate calcula pentru o


FI

anumit statistic a unui test corespunztor unei funcii de distribuie,


valoarea lui nu se calculeaz. Valoarea lui scade pe msur ce
M

dimensiunea probelor ( ) crete i crete pe msur ce diferena dintre


ZA

valorile comparate ( i ) scade. Riscul variaz de la un test la altul. Un


test puternic nseamn de fapt c are un risc mic, adic este mai puin
influenat de dimensiunea probei i de diferenele mici dintre valorile
comparate.

Legat de puterea unui test sau de riscul de a comite o eroare de genul


II, trebuie menionat c testele neparametrice sau independente de distribuie
sunt mai puin puternice dect cele parametrice, mai restrictive. Din aceast
cauz un cercettor ar putea manifesta o tendin de evitare a testelor
neparametrice n ideea folosirii unor teste mai puternice. O astfel de
atitudine se poate dovedi eronat nu trebuie sacrificat validitatea utilizrii
unui test n favoarea puterii acestuia! Regula de siguran n privina alegerii
unui test parametric sau neparametric este c, dac exist o ndoial orict
de mic cu privire la modul n care datele din probe satisfac condiiile
restrictive ale unui anumit test parametric, atunci mai bine se apeleaz la un
78 Elemente de statistic aplicate n ecologie
test neparametric alternativ celui parametric.
Rezumnd aspectele prezentate pn acum, testarea ipotezelor
statistice se realizeaz prin parcurgerea urmtoarelor etape:

1. Enunarea clar a ntrebrii la care se dorete aflarea rspunsului


n urma prelucrrii datelor din probe.
2. Identificarea tipului de variabil i a scalei de apreciere a acesteia
i aprecierea distribuiei probei. Aceast etap permite luarea
deciziei privind utilizarea unui test parametric sau a unuia
neparametric.
3. Pe baza rspunsurilor din primele dou etape se formuleaz cele
dou ipoteze statistice (practic se alege o variant bilateral sau

U
una unilateral a testului) i se stabilete regula de decizie (se
desemneaz nivelul de ncredere sau de confiden ).

C
4. Se calculeaz statistica sau statisticile testului.
ES
5. Se compar statistica obinut cu valoarea critic corespunztoare
valorii i gradelor de libertate i se ia o decizie privind
acceptarea sau respingerea ipotezei nule. Decizia mai poate fi
R

luat i prin calcularea probabilitii corespunztoare statisticii


FI

testului (aceasta va fi de fapt probabilitatea ca s fie adevrat)


cu ajutorul funciei distribuiei acesteia sau folosind un sistem de
M

programe pentru computere adecvat (un software).


ZA

6. TESTAREA UNEI IPOTEZE PRIVIND MEDIA UNEI
SINGURE POPULAII

Aceast testare permite compararea mediei unei probe (x ) cu o


valoare de interes care de obicei reprezint media cunoscut a unei populaii
(). Altfel spus, se verific ce probabilitate exist ca proba luat n analiz
s provin dintr-o populaie cu o anumit medie cunoscut. Populaia din
care a fost extras proba poate fi diferit de cea de referin, caz n care se

U
testeaz o ipotez nul conform creia nu exist o diferen semnificativ

C
ntre mediile celor dou populaii.
Testul care se folosete ntr-o astfel de situaie se numete Testul
ES
(Student) pentru o prob. Fiind un test parametric, condiiile de aplicare
ale acestuia sunt urmtoarele:
R

1. proba trebuie s fie extras aleator din populaie;


FI

2. variabila trebuie s fie exprimat pe o scal de raport sau de


interval;
M

3. valorile probei trebuie s fie aproximativ normal distribuite.


ZA

Dac este media populaiei din care a fost extras proba i este
media populaiei de referin sau o valoare de referin, atunci ipotezele

testului pot fi:

: : :
: : : .

Prima pereche de ipoteze se scrie n cazul variantei bilaterale a


testului, adic atunci cnd ntrebarea este: Exist o diferen semnificativ
ntre i ?.
Ultimele dou perechi de ipoteze se scriu n cazul unui test
unilateral dreapta (Este semnificativ mai mare dect ?) i, respectiv,
unui test unilateral stnga (Este semnificativ mai mic dect ?).
80 Elemente de statistic aplicate n ecologie
Indiferent de varianta n care se realizeaz testul, statistica sa este:

n aceast relaie este un estimator al mediei populaiei din care a


fost extras proba ( ).
Condiia testului const n compararea statisticii acestuia cu o
valoare critic , :

dac , se respinge i se accept pentru o


probabilitate de 1 sau 100 1 %. Deci se accept c i

U
difer semnificativ una de alta. Dac , , atunci se accept

C
pentru aceeai probabilitate, adic nu exist o diferen
semnificativ ntre i .
ES
Dac este semnificativ diferit de , nseamn c este ori mai
R

mare, ori mai mic dect Aceasta implic faptul c este mai mic sau
mai mare dect .
FI

n situaia n care este mai mare dect , atunci numrtorul


statisticii va fi negativ i, implicit, statistica va avea o valoare negativ.
M

Deci trebuie comparat cu valoarea critic pozitiv aflat n dreapta cozii


ZA

distribuiei . n acelai mod, dac este mai mic dect , statistica va fi


negativ i trebuie comparat cu valoarea critic negativ din coada stng a
cozii distribuiei.

Condiia testului ar trebui n realitate scris astfel:

dac t este mai mic dect valoarea critic negativ i mai mare dect
valoarea critic pozitiv, atunci se respinge i se accept
pentru o probabilitate de 1 sau 100 1 %.

Astfel rezult c dac se gsete ntre valoarea critic negativ i


cea pozitiv, va fi acceptat. Deci ntre cele dou valori critice exist
zona de acceptare a ipotezei nule (1 ), n afara creia se gsesc zonele de
respingere a acesteia i de acceptare a ipotezei alternative (cte /2 n
fiecare coad a distribuiei) (fig. 6.1).
Testarea unei ipoteze privind media unei singure populaii 81

/2 /2
1-

H1 -t H0 +t H1

Figura 6.1. Zonele de respingere a pentru un test bilateral

U
C
Atunci cnd se aplic testul n variant unilateral, atunci exist o
singur zon de respingere a cantonat doar ntr-o singur coad a
ES
distribuiei: dreapt sau stng. Dac se vizeaz coada din dreapta
distribuiei ( : ), atunci statistica testului ( ) trebuie comparat cu
R

valoarea critic pozitiv (fig. 6.2).


FI
M
ZA


1-

H0 +t H1

Figura 6.2. Zona de respingere a pentru un test unilateral dreapta

Dac se urmrete coada din stnga a distribuiei ( : ),


atunci statistica testului ( ) trebuie comparat cu valoarea critic negativ
(zona de respingere a se afl n partea opus fa de cum este prezentat
n figura 6.2).
82 Elemente de statistic aplicate n ecologie
Pentru a simplifica lucrurile, se poate scrie condiia testului astfel
nct s fie valabil i n cazul unui test bilateral, i n cazul testelor
unilaterale, anume cu statistica testului n modul:

dac | | , se respinge i se accept cu o


probabilitate de 1 sau 100 1 %.

Reamintim c valoarea critic pentru un anumit prag de confiden


pentru un test unilateral este egal cu valoarea critic pentru un prag de
confiden 2 pentru un test bilateral (seciunea 5.1, fig. 5.2, 5.4).

Exemplul 6.1. ntr-un studiu s-a urmrit concentraia unui

U
biomarker al polurii apei n corpul unei specii de pete. O concentraie mai

C
mare de 100 uniti/g indic o poluare a apei n care triesc petii. Este
poluat apa din care s-a extras aleatoriu o prob format din 30 de peti?
ES
87 90 94 94 94 95 95 98 98 101
R

101 102 102 103 104 105 106 106 106 107
108 110 110 111 117 118 123 124 130 137
FI
M

Se parcurg etapele unei testri statistice (seciunea 5.5). Astfel, prima


etap const n clarificarea ntrebrii problemei. Din punct de vedere
ZA

statistic, ntrebarea este urmtoarea: Este media concentraiei biomarker-ului


n populaia din care s-a extras proba semnificativ mai mare dect media
populaiei de referin? sau mai concret Este media populaiei din care s-a

extras proba semnificativ mai mare dect 100?. Dac ntrebarea problemei
ar fi fost pus invers Provin petii din prob dintr-o ap nepoluat? ,
atunci ntrebarea din punct de vedere statistic ar fi fost Este media
populaiei din care s-a extras proba semnificativ mai mic dect 100?.

A doua etap const n identificarea tipului de variabil. Aa cum


reiese din textul problemei, variabila este concentraia biomarker-ului pe
gram. Concentraia este apreciat pe o scal de raport, deoarece valoarea
zero este absolut. Un alt aspect ce trebuie urmrit n aceast etap este
distribuia valorilor. Pentru a aprecia distribuia ne folosim de relaia dintre
msurile tendinei centrale ntr-o prob normal distribuit (seciunea 3.1).
Testarea unei ipoteze privind media unei singure populaii 83
Deci vom compara media cu mediana i, dac este posibil, i cu modul
probei:

3176/30 105,87
104,5
106 .

Putem concluziona c cei trei descriptori ai tendinei centrale au


valori apropiate i, ca urmare, distribuia valorilor n probe este aproximativ
normal.
n urma parcurgerii acestei etape se poate spune c se ndeplinesc
toate condiiile de aplicare ale testului pentru o prob.

U
Ipotezele testului vor corespunde unei variante unilaterale, aa cum
am stabilit n prima etap:

C
ES
: 100
: 100 .
R

Cu ajutorul mediei ( 105,87), valorii de referin ( 100) i


FI

erorii standard a mediei ( 2,142) se calculeaz statistica testului:


M

,
2,739 .
,
ZA

n continuare se verific condiia testului. Pentru aceasta trebuie


aflat valoarea critic a testului , din tabelul valorilor critice ale

distribuiei (Student) (anexa 2). n cazul nostru, numrul gradelor de


libertate este 1 30 1 29, iar nivelul de confiden 0,05. Avnd
n vedere c facem un test unilateral, , , va fi egal cu , , , care s-
ar folosi n cazul unui test unilateral, adic 1,699.

2,739 1,699 se respinge, se accept


0,95 sau 95%.

O alt modalitate de rezolvare a problemei const n calcularea


exact a probabilitii asociate valorii statisticii testului, adic s aflm
84 Elemente de statistic aplicate n ecologie
proporia din distribuia Student exclus de statistica testului (anexa 3).
Aceast proporie reprezint probabilitatea ( ) ca s fie adevrat, ceea
ce nseamn c probabilitatea ca s fie fals sau ca s fie adevrat va
fi 1 :

0,0052, adic statistica testului , , .

Deci probabilitatea exact ca media concentraiei biomarker-ului n


populaia de peti s fie mai mic sau egal ca 100 ( ) este de 0,0052
(0,52%), ceea ce nseamn c probabilitatea s fie mai mare ca 100 este
1 0,0052 0,9948 sau 99,48%.

U
Concluzia testului este cea surprins de : media concentraiei

C
biomarker-ului n populaia de peti din care a fost extras proba este
semnificativ mai mare dect valoarea de referin.
ES
Pentru a rspunde la ntrebarea problemei, putem spune c apa din
care a fost extras proba de 30 de peti este poluat.
R
FI
M
ZA

7. TESTAREA DIFERENEI DINTRE DOU PROBE

O astfel de inferen statistic se refer la compararea tendinelor


centrale a dou probe. Cele dou probe pot fi prelevate din dou populaii
diferite, caz n care se numesc probe independente. Denumirea este
argumentat de faptul c eantionarea valorilor primei probe nu influeneaz
probabilitatea de extragere a valorilor celei de a doua probe, deoarece
prelevarea se face din populaii distincte.
Uneori, testarea diferenei se poate face pornindu-se de la probe

U
neindependente. ntr-un astfel de caz, cele dou probe pot fi prelevate din

C
aceeai populaie sau se obin prin investigarea unitilor de prob de dou
ES
ori: nainte i dup aplicarea unui anumit tratament unitilor de prob.

7.1. COMPARAREA A DOU PROBE INDEPENDENTE


R

Cnd se face o astfel de comparaie, se vizeaz de fapt compararea


FI

mediilor populaiilor din care au fost extrase probele. Deci mediile probelor
M

reprezint estimatori ai mediilor populaiilor din care au fost prelevate.


Cele mai utilizate teste ce pot fi folosite pentru compararea a dou
ZA

probe sunt testul (Student) pentru probe independente i testul


(Mann-Whitney).

7.1.1. Testul (Student) pentru probe independente


Acesta este unul dintre cele mai utilizate teste parametrice ce se
folosesc frecvent pentru o astfel de comparaie n ecologie. Fiind un test
parametric, prezint o serie de condiii de aplicare:

1. cele dou probe trebuie s fie prelevate aleator din dou populaii
distincte;
2. variabila trebuie s fie apreciat pe o scal de interval sau de
raport;
3. valorile din cele dou probe trebuie s fie aproximativ normal
distribuite.
86 Elemente de statistic aplicate n ecologie
n funcie de tipul de comparaie, testul poate fi aplicat n variant
bilateral sau unilateral, n funcie de care se scriu ipotezele testului. Fie
populaia din care se extrage aleator proba i populaia din care se
preleveaz aleator proba . Atunci ipotezele testului pot fi:

Bilateral Unilateral
: : :
: : : .

Statistica testului este urmtoarea:

U
C
media valorilor din proba
ES
media valorilor din proba B
media populaiei media populaiei
variana probei variana probei
R

dimensiunea probei dimensiunea probei .


FI

Atenie, diferena dintre mediile probelor i este 0 conform


M

ipotezelor nule!
ZA

Valoarea critic cu care se compar statistica testului se afl (anexa


2) n funcie de i de numrul gradelor de libertate care se estimeaz
conform ecuaiei Welch-Satterthwaite:

Exist i o variant mai simpl de estimare a gradelor de libertate:

, 1.
Testarea diferenei dintre dou probe 87
Condiia testului este:

dac | | , se respinge, se accept, 1 .

Probabilitatea asociat lui sau se poate calcula exact (anexa 3),


iar probabilitatea se afl prin scderea acesteia din 1:

1 .

Exemplul 7.1. La o prob extras aleator dintr-o populaie de viper


de step (Vipera ursinii moldavica) s-a determinat numrul de perechi de
plci subcaudale. Este numrul de plci subcaudale semnificativ mai mare la

U
masculi dect la femele?

Femele (f): 31 32 29
C 29 29 25 29
ES
28 28 27 31 30 28
Masculi (m): 35 37 38 38 38 36 38
R

39 35 36 37 31 36 38
36 37 37 38 37 32
FI

Dac diferena dintre masculi i femele este semnificativ, nseamn


M

c este ca i cum ar proveni din dou populaii statistice diferite.


ZA

Datele ndeplinesc condiiile de aplicare ale testului : datele au fost


extrase aleator din populaie, variabila este exprimat pe o scal de raport,
datele sunt aproximativ normal distribuite ( 36,45, 37;

28,923, 29). Intervalul cuprinde aproximativ 62% din valorile


femelelor i 85% din valorile masculilor. Pentru ca datele s fie mai normal
distribuite, se realizeaz o normalizare a acestora prin logaritmare cu
ajutorul logaritmului natural ( ).

f: 3,4340 3,4657 3,3673 3,3673 3,3673 3,2189 3,3673 3,3322


3,3322 3,2958 3,4340 3,4012 3,3322
m: 3,5553 3,6109 3,6376 3,6376 3,6376 3,5835 3,6376 3,6636
3,5553 3,5835 3,6109 3,4340 3,5835 3,6376 3,5835 3,6109
3,6109 3,6376 3,6109 3,4657
88 Elemente de statistic aplicate n ecologie
Dup transformare, intervalul cuprinde aproximativ 85% din
valorile femelelor i 90% din valorile masculilor
n continuare trebuie emise ipotezele testului. Cum ntrebarea la care
trebuie s rspund testul este dac numrul subcaudalelor la masculi este
mai mare dect cel de la femele, atunci ipoteza alternativ va exprima
aceast inegalitate.

:
:

Se calculeaz statistica testului:

U
, ,
10,482 .

C
, , ES
Numrul gradelor de libertate se poate afla n dou moduri:
R

, ,

23,6 23
FI

, ,

13,20 1 13 1 12 .
M
ZA

Valoarea critic pentru un test unilateral, pentru 0,05 nivel de


ncredere i grade de libertate, se poate cuta n tabel (anexa 2) sau
calcula (anexa 3):

, , 1,714 , , 1,782 .

Valoarea absolut a statisticii testului | 10,482| este mai mare dect


ambele valori critice, deci se respinge i se accept , adic media
numrului de subcaudale de la masculi este semnificativ mai mare dect cel
de la femele, cu o probabilitate de 0,95 sau n 95% din cazuri.
Probabilitatea ca s fie adevrat (anexa 3) este de 1,6 10
pentru 23 grade de libertate i 1,1 10 pentru 12 grade de libertate. n
ambele situaii, probabilitatea este foarte mic i se poate accepta ipoteza
nul a crei probabilitate este de 1 , adic foarte mare.
Testarea diferenei dintre dou probe 89

7.1.2. Testul (Mann-Whitney)


Acest test se utilizeaz ca alternativ neparametric a testului
(Student) pentru probe independente. Unicele condiii ale testului (Mann-
Whitney) sunt:

1. probele trebuie s fie prelevate aleator din dou populaii distincte;


2. variabila trebuie s fie apreciat pe o scal ordinal, de interval
sau de raport.

Ipotezele testului sunt n esen similare cu cele ale testului pentru


probe independente:

U
Bilateral Unilateral

C
: : :
ES
: : : .

Aplicarea testului presupune ca valorile celor dou probe s


R

primeasc ranguri mpreun. Pentru aceasta, valorile din ambele probe se


FI

ordoneaz cresctor ntr-o singur serie. Valoarea cea mai mic va primi
rangul 1, urmtoarea rangul 2 i aa mai departe. Valorile egale vor primi
M

media rangurilor pe care le-ar fi primit dac ar fi fost diferite (seciunea 2.1,
tab. 2.3).
ZA

Ulterior se nsumeaz rangurile corespunztoare valorilor fiecrei


probe, obinndu-se suma rangurilor corespunztoare valorilor din
proba i, respectiv, suma rangurilor corespunztoare valorilor din

proba . Cu valorile celor dou sume i dimensiunile probelor ( i ) se


calculeaz statisticile testului i :

Suma celor dou statistici ale testului trebuie s fie egal cu suma
tuturor rangurilor, adic . De unde rezult c, pentru
simplificare, putem scrie una dintre statistici, s zicem , n funcie de
cealalt:
90 Elemente de statistic aplicate n ecologie

Decizia privind respingerea sau acceptarea poate fi luat n dou


moduri, n funcie de dimensiunile celor dou probe ( i ).

1. Dac 20 i 20, atunci condiia testului este:


Dac valoarea mai mic dintre statisticile testului este mai mic
dect valoarea critic tabelat (anexa 2), atunci se respinge i se
accept .

Dac , , , se respinge, se accept

U
pentru 1 .

C
Valoarea critic trebuie aleas n funcie de varianta bilateral sau
ES
unilateral n care se aplic testul.
R

2. Dac 20 i 20, atunci distribuia probabilistic a lui


este aproximativ normal i se poate face conversia la distribuia
FI

normal standard:
Pentru aceasta este nevoie s se calculeze media ( ) i deviaia
M

standard ( ) ale lui , dac este adevrat:


ZA

Cu acestea se calculeaz valoarea z corespunztoare 0,1 , unde


este una dintre cele dou statistici ale testului ( sau ):

Dac | | , 1,96 se respinge i se accept


pentru p=0,95.
Testarea diferenei dintre dou probe 91
Exemplul 7.2. S se rspund la ntrebarea de la exemplul 7.1,
considerndu-se c una dintre sau ambele condiii 2 i 3 ale testului Student
pentru probe independente nu sunt ndeplinite.

n acest caz se utilizeaz alternativa neparametric a testului Student,


adic testul Mann-Whitney. Pentru a realiza acest test se dau ranguri
valorilor din cele dou probe mpreun, dup metoda prezentat n seciunea
2.1.

Sex f f f F f f f f f f f f f m m m m

x 25 27 28 28 28 29 29 29 29 30 31 31 32 31 32 35 35

Ri 1 2 3 4 5 6 7 8 9 10 11 12 14 13 15 16 17

U
Rx 1 2 4 4 4 7,5 7,5 7,5 7,5 10 12 12 14,5 12 14,5 16,5 16,5

C
continuare
ES
m m m M m m m m m m m m m m m m

36 36 36 36 37 37 37 37 37 38 38 38 38 38 38 39
R

18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
FI

19,5 19,5 19,5 19,5 24 24 24 24 24 29,5 29,5 29,5 29,5 29,5 29,5 33
M

Ipotezele testului sunt similare cu cele de la exemplul 7.1:


ZA

:
: .

Se calculeaz suma rangurilor valorilor de la femele:

1 2 4 14,5 93,5 .

Statisticile testului vor fi:

13 20 93,5 257,5
13 20 257,5 2,5 .
92 Elemente de statistic aplicate n ecologie
Deoarece dimensiunea probelor este mai mic sau egal cu 20,
trebuie aflat valoarea critic (anexa 2). Cum testul se aplic n variant
unilateral, atunci valoarea critic din tabelul cu valorile critice , ,
din anexa 2 va fi considerat pentru un nivel de confiden de 0,025:

, , , 76 .

De fapt, pentru testul Mann-Whitney exist un interval de acceptare


a . Suma limitelor acestui interval este egal cu produsul dintre
dimensiunile probelor, n cazul exemplului fiind egal cu 13 20 260.
Cum una dintre limite este valoarea critic egal cu 76, nseamn c cealalt
este egal cu 260 76 184. Deci intervalul de acceptare a are limita

U
inferioar 76 i limita superioar 184. Cele dou statistici calculate sunt n

C
afara acestui interval, deci ipoteza nul se respinge i se accept n
consecin ipoteza alternativ.
ES
R

2,5 76 184 257,5


FI
M

Concluzia este c numrul de subcaudale la masculi este


semnificativ mai mare dect la femele, cu o probabilitate de 0,975 sau n
ZA

97,25% din cazuri.


7.2. COMPARAREA A DOU PROBE NEINDEPENDENTE

Aceste comparaii au drept scop evidenierea efectului unui anumit


tratament asupra valorilor variabilei investigate. Tratamentul poate fi
aciunea unei substane, a unui factor de mediu etc. ce ar putea modifica
valorile individuale ale unei variabile.
n cazul unor astfel de comparaii, probele trebuie s fie
neindependente, deoarece se presupune c astfel s-ar elimina posibilitatea
apariiei unor diferene semnificative datorate deosebirilor dintre populaii.
Astfel, diferenele, dac apar, vor reprezenta efectul tratamentului asupra
unitilor de prob.
Testarea diferenei dintre dou probe 93
Atunci cnd este posibil, este bine ca cele dou probe s rezulte n
urma a dou investigaii repetate asupra unitilor de prob: prima, nainte
de aplicarea tratamentului, i a doua, dup aplicarea acestuia. Astfel, rezult
cte o pereche de valori pentru fiecare unitate de prob.
Existena perechilor de valori este absolut necesar n cazul testelor
ce compar probe neindependente, motiv pentru care acestea se mai numesc
i teste pentru perechi de valori sau pentru observaii perechi.
Testele cele mai uzuale care se folosesc pentru astfel de observaii
sunt testul (Student) pentru perechi de observaii i testul
(Wilcoxon).

7.2.1. Testul (Student) pentru perechi de observaii

U
Ca i testul pentru probe independente, i acesta este un test
parametric care necesit ca datele s ndeplineasc o serie de condiii de

C
aplicare:
ES
1. probele trebuie s fie extrase aleator din aceeai populaie sau s
provin n urma unor investigaii repetate asupra acelorai uniti
R

de prob, iar dimensiunea probelor trebuie s fie aceeai astfel


FI

nct s existe perechi de observaii;


2. variabila trebuie s fie apreciat pe o scal de interval sau de raport;
M

3. distribuia valorilor n probe trebuie s fie aproximativ normal.


ZA

n funcie de ntrebarea la care testul trebuie s rspund, se scriu


ipotezele n variant bilateral sau unilateral. n esen, ipotezele se
refer la media diferenelor ( ) dintre perechile de valori n

populaie:

Bilateral Unilateral
: 0 : 0 : 0
: 0 : 0 : 0.

Dac se noteaz diferena dintre valorile unei perechi, iar fiecare


dintre valorile perechii aparin probei i, respectiv, probei , atunci:

.
94 Elemente de statistic aplicate n ecologie

Dac media acestor diferene n populaie este zero, atunci nseamn


c tratamentul aplicat nu a modificat semnificativ valorile variabilei. O
medie a diferenelor mai mare ca zero arat c tratamentul a dus la creterea
semnificativ a valorilor, n timp ce una mai mic dect zero arat c
tratamentul a sczut semnificativ valorile.
Principalul estimator al mediei populaionale a diferenelor este
media diferenelor dintre perechile de valori din probe ( ). Deci se
calculeaz diferenele corespunztoare fiecrei perechi de valori, iar suma
diferenelor se mparte la numrul perechilor de valori ( ) sau la numrul
valorilor dintr-o prob.

C
ES
O alt valoare necesar pentru aflarea statisticii testului este eroarea
standard a mediei diferenelor ( ), care se calculeaz mprind deviaia
standard a mediei diferenelor ( ) la radical din numrul perechilor de
R

observaii ( ):
FI


.

ZA

Statistica testului ( ) va fi egal cu raportul dintre media diferenelor


( ) i eroarea standard a mediei diferenelor ( ):

Condiia testului, att pentru varianta bilateral, ct i pentru


variantele unilaterale, este:

dac | | , se respinge, se accept, pentru p=1.

Valoarea critic se poate afla din tabele (anexa 2) sau se poate


calcula (anexa 3).
Testarea diferenei dintre dou probe 95
Cnd se calculeaz probabilitatea asociat valorii (anexa 3) (adic
probabilitatea ca ipoteza nul s fie adevrat), atunci ipoteza nul se
respinge dac este mai mic de nivelul i se va accepta ipoteza
alternativ pentru o probabilitate de 1 .

Exemplul 7.3. ntr-un experiment s-a urmrit reacia gndacilor de


buctrie la lumin. Pentru aceasta s-au pus 12 indivizi selectai aleatoriu n
12 incinte cu perei transpareni i la aprinderea luminii s-a urmrit cte
secunde dintr-un minut a petrecut fiecare gndac n mijlocul incintei i lng
pereii incintei. Au gndacii o tendin semnificativ de a se ascunde n
condiii de lumin?

U
scunde n mijloc ( ) 28 17 33 24 15 23 21 21 21 32 27 34
secunde lng perete ( ) 32 43 27 36 45 37 39 39 39 28 33 26

C
ES
n acest exemplu, sunt prezentate dou probe rezultate prin
investigarea acelorai uniti de prob (cei 12 gndaci) de dou ori: pentru
fiecare gndac exist timpul petrecut n mijlocul incintei i timpul petrecut
R

lng perei. Deci probele nu sunt independente i pentru fiecare unitate de


FI

prob (gndac) exist o pereche de valori (timpul petrecut n mijlocul


incintei i timpul petrecut lng pereii acesteia).
M

n continuare trebuie verificate condiiile de aplicare ale testului


Student pentru perechi de valori: probele sunt aleatoare i exist observaii
ZA

perechi, variabila este exprimat pe o scal de raport, probele au o distribuie


aproximativ normal ( 24,67, 23,5; 35,33, 36,5).
Condiiile sunt ndeplinite.

Pentru a emite ipotezele testului, trebuie analizat ntrebarea


problemei: dac gndacii ar avea o tendin semnificativ s se ascund,
atunci ar trebui ca timpii petrecui lng perei s fie semnificativ mai mari
dect cei petrecui n centru. Dac se calculeaz diferena ,
atunci diferenele pozitive trebuie s fie dominante, fapt ce trebuie surprins
de ipoteza alternativ.

: 0
: 0
96 Elemente de statistic aplicate n ecologie
Se calculeaz diferenele dintre valorile fiecrei perechi:

28 17 33 24 15 23 21 21 21 32 27 34
32 43 27 36 45 37 39 39 39 28 33 26
4 26 6 12 30 14 18 18 18 4 6 8

Se calculeaz media diferenelor i eroarea standard a mediei


diferenelor care sunt necesare pentru aflarea statisticii testului:

10,67

12,397

U
,
3,579

C

,
2,98 .
ES
,

Se afl valoarea critic pentru testul unilateral, pentru un nivel de


R

confiden de 0,05 i 12 1 grade de libertate (anexa 2 sau anexa 3):


FI

, , 1,796 .
M

Valoarea statisticii testului este mai mare dect valoarea critic, deci
ZA

se respinge ipoteza nul i se accept ipoteza alternativ, adic numrul de


secunde petrecut lng pereii incintei este semnificativ mai mare dect
numrul de secunde petrecute n centrul incintei, cu o probabilitate de 0,95

sau n 95% din cazuri.


Probabilitatea ca ipoteza nul s fie adevrat (anexa 3) este de
0,0063, deci probabilitatea ca ipoteza nul s nu fie adevrat i s fie
adevrat ipoteza alternativ este de 1 0,0063 0,9937.

7.2.2. Testul (Wilcoxon)


Acest test reprezint alternativa neparametric a testului t pentru
observaii perechi, deci se utilizeaz pentru dou probe neindependente sau
pentru observaii perechi realizate asupra unitilor de prob, nainte sau
dup aplicarea unui tratament. Se folosete atunci cnd nu se respect
Testarea diferenei dintre dou probe 97
condiia 2 sau 3 a testului Student pentru perechi de observaii. Condiiile de
aplicare a testului Wilcoxon sunt:

1. probele trebuie s fie extrase aleator din aceeai populaie sau s


provin n urma unor investigaii repetate asupra acelorai uniti
de prob, iar dimensiunea probelor trebuie s fie aceeai astfel
nct s existe perechi de observaii;
2. variabila trebuie s fie apreciat pe o scal ordinal, de interval
sau de raport.

n cazul acestui test, se calculeaz diferena ( ) dintre observaiile


fiecrei perechi de valori din cele dou probe.

U
C
ES
Diferenele n modul primesc apoi ranguri (| | ) la fel ca n
cazul testului Mann-Whitney. n dreptul fiecrui rang se specific ntre
paranteze semnul diferenei corespunztoare.
R

Valorile ale cror diferene sunt nule se elimin din analiz, ceea ce
FI

atrage dup sine reducerea corespunztoare a gradelor de libertate.


Ulterior se calculeaz suma rangurilor diferenelor pozitive ( )
M

i suma rangurilor diferenelor negative ( ).


ZA

Ipotezele care se scriu n acest test sunt n esen similare cu cele ale
testului t pentru probe neindependente, cu excepia faptului c se refer la
sumele rangurilor diferenelor:

Bilateral Unilateral
: : :
: : : .

Ce reprezint aceste diferene? Dac suma rangurilor diferenelor


pozitive este mai mare dect cea a rangurilor diferenelor negative,
nseamn c exist mai multe diferene pozitive, deci valorile din proba B,
influenate de tratament, sunt n general mai mari dect cele din proba A.
Aceasta nseamn c tratamentul aplicat a dus la creterea valorilor. Dac
suma rangurilor diferenelor pozitive este mai mic dect cea a rangurilor
98 Elemente de statistic aplicate n ecologie
diferenelor negative, nseamn c sunt mai multe diferene negative i
valorile din proba A sunt n general mai mari dect cele din B. Deci
tratamentul aplicat a determinat scderea valorilor probei B. Dac cele dou
sume sunt egale, nseamn c exist diferene negative i pozitive n egal
msur i tratamentul nu a modificat semnificativ valorile din proba B.
Statisticile testului (T i T) sunt reprezentate de suma rangurilor
diferenelor pozitive i suma rangurilor diferenelor negative:

,
sau = , .

Inspectarea formulelor de mai sus arat c suma celor dou statistici

U
este egal cu suma rangurilor tuturor diferenelor (diferite de 0) att

C
pozitive, ct i negative:
ES
.
R

Decizia de acceptare sau de respingere a se ia n funcie de


FI

numrul gradelor de libertate ( ).


M

1. Dac 33 (sau dect 25), condiia testului const n


ZA

compararea statisticilor cu valoarea critic , care se gsete n


tabele (anexa 2) i se alege n funcie de varianta n care se aplic
testul i numrul gradelor de libertate egal cu numrul diferenelor
nenule.

Dac sau , se respinge, se accept, pentru


1 .

Dac se accept n cazul unei variante bilaterale, concluzia este


c tratamentul a modificat semnificativ variabila. n cazul variantei
unilaterale dreapta ( : ), concluzia va fi c
tratamentul a determinat o cretere a valorilor variabilei, iar n cazul
variantei unilaterale stnga ( : ), c acesta le-a
sczut.
Testarea diferenei dintre dou probe 99
2. Dac 33, atunci distribuia poate fi aproximat prin cea
normal standard. Pentru a putea calcula valoarea trebuie mai
nti calculate media i deviaia standard .

Condiia testului este:

U
dac | | , 1,96 se respinge, se accept,

C
pentru 0,95
ES
Exemplul 7.4. S se rezolve problema din exemplul 7.4,
R

considerndu-se c una dintre ultimele dou condiii ale testului Student


pentru perechi de observaii nu este ndeplinit.
FI

n acest caz se aplic alternativa neparametric a testului Student


M

pentru perechi de observaii, adic testul Wilcoxon. Pentru efectuarea


ZA

acestui test se calculeaz diferenele dintre valorile fiecrei perechi.


Modulelor diferenelor li se dau ranguri, iar n dreptul fiecrui rang se
specific semnul diferenei corespunztoare.

Ipotezele testului sunt asemntoare cu cele de la exemplul 7.3. Dac


diferenele dintre valorile fiecrei perechi se calculeaz scznd din timpul
petrecut lng perete pe cel petrecut n mijlocul incintei, atunci, dac exist
o tendin semnificativ de ascundere la gndacii de buctrie, ar trebui s
se obin mai multe diferene pozitive i suma rangurilor diferenelor
pozitive ar trebui s fie mai mare dect cea a diferenelor negative. Acest
aspect trebuie surprins n ipoteza alternativ.

:
:
100 Elemente de statistic aplicate n ecologie

Secunde n Secunde lng semnul


| |
centru ( ) perete ( ) diferenei
28 32 4 4 1 1,5 +
32 28 4 4 2 1,5
33 27 6 6 3 3,5
27 33 6 6 4 3,5 +
34 26 8 8 5 5
24 36 12 12 6 6 +
23 37 14 14 7 7 +
21 39 18 18 8 9 +
21 39 18 18 9 9 +
21 39 18 18 10 9 +

U
17 43 26 26 11 11 +

C
15 45 30 30 12 12 +
ES
Se calculeaz statisticile testului:
R

1,5 3,5 5 10
10 68 .
FI
M

Deoarece numrul perechilor de observaii este mai mic de 33, se


afl valoarea critic pentru varianta bilateral n funcie de nivelul de
ZA

confiden i de numrul gradelor de libertate:

, , 17 .

i pentru testul Wilcoxon exist un interval de acceptare a . Suma


limitelor acestui interval este egal cu suma tuturor rangurilor:

78 .

Cum una dintre limite este reprezentat de valoarea critic egal cu


17, nseamn c cealalt este egal cu 78 17 61. Deci intervalul de
acceptare a are limita inferioar 17 i limita superioar 61. Cele dou
statistici calculate sunt n afara acestui interval, deci ipoteza nul se respinge
Testarea diferenei dintre dou probe 101
i se accept n consecin ipoteza alternativ.

10 17 61 68

Concluzia este c timpul petrecut lng perete este semnificativ mai


mare dect cel petrecut n centrul incintei, cu o probabilitate de 0,95 sau n
95% din cazuri.

U
C
ES
R
FI
M
ZA

8. TESTAREA DIFERENELOR DINTRE TREI SAU MAI
MULTE PROBE

Exist situaii n care, n cadrul unor investigaii ecologice, este


necesar testarea semnificaiei diferenelor dintre trei sau mai multe probe
din punctul de vedere al unei variabile. Dac datele ndeplinesc condiiile de
aplicare ale unor teste parametrice, atunci o astfel de situaie s-ar putea
rezolva printr-o serie de teste care s verifice semnificaia diferenei pentru

U
fiecare pereche de probe pn la epuizarea tuturor combinaiilor unice

C
posibile. De exemplu, dac exist trei probe A, B i C, atunci se face cte un
test Student pentru verificarea semnificaiei diferenei dintre A i B, dintre A
ES
i C i dintre B i C. Dac ns se compar 10 probe n loc de 3, atunci
analiza devine ceva mai dificil, pentru c trebuie efectuate 45 de teste
R

Student. Pe lng aceasta, ntr-o astfel de situaie mai apare si un aspect


statistic n defavoarea unei asemenea abordri.
FI

Aa cum s-a artat n seciunea 5.5, orice test presupune un risc de


a efectua o eroare de genul I, ce const n respingerea unei ipoteze nule care
M

n realitate este adevrat. Cum valoarea cea mai uzual a lui este 0,05,
ZA

nseamn c pentru cele 45 de teste Student riscul apariiei unei astfel de


erori crete la 45 0,05 2,25. Conform acestei valori, nseamn c exist
anse mari de a ajunge la cel puin dou concluzii greite cu privire la

diferenele dintre cele zece probe. O posibil rezolvare ar consta n scderea


valorii de la 0,05 la 0,01, ceea ce ar micora riscul n cazul exemplului la
45 0,01 0,45. ns scznd valoarea nivelului de semnificaie, crete
riscul de a comite o eroare de genul II, adic de a accepta o ipotez nul
care n realitate s fie fals.
Aceste neajunsuri care pot s apar cnd se compar trei sau mai
multe probe pot fi depite cu ajutorul analizei varianei. Aceast tehnic
de analiz statistic este simbolizat prin acronimul ANOVA provenit de la
denumirea sa n limba englez (ANalysis Of VAriance), acronim pe care l
vom folosi n continuare pentru a ne referi la aceast tehnic.
ANOVA este o tehnic versatil ce poate fi utilizat pentru
Testarea diferenelor dintre trei sau mai multe probe 103
compararea a trei sau mai multor probe, grupate dup unul sau mai muli
factori, n cadrul unui singur test.

8.1. PRINCIPIUL ANOVA

n esen, ANOVA este o tehnic ce permite descompunerea


variabilitii unui set de probe n componentele sale. Dac ne imaginm c
avem de comparat trei probe, atunci variabilitatea total a acestora va fi
dat de variabilitatea valorilor individuale fa de media fiecrei probe,
adic variabilitatea intern a probelor, i de variabilitatea dintre probe
datorat diferenelor dintre mediile populaiilor din care au fost extrase
probele, adic variabilitatea extern. Dac descriptorul folosit al

U
variabilitii este variana ( ), atunci descompunerea variabilitii poate fi
rezumat prin relaia:

C
ES
variana total;
variana extern sau dintre probe;
R

variana intern sau din probe.


FI

n ANOVA varianele nu se folosesc ca atare, ci se consider ca


M

fiind sume de ptrate medii ( ) obinute prin mprirea sumelor de ptrate


ZA

( ) la numrul gradelor de libertate ( ).


Astfel vom vorbi de sume de ptrate medii, sume de ptrate i grade


de libertate, totale, externe i interne.
Dac probele au fost extrase aleatoriu din populaii normal
distribuite cu medii i variane egale, atunci variana intern va fi aceeai cu
cea extern. n cazul n care probele provin din populaii cu medii i variane
diferite, atunci diferenele dintre probe vor avea drept cauz principal
variabilitatea sau variana extern. Statistica ANOVA, notat cu ,
reprezint tocmai raportul dintre variana extern i cea intern i are o
distribuie particular Snedecor-Fisher n funcie de nivelul de semnificaie
( ), de gradele de libertate externe ( ) i de gradele de libertate interne
104 Elemente de statistic aplicate n ecologie
( ). Cu ct valoarea lui va fi mai mare, cu att variabilitatea total va
rezulta mai mult din variabilitatea extern i mai puin din cea intern, i
invers.

ANOVA este o tehnic statistic parametric, deci presupune ca


datele analizate s ndeplineasc urmtoarele condiii:

1. probele trebuie s fie prelevate aleator;


2. variabila trebuie s fie apreciat pe o scal de interval sau de raport;
3. datele din probe trebuie s fie aproximativ normal distribuite;
4. varianele interne trebuie s nu difere semnificativ.

U
Ipotezele generale care se pot scrie n ANOVA sunt:

C
: probele au fost prelevate din populaii normal distribuite cu
ES
variane i medii egale.
: deoarece se presupune c varianele populaiilor sunt egale,
probele au fost prelevate din populaii cu medii diferite.
R
FI

Dac datele nu respect condiiile enumerate mai sus, se poate apela


la transformri ale valorilor variabilelor sau la alternative neparametrice ale
M

ANOVA.
Se observ c se face referire la egalitatea varianelor interne ale
ZA

probelor att la nivelul condiiilor de aplicare ale ANOVA, ct i la nivelul


ipotezelor generale. Deci, dup verificarea ndeplinirii condiiilor comune
testelor parametrice, trebuie testat dac varianele interne ale probelor difer

semnificativ.

8.1.1. Testarea omogenitii varianei interne


n acest sens se pot utiliza dou teste diferite. Cel mai rapid i mai
simplu este testul sau Hartley. Acesta const n calcularea raportului
ntre variana cea mai mare ( ) i cea mai mic ( ) dintre varianele
probelor analizate.
Testarea diferenelor dintre trei sau mai multe probe 105
Valoarea se compar cu o valoare critic pentru un anumit ,
pentru un anumit numr de probe ( ) i grade de libertate ( 1) (anexa 2).

Dac , ,
nu exist diferene semnificative ntre
varianele interne ale probelor pentru 1 .

Acest test se poate folosi doar dac toate probele conin acelai
numr de valori ( ).
Dac probele au dimensiuni diferite, atunci se recomand aplicarea
testului Bartlett. Statistica testului Bartlett este una de tip i se
calculeaz pornind de la gradele de libertate ale fiecrei probe ( 1, unde
ia valori de la 1 la numrul de probe ), de la variana fiecrei probe ( )

U
i de la variana medie balansat ( ).


C
ES

1 1
R

Statistica testului se compar cu o valoare critic n funcie de un


FI

anumit nivel de confiden i numrul de probe minus unu ( 1) grade


de libertate (anexele 2 i 3).
M
ZA

Dac , nu exist diferene semnificative ntre


varianele interne ale probelor pentru 1 .

Probabilitatea asociat valorii statisticii testului poate fi calculat i


exact (anexa 3). Cnd se calculeaz probabilitatea asociat valorii se
accept c nu exist diferene semnificative ntre varianele probelor dac
este mai mare de nivelul .

Exemplul 8.1. S-a urmrit numrul de exemplare ale unei plante n


cte 12 suprafee de prob din 4 zone diferite (notate de la la ). Urmeaz
s se realizeze o analiz a varianei i este nevoie s se testeze dac
varianele probelor difer semnificativ. Datele sunt urmtoarele:
106 Elemente de statistic aplicate n ecologie
Se examineaz normalitatea distribuiei datelor
28 32 54 59 n probe.
41 10 46 63
25 12 39 71 24,33 25
13 25 21 53 25,66 26,5
25 38 41 66 38,66 40
33 14 25 74 55,58 56
13 37 23 35
30 43 46 62 Se poate considera c probele au o distribuie
21 16 29 53 aproximativ normal.
22 20 52 49 n continuare se verific omogenitatea
12 28 31 53 varianei cu ajutorul testului , pentru efectuarea

U
29 33 57 29 cruia este necesar calcularea varianelor probelor:

C
ES
76,97 124,97

159,88 180,63 .
R
FI

Se calculeaz statistica testului:


M

,
2,347 .
,
ZA

Valoarea critic a testului se afl n funcie de nivelul de confiden,


numrul probelor i numrul de valori per prob minus unu (anexa 2).

Pentru c valoarea pentru 4 i 11 grade de libertate lipsete din tabel, vom


considera valoarea pentru 4 i 10:

, , ,
5,67 .

Valoarea calculat este mai mic dect valoarea critic, deci se poate
considera c varianele probelor nu difer semnificativ sau variana intern
este omogen.
Dac se folosete testul Bartlett pentru aceleai date, trebuie
calculat media balansat a varianei:
Testarea diferenelor dintre trei sau mai multe probe 107

, , , ,
135,612 .

Se calculeaz suma produselor dintre variana logaritmat a probei i


numrul gradelor de libertate:

1 76,97 12 1 124,97 12 1
159,88 12 1 180,63 12 1 213,866 .

Se calculeaz statistica testului:

U
135,612 44 213,866 2,165 .

C
Se afl valoarea critic (anexa 2 sau anexa 3):
ES
, , 7,815 .
R

Statistica testului este mai mic dect valoarea critic, deci variana
FI

intern poate fi considerat omogen. Probabilitatea ca s nu existe diferene


semnificative ntre varianele probelor este de 0,54, adic mai mare de 0,05.
M
ZA

8.2. TIPURI DE ANOVA

ANOVA este una dintre cele mai versatile tehnici de statistic


inferenial, putnd fi aplicat n numeroase variante n funcie de


planificarea investigaiilor, att n teren, ct i n laborator.
n cadrul ANOVA, gruparea valorilor variabilei investigate se poate
face dup unul sau mai muli factori. Un factor reprezint un grup de
tratamente similare, care la rndul lor reprezint niveluri ale factorului
respectiv. Aceast terminologie i are originea n experimentele din
agricultur, ns n prezent a cptat o extindere mult mai mare, depind
semnificaia iniial. Astfel, ntr-un experiment, nivelurile unui factor sau
tratamentele pot fi obinute n urma unor manipulri. De exemplu, trei loturi
de animale primesc fiecare un anumit tip de hran i se urmrete efectul
108 Elemente de statistic aplicate n ecologie
acestuia asupra greutii corporale. n acest exemplu, factorul este
reprezentat de hran, iar tratamentele sau nivelurile factorului sunt tipurile
de hran. Datele vor fi reprezentate de greutile animalelor i vor fi grupate
n probe, n funcie de tipul de hran. Dac ns se urmrete o anumit
variabil n trei populaii conspecifice din trei locaii diferite, atunci factorul
va fi locaia n general, iar nivelurile acestuia vor fi reprezentate de locaiile
fiecrei populaii n parte. Valorile variabilei urmrite vor fi grupate n trei
probe, n funcie de locaia fiecrei populaii. n concluzie, factorul poate fi
orice factor ecologic ale crui niveluri (tratamente) difer de la o
populaie la alta.
n funcie de numrul factorilor dup care se grupeaz datele,
ANOVA poate fi unifactorial dac ia n consideraie un singur factor, sau

U
multifactorial, dac se iau n calcul mai muli factori. Modelele cele mai
frecvent utilizate n cercetrile ecologice sunt modelul unifactorial i cel

C
bifactorial.
ES
Un alt aspect caracteristic pentru ANOVA bifactorial este
interaciunea factorilor. Dac exist interaciune ntre factori, atunci se
utilizeaz modelul bifactorial cu replicare (cu numr egal de observaii n
R

celul), iar dac nu exist interaciune ntre factori atunci se folosete


FI

modelul bifactorial fr replicare (cu o singur observaie n celul sau cu


observaii repetate). Din perspectiva ANOVA, interaciunea reprezint o
M

parte a variabilitii totale, datorat modificrilor unui factor, i este legat


de variabilitatea unui alt factor sau a unei combinaii de ali factori.
ZA

8.2.1. ANOVA unifactorial


n cazul acestui model datele sunt grupate n probe n funcie de un

singur factor ( ). Astfel, probele coincid nivelurilor factorului sau


tratamentelor ( ) (tab. 8.1).
Conform acestui model orice observaie poate fi definit ca:

Media Eroarea
Obs. = + Efectul +
general ntmpltoare.

Efectul nivelurilor factorului d variabilitatea extern (dintre probe),


iar eroarea ntmpltoare este rezultatul variabilitii interne (din cadrul
probelor).
Testarea diferenelor dintre trei sau mai multe probe 109

Din aceste dou relaii rezult:

Tabelul 8.1. Distribuia valorilor n probe n ANOVA unifactorial

U

C
ES
R

Ipotezele care se testeaz prin intermediul acestui model pot fi


FI

formulate diferit, n funcie de sensul care se atribuie noiunii de tratament.


n cazul unor date obinute n urma unui experiment, ipotezele sunt de
M

forma:
ZA

: nu exist diferene semnificative ntre efectele tratamentelor


asupra variabilei;

: diferenele dintre efectele tratamentelor asupra variabilei sunt


semnificative.

n cazul unor date obinute n urma realizrii unor observaii


efectuate asupra unei variabile n populaii diferite, ipotezele pot fi
formulate astfel:

: mediile populaiilor din care s-au extras probele nu difer


semnificativ;
: mediile populaiilor din care s-au extras probele difer
semnificativ.
110 Elemente de statistic aplicate n ecologie
Dac se aplic ANOVA unifactorial pentru probe, trebuie
parcurse urmtoarele etape:
1. Se calculeaz suma de ptrate a tuturor valorilor ( ) prin
adunarea sumelor de ptrate a valorilor pentru fiecare prob
( ):

2. Se calculeaz ptratul sumei totale ( prin adunarea


sumelor valorilor din fiecare prob ( ), urmat de ridicarea la
ptrat:

U
.

C
3. Se calculeaz numrul total de valori din toate probele ( ) prin
ES
nsumarea dimensiunilor tuturor probelor ( ):
R

.
FI

4. Se calculeaz suma rapoartelor dintre ptratul sumei i


dimensiunea fiecrei probe:
M
ZA

5. Se calculeaz sumele de ptrate total ( ), extern ( ) i


intern ( ):

6. Se calculeaz numrul gradelor de libertate totale ( ), externe


( ) i interne ( ):

1 1
.
Testarea diferenelor dintre trei sau mai multe probe 111

7. Sumele de ptrate medii ( ) se calculeaz mprind sumele de


ptrate ( ) la gradele de libertate corespunztoare ( ):

8. Cu rezultatele obinute se completeaz aa-numitul tabel ANOVA


n care se va gsi i statistica testului ( ):

Sursa de variaie
Extern (ntre probe) /

U
Intern (n probe)
Total

C
ES
Condiia testului const n compararea statisticii cu o valoare
critic a distribuiei Snedecor-Fisher tabelat n funcie de , gradele de
libertate externe ( ) i gradele de libertate interne ( ) (anexa 2).
R
FI

Dac , , se respinge i se accept pentru o


probabilitate 1 .
M
ZA

Valoarea critic, precum i probabilitatea statisticii testului (adic


probabilitatea ca ipoteza nul s fie adevrat) se pot calcula (anexa 3).
Cnd se calculeaz probabilitatea asociat valorii , atunci ipoteza nul se
respinge dac este mai mic de nivelul i se va accepta ipoteza

alternativ pentru o probabilitate de 1 .


n cazul n care la sfritul testului se respinge ipoteza nul i se
accept n consecin c exist o diferen semnificativ, atunci analiza
poate continua n sensul detectrii diferenelor semnificative dintre mediile
tuturor combinaiilor de probe. O evaluare rapid a diferenelor dintre
mediile perechilor de probe const n inspectarea sau compararea grafic a
intervalelor de confiden a mediilor populaiilor (seciunea 5.1, fig. 5.5) din
care au fost extrase probele. n general, exist anse mari ca diferena dintre
dou probe s fie semnificativ, dac intervalele de confiden
corespunztoare nu se suprapun.
112 Elemente de statistic aplicate n ecologie
O modalitate mai sensibil de detectare a diferenelor semnificative
dintre medii este reprezentat de testul Tukey.
n cadrul acestui test se calculeaz diferenele n modul dintre
mediile tuturor perechilor unice de probe:

Media

Probei
| | | | | |
| | | |

| |

U
Se calculeaz apoi pentru fiecare pereche de probe cte o statistic

C
a testului, pornind de la o valoare critic Tukey ( , , , anexa 2), suma
de ptrate medie intern ( ) i o medie armonic dintre dimensiunile
ES
probelor din fiecare pereche ( ). Dac probele au aceeai dimensiune, n
loc de se ia .
R
FI
M

, , ,
ZA

Dac | | , diferena dintre mediile populaiilor din


care au fost extrase probele 1 i 2 este semnificativ pentru 1 .

Dac probele au aceeai dimensiune ( ), atunci


diferenierea probelor se poate face prin investigarea sau compararea grafic
a suprapunerii intervalelor de confiden a mediilor fiecrei probe. Limitele
intervalului de confiden a unei medii rezult din adunarea i scderea la
aceasta a statisticii Tukey mprit la doi:

Exemplul 8.2. Pe baza datelor din exemplul 8.1 s se afle dac cele
patru probe sunt diferite semnificativ.
Testarea diferenelor dintre trei sau mai multe probe 113
Datele din exemplul 8.1 sunt distribuite n probe dup un singur
factor (zona), deci se realizeaz ANOVA unifactorial.
Ipotezele testului sunt:

: mediile probelor nu difer semnificativ;


:mediile probelor difer semnificativ.

Se calculeaz suma ptratelor tuturor valorilor prin adunarea sumelor


ptratelor valorilor din fiecare prob:

7952 9280 19700 39061 75993 .

U
Se calculeaz ptratul sumei totale prin adunarea sumelor valorilor
din fiecare prob i ridicarea sumei la ptrat:

C
ES
292 308 464 667 1731 2996361 .

Se calculeaz numrul total de valori din toate probele:


R
FI

12 12 12 12 48 .
M

Se calculeaz suma rapoartelor dintre ptratul sumei i dimensiunea


ZA

fiecrei probe:


70026,083 .

Se calculeaz cele trei sume de ptrate:

75993 13568,813
70026,083 7601,896
13568,813 7601,896 5966,917 .

Se calculeaz cele trei grade de libertate:

48 1 47 4 1 3 47 3 44 .
114 Elemente de statistic aplicate n ecologie
Se calculeaz sumele de ptrate medii:
, ,
2533,965 135,612 .

Cu cele dou sume de ptrate medii se calculeaz statistica testului:


,
18,685 .
,

Se completeaz tabelul ANOVA:

Sursa de variaie

U
Extern 7601,896 3 2533,965 18,685

C
Intern 5966,917 44 135,612
Total 13568,813 47
ES
Se afl valoarea critic tabelat (anexa 2) sau se calculeaz n funcie
R

de nivelul de confiden, de gradele de libertate externe i de gradele de


libertate interne (anexa 3):
FI

2,816 .
M

, , ,
ZA

Statistica testului este mai mare dect valoarea critic i se poate


respinge ipoteza nul. Deci se accept c mediile probelor difer
semnificativ.

Probabilitatea ca ipoteza nul s fie adevrat este 5,8 10 , adic


extrem de mic.
n continuare, pentru a compara probele dou cte dou se folosete
testul Tukey, pentru care trebuie calculate modulele diferenelor dintre
perechile de probe:

Media
, , ,
Probei
, 1,33 14,33 31,25
, 13 29,92
, 16,92
Testarea diferenelor dintre trei sau mai multe probe 115

Se calculeaz statistica testului pornind de la valoarea critic Tukey


(anexa 2):

, , , 3,79
,
3,79 12,74 .

Probele pentru care diferenele sunt mai mari dect statistica testului
sunt diferite semnificativ: proba difer semnificativ de probele i ,
proba difer semnificativ de probele i i proba difer semnificativ
de proba . Probele i nu difer semnificativ.

U
Pentru c probele au acelai numr de valori, se poate reprezenta

C
grafic intervalul de confiden pentru fiecare prob adunnd i scznd din
,
valoarea fiecrei medii statistica testului mprit la doi ( 6,37).
ES
Modul n care aceste intervale se suprapun arat care sunt probele diferite
semnificativ.
R
FI

70
M

60

50
ZA

40
x
30

20

10

0
A B C D
Proba

n grafic se observ cum intervalele probelor i se suprapun, n


timp ce intervalele celorlalte probe sunt separate pe vertical.
116 Elemente de statistic aplicate n ecologie

8.2.2. ANOVA unifactorial neparametric Kruskal-Wallis


Acest tip de ANOVA este o alternativ neparametric a modelului
unifactorial. Ca urmare, se utilizeaz atunci cnd datele nu respect
condiiile de aplicare ale modelului unifactorial parametric.
Aranjarea datelor i ipotezele sunt similare cu cele de la ANOVA
unifactorial parametric.
Valorile din probe primesc ranguri mpreun, la fel ca n cazul
testului Mann-Whitney (seciunea 7.1.2).
Se calculeaz apoi suma rapoartelor dintre ptratele sumelor
rangurilor i numrul valorilor pentru fiecare prob:

U


.

C
ES
Statistica testului se calculeaz pornind de la valoarea prezentat
anterior i numrul total de valori din toate probele ( ).
R



3 1
FI
M

Condiia testului const n compararea statisticii cu o valoare critic


n funcie de i de 1 grade de libertate (anexele 2 i 3).
ZA

Dac , se respinge i se accept pentru


1 .

Probabilitatea pentru valoarea lui , asociat ipotezei nule, se poate


calcula exact (anexa 3). n cazul n care este mai mic dect valoarea
, ipoteza nul se respinge i se accept ipoteza alternativ pentru o
probabilitate de 1 .
La fel ca n cazul ANOVA unifactorial parametric, i n cazul
ANOVA unifactorial neparametric se pot face comparaii multiple dac
diferenele testate sunt semnificative. Pentru a compara probele dou cte
dou se poate face pentru fiecare pereche cte un test Mann-Whitney
(seciunea 7.1.2).
Testarea diferenelor dintre trei sau mai multe probe 117
Exemplul 8.3. Pe baza datelor din exemplul 8.1 s se afle dac cele
patru probe sunt diferite semnificativ, considernd c nu sunt ndeplinite
condiiile pentru a realiza ANOVA unifactorial parametric.

n acest caz, se folosete alternativa neparametric a ANOVA


unifactorial, adic ANOVA Kruskal-Wallis.
Ipotezele sunt similare cu cele de la exemplul 8.2.
Se dau ranguri valorilor din cele patru probe mpreun:

Proba Proba
A 12 2 2,5 C 21 10 9,5
A 13 4 4,5 C 23 12 12

U
A 13 5 4,5 C 25 16 14,5
A 21 9 9,5 C 29 20 20

C
A 22 11 11 C 31 23 23
A 25 13 14,5 C 39 30 30
ES
A 25 14 14,5 C 41 32 31,5
A 28 17 17,5 C 46 34 34,5
A 29 19 20 C 46 35 34,5
R

A 30 22 22 C 52 37 37
FI

A 33 25 25,5 C 54 41 41
A 41 31 31,5 C 57 42 42
M

B 10 1 1 D 29 21 20
B 12 3 2,5 D 35 27 27
ZA

B 14 6 6 D 49 36 36
B 16 7 7 D 53 38 39
B 20 8 8 D 53 39 39
B 25 15 14,5 D 53 40 39

B 28 18 17,5 D 59 43 43
B 32 24 24 D 62 44 44
B 33 26 25,5 D 63 45 45
B 37 28 28 D 66 46 46
B 38 29 29 D 71 47 47
B 43 33 33 D 74 48 48

Se calculeaz apoi suma rapoartelor dintre ptratele sumelor


rangurilor i numrul valorilor pentru fiecare prob:
118 Elemente de statistic aplicate n ecologie
, ,

33518,458 .
Se calculeaz statistica testului:

33518,458 3 48 1 24,013 .

Se afl valoarea critic pin cutare n tabel (anexa 2) sau prin


calculare (anexa 3).

, , 7,815 .

U
Se verific condiia testului:

C
24,013 7,815 se respinge i se accept pentru
ES
1 0,05 0,95 .

Probabilitatea ca ipoteza nul s fie adevrat (anexa 3) este de


R

2,5 10 , adic extrem de mic.


FI

Concluzia testului este c probele difer semnificativ unele de altele.


M

8.2.3. ANOVA bifactorial fr replicare


Acest model se mai numete i model cu o singur observaie n
ZA

celul sau model cu observaii repetate.


n cazul acestui model datele sunt grupate n probe n funcie de doi
factori: , care determin aranjarea datelor n coloane ( ) i ,

care determin aranjarea datelor n rnduri sau linii ( ) (tab.


8.2). ntre cei doi factori nu exist interaciune (seciunea 8.2.5).

Tabelul 8.2. Distribuia valorilor n probe n ANOVA bifactorial






Testarea diferenelor dintre trei sau mai multe probe 119
Denumirea de model cu o singur observaie n celul vine de la
faptul c, ntr-o celul a tabelului, adic la intersecia unui nivel al unui
factor cu un nivel al celuilalt factor ( , ) sau, mai simplu, la intersecia
unui rnd cu o coloan, se gsete o singur valoare ( , ).
Denumirea de model cu observaii repetate provine de la un caz
particular n care rndurile sunt reprezentate de uniti de prob asupra
crora se fac observaii repetate. O astfel de situaie este similar cu cea n
care se compar dou probe neindependente cu ajutorul testului Student
pentru perechi de observaii (seciunea 7.2.1), cu deosebirea c n cazul
ANOVA se compar efectul a trei sau mai multe tratamente.
Conform acestui model orice observaie poate fi definit ca:

U
Media Eroarea
Obs. = + Efectul + Efectul +

C
general ntmpltoare.
ES
Efectul nivelurilor factorilor d variabilitatea extern (dintre probe),
iar eroarea ntmpltoare este rezultatul variabilitii interne (din cadrul
R

probelor).
n cazul acestui model, variabilitatea extern ( ) poate fi la rndul
FI

ei descompus n variabilitatea dintre coloane i variabilitatea dintre rnduri


( ), astfel c relaia de principiu a ANOVA bifactorial devine:
M
ZA

Dac varianele sau sumele de ptrate medii ( ) le considerm


rapoarte ntre sumele de ptrate ( ) i grade de libertate ( ), atunci:

Ipotezele care se testeaz prin intermediul acestui model pot viza


semnificaia efectului unui singur factor sau a ambilor factori, caz n care se
vor emite dou ipoteze nule i dou ipoteze alternative pentru acelai test.
Pentru date experimentare ipotezele sunt formulate astfel:
120 Elemente de statistic aplicate n ecologie
: nu exist diferene semnificative ntre efectele nivelurilor
primului factor ( ) asupra variabilei;
: nu exist diferene semnificative ntre efectele nivelurilor celui
de-al doilea factor ( ) asupra variabilei;
: diferenele dintre efectele nivelurilor primului factor ( ) asupra
variabilei sunt semnificative;
: diferenele dintre efectele nivelurilor celui de-al doilea factor
( ) asupra variabilei sunt semnificative.

n cazul unor date obinute n urma realizrii unor observaii


efectuate asupra unei variabile n populaii diferite, ipotezele pot fi

U
formulate astfel:

C
: mediile populaiilor corespunztoare nivelurilor primului factor
ES
( ) nu difer semnificativ;
: mediile populaiilor corespunztoare nivelurilor celui de-al
doilea factor ( ) nu difer semnificativ;
R

: mediile populaiilor corespunztoare nivelurilor primului factor


FI

( ) difer semnificativ;
: mediile populaiilor corespunztoare nivelurilor primului factor
M

( ) difer semnificativ.
ZA

Dac se aplic ANOVA unifactorial pentru coloane i rnduri,


trebuie parcurse urmtoarele etape:

1. Se calculeaz suma ptratelor tuturor valorilor ( ) prin


adunarea sumelor ptratelor valorilor pe coloane sau pe rnduri
( sau ):


Sau
.

2. Se calculeaz ptratul sumei totale ( prin adunarea


sumelor valorilor din fiecare coloan ( ) sau rnd ( ),
urmat de ridicarea la ptrat:
Testarea diferenelor dintre trei sau mai multe probe 121


sau
.

3. Se calculeaz numrul total de valori din toate probele ( ) prin


nsumarea dimensiunilor coloanelor ( ) sau rndurilor ( ):

sau
.

U
C
4. Se calculeaz suma rapoartelor dintre ptratul sumei i
dimensiunea fiecrei coloane:
ES

.
R
FI

5. Se calculeaz suma rapoartelor dintre ptratul sumei i


M

dimensiunea fiecrui rnd:


ZA

6. Se calculeaz sumele de ptrate: total ( ), dintre coloane ( ),


dintre rnduri ( ) i cea intern ( ):


.
122 Elemente de statistic aplicate n ecologie
7. Se calculeaz numrul gradelor de libertate totale ( ), pentru
coloane ( ), pentru rnduri ( ) i cele interne ( ):

1
1
1
1 1 1 .

8. Sumele de ptrate medii ( ) se calculeaz mprind sumele de


ptrate ( ) la gradele de libertate corespunztoare ( ):

U
C
ES
.

9. Cu rezultatele obinute se completeaz aa-numitul tabel ANOVA


R

n care se va gsi i statistica testului ( ):


FI

Sursa de variaie
M

Extern, ntre coloane /


ZA

Extern, ntre rnduri /


Intern
Total

Condiia testului const n compararea statisticii cu o valoare


critic tabelat n funcie de , gradele de libertate externe ( ) i gradele
de libertate interne ( ) (anexa 2).

Dac , , se respinge i se accept pentru


o probabilitate 1 .
Dac , , se respinge i se accept pentru
o probabilitate 1 .

Valoarea critic, precum i probabilitatea statisticii testului (adic


Testarea diferenelor dintre trei sau mai multe probe 123
probabilitatea ca ipoteza nul s fie adevrat) se pot calcula (anexa 3).
Cnd se calculeaz probabilitatea asociat valorii , atunci ipoteza nul se
respinge dac este mai mic de nivelul i se va accepta ipoteza
alternativ pentru o probabilitate de 1 .

Exemplul 8.4. S-a urmrit densitatea realizat de o anumit specie


de plant n cinci suprafee de prob (de la la ) urmrite timp de patru
ani (de la la ) dintr-o zon supus reconstruciei ecologice. A crescut
semnificativ densitatea plantei n timp?

An Se poate observa c
datele sunt organizate dup doi

U
3 7 10 18 factori: an i prob. Deci se poate
realiza un model bifactorial de

C
8 10 15 20
Proba 17 30 33 65 ANOVA. Dat fiind faptul c n
ES
8 11 31 60 fiecare celul exist o singur
valoare, se va realiza ANOVA
2 3 17 15
bifactorial fr replicare.
R

Fiind vorba de relativ


FI

1,0986 1,9459 2,3026 2,8904 puine date ce reprezint numr


2,0794 2,3026 2,7081 2,9957 de entiti, se poate face o
M

2,8332 3,4012 3,4965 4,1744 transformare care s normalizeze


distribuia i s stabilizeze
ZA

2,0794 2,3979 3,4340 4,0943


0,6931 1,0986 2,8332 2,7081 variana probelor.

ntrebarea problemei se refer doar la diferenele semnificative


dintre ani (coloane). Dac s-ar fi dorit i evidenierea diferenelor dintre


suprafeele de prob (rnduri), atunci trebuie testate dou seturi de ipoteze:
una nul i una alternativ pentru fiecare factor:

: nu exist diferene semnificative ntre densiti pe ani;


: nu exist diferene semnificative ntre densiti pe probe;
: diferenele dintre densitile pe ani sunt semnificative;
: diferenele dintre densitile pe probe sunt semnificative.
124 Elemente de statistic aplicate n ecologie
Se calculeaz suma ptratelor tuturor valorilor logaritmate:

18,363 27,613 44,680 58,851 149,508 .

Se calculeaz ptratul sumei totale la ptrat:

8,784 11,146 14,774 16,863 51,567


2659,185 .

Se calculeaz numrul total de valori din toate probele

5 5 5 5 20 .

U
Se calculeaz suma rapoartelor dintre ptratul sumei i dimensiunea

C
fiecrei coloane:
ES
, , , ,
140,806 .
R
FI

Se calculeaz suma rapoartelor dintre ptratul sumei i dimensiunea


M

fiecrui rnd:
ZA

, , , , ,

140,212 .

Se calculeaz sumele de ptrate:

,
149,508 16,549
,
140,806 7,847
,
140,212 7,252
16,549 7,847 7,252 1,450 .
Testarea diferenelor dintre trei sau mai multe probe 125
Se calculeaz numrul gradelor de libertate:

20 1 19 4 1 3
5 1 4 4 1 5 1 12 .

Se calculeaz sumele de ptrate medii:


, , ,
2,616 1,813 0,121 .

Se calculeaz statisticile testului i se completeaz tabelul ANOVA:


, ,
21,620 14,983 .

U
, ,

C
Sursa de variaie
ES
Extern, ntre coloane 7,847 3 2,616 21,620
Extern, ntre rnduri 7,252 4 1,813 14,983
R

Intern 1,450 12 0,121


Total 16,549 19
FI

Se afl valorile critice pentru fiecare surs de variaie extern (anexa


M

2 sau 3):
ZA

, , , 3,490 , , , 3,259 .

Se verific condiia testului:

21,620 3,490 se respinge i se accept pentru o


probabilitate 1 0,05 0,95.
14,983 3,259 se respinge i se accept pentru o
probabilitate 1 0,05 0,95.

Probabilitile celor dou ipoteze nule se pot calcula (anexa 3):

3,92 10 i 1,18 10 .
126 Elemente de statistic aplicate n ecologie
Concluzia testului este c modificrile induse de trecerea anilor
densitii plantei analizate sunt semnificative. De asemenea, exist i o
diferen semnificativ ntre suprafeele de prob din punctul de vedere al
densitii speciei analizate.

8.2.4. ANOVA bifactorial neparametric Friedman


Se utilizeaz ca alternativ neparametric a modelului bifactorial
atunci cnd se fac observaii repetate asupra acelorai uniti de prob,
obinndu-se probe neindependente. Din acest punct de vedere ANOVA
bifactorial neparametric este similar testului Wilcoxon (seciunea 7.2.2),
doar c se folosete pentru trei sau mai multe probe.
Aranjarea datelor i ipotezele sunt similare cu cele de la ANOVA

U
bifactorial parametric, cu deosebirea c se testeaz doar ipotezele i

C
referitoare la factorul ce determin aranjarea datelor n coloane.
Valorile fiecrui rnd primesc ranguri n mod independent.
ES
Rangurile pentru fiecare rnd se atribuie conform algoritmului prezentat n
seciunea 2.1, tab. 2.3.
R

Logica acestui test este c, dac nu exist diferene ntre efectele


nivelului primului factor ( ) sau, mai simplu, dac nu exist diferene ntre
FI

coloane, sumele rangurilor coloanelor ar trebui s fie aproximativ egale,


deoarece orice rang are anse egale s apar n orice coloan.
M

Se calculeaz suma rangurilor valorilor din fiecare coloan ( ),


ZA

dup care se ridic la ptrat:

Se calculeaz suma ptratelor sumelor rangurilor pe coloan:

Statistica testului se calculeaz cu ajutorul formulei:

3 1 .
Testarea diferenelor dintre trei sau mai multe probe 127
Condiia testului compar valoarea statisticii cu o valoare critic
tabelat (anexa 2) sau calculat (anexa 3) n funcie de i de numrul de
coloane minus unu grade de libertate ( 1).

Dac , se respinge, se accept pentru


1 .

Probabilitatea pentru valoarea lui , asociat ipotezei nule, se poate


calcula exact (anexa 3). n cazul n care este mai mic de valoarea ,
ipoteza nul se respinge i se accept ipoteza alternativ pentru o
probabilitate de 1 .
Deci acesta verific doar setul de ipoteze care se refer la factorul

U
dup care se aranjeaz datele pe coloane. Cu alte cuvinte, dac se respinge

C
ipoteza nul, concluzia este c exist o diferen semnificativ ntre coloane.
ES
Exemplul 8.5. S se rspund la ntrebarea de la exemplul 8.4
considernd c nu sunt ndeplinite condiiile de aplicare a ANOVA
R

bifactoriale fr replicare, parametrice.


FI

n acest caz se apeleaz la alternativa neparametric a acestui tip de


ANOVA, adic la ANOVA Freidman.
M

Ipotezele testului sunt similare celor de la exemplul 8.4, cu


ZA

deosebirea c ANOVA Friedman testeaz doar un singur set de ipoteze, cele


care vizeaz coloanele. Pentru a testa i ipotezele referitoare la rnduri,
datele trebuie rearanjate astfel nct coloanele s devin rnduri i rndurile

coloane. Altfel spus, tabelul de date trebuie rotit.


Pentru a efectua testul trebuie ca valorile din fiecare rnd s
primeasc ranguri, dup care se calculeaz suma rangurilor pe coloane:

1 2 3 4
1 2 3 4
1 2 3 4
1 2 3 4
1 2 4 3
5 10 16 19
128 Elemente de statistic aplicate n ecologie

Se calculeaz apoi suma sumelor ridicate la ptrat ale rangurilor pe


coloane:

5 10 16 19 742 .

Se calculeaz statistica testului:

742 35 4 1 14,04 .

Se afl valoarea critic (anexa 2 sau anexa 3): 7,815 .

U
, ,
Statistica testului este mai mare dect valoarea critic, deci se

C
respinge ipoteza nul ( ) i se accept ipoteza alternativ ( ).
ES
Probabilitatea ca ipoteza nul s fie adevrat se poate calcula
(anexa 3) i este egal cu 0,0029.
Concluzia testului este c probele (coloanele) difer semnificativ.
R
FI

8.2.5. ANOVA bifactorial cu replicare


Acest model se mai numete si model cu numr egal de observaii n
M

celul.
La fel ca i la ANOVA bifactorial fr replicare, datele sunt grupate
ZA

n probe n funcie de doi factori: , care determin aranjarea datelor n


coloane ( ), i , care determin aranjarea datelor n rnduri
sau linii ( ) (tab. 8.3). n cazul acestui model particularitatea de

form const n faptul c ntr-o celul a tabelului, adic la intersecia unui


nivel al unui factor cu un nivel al celuilalt factor ( , ) sau, mai simplu, la
intersecia unui rnd cu o coloan, se gsesc mai multe valori ( , , ), adic
observaii replicate.
Particularitatea de principiu a acestui model este reprezentat de
faptul c presupune o interaciune ntre cei doi factori. Practic, interaciunea
este evident dac efectul unor anumite niveluri ale factorilor asupra
variabilei investigate se modific ntr-o manier neaditiv.
Testarea diferenelor dintre trei sau mai multe probe 129
Tabelul 8.3. Distribuia valorilor n probe n ANOVA bifactorial

C
ES
Evidenierea interaciunii se poate realiza prin vizualizarea grafic a
mediilor celulelor (a mediilor valorilor de la 1 la din fiecare celul). Dac
liniile care unesc mediile dup un factor sunt mai mult sau mai puin
R

paralele, atunci ntre factori nu exist interaciune. n figura 8.1 se poate


FI

observa c trecerea de la un nivel al factorului la altul (trecerea de la la


) modific variabila n sensul descreterii mediilor cu aceeai valoare i
M

pentru rndul 1, i pentru rndul 2. Modificarea variabilei se realizeaz n


acelai sens i sub aciunea nivelurilor factorului . Deci, n acest caz,
ZA

factorii i au o aciune aditiv negativ (de scdere) a variabilei


investigate.

x R1
R2

C1 C2
Figura 8.1. Interaciune absent
130 Elemente de statistic aplicate n ecologie
Dac liniile ce unesc mediile dup un factor sunt evident neparalele,
nseamn c ntre cei doi factori exist o interaciune sau efectele factorilor
asupra variabilei sunt neaditive. n figura 8.2, efectele factorului asupra
variabilei modific efectele factorului n sensul c pentru efectul
trecerii de la la const ntr-o scdere mai mare dect pentru .

x R1

U
R2

C
ES
C1 C2
R

Figura 8.2. Interaciune:


FI

n figura 8.3 este vorba tot de interaciune ntre factori, dar n acest
M

caz interaciunea const ntr-o descretere mai ampl n cazul sub


aciunea factorului .
ZA

x R1
R2

C1 C2

Figura 8.3. Interaciune:


Testarea diferenelor dintre trei sau mai multe probe 131
Conform acestui model orice observaie poate fi definit ca:

Efect
Media Efect Efect Eroarea
Obs.= + + + Interaciune +
general ntmpltoare.

Efectul nivelurilor factorilor d variabilitatea extern (dintre probe),


iar eroarea ntmpltoare este rezultatul variabilitii interne (din cadrul
probelor).
n cazul acestui model variabilitatea extern ( ) poate fi rndul ei
descompus n variabilitatea dintre coloane, variabilitatea dintre rnduri i
variabilitatea cauzat de interaciune ( ), astfel c relaia de

U
principiu a ANOVA bifactorial devine:

C
.
ES
Dac varianele sau sumele de ptrate medii ( ) le considerm
rapoarte ntre sumele de ptrate ( ) i grade de libertate ( ), atunci:
R
FI

.
M

Ipotezele care se testeaz prin intermediul acestui model pot viza


semnificaia efectului unui singur factor sau a ambilor factori, caz n care se
ZA

vor emite dou ipoteze nule i dou ipoteze alternative pentru acelai test.
Pentru date experimentale ipotezele sunt formulate astfel:

: nu exist diferene semnificative ntre efectele nivelurilor


primului factor ( ) asupra variabilei;
: nu exist diferene semnificative ntre efectele nivelurilor celui
de-al doilea factor ( ) asupra variabilei;
: efectul interaciunii nu este semnificativ;
: diferenele dintre efectele nivelurilor primului factor ( ) asupra
variabilei sunt semnificative;
: diferenele dintre efectele nivelurilor celui de-al doilea factor
( ) asupra variabilei sunt semnificative;
: efectul interaciunii este semnificativ.
132 Elemente de statistic aplicate n ecologie
n cazul unor date obinute n urma realizrii unor observaii
efectuate asupra unei variabile n populaii diferite, ipotezele pot fi
formulate astfel:

: mediile populaiilor corespunztoare nivelurilor primului factor


( ) nu difer semnificativ;
: mediile populaiilor corespunztoare nivelurilor celui de-al
doilea factor ( ) nu difer semnificativ;
: mediile corespunztoare interaciunii nivelurilor factorilor
( , ) nu difer semnificativ;
: mediile populaiilor corespunztoare nivelurilor primului factor

U
( ) difer semnificativ;
: mediile populaiilor corespunztoare nivelurilor primului factor

C
( ) difer semnificativ;
ES
: mediile corespunztoare interaciunii nivelurilor factorilor
( , ) difer semnificativ.
R

Dac se aplic ANOVA unifactorial pentru coloane, rnduri i


FI

valori n fiecare celul, trebuie parcurse urmtoarele etape:


1. Se calculeaz suma ptratelor tuturor valorilor ( ) prin
M

adunarea ptratelor tuturor valorilor pe coloane sau pe rnduri


ZA

( sau ):

sau
.

2. Se calculeaz ptratul sumei totale ( prin adunarea


sumelor valorilor din fiecare coloan ( ) sau rnd ( ),
urmat de ridicarea la ptrat:


sau
.
Testarea diferenelor dintre trei sau mai multe probe 133

3. Se calculeaz numrul total de valori din toate probele ( ) prin


nsumarea dimensiunilor coloanelor ( ) sau rndurilor ( ) sau
prin nmulirea numrului de valori din celul cu numrul
celulelor egal cu produsul dintre numrul coloanelor i rndurilor:

sau

sau
.

U
4. Se calculeaz suma rapoartelor dintre ptratul sumei i

C
dimensiunea fiecrei coloane:
ES

.
R
FI

5. Se calculeaz suma rapoartelor dintre ptratul sumei i


dimensiunea fiecrui rnd:
M
ZA

6. Se calculeaz suma rapoartelor dintre ptratul sumei i


dimensiunea fiecrei celule ( ):

sau

.
134 Elemente de statistic aplicate n ecologie
7. Se calculeaz sumele de ptrate: total ( ), dintre coloane ( ),
dintre rnduri ( ), de interaciune ( ) i cea intern ( ):

U
.

C
ES
8. Se calculeaz numrul gradelor de libertate totale ( ) pentru
coloane ( ), pentru rnduri ( ), pentru interaciune ( ) i
pentru cele interne ( ):
R
FI

1
1
M

1
1 1
ZA

9. Sumele de ptrate medii ( ) se calculeaz mprind sumele de


ptrate ( ) la gradele de libertate corespunztoare ( ):

.
Testarea diferenelor dintre trei sau mai multe probe 135
10. Cu rezultatele obinute se completeaz aa-numitul tabel
ANOVA n care se va gsi i statistica testului ( ):

Sursa de variaie
Extern, ntre coloane /
Extern, ntre rnduri /
Extern, de interaciune
/
(ntre celule)
Intern

U
Total

C
ES
Condiia testului const n compararea statisticii cu o valoarea
critic tabelat n funcie de , gradele de libertate externe ( ) i gradele
R

de libertate interne ( ) (anexa 2 sau anexa 3).


FI

Dac , , se respinge i se accept pentru


M

o probabilitate 1 .
Dac , , se respinge i se accept pentru
ZA

o probabilitate 1 .
Dac , , se respinge i se accept pentru
o probabilitate 1 .

Valoarea critic, precum i probabilitatea statisticii testului (adic


probabilitatea ca ipoteza nul s fie adevrat) se pot calcula (anexa 3).
Cnd se calculeaz probabilitatea asociat valorii , atunci ipoteza nul se
respinge dac este mai mic de nivelul i se va accepta ipoteza
alternativ pentru o probabilitate de 1 .
Dac diferenele testate sunt semnificative, atunci se pot face
comparaii multiple. Pentru aceasta se utilizeaz testul Tukey, n cadrul
cruia se calculeaz diferenele n modul dintre mediile tuturor perechilor
unice de probe (celule):
136 Elemente de statistic aplicate n ecologie

Media

probei
| | | | | |

| | | |

| |

U
Se calculeaz apoi pentru statistica a testului pornind de la o

C
valoare critic Tukey ( , , , anexa 2), suma de ptrate medie intern
( ) i numrul valorilor dintr-o celul ( ).
ES

R

, ,
FI

Dac diferena absolut dintre oricare dou medii | |


M

diferena este semnificativ pentru 1 .


ZA

Exemplul 8.6. ntr-un experiment s-a urmrit efectul tipului de


hran i al stresului ambiental asupra greutii unor obolani de laborator.
Pentru aceasta s-au format 4 grupuri a cte 10 obolani, care au fost supuse

urmtoarelor tratamente: un grup a primit hran normal n condiii


nestresante, un grup a primit hran normal n condiii stresante, un grup a
primit hran hipercaloric n condiii nestresante i ultimul grup a primit
hran hipercaloric n condiii stresante. Dup un timp s-au determinat
greutile la toi indivizii. Exist o interaciune semnificativ ntre cei doi
factori: tipul de hran i stres?

Avnd n vedere modul de organizare al datelor, se poate folosi


ANOVA bifactorial cu replicare (cu numr egal de observaii n celul). La
intersecia unui rnd i a unei coloane sunt zece valori. Acest model poate
rspunde la ntrebarea problemei.
Testarea diferenelor dintre trei sau mai multe probe 137
Hran
Mediu Normal Hipercaloric
130 157
142 155
131 162
124 153
124 158
Stresant
131 152
143 159
131 161
130 160
127 157
120 132
130 128

U
122 142
118 131

C
120 135
Nestresant
ES
119 120
127 139
118 133
R

119 135
122 136
FI

Pentru a vedea dac exist interaciune ntre factori la nivel de probe


M

(celule), trebuie reprezentate grafic mediile valorilor din fiecare celul.


ZA

165
160
stresant 157,4

155
150 nestresant
145
x 140
135 131,3 133,1
130
125 121,5
120
115
normal hipercaloric
Hran
138 Elemente de statistic aplicate n ecologie
Din analiza acestui grafic rezult c hrana hipercaloric determin o
cretere n greutate mai mare dect cea normal. Condiiile stresante
determin o cretere n greutate mai mare. Creterea n greutate cnd s-a
administrat hran hipercaloric i n condiii stresante este mai puternic
dect atunci cnd s-a administrat hran normal n condiii stresante. Deci s-
ar putea s existe o interaciune ntre cei doi factori.
Ipotezele acestui test sunt:

: tipul de hran nu are un efect semnificativ asupra greutii


(coloanele nu difer semnificativ);
: stresul nu are un efect semnificativ asupra greutii (rndurile
nu difer semnificativ);

U
: interaciunea dintre tipul de hran i stres nu este semnificativ

C
(celulele nu difer semnificativ);
: tipul de hran are un efect semnificativ asupra greutii
ES
(coloanele difer semnificativ);
: stresul are un efect semnificativ asupra greutii (rndurile
R

difer semnificativ);
: interaciunea dintre tipul de hran i stres este semnificativ
FI

(celulele difer semnificativ).


M
ZA

Pentru a verifica dac interaciunea este semnificativ trebuie s se


parcurg etapele de realizare ale ANOVA bifactorial cu replicare.
Se calculeaz suma ptratelor tuturor valorilor:

320544 425335 745879 .

Se calculeaz ptratul sumei totale:

2528 2905 5433 29517489 .

Se calculeaz numrul total de valori din toate probele:

20 20 40 .
Testarea diferenelor dintre trei sau mai multe probe 139
Se calculeaz suma rapoartelor dintre ptratul sumei i dimensiunea
fiecrei coloane:


741490,45 .

Se calculeaz suma rapoartelor dintre ptratul sumei i dimensiunea


fiecrui rnd:


740844,25 .

U
C
Se calculeaz suma rapoartelor dintre ptratul sumei i dimensiunea
fiecrei celule:
ES

744923,1 .
R
FI

Se calculeaz sumele de ptrate:


M
ZA

745879 7941,775
741490,45 3553,225

740844,25 2907,025
744923,1 3553,225 2907,025 525,625
7941,775 3553,225 2907,025 525,625 955,9.

Se calculeaz numrul gradelor de libertate:

40 1 39 2 1 1
2 1 1 2 1 2 1 1
40 4 36 .
140 Elemente de statistic aplicate n ecologie
Se calculeaz sumele de ptrate medii:
, ,
3553,225 2907,025
, ,
525,625 26,553 .

Se calculeaz statisticile testului i se completeaz tabelul ANOVA:


, ,
133,82 109,48
, ,
,
19,80 .
,

U
Sursa de variaie

C
Extern, ntre coloane 3553,225 1 3553,225 133,82
Extern, ntre rnduri 2907,025 1 2907,025 109,48
ES
Extern, de interaciune
525,625 1 525,625 19,80
(ntre celule)
R

Intern 955,9 36 26,553


Total 7941,775 39
FI

Deoarece gradele de libertate externe sunt toate egale cu 1, valoarea


M

critic va fi aceeai (anexa 2 sau 3) pentru toate cele trei seturi de ipoteze:
ZA

, , , 4,113.

133,82 4,113 se respinge i se accept pentru o


probabilitate 1 0,05.
109,48 4,113 se respinge i se accept pentru o
probabilitate 1 .
19,80 4,113 se respinge i se accept pentru o
probabilitate 1 .

Probabilitile ca ipotezele nule s fie adevrate pot fi calculate


pentru fiecare statistic (anexa 3). Ele sunt 1,1 10 pentru , 1,9
10 pentru i 7,9 10 pentru .
Concluzia testului este c hrana are un efect semnificativ asupra
Testarea diferenelor dintre trei sau mai multe probe 141
greutii, stresul are un efect semnificativ asupra greutii i interaciunea
dintre hran i stres este i ea semnificativ.
n continuare, pentru evidenierea diferenelor semnificative dintre
celule luate cte dou se poate realiza testul Tukey. Pentru aceasta se
calculeaz modulele diferenelor dintre mediile celulelor:

Hipercaloric Normal Hipercaloric


Hran
Stresant Nestresant Nestresant
Mediu
157,4 121,5 133,1
Normal
Stresant 26,1 9,8 1,8
131,3

U
157,4 35,9 24,3

C
ES
121,5 11,6

Se afl valoarea critic Tukey (anexa 2):


R
FI

, , , 3,85 .
M

Se calculeaz statistica testului:


ZA

,
3,85 6,27 .

Comparaia dintre modulele diferenelor dintre medii i statistica


testului evideniaz c exist diferene semnificative ntre toate perechile de
grupuri, cu excepia perechii formate de grupul hrnit normal n condiii de
stres i grupul hrnit cu hran hipercaloric n condiii nestresante, ntre care
nu exist o diferen semnificativ.
Diferenele semnificative pot fi observate i prin analiza grafic a
suprapunerii dintre intervalele de confiden ale mediilor grupurilor.
Limitele intervalelor de confiden se calculeaz scznd i adunnd la
media fiecrui grup valoarea obinut prin mprirea statisticii testului
,
Tukey la doi ( 3,135).
142 Elemente de statistic aplicate n ecologie

165
160 stresant
157,4
155 nestresant
150
145
x 140
135
131,3 133,1
130
125
121,5
120
115

U
normal hipercaloric
Hran

C
ES
R
FI
M
ZA

9. CORELAIA I REGRESIA

O cercetare ecologic poate urmri posibilele relaii ntre dou sau


mai multe fenomene. De cele mai multe ori se urmrete relaia dintre dou
variabile apreciate pe o scal ordinal, de interval sau de raport. Analiza
unei astfel de relaii se face prin corelaie sau regresie, aplicarea uneia din
cele dou depinznd de modalitatea de obinere a datelor i de problema
care se pune n legtur cu acestea.

U
Corelaia este folosit pentru a determina dac exist asociere ntre

C
dou variabile i ct de puternic este aceast asociere. Prin asociere se
nelege c atunci cnd o variabil se modific cealalt se modific i ea
ES
ntr-un anumit mod. De remarcat c n cazul corelaiei nu se fac presupuneri
viznd asocieri de tipul cauz-efect ntre cele dou variabile, dei acestea ar
putea exista. Exist posibilitatea ca dinamica celor dou variabile s fie
R

determinat de o a treia.
FI

Regresia, pe de alt parte, evideniaz cu precdere relaiile de tip


cauz-efect dintre dou variabile, astfel nct o proporie substanial dintre
M

valorile unei variabile, numit variabil dependent, s fie o funcie sau s


ZA

fie explicate de valorile celeilalte variabile, numit variabil independent.


O alt deosebire notabil dintre corelaie i regresie este faptul c n
majoritatea cazurilor de analiz a regresiei valorile variabilei independente
nu sunt obinute aleator din populaie, nu sunt normal distribuite, ci, mai

curnd, selecia lor se afl sub controlul experimentatorului.


n general, se fac suficiente confuzii privind care dintre cele dou
analize pot fi aplicate unor anumite date. Pentru a simplifica decizia privind
utilizarea analizei corelaiei sau regresiei s analizm urmtoarele trei
cazuri:
A. Se extrage aleator o prob format din oprle gravide dintr-o
populaie. Dup depunerea oulor se nregistreaz greutatea i numrul de
ou produse. Datele se reprezint grafic, desemnndu-se arbitrar care
dintre cele dou variabile va fi reprezentat pe abscis i care pe ordonat.
B. Se urmrete efectul temperaturii asupra frecvenei cardiace la
144 Elemente de statistic aplicate n ecologie
proba reprezentat de oprle. Pentru aceasta fiecare dintre ele este supus
unei anumite temperaturi cuprins ntre anumite limite. Se nregistreaz
apoi la fiecare individ frecvena cardiac. Temperatura, variabila
independent fixat arbitrar, va fi reprezentat pe abscis. Frecvena
cardiac, variabila dependent de prima, va fi reprezentat pe ordonat.
C. Se alege un anumit numr de oprle gravide dintr-o populaie
dup un anumit criteriu s aib o anumit greutate. Se urmrete mai
departe cte ou va produce fiecare animal. Greutatea, variabila
independent aleas arbitrar i n funcie de valorile creia s-a selecionat
proba, va fi reprezentat pe abscis, iar dimensiunea pontei, variabila
dependent de prima, va fi reprezentat pe ordonat.
Dintre cele 3 situaii descrise mai sus, prima (A) este o problem de

U
analiz a corelaiei, n timp ce situaiile B i C sunt probleme de analiz a
regresiei. Dei situaiile A i C pot conduce aparent la ideea c ambele

C
analize pot fi aplicate pe aceleai date, n realitate, aplicarea corelaiei sau
ES
regresiei este dictat de modul n care a fost obinut proba: n cazul A
proba era prelevat aleator, n timp ce n cazul C proba era prelevat
arbitrar, dup un anumit criteriu.
R
FI

9.1. ANALIZA CORELAIEI


M

Analiza corelaie are rolul de a rspunde la mai multe ntrebri:


ZA

1. Exist o relaie ntre dou 2 variabile studiate?


2. Care este tipul acestei relaii?

3. Ct de puternic este aceast relaie?


4. Este relaia detectat semnificativ?

Rspunsurile la aceste ntrebri pot fi intuite din analiza datelor prin


intermediul unor reprezentri grafice (diagram de mprtiere a punctelor
de coordonate i ). Astfel, analiza graficelor de mai jos (fig. 9.1) permite
urmtoarele concluzii:
primul grafic prezint o corelaie direct sau pozitiv (variabilele
sunt direct proporionale), adic cele dou variabile se modific n acelai
sens cnd crete, crete, iar cnd scade, scade;
Corelaia i regresia 145
al doilea grafic prezint o corelaie invers sau negativ
(variabilele sunt invers proporionale), adic cele dou variabile se modific
n sens diferit cnd crete, scade, iar cnd scade, crete;
al treilea grafic arat c, ntre cele dou variabile, corelaia practic
nu exist;
n cazul celui de-al patrulea grafic, tragerea unei concluzii este
dificil, implicnd un grad nalt de subiectivism: fie nu exist corelaie, fie
este o corelaie pozitiv, slab (mprtierea punctelor este relativ mare).

y y

U
Corelaie pozitiv x
C
Corelaie negativ x
ES
y y
R
FI
M

Corelaiei absent x Corelaie? x


ZA

Figura 9.1. Tipuri de corelaie

Examinarea graficelor de corelaie poate fi ns subiectiv, motiv


pentru care este necesar completarea metodei grafice cu una statistic, mai
obiectiv. O astfel de metod ce surprinde msura n care dou variabile
sunt asociate const n calcularea coeficientului de corelaie .
Valoarea coeficientului de corelaie este cuprins ntre 1, valoarea
unei corelaii maxime negative, i 1, valoarea unei corelaii maxime
pozitive. Dac este cuprins ntre 0 i 1, corelaia este pozitiv, iar dac
este cuprins ntre 0 i 1, corelaia este negativ. Cnd este egal cu 0,
corelaia este absent. Cnd este egal cu 1 sau 1, punctele de
coordonate , sunt dispuse perfect liniar, n lungul unei drepte imaginare
(fig. 9.2, A i B). Dac variabilele urmrite sunt apreciate pe o scal
146 Elemente de statistic aplicate n ecologie
ordinal, exist o corelaie perfect cnd toate valorile cresc sau descresc
succesiv. n acest caz, punctele din graficul de corelaie pot s nu se afle
dispuse liniar (fig. 9.2, C).

y y y

A x B x C x

Figura 9.2. Corelaii perfecte: A pozitiv, B negativ, C perfect monoton (a


rangurilor)

U
C
Corelaiile pentru care valoarea coeficientului este mai apropiat de
ES
1 sau 1 sunt corelaii puternice, pozitive sau, respectiv, negative, iar cele
pentru care valoarea coeficientului este mai apropiat de 0 sunt corelaii
slabe (tab. 9.1).
R

Tabelul 9.1. Puterea corelaiei n funcie de valoarea lui


FI

Puterea corelaiei
M

0,00 0,19 Corelaie foarte slab


0,20 0,39 Corelaie slab
ZA

0,40 0,69 Corelaie moderat


0,70 0,89 Corelaie puternic
Corelaie foarte
0,90 1,00

puternic

n funcie de caracteristicile datelor celor dou variabile, corelaia


poate fi parametric sau neparametric. Pentru fiecare din cele dou se
folosesc coeficieni diferii: pentru corelaia parametric se folosete
coeficientul de corelaie Pearson; pentru corelaia neparametric se
utilizeaz coeficientul de corelaie Spearman. n funcie de utilizarea
unuia dintre cei doi coeficieni, analiza corelaiei poate fi parametric i,
respectiv, neparametric. Analiza corelaie n general const n calcularea
valorii coeficientului de corelaie i n testarea semnificaiei acestuia la
nivelul populaiei din care a fost extras proba.
Corelaia i regresia 147
Semnificaia unei corelaii se apreciaz independent de puterea
acesteia. Astfel, se poate pune n eviden o corelaie puternic, pozitiv sau
negativ, care ns s nu fie semnificativ i invers, una slab care ns s se
dovedeasc a fi semnificativ.

9.1.1. Analiza corelaiei parametrice


Ca i n cazul celorlalte teste parametrice prezentate n capitolele
anterioare, analiza corelaiei parametrice presupune ca datele s
ndeplineasc urmtoarele condiii:

1. proba trebuie s fie prelevat aleator din populaia cercetat;


2. ambele variabile, i , trebuie s fie apreciate pe o scal de

U
raport sau de interval;
3. valorile ambelor trebuie variabile s fie aproximativ normal

C
distribuite;
ES
4. relaia dintre cele dou variabile, dac exist, trebuie s fie liniar.

Liniaritatea relaiei poate fi verificat prin inspectarea graficului de


R

corelaie n care norul de puncte de coordonate , trebuie s nu fie curbat.


FI

Dac datele nu ndeplinesc condiiile 2, 3, i 4, atunci trebuie


utilizat o analiz neparametric a corelaiei. n cazul n care nu este
M

ndeplinit numai condiia 4, se poate lua n consideraie i o transformare


care s ndrepte relaia (seciunea 9.2 Abordarea relaiilor curbilinii).
ZA

n cazul corelaiei parametrice se calculeaz coeficientul de corelaie


Pearson. Acesta msoar ct de puternic este relaia dintre dou variabile
i , pornind de la covariana lor n prob.

Covariana este o msur a variabilitii legate a dou variabile fa


de mediile lor. Este de fapt media produselor abaterilor celor dou variabile
fa de media fiecreia sau produsul deviaiilor variabilelor. Ca i deviaia
standard i variana, covariana poate fi o statistic a unei probe ( ) sau un
parametru populaional ( ). Cnd statistica se folosete ca estimator al
parametrului, atunci suma produselor abaterilor variabilelor se mparte la
numrul gradelor de libertate 1.


148 Elemente de statistic aplicate n ecologie
Pentru dou valori x i y, fiecare mai mare dect media sa ( i
), abaterile ( i ) lor vor fi pozitive i produsul lor, tot pozitiv.
Dac o pereche de valori i sunt mai mici dect mediile lor, atunci
ambele abateri vor fi negative. Produsul lor ns va fi pozitiv.
Dac o valoare este mai mic dect , iar o valoare este mai
mare dect , atunci abaterea lui va fi negativ, iar abaterea lui va fi
pozitiv. Ca urmare, produsul abaterilor va fi negativ. La fel se ntmpl
dac x este mai mare dect , iar y este mai mic dect .
Din punct de vedere grafic, produsele abaterilor vor fi pozitive sau
negative n funcie de poziia punctului de coordonate , fa de poziia
punctului de coordonate , , numit i centru mediu (fig. 9.3).

U
C
y
ES
+

y
R

+
FI
M

x x
ZA

Figura 9.3. Semnul produselor abaterilor n funcie de poziia fa de centrul mediu

Referindu-ne la datele dintr-o prob, din analiza figurii 9.3 rezult


c, dac majoritatea punctelor de coordonate , se vor dispune n


cadranele notate cu + i mai puine puncte se vor afla n cadranele notate
cu , atunci covariana va fi pozitiv. Dac vor predomina punctele din
cadranele negative, iar cele din cadranele pozitive vor fi mai puine, atunci
covariana probei va fi negativ. Deci, fcnd legtura dintre covarian i
coeficientul de corelaie, se poate spune c semnul corelaiei, al
coeficientului, este acelai cu cel al covarianei valorilor dintr-o prob.
Acest lucru este evident i dac suprapunem primele dou grafice din figura
9.1 peste cel din figura 9.3 (fig. 9.4).
Corelaia i regresia 149
+
y y
+

y y

+
x x x x

Figura 9.4. Relaia dintre semnul covarianei i cel al corelaiei

Se poate pune urmtoarea ntrebare: dac relaia dintre variabile este

U
surprins de covariana lor, de ce nu se utilizeaz acest descriptor ( ) n

C
loc de coeficientul de corelaie ( )? Din perspectiva corelaiei, covariana
prezint un dezavantaj: valoarea sa este influenat de unitile de msur
ES
ale variabilelor i , ceea ce face dificil comparaia. Pentru a elimina
acest neajuns, este nevoie s se realizeze o standardizare a covarianei ( )
R

prin mprirea acesteia la produsul deviaiilor standard ale celor dou


FI

variabile ( ). Astfel, ctul acestei mpriri va lua valori de la 1 la 1


i va reprezenta coeficientul de corelaie Pearson:
M


ZA

Prin rearanjarea algebric a formulei se obine una mai uor de


folosit n practic:

Odat calculat valoarea coeficientului de corelaie se poate trece la


testarea semnificaiei acestuia care se face sub forma unui test. Testarea
semnificaiei arat n ce msur relaia surprins de coeficientul de corelaie
a probei ( ) este semnificativ la nivel de populaie ( ).
150 Elemente de statistic aplicate n ecologie
n funcie de ntrebarea cu privire la relaia dintre variabile (corelaie
semnificativ, corelaie semnificativ pozitiv i corelaie semnificativ
negativ) la care trebuie s rspund testul se aleg ipotezele ce vizeaz
coeficientul de corelaie n populaie:

Bilateral Unilateral
: 0 : 0 : 0
: 0 : 0 : 0.

Primul set de ipoteze se folosete dac se dorete evidenierea unei


corelaii semnificative n populaia din care s-a extras proba, fr a se
preciza semnul acesteia. Dac se urmrete punerea n eviden a unei

U
corelaii pozitive semnificative, se utilizeaz al doilea set de ipoteze, iar n
cazul n care se urmrete semnificaia unei corelaii negative, se folosete

C
ultimul set de ipoteze.
ES
Statistica testului este una de tip Student ( ) i se calculeaz cu
ajutorul numrului de perechi de valori i ( ) i cu valoarea
coeficientului de corelaie Pearson ( ):
R
FI

.
M
ZA

Condiia testului este similar cu cea a unui test , cu meniunea c


valoarea critic se alege n funcie de i de numrul gradelor de libertate
2.

Dac | | , se respinge, se accept pentru


1 .

Coeficientul de determinare
Valoarea coeficientului de corelaie Pearson ridicat la ptrat
reprezint o statistic util a datelor. Acesta arat proporia n care
variabilitatea uneia dintre cele dou variabile poate fi pus pe seama
variabilitii celeilalte. Coeficientul de determinare reprezint o proporie,
dar dac se nmulete cu 100, rezult procentul de valori ale celor dou
variabile care sunt realmente corelate. De exemplu, dac pentru dou
Corelaia i regresia 151
variabile oarecare 0,81, nseamn c 81% din valorile celor dou
variabile sunt realmente corelate. Coeficientul de determinare poate fi
considerat un descriptor standardizat al puterii corelaiei dintre dou
variabile.

Exemplul 9.1. La 24 de indivizi de viper de step extrai aleatoriu


din populaie s-a determinat lungimea trunchiului i greutatea. Exist o
corelaie pozitiv semnificativ ntre cele dou variabile?

Nr. crt. 1 2 3 4 5 6 7 8 9 10 11 12
cm (x) 49 150 153 146 164 66 160 215 228 222 260 325
g (y) 2,5 3,6 3,6 3,8 4 4,5 4,7 9,3 10,5 10,9 14 21

U
Nr. crt. 13 14 15 16 17 18 19 20 21 22 23 24
cm (x) 340 430 390 373 425 450 389 422 418 435 459 470

C
g (y) 22 30 33,5 38,4 40 41 46,3 49,8 53,3 57 72,2 76,7
ES
Inspectarea graficului de corelaie arat o relaie uor curb ntre cele
dou variabile, ceea ce nseamn c ultima condiie de aplicare a corelaiei
R

parametrice nu este respectat.


FI

90
M

80
ZA

70
60
50
y

40
30
20
10
0
0 100 200 300 400 500
x
152 Elemente de statistic aplicate n ecologie
n urma logaritmrii valorilor i n diferite combinaii se observ
c logaritmarea doar a valorilor greutilor ndreapt cel mai bine relaia
dintre cele dou variabile.

Nr, crt, 1 2 3 4 5 6 7 8 9 10 11 12
x 49 150 153 146 164 66 160 215 228 222 260 325
y=ln(y) 0,916 1,281 1,281 1,335 1,386 1,504 1,548 2,230 2,351 2,389 2,639 3,045
Nr, crt, 13 14 15 16 17 18 19 20 21 22 23 24
x 340 430 390 373 425 450 389 422 418 435 459 470
y=ln(y) 3,091 3,401 3,512 3,648 3,689 3,714 3,835 3,908 3,976 4,043 4,279 4,340

5
4.5

U
4
3.5

C
3
y'=ln(y)

ES
2.5
2
1.5
R

1
FI

0.5
0
M

0 100 200 300 400 500


ZA

n continuare, se calculeaz valoarea coeficientului de corelaie


Pearson dintre lungime i greutatea transformat:


, ,
0,975 .
, ,

Valoarea coeficientului arat c este vorba de o corelaie pozitiv


foarte puternic. Puterea corelaiei mai poate fi reflectat i de valoarea
coeficientului de determinare:

0,975 0,95 .
Corelaia i regresia 153
Valoarea coeficientului de determinare arat c 95% din valorile
celor dou variabile sunt realmente corelate.
Pentru a afla dac aceast corelaie evideniat la nivel de prob este
semnificativ i la nivel de populaie, trebuie efectuat testul de semnificaie
a corelaiei. Avnd n vedere modul de formulare a ntrebrii problemei,
ipotezele testului sunt:

: 0
: 0.

Se calculeaz statistica testului:

U
0,975 20,54 .

C
, ES
Se afl valoarea critic pentru un test unilateral (anexa 2 sau 3):

1,717 .
R

, ,
FI

Statistica testului este mai mare dect valoarea critic, deci se


respinge ipoteza nul i se accept ipoteza alternativ pentru o probabilitate
M

de 0,95 sau n 95% din cazuri.


ZA

Probabilitatea ca ipoteza nul s fie adevrat poate fi calculat


(anexa 3). Aceast probabilitate este foarte mic (3,8 10 ).
Concluzia testului este c exist o corelaie pozitiv i semnificativ

ntre lungimea corpului i greutate n populaia de vipere de step


investigat.

9.1.2. Analiza corelaiei neparametrice


n cazul n care datele nu respect condiiile corelaiei parametrice (x
i/sau y sunt apreciate pe o scal ordinal, valorile x i/sau y din prob nu
sunt aproximativ normal distribuite, relaia dintre variabile nu este liniar),
atunci se va calcula coeficientul de corelaie neparametric Spearman.
Acest coeficient, notat cu pentru prob i pentru populaie, a
fost obinut prin prelucrarea formulei coeficientului Pearson cnd n loc de
154 Elemente de statistic aplicate n ecologie
datele brute se folosesc rangurile acestora. Deci exist o legtur strns
ntre cei doi coeficieni.
Pentru a putea calcula valoarea este nevoie ca mai nti s se dea
ranguri valorilor lui ( ) i valorilor lui ( ), separat. Algoritmul de
acordare a rangurilor este similar cu cel folosit n celelalte teste
neparametrice (seciunea 2.1, tab. 2.3). Ulterior, se calculeaz diferenele
dintre rangurile corespunztoare fiecrei perechi de valori i , originale
( ), iar fiecare diferen se ridic la puterea a doua ( ). Ptratele
tuturor diferenelor se nsumeaz obinndu-se suma ptratelor diferenelor
( ). Formula de calcul a coeficientului Spearman include suma ptratelor
diferenelor i numrul perechilor de valori i ( ):

U

1 .

C
ES
Valoarea coeficientului Spearman are aceleai proprieti
informaionale ca i cea a coeficientului Pearson: ia valori ntre 1 i 1,
semnul valorii indic, dup caz, o corelaie pozitiv sau negativ; o valoare
R

egal cu 1 sau 1 semnific o corelaie maxim, n timp ce una egal cu 0


FI

arat absena corelaiei; apropierea valorii de 1indic o corelaie


puternic, n timp ce o valoare mai apropiat de 0, o corelaie slab.
M

Testarea semnificaiei n analiza corelaiei neparametrice se face la


ZA

fel ca n cazul corelaiei parametrice, cu deosebirea c la calcularea


statisticii testului ( ) n loc de valoarea coeficientului Pearson ( ) se
folosete valoarea coeficientului Spearman ( ):

Coeficientul Spearman pierde din precizie dac exist un numr


relativ mare de valori egale. n general, dac mai mult de jumtate din
ranguri au valori egale, atunci se recomand calcularea coeficientului de
corelaie a rangurilor conform formulei lui Pearson, n care se nlocuiesc
valorile originale cu rangurile acestora.
Corelaia i regresia 155
Exemplul 9.2. S se rezolve problema de la exemplul 9.1
considerndu-se c datele nu ndeplinesc condiiile de aplicare ale corelaiei
parametrice.

Pentru calcularea coeficientului de corelaie parametric trebuie date


ranguri valorilor originale ale lungimii i greutii, dup care se calculeaz
suma ptratelor diferenelor dintre rangurile fiecrei perechi , :

49 2,5 1 1 0 0
150 3,6 4 2,5 1.5 2,25
153 3,6 5 2,5 2.5 6,25

U
146 3,8 3 4 -1 1
164 4 7 5 2 4

C
66 4,5 2 6 -4 16
160 4,7 6 7 -1 1
ES
215 9,3 8 8 0 0
228 10,5 10 9 1 1
222 10,9 9 10 -1 1
R

260 14 11 11 0 0
FI

325 21 12 12 0 0
340 22 13 13 0 0
M

430 30 20 14 6 36
390 33,5 16 15 1 1
ZA

373 38,4 14 16 -2 4
425 40 19 17 2 4
450 41 22 18 4 16
389 46,3 15 19 -4 16

422 49,8 18 20 -2 4
418 53,3 17 21 -4 16
435 57 21 22 -1 1
459 72,2 23 23 0 0
470 76,7 24 24 0 0
130,5

Se calculeaz coeficientul de corelaie Spearman:


,
1 0,943 .
156 Elemente de statistic aplicate n ecologie
Acest rezultat arat c este vorba de o corelaie pozitiv foarte
puternic.

30
25
20

Ry 15
10
5

U
0
0 5 10 15 20 25 30
Rx
C
ES
Pentru testarea semnificaiei se aplic testul la fel ca n exemplul 9.1.
R

Se scriu ipotezele testului:


: 0
FI

: 0.
M

Se calculeaz statistica testului:


ZA

0,943 13,324 .
,

Se afl valoarea critic pentru testul unilateral (anexa 2 sau 3):

, , 1,717 .

13,324 1,717 se respinge i se accept pentru o


probabilitate de 0,95.

Probabilitatea ipotezei nule (anexa 3) este de 2,6 10 .


Concluzia testului este c exist o corelaie pozitiv semnificativ
ntre lungimea i greutatea viperelor de step din populaia studiat.
Corelaia i regresia 157

9.2. ANALIZA REGRESIEI

Analiza regresiei este similar n unele aspecte cu analiza corelaiei,


dar este diferit de aceasta prin faptul c presupune o relaie de tip cauz-
efect ntre variabila independent, aflat sub controlul cercettorului, i cea
dependent.
n esen, se presupune c ar exista o relaie funcional care permite
prezicerea unei valori a variabilei corespunztoare unei valori date a
variabilei independente , adic:

U
eroarea aleatoare.

C
n cazul regresiei liniare simple, relaia are urmtoarea form:
ES
media populaional a valorilor corespunztoare unei valori
R

coeficient de regresie nlimea dreptei de regresie


FI

coeficient de regresie panta dreptei de regresie.


M
ZA

y=+x
x
y


0 x
Figura 9.5. Explicaia grafic a funcie regresiei liniare
158 Elemente de statistic aplicate n ecologie
Analiza regresiei presupune urmtoarele aspecte:

1. Regresia este folosit pentru aproximarea unei ecuaii ce descrie


relaia liniar dintre 2 variabile. Aceasta se numete ecuaie sau
funcie de regresie. Parametrii i pot fi estimai pe baza unei
probe din populaie.
2. Pe baza ecuaiei se poate construi o dreapt de regresie.
3. Ecuaia de regresie poate fi folosit pentru aflarea valorilor
variabilei dependente ( ) corespunztoare valorilor variabilei
independente ( ).
4. Regresia poate fi folosit pentru a surprinde msura n care
variabila dependent se afl sub controlul variabilei independente.

U
Analiza regresiei presupune o serie de condiii:

C
ES
1. Variabila independent ( ) este fixat, adic valorile acesteia sunt
alese arbitrar i nu aleator din populaie.
2. Pentru orice valoare a variabilei independente ( ) exist o
R

populaie normal distribuit de valori ale variabilei dependente


FI

( ). Media populaional a valorilor lui este: .


3. Din condiia 2 rezult c pentru oricare valoare exist o valoare
M

particular :
ZA

4. .
5. reziduu sau eroare ntmpltoare; arat msura n care o
valoare observat a lui difer de media valorilor lui ( ); are

o distribuie normal standard.


6. Varianele variabilei pentru toate valorile variabilei sunt egale.
7. Observaiile sunt independente, adic fiecare pereche de valori
, provin prin investigarea unei singure uniti de prob.

Dac prima condiie nu este ndeplinit, atunci analiza regresiei nu


poate fi aplicat. n schimb, s-ar putea folosi analiza corelaiei.

Estimarea funciei i dreptei de regresie


Coeficienii de regresie, adic parametrii funciei, se estimeaz
pornind de la o prob, astfel i vor fi estimai prin i, respectiv, .
Corelaia i regresia 159
Dreapta descris de estimatorii i reprezint linia care se potrivete cel
mai bine funciei de regresie i care se mai numete i dreapt de regresie
estimat. Avnd n vedere c ecuaia definete dreapta, estimarea acestora
se va face n paralel.
Dreapta de regresie va trece ntotdeauna prin punctul de coordonate
, . Dac pe orizontala ce trece prin acest punct se traseaz perpendiculare
din fiecare punct de coordonate , , atunci fiecare perpendicular va
reprezenta abaterea valorilor lui fa de , adic . Suma acestor
abateri va fi aproximativ egal cu 0, dar suma ptratelor abaterilor va fi ns
mai mare dect 0 ( 0; 0). Deci se obine suma
ptratelor abaterilor lui fr a se ine cont de valorile lui (fig. 9.6).

U
C
ES
R
FI
M
ZA

Figura 9.6. Variaia variabilei dependente cnd variabila independent nu este luat

n consideraie

S presupunem c orizontala poate pivota n jurul punctului ,


astfel nct distanele de la valorile lui la dreapt s fie minime sau suma
ptratelor abaterilor valorilor lui fa de linie s fie minim (metoda celor
mai mici ptrate). Corespondenta unei anumite valori pe dreapt se
noteaz cu . Abaterea valorilor fa de linie va fi egal cu . Suma
ptratelor abaterilor lui fa de linie, cnd se ine cont i de valorile lui ,
va fi mai mic dect cea precedent, adic . n
concluzie, incertitudinea lui a fost redus prin luarea lui n consideraie.
160 Elemente de statistic aplicate n ecologie
Diferena dintre o valoare i corespondenta sa pe dreapta de regresie este
; are o distribuie normal i media egal cu 0, adic are o
distribuie normal standard (fig. 9.7).

U
C
ES
Figura 9.7. Variaia variabilei dependente cnd variabila independent este luat n
R

consideraie
FI

Estimarea funciei (ecuaiei) de regresie


M

Se calculeaz coeficienii de regresie i conform formulelor:


ZA

Estimarea funciei de regresie este:

Cu ajutorul funciei de regresie se calculeaz valorile


corespunztoare fiecrei valori . Trasarea dreptei de regresie se face unind
punctele de coordonate , .
Corelaia i regresia 161
Testarea semnificaiei funciei de regresie
Semnificaia ecuaiei de regresie estimate se face sub forma unei
analize a varianei (ANOVA).
Principiul de descompunere a variabilitii este urmtorul: variana
total ( ) este dat de variana extern sau de regresie ( ) plus variana
intern sau rezidual ( ):

Ipotezele testului sunt similare cu cele de la corelaie, doar c n


cazul regresiei se testeaz coeficientul de regresie (panta sau nclinaia
dreptei) pentru populaia din care a fost prelevat proba. Dac este zero,

U
atunci nseamn c variabila nu este dependent de (aceast proprietate

C
a lui este similar cu cea a coeficientului de corelaie populaional ).
ES
H0: =0
H1: 0
R

n continuare se calculeaz suma de ptrate total ( ), suma de


FI

ptrate extern ( ) i suma de ptrate intern ( ), conform


formulelor:
M
ZA

Se calculeaz sumele de ptrate medii ( ) ca raportul dintre sumele


de ptrate ( ) i gradele de libertate corespunztoare ( ). Gradele de
libertate externe reprezint diferena dintre numrul variabilelor considerate
( ) din care se scade 1. Gradele de libertate totale reprezint numrul
perechilor de valori , ( ) minus 1. Gradele de libertate interne se afl la
fel ca i suma de ptrate intern, adic din numrul gradelor de libertate
totale se scad cele externe ( 1 1 ). Raportul dintre suma de
ptrate medie extern i cea intern reprezint statistica testului ( ).
162 Elemente de statistic aplicate n ecologie

Sursa de variabilitate
Extern 1 /
Intern
Total 1

Condiia testului const n compararea statisticii testului ( ) cu o


valoare critic pentru un anumit nivel de ncredere i gradele de libertate
externe ( 1) i interne ( ).

Dac , , se respinge, se accept pentru

U
1 .

C
Intervalul de confiden al coeficientului de regresie
ES
Coeficientul de regresie n prob b este o estimare a coeficientului de
regresie populaional . Deci i sunt diferii, dar se poate calcula
intervalul de confiden pentru cu ajutorul erorii standard a lui ( ):
R
FI


.
M


ZA

Limitele inferioar ( ) i cea superioar ( ) ale intervalului de


confiden a lui se vor afla prin calcularea relaiei:

,
,
, .

n concluzie, intervalul - include coeficientul de regresie


populaional , cu o probabilitate de 1 sau 100 1 .

Coeficientul de determinare
Se tie c variana lui poate fi explicat n bun msur de
cunoaterea variabilei , totui o parte rmne neexplicat. Este vorba de
Corelaia i regresia 163
variana intern. Dac valorile lui ar fi complet dependente de valorile lui
, atunci erorile aleatoare ( ) ar fi egale cu zero, adic toate punctele de
coordonate , ar fi exact pe dreapta de regresie.
n cazul analizei regresiei, coeficientul de determinare ( ) arat
proporia varianei lui explicat prin dependena de .
Formula de calcul a lui este la fel ca n cazul analizei corelaiei.
Totui, pentru a simplifica calculul i pentru a folosi valori deja calculate n
etapele anterioare ale analizei regresiei, se poate calcula i dup
urmtoarea formul:

U
Ca i n cazul analizei corelaiei, valoarea coeficientului de

C
determinare se poate nmuli cu 100 pentru a obine un procent, care, n
ES
analiza regresiei, arat ct la sut dintre valorile lui sunt dependente sau
determinate de valorile lui . Diferena 100 % arat variana individual
sau rezidual care nu poate fi explicitat de valorile lui .
R
FI

Zona de confiden a dreptei de regresie


Limitele de confiden ale dreptei de regresie se pot afla calculnd
M

eroarea standard pentru fiecare punct de coordonate , de pe dreapt,


pentru fiecare valoare a lui din prob. Pentru fiecare valoare se
ZA

calculeaz eroarea standard :


Limitele inferioar ( ) i superioar ( ) ale intervalului de


confiden a fiecrui corespunztor unei valori din prob se calculeaz
pornind de la relaia:

,
,
, .
164 Elemente de statistic aplicate n ecologie
Concluzia va fi c intervalele - pentru fiecare valoare x includ
mediile populaiilor de valori ( ) cu o probabilitate de 1 .
Unirea limitelor inferioare ntre ele i a celor superioare ntre ele,
obinute pentru fiecare valoare , duce la reprezentarea grafic a zonei de
confiden a dreptei n ansamblu (fig. 9.8). Deci dreapta de regresie n
populaia din care s-a extras proba se poate gsi ntre liniile ce unesc
limitele inferioare i cele superioare, cu o probabilitate de 1 .

Limitele de confiden ale unei estimri individuale


Estimarea unei valori pentru o valoare individual x care nu se
regsete n prob poate fi afectat de o surs de eroare adiional, anume de
mprtierea fa de dreapt. Astfel, intervalul de confiden pentru o

U
valoare va fi mai larg dect cel al dreptei de regresie. Intervalul se afl

C
folosind relaiile de mai sus, doar c se modific formula erorii standard a
unui punct de pe dreapt prin adugarea unei uniti la valoarea dintre
ES
parantezele ptrate.
R

1
FI

Limita inferioar ( ) i cea superioar ( ) a intervalului de


ZA

confiden pentru o valoare corespunztoare unei valori x din prob se


calculeaz pornind de la relaia:

,
,
, .

Concluzia va fi c intervalul - pentru o valoare include media


populaiei de valori ( ) cu o probabilitate de 1 .
Unirea limitelor inferioare ntre ele i a celor superioare ntre ele,
obinute pentru fiecare valoare , duce la reprezentarea grafic a zonei de
confiden pentru estimarea lui pornind de la o valoare unic (fig. 9.8).
Corelaia i regresia 165

zona de confiden a
dreptei de regresie

intervalul de confiden al lui


y
pentru o singur valoare x

U
x

C
Figura 9.8. Zona de confiden a dreptei de regresie i pentru o valoare unic
ES
Abordarea relaiilor neliniare
Numeroase relaii dintre variabile biologice nu sunt rectilinii. Un
R

exemplu n acest sens l constituie creterea populaiilor i relaia dintre


mortalitate i vrst.
FI

n astfel de cazuri, relaiile curbilinii pot fi ndreptate prin


M

transformarea datelor (seciunea 4.5 Transformarea datelor).


La nceput trebuie observat care din cele dou variabile trebuie
ZA

transformat. Aceasta se poate face prin ncercri repetate, adic prin


reprezentarea grafic a corelaiei cu cte o variabil transformat sau cu
amndou.

O alt modalitate const n calcularea pentru fiecare transformare


alternativ ( , ; , ; , ; , ). Transformarea care va duce la obinerea
valorii celei mai mari a va fi folosit n analiza regresiei.
Transformarea variabilelor determin i modificarea funciei:

dac , atunci i ;
dac i , atunci .

Dac se apeleaz la o transformare a datelor, se impune n final o


transformare invers a rezultatelor (coeficieni de regresie, limitele
intervalelor de confiden).
166 Elemente de statistic aplicate n ecologie
Exemplul 9.3. S se afle dac exist o relaie de tip cauz-efect
semnificativ ntre lungimea i greutatea viperelor din exemplul 9.1,
considernd c proba a fost selectat astfel nct indivizii s aib anumite
greuti. S se estimeze intervalul de confiden al greutii pentru un
individ la care lungimea este de 30 .
Deoarece existena unei relaii liniare reprezint o condiie a
regresiei, se vor lua n consideraie valorile transformate prin logaritmare ale
greutii.
n continuare se estimeaz coeficienii funciei de regresie:

Nr. Crt. cm (x) ln(g) (y) xy


1 49 0,916 44,898

U
2 150 1,281 192,140
3 153 1,281 195,983

C
4 146 1,335 194,910
5 164 1,386 227,352
ES
6 66 1,504 99,269
7 160 1,548 247,610
8 215 2,230 479,453
R

9 228 2,351 536,114


FI

10 222 2,389 530,305


11 260 2,639 686,155
M

12 325 3,045 989,470


13 340 3,091 1050,954
ZA

14 430 3,401 1462,515


15 390 3,512 1369,503
16 373 3,648 1360,725
17 425 3,689 1567,774

18 450 3,714 1671,107


19 389 3,835 1491,870
20 422 3,908 1649,182
21 418 3,976 1661,941
22 435 4,043 1758,727
23 459 4,279 1964,263
24 470 4,340 2039,754
Suma 7139 67,341 23471,976
Media 297,458 2,806
(Suma)2 50965321 4534,757
Suma de ptrate 2546985 218,368
Corelaia i regresia 167
,
,
0,00813
2,806 0,00813 297,458 0,3886 .

Deci ecuaia dreptei de regresie sau funcia de regresie este:

0,3886 0,00813 .

Estimarea funciei de regresie se face prin ANOVA. Ipotezele


testului sunt:

H0: =0

U
H1: 0 .

Se calculeaz sumele de ptrate:


C
ES
,
218,368 29,42
R

,
0,00813 23471,976 27,96
FI

29,42 27,96 1,46 .


M

Se calculeaz numrul gradelor de libertate:


ZA

24 1 23
2 1 1

24 2 22 .

Se calculeaz sumele de ptrate medii:


, ,
27,96 0,0663 .

Se calculeaz statistica testului:


,
422,05 .
,
168 Elemente de statistic aplicate n ecologie
Se completeaz tabelul Anova:

Sursa de variabilitate
Extern 27,96 1 27,96 422,05
Intern 1,46 22 0,0663
Total 29,42 23

Se afl valoarea critic (anexa 2 sau 3):

, , , 4,301 .

Statistica testului este mai mare dect valoarea critic, deci se

U
respinge ipoteza nul i se accept ipoteza alternativ pentru o probabilitate

C
de 0,95. Probabilitatea calculat a ipotezei nule pentru statistica testului
(anexa 3) este 7,6 10 .
ES
Concluzia testului este c exist o relaie de tip cauz-efect
semnificativ ntre cele dou variabile, definit de funcia de regresie
R

estimat.
FI

Cu ajutorul funciei de regresie se pot calcula valorile estimate


pentru valorile . Prin punctele de coordonate , se poate trasa dreapta de
M

regresie. Valoarea pentru prima valoare 49 se calculeaz astfel:


ZA

0,3886 0,00813 49 0,7868 .


La fel se procedeaz i pentru celelalte valori ale variabilei .


Pentru a construi zona de confiden a dreptei de regresie trebuie
reprezentate grafic limitele intervalului de confiden ale mediei populaiei
de valori corespunztoare fiecrei valori . Pentru aceasta este nevoie s
se afle valoarea critic , , (anexa 2 sau 3):

, , 2,074 .

Limitele intervalului de confiden pentru prima valoare 49 se


calculeaz astfel:
Corelaia i regresia 169

,
0,7868 2,074 0,0663 0,5557

,
0,7868 2,074 0,0663 1,0179 .

La fel se procedeaz i pentru celelalte valori ale variabilei .

cm ( ) ln(g) ( )
49 0,9163 0,7868 0,1114 0,5557 1,0179
150 1,2809 1,6076 0,0785 1,4448 1,7704

U
153 1,2809 1,6319 0,0776 1,4709 1,7929
146 1,3350 1,5751 0,0797 1,4098 1,7403

C
164 1,3863 1,7213 0,0745 1,5669 1,8758
66 1,5041 0,9249 0,1056 0,7060 1,1439
ES
160 1,5476 1,6888 0,0756 1,5320 1,8456
215 2,2300 2,1358 0,0618 2,0075 2,2640
228 2,3514 2,2414 0,0593 2,1185 2,3644
R

222 2,3888 2,1927 0,0604 2,0673 2,3180


FI

260 2,6391 2,5015 0,0546 2,3882 2,6147


325 3,0445 3,0297 0,0537 2,9184 3,1410
M

340 3,0910 3,1516 0,0552 3,0372 3,2660


430 3,4012 3,8829 0,0742 3,7290 4,0369
ZA

390 3,5115 3,5579 0,0640 3,4251 3,6907


373 3,6481 3,4197 0,0604 3,2944 3,5451
425 3,6889 3,8423 0,0728 3,6912 3,9934
450 3,7136 4,0455 0,0800 3,8795 4,2114

389 3,8351 3,5498 0,0638 3,4174 3,6821


422 3,9080 3,8179 0,0720 3,6686 3,9673
418 3,9759 3,7854 0,0710 3,6383 3,9326
435 4,0431 3,9236 0,0756 3,7667 4,0804
459 4,2794 4,1186 0,0827 3,9470 4,2902
470 4,3399 4,2080 0,0861 4,0294 4,3866

Pentru a afla intervalul de confiden al mediei populaiei de valori


pentru 300 se calculeaz relaiile:

0,3886 0,00813 300 2,8265


170 Elemente de statistic aplicate n ecologie

,
2,8265 2,074 0,0663 1

2,2295
,
2,8265 2,074 0,0663 1

3,4235 .

Valorile obinute sunt modificate de transformarea iniial a


greutilor. Pentru a obine valorile n grame este necesar transformarea
invers (anexa 3) a valorilor obinute:

U
C
16,8864 9,2956
ES 30,6760 .

Concluzia este c o viper de 300 poate avea o greutate ntre


9,3 i 30,7 cu o probabilitate de 0,95 sau n 95% din cazuri.
R

4.5
FI

4
M

3.5
ZA

3
y'=ln(y)

2.5


2 Li

1.5 Ls
300 cm
1

0.5
0 100 200 300 400 500
x
10. ANALIZA FRECVENELOR I A DATELOR
NOMINALE

Numeroase cercetri ecologice presupun numrarea i clasificarea


lucrurilor folosind diferite scale nominale, cum ar fi speciile, culorile,
habitatele etc. Din aceast cauz tehnicile statistice care analizeaz
frecvenele sunt deosebit de utile. Metoda clasic de analiz a frecvenelor
este testul . Statistica testului este comparat cu distribuia . Acesta

U
este o distribuie a varianei probei. Distribuia este asimetric fa de

C
variana populaional ( ). Partea stng a distribuiei ajunge la 0, n timp
ce cea dreapt poate atinge, teoretic, infinitul. Cu ct numrul gradelor de
ES
libertate crete, cu att distribuia devine mai simetric, iar n cazul probelor
cu mai mult de 100 de uniti de prob ( 100) distribuia tinde s devin
R

normal.
mprirea frecvenelor la numrul total de observaii duce la
FI

transformarea distribuiei frecvenelor ntr-o distribuie a probabilitilor.


M

Standardizarea axei orizontale prin nmulirea varianei cu numrul gradelor


de libertate i mprirea produsului la variana populaiei duce la obinerea
ZA

distribuiei .

1 gl

3 gl
f
10 gl

s2
Figura 10.1. Distribuia varianei probei pentru 1, 3 i 10 grade de libertate
172 Elemente de statistic aplicate n ecologie

9 gl

p=0,05
p=0,95

U
C
16,92 2
ES
Figura 10.2. Distribuia 2 cu zona de respingere a ipotezei nule pentru o probabilitate
de 0,05
R

Testele pot fi pentru omogenitate, asociere, independen i de


FI

concordan. Principiul acestor teste este acelai: frecvenele observate sunt


comparate cu cele calculate teoretic sau estimate. Dac ntre frecvenele
M

observate i cele estimate exist o diferen semnificativ, atunci statistica


va fi mai mare dect valoarea critic pentru gradele de libertate
ZA

respective, caz n care se respinge, iar se accept n consecin cu


1 .
Distribuia este una asimetric. O diferen mare ntre frecvenele

observate i cele estimate va conduce la o valoare a plasat n coada din


dreapta a distribuiei. Dac ns se obine o valoare foarte mic plasat n
coada stng (redus) a distribuiei, aceasta arat c frecvenele observate
concord foarte bine cu cele teoretice. Dat fiind faptul c sunt anse reduse
s se obin valori foarte mici sau foarte mari, n practic interesul const
doar n a arta absena concordanei.
Dificultatea testului nu const att n calcularea statisticii acestuia,
ct n calcularea frecvenelor estimate (teoretice). Acestea se pot afla
pornind de la datele din prob sau pe baza unui model matematic.
Analiza frecvenelor i a datelor nominale 173

10.1. TESTUL DE CONCORDAN

Acesta verific dac distribuia frecvenelor observate n probe


concord sau nu ntr-o oarecare msur cu o distribuie teoretic, cum ar fi
Poisson, binomial sau normal, sau cu orice alt tip specificat de distribuie.
Testul de concordan verific ct de bine se potrivete un set de
frecvene observate aparinnd la dou sau mai multe categorii distincte cu o
anumit distribuie ateptat. Testul este neparametric i necesit doar
observaii nominale sau sub form de frecvene.

Testul se folosete dac datele ndeplinesc urmtoarele condiii:

U
1. Variabila trebuie s fie nominal; categoriile scalei nominale ale

C
cror frecvene sunt urmrite trebuie s nu se suprapun.
ES
2. Observaiile sunt independente.
3. Frecvenele estimate trebuie s fie mai mari sau egale cu 5 sau,
dac exist mai multe categorii, 80% dintre acestea trebuie s aib
R

frecvenele estimate mai mari sau egale cu 5.


FI

Dac a treia condiie nu este ndeplinit, categoriile cu frecvenele


M

estimate mai mici de 5 se reunesc ntr-o singur categorie pn cnd


frecvena estimat a acesteia egaleaz sau depete valoarea 5. Aceasta
ZA

determin o reducere corespunztoare a gradelor de libertate.


Ipotezele testului sunt:

: frecvenele observate nu difer semnificativ de cele estimate;


: frecvenele observate difer semnificativ de cele estimate.

Statistica testului se calculeaz n funcie de frecvenele observate


( ) i cele estimate ( ):

Dac , se respinge i se accept pentru o


probabilitate de 1 (100 1 %).
174 Elemente de statistic aplicate n ecologie

1
numrul categoriilor (claselor de frecven)
numrul parametrilor populaionali estimai.

Dac frecvenele teoretice se obin prin folosirea modelului Poisson,


atunci 1 deoarece se estimeaz media populaiei necesar calculului
probabilitii n aceast distribuie (seciunea 4.2), iar dac se folosete
modelul binomial sau binomial negativ, atunci 2 deoarece se estimeaz
i (seciunile 4.1 i, respectiv, 4.3).
Cnd exist doar dou categorii de distribuie, atunci vom avea 1
grad de libertate ( 1), iar statisticii testului i se aplic corecia Yates

U
pentru continuitate. Aceasta nltur posibilitatea obinerii unor valori prea
mari ale statisticii testului. Corecia const n scderea valorii 0,5 din

C
valoarea absolut a diferenei dintre frecvena observat i cea teoretic a
ES
fiecrei componente a formulei lui . Astfel, formula devine:

| |
R
,
.
FI

Exemplul 10.1. ntr-o prob extras aleator de pe fundul unui bazin


M

acvatic au fost identificate 16 larve ale unei specii de chironomid. Larvele


au fost crescute pn la stadiul de adult, dup care s-a determinat sexul
ZA

indivizilor, rezultnd 12 masculi i 4 femele. Exist o diferen


semnificativ ntre raportul dintre sexe (sex ratio) observat i cel de 1:1?

Sexul este o variabil nominal ale crei categorii se exclud reciproc.


Observaiile sunt independente. Dac sex ratio ar fi egal cu 1, atunci
frecvenele estimate ale celor dou sexe ar trebui s fie egale, adic din 16
indivizi, 8 ar trebui s fie masculi, iar 8 s fie femele. Putem concluziona c
datele ndeplinesc condiiile de aplicare ale testului 2 de concordan.

Ipotezele n cazul exemplului sunt urmtoarele:

: sex ratio este egal cu 1, adic : 1: 1;


: sex ratio este diferit de 1.
Analiza frecvenelor i a datelor nominale 175

Frecvene Frecvene
observate ( ) estimate ( )
Masculi 12 8
Femele 4 8
Total 16 16

Cum sunt doar dou categorii de frecvene (dou valori ale


variabilei) nseamn c numrul gradelor de libertate va fi 1. Ca urmare,
trebuie aplicat formula cu corecia pentru continuitate.

| | , | | ,
3,0625

U
C
Valoarea critic , , 3,84 (anexa 2 sau 3). Deoarece statistica
ES
testului este mai mic dect valoarea critic, nu se poate respinge ipoteza
nul pentru 0,05. Probabilitatea ca ipoteza nul s fie adevrat (anexa
3) este 0,08, adic mai mare dect pragul de confiden de 0,05.
R

Concluzia testului este c nu exist o deosebire semnificativ ntre


FI

sex ratio observat i cel teoretic de 1:1.


M

Exemplul 10.2. Pornind de la datele i rezultatele din exemplul 4.6


s se verifice semnificaia concordanei dintre frecvenele estimate i cele
ZA

teoretice.

Era vorba de densitatea indivizilor unei specii de arpe din 100 de


suprafee de prob. Indicele de dispersie indic o dispersie aleatoare. S-au


calculat frecvenele observate pe baza probabilitilor estimate conform
distribuiei Poisson.
Dac primele condiii de aplicare a testului de concordan sunt
ndeplinite, se observ c ultima nu este ndeplinit frecvenele estimate
pentru valorile 6, 7 i 8 sunt mai mici dect valoarea 5. Pentru a putea
continua testul se impune nsumarea frecvenelor, att observate, ct i
estimate, corespunztoare acestor valori. Ca urmare, frecvenele estimate i
cele teoretice se prezint astfel:
176 Elemente de statistic aplicate n ecologie

0 7 5,727
1 16 16,379 0 7 5,727
2 25 23,422 1 16 16,379
3 18 22,329 2 25 23,422
4 16 15,965 3 18 22,329
5 10 9,132 4 16 15,965
6 5 4,353 5 10 9,132
7 2 1,778 6+7+8 8 6,767
8 1 0,636

U
Statistica testului se poate afla calculnd valoarea raportului pentru
fiecare pereche de frecvene, dup care se nsumeaz.

C
ES
, , , ,
, , , ,
, , ,
1,544
R

, , ,
FI

Numrul gradelor de libertate se reduce datorit nsumrii ultimelor


trei clase de frecven. Astfel, din numrul de clase redus se scade 1 (a fost
M

estimat media populaional prin media probei pentru calcularea funciei


ZA

distribuiei Poisson) i nc 1:

7 1 1 5.

Valoarea critic n cazul acestui exemplu (anexa 2 sau 3) este


, , 11,07. Deoarece statistica testului este mai mic dect valoarea
critic, se accept ipoteza nul pentru 0,95. Probabilitatea ca ipoteza
nul s fie adevrat (anexa 3) este 0,91, adic foarte mare.
Conform ipotezei nule nu exist o diferen semnificativ ntre
frecvenele observate i cele estimate conform distribuiei Poisson.
Cum distribuia Poisson descrie probabilitatea de apariie a unor
fenomene aleatoare, iar distribuia frecvenelor observate nu difer
semnificativ de aceast distribuie, se poate concluziona c distribuia
indivizilor din populaia cercetat este aleatoare, cu o probabilitate de 0,95.
Analiza frecvenelor i a datelor nominale 177
n exemplul 4.6 spuneam c exist o asemnare evident ntre
frecvenele observate i cele estimate. Prin realizarea testului de
concordan s-a completat rezolvarea problemei, n sensul c se poate
specifica faptul c asemnarea sesizat anterior este semnificativ pentru un
anumit nivel de ncredere.

10.2. TESTUL DE ASOCIERE

n analiza concordanei dintre frecvenele observate i cele calculate


teoretic, era urmrit o singur variabil a crei valori apreciate pe o scal
nominal reprezentau categorii de frecven. Exist ns situaii n care se

U
folosesc dou variabile. De exemplu, un individ poate fi clasificat n funcie
de sex i clas de vrst, specie i habitat etc. n astfel de cazuri, frecvenele

C
se distribuie pe dou sau mai multe rnduri, rezultnd aa-numitul tabel sau
ES
matrice de contingen. Acestea permit investigarea asocierii dintre
variabile. Unul dintre cele mai frecvent utilizate teste care verific
semnificaia asocierii dintre variabilele apreciate pe o scal nominal este
R

testul de asociere. Acesta reprezint echivalentul corelaiei pentru


FI

variabilele nominale.
M

Condiii de aplicare:
ZA

1. Datele trebuie s fie sub form de frecvene.


2. Observaiile sunt independente (o unitate de prob poate ocupa o
singur poziie n matricea de contingen).

3. 80% dintre frecvenele estimate trebuie s fie mai mari sau egale
cu 5 i nici o frecven estimat s nu fie 0; deci, pentru o matrice
de contingen de 2 2, toate celulele trebuie s aib o valoare
calculat teoretic mai mare sau egal cu 5.

Ipotezele testului sunt:

: nu exist asociere ntre variabile


: exist asociere ntre variabile.
178 Elemente de statistic aplicate n ecologie
Datele se aranjeaz ntr-un tabel cu dou intrri, numit i matrice de
contingen:

Variabila (Coloan)
Total pe rnd ( )
Valori ( ) ( )
( )
(Rnd) ( )
Total general ( )
Total pe coloan ( )

Valorile teoretice se calculeaz pentru fiecare celul n parte. De


exemplu, valoarea estimat pentru prima celul este:

U
C

.
ES
La fel se procedeaz i pentru celelalte celule ale matricei de
contingen:
R
FI
M
ZA

Statistica testului se calculeaz conform formulei:

.
Analiza frecvenelor i a datelor nominale 179
Dac matricea de contingen are dou linii i dou coloane, atunci
se utilizeaz corecia Yates pentru continuitate, la fel ca n cazul testului
de concordan.

| | ,

Dac , se respinge i se accept pentru


o probabilitate de 1 .

Cnd exist mai multe categorii nominale ale celor dou variabile
analizate, atunci matricea de contingen poate avea mai mult de dou

U
rnduri i dou coloane. n acest caz, metoda de calcul a frecvenelor
estimate i a statisticii testului este aceeai cu cea folosit pentru o matrice

C
de contingen cu dou rnduri i dou coloane ( ), cu excepia
ES
faptului c n formula de calcul a statisticii testului nu se mai aplic corecia
Yates pentru continuitate.
R

Exemplul 10.3. Se crede ca femelele unei specii de arpe acvatic


FI

dintr-un lac migreaz toamna n apropierea blilor adiacente pentru


depunerea pontei. Dac este aa, atunci femelele ar trebui sa migreze mai
M

intens dect masculii. Dac din 27 de femele 25 au migrat i 2 nu au migrat,


iar din 34 de masculi 4 au migrat, iar 30 nu, exista o asociere semnificativ
ZA

ntre migraie i sex?

Datele sunt sub form de frecvene, iar erpii pot aparine doar la una

din cele dou categorii definite de valorile variabilei nominale sex. Deci
primele dou condiii de aplicare a testului sunt respectate de datele obinute
n urma analizei probelor.
Se alctuiete tabelul de contingen:

Variabila Migraia
Valori Migratori Nemigratori
Femel 25 2 27
Sex
Mascul 4 30 34
29 32 =61
180 Elemente de statistic aplicate n ecologie

Se calculeaz valorile estimate:

SexMigraia
Migratori 25 (2729)/61=12,8360
Femel
Nemigratori 2 (2732)/61=14,1639
Migratori 4 (3429)/61=16,1639
Mascul
Nemigratori 30 (3432)/61=17,8360

Frecvenele teoretice ( ) sunt toate mai mari ca 5, deci este


ndeplinit i condiia a treia a testului de asociere.
Ipotezele testului sunt:

U
C
: nu exist asociere semnificativ ntre migraie i sex
: exist o asociere semnificativ ntre migraie i sex.
ES
Dat fiind c numrul gradelor de libertate este 1 ( 1 1
R

2 1 2 1 ) se aplic formula cu corecia pentru continuitate.


FI

| , | , | , | , | , | ,
, , ,
M

| , | ,
36,2484
,
ZA

Se afl valoarea critic (anexa 2 sau 3): , , 3,841.


Statistica testului este mai mare dect valoarea critic i, n


consecin, ipoteza nul se respinge i se accept ipoteza alternativ pentru o
probabilitate 0,05 (95%). Probabilitatea ca ipoteza nul s fie
adevrat este de 1,7 10 .
Se poate trage concluzia c exist o asociere semnificativ ntre sex
i migraie n populaia de erpi de ap analizat.

Exemplul 10.4. ntr-un studiu s-a investigat preferina pentru habitat


a larvelor aparinnd la trei specii de insecte ( , , ), prin prelevarea
aleatoare a pupelor din trei ape curgtoare cu grade diferite de eutrofizare
Analiza frecvenelor i a datelor nominale 181
(oligotrofic, mezotrofic i eutrofic). Exist o asociere semnificativ ntre
preferina pentru un anumit tip de habitat i apartenena specific?

Datele sunt sub form de frecvene, iar o pup poate aparine doar la
o singur specie i poate proveni doar dintr-o singur ap curgtoare. Deci
primele dou condiii ale testului de asociere sunt ndeplinite.
Se scrie matricea de contingen 3 3.

Variabila Habitat
Valori Oligotrofic Mezotrofic Eutrofic
10 12 35 57
Specia 7 26 11 44

U
28 13 9 50

C
45 51 55 =151
ES
Se calculeaz valorile estimate:
R

sp. Habitat
Oligotrofic 10 (4557)/151=16,9868
FI

Mezotrofic 12 (5157)/151=19,2517
M

Eutrofic 35 (5557)/151=20,7614
Oligotrofic 7 (4544)/151=13,1126
ZA

Mezotrofic 26 (5144)/151=14,8609
Eutrofic 11 (5544)/151=16,0265
Oligotrofic 28 (4550)/151=14,9007

Mezotrofic 13 (5150)/151=16,8874
Eutrofic 9 (5550)/151=18,2119

Frecvenele teoretice ( ) sunt toate mai mari ca 5, deci este


ndeplinit i condiia a treia a testului de asociere.
Ipotezele testului sunt:

: nu exist asociere semnificativ ntre apartenena specific i


tipul de habitat
: exist o asociere semnificativ ntre apartenena specific i tipul
de habitat.
182 Elemente de statistic aplicate n ecologie
Numrul gradelor de libertate este 4 ( 1 1 3 1 3
1 ). Astfel, se aplic formula statisticii testului fr corecia pentru
continuitate.

, , , ,
, , , ,
, , , ,
, , , ,
,
45,2155
,

Se afl valoarea critic (anexa 2 sau 3): , , 9,488.

U
Valoarea statisticii testului este mai mare dect valoarea critic,

C
ipoteza nul se respinge i se accept ipoteza alternativ pentru o
probabilitate 0,05 (95%). Probabilitatea ca ipoteza nul s fie
ES
adevrat este 8,3 10 , deci foarte mic.
Se poate trage concluzia c exist o asociere semnificativ ntre
R

apartenena specific i gradul de eutrofizare al habitatelor.


FI

Pentru a determina care dintre speciile analizate este asociat cu un


anumit grad de eutrofizare, trebuie comparate valorile observate cu cele
M

estimate (ateptate, dac nu ar fi existat nici o preferin pentru habitat):


ZA

pentru specia , frecvena observat a fost mai mare dect cea estimat n
apele eutrofe; pentru specia , frecvena observat a depit-o pe cea
estimat n apele mezotrofe; pentru specia , frecvena observat a fost mai

mare dect cea estimat n apele oligotrofe.


Din acest exemplu se poate trage i o concluzie de ordin general:
unde frecvenele observate sunt mai mari dect cele estimate nseamn c
exist o asociere pozitiv ntre cele dou variabile i invers, unde frecvenele
estimate sunt mai mari dect cele observate nseamn c exist o asociere
negativ ntre variabile.
Analiza frecvenelor i a datelor nominale 183

10.3. TESTUL EXACT AL LUI FISHER

Este asemntor cu testul pentru asociere i se folosete pentru


testarea asocierii dintre dou variabile nominale. Diferena dintre cele dou
teste const n faptul c testul Fisher nu prevede a treia condiie de aplicare a
testul . Primele dou condiii (privind datele sub form de frecvene i
independena probelor) trebuie ndeplinite. Acest test este foarte util pentru
analiza probelor de dimensiuni mici. Un alt avantaj fa de testul se
refer la faptul c testul Fisher se poate aplica i n variant unilateral.
Pentru calcularea testului, datele trebuie ordonate ntr-o matrice de

U
contingen:

C
Valoarea
ES
Total
variabilei
prezent absent
Rnd ( )
( ) ( )
R

prezent ( )
FI

absent ( )
M

Total coloan ( )
ZA

Ipotezele testului sunt:


Bilateral Unilateral
: nu exist : indivizii care prezint nu au tendina s
asociere ntre i . prezinte , iar cei care nu prezint au tendina s
prezinte .
: exist asociere : indivizii care prezint au tendina s
ntre i . prezinte i , iar cei care nu prezint au tendina
s nu prezinte nici .

Deosebirea ntre ipotezele bilaterale i cele unilaterale, n cazul


testului Fisher, este similar cu cea dintre aceleai ipoteze n situaia unei
analize a corelaiei: ipotezele bilaterale ale testului Fisher sunt analoage
184 Elemente de statistic aplicate n ecologie
ipotezelor privind nonexistena sau existena unei asocieri ntre dou
variabile, fr a preciza tipul corelaiei; ipotezele unilaterale ale testului
Fisher sunt similare ipotezelor care specific tipul corelaiei (pozitiv sau
negativ).
Se scriu apoi toate matricele posibile pentru aceleai totaluri
marginale, adic se modific frecvenele , , , i astfel nct , ,
, i s rmn constante. Astfel, rezult o serie de matrice n
care la un capt poziia va avea o valoare minim, iar la cellalt va avea o
valoare maxim.
Se calculeaz disproporionalitatea pentru fiecare matrice obinut,
dup relaia:

U
.

C
ES
Se calculeaz probabilitatea ( ) pentru fiecare matrice a crei
disproporii ( ) este mai mare sau egal cu disproporia matricei iniiale,
conform relaiei
R

! ! ! !
FI

.
! ! ! ! !
M

Suma probabilitilor acestor matrice reprezint probabilitatea ca


ZA

s fie adevrat. Se respinge ipoteza nul dac suma probabilitilor este mai
mic dect pragul de semnificaie (0,05).
Dac testul se aplic n varianta bilateral, atunci se nsumeaz
probabilitile date de toate matricele din ambele capete ale seriei cu

disproporionalitatea mai mare sau egal cu cea a matricei iniiale. Cnd se


formuleaz ipoteze unilaterale, atunci se nsumeaz doar probabilitile
matricelor dintr-o singur parte a seriei, ale cror disproporionalitate este
mai mare sau egal cu cea a matricei iniiale.

Exemplul 10.5. ntr-un experiment s-a urmrit dac juvenilii unei


specii de arpe tind s prezinte o reacie de fug la un stimul amenintor de
deasupra sau din lateral. Ca urmare, 7 erpi au fost stimulai de deasupra
capului, iar ali 7, din lateral i s-au nregistrat tentativele de scpare.
Analiza frecvenelor i a datelor nominale 185
n aceast situaie este vorba de dou probe independente, deoarece
un individ a fost supus unui singur tratament (a fost stimulat fie de deasupra,
fie din lateral), i de categorii care se exclud reciproc (au prezentat reacia
sau nu au prezentat-o). n aceste condiii, pentru a realiza testarea, datele
trebuie aranjate ntr-un tabel de contingen. Acesta poate fi alctuit astfel
nct s reflecte dac se urmrete o ipotez bilateral sau unilateral:

Tabel de contingen pentru varianta bilateral


Reacie prezent Reacie absent
Stimul de deasupra 6 1
Stimul din lateral 1 6

Tabel de contingen pentru varianta unilateral

U
Reacie de scpare

C
da Nu
da 6 1
ES
Stimul de deasupra capului
nu 1 6

Dac se calculeaz frecvenele estimate conform testului de


R

asociere, se observ c toate acestea sunt mai mici dect 5 (frecvenele


FI

estimate sunt egale cu 3,5), deci condiia a treia a testului nu este


ndeplinit. Ca urmare, testul de asociere nu poate fi aplicat pentru acest
M

exemplu.
ZA

Ipotezele testului:

Bilateral Unilateral

: nu exist asociere ntre : indivizii care au fost stimulai de


stimulare i apariia reaciei. deasupra nu tind s prezinte reacia de
scpare.
: exist asociere ntre : indivizii care au fost stimulai de
stimulare i apariia reaciei. deasupra tind s manifeste o reacie de
scpare.

Indiferent de varianta n care se aplic testul, trebuie scris seria de


matrice. Cel mai simplu este ca la valoarea din poziia s se adune cte o
unitate pn se ajunge la captul din dreapta al seriei, iar apoi din aceeai
186 Elemente de statistic aplicate n ecologie
valoare s se scad cte o unitate pn se obine captul din stnga al seriei.
n funcie de valoarea i totalurile marginale se completeaz celelalte
poziii ale matricelor.

#1 #2 #3 #4
0 7 1 6 2 5 3 4
7 0 6 1 5 2 4 3
, 0,42 0,14

#5 #6 #7 #8
4 3 5 2 6 1 7 0
3 4 2 5 1 6 0 7

U
0,14 0,42 ,

C
ES
Matricele care au mai mare sau egal cu matricei iniiale (#7)
sunt matricele #1, #2 i #8. Deci pentru acestea se vor calcula
R

probabilitile:
FI

! ! ! !
#1 0,00029
! ! ! ! !
M

! ! ! !
#2 0,01427
! ! ! ! !
ZA

! ! ! !
#8 0,00029 .
! ! ! ! !

Pentru a calcula probabilitatea ipotezei nule este nevoie i de


probabilitatea dat de matricea iniial:


! ! ! !
#7 0,00029 .
! ! ! ! !

Dac testul se aplic n variant bilateral, atunci probabilitatea


ipotezei nule va fi dat de suma probabilitilor celor patru matrice:

#1 #2 #7 #8
0,00029 0,01427 0,01427 0,00029 0,0291 .
Analiza frecvenelor i a datelor nominale 187
Dac testul se aplic n variant unilateral, atunci probabilitatea
ipotezei nule va fi suma probabilitilor calculate pe baza matricelor #7 i
#8:

#7 #8
0,01427 0,00029 0,0145 .

Indiferent de varianta aplicat, condiia testului este urmtoarea:

dac 0,05 se respinge i se accept .

n cazul exemplului, ambele rezultate arat c ipotezele nule

U
corespunztoare celor dou variante au o probabilitate foarte mic (mai mic
de 0,05). Deci se poate accepta fie c exist o asociere semnificativ ntre

C
stimulare i reacia de scpare, fie c exist o asociere semnificativ ntre
ES
stimularea de deasupra capului i apariia reaciei de scpare. Evident, al
doilea rezultat (varianta unilateral) este n cazul experimentului prezentat
mai valoros, deoarece ofer un plus de informaie.
R
FI

10.4. TESTUL MCNEMAR


M
ZA

n anumite situaii nu se dorete ca observaiile s fie independente


(de exemplu, dac se investigheaz aciunea unui tratament asupra unor
animale). Astfel, pentru a elimina diferenele individuale, aceiai indivizi
vor fi investigai de dou ori nainte i dup tratament.

n astfel de cazuri se folosete testul McNemar pentru testarea


semnificaiei schimbrilor rspunsurilor organismelor sub influena unui
tratament. Acest test este echivalentul testului pentru perechi de valori n
cazul variabilelor nominale.
Condiii de aplicare:

1. variabila trebuie s fie nominal;


2. observaiile trebuie s fie neindependente (fiecare individ trebuie
s fie investigat de dou ori).
188 Elemente de statistic aplicate n ecologie
Se alctuiete matricea de contingen:

Tratament Tratament 1
Rspuns Rspuns 1 Rspuns 2
Rspuns 1
Tratament 2
Rspuns 2

Ipotezele testului sunt urmtoarele:

: rspunsul nu se modific semnificativ sub aciunea tratamentului


: rspunsul se modific semnificativ sub aciunea tratamentului

U
Indivizii care i-au modificat comportamentul ocup poziiile i

C
(indivizii din au dat rspunsul 2 la tratamentul 1 i rspunsul 1 la
tratamentul 2; indivizii din au dat rspunsul 1 la tratamentul 1 i rspunsul
ES
2 la tratamentul 2). Indivizii din poziiile i d nu i-au modificat rspunsul
(indiferent de tratament ei au dat fie rspunsul 1, fie 2).
R

Statistica testului consider doar indivizii care i-au modificat


rspunsul n funcie de tratament:
FI

| |
M

.
ZA

Statistica testului de compar cu o valoare critic aleas (anexa 2 sau


3) n funcie de pragul de confiden i numrul gradelor de libertate.

Dac , se respinge i se accept pentru


1 .

Dac 5, se poate calcula probabilitatea cu ajutorul funciei


distribuiei binomiale. n acest caz parametrii distribuiei se calculeaz
astfel:

0,5 ,
!
.
! !
Analiza frecvenelor i a datelor nominale 189

Dac 0,05 se respinge i se accept pentru


1 0,05 0,95 .

Exemplul 10.6. La unele specii de amfibieni anuri, la care


dimorfismul sexual nu este evident, din repertoriul masculilor fac parte
printre altele i sunetele de eliberare. Acestea sunt emise de un mascul
atunci cnd este abordat de un altul (care l confund cu o femel) pentru a
realiza mperecherea (amplexus sau mbriare). Astfel, masculul abordat
semnalizeaz sonor c i el este tot mascul. n acest sens, ntr-un studiu
efectuat pe 31 de masculi de Pelophylax (Rana) lessonae, s-a aplicat un
stimul tactil n zona axilar (zona n care masculul prinde femela n

U
amplexus) i apoi un altul n zona spatelui. Rezultatele au fost urmtoarele:
25 au reacionat prin emiterea sunetului de eliberare doar n urma stimulrii

C
axilare, 2 au emis sunetul cnd au fost stimulai doar dorsal, 3 au emis
ES
sunetul n urma ambelor stimulri i 1 nu a reacionat la niciunul dintre
stimuli. Exist o modificare semnificativ a comportamentului n funcie de
zona n care este aplicat stimulul?
R
FI

n cazul acestui experiment, nu se poate aplica testul de asociere


i nici testul Fisher, deoarece aplicarea ambelor teste este condiionat de
M

existena unor observaii independente, iar n acest experiment acelai


ZA

individ a fost supus ambelor tratamente: o dat a fost stimulat axilar, iar a
doua oar, dorsal. Deci pentru testarea semnificaiei asocierii dintre
comportament i zona stimulat trebuie aplicat testul McNemar.

Matricea de contingen n acest caz este urmtoarea:

Zona stimulat Axilar


Sunet de eliberare Prezent Absent
Prezent 3 2
Dorsal
Absent 25 1

Ipotezele testului sunt:


190 Elemente de statistic aplicate n ecologie
: nu exist o schimbare semnificativ a comportamentului n
funcie de zona stimulat.
: exist o schimbare semnificativ a comportamentului n funcie
de zona stimulat.

n matricea de contingen, masculii care i-au schimbat


comportamentul n funcie de zona stimulat sunt cei din poziiile (2 au
reacionat la stimulul dorsal i nu au reacionat la cel axilar) i (25 au
reacionat la stimulul axilar i nu au reacionat la cel dorsal). Cei din
poziiile i nu i-au schimbat comportamentul (3 au reacionat la ambele
stimulri i, respectiv, 1 nu a reacionat la nici un stimul).

U
Pe baza acestor date se calculeaz statistica a testului McNemar:

C
| |
17,926 .
ES
Se afl valoarea critic (anexa 2 sau 3) pentru 0,05 i 1 grad de
R

libertate (tabelul are 2 rnduri i 2 coloane, deci 2 1 2 1 1).


FI

, , 3,841 .
M

Valoarea statisticii testului este mai mare dect valoarea critic, deci
ZA

se respinge ipoteza nul i se accept ipoteza alternativ. Probabilitatea ca


ipoteza nul s fie adevrat (anexa 3) este foarte mic (2,3 10 ).
Concluzia testului este c exist o schimbare semnificativ a

comportamentului ce const n emiterea sunetului de eliberare n funcie de


zona stimulat la masculii speciei investigate.

S presupunem c rezultatul experimentului mai sus menionat se


prezint astfel:

Zona stimulat Axilar


Sunet de eliberare Prezent Absent
Prezent 3 0
Dorsal
Absent 9 1
Analiza frecvenelor i a datelor nominale 191

n acest caz, media dintre i este 4,5 (o valoare mai mic dect
5) i, ca urmare, statistica testului nu mai este aproximat de distribuia 2.
n aceast situaie se folosete un test exact bazat pe distribuia binomial,
cu 0,5 i .

Parametrii necesari calculrii probabilitii sunt: 0;


0,5; 9 0 9.
!
0 0,5 0,5 0,0019
! !

Valoarea obinut este mai mic dect 0,05 sau probabilitatea

U
ipotezei nule este 0,0019, deci putem accepta ipoteza alternativ conform

C
creia exist o schimbare semnificativ a comportamentului n funcie de
ES
locul unde s-a aplicat stimulul.
R
FI
M
ZA

BIBLIOGRAFIE
Andrei T., Stancu S. (1995): Statistica teorie i aplicaie. Editura All.
Armitage P., Colton T. (2005): Encyclopedia of Biostatistics, 2nd edition.
John Wiley and Sons, Ltd.
Bailey T.J.N. (1981): Statistical Methods in Biology, 2nd edition.
Cambridge University Press.
Bart J., Fligner M.A., Notz W.I. (2004): Sampling and statistical methods
for behavioral ecologists. Cambridre University Press.
Bennett P.D., Humphries A.D. (1977): Introduction to Field Biology.

U
Edward Arnold (Publishers) Ltd.

C
Bishop O.N. (1971): The Principles of Modern Biology Statistics for
Biology, 2nd edition. Longman.
ES
Cann A.J. (2002): Maths from Scratch for Biologists. John Wiley & Sons,
Ltd.
Ceapoiu M. (1968): Metode statistice aplicate n experienele agricole i
R

biologice. Editura Agro-Silvic, Bucureti.


FI

Cox W.G. (1996): Laboratory Manual of General Ecology, 7th edition.


Wm. C. Brown Publishers.
M

Dragomirescu L. (1998): Biostatistic pentru nceptori. Editura


ZA

Constelaii, Bucureti.
Dragomirescu L. (1999): Lucrri practice de biostatistic. Editura Ars
Docendi, Bucureti.
Dytham C. (2003): Choosing and Using Statistics: A Biologists Guide, 2nd

edition. Blackwell Publishing.


Everitt B.S. (2002): The Cambridge Dictionary of Statistics, 2nd edition.
Cambridge University Press.
Forthofer R.N., Lee E.S., Hernandez M. (2007): Biostatistics: A Guide to
Design, Analysis, and Discovery. Elsevier Inc.
Fowler J., Cohen L., Javris P. (2000): Practical Statistics for Field Biology,
2nd edition. John Wiley and Sons, Ltd.
Glantz S.A. (2005): Primer of Biostatistics, 6th edition. McGraw-Hill.
Glaser A.N. (2001): High-YeldTM Biostatistics. Lippincott Williams &
Wilkins.
Bibliografie 193
Hampton E.R. (1994): Introductory Biological Statistics. Wm. C. Brown
Publishers.
Hrdle W., Mori Y., Vieu P. (2007): Statistical Methods for Biostatistics
and Related Fields. Springer-Verlag Berlin Heidelberg.
Iosifescu M., Moineagu C., Trebici V., Ursianu E. (1985): Mica
enciclopedie de statistic. Editura tiinific i Enciclopedic,
Bucureti.
Le C.T. (2003): Introductory Biostatistics. John Wiley and Sons, Ltd.
Ludwig J.A., Reynolds J.F. (1988): Statistical Ecology: A primer on
Methods and Computing. John Wiley and Sons, Ltd.
Manly B.F.J., McDonald L.L., Thomas D.L., McDonald T.L., Erikson W.P.
(2004): Resource Selection by Animals: Statistical Design and

U
Analysis for Field Studies, 2nd edition. Kluwer Academic
Publishers.

C
Michelson S., Schofield S. (2002): The Biostatistics Cookbook: The most
ES
user-friendly guide for the bio/medical scientist. Kluwer Academic
Publishers.
Morisita M. (1962): I-Index, a measure of dispersion of individuals. Res.
R

Popul. Ecol., 4: 1-7.


FI

Neacu P. (1987): Lucrri practice de ecologie. Bucureti.


Neacu P., Apostolache-Stoicescu Z. (1982): Dicionar de ecologie. Editura
M

tiinific i Enciclopedic, Bucureti.


Norman G.R., Streiner D.L. (1998): Biostatistics: The Bare Essentials. B.C.
ZA

Decker Inc.
Prvu C. (1999): Ecologie general. Editura Tehnic, Bucureti.
Petrie A., Sabin C. (2000): Medical Statistics at a Glance. Blackwell

Science Ltd.
Postelnicu V., Coatu S. (1980): Mica enciclopedie matematic (traducere
dup Kleine Enzyklopadie der Mathematik ed. VI-a, 1971 i
Mathematics at a glance, 1975). Editura Tehnic, Bucureti.
Simionescu V. (1983): Lucrri practice de ecologie. Editura Universitii
Al.I. Cuza Iai.
Slingsby D., Cook C. (1992): Practical Ecology. Macmillan Distribution
Ltd.
Smith R.L. (1996): Ecology and Field Biology, 5th edition. Harper Collins
College Publishers.
194 Elemente de statistic aplicate n ecologie
Snedecor W.G. (1968): Metode statistice aplicate n cercetrile de
agricultur i biologie (traducere din limba englez). Bucureti.
Southwood T.R.E. (1966): Ecological Methods with Particular Reference to
the Study of Insect Populations. London, Methuen and co. LTD.
Stan Gh. (1994): Metode statistice cu aplicaii n cercetrile entomologice
(IV). Bul. Inf. Soc. Lepid. Rom., 5 (1): 13-25.
Stan Gh., 1994, Metode statistice cu aplicaii n cercetrile entomologice
(V). Bul. Inf. Soc. Lepid. Rom., 5 (2): 113-126.
Stan Gh. (1994): Metode statistice cu aplicaii n cercetrile entomologice
(VI). Bul. Inf. Soc. Lepid. Rom., 5 (3-4): 257-280.
Stan Gh. (1995): Metode statistice cu aplicaii n cercetrile entomologice
(VII). Bul. Inf. Soc. Lepid. Rom., 6 (1-2): 67-96.

U
Stiling, P.D. (2001): Ecology Theories and Applications, 4th edition.
Prentice Hall.

C
Varvara M. (2000): Curs de Ecologie, vol. 1. Editura Universitii Al.I.
ES
Cuza Iai.
Varvara M., Zamfirescu .R., Neacu V. (2001): Lucrri practice de
ecologie manual. Editura Universitii Al.I. Cuza Iai.
R

Zamfirescu O., Zamfirescu .R. (2007): Aspects Regarding the Vegetation


FI

From the Floristic Reserve The Secular Hayfields From Valea Lui
David Iai, Romnia. Journal of Ecology and Safety, International
M

Scientific Publication, 1:32-39.


Zamfirescu .R. (2002): The Experimental Induction of the Release Calls of
ZA

Some Anuran Species (Amphibia, Anura). In: Tomescu, N., Popa,


V. (eds.), In Memoriam Prof. Dr. Doc. Vasile Ghe. Radu
Coresponding Member of Romanian Academy of Sciences. Cluj

University Press, Cluj-Napoca, pp. 169-172.


Zamfirescu .R., Zamfirescu O., Popescu I.E., Ion C., Strugariu A. (2008):
Vipera de step (Vipera ursinii moldavica) i habitatele sale din
Moldova (Romania). Editura Universitii Al.I. Cuza Iai.
ANEXA 1: CHEIE DIHOTOMIC PENTRU
DETERMINAREA TIPULUI DE ANALIZ STATISTIC
1. Aprecierea datelor:
a. datele sunt apreciate pe o scal ordinal, de interval, de raport
2
b. datele sunt apreciate pe o scal nominal i/sau sub form de
frecvene 15

2. Numrul variabilelor analizate:

U
a. o singur variabil (ex: lungimea, greutatea, numr de

C
indivizi) 3
b. dou variabile (ex: lungimea i greutatea) 13
ES
3. Numrul probelor analizate:
R

a. o singur prob 4
b. mai multe probe 5
FI

4. Scopul analizei:
M

a. descrierea tendinei centrale i a variabilitii probei


ZA

Statistica descriptiv.
b. compararea mediei cu o valoare control Testul Student
(t) pentru o prob.

5. Numrul probelor:
a. 2 probe 6 (Teste pentru 2 probe) 6
b. 3 sau mai multe probe 9 (ANOVA) 9

6. Independena observaiilor:
a. observaii independente (probele provin din populaii
diferite) 7
b. observaii neindependente (probele provin din aceeai
populaie sau sunt obinute prin efectuarea unor observaii
repetate asupra acelorai uniti de prob) 8
196 Elemente de statistic aplicate n ecologie
7. Distribuia valorilor i scala de apreciere a variabilei:
a. distribuie aproximativ normal, scal de interval sau de
raport Testul Student (t) pentru observaii
independente.
b. distribuie diferit de cea normal, scal de interval, de raport
sau ordinal Testul Mann-Whitney (U).

8. Distribuia valorilor i scala de apreciere a variabilei:


a. distribuie aproximativ normal, scal de interval sau de
raport Testul Student (t) pentru observaii perechi.
b. distribuie diferit de cea normal, scal de interval, de raport
sau ordinal Testul Wilcoxon (W) pentru observaii

U
perechi.

C
9. Numrul factorilor (tratamente) care influeneaz probele:
ES
a. 1 singur factor (tratament) 10
b. 2 factori (tratamente) 11
R

10. Distribuia valorilor i scala de apreciere a variabilei:


a. distribuie aproximativ normal, scal de interval sau de
FI

raport, variana intern omogen ANOVA unifactorial.


M

b. distribuie diferit de cea normal, scal de interval, de raport


sau ordinal, varian intern heterogen ANOVA
ZA

unifactorial neparametric Kruskal-Wallis.

11. Numrul de observaii n celul, interaciunea dintre factori:


a. o singur observaie n celul, nu exist interaciune 12


b. mai multe observaii n celul, exist interaciune
ANOVA bifactorial cu replicare.

12. Distribuia valorilor i scala de apreciere a variabilei:


a. distribuie aproximativ normal, scal de interval sau de
raport, varian intern omogen ANOVA bifactorial
fr replicare.
b. distribuie diferit de cea normal, scal de interval, de raport
sau ordinal, varian intern heterogen ANOVA
bifactorial neparametric Friedman.
ANEXA 1: Cheie dihotomic pentru determinarea tipului de analiz statistic 197
13. Relaia dintre variabile, prelevarea probei:
a. asociere liniar, proba este prelevat aleator 14 (Analiza
Corelaiei)
b. relaie liniar cauz-efect, proba este prelevat n funcie de
valorile variabilei independente Analiza Regresiei.

14. Distribuia valorilor i scala de apreciere a variabilei:


a. distribuie aproximativ normal, scal de interval sau de
raport Corelaia parametric (Coeficientul de corelaie
Pearson).
b. distribuie diferit de cea normal, scal de interval, de raport
sau ordinal Corelaia neparametric (Coeficientul de

U
corelaie Spearman).

C
15. Scopul analizei:
ES
a. concordana dintre distribuia frecvenelor observate i cea a
frecvenelor estimate conform unei distribuii teoretice,
cunoscute Testul Chi-Ptrat de concordan.
R

b. asocierea dintre 2 variabile apreciate pe o scal nominal sau


FI

sub form de frecvene 16


M

16. Independena observaiilor:


a. observaii independente (fiecare unitate de prob este
ZA

investigat o singur data) 17


b. observaii neindependente (sunt obinute prin efectuarea unor
investigaii repetate asupra acelorai uniti de prob)

Testul McNemar pentru semnificaia schimbrii.

17. Magnitudinea frecvenelor estimate:


a. frecvenele estimate mai mari ca 0 i cel mult 20% dintre ele
sunt mai mici ca 5 Testul Chi-Ptrat de Asociere.
b. exist frecvene estimate egale cu 0 i mai mult de 20% din
frecvenele estimate sunt mai mici ca 5 Testul exact al lui
Fisher.
ANEXA 2: TABELE CU VALORI CRITICE
Scorul z i probabilitile corespunztoare n distribuia normal standard
A doua zecimal
z
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852

U
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389

C
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
ES
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
R

1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
FI

1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
M

2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
ZA

2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964

2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
ANEXA 2: Tabele cu valori critice 199

Valorile critice ale distribuiei t (Student)


(bilateral)
Grade de 0,05 0,1
libertate (unilateral)
0,025 0,05
1 12,706 6,314
2 4,303 2,920
3 3,182 2,353
4 2,776 2,132
5 2,571 2,015
6 2,447 1,943
7 2,365 1,895
8 2,306 1,861
9 2,262 1,833

U
10 2,228 1,812
11 2,201 1,796

C
12 2,179 1,782
13 2,160 1,771
ES
14 2,145 1,761
15 2,131 1,753
16 2,120 1,746
R

17 2,110 1,740
18 2,101 1,734
FI

19 2,093 1,729
20 2,086 1,725
M

21 2,080 1,721
22 2,074 1,717
ZA

23 2,069 1,714
24 2,064 1,711
25 2,060 1,708
26 2,056 1,706

27 2,052 1,703
28 2,048 1,701
29 2,045 1,699
30 2,042 1,697
40 2,021 1,684
60 2,000 1,671
100 1,984 1,660
120 1,980 1,658
1,960 1,645
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1

- - - - - - - - - - - - - - - - - - - - 1 200
2 2 2 2 1 1 1 1 1 0 0 0 0 - - - - - - - 2

8 7 7 6 6 5 5 4 4 3 3 2 2 1 1 0 - - - - 3

14 13 12 11 11 10 9 8 7 6 5 4 4 3 2 1 0 - - - 4

20 19 18 17 15 14 13 12 11 9 8 7 6 5 3 2 1 0 - - 5

27 25 24 22 21 19 17 16 14 13 11 10 8 6 5 3 2 1 - - 6
,

34 32 30 28 26 24 22 20 18 16 14 12 10 8 6 5 3 1 - - 7
ZA
41 38 36 34 31 29 26 24 22 M19 17 15 13 10 8 6 4 2 0 - 8

48 45 42 39 37 34 31 28 26 23 20 17 15 12 10 7 4 2 0 - 9
(bilateral),

55 52 48 45 42 39 36 33 29 26 23 21 17 14 11 8 5 3 0 - 10
FI
62 58 55 51 47 44 40 37 33 30 26 23 19 16 13 9 6 3 0 - 11
,

R
69 65 61 57 53 49 45 41 37 33 29 26 22 18 14 11 7 4 1 - 12

76 72 67 63 59 54 50 45 41 37 33 28 24 20 16 12 8 4 1 - 13
ES
83 78 74 67 64 59 55 50 45 40 36 31 26 22 17 13 9 5 1 - 14
C
90 85 80 75 70 64 59 54 49 44 39 34 29 24 19 14 10 5 1 - 15
(unilateral)

U
98 92 86 81 75 70 64 59 53 47 42 37 31 26 21 15 11 6 1 - 16

105 99 93 87 81 75 67 63 57 51 45 39 34 28 22 17 11 6 2 - 17
Valorile critice ale statisticii U pentru testul Mann-Whitney pentru

112 106 99 93 86 80 74 67 61 55 48 42 36 30 24 18 12 7 2 - 18

119 113 106 99 92 85 78 72 65 58 52 45 38 32 25 19 13 7 2 - 19


Elemente de statistic aplicate n ecologie

127 119 112 105 98 90 83 76 69 62 55 48 41 34 27 20 13 8 2 - 20


ANEXA 2: Tabele cu valori critice 201

Valorile critice ale statisticii T a testului Wilcoxon


n Bilateral =0,05 Unilateral =0,05
5 - 0
6 - 2
7 2 3
8 3 5
9 5 8
10 8 10
11 10 13
12 13 17
13 17 21
14 21 25

U
15 25 30

C
16 29 35
17 34 41
ES
18 40 47
19 46 53
20 52 60
R

21 58 67
22 65 75
FI

23 73 83
24 81 91
M

25 89 100
26 98 110
ZA

27 107 119
28 116 130
29 126 140

30 137 151
35 195 213
40 264 286
45 343 371
50 434 466
60 648 690
70 907 960
80 1211 1276
90 1560 1638
100 1955 2045
202 Elemente de statistic aplicate n ecologie
Valorile critice pentru testul (Hatley) pentru ,

2 3 4 5 6 7 8 9 10 11 12
2 39,0 87,5 142 202 266 333 403 475 550 626 704
3 15,4 27,8 39,2 50,7 62,0 72,9 83,5 93,9 104 114 124
4 9,6 15,5 20,6 25,2 29,5 33,6 37,5 41,1 44,6 48,0 51,4
5 7,15 10,8 13,7 16,3 18,7 20,8 22,9 24,7 26,5 28,2 29,9
6 5,82 8,38 10,4 12,1 13,7 15,0 16,3 17,5 18,6 19,7 20,7
7 4,99 6,94 8,44 9,70 10,8 11,8 12,7 13,5 14,3 15,1 15,8
8 4,43 6,00 7,18 8,12 9,03 9,78 10,5 11,1 11,7 12,2 12,7
9 4,03 5,34 6,31 7,11 7,80 8,41 8,95 9,45 9,91 10,3 10,7
10 3,72 4,85 5,67 6,34 6,92 7,42 7,87 8,28 8,66 9,01 9,34
12 3,28 4,16 4,79 5,30 5,72 6,09 6,42 6,72 7,00 7,25 7,48
15 2,86 3,54 4,01 4,37 4,68 4,95 5,19 5,40 5,59 5,77 5,93

U
20 2,46 2,95 3,29 3,54 3,76 3,94 4,10 4,24 4,37 4,49 4,59
30 2,07 2,40 2,61 2,78 2,91 3,02 3,12 3,21 3,29 3,36 3,39

C
60 1,67 1,85 1,96 2,04 2,11 2,17 2,22 2,26 2,30 2,33 2,36
ES
1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00

Valorile critice q pentru testul Tukey (=0,05).


R


2 3 4 5 6 7 8 9 10
FI

1 17,97 26,98 32,82 37,08 40,41 43,12 45,40 47,36 49,07


2 6,08 8,33 9,80 10,88 11,74 12,44 13,03 13,54 13,99
3 4,50 5,91 6,82 7,50 8,04 8,48 8,85 9,18 9,46
M

4 3,93 5,04 5,76 6,29 6,71 7,05 7,35 7,60 7,83


5 3,64 4,60 5,22 5,67 6,03 6,33 6,58 6,80 6,99
ZA

6 3,46 4,34 4,90 5,30 5,63 5,90 6,12 6,32 6,49


7 3,34 4,16 4,68 5,06 5,36 5,61 5,82 6,00 6,16
8 3,26 4,04 4,53 4,89 5,17 5,40 5,60 5,77 5,92
9 3,20 3,95 4,41 4,76 5,02 5,24 5,43 5,59 5,74
10 3,15 3,88 4,33 4,65 4,91 5,12 5,30 5,46 5,60

11 3,11 3,82 4,26 4,57 4,82 5,03 5,20 5,35 5,49


12 3,08 3,77 4,20 4,51 4,75 4,95 5,12 5,27 5,39
13 3,06 3,73 4,15 4,45 4,69 4,88 5,05 5,19 5,32
14 3,03 3,70 4,11 4,41 4,64 4,83 4,99 5,13 5,25
15 3,01 3,67 4,08 4,37 4,59 4,78 4,94 5,08 5,20
16 3,00 3,65 4,05 4,33 4,56 4,74 4,90 5,03 5,15
17 2,98 3,63 4,02 4,30 4,52 4,70 4,86 4,99 5,11
18 2,97 3,61 4,00 4,28 4,49 4,67 4,82 4,96 5,07
19 2,96 3,59 3,98 4,25 4,47 4,65 4,79 4,92 5,04
20 2,95 3,58 3,96 4,23 4,45 4,62 4,77 4,90 5,01
24 2,92 3,53 3,90 4,17 4,37 4,54 4,68 4,81 4,92
30 2,89 3,49 3,85 4,10 4,30 4,46 4,60 4,72 4,82
40 2,86 3,44 3,79 4,04 4,23 4,39 4,52 4,63 4,73
60 2,83 3,40 3,74 3,98 4,16 4,31 4,44 4,55 4,65
120 2,80 3,36 3,68 3,92 4,10 4,24 4,36 4,47 4,56
ANEXA 2: Tabele cu valori critice 203

Valorile critice ale distribuiei F pentru =0,05.


glext
glint
1 2 3 4 5 6 7 8 9 10
2 18,5 19,0 19,2 19,3 19,4 19,4 19,4 19,4 19,4 19,4
3 10,1 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06
7 5,59 4,74 4,35 4,12 3,97 3,87 3,77 3,73 3,68 3,64
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35

U
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98

C
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85
ES
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35
4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24
R

25
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16
FI

40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99
M

120 3,92 3,07 2,68 2,45 2,29 2,17 2,09 2,02 1,96 1,91
ZA

204 Elemente de statistic aplicate n ecologie

Valorile critice ale distribuiei 2


Grade de
libertate 0,99 0,95 0,90 0,10 0,05 0,01 0,001
1 0,000157 0,00393 0,0158 2,706 3,841 6,635 10,828
2 0,0201 0,103 0,211 4,605 5,991 9,210 13,816
3 0,115 0,352 0,584 6,251 7,815 11,345 16,266
4 0,297 0,711 1,064 7,779 9,488 13,277 18,467
5 0,554 1,145 1,610 9,236 11,070 15,086 20,515
6 0,872 1,635 2,204 10,645 12,592 16,812 22,458
7 1,239 2,167 2,833 12,017 14,067 18,475 24,322
8 1,646 2,733 3,490 13,362 15,507 20,090 26,124
9 2,088 3,325 4,168 14,684 16,919 21,666 27,877
10 2,558 3,940 4,865 15,987 18,307 23,209 29,588

U
11 3,053 4,575 5,578 17,275 19,675 24,725 31,264

C
12 3,571 5,226 6,304 18,549 21,026 26,217 32,909
13 4,107 5,892 7,042 19,812 22,362 27,688 34,528
ES
14 4,660 6,571 7,790 21,064 23,685 29,141 36,123
15 5,229 7,261 8,547 22,307 24,996 30,578 37,697
16 5,812 7,962 9,312 23,542 26,296 32,000 39,252
R

17 6,408 8,672 10,085 24,769 27,587 33,409 40,790


18 7,015 9,390 10,865 25,989 28,869 34,805 42,312
FI

19 7,633 10,117 11,651 27,204 30,144 36,191 43,820


20 8,260 10,851 12,443 28,412 31,410 37,566 45,315
M

21 8,897 11,591 13,240 29,615 32,671 38,932 46,797


22 9,542 12,338 14,041 30,813 33,924 40,289 48,268
ZA

23 10,196 13,091 14,848 32,007 35,172 41,638 49,728


24 10,856 13,848 15,659 33,196 36,415 42,980 51,179
25 11,524 14,611 16,473 34,382 37,652 44,314 52,620

26 12,198 15,379 17,292 35,563 38,885 45,642 54,052


27 12,879 16,151 18,114 36,741 40,113 46,963 55,476
28 13,565 16,928 18,939 37,916 41,337 48,278 56,892
29 14,256 17,708 19,768 39,087 42,557 49,588 58,301
30 14,953 18,493 20,599 40,256 43,773 50,892 59,703
ANEXA 3: FUNCII MICROSOFT OFFICE EXCEL
n general, n acest program se poate realiza orice calcul prin tastarea
=, urmat de numerele sau referinele csuelor (liter coloan_numr rnd)
ce conin valorile de interes, ntre care se introduc semnele de operaie ale
formulei (+, -, *, /, sum, sqrt, power, abs, round, log pentru detalii
consultai meniu-ul Help al programului).

Modulul Data Analysis exist n meniu Tools n versiunea 97-


2003 sau Data n versiunea 2007. Dac nu apare n meniu, modulul se

U
poate activa astfel: pentru versiunea 97-2003 se alege Tools > Add-Ins;

C
n versiunea 2007 se alege Office Button > Excel Options > Add-Ins.
ES
FUNCII SPECIALE N ORDINEA SECIUNILOR DIN CARTE:

2.1. SCALE DE MSURARE I TIPURI DE VARIABILE


R
FI

=RANK(nr, ref, 1)+(COUNT(ref) + 1 RANK(nr, ref, 0)


RANK(nr, ref, 1)/2
M

Returneaz rangul unei valori (nr) dintr-un set de date (ref).


ZA

2.2. REPREZENTAREA DATELOR


=LOG10(nr)
Returneaz valoarea logaritmului zecimal al unui numr (nr)

=MAX(ref)
Returneaz valoarea maxim a unui set de date (ref).
=MIN(ref)
Returneaz valoarea minim a unui set de date (ref).
=FREQUENCY(ref 1, ref 2)
Returneaz frecvena cumulat a valorilor unui set de date (ref 1)
cuprinse ntre valoarea minim i limita superioar a unei clase de
frecven (ref 2).
206 Elemente de statistic aplicate n ecologie
3.1. TENDINA CENTRAL
=MODE(ref)
Returneaz valoarea modului unui set de date (ref).
=MEDIAN(ref)
Returneaz valoarea medianei unui set de date (ref).
=AVERAGE(ref)

3.2. VARIABILITATEA
Returneaz valoarea mediei aritmetice a unui set de date (ref).
=MAX(ref)
Returneaz valoarea maxim a unui set de date (ref).
=MIN(ref)

U
Returneaz valoarea minim a unui set de date (ref).
=SUMSQ(ref)

C
Returneaz suma ptratelor valorilor dintr-un set de date (ref).
ES
=STDEV(ref)
Returneaz valoarea deviaiei standard calculat ca radical din suma
ptratelor mprit la numrul gradelor de libertate ( 1), a unui set
R

de date (ref).
FI

=STDEVP(ref)
Returneaz valoarea deviaiei standard a populaiei calculat ca
M

radical din suma ptratelor mprit la numrul valorilor ( ), a unui


ZA

set de date (ref).


=VAR(ref)
Returneaz valoarea varianei calculat ca suma ptratelor mprit
la numrul gradelor de libertate ( 1), a unui set de date (ref).

=VARA(ref)
Returneaz valoarea varianei populaiei calculat ca suma ptratelor
mprit la numrul valorilor ( ), a unui set de date (ref).

Descrierea statistic a unei probe mai poate fi obinut prin apelarea


meniului DATA > DATA ANALYSIS > DESCRIPTIVE
STATISTICS i completarea cmpurilor din fereastra de dialog
urmat de bifarea Summary statistics.
ANEXA 3: Funcii Microsoft Office Excel 207
4. DISTRIBUII PROBABILISTICE
=BINOMDIST(x, k, p, cumulativ)
Returneaz probabilitatea binomial asociat numrului rezultatelor
de interes ( ), n funcie de numrul total de ncercri ( ), i
probabilitatea obinerii unui anumit rezultat ( ), exprimat
necumulat (cumulative = false).
=POISSONDIST(x, x , cumulativ)
Returneaz probabilitatea Poisson asociat numrului rezultatelor de
interes ( ), n funcie de valoarea medie ( ), exprimat necumulat
(cumulative = false).
=NORMALIZE(x, x , s)
Returneaz valoarea a unei anumite valori a unei variabile ( ) n

U
funcie de media valorilor ( ) i de deviaia standard a acesteia ( ).
=NORMSINV(prob)

C
Returneaz scorul corespunztor unei anumite probabiliti (prob)
ES
exprimat ca o proporie din distribuia normal standard.
=NORMSDIST(z)
Returneaz probabilitatea ca proporie din distribuia normal
R

standard, din coada stng a distribuiei i pn la un anumit scor .


FI

=STANDARDIZE(nr, x , s)
Returneaz scorul al unei valori (nr) n funcie de medie ( ) i
M

deviaie standard ( ).
ZA

Transformarea datelor
=LOG10(x)
Returneaz logaritmul zecimal ( ) al unei valori ce trebuie

transformate ( ).
=POWER(10,x)
Returneaz antilogaritmul zecimal al unei valori transformate prin
logaritmare n baza10.
=LN(x)
Returneaz logaritmul natural ( ) al unei valori ce trebuie
transformate ( ).
=EXP(x)
Returneaz antilogaritmul natural al unei valori transformate prin
logaritmare n baza .
208 Elemente de statistic aplicate n ecologie

=LOG(x, baz)
Returneaz logaritmul ntr-o baz specificat (baz) al unei valori ce
trebuie transformate ( ).
=POWER(baz,x)
Returneaz antilogaritmul unei valori transformate prin
logaritmare ntr-o baz specificat (baz).
=ASINH(x)
Returneaz valoarea transformat prin funcia arcsinh a unei valori
ce trebuie transformat.
=SINH(x)
Returneaz valoarea transformrii inverse a unei valori

U
transformat cu funcia arcsinh.
=SQRT(x)

C
Returneaz valoarea transformat prin extragerea radicalului dintr-o
ES
valoare ce trebuie transformat.
=POWER(x,2)
Returneaz valoarea transformrii inverse a unei valori
R

transformat prin extragerea radicalului.


FI

=DEGREES(ASIN(SQRT(x)))
Returneaz valoarea transformrii unei proporii (0 1) cu
M

ajutorul funciei arcsin.


ZA

=POWER(SIN(RADIANS(x)), 2)
Returneaz o proporie ( ) prin transformarea invers a unei valori
obinut cu ajutorul funciei arcsin ( ).

5.1. ESTIMAREA MEDIEI POPULAIONALE


Estimarea mediei populaionale poate fi obinut prin apelarea
meniului DATA > DATA ANALYSIS > DESCRIPTIVE
STATISTICS i completarea cmpurilor din fereastra de dialog
urmat de bifarea Summary statistics i Confidence Level for
Mean. Ultimul rnd din tabelul de rezultate conine valoarea
produsului dintre eroarea standard a mediei i valoarea critic a
distribuiei Student pentru (valoarea implicit este de 0,05) i 1
grade de libertate.
ANEXA 3: Funcii Microsoft Office Excel 209

=TINV(prob, gl)
Returneaz valoarea critic (Student) pentru un anumit nivel de
semnificaie (prob = ) i un anumit numr de grade de libertate (gl
= 1).

6. TESTAREA UNEI IPOTEZE PRIVIND MEDIA UNEI


SINGURE POPULAII
=TINV(prob, gl)
Returneaz valoarea critic (Student) pentru un anumit nivel de
semnificaie (prob = ) i un anumit numr de grade de libertate (gl

U
= 1).

C
=TDIST(t, gl, cozi)
Returneaz probabilitatea asociat unei valori (Student) pentru un
ES
anumit numr de grade de libertate (gl = 1) i n funcie de
varianta testului (cozi: 1 unilateral, 2 bilateral).
R

7.1.1. Testul t (Student) pentru probe independente


FI

=TINV(prob, gl)
M

Returneaz valoarea critic (Student) pentru un anumit nivel de


semnificaie (prob = ) i un anumit numr de grade de libertate (gl
ZA

= 1).
=TDIST(t, gl, cozi)
Returneaz probabilitatea asociat unei valori (Student) pentru un

anumit numr de grade de libertate (gl = 1) i n funcie de


varianta testului (cozi: 1 unilateral, 2 bilateral).

Testul Student pentru probe independente se poate realiza prin


apelarea meniului DATA > DATA ANALYSIS > t-Test:
Two-Sample Assuming Unequal Variances i completarea
cmpurilor din fereastra de dialog. n cmpul Hypothesized Mean
Diference se completeaz valoarea 0.
210 Elemente de statistic aplicate n ecologie
7.2.1. Testul t (Student) pentru perechi de observaii
=TINV(prob, gl)
Returneaz valoarea critic (Student) pentru un anumit nivel de
semnificaie (prob = ) i un anumit numr de grade de libertate (gl
= 1).
=TDIST(t, gl, cozi)
Returneaz probabilitatea asociat unei valori (Student) pentru un
anumit numr de grade de libertate (gl = 1) i n funcie de
varianta testului (cozi: 1 unilateral, 2 bilateral).

Testul Student pentru perechi de observaii se poate realiza prin


apelarea meniului DATA > DATA ANALYSIS > t-Test:

U
Paired Two Sample for Means i completarea cmpurilor din

C
fereastra de dialog. n cmpul Hypothesized Mean Diference se
completeaz valoarea 0.
ES
8.1.1. Testarea omogenitii varianei interne
R

=VAR(ref)
Returneaz valoarea varianei calculat ca suma ptratelor mprit
FI

la gradele de libertate ( 1), a unui set de date (ref).


M

=LN(nr)
Returneaz valoarea logaritmului natural a unui numr (nr).
ZA

=CHIINV(prob, gl)
Returneaz valoarea critic pentru un anumit nivel de
semnificaie (prob = ), un anumit numr de grade de libertate (gl =

1).
=CHIDIST(2, gl)
Returneaz probabilitatea asociat unei valori pentru un anumit
numr de grade de libertate (gl = 1).

8.2.1. ANOVA model unifactorial


=FINV(prob, glext, glint)
Returneaz valoarea critic pentru un anumit nivel de semnificaie
(prob = ), un anumit numr de grade de libertate externe (glext =
1) i un anumit numr de grade de libertate interne (glint =
).
ANEXA 3: Funcii Microsoft Office Excel 211
=FDIST(F, glext, glint)
Returneaz probabilitatea asociat unei valori pentru un anumit
numr de grade de libertate externe (glext = 1) i un anumit
numr de grade de libertate interne (glint = ).

Testul ANOVA model unifactorial se poate realiza prin apelarea


meniului DATA > DATA ANALYSIS > Anova: Single
Factor i completarea cmpurilor din fereastra de dialog.

8.2.2. ANOVA Kruskal-Wallis


=CHIINV(prob, gl)
Returneaz valoarea critic pentru un anumit nivel de

U
semnificaie (prob = ) i un anumit numr de grade de libertate (gl

C
= 1).
=CHIDIST(2, gl)
ES
Returneaz probabilitatea asociat unei valori pentru un anumit
numr de grade de libertate (gl = 1).
R

8.2.3. ANOVA model bifactorial fr replicare


FI

=FINV(prob, glext, glint)


Returneaz valoarea critic pentru un anumit nivel de semnificaie
M

(prob = ), un anumit numr de grade de libertate externe (glext =


ZA

1 sau glext = 1) i un anumit numr de grade de libertate


interne (glint = 1 1 1).
=FDIST(F, glext, glint)

Returneaz probabilitatea asociat unei valori pentru un anumit


numr de grade de libertate externe (glext = 1 sau glext = 1)
i un anumit numr de grade de libertate interne (gl = 1
1 1).

Testul ANOVA model bifactorial cu o singur observaie n celul


se poate realiza prin apelarea meniului DATA > DATA
ANALYSIS > Anova: Two Factor Without Replication i
completarea cmpurilor din fereastra de dialog.
212 Elemente de statistic aplicate n ecologie
8.2.4. ANOVA Friedman
=CHIINV(prob, gl)
Returneaz valoarea critic pentru un anumit nivel de
semnificaie (prob = ), un anumit numr de grade de libertate (gl =
1).
=CHIDIST(2, gl)
Returneaz probabilitatea asociat unei valori pentru un anumit
numr de grade de libertate (gl = 1).

8.2.5. ANOVA model bifactorial cu replicare


=FINV(prob, glext, glint)
Returneaz valoarea critic pentru un anumit nivel de semnificaie

U
(prob = ), un anumit numr de grade de libertate externe (glext =
1 sau glext = 1 sau glext = (c1)(r1)) i un anumit numr

C
de grade de libertate interne (glint = ).
ES
=FDIST(F, glext, glint)
Returneaz probabilitatea asociat unei valori pentru un anumit
numr de grade de libertate externe (glext = 1 sau glext = 1
R

sau glext = (c1)(r1)) i un anumit numr de grade de libertate


FI

interne (glint = ).
M

Testul ANOVA model bifactorial cu o singur observaie n celul


ZA

se poate realiza prin apelarea meniului DATA > DATA


ANALYSIS > Anova: Two Factor With Replication i
completarea cmpurilor din fereastra de dialog.

9.1. Analiza Corelaiei


=CORREL(ref x, ref y)
Returneaz valoarea coeficientului de corelaie parametric Pearson
dintre valorile variabilei (ref x) i valorile variabilei (ref y).
=TINV(prob, gl)
Returneaz valoarea critic (Student) pentru un anumit nivel de
semnificaie (prob = ) i un anumit numr de grade de libertate (gl
= 2).
ANEXA 3: Funcii Microsoft Office Excel 213
=TDIST(t, gl, cozi)
Returneaz probabilitatea asociat unei valori (Student) pentru un
anumit numr de grade de libertate (gl = 2) i n funcie de
varianta testului (cozi: 1 unilateral, 2 bilateral).

Coeficientul de corelaie parametric Pearson se poate realiza prin


apelarea meniului DATA > DATA ANALYSIS >
Correlation i completarea cmpurilor din fereastra de dialog.

9.2. Analiza Regresiei


Analiza regresiei se poate realiza prin apelarea meniului DATA >
DATA ANALYSIS > Regression i completarea cmpurilor

U
din fereastra de dialog.

10.1. Testul 2 de concordan


C
ES
=CHIINV(prob, gl)
Returneaz valoarea critic pentru un anumit nivel de
semnificaie (prob = ), un anumit numr de grade de libertate (gl =
R

1).
FI

=CHIDIST(2, gl)
Returneaz probabilitatea asociat unei valori pentru un anumit
M

numr de grade de libertate (gl = 1).


ZA

=BINOMDIST(x, k, p, cumulativ)
Returneaz probabilitatea binomial asociat numrului rezultatelor
de interes ( ), n funcie de a numrului total de ncercri ( ), i a

probabilitii obinerii unui anumit rezultat ( ), exprimat necumulat


(cumulative = false).
=POISSONDIST(x, x , cumulativ)
Returneaz probabilitatea Poisson asociat numrului rezultatelor de
interes ( ), n funcie de valoarea medie ( ), exprimat necumulat
(cumulative = false).
214 Elemente de statistic aplicate n ecologie
2
10.2. Testul de asociere
=CHIINV(prob, gl)
Returneaz valoarea critic pentru un anumit nivel de
semnificaie (prob = ) i un anumit numr de grade de libertate (gl
= 1 1 ).
2
=CHIDIST( , gl)
Returneaz probabilitatea asociat unei valori pentru un anumit
numr de grade de libertate (gl = 1 1 ).

10.3. Testul exact al lui Fisher


=FACT(x)
Returneaz valoarea !.

U
10.4. Testul McNemar

C
=CHIINV(prob, gl)
ES
Returneaz valoarea critic pentru un anumit nivel de
semnificaie (prob = ) i un anumit numr de grade de libertate (gl
= 1 1 ).
R

=CHIDIST(2, gl)
FI

Returneaz probabilitatea asociat unei valori pentru un anumit


numr de grade de libertate (gl = 1 1 ).
M

=BINOMDIST(x, k, p, cumulativ)
ZA

Returneaz probabilitatea binomial asociat numrului rezultatelor


de interes ( ), n funcie de a numrului total de ncercri ( ), i a
probabilitii obinerii unui anumit rezultat ( ), exprimat necumulat
(cumulative = false).

INDEX ALFABETIC
coeficientul de corelaie Spearman, 146
A coeficientul de determinare n corelaie,
150
aleator, 9 compararea a dou probe
amplitudine, 29 neindependente, 92
analiza varianei, 102 corelaie, 144
ANOVA, 102

U
corelaie direct sau pozitiv, 144
ANOVA bifactorial cu replicare, 128 corelaie invers sau negativ, 145

C
ANOVA bifactorial fr replicare, 118 corelaie neparametric, 153
ANOVA bifactorial neparametric
ES
corelaie parametric, 147
Friedman, 126 corelaie, puterea, 146
ANOVA unifactorial, 108 covarian, 147
R

ANOVA unifactorial neparametric


Kruskal-Wallis, 116
D
FI

atribut, 12
date, 9, 12
M

B deviaie standard, 30
deviaie standard a populaiei, 30
ZA

Bartlett, 105 deviaie standard a probei, 30


diagrama frecvenelor, 18
C dispersie, 44

dispersie aleatoare, 44
clasa modal, 24
dispersie grupat, 44
clas median, 26
dispersie uniform, 44
clase de frecven, 19
dispersie, indici de, 44
coeficient, 17
disproporionalitate, 184
coeficient de corelaie, 145
distribuia binomial, 36
coeficient de determinare n regresie, 162
distribuia binomial negativ, 42
coeficient de regresie, nlimea dreptei,
distribuia normal, 55
157
distribuia normal standard, 58
coeficient de regresie, panta dreptei, 157
distribuia Poisson, 40
coeficient de variaie, 32
distribuia Student, 67
coeficientul de corelaie Pearson, 146
216 Elemente de statistic aplicate n ecologie
distribuia t, 67 interval de confiden al mediei
distribuie bimodal, 24 populaionale, 68
distribuie multimodal, 24 interval de variaie, 29
distribuii probabilistice, 34 ipotez, 74
ipotez alternativ, 75
E ipotez nul, 75

eroare de genul I, 77
K
eroare de genul II, 77
eroare standard a mediei, 66 Kruskal-Wallis, 116
eroare , 77
eroare , 77 L
erori statistice, 77

U
Laplace, 65
Lincon-Petersen, 71

C
F ES
factor, 107 M
Fisher, 183
frecven proporional, 17 Mann-Whitney, 89
R

Friedman, 126 matrice de contingen, 178


McNemar, 187
FI

media probei, 27
G
median, 25
M

grade de libertate, 31 medie, 27


ZA

medie populaional, 27
H meristic, 15
metode neparametrice, 61
Hartley, 104 metode parametrice, 61

histograma frecvenelor, 20 metric, 15


mod, 23
I model binomial, 49
model binomial negativ, 53
independen, 10
model Poisson, 51
indice de dispersie, 45
Moivre, 65
indice Green, 47
indicele Lincon-Petersen, 71
indicele Shannon-Weaver, 72 N
interaciunea factorilor, 108 nivel al factorului, 107
interval de clas, 20 nivel de confiden, 76
Index alfabetic 217
nivel de ncredere, 76 regula nmulirii, 35
normalizare, 63 relaii neliniare, 165
reprezentarea datelor, 17
O reprezentarea variabilelor continui, 19
reprezentarea variabilelor discrete, 18
observaie, 9
omogenitatea varianei interne, 104
S
P scal, 12
scal de interval, 14
parametru, 10 scal de raport, 14
Pearson, 146, 149 scal nominal, 12
Poisson, 40 scal ordinal, 13

U
poligonul frecvenelor, 21 scor , 58
populaie, 8

C
Shannon-Weaver, 72
prag de semnificaie, 76 Snedecor-Fisher, 103
ES
probabilitate, 34 Spearman, 146, 153
prob, 8 stabilizarea varianei, 63
probe independente, 85 statistica inferenial, 65
R

probe neindependente, 85 statistica testului, 75


procent, 17
FI

statistic, 10
proporie, 17 statistic descriptiv, 23
M

Student, 67, 79, 85, 93


R
ZA

rang, 13 T
raport, 17 tendina central, 23
rat, 17

teorema limit central, 65


regresie, 157 teorie, 74
regresie, estimare individual, 164 test n variant bilateral, 76
regresie, estimarea funciei, 160 test n variant unilateral, 76
regresie, interval de confiden al test puternic, 77
coeficientului, 162 test unilateral dreapta, 79
regresie, testarea semnificaiei funciei, test unilateral stnga, 79
161 testarea diferenei dintre dou probe, 85
regresie, zona de confiden a dreptei, testarea diferenelor dintre trei sau mai
163 multe probe, 102
regula adunrii, 35 testarea ipotezelor statistice, etape, 78
regula mpririi, 34 teste statistice, 75
218 Elemente de statistic aplicate n ecologie
testul sau Hartley, 104 V
testul 2 de asociere, 177
testul 2 de concordan, 173 valoare critic, 75
testul Bartlett, 105 valoare individual, 9, 12
testul exact al lui Fisher, 183 variabil, 9, 12
testul McNemar, 187 variabil continu, 15
testul Tukey, 112 variabil dependent, 143
testul (Wilcoxon), 96 variabil derivat, 16
testul (Mann-Whitney), 89 variabil discontinu, 15
testul (Student) pentru o prob, 79 variabil discret, 15
testul (Student) pentru perechi de variabil independent, 143
observaii, 93 variabil nominal, 12
testul (Student) pentru probe variabil ordinal, 13

U
independente, 85 variabil, tipuri, 12

C
transformarea arcsin, 64 variabilitate extern, 103
transformarea arcsinh, 63 variabilitate intern, 103
ES
transformarea datelor, 63 variabilitate total, 103
transformarea invers, 64 variabilitatea, 29
varian, 30
R

transformarea logaritmic, 63
transformarea prin extragerea radicalului,
FI

63 W
Tukey, 112
M

Wilcoxon, 96
ZA

U Z
unitate de prob, 9
zon de acceptare a ipotezei nule, 80
zon de respingere a ipotezei nule, 80

S-ar putea să vă placă și