Carte finanat din Contract CNCSIS 1179/2006

Refereni tiinifici:

Prof. dr. Ioan MOGLAN
Departamentul de Biologie, Universitatea Al.I. Cuza Iai

Conf. dr. Luminia BEJENARU
Departamentul de Biologie, Universitatea Al.I. Cuza Iai

Lect. dr. Marcel ROMAN
Catedra de Matematic, Universitatea Tehnic Gh. Asachi Iai

ISBN: 978-973-703-389-5

tefan R. ZAMFIRESCU
Oana ZAMFIRESCU

ELEMENTE DE STATISTIC
APLICATE N
ECOLOGIE

Editura Universitii Alexandru Ioan Cuza Iai
2008

CUPRINS

INTRODUCERE ................................................................................................................. 7
1. CONCEPTE GENERALE .............................................................................................. 8
2. APRECIEREA I PREZENTAREA DATELOR ...................................................... 12
2.1. SCALE DE MSURARE I TIPURI DE VARIABILE .......................................................... 12
2.2. REPREZENTAREA DATELOR ....................................................................................... 17
3. DESCRIEREA STATISTIC A PROBELOR ECOLOGICE ................................. 23
3.1. TENDINA CENTRAL ............................................................................................... 23
3.2. VARIABILITATEA ...................................................................................................... 29
4. DISTRIBUII PROBABILISTICE ............................................................................. 34
4.1. DISTRIBUIA BINOMIAL .......................................................................................... 36
4.2. DISTRIBUIA POISSON ............................................................................................... 40
4.3. DISTRIBUIA BINOMIAL NEGATIV ......................................................................... 42
4.4. ESTIMAREA DISPERSIEI UNEI POPULAII .................................................................... 44
4.4.1. Indici de dispersie ............................................................................................ 44
4.4.2. Modelul binomial ............................................................................................. 49
4.4.3. Modelul Poisson ............................................................................................... 51
4.4.4. Modelul binomial negativ ................................................................................. 53
4.5. DISTRIBUIA NORMAL ............................................................................................ 55
4.5.1. Aprecierea normalitii datelor ........................................................................ 61
5. STATISTIC INFERENIAL: ELEMENTE INTRODUCTIVE ........................ 65
5.1. ESTIMAREA MEDIEI POPULAIONALE ........................................................................ 65
5.2. ESTIMAREA UNEI PROPORII ..................................................................................... 71
5.3. ESTIMAREA EFECTIVULUI POPULAIONAL ................................................................ 71
5.4. ESTIMAREA INDICELUI DE DIVERSITATE .................................................................... 72
5.5. TESTAREA IPOTEZELOR STATISTICE .......................................................................... 74
6. TESTAREA UNEI IPOTEZE PRIVIND MEDIA UNEI SINGURE
POPULAII ............................................................................................................. 79
7. TESTAREA DIFERENEI DINTRE DOU PROBE .............................................. 85
7.1. COMPARAREA A DOU PROBE INDEPENDENTE .......................................................... 85
7.1.1. Testul t (Student) pentru probe independente .................................................. 85
7.1.2. Testul U (Mann-Whitney) ................................................................................. 89
7.2. COMPARAREA A DOU PROBE NEINDEPENDENTE ...................................................... 92
7.2.1. Testul t (Student) pentru perechi de observaii ................................................ 93
7.2.2. Testul T (Wilcoxon) .......................................................................................... 96
8. TESTAREA DIFERENELOR DINTRE TREI SAU MAI MULTE PROBE...... 102
8.1. PRINCIPIUL ANOVA .............................................................................................. 103
8.1.1. Testarea omogenitii varianei interne ......................................................... 104
8.2. TIPURI DE ANOVA ................................................................................................. 107
8.2.1. ANOVA unifactorial ..................................................................................... 108
8.2.2. ANOVA unifactorial neparametric Kruskal-Wallis .................................... 116
8.2.3. ANOVA bifactorial fr replicare ................................................................ 118
8.2.4. ANOVA bifactorial neparametric Friedman .............................................. 126
8.2.5. ANOVA bifactorial cu replicare ................................................................... 128
9. CORELAIA I REGRESIA ..................................................................................... 143
9.1. ANALIZA CORELAIEI ............................................................................................. 144
9.1.1. Analiza corelaiei parametrice ....................................................................... 147
9.1.2. Analiza corelaiei neparametrice ................................................................... 153
9.2. ANALIZA REGRESIEI ................................................................................................ 157
10. ANALIZA FRECVENELOR I A DATELOR NOMINALE ............................ 171
10.1. TESTUL 2 DE CONCORDAN ............................................................................. 173
10.2. TESTUL 2 DE ASOCIERE ...................................................................................... 177
10.3. TESTUL EXACT AL LUI FISHER ............................................................................... 183
10.4. TESTUL MCNEMAR ............................................................................................... 187
BIBLIOGRAFIE ............................................................................................................. 192
ANEXA 1: CHEIE DIHOTOMIC PENTRU DETERMINAREA TIPULUI DE
ANALIZ STATISTIC ...................................................................................... 195
ANEXA 2: TABELE CU VALORI CRITICE .............................................................. 198
ANEXA 3: FUNCII MICROSOFT OFFICE EXCEL ............................................... 205
INDEX ALFABETIC ...................................................................................................... 215

INTRODUCERE

n prezent, valorificarea investigaiilor ecologice nu poate fi
conceput fr o analiz statistic a datelor, fr aa-numita asigurare
statistic ce red msura n care concluziile acestor investigaii ar putea fi
reale. Analiza statistic a datelor, fr a fi un scop n sine al demersului
tiinific n ecologie, reprezint o unealt ce permite o mai bun
comprehensiune i prezentare a informaiei coninute de rezultatele
cercetrilor.
n prezent, prelucrarea statistic a datelor este facilitat de utilizarea
computerului i a programelor corespunztoare. Utilizarea acestora trebuie
s fie fcut numai dup nelegerea conceptelor i procedurilor metodelor
statistice. Altfel, aceste instrumente vor reprezenta un fel de cutie neagr
n care se introduc rezultatele cercetrilor i din care rezult nite concluzii
despre a cror corectitudine nu se poate spune mare lucru.
Prezenta lucrare ncearc s ofere o baz conceptual pentru cei care
se dedic cercetrilor cu caracter ecologic. Din acest motiv, pe parcursul
capitolelor apar numeroase exemple inspirate din cercetri ecologice.
Lucrarea poate fi ns de ajutor i pentru analiza datelor rezultate n urma
investigaiilor din diverse ramuri ale biologiei sau ale tiinelor conexe.
n prima parte a crii sunt prezentate o serie de noiuni de baz n
statistic, care s asigure nelegerea limbajului intrinsec al acestei tiine.
Urmeaz o parte dedicat statisticii descriptive i principalelor distribuii
probabilistice cu aplicativitate n ecologie. Partea urmtoare trateaz
aspectele de principiu ale statisticii inductive i prezint principalele teste
care se utilizeaz pentru comparaia probelor. n continuare sunt prezentate
modaliti de analiz a asocierii dintre dou variabile, iar ultima parte
cuprinde metode de analiz ale frecvenelor. La finalul crii sunt trei anexe:
prima reprezint o cheie de decizie asupra metodelor statistice, prin care pot
fi prelucrate date, a doua cuprinde tabelele cu valorile critice necesare
pentru diferite teste statistice, iar a treia cuprinde funciile statistice din
programul MS-Excel. Cartea se termin cu un index alfabetic al termenilor
statistici folosii pe parcursul lucrrii.

1. CONCEPTE GENERALE

Statistica reprezint o parte important din preocuprile actuale ale
biologilor i ecologilor. Termenul statistic este folosit n dou ipostaze:
fie se refer la colecii de informaie cantitativ i la metode de procesare a
acestora, fie la procesul de stabilire a unor concluzii privind grupuri de
dimensiuni mari, n urma analizei unor pri din aceste grupuri.
Statistica este tiina care se ocup cu organizarea, descrierea i
analiza numeric a fenomenelor cuantificabile, dezvluind particularitile
lor de volum, structur, dinamic, conexiune, precum i regulile sau legile
care le guverneaz.
Pentru ecologi i pentru cei care, n general, studiaz fenomene
variabile cu implicaii preponderent probabilistice, statistica este util pentru
dirijarea colectrii, organizrii i prezentrii datelor, precum i pentru
tragerea concluziilor cu o anumit probabilitate sau grad de incertitudine de
pe urma analizei datelor.
Trebuie menionat c o analiz statistic nu demonstreaz nimic, ci
doar indic probabilitatea unui anumit rezultat sau concluzii trase n urma
analizei datelor.
Att n statistic, ct i n cadrul ecologiei i a celorlalte ramuri ale
biologiei, apare noiunea de populaie. Accepiunea biologic a acestui
termen este de grup de indivizi ce aparin unei anumite specii, ntre care se
stabilesc interaciuni i ale cror gene alctuiesc un genofond omogen. Din
punct de vedere statistic, populaia are un neles mai larg dect cel biologic,
referindu-se la o colecie de uniti individuale, ce constituie obiectul unei
investigaii. Populaia statistic reprezint un grup de entiti de un anumit
tip din univers sau dintr-o subdiviziune specificat a universului. Este
grupul de dimensiuni mari pe care dorim s-l cunoatem. Aa cum spuneam
n primul paragraf, cunoaterea unui astfel de grup sau populaii se poate
face prin intermediul analizei unei pri. O astfel de parte, care este extras
din populaie pentru a fi studiat, se numete n general eantion sau prob.
Noi vom folosi n continuare noiunea de prob bine ncetenit n
Concepte generale 9
comunitatea tiinific ecologic. Deci proba este un grup mai mic, dar
reprezentativ pentru populaia din care a fost extras.
Studiul unei populaii presupune investigarea uneia sau mai multor
caracteristici ale unitilor din probe, caracteristici care se numesc variabile.
Valorile unei variabile corespunztoare entitilor unei populaii se numesc
valori individuale. Valorile individuale cunoscute, corespunztoare
unitilor din probe, se numesc date sau observaii.
n ecologie, de multe ori, se numr entitile dintr-un grup sau
dintr-o colecie. Pentru ca o astfel de numrtoare s aib valoare, trebuie
specificat dimensiunea grupului sau coleciei, care se numete unitatea de
prob. Un set de uniti de prob alctuiesc o prob, iar observaia este
numrul de entiti dintr-o anumit unitate de prob.
Principala diferen dintre numrtori i msurtori este, n cazul
msurtorilor, lipsa unui control asupra dimensiunii unitilor de prob.
Atunci cnd se numr entiti, se poate decide care este unitatea de prob.
Coninutul unei capcane sau ptrat de prob reprezint o prob dac
entitile investigate sunt msurate, i o unitate de prob dac entitile sunt
doar numrate.
O ntrebare cu un rspuns nu ntotdeauna evident se refer la
identificarea populaiei din care provin unitile de prob. Dac ceea ce s-a
capturat din zece capcane de sol constituie o prob, care este populaia din
care a fost extras aceast prob? n acest caz, populaia este reprezentat de
numrul total de capcane care ar fi putut fi instalate n ntreaga suprafa de
studiu. O astfel de populaie este una ipotetic.
Pentru ca o prob s fie reprezentativ pentru populaia din care a
fost extras este necesar ca prelevarea acesteia s fie fcut aleator,
randomizat sau la ntmplare. Aceasta nseamn c unicul criteriu folosit
n extragerea unitilor de prob este ca toate unitile s aib anse egale de
a face parte din prob. De exemplu, dac proba se obine cu ajutorul unor
capcane cu momeal, animalele care vor cdea n acestea vor fi cele mai
flmnde i eventual cu o greutate mai mic. Astfel, proba obinut nu va fi
reprezentativ pentru populaie, deoarece animalele cu o greutate mai mic
au anse mai mari s fie capturate dect cele cu o greutate mai mare i care
sunt mai stule. Dac proba nu este reprezentativ, atunci generalizrile care
se vor face pornind de la aceasta, cu privire la ntreaga populaie, vor fi
eronate. Dac ne referim la exemplul anterior, proba obinut cu ajutorul
10 Elemente de statistic aplicate n ecologie
capcanelor cu momeal este reprezentativ pentru populaia statistic a
animalelor flmnde din populaia biologic. Obinerea unor probe aleatoare
este asigurat de metodele de lucru utilizate n funcie de caracteristicile
entitilor urmrite. n cazul n care exist suspiciunea c o prob nu este
aleatoare, acest lucru trebuie specificat sau concluziile rezultate prin
extrapolare trebuie legate de populaia statistic din care proba a fost
extras.
Un alt aspect important este reprezentat de independena
observaiilor din probe. Aceasta se refer la faptul c apariia unei anumite
valori individuale ntr-o prob nu influeneaz probabilitatea de apariie n
prob a altei valori. De exemplu, dac se studiaz o populaie ipotetic
format din zece entiti, probabilitatea de a extrage o entitate este de 11u,
iar dac nu se face reintroducere, probabilitatea de a extrage urmtoarea
entitate este de 19 i aa mai departe. Deci extragerea unei entiti
modific probabilitatea de extragere a celorlalte i observaiile nu sunt
independente. O astfel de situaie nu trebuie s constituie un motiv de
preocupare n cazul populaiilor mari, aa cum sunt majoritatea populaiilor
biologice.
Uneori, obinerea unor observaii neindependente este intenionat.
De exemplu, cnd se dorete studierea efectului unui anumit tratament
asupra variabilei, se fac observaii repetate asupra acelorai entiti pentru a
evidenia dac deosebirile dintre observaii sunt diferite semnificativ, adic
dac tratamentul a modificat valorile variabilei semnificativ. Dac ns se
fac observaii repetate asupra unei singure entiti, atunci concluziile
rezultate nu pot fi extrapolate la populaia de provenien a entitii
respective, deoarece proba cu dimensiunea unu nu este reprezentativ.
Un descriptor sau o msur a unei variabile n prob se numete
statistic. O statistic a unei probe se folosete de obicei pentru a estima un
parametru al populaiei. De exemplu, media valorilor dintr-o prob este o
statistic, iar media populaiei din care a fost extras proba, un parametru.
Dat fiind faptul c n ecologie sunt rare cazurile n care se poate afla media
unei populaii prin investigarea fiecrei uniti de prob, media populaiei
respective poate fi estimat pornind de la statistica probei reprezentative.
Populaiile ipotetice au parametri ipotetici i sunt de obicei folosite
pentru comparaii. De exemplu, media numrului de plante dintr-o anumit
specie din zece ptrate de 1 m
2
este o estimare a mediei numrului de plante
Concepte generale 11
per ptrat sau metru ptrat, adic parametrul populaiei de ptrate care s-ar
putea delimita n aria de studiu. Astfel de parametri sunt utili atunci cnd se
compar diferite zone de studiu (dou zone stepice, dou zone de pdure,
dou bazine acvatice etc.).
Atunci cnd se estimeaz un parametru populaional pornind de la
statistica corespunztoare, dimensiunea probei sau numrul unitilor de
prob are o mare importan. n general, cu ct proba are o dimensiune mai
mare, cu att va fi mai reprezentativ pentru populaia de provenien i
estimarea parametrilor mai precis. Totui obinerea unor probe extrem de
numeroase este uneori imposibil sau presupune un efort foarte mare care ar
putea fi investit n alte direcii de cercetare. Astfel, este bine s existe un
echilibru ntre aceste dou aspecte, ntre dimensiunea probei i efortul
necesar obinerii acesteia.

2. APRECIEREA I PREZENTAREA DATELOR

Variabilele sunt caracteristici sau caractere care au valori ce pot fi
diferite de la un individ la altul, ntr-o populaie. Deci o variabil poate lua
mai multe valori individuale n populaia studiat. Valorile individuale
determinate prin investigarea unor indivizi sau uniti dintr-o prob se
numesc date.

2.1. SCALE DE MSURARE I TIPURI DE VARIABILE

De exemplu, ntr-o populaie de peti dintr-o anumit specie, se
investigheaz lungimea indivizilor. Lungimea reprezint o caracteristic sau
un caracter al tuturor indivizilor din populaie, deci este o variabil.
Lungimea petilor are valori diferite de la un individ la altul sau de la un
grup de indivizi la altul. Aceste valori ale tuturor indivizilor din populaie se
numesc valori individuale. Dac se captureaz un anumit numr de peti (se
extrage o prob) din populaia de studiu i se msoar lungimea fiecrui
individ, valorile individuale astfel determinate constituie datele.
n funcie de relaiile ce se pot stabili ntre valorile individuale ale
unei variabile, aceasta poate aparine unui anumit tip de variabil, care la
rndul su poate fi apreciat pe o anumit scal cu anumite reguli i limitri.
n general, sunt recunoscute patru astfel de scale de apreciere a variabilelor:
nominal, ordinal, de interval i de raport. Relaia dintre aceste scale
este una ierarhic, adic o scal de nivel superior ncorporeaz proprietile
scalelor inferioare acesteia.

Scala nominal. Este cea mai simpl modalitate de apreciere a
variabilelor. n esen, permite doar identificarea categoriilor n care valorile
individuale pot fi clasificate. Categoriile se exclud reciproc, adic o anumit
valoare poate aparine doar unei singure categorii din scal. Variabilele
corespunztoare acestei scale se numesc variabile nominale sau atribute.
Aprecierea i prezentarea datelor 13
Oricare dou valori ale unei astfel de variabile pot aparine aceleiai
categorii sau la dou categorii diferite ale scalei ordinale, cu alte cuvinte pot
fi egale sau diferite (tab. 2.2).
De exemplu, sexul indivizilor unei populaii este o variabil
nominal, ale crei valori individuale posibile sunt mascul i femel. Doi
indivizi dintr-o populaie pot avea acelai sex (mascul sau femel) sau pot
avea sexe diferite (unul este mascul, cellalt este femel) la un moment dat.
Deci valorile variabilei sex pot fi egale (aparin aceleiai categorii a scalei
nominale) sau diferite (aparin la categorii diferite ale scalei nominale). Alte
exemple de variabile nominale ntlnite n ecologie sunt: culoarea, tipul de
habitat, specia.

Scala ordinal. Aceasta include proprietile scalei nominale
(identificare i clasificare), la care se mai adaug posibilitatea de ordonare a
categoriilor ntr-o serie, de la valoarea cea mai mic la cea mai mare, sau de
specificare a magnitudinii acestora. Variabilele corespunztoare acestei
scale se numesc variabile ordinale. Oricare dou valori ale unei astfel de
variabile pot fi egale sau diferite. n cazul n care sunt diferite, valorile se
pot ordona, adic se poate spune c una dintre valori este mai mare dect
cealalt (tab. 2.2). n general, valorile variabilelor ordinale se reprezint sub
form de magnitudine relativ.
De exemplu, dac ntr-o populaie de lupi urmrim variabila
agresivitate, valorile individuale pot fi neagresiv, puin agresiv,
agresiv i foarte agresiv. Doi indivizi pot fi egali sau diferii din punctul
de vedere al agresivitii, iar dac sunt diferii, atunci se poate determina c
unul este mai agresiv dect cellalt (c o valoare este mai mare dect
cealalt), dar nu se poate spune exact cu ct.
O alt modalitate de a reprezenta valorile pe scala ordinal const n
folosirea unor simboluri numerice corespunztoare magnitudinii valorilor,
numite ranguri. Rangurile sunt utile mai ales cnd se urmrete
reprezentarea unei variabile pe o scal cu mai multe categorii ordinale.
Astfel, valoarea cea mai mic, neagresiv din exemplul anterior, primete
rangul unu, urmtoarea doi i aa mai departe.
Un exemplu de scal ordinal este scala DAFOR (acronimul este
format prin preluarea primei litere a valorilor scalei), utilizat pentru
aprecierea abundenei unei specii de plante ntr-un ptrat de prob (tab. 2.1).
14 Elemente de statistic aplicate n ecologie

Tabelul 2.1
Valoare Dominat Abundent Frecvent Ocazional Rar
Rang 5 4 3 2 1

Trebuie reinut c valorile numerice ale rangurilor nu pot fi folosite
pentru a efectua operaii simple, deoarece acestea nu au sens valoarea
abundent nu este de dou ori mai mare dect valoarea ocazional sau
diferena dintre valoare dominant i valoarea abundent poate s nu fie
egal cu cea dintre valorile ocazional i rar. Rangurile sunt doar
simboluri numerice care arat magnitudinea valorilor sau poziia lor n setul
de valori ordonate.

Scala de interval. Permite att ordonarea datelor, ct i precizarea
distanei dintre unitile scalei. Valorile exprimate pe aceast scal pot fi
sczute unele din altele pentru a afla exact care este diferena dintre ele. Din
cauza faptului c scala de interval nu are o valoare zero absolut, nu se
poate realiza mprirea valorilor pentru a afla cu ct una este mai mare
dect cealalt (tab. 2.2).
De exemplu, variabila de tip dat este apreciat pe o scal de
interval. Dac trei specii de psri de talie mic (paseriforme) revin din
migraie pe 5, 10 i 15 mai, putem spune c a treia specie ajunge cu zece zile
mai trziu dect prima, dar nu putem spune c are nevoie de trei ori mai
mult timp pentru a ncheia migraia. Un alt exemplu de scal de interval este
scala Celsius de apreciere a temperaturii: uC este o valoare convenional,
aleas s desemneze temperatura de nghe a apei. Ca urmare, o temperatur
de 1uC nu nseamn de dou ori mai cald dect SC. Datorit faptului c
scala Celsius de apreciere a temperaturii nu are un zero absolut, aceasta
prezint i valori negative care nu ar putea exista n cazul unei valori zero
absolute.

Scala de raport. Pe lng proprietile celorlalte scale (identificare,
clasificare, ordonare, precizarea diferenei), aceasta mai permite i
mprirea valorilor unele la altele pentru a putea afla de cte ori una este
mai mare dect cealalt (tab. 2.2).
De exemplu, lungimea se apreciaz pe scal de raport, iar o lungime
de Su cm este de trei ori mai mare dect una de 1u cm.
Aprecierea i prezentarea datelor 15
Aceast proprietate este posibil datorit faptului c scalele de raport
au valori zero absolute, adic zero nseamn nimic, vid. Ca urmare, aceste
scale nu pot prezenta valori negative.
De exemplu, scala Kelvin de apreciere a temperaturii este o scal de
raport, deoarece valoarea uK ( 27S,1SC) reprezint temperatura fa de
care nimic nu poate fi mai rece i la care n materie nu mai exist energie
sub form de cldur.

Variabilele corespunztoare scalei de interval i scalei de raport pot
fi de dou tipuri: discontinui i continui.
Variabilele discontinui sau discrete pot lua anumite valori (de
obicei, ntregi i pozitive), ntre care nu exist valori intermediare. Aceste
variabile reprezint caractere numrabile sau meristice (numr de solzi,
numr de ou, numr de elemente florale, numr de pui etc.). De exemplu,
dimensiunea pontei unei psri este o variabil discret, ale crei valori sunt
ntregi i pozitive; nu exist cuiburi cu numr fracionar de ou.
Variabilele continui pot lua orice valoare dintr-un anumit interval,
iar ntre oricare dou valori exist o infinitate de valori posibile. Aceste
variabile reprezint caractere msurabile sau metrice (lungime, lime,
nlime, greutate, temperatur etc.). De exemplu, ntre 1u cm i 11 cm pot
exista, n principiu, o infinitate de valori posibile, n funcie de numrul
zecimalelor considerate.

Tabelul 2.2. Caracteristicile eseniale ale tipurilor de variabile
Scala de apreciere a variabilelor Semnele care se pot pune ntre valori
Nominal =; =
Ordinal =; =; <; >
De interval
=; =; <; >;
De raport
=; =; <; >; ;

Conversia datelor de la o scal la alta
Conversia datelor se poate face doar n sensul pierderii unei pri din
informaia deinut de acestea. Ca urmare, conversia se poate face doar de la
o scal superioar ierarhic ctre una de nivel inferior. Astfel, datele
msurate pe o scal de interval sau de raport pot fi convertite la o scal
ordinal sau nominal. Datele msurate pe o scal ordinal pot fi convertite
doar la o scal nominal.
16 Elemente de statistic aplicate n ecologie
Exemplul 2.1. Dac s-au determinat nlimile unor plante de step
n centimetri, variabila urmrit, nlimea, este una continu, exprimat pe
o scal de raport. Pentru a realiza conversia la o scal ordinal, se dau
ranguri valorilor iniiale. Astfel, valoarea cea mai mic va primi rangul 1,
urmtoarea 2, iar valoarea cea mai mare va primi rangul maxim. nlimea
de 1S cm va primi rangul 1, ceea ce arat c este vorba de valoarea cea mai
mic, iar nlimea de 2S cm va primi rangul 9, adic valoarea maxim din
prob. Valorile egale ale nlimii vor primi media rangurilor pe care le-ar fi
primit dac ar fi fost diferite. Observm n tabelul 2.3 c exist trei valori
egale, de 1S cm, i alte dou valori egale ntre ele, de 17 cm. Cele trei
valori de 1S cm, dac ar fi fost diferite, ar fi primit rangurile 2, S i 4. Fiind
egale, primesc media rangurilor pe care le-ar fi primit dac ar fi fost diferite,
adic (2 +S +4)S = S. La fel se procedeaz i n cazul celor dou valori
de 17 cm media rangurilor pe care le-ar fi primit dac ar fi fost diferite
este (S +6)2 = S,S. n continuare, pentru conversia la o scal ordinal,
se consider o valoare de referin a nlimii din prob, dup care toate
celelalte valori se exprim n relaie cu aceasta: egale cu valoarea de
referin sau diferite de aceasta. Dac din anumite motive ne intereseaz
plantele cu nlimea de 17 cm, atunci vom avea dou valori = 17 i
apte valori = 17

Tabelul 2.3
nlimea (cm), scal de
interval sau raport
13 15 15 15 17 17 19 21 23
Ranguri intermediare
(dac valorile ar fi diferite)
1 2 3 4 5 6 7 8 9
Ranguri, scal ordinal 1 3 3 3 5,5 5,5 7 8 9
Valori nominale, scal
nominal
17 17 17 17 =17 =17 17 17 17

Cea mai frecvent conversie este cea de la datele apreciate pe o scal
de interval sau de raport, la una ordinal. O astfel de conversie este necesar
atunci cnd datele vor fi analizate prin metode neparametrice, deoarece nu
sunt ndeplinite condiiile de aplicare ale metodelor parametrice.

Variabile derivate
n anumite situaii, variabilele originale sunt procesate matematic,
Aprecierea i prezentarea datelor 17
astfel nct s rezulte variabile derivate cum ar fi: rapoarte, proporii,
procente i rate.
Raportul este o relaie simpl ntre dou numere. De exemplu, dac
lungimea capului la o viper de step este 17,7 mm i limea de 11,7 mm,
raportul lungime:lime este de 17,7: 11,7. Implicit, raportul lime:lungime
este de 11,7: 17,7. Uneori, una dintre valori poate fi convertit prin
mprire la unitate. De exemplu, dac ntr-o prob sunt 19 mosculi i
27 cmclc, atunci raportul masculi:femele este 19: 27 sau 1: 2719, adic
1: 1,421. Raportul poate fi scris i ca o fracie. n cazul exemplului anterior,
raportul dintre masculi i femele este de 1927 = 11,421. Rezultatul
calculrii fraciei se numete coeficient; astfel, 11,421 = u,7u4.
Proporia este raportul dintre parte i ntreg. Dac lungimea total a
unei vipere de step este 49u mm, iar lungimea cozii este 6S mm, proporia
reprezentat de coad este 6S: 49u = u,1S. Dac se calculeaz o proporie
pornind de la raportul dintre numrul de valori dintr-o categorie i numrul
total de valori din toate categoriile, atunci aceasta se numete frecven
proporional.
Procentul se obine prin nmulirea valorii unei proporii cu 1uu.
Rata reprezint raportarea unei observaii la unitatea de timp. Ratele
se folosesc pentru a exprima anumite variabile cum ar fi creterea, dinamica
unei populaii, micarea.
De exemplu, dac o plantul crete 1S cm n 1u zilc, atunci rata de
cretere este de 1S1u = 1,S cmzi.

Numeroi indici ecologici cum ar fi indicii de diversitate sunt de fapt
variabile derivate. Uneori acestea pot fi analizate prin metode statistice dar
numai dup o conversie sau transformare prealabil a datelor.

2.2. REPREZENTAREA DATELOR

Unul dintre inconvenientele majore ale prezentrii datelor sub form
de tabele const n faptul c informaia nu este evident imediat. Ea poate fi
perceput doar dup o analiz n detaliu a fiecrei valori sau a majoritii
valorilor din tabel. Pentru facilitarea percepiei informaiei coninute de
date, este necesar procesarea i transformarea acestora ntr-o prezentare
vizual. Modalitatea cea mai des utilizat de prezentare a datelor const n
18 Elemente de statistic aplicate n ecologie
folosirea reprezentrilor grafice. Tipul de reprezentare grafic se alege n
funcie de tipul de variabil.
Reprezentarea variabilelor discrete. Procesarea datelor const n
acest caz n aranjarea lor n tabelul de distribuie a frecvenelor, adic se
prezint fiecare valoare a variabilei i frecvena corespunztoare acesteia,
adic de cte ori se ntlnete o anumit valoare n prob.
Exemplul 2.2. ntr-un studiu se urmrete numrul de fitoindivizi
(de plante) din specia Crambe tataria n 20 de ptrate de 10x10 m dintr-o
pajite stepic. Tabelul de distribuie a frecvenelor se prezint astfel:

Tabelul 2.4
Nr. fitoindivizi/ptrat (x) 0 1 2 5 7 10 16 19 38 60
Frecvena () 5 4 3 1 1 2 1 1 1 1

n continuare se reprezint grafic pe abscis valorile ordonate ale
variabilei (x), iar pe ordonat valorile frecvenelor () corespunztoare
valorilor variabilei. Practic, frecvena fiecrei valori a variabilei este
reprezentat printr-o coloan cu nlime corespunztoare. Se obine astfel o
diagram n coloane (dreptunghiuri) a distribuiei frecvenelor unei variabile
discrete. Trebuie remarcat spaiul dintre coloanele corespunztoare valorilor
ordonate ale variabilei acesta sugereaz absena valorilor intermediare
dintre valorile alturate ale unei variabile discrete (fig. 2.1).

Figura 2.1. Diagrama reprezentrii frecvenelor prin coloane

Diagrama poate fi realizat i prin reprezentarea frecvenelor prin
0
1
2
3
4
5
6
0 1 2 5 7 10 16 19 38 60
f
x
Aprecierea i prezentarea datelor 19
puncte (fig. 2.2). n acest caz, se impune ca acestea s nu fie unite, pentru a
sugera, ca i n cazul spaiului dintre coloanele graficului anterior, c este
vorba de valorile unei variabile discontinue.

Figura 2.2. Diagrama reprezentrii frecvenelor prin puncte

Aceleai tipuri de reprezentri pot fi utilizate i pentru reprezentarea
distribuiei frecvenelor variabilelor nominale i a celor ordinale. n cazul
variabilelor nominale, ordinea valorilor acestora pe abscis este arbitrar.
Reprezentarea variabilelor continui. Datorit faptului c
variabilele continui iau valori din aproape n aproape, exist posibilitatea ca
o prob s nu conin nici mcar dou valori identice. Ca urmare, nu se mai
poate opera cu frecvena unei singure valori, pentru c, ntr-o astfel de
situaie, toate valorile fiind diferite, vor avea frecvena egal cu 1, adic vor
aprea n prob o singur dat. Astfel, n cazul n care se dorete
reprezentarea distribuiei frecvenelor valorilor unei variabile continui, este
necesar gruparea valorilor din prob n clase de frecven, ceea ce implic
parcurgerea mai multor etape de procesare a datelor:
1. Aflarea numrului de clase. Numrul de clase (k) este rezultatul
rotunjit la cel mai apropiat ntreg, ce se poate afla folosind una din
urmtoarele dou relaii:

k = 1 +S,S log
10
(n) sau k < S log
10
(n)
n numrul de valori din prob.

0
1
2
3
4
5
6
0 1 2 5 7 10 16 19 38 60
f
x
20 Elemente de statistic aplicate n ecologie
2. Aflarea intervalului de clas. Intervalul de clas (h) este rezultatul
relaiei:

b =
x
mcx
-x
min
k

x
mux
valoarea maxim (cea mai mare) din prob;
x
mn
valoarea minim (cea mai mic) din prob.

3. Aflarea limitelor fiecrei clase. Pentru fiecare clas trebuie aflat
limita inferioar (x
|n
) i limita superioar (x
xup
). n general, relaia dintre
cele dou valori pentru oricare clas k este:

x
sup
k
= x
n]
k
+b .

Limita inferioar a primei clase va fi egal cu valoarea cea mai mic
din prob dac aceasta este un numr ntreg, adic pentru k = 1, x
n]
1
=
x
mn
. Dac x
mn
nu este un ntreg, atunci x
n]
1
va fi ntregul aflat prin
rotunjirea prin lips al lui x
mn
. Limita superioar a primei clase se va afla
adunnd la valoarea minim sau la limita inferioar a clasei valoarea
intervalului de clas, conform relaiei:

x
sup
1
= x
n]
1
+b sau x
sup
1
= x
mn
+b .

Pentru a afla x
n]
2
, la x
sup
1
se va aduga 1. Astfel, ntre cele dou
clase nu va exista nici un fel de suprapunere, adic o valoare din prob egal
cu x
sup
1
va face parte doar din prima clas. n acest fel se vor afla limitele
celorlalte clase. Ultima clas, k, va trebui s includ valoarea cea mai mare
mux
.

4. Aflarea frecvenei fiecrei clase. Frecvena claselor se va afla prin
numrarea valorilor din prob cuprinse ntre limita inferioar i cea
superioar a fiecrei clase. n final, trebuie ca fiecare valoare din prob s
fie inclus ntr-una din clase. Suma frecvenelor tuturor claselor trebuie s
fie egal cu numrul de valori din probe, adic = n.
Frecvenele claselor se pot reprezenta sub forma unei histograme.
Spre deosebire de diagrama frecvenelor prezentat pentru variabilele
Aprecierea i prezentarea datelor 21
discrete, histograma are coloanele unite, ceea ce sugereaz continuitatea
dintre clasele de frecven ale valorilor unei variabile continui.
O alt modalitate de reprezentare a frecvenelor claselor este i
poligonul frecvenelor. Acesta se construiete prin unirea punctelor ale cror
coordonate sunt reprezentate de mijlocul intervalului de clas i de frecvena
clasei respective. Mijlocul intervalului de clas se afl calculnd media
aritmetic dintre limitele fiecrei clase:

mijlocul clasei k =
x
in]
k
+x
sup
k
2
.

Toate rezultatele obinute n urma procesrii datelor se nscriu n
tabelul de frecvene (tab. 2.5), care trebuie s cuprind: clasa, limitele clasei,
mijlocul intervalului de clas i frecvena fiecrei clase.

Exemplul 2.3. n cadrul unui studiu s-a msurat lungimea n mm a
100 de peti dintr-o anumit specie.

194 140 226 269 284 243 303 235 229 239
206 262 233 307 285 180 248 205 284 191
154 224 307 236 198 288 241 252 385 220
299 273 275 164 137 357 246 271 246 276
229 280 227 253 286 190 291 297 296 288
225 234 244 351 267 265 239 283 190 244
288 245 289 241 289 278 255 253 240 153
208 328 235 283 214 300 228 204 343 228
194 233 218 321 303 254 225 232 196 245
223 305 220 338 269 224 319 259 240 293

n = 1uu
k = 1 +S,S log
10
(1uu) = 7,6 = 8
x
mux
= S8S
x
mn
= 1S7
b =
385-137
8
= S1
22 Elemente de statistic aplicate n ecologie
Tabelul 2.5. Tabelul de distribuie a frecvenelor claselor de lungime (mm)
k x
inf
x
sup
mijloc f F (f cumulat)
1 137 168 152,5 5 5
2 168 199 183,5 8 13
3 199 230 214,5 19 32
4 230 261 245,5 27 59
5 261 292 276,5 23 82
6 292 323 307,5 12 94
7 323 354 338,5 4 98
8 354 385 369,5 2 100

Figura 2.3. Histograma frecvenelor

Figura 2.4. Poligonul frecvenelor
0
5
10
15
20
25
30
1 2 3 4 5 6 7 8
F
r
e
c
v
e
n

a

(
f
)
Clasa (k)
0
5
10
15
20
25
30
152,5 183,5 214,5 245,5 276,5 307,5 338,5 369,5
F
r
e
c
v
e
n

a

(
f
)
Clasa (mijloc)

3. DESCRIEREA STATISTIC A PROBELOR
ECOLOGICE

Statistica descriptiv este partea statisticii care se ocup de culegerea
i de clasificarea datelor statistice i, pe aceast baz, de descrierea
fenomenelor investigate. Rolul ei este de a rezuma cantitativ informaia
culeas, de a descrie i de a pune n eviden esenialul, n fine, de a realiza
sinteze cu ajutorul unui limbaj numeric.
n natur, atunci cnd investigm o populaie, rareori ntlnim valori
individuale identice ale unor variabile. La o privire mai atent a datelor, se
poate observa existena unor valori n jurul crora tind s se distribuie
majoritatea, dac nu toate celelalte valori individuale. Descrierea statistic a
probelor prelevate din populaii scoate n eviden dou aspecte eseniale:
tendina central i variabilitatea valorilor individuale.

3.1. TENDINA CENTRAL

Tendina central a unor date reprezint o valoare sau o condiie
reprezentativ pentru toate datele din prob sau pentru valorile individuale
din populaie. De exemplu, enunuri ca majoritatea florilor dintr-o prob au
culoarea roie sau diametrul mediu al florilor este de 2 cm surprind
tocmai aceast tendin central a valorilor individuale din probe.
n funcie de scala de apreciere a datelor din prob i implicit a
caracteristicilor tipului de variabil urmrit, exist mai multe msuri sau
descriptori ai tendinei centrale, dintre care cei mai des utilizai sunt: modul,
mediana i media.

Modul (Mo). Msura tendinei centrale, reprezentat de valoarea din
prob cu frecvena cea mai mare, adic cel mai des ntlnit, se numete
mod. De exemplu, dac o prob este reprezentat de 20 de plante la care se
urmrete culoarea florilor, iar zece dintre acestea au flori de culoare roie,
apte au flori de culoare violet i trei sunt grena, atunci modul probei va fi
24 Elemente de statistic aplicate n ecologie
valoarea rou a variabilei culoarea florilor. Aa cum reiese din acest
exemplu, modul se poate folosi pentru descrierea tendinei centrale a unei
variabile apreciate pe o scal nominal; de fapt este singurul descriptor de
acest fel ce se poate folosi pentru valorile unei variabile nominale. Modul se
poate folosi i pentru celelalte tipuri de variabile ordinale, discrete i
continui. n cazul variabilelor continui, se poate ca modul s nu poat fi
aplicat. Dat fiind faptul c aceste variabile iau valori din aproape n aproape
i c ntre oricare valori alturate exist un numr infinit de valori posibile,
se poate ntmpla ca ntr-o prob toate valorile s fie diferite, caz n care
frecvena fiecrei valori va fi egal cu unu. Deci, ntr-o astfel de situaie, nu
exist nici o valoare cu frecven mai mare dect celelalte i modul nu se
poate calcula dect pentru clasele de frecven.
n exemplul 2.3 lungimea petilor este o variabil continu. Modul
probei este 288, pentru care exist 3 valori. Dac toate valorile ar fi fost
diferite, atunci s-ar fi putut afla clasa modal de distribuie a frecvenelor ca
fiind clasa cu frecvena cea mai mare. n cazul exemplului luat n discuie,
clasa modal este clasa nr. 4 cu frecvena 27.
Dac ntr-o distribuie a frecvenelor apar mai multe vrfuri de
frecven sau moduri, aceasta va fi numit distribuie multimodal. Multe
caractere rspunztoare de dimorfismul sexual prezint n populaii o
distribuie bimodal. n figura 3.1 apare o astfel de distribuie bimodal:
modul pentru femele este 29 de plci subcaudale, iar pentru masculi este 37.

Figura 3.1. Diagrama distribuiei frecvenelor numrului de subcaudale la
Vipera ursinii moldavica
0
1
2
3
4
5
6
7
8
2
5
2
6
2
7
2
8
2
9
3
0
3
1
3
2
3
3
3
4
3
5
3
6
3
7
3
8
3
9
4
0
4
1
f
Nr. subcaudale
femele
masculi
Descrierea statistic a probelor ecologice 25
n cazul unor astfel de distribuii, care nu sunt simetrice fa de o
singur valoare a tendinei centrale, se recomand ca analiza statistic s se
fac separat, pe categorii discrete din prob masculi, femele, juvenili
pentru care datele se prezint mai mult sau mai puin simetrice.

Mediana (Me). Este msura tendinei centrale care reprezint
valoarea central sau media valorilor centrale ale unui set de date ordonate
cresctor. Valoarea central este cea care, n setul de date ordonat cresctor,
este precedat i succedat de acelai numr de valori individuale. Rezult
c mediana se poate utiliza pentru date care se pot ordona, adic pentru date
msurate pe o scal de raport, interval sau ordinal, i se poate folosi pentru
datele apreciate pe o scal nominal. Este considerat una dintre cele mai
robuste msuri ale tendinei centrale, deoarece nu este influenat de
eventualele valori atipice, cum se poate ntmpla n cazul mediei, i se poate
utiliza chiar i n cazurile n care se cunosc doar magnitudinile (sau
rangurile) unor valori ce nu au fost nregistrate.
Modalitatea de calcul a medianei depinde de numrul valorilor din
prob (n):
dac proba are un numr par de date (n = 2k +1), atunci mediana
va fi reprezentat de valoarea central:

pt. n = 2k +1, atunci Hc = x
k+1
sau Hc = x
(n+1)2
.

De exemplu, pentru seria de date 1, 2, 2, 3, 4, 4, 5, Hc = S, pentru
c are un numr egal de valori la stnga i la dreapta sa.

dac proba are un numr par de date (n = 2k), atunci mediana va
fi reprezentat de media celor dou valori centrale sau de intervalul median:

pt. n = 2k, atunci Hc =
x
k
+x
k+1
2
sau Hc =
x
n2
+x
(n2)+1
2
.

De exemplu, pentru seria de date 1, 2, 2, 3, 4, 5, 6, 7, cele dou
valori centrale sunt 3 i 4, deci Hc = (S +4)2 = S,S.

n cazul n care exist numeroase observaii cu aceeai valoare cu
cea a medianei datorit prezentrii datelor sub form de intervale de clas,
26 Elemente de statistic aplicate n ecologie
atunci formulele de calcul se modific astfel:
pt. n = 2k +1, atunci Hc = x
n]Mc
+b
1
2
(])-P
Mc-1
]
Mc
;
pt. n = 2k, atunci Hc = x
n]Mc
+b
1
2
(1+])-P
Mc-1
]
Mc
,
x
n] Mc
limita inferioar a clasei mediane (clasa de frecven ce
conine valoarea median);
b valoarea intervalului de clas;
suma frecvenelor tuturor claselor;
F
Mc 1
frecvena cumulat a clasei dinaintea clasei mediane (suma
frecvenelor claselor care preced clasa median);

Mc
frecvena clasei mediane.

Exemplu 3.1. ntr-un studiu s-a urmrit acoperirea procentual
realizat de o specie de ierburi de step, n 20 de suprafee de prob.

Acoperire 80-100% 60-80% 40-60% 20-40% 0-20% f

Frecvena (f) 1 2 9 6 2 20

Conform definiiei medianei, aceasta ar trebuie s reprezinte media
acoperirilor din suprafeele de prob 1u i 11. Valorile exacte ale acoperirii
nu sunt accesibile, acestea fiind aproximate prin clase de acoperire. Acestea
sunt echivalente din punct de vedere statistic unor clase de distribuie a
frecvenelor. Dac simbolizm fiecare observaie prin procentul mediu al
fiecrei clase, datele se prezint astfel:

10 10 30 30 30 30 30 30 50 50
50 50 50 50 50 50 50 70 70 90

Cifrele scrise ngroat ar reprezenta cele dou valori centrale
necesare calculrii medianei n cazul unui numr par de date. Se observ c
sunt mai multe valori egale cu Su; sunt 9 valori n clasa (intervalul)
median. Frecvena cumulat a clasei de dinaintea celei mediane este
2 +6 = 8. Deci, pn la prima valoare central, mai sunt 2 suprafee de
prob. Rezult c prima valoare central se gsete la 29 din intervalul
clasei mediane. Intervalul de clas este egal cu 2u%; 29 din 2u reprezint
Descrierea statistic a probelor ecologice 27
4,4S. Dac la aceast valoare adugm limita inferioar a clasei mediane
(4u), obinem 44,4S, adic prima valoare central a acoperirii. Folosind
acelai raionament, se obine i a doua valoare central: 4u +2u S9 =
46,67. Mediana va fi egal cu media celor dou valori centrale: (44,4S +
46,67)2 = 4S,S6.
O alt modalitate const n aplicarea formulei de mai sus, care are la
baz acelai raionament:
x
n] Mc
= 4u
b = 2u
= 2u
F
Mc1
= 8

Mc
= 9

Hc = 4u +2u
1
2
(1+20)-8
9
= 4u +2u
2,5
9
= 4S,S6 .

Media (x, ). Este unul dintre cei mai cunoscui i mai utili
descriptori ai tendinei centrale. Exist mai multe tipuri de medie, dar cel
mai utilizat este media aritmetic. Dac se calculeaz media lund n
consideraie toi indivizii unei populaii, atunci aceasta se numete medie
populaional, este un parametru populaional i se noteaz cu . Media
obinut n urma analizei datelor dintr-o prob sau media probei este o
statistic a probei simbolizat cu x. Media probei poate fi un estimator
direct al mediei populaionale (x estimeaz pe p).
Formula de calcul a mediei este suma tuturor valorilor supra
numrul acestora:
pentru populaie p =
x
N
;
pentru prob x =
x
n
,
x fiecare valoare individual din populaie sau prob;
N numrul tuturor valorilor individuale din populaie;
n numrul tuturor valorilor din proba prelevat din populaie.

Relaia dintre medie, median i mod.
n cazul unei variabile a crei valori individuale sunt distribuite
perfect simetric, media, mediana i modul sunt egale. n cazul unei
Hc = x
n]Mc
+b
1
2
(1+])-P
Mc-1
]
Mc

28 Elemente de statistic aplicate n ecologie
distribuii uor asimetrice unimodale, mediana se dispune ntre medie i
mod. n majoritatea distribuiilor biologice se observ o abatere pozitiv,
adic media are valoare mai mare dect mediana, care la rndul ei este mai
mare dect modul (fig. 3.2).

Figura 3.2. Relaia dintre mod, median i medie: A distribuie simetric; B
distribuie asimetric

Dintre cele trei msuri ale tendinei centrale, media este singura care
ine cont de toate datele din probe i astfel sintetizeaz ntreaga informaie
furnizat de acestea. Valoarea mediei este folosit n numeroase tehnici de
analiz statistic. De asemenea, poate fi combinat cu mediile altor probe
din aceeai populaie, n cadrul mediei generale, atunci cnd datele sunt rare
sau greu de obinut.

meuia geneial=
(n
i
x
i
)
n
i

x

media probei i n

numrul de valori din proba i

Media este ns uor influenat de apariia unor valori atipice (foarte
mari sau foarte mici fa de majoritatea valorilor). n astfel de situaii,
mediana reprezint un descriptor mai robust al tendinei centrale a probei.
Mediana este util i n analiza preliminar, deoarece scoate n eviden
tendinele generale ale datelor.
Modul reprezint o modalitate rapid i aproximativ de a aprecia
tendina central a probei i de a indica centrul distribuiei observaiilor,
apreciate pe o scal ordinal sau nominal.

Mo=Me=x

Mo<Me<x

A B
Descrierea statistic a probelor ecologice 29
3.2. VARIABILITATEA

Variabilitatea este o trstur general a sistemelor naturale. Este
foarte puin probabil ca indivizii dintr-o populaie biologic s fie identici
din punctul de vedere al unui caracter sau al unei variabile. Dac nu ar
exista variabilitate, nu ar mai fi nevoie de analiza statistic o singur
valoare ar fi suficient pentru a descrie variabila cercetat pentru ntreaga
populaie (implicit, nici tendina central ca noiune nu i-ar mai avea
rostul). Deci, pentru a surprinde informaia intrinsec a unei probe, pe lng
tendina central, trebuie descris i variabilitatea acesteia.
n general, variabilitatea este surprins de modul n care valorile
individuale ale unei variabile graviteaz n jurul tendinei centrale sau se
distribuie fa de aceasta.
Cei mai comuni descriptori ai variabilitii unei probe sunt
amplitudinea i deviaia standard.

Amplitudinea (m). Este o msur simplu de calculat a dispersiei
datelor dintr-o prob. Amplitudinea reprezint diferena dintre valoarea
maxim (x
mux
) i valoarea minim (x
mn
dintre cele dou limite ale intervalului de variaie.

= x
mux
-x
mn
inteivalul ue vaiiaie=|x
mn
, x
mux
]

Cnd datele sunt sub forma claselor de distribuie a frecvenelor i
valorile extreme (x
mux
i x
mn
) nu se cunosc cu exactitate, amplitudinea se
calculeaz ca diferena dintre centrele intervalelor primei i ultimei clase.
Dac ne referim la exemplul 2.3 i presupunem c avem la dispoziie doar
tabelul 2.5, atunci amplitudinea poate fi apreciat astfel:

= S69,S -1S2,S = 217 .

Este msura cea mai util a variabilitii, atunci cnd o decizie este
condiionat de valorile extreme ale unei variabile. Prezint ns i o serie de
neajunsuri: depinde doar de valorile extreme care adesea sunt excepionale,
prezint fluctuaii mari de la o prob la alta i nu este influenat de simetria
repartiiei dintre extreme (poate avea aceeai valoare pentru o repartiie
30 Elemente de statistic aplicate n ecologie
simetric i pentru una puternic asimetric).

Deviaia standard (x, o). Este descriptorul variabilitii cel mai
frecvent i mai util, care se folosete n analiza statistic a datelor. Atunci
cnd valoarea sa se obine prin folosirea tuturor valorilor individuale ale
unei variabile dintr-o populaie, se numete deviaia standard a populaiei
i se noteaz cu o. Dac se calculeaz pornind de la datele dintr-o prob
extras din populaia de cercetat, se numete deviaia standard a probei i
se noteaz cu x. n ambele cazuri, deviaia standard reprezint media
abaterilor valorilor individuale fa de valoarea mediei. Abaterea unei valori
individuale fa de medie poate fi scris ca diferena dintre valoarea
respectiv i valoarea mediei (x x). n continuare, pentru a afla media
abaterilor, ar trebui ca abaterile tuturor valorilor s se nsumeze i apoi s se
mpart la numrul valorilor individuale luate n analiz (n sau N). Totui
exist o problem cu privire la acest raionament:

(x -x) = [
x
n
-x =n [
x
n
-x = x -x = u .

Deci suma abaterilor este zero, ceea ce reprezint un impas n
calcularea mediei abaterilor, aceasta fiind egal cu un = u. Aceasta ar
nsemna c valorile individuale se confund cu cea a medie, ceea ce este n
majoritatea cazurilor (dac nu n toate) imposibil, din cauza variabilitii
naturale. Ca urmare, pentru a depi acest impas, este nevoie s pozitivm
toate abaterile printr-un procedeu reversibil care s nu influeneze rezultatul
final. Un astfel de procedeu const n ridicarea abaterilor la ptrat. Se obine
astfel suma ptratelor abaterilor care, mprit la numrul de valori, d
media aritmetic a ptratelor abaterilor sau variana (x
2
, o
2
).

s
2
=
(x-x )
2
n
sau o
2
=
(x-x )
2
N

n cazul varianei, unitile de apreciere ale variabilei se modific
de exemplu, mm devin mm
2
, g devine g
2
, pierzndu-i sensul. Pentru a
reveni la unitile originale de msur, se extrage radicalul din valoarea
varianei i se obine astfel deviaia standard.

Descrierea statistic a probelor ecologice 31
s =
_
(x-x )
2
n
sau o =
_
(x-x )
2
N

Printr-o rearanjare algebric a formulelor de mai sus se poate obine
una mai uor de utilizat n practic.

s =
_
x
2
-
(x)
2
n
n
sau o =
_
x
2
-
(x)
2
N
N

Atunci cnd deviaia standard a probei se utilizeaz pentru estimarea
deviaiei standard a populaiei (se estimeaz o pe baza s), suma ptratelor
abaterilor se mparte la n 1 i nu la n, ceea ce are drept efect creterea
valorii s.

s =
_
(x-x )
2
n-1
sau formula cea mai uzual s =
_
x
2
-
(x)
2
n
n-1

Creterea valorii s reprezint o marj ce trebuie luat pentru folosirea
mediei probei x (o statistic) n loc de media populaiei p (un parametru)
pentru estimarea deviaiei standard populaionale o. Valoarea n 1 se
numete n statistic numrul gradelor de libertate i reprezint un
concept general desemnnd numrul de elemente independente (variabile
aleatoare, statistici etc.) pentru a defini starea unui sistem sau a unui
ansamblu (numrul de elemente considerate simultan minus numrul de
relaii independente care le leag). De exemplu, dac presupunem c avem o
prob n = 1u, cu x = 2u, i trebuie s inventm valorile observaiilor,
avem libertatea s desemnm primele 9 valori (adic n 1 = 1u 1 = 9). A
zecea valoare nu mai avem libertatea s o inventm, deoarece aceasta
trebuie s fie o valoare care s permit obinerea mediei egale cu 2u. Cu alte
cuvinte, media constituie o relaie independent, o constrngere a valorilor
din prob. Deci, dac media este 2u, suma celor 1u valori va fi 2u 1u =
2uu. Desemnm primele patru valori: 26, 18, 14, 2S, 2u, 28, SS, 17 i 7.
Suma lor este 19u. Pentru ca suma s fie 2uu, nseamn c al zecelea numr
32 Elemente de statistic aplicate n ecologie
poate fi doar 1u (2uu 19u = 1u) i astfel media s fie 2u (2uu1u = 2u).
Deviaiile standard ale probelor pot fi utilizate pentru a compara
variabilitatea acestora. Compararea direct a deviaiilor standard obinute n
urma analizei unor probe cu medii diferite (de exemplu, o medie de ordinul
zecilor i o alta de ordinul sutelor) nu are nici o valoare. Astfel, pentru
compararea variabilitii probelor din populaii cu medii diferite, se
folosete coeficientul de variaie (CF).

CI =
s
x
sau CI% =
s
x
1uu

Exemplul 3.1. ntr-un studiu s-a urmrit nlimea fitoindivizilor de
migdal pitic (Amygdalus nana). n acest sens s-a msurat nlimea a 50 de
tulpini n cm dintr-un plc compact. S-a realizat apoi descrierea statistic a
probei.

59,3 59,6 60,3 60,6 60,9 62,6 62,7 62,8 63,7 63,7
65,5 65,8 66,6 67,1 67,2 67,5 67,8 68,1 68,9 69
69 69 69 69,4 69,6 70 70,2 71,1 71,4 71,6
71,9 72,6 73,4 73,6 74,1 75 75,1 75,2 76,3 76,9
77 77,5 77,5 77,7 78,8 79,3 81,5 82,8 86,7 89,6

Valoarea cea mai frecvent ntlnit este 69, deci Ho = 69.
Mediana va fi egal cu media celor dou valori centrale, deoarece
n = Su, un numr par.

Hc =
x
S0
2
+x
S0+1
2
2
=
69,6+70
2
= 69,8

Media este suma tuturor valorilor mprit la Su.

x =
3542,5
50
= 7u,8S

Amplitudinea este dat de diferena dintre valoarea maxim i cea
minim din prob.

Descrierea statistic a probelor ecologice 33
= 89,6 -S9,S = Su,S

Deviaia standard se calculeaz conform formulei utilizate pentru
estimarea deviaiei standard populaionale.

s =
_
253329,99-
12S49306,2S
S0
50-1
= _
253329,99-250986,13
50-1
= _
2343,87
49
=
=

47,8S = 6,92
s
2
= 47,8S

Coeficientul de variaie se afl mprind deviaia standard la medie.

CI =
6,92
70,85
= u,u98 , adic 9,8% .

Datele din proba cercetat prezint o distribuie simetric, pentru c
cele trei msuri ale tendinei centrale au valori foarte apropiate.

4. DISTRIBUII PROBABILISTICE

Teoria matematic a probabilitilor a aprut n urma studiului
jocurilor i arat care va fi rezultatul, n general, dac se extrag probe n
mod repetat din aceeai populaie statistic.
Probabilitatea de apariie a unui anumit eveniment reprezint ansa
ca evenimentul respectiv s se ntmple, exprimat de la u la 1 sau de la u la
1uu%. O probabilitate apropiat de 1 nseamn c evenimentul este unul
probabil, iar o probabilitate apropiat de u nseamn c evenimentul
respectiv este puin probabil.
Exist mai multe modaliti de aflare a probabilitii unui eveniment,
dintre care dou sunt mai des utilizate. Prima modalitate este cea empiric,
bazat pe cunotine anterioare cu privire la evenimentul respectiv n
populaie. De exemplu, dac se tie c ntr-o populaie doi din 5 indivizi
aparin sexului masculin, atunci se poate spune c probabilitatea ca un
individ selectat la ntmplare din populaie s fie mascul este de 2S sau
u,67 (sau 67%). Pentru a afla aceast probabilitate, sunt necesare cunotine
asupra raportului dintre sexe n populaia studiat. A doua modalitate de
aflare a probabilitii este cea bazat pe consideraii teoretice. De exemplu,
probabilitatea de a obine un anumit numr prin aruncarea unui zar este de
16 adic u,1667. n acest caz, nu este nevoie ca zarul s fie aruncat pentru
a ajunge la acest rezultat.
n cele dou situaii de mai sus, probabilitatea a fost calculat sub
forma unui raport. Acest aspect este surprins de regula mpririi conform
creia probabilitatea unui eveniment este dat de numrul de posibiliti n
care evenimentul respectiv poate s apar mprit la numrul total de
evenimente ce pot s apar.
n primul exemplu de mai sus, erau dou posibiliti de apariie a
unui mascul din trei indivizi pentru care nu se specific sexul. n al doilea
exemplu, era o posibilitate de a obine un anumit numr din ase numere
posibile.
n general, se pot face operaii cu probabiliti, dintre care cele mai
Distribuii probabilistice 35
frecvent utilizate sunt adunarea sau nmulirea. Deoarece probabilitile sunt
fracii, adunarea probabilitilor duce la o cretere a probabilitii compuse,
n timp ce nmulirea, la o scdere a acesteia.
Dac se cunoate probabilitatea de apariie a unui rezultat A i cea de
apariie a unui rezultat B, probabilitatea apariiei simultane a ambelor
rezultate este, conform regulii nmulirii, egal cu produsul probabilitilor
individuale: p(A i B) = p(A) p(B). De exemplu, dac probabilitatea ca
dintr-un ou s ias o anumit specie este de u,2 i probabilitatea ca
respectivul individ s fie mascul este de u,S, atunci probabilitatea ca din ou
s apar un individ mascul din specia de interes va fi egal cu produsul
probabilitilor individuale ale celor dou rezultate: u,2 u,S = u,1u.
Dac se cunoate probabilitatea de apariie a unui rezultat A i cea de
apariie a unui rezultat B, probabilitatea apariiei unuia din cele dou
rezultate la un moment dat este, conform regulii adunrii, egal cu suma
probabilitilor individuale: p(A sau B) = p(A) +p(B). De exemplu, dac
probabilitatea ca dintr-un ou s ias o anumit specie este de u,2 i
probabilitatea de apariie a unei alte specii este u,S, atunci probabilitatea ca
din ou s ias prima sau a doua specie va fi egal cu suma probabilitilor
individuale ale celor dou rezultate: u,2 +u,S = u,S.
O distribuie probabilistic este o distribuie a probabilitilor
similar cu o distribuie a frecvenelor (seciunea 2.2), cu deosebirea c
prima red probabilitatea de apariie a evenimentelor i nu frecvena
acestuia. Deci distribuiile probabilistice se bazeaz pe probabilitile,
calculate pornind de la anumite premise ca evenimentele s apar i nu pe
frecvenele observate ale evenimentelor. O distribuie a frecvenelor poate fi
convertit la o distribuie a probabilitilor, dac fiecare frecven este
convertit la probabilitate prin mprirea la numrul total de observaii
(dimensiunea probei).
Utilitatea distribuiilor probabilistice este multipl: permite
estimarea probabilitii ca un anumit eveniment s aib un anumit rezultat i
poate fi folosit pentru a calcula o distribuie de frecvene de ateptat
(estimate). Aa cum o probabilitate poate fi estimat prin mprirea
frecvenei unei anumite observaii la numrul total de observaii, tot aa, o
frecven estimat poate fi calculat prin nmulirea probabilitii estimate
cu numrul total de observaii.
Astfel, se pot compara frecvenele observate cu cele estimate, dup
36 Elemente de statistic aplicate n ecologie
un anumit model. Dac diferenele dintre cele dou tipuri de frecvene nu
sunt semnificative, atunci modelul dup care s-au calculat frecvenele
estimate este valabil i pentru cele observate.
Modelele folosite n calcularea probabilitilor teoretice sunt modele
matematice. Dintre acestea, o parte au o importan practic deosebit
pentru cercetarea ecologic. Astfel, exist trei distribuii probabilistice
asociate cu variabile discrete (caractere numrabile), folosite drept model n
studiile ecologice: distribuia binomial, distribuia Poisson i distribuia
binomial negativ. Dintre distribuiile probabilistice folosite pentru
variabile continui (caractere msurabile), probabil cea mai important, mai
ales din punct de vedere conceptual, este distribuia normal.

4.1. DISTRIBUIA BINOMIAL

Aceast distribuie are urmtoarele particulariti:

1. Observaiile sunt sub form de numr de entiti;
2. O observaie se poate clasifica n una din dou categorii posibile,
3. Variana unei probe de frecvene este mai mic dect media;
4. Dispersia entitilor numrate este uniform.

Dac se ia n considerare sexul unui individ dintr-o populaie,
aceast variabil poate lua doar dou valori: mascul sau femel. Dac se
selecteaz aleator un singur individ dintr-o populaie, ansele ca acesta s fie
mascul sunt egale cu ansele s fie femel. Cum rezultatul poate fi doar unul
singur, nseamn c probabilitatea de a obine un mascul este 12 = u,uS,
iar probabilitatea de a obine o femel este tot 12 = u,uS. Dac p este
probabilitatea de a obine mascul i q este probabilitatea de a obine femel,
atunci suma probabilitilor va fi p +q = 1, iar p = 1 -q i q = 1 -p.
Distribuia probabilistic n cazul sexului unui individ este reprezentat n
figura 4.1.
Dac se extrag doi indivizi din populaie, atunci exist patru
rezultate posibile (tab. 4.1). Probabilitile fiecrui rezultat pot fi obinute
conform regulii nmulirii. Astfel, probabilitatea de a obine doi masculi va
Distribuii probabilistice 37
fi u,S u,S = u,S
2
= u,2S. Probabilitatea de a obine dou femele se
calculeaz n acelai fel. Probabilitatea de a obine un mascul i o femel
este egal cu probabilitatea de a obine o femel i apoi un mascul, adic
u,S u,S = u,2S.

Figura 4.1. Distribuia probabilistic a sexului n cazul unui individ

Tabelul 4.1. Probabilitile diferitelor rezultate la extragerea a doi indivizi
Individul 1
Individul 2
Mascul (M)
p = u,S
Femel (F)
q = u,S
Mascul (M)
p = u,S
MM
p p = u,2S
FM
q p = u,2S
Femel (F)
q = u,S
MF
p q = u,2S
FF
q q = u,2S

Dac nu se ia n consideraie ordinea n cadrul rezultatului mascul-
femel, probabilitatea obinerii unui mascul i a unei femele va fi dat,
conform regulii adunrii, de suma dintre probabilitatea de a obine mascul-
femel i probabilitatea de a obine femel-mascul, adic pq +qp = u,2S +
u,2S = u,S.
Suma probabilitilor tuturor rezultatelor este 1. Dac se
generalizeaz suma probabilitilor tuturor rezultatelor, atunci se obine:

0
0,1
0,2
0,3
0,4
0,5
0,6
mascul femel
P
r
o
b
a
b
i
l
i
t
a
t
e
Rezultat
38 Elemente de statistic aplicate n ecologie
p
2
+2pq +q
2
= 1 (p +q)
2
= 1 .

Dac se repet distribuia probabilistic pentru trei indivizi, atunci
relaia general devine:

p
3
+Sp
2
q +Spq
2
+q
3
= 1 (p +q)
3
= 1 .

Deci, pentru k indivizi, probabilitile tuturor rezultatelor posibile
vor fi date prin descompunerea binomului:

(p +q)
k
= 1 .

n aceast relaie general a distribuiei binomiale, k reprezint
numrul de ncercri, p este probabilitatea de a obine un anumit rezultat
dintr-o singur ncercare, iar q este probabilitatea ca rezultatul vizat s nu
apar. Distribuia binomial depinde de k i de p (valoarea lui q depinde de
cea a lui p).
O formul mai practic pentru calculul probabilitii n distribuia
binomial este:

p(x) =
k!
x!(k-x)!
p
x
q
k-x
,
p(x) probabilitatea de a obine un anumit numr de rezultate;
x numrul de rezultate de interes;
k numrul de evenimente sau ncercri;
p probabilitatea de a obine un rezultat de interes;
q probabilitatea de a nu obine un rezultat de interes.

Exemplul 4.1. Dac o pont conine 6 ou, iar probabilitatea ca
dintr-un ou s apar un mascul este u,S, care sunt probabilitile de a obine
4 sau mai puini masculi?

n aceast problem datele sunt urmtoarele:
k = 6 p = u,S
q = 1 -p = 1 -u,S = u,S
x 4 .
Distribuii probabilistice 39

Aceasta nseamn c probabilitatea de a obine 4 sau S sau 2 sau 1
sau u masculi va fi, conform regulii adunrii, suma probabilitilor p(4) +
p(S) +p(2) +p(1) +p(u).
Probabilitatea de a obine 4 masculi este:

p(4) =
6!
4!(6-4)!
u,S
4
u,S
6-4
= u,2S4S7S .

La fel se procedeaz i pentru celelalte valori ale lui x.

x 4 3 2 1 0 4
p(x) 0,2343 0,3125 0,2343 0,0937 0,0156 0,8906

Probabilitatea de a obine patru sau mai puini masculi este de
aproximativ 89,1%.
Distribuia probabilistic pentru toate combinaiile posibile de
masculi i femele din ase indivizi se prezint astfel:

Distribuia este simetric deoarece p = q. n general, cu ct k este
mai mare i p are o valoare apropiat de cea a lui q, cu att distribuia
binomial este mai simetric, iar diferenele dintre probabiliti (coloanele
diagramei) sunt mai mici.
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0 1 2 3 4 5 6
p
(
x
)
x
40 Elemente de statistic aplicate n ecologie

4.2. DISTRIBUIA POISSON

Aceast distribuie are urmtoarele particulariti:

1. Observaiile sunt sub form de numr de entiti;
2. Observaiile se obin din uniti de prob definite (ptrate de
prob, intervale de timp etc.) i pot fi organizate ntr-o distribuie
a frecvenelor;
3. Variana probei este aproximativ egal cu media acesteia;
4. Entitile numrate sunt relativ rare (mult mai puine dect ar
putea s conin unitatea de prob).
5. Dispersia entitilor n timp i spaiu este aleatoare, ceea ce
nseamn c entitile nici nu se atrag, nici nu se resping, adic
sunt independente unele fa de altele.

Dei aceast distribuie este greu de ntlnit n natur, ea este util n
ecologie, fiind singurul model ce poate fi folosit pentru descrierea obiectelor
cu dispersie ntmpltoare.
Distribuia Poisson este determinat de un singur parametru z, care
este egal cu media populaional p i cu variana populaional o
2
:

z = p = o
2
.
Deoarece aceti parametri rareori ajung s fie cunoscui, formula de
calcul a probabilitii se bazeaz pe media probei (x ) ca estimare a mediei
populaionale, pe un anumit numr de entiti dintr-o unitate de prob (x) i
pe constanta matematic, baza logaritmului natural c = 2,718S:

p(x) = c
-x

x
x
x!
.

Exemplul 4.2. S se estimeze distribuia probabilistic Poisson
pentru 10 sau mai puini indivizi pe unitate de prob, tiind c numrul
mediu de indivizi pe unitate de prob este S.

Distribuii probabilistice 41
Datele acestei probleme sunt:
x = S
c = 2,718S
x 10 .

Trebuie calculat probabilitatea Poisson de a identifica 1u sau mai
puini indivizi pe unitate de prob.
Probabilitatea de a identifica 1u indivizi pe unitate de prob este:

p(1u) = 2,718S
-5

5
10
10!
= u,u181 ,
p(9) = 2,718S
-5

5
9
9!
= u,uS6S .

La fel se procedeaz i pentru celelalte valori.

x p(x)
0 0,0067
1 0,0337
2 0,0842
3 0,1404
4 0,1755
5 0,1755
6 0,1462
7 0,1044
8 0,0653
9 0,0363
10 0,0181
p(x) 0,9863

Suma probabilitilor valorilor de la zero la zece este mai mic dect
1, deoarece distribuia este trunchiat la valoarea 1u. Probabilitile
valorilor mai mari de 1u sunt extrem de mici. Distribuia este uor
asimetric. Dac z depete valoarea 1u, distribuia tinde s devin
aproximativ simetric.

0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
0,18
0 1 2 3 4 5 6 7 8 9 10
p
(
x
)
x
42 Elemente de statistic aplicate n ecologie

4.3. DISTRIBUIA BINOMIAL NEGATIV

Aceast distribuie are urmtoarele particulariti:

1. Observaiile sunt sub form de numr de entiti;
2. Observaiile se obin din uniti de prob definite (ptrate de
prob, intervale de timp etc.) i pot fi organizate ntr-o distribuie
a frecvenelor;
3. Variana probei este evident mai mare dect media acesteia;
4. Entitile numrate sunt relativ rare (mult mai puine dect ar
putea s conin unitatea de prob).
5. Dispersia entitilor nu este nici uniform, nici aleatoare, ci poate
s fie grupat sau agregat.

Spre deosebire de celelalte distribuii discrete, distribuia binomial
negativ este un model robust ce descrie dispersia a numeroase populaii
naturale.
Aceast distribuie probabilistic este definit de doi parametri:
media populaional (p) i un exponent k. Spre deosebire de k din
distribuia binomial, care ia valori ntregi, fiind o variabil discret, n
distribuia binomial negativ, k este o variabil continu, ce ia valori din
aproape n aproape i exprim heterogenitatea unei distribuii.
n practic, cei doi parametri sunt estimai pe baza probei. Media
probei x este o estimare a lui p, iar k se estimeaz pornind de la media i
variana probei, conform urmtoarei relaii:

k =
x
2
s
2
-x
.

Probabilitile individuale, adic probabilitile obinerii unui anumit
numr de entiti x dintr-o unitate de prob, se pot afla prin descompunerea
expresiei (q -p)
-k
, unde p = x k, iar q = 1 +p.
Din motive practice, probabilitatea n distribuia binomial negativ
se calculeaz urmnd urmtoarele etape:

Distribuii probabilistice 43
1. Se calculeaz valoarea k.
2. Se calculeaz probabilitatea pentru x = u:

p(u) = q
-k
= [1 +
x
k

-k
.

3. Pentru oricare x > u, se calculeaz probabilitatea astfel:

p(x > u) =
k+x-1
x

x
x +k
p(x -1) .

Exemplul 4.3. Care sunt probabilitile ca pe nite suprafee de
prob s apar zece sau mai puini indivizi? Media numrului de indivizi pe
suprafa de prob este trei, iar deviaia standard este cinci.

x = S
s
2
= S

Trebuie calculat valoarea lui k:

k =
3
2
5-3
= 4,S .

Se calculeaz probabilitatea pentru x = u:

p(u) = [1 +
3
4,5

-4,5
= u,1uu4 .

n continuare se pot calcula probabilitile pentru celelalte valori mai
mari ca unu, cu ajutorul formulei recurente:

p(1) =
4,5+1-1
1

3
3+4,5
u,1uu4 = u,18u7
p(2) =
4,5+2-1
2

3
3+4,5
u,18u7 = u,1988 .

n acelai mod se continu i pentru celelalte valori. Rezultatele
probabilitilor pentru valorile mai mici sau egale cu zece sunt trecute n
tabelul urmtor:
44 Elemente de statistic aplicate n ecologie

x p(x)
0 0,1004
1 0,1807
2 0,1988
3 0,1723
4 0,1292
5 0,0879
6 0,0556
7 0,0334
8 0,0192
9 0,0107
10 0,0058
p(x) 0,9938

Se poate observa c suma probabilitilor valorilor este mai mic
dect 1. Probabilitile pentru valorile mai mari de 1u vor fi extrem de mici.
Pe msur ce valoarea k crete i deviaia standard (s
2
media (x ), gradul de simetrie al distribuiei crete. Pentru valori ale lui
k > 2u, distribuia probabilistic este aproape simetric.

4.4. ESTIMAREA DISPERSIEI UNEI POPULAII

4.4.1. Indici de dispersie
Dispersia unei populaii se refer la modul de repartizare a
indivizilor n spaiu. Dispersia se apreciaz pe baza poziiei unor indivizi,
relativ la poziia celorlali.
n general, dispersia unei populaii poate fi de trei tipuri: uniform,
aleatoare i grupat (fig. 4.2). n cele mai multe cazuri, dispersia este
privit din perspectiv spaial, dar se poate investiga i dispersia n timp a
unor evenimente. n primul caz, unitatea de prob poate fi un ptrat, n timp
ce n al doilea caz, poate fi un interval de timp. Dac se urmresc organisme
parazite, atunci unitatea de prob poate fi organismul gazd.
n principiu, aprecierea dispersiei se face n funcie de variabilitatea
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
0,18
0,2
0 1 2 3 4 5 6 7 8 9 10
p
(
x
)
x
Distribuii probabilistice 45
densitii entitilor pe unitate de prob. n cazul unei dispersii uniforme,
densitile entitilor pe unitate de prob vor fi cam aceleai i variabilitatea
acestor densiti va fi relativ mic. n cazul unei dispersii grupate, densitile
vor avea valori extreme, fie foarte mari, fie aproape nule, iar variabilitatea
acestor densiti va fi relativ mare. n cazul dispersiei aleatoare, vor exista
densiti cu valori mari, mici i intermediare i, ca urmare, variabilitatea
acestor densiti va fi intermediar fa de variabilitatea densitilor din
celelalte tipuri de dispersie.

Figura 4.2. Tipuri de dispersie: I uniform, II aleatoare, III grupat

Pornind de la acest principiu, dac se folosete variana densitilor
pe unitate de prob ca descriptor al variabilitii i media densitilor pe
unitate de prob ca termen de comparaie a magnitudinii varianei, se poate
calcula un indice de dispersie astfel:

Indice de dispersie =
s
2
x
.

Cnd datele sunt prezentate sub form de tabel de distribuie a
frecvenelor, atunci formulele varianei i mediei pot fi adaptate pentru
facilitarea calculelor astfel:

x x
x
1

1
x
1

1
x
2

2
x
2

2

x
k

k
x
k

k
= n (x )
x =
(x])
n

s
2
=
|](x-x )
2
]
n-1
.
46 Elemente de statistic aplicate n ecologie
Indicele de dispersie poate fi subunitar, egal cu unitatea sau
supraunitar. Astfel, n funcie de valoarea raportului, se poate decide care
este tipul de dispersie:

dac
s
2
x
< 1, dispersia este uniform;
dac
s
2
x
= 1, dispersia este aleatoare;
dac
s
2
x
> 1, dispersia este grupat.

Ce se ntmpl dac valoarea indicelui de dispersie este foarte
apropiat de 1? Valoarea respectiv poate fi considerat ca aproximativ
egal cu 1 sau, la fel de bine, poate fi considerat n funcie de situaie ca
fiind mai mare sau mai mic dect 1.
ntr-o astfel de situaie, pentru a lua o decizie obiectiv trebuie ca
acesteia s i se atribuie o probabilitate, adic s se realizeze o estimare
statistic. Pentru aceasta se impune o standardizare a indicelui de dispersie
unitilor de prob minus unu (n -1), obinndu-se o statistic de tip _
2
:

_
2
= (n -1)
s
2
x
.

Cnd numrul unitilor de prob este relativ mic (n < Su), se
compar statistica _
2
cu valorile critice ale distribuiei _
2
pentru n -1
grade de libertate i pentru pragul de confiden u,97S i, respectiv, u,u2S:

dac _
2
< _
(0,975,n-1)
2
=> dispersia este uniform;
dac _
(0,975,n-1)
2
< _
2
< _
(0,025,n-1)
2
=> dispersia este aleatoare;
dac _
2
> _
(0,025,n-1)
2
=> dispersia este grupat.

n oricare dintre situaiile de mai sus, nivelul de confiden al
estimrii este de u,uS (cele dou valori critice exclud fiecare cte 0,025 din
2
). Deci probabilitatea ca dispersia s fie de un
anumit tip este de u,9S sau 9S%.

Distribuii probabilistice 47
Cnd numrul unitilor de prob este relativ mare (n Su), atunci
se calculeaz o statistic J conform relaiei:

J = 2 _
2
-2 (n -1) -1 .

Aceast statistic se compar cu valoarea critic 1,96, care este o
valoare z ce exclude u,uS din distribuia normal standard (seciunea 4.5):

dac J < -1,96 => dispersia este uniform;
dac |J| < 1,96 => dispersia este aleatoare;
dac J > 1,96 => dispersia este grupat.

i n acest caz, nivelul de ncredere este de u,uS, deci probabilitatea
ca dispersia s fie de un anumit tip este de u,9S sau 9S%.

Indicele de dispersie face distincia dintre cele trei tipuri, dar nu
poate indica gradul de aglomerare n cazul unei dispersii grupate, deoarece
este puternic influenat de numrul total de entiti individuale din toate
unitile de prob. Pentru a aprecia gradul de aglomerare dintr-o dispersie
grupat, se folosete indicele Green (I6), care elimin dependena de
numrul tuturor indivizilor din toate unitile de prob. Numrul total de
indivizi din toate unitile de prob va fi egal cu (x) n cazul n care
datele sunt sub form de tabel de frecvene sau cu (x) dac datele sunt sub
form de densiti pe unitatea de prob.

I0 =
s
2
x
-1
(x])-1
sau I0 =
s
2
x
-1
(x)-1

Acest indice ia valori ntre u, pentru dispersie aleatoare, i 1, pentru
dispersie grupat, cu grad maxim de aglomerare (toate entitile au fost
identificate ntr-o singur unitate de prob). Acest indice poate fi folosit
pentru compararea gradului de aglomerare a unor probe diferite ca numr de
entiti, medie sau numr de uniti de prob.

48 Elemente de statistic aplicate n ecologie
Exemplul 4.4. ntr-o populaie de plante, prin investigarea a 14
ptrate de prob s-au obinut densitile indivizilor. Care este tipul de
dispersie al populaiei?

0 0 0 5 3 48 1
2 30 5 9 22 1 0

x =
126
14
= 9
s
2
= 2u7,69
s
2
x
=
207,69
9
= 2S,u8 .

Indicele de dispersie este evident mai mare ca 1. n continuare vom
verifica dac dispersia aglomerat este semnificativ.

_
2
= (14 - 1) 2S,u8 = Suu,u4

Aceast valoare se compar cu valorile critice calculate pentru 1S
grade de libertate i pentru nivelurile de semnificaie u,97S i, respectiv,
u,u2S (anexa 3):

_
(0,975,13)
2
= S,uu9
_
(0,025,13)
2
= 24,7S6 .

Valoarea calculat (_
2
= Suu,u4) este mai mare dect limita
superioar (_
(0,025,13)
2
= 24,7S6) a intervalului de confiden pentru
dispersia aleatoare, deci populaia investigat are o dispersie aglomerat, cu
o probabilitate de u,9S sau 95%.
Se estimeaz gradul de aglomerare cu indicele Green (I0). Datele
sunt sub form de densitate pe ptrat de prob, deci numrul total de indivizi
identificai n cele 14 ptrate este dat de suma numrului de indivizi din
fiecare ptrat.

I0 =
23,08-1
126-1
= u,177

Distribuii probabilistice 49

Avnd n vedere c I0 ia valori ntre 0 i 1, se poate concluziona c
gradul de aglomerare nu este destul de sczut.

n situaia n care numrul unitilor de prob este mai mare de Su,
se poate verifica dac frecvenele observate ale variabilei concord cu
frecvenele estimate cu ajutorul uneia dintre distribuiile probabilistice
discrete (binomial, Poisson, binomial negativ) ce servete drept model.
Practic, se calculeaz probabilitatea de a obine o anumit valoare a
variabilei pe unitate de prob, dup care se convertete n frecven prin
nmulirea cu numrul unitilor de prob. Concordana frecvenelor
observate cu cele estimate (cu modelul) se poate face prin reprezentarea
grafic a ambelor frecvene i prin testul _
2
de concordan (seciunea 10.1).
n seciunile urmtoare ne vom referi la compararea grafic a frecvenelor.

4.4.2. Modelul binomial
Calcularea probabilitii binomiale de obinere a unei valori a
variabilei pe unitate de prob se bazeaz pe procedura descris n exemplul
4.1, cu deosebirea c numrul de ncercri (k) se estimeaz ca fiind valoarea
rotunjit obinut prin calcularea expresiei:

k =
x
2
x -s
2
.

Parametrii p i q reprezint probabilitatea ca o anumit poziie dintr-o
unitate de prob s fie ocupat de o entitate.

p =
x
k
, iar q = 1 -p .

Pe baza acestor parametrii se calculeaz probabilitatea binomial
(p(x)) de a obine o anumit valoare a variabilei (x) pe unitate de prob.
Ulterior se afl frecvena estimat a valorii x prin nmulirea probabilitii
acesteia cu numrul unitilor de prob
i
= p(x) n.

50 Elemente de statistic aplicate n ecologie
Exemplul 4.5. S-au determinat densitile indivizilor unei specii de
plante din 50 de ptrate de prob cu o anumit suprafa. Care este tipul de
dispersie al populaiei de plante?

Nr. indivizi pe ptrat 16 17 18 19 20 21 22
Frecvena 3 5 8 14 11 6 3

Variabila este numrul indivizilor pe ptrat de prob i o vom nota
cu x. Frecvenele observate le vom nota cu .
Pentru a calcula numrul mediu de indivizi pe ptrat (x), trebuie aflat
numrul total de indivizi din toate ptratele. Deoarece datele sunt prezentate
sub form de tabel de frecven, numrul total de indivizi identificai va fi
(x).

x 16 17 18 19 20 21 22 Suma
3 5 8 14 11 6 3 50
x
48 85 144 266 220 126 66 955

x =
955
50
= 19,1
s
2
=
3(16-19,1)
2
50-1
+
5(17-19,1)
2
50-1
++
3(22-19,1)
2
50-1
= 2,S8

Indicele de dispersie este evident subunitar, deci se poate ca
populaia s aib o dispersie uniform.

Indicele de dispersie =
2,38
19,1
= u,124
_
2
= u,124 (Su -1) = 6,u99
J =

2 6,u99 -2(Su -1) -1 = -6,SS6
-6,SS6 < -1,96 => dispersie uniform semnificativ

n continuare se calculeaz valorile k i p:

k =
19,1
2
19,1-2,38
= 21,82 = 22
p =
19,1
22
= u,876 q = 1 -u,876 = u,124 .
Distribuii probabilistice 51

Pornind de la aceste valori, se pot calcula probabilitile pentru x
indivizi la ptrat de prob (anexa 3):

p(16) =
22!
16!(22-16)!
u,876
16
u,124
(22-16)
= u,uSS1 .

La fel se procedeaz i pentru celelalte valori, dup care se nmulesc
cu numrul unitilor de prob, obinndu-se frecvenele estimate (').

x p(x) '
16 3 0,033 1,654
17 5 0,082 4,107
18 8 0,160 8,024
19 14 0,238 11,881
20 11 0,251 12,534
21 6 0,168 8,396
22 3 0,054 2,684

Se poate observa c exist o concordan destul de mare ntre
frecvenele observate i cele estimate pe baza modelului binomial. Deci
putem concluziona c dispersia populaiei este uniform.

4.4.3. Modelul Poisson
Calcularea probabilitii de obinere a unei valori a variabilei pe
unitate de prob, conform distribuiei Poisson, se bazeaz pe procedura
descris n exemplul 4.2.

Exemplul 4.6. ntr-un studiu s-a urmrit densitatea indivizilor unei
specii de arpe n 100 de ptrate de prob, ntr-o formaiune ierboas. Ce tip
de dispersie prezint populaia studiat?

0
2
4
6
8
10
12
14
16
16 17 18 19 20 21 22
f
r
e
c
v
e
n

a
x
f f'
52 Elemente de statistic aplicate n ecologie
Nr. indivizi/ptrat 0 1 2 3 4 5 6 7 8
Frecvena 7 16 25 18 16 10 5 2 1

Se calculeaz media i deviaia standard la fel ca n exemplul 4.5.

x 0 1 2 3 4 5 6 7 8 Suma
7 16 25 18 16 10 5 2 1 100
x 0 16 50 54 64 50 30 14 8 286

x =
286
100
= 2,86
s
2
=
7(0-2,86)
2
100-1
+
16(1-2,86)
2
100-1
++
1(8-2,86)
2
100-1
= S,11

Indicele de dispersie poate fi considerat fie aproximativ egal cu 1, fie
supraunitar.

Indicele de dispersie =
3,11
2,86
= 1,u88
_
2
= 1,u88 (1uu -1) = 1u7,7u6
J =

2 1u7,76 -2(1uu -1) -1 = u,641
u,641 < 1,96 => dispersie aleatoare semnificativ

n continuare se calculeaz probabilitatea Poisson (p(x)) pentru
toate valorile variabilei x (anexa 3). Se obin astfel probabilitile de apariie
a x indivizi la ptrat de prob. Probabilitatea de a obine x indivizi n 1uu
de ptrate se obine nmulind p(x) cu 1uu. Valorile astfel obinute
reprezint frecvenele teoretice (').

p(u) = 2,718S
-2,86

2,86
0
0!
= u,uS727
p(1) = 2,718S
-2,86

2,86
1
1!
= u,16S79

La fel se procedeaz i pentru celelalte valori, dup care se nmulesc
cu numrul unitilor de prob, obinndu-se frecvenele estimate (').

Distribuii probabilistice 53

1
i
= u,uS727 1uu = S,727

2
i
= u,16S79 1uu = 16,S79 .

x p(x) '
0 7 0,057 5,727
1 16 0,164 16,379
2 25 0,234 23,422
3 18 0,223 22,329
4 16 0,160 15,965
5 10 0,091 9,132
6 5 0,044 4,353
7 2 0,018 1,778
8 1 0,006 0,636

Se poate observa c exist o concordan destul de mare ntre
frecvenele observate i cele estimate pe baza modelului Poisson. Deci
putem concluziona c dispersia populaiei studiate este aleatoare.

4.4.4. Modelul binomial negativ
Calcularea probabilitii de obinere a unei valori a variabilei pe
unitate de prob, conform distribuiei binomiale negative, se bazeaz pe
procedura descris n exemplul 4.3.

Exemplul 4.7. ntr-un studiu s-a urmrit densitatea indivizilor unei
specii de plante n 1uu de ptrate de prob. Care este tipul de dispersie al
populaiei?

Nr. indivizi/ptrat 0 1 2 3 4 5 6 7 8 9 10 11
Frecvena 20 27 18 12 10 4 2 3 2 0 1 1

Se calculeaz media i deviaia standard la fel ca n exemplul 4.5.

x 0 1 2 3 4 5 6 7 8 9 10 11 Suma
20 27 18 12 10 4 2 3 2 0 1 1 100
x 0 27 36 36 40 20 12 21 16 0 10 11 229
0
5
10
15
20
25
30
0 1 2 3 4 5 6 7 8
f
r
e
c
v
e
n

a
x
f f'
54 Elemente de statistic aplicate n ecologie

x =
229
100
= 2,29
s
2
=
20(0-2,29)
2
100-1
+
27(1-2,29)
2
100-1
++
1(11-2,86)
2
100-1
= S,16

Indicele de dispersie este evident supraunitar.

Indicele de dispersie =
5,16
2,29
= 2,2S2
_
2
= 2,2S2 (1uu -1) = 222,96S
J = 2 222,96S -2(1uu -1) -1 = 7,u81
7,u81 > 1,96 => dispersie grupat semnificativ

Pentru distribuia binomial negativ este necesar calcularea
parametrului k. Acesta este o variabil continu, motiv pentru care valoarea
sa nu se rotunjete ca n cazul distribuiei binomiale.

k =
2,29
2
5,16-2,29
= 1,829

n continuare se calculeaz probabilitatea Poisson (p(x)) pentru
toate valorile variabilei x:

p(u) = [1 +
2,29
1,829

-1,829
= u,226S ;
p(1) =
(1,829+1-1)
1

2,29
2,29+1,829
u,226S = u,2Su4 ;
p(2) =
(1,829+2-1)
2

2,29
2,29+1,829
u,2Su4 = u,1811 .

La fel se procedeaz pentru restul valorilor lui x. Probabilitile de
apariie a x indivizi la ptrat de prob se nmulesc cu numrul unitilor de
prob (1uu), obinndu-se astfel frecvenele estimate (') conform
modelului binomial negativ.

1
i
= u,227 1uu = 22,6S

1
i
= u,2Su4 1uu = 2S,u4

1
i
= u,181S 1uu = 18,1S
Distribuii probabilistice 55

x p(x) '
0 20 0,2265 22,65
1 27 0,2304 23,04
2 18 0,1811 18,11
3 12 0,1285 12,85
4 10 0,0863 8,63
5 4 0,0559 5,59
6 2 0,0354 3,54
7 3 0,0220 2,20
8 2 0,0135 1,35
9 0 0,0082 0,82
10 1 0,0049 0,49
11 1 0,0029 0,29

Se poate observa c exist o concordan destul de mare ntre
frecvenele observate i cele estimate pe baza modelului distribuiei
binomiale negative. Deci se poate concluziona c dispersia populaiei
studiate este aglomerat.

4.5. DISTRIBUIA NORMAL

Distribuia normal este una dintre distribuiile continui. Aceasta
descrie, mai mult sau mai puin, distribuia unui mare numr de variabile,
motiv pentru care reprezint o baz conceptual pentru multe procedee de
analiz statistic.
Variabilele continui pot lua orice valoare ntre anumite limite. Dac
se reprezint grafic distribuia frecvenelor unei astfel de variabile ntr-o
populaie, prin intermediul unei linii continui, aceasta va avea o form
simetric, de clopot. De aceea, aceast distribuie mai este numit i
clopotul lui Gauss, care este unul din autorii (Moivre 1733, Legendre
1805, Laplace 1812) care a descris riguros aceast distribuie (Gauss 1809).
Teoretic, dac se realizeaz histograma folosind un numr infinit de valori
individuale, iar intervalul de clas este cel mai mic posibil, histograma sau
poligonul frecvenelor tinde s devin o curb continu (fig. 4.3).
0
5
10
15
20
25
30
0 1 2 3 4 5 6 7 8 9 10 11
f
r
e
c
v
e
n

a
x
f f'
56 Elemente de statistic aplicate n ecologie

Figura 4.3. Distribuia frecvenelor valorilor unei variabile

Numeroase variabile continui ntlnite n natur au o distribuie
normal. De asemenea, multe variabile care au o amplitudine mare a
valorilor prezint o distribuie aproximativ normal. Unele distribuii
discrete tind s devin aproximativ normale sau simetrice pe msur ce
parametrii legai de numrul de valori cresc.

Proprietile distribuiei normale

1. Distribuia este definit de medie (p) i de deviaia standard (o).
Poziia distribuiei pe abscis este determinat de valoarea mediei,
iar lrgimea acesteia, de deviaia standard (fig. 4.4). Cum aceti
parametri pot avea o infinitate de valori diferite, nseamn c
exist un numr infinit de distribuii normale.
2. nlimea curbei fa de ordonat este dat de funcia de repartiie
(x) pentru fiecare valoare individual a variabilei:

(x) =
1
c2n
c
-
(x-)
2
2o
2
.
f
x
Distribuii probabilistice 57

Figura 4.4. Distribuii normale diferite dup medii (m) i deviaii standard (s)

3. Curba este perfect simetric fa de medie, motiv pentru care
media i mediana sunt egale n distribuia normal. De asemenea,
valorile variabilei egale cu media sunt cele mai frecvente i astfel
media este egal cu modul valorilor individuale. n concluzie,
media, mediana i modul valorilor unei variabile normal
distribuite sunt egale.
4. Curba distribuiei cuprinde probabilitatea total, adic 1. Dac se
consider suprafaa delimitat de curb ca fiind 1uu%, atunci
suprafaa delimitat de valoarea p -o i p +o reprezint
aproximativ 68,26% din total. Adic n jur de 68% dintre valorile
variabilei sunt cuprinse n acest interval sau probabilitatea ca o
valoare selectat aleator din populaie s fie cuprins de acest
interval este de u,68. ntre p -2o i p +2o se gsete 9S,44%
din suprafaa curbei, adic probabilitatea de a observa o valoare
din acest interval este de u,9S44, iar intervalul p -So, p +So
cuprinde 99,74% din valorile individuale sau probabilitatea de a
extrage o valoare din acest interval este de u,9974 (fig. 4.5). n
practic se folosesc probabilitile u,9S i u,99, pentru care
intervalele sunt p _1,96o i, respectiv, p _2,S8o. Probabilitatea
ca o valoare s fie n afara celor dou intervale va fi 1 -u,9S =
u,uS i, respectiv, 1 -u,99 = u,u1. Aceste proprieti pot fi
folosite pentru aprecierea posibilitilor de apariie a unor
rezultate.
m1 m2
s1
s2
58 Elemente de statistic aplicate n ecologie

Figura 4.5. Suprafee ale distribuiei normale

Distribuia normal standard
Orice distribuie normal particular (N(p, o)) poate fi convertit la
distribuia normal standard care se caracterizeaz prin faptul c are media
zero i deviaia standard unu (N(u,1)). Aceast conversie se realizeaz prin
calcularea scorului z pentru fiecare valoare individual a variabilei x, n
funcie de media i de deviaia standard populaional (p i o):

z =
x-
c
.

n practic, parametrii populaionali nu pot fi cunoscui cu exactitate,
caz n care pot fi substituii cu statisticile probei (x i s), cu condiia ca
dimensiunea probei sa fie mai mare sau egal cu Su (n Su).

z =
x-x
s

Astfel, pentru valorile x mai mici dect media, z va avea o valoare
negativ, iar pentru cele mai mari dect media, o valoare pozitiv. Scorul z
arat la ce distan de medie exist o anumit valoare, unitatea de referin
fiind deviaia standard.
Intervalele de probabilitate ale distribuiei normale standard vor fi
-3 -2 - + +2 +3 x
0,6826
0,9544
0,9974
Distribuii probabilistice 59
-1, +1 pentru aproximativ u,6826 sau 68,26%, -2, +2 pentru u,9S44 sau
9S,44% i -S, +S pentru u9974 sau 99,74%. Pentru probabilitile de u,9S
i u,99, intervalele vor fi cuprinse ntre -1,96, +1,96 i, respectiv,
-2,S8, +2,S8 (fig. 4.6).

Figura 4.6. Suprafee ale distribuiei normale standard

Probabilitile pentru diferite valori ale lui z sunt tabelate (anexa 2)
sau pot fi calculate (anexa 3) pornind de la coada din stnga (cu valori
extreme negative) a N(u,1) i pn la valoarea z calculat.

Exemplul 4.8. Considernd datele din exemplul 3.1 reprezentnd
nlimile a Su de indivizi de migdal pitic (Amygdalus nana), s se estimeze:
a) Ce procent din populaie are nlimea cuprins ntre 6u cm i
8u cm?
b) ntre ce interval de nlime sunt cuprinse 95% din valorile
nlimii n populaie?

Se cunoate c x = 7u,8S i s = 6,92.
Pentru a rspunde la prima ntrebare trebuie fcut conversia celor
dou valori la distribuia normal standard, adic trebuie calculate scorurile
z pentru cele dou nlimi, dup care se afl probabilitile sau procentele
celor corespunztoare. Simplificnd, se parcurge urmtoarea schem
x - z - p.
-2,58 -1,96 -1 0 +1 +1,96 +2,58 z
0,99
0,95
0,6826
60 Elemente de statistic aplicate n ecologie
Pentru x =60 scorul z =
60-70,85
6,92
=
-10,85
6,92
= -1,S68 .
Pentru x =80 scorul z =
80-70,85
6,92
=
9,15
6,92
= 1,S22 .

Probabilitile celor dou scoruri z se caut n tabel (anexa 2) sau se
calculeaz (anexa 3)

p(-1,S68) = u,uS8
p(1,S22) = u,9u7 .

Prima probabilitate arat c din coada stng (cu valori negative) a
N(u,1) i pn la z = -1,S68 sunt cuprinse S,8% din suprafaa delimitat
de curb. A doua arat c din coada stng a N(u,1) i pn la z = 1,S22
sunt cuprinse 9u,7% din suprafaa delimitat de curb.
Ca s aflm ce procent din valorile nlimii se gsesc ntre 6u cm i
7u cm, trebuie sczute probabilitile:

u,9u7 -u,uS8 = u,849 .

Rspunsul la prima ntrebare este c ntre 6u cm i 7u cm sunt
cuprinse aproximativ 8S% din valorile nlimii n populaie.

Pentru a rspunde la a doua ntrebare este nevoie s se parcurg
schema de raionament de la prima, dar n sens invers: p - z - x.
Scorul z pentru o anumit probabilitate se afl din tabel (anexa 2)
sau se calculeaz (anexa 3). Avnd n vedere c att tabelul din anexa 2, ct
i funcia din anexa 3 consider probabilitatea din coada stng a N(u,1),
nseamn c aflarea scorului z pentru p = u,9S va returna limita superioar
a unui interval dispus asimetric fa de medie, limita inferioar fiind ctre
-. Astfel, pentru a obine scorurile z care s delimiteze o suprafa de
u,9S din N(u,1) simetric fa de medie, trebuie ca diferena 1 -u,9S =
u,uS s fie mprit n mod egal n ambele cozi ale distribuiei (ca n fig.
4.6). Deci se afl scorurile z pentru p = u,u2S i, respectiv, pentru p = 1 -
u,u2S = u,97S. La fel ca la punctul a), primul z separ u,u2S pn n coada
stng, al doilea, u,97S pn n coada stng, iar ntre cei doi se gsete o
suprafa ce reprezint u,9S din suprafaa total de sub clopot.
Distribuii probabilistice 61

z
(0,025)
= -1,96
z
(0,975)
= +1,96

Mai departe se calculeaz cele dou valori ale nlimii (x) pornind
de la cele dou scoruri z, pe baza relaiei pentru aflarea scorurilor z.

z =
x-x
s
= zs = x -x = x = x +zs
x = 7u,8S +(-1,96) 6,92 = S7,29
x = 7u,8S +1,96 6,92 = 84,41

Rspunsul de la punctul b) este c ntre S7,29 cm i 84,41 cm sunt
cuprinse 9S% din valorile nlimii n populaie.

4.5.1. Aprecierea normalitii datelor
Metodele statistice utilizate n ecologie sunt de dou categorii:
parametrice i neparametrice. Cele parametrice sunt mai puternice, dar
totodat mai restrictive n sensul c se pot aplica doar dac datele ntrunesc
o serie de condiii. O condiie comun pentru toate testele parametrice este
ca datele s fie aproximativ normal distribuite. Metodele neparametrice nu
prevd aceast condiie i din aceast perspectiv se mai numesc i
independente de distribuie. Ele pot fi utilizate pentru o gam mai variat de
situaii, dar sunt mai puin puternice (seciunea 5.5, Erori statistice).
Deci, pentru a putea utiliza metode statistice parametrice, trebuie s
se verifice normalitatea distribuiei datelor. Din start trebuie subliniat c
variabilele trebuie s fie apreciate pe o scal de interval sau raport, cu alte
cuvinte trebuie s fie continui sau discrete (n cazul celor discrete trebuie s
existe un numr relativ mare de valori posibile).
n statistic exist teste dedicate, care verific dac datele au o
distribuie aproximativ normal, dar care sunt relativ complicate i rareori
utilizate, motiv pentru care doar le menionm pe cele mai cunoscute: testul
Shapiro-Wilk, testul Kolmogorov-Smirnov, testul Cramr-von-Mises, testul
Jarque-Bera.
Testarea normalitii se poate face i cu ajutorul testului _
2
de
concordan ntre frecvenele valorilor variabilelor din prob i frecvenele
estimate pe baza funciei de repartiie a distribuiei normale. Acest procedeu
62 Elemente de statistic aplicate n ecologie
este i el destul de laborios.
O verificare simpl, dar laborioas a normalitii distribuiei datelor,
o reprezint aprecierea empiric a similaritii dintre poligonul frecvenelor
valorilor variabilei investigate i curba n form de clopot a distribuiei
normale. n cadrul exerciiului din exemplul 2.3 (fig. 2.3, 2.4) se poate
spune c frecvenele observate au o distribuie ce poate fi considerat
aproximativ normal.
Verificarea normalitii datelor se poate face i pornind de la
proprietile matematice ale distribuiei normale. Astfel, dac valorile sunt
distribuite simetric fa de medie, adic ntre medie i median nu exist o
diferen mare (seciunea 3.1 Relaia dintre descriptorii tendinei centrale),
i aproximativ 7u% din valori sunt cuprinse n intervalul delimitat de
valorile (x -s) i (x +s), atunci se poate aprecia c variabila analizat este
aproximativ normal distribuit n prob.

Exemplul 4.9. S se verifice rapid dac datele din exemplul 3.1 au o
distribuie apropiat de cea normal.

Simpla vizualizare a descriptorilor tendinei centrale arat c
distribuia valorilor din prob este aproximativ normal deoarece acetia au
valori foarte apropiate.

Ho = 69
Hc = 69,8
x = 7u,8S

Intervalul x _s are urmtoarele limite:

7u,8S -6,92 = 6S,9S
7u,8S +6,92 = 77,77 .

ntre aceste dou valori se gsesc S4 din Su de valori, adic 68% din
valorile din prob. Acest procent este apropiat de cel cuprins n intervalul
p -o, p +o al unei distribuii normale, adic de 68,26%.

Dac datele nu sunt normal distribuite, atunci cel mai simplu este s
Distribuii probabilistice 63
se foloseasc o metod statistic alternativ, neparametric. Folosirea
metodelor parametrice n astfel de situaii este totui permis dac se
realizeaz o transformare a datelor care s corecteze distribuia acestora.
Transformarea datelor este necesar dac datele sunt sub form de
numr de entiti. Astfel de variabile discrete au o distribuie evident
asimetric. n astfel de situaii se folosesc transformri care au rolul de a
normaliza distribuia datelor.
Numeroase tehnici parametrice compar mediile probelor care se
presupune c au variane suficient de asemntoare i care, din aceast
cauz, pot fi ignorate. Datele discrete ce reprezint numrtori de entiti nu
ndeplinesc aceast condiie, deoarece variana este dependent de medie n
sensul c populaiile la care media are o valoare mare, mprtierea valorilor
fa de medie este mai mare i, implicit, variana va fi mai mare. n astfel de
situaii transformrile au rolul de a ntrerupe relaia dintre medie i varian,
adic de a stabiliza variana datelor.
Transformrile cele mai utilizate n ecologie sunt logaritmul,
radicalul i transformarea arcsin (anexa 3). Acestea se calculeaz n diferite
condiii pentru toate valorile individuale din probe.
Transformarea logaritmic se utilizeaz atunci cnd variana
probei este mai mare dect media acesteia. De asemenea, are si rolul de a
normaliza distribuia datelor. Valoarea transformat x' a unei valori
individuale x se calculeaz folosind cel mai adesea logaritmul zecimal sau
pe cel natural:

x
i
= log
10
(x) sau x
i
= ln(x) .

Dac n prob exist valori egale cu zero, atunci logaritmul nu are
sens i transformarea se poate face fie adugnd o unitate la toate valorile,
fie folosind transformarea arcsinh (sinus hiperbolic invers) returneaz
valoarea zero dac x = u.

x
i
= log(x +1)
x
i
= orcsinb(x)

Transformarea prin extragerea radicalului se folosete atunci
cnd variana datelor de tip numr de entiti este aproape egal cu media i
64 Elemente de statistic aplicate n ecologie
pentru normalizarea distribuiei. i aici, n cazul existenei valorilor nule, se
poate aduna o constant la toate valorile din prob (1 sau u,S):

x
i
=

x
x
i
= x +1 sau x
i
= x +u,S .

Transformarea arcsin se folosete atunci cnd datele sunt sub
form de proporii sau procente. n cazul unor astfel de variabile distribuia
valorilor este trunchiat de cele dou valori extreme: u i 1 pentru proporii
i u i 1uu pentru procente. Rezultatul transformrii n radian se transform

x
i
= orcsin(

x) pentru proporii
x
i
= orcsin __
x
100
] pentru procente

n anumite situaii este nevoie de realizarea transformrii inverse
(anexa 3) pentru raportarea rezultatului n forma iniial a datelor (x' - x).
Transformarea invers se realizeaz astfel:
Pentru transformarea prin logaritmare:
x = ontilog(x
i
)
x = ontilog(x
i
) -1 .

Pentru transformarea arcsinh:
s = sinb(x
i
) .

x = x
i2

x = x
i2
-1 sau x = x
i2
-u,S .

Pentru transformarea arcsin:
x = (sin(x'))
2

x = (sin(x'))
2
1uu .

5. STATISTIC INFERENIAL: ELEMENTE
INTRODUCTIVE

Statistica inferenial (inductiv sau analitic) este partea statisticii
care cuprinde metode de apreciere critic a variabilitii parametrilor
empirici. Inferena statistic reprezint tratarea teoretic a datelor pentru a se
ajunge la concluzii logice, asociate observaiilor efectuate. Din punct de
vedere ecologic, inferena statistic reprezint stabilirea unor concluzii
despre populaii pornindu-se de la analiza probelor prelevate din populaiile
respective.
n general, se recunosc dou categorii largi de inferene statistice:
estimarea unor parametri populaionali i testarea ipotezelor statistice.

5.1. ESTIMAREA MEDIEI POPULAIONALE

Dac dintr-o populaie se preleveaz o prob aleatoare, aceasta va fi
una din numeroasele probe aleatoare care se pot extrage din populaia
respectiv. Fiecare dintre aceste populaii va avea statistici diferite: medii
diferite, deviaii standard diferite. Cu toate acestea, statisticile acestor
populaii sunt estimatori ai parametrilor populaionali (fig. 5.1). Diferenele
dintre aceste probe sunt cauze ale erorii de eantionare, ce rezult din faptul
c unele probe vor cuprinde mai multe valori mari, n timp ce altele, mai
multe valori mici din populaia de cercetat. Eroarea de eantionare nu este
rezultatul unor greeli realizate de observator, ci reflect mprtierea
aleatoare ce se regsete n probe. Mediile probelor prelevate aleator din
populaie se distribuie n jurul mediei populaionale, la fel cum valorile
individuale ntr-o prob se distribuie n jurul mediei probei (fig. 5.2). Acest
concept are o valoare fundamental i este surprins de Teorema limit
central (Moivre 1738, Laplace 1813): mediile probelor (x

) extrase dintr-o
populaie normal distribuit sunt la rndul lor normal distribuite n jurul
mediei populaionale (). Mediile probelor extrase dintr-o populaie
nenormal distribuit au o distribuie aproximativ normal dac dimensiunea
probei este mare (n > 30).
66 Elemente de statistic aplicate n ecologie

Figura 5.1. Reprezentarea grafic a prelevrii repetate a probelor din populaie. (linie
continu sensul prelevrii; line ntrerupt sensul estimrii)

Figura 5.2. Distribuia normal a mediilor probelor fa de media populaiei

Utilitatea acestei teoreme const n faptul c nu este necesar
prelevarea repetat a probelor din populaie pentru a cunoate modul lor de
distribuire; ele vor avea o distribuie normal. Astfel, putem lua n
considerare doar o singur medie a unei probe prelevate dintr-o populaie ca
fiind una dintre numeroasele medii a cror distribuie ar fi normal. La fel
cum deviaia standard surprinde mprtierea valorilor individuale fa de
media probei, tot aa, mprtierea mediilor probelor poate fi surprins de o
deviaie standard a mediilor probelor, care se numete eroarea standard a
mediei.
x

1
x

2
x

3
x

4
x

5
x

6
Populaie
,
Populaie 1
x
1
, s
1

Populaie 2
x
2
, s
2

Populaie 3
x
3
, s
3

Populaie i
x
i
, s
i

Statistic inferenial: elemente introductive 67
Estimarea mediei populaionale se poate face pornind de la media i
deviaia standard ale unei probe i cu ajutorul erorii standard a mediei. Dat
fiind faptul c distribuia mediilor probelor se abate de la normalitate pe
msur ce dimensiunea probei scade, se apeleaz la o distribuie care descrie
mai bine distribuia mediilor probelor atunci cnd deviaia standard a
populaiei este estimat prin deviaia standard a probei. Aceast distribuie
se numete distribuia t sau distribuia Student.
Distribuia Student este similar n multe privine cu distribuia
normal, dar, spre deosebire de aceasta, este definit, pe lng media i
deviaia standard, i de numrul gradelor de libertate (n 1). Aa cum o
valoare z corespunde unei anumite proporii din distribuia normal
standard, tot aa o valoare t corespunde unei proporii a distribuiei Student,
dar n plus ia n consideraie i dimensiunea probei prin intermediul gradelor
de libertate. Valorile lui t scad odat cu creterea diferenei n 1, astfel c o
valoare critic t
(0,05,)
ce definete u,9S sau exclude u,uS din distribuia
Student pentru o infinitate de valori ca grade de libertate are valoarea 1,96,
(0,95)
ce definete aceeai proporie din distribuia
normal standard. Deci distribuia t tinde s devin normal odat cu
creterea dimensiunii probei.
Valorile distribuiei t sunt tabelate sau se pot calcula n funcie de
proporia exclus din distribuie i de numrul gradelor de libertate. De
exemplu, valoare t ce exclude u,uS din distribuia Student pentru n 1 = 4
grade de libertate este 2,776. Proporia (u,uS) sau procentul (S%) exclus
este repartizat n mod egal n cele dou cozi ale distribuiei (fig. 5.3).

Figura 5.3
-2,776 0 2,776
0,025 0,025
68 Elemente de statistic aplicate n ecologie
Deci exist de fapt dou valori t: +2,776 care exclude u,uS2 =
u,u2S din coada din dreapta a distribuiei i 2,776 care exclude u,u2S din
Dac dorim s reprezentm valoarea t care exclude u,uS din
distribuie doar n coada dreapt pentru 4 grade de libertate, atunci trebuie
cutat n tabel valoarea ce exclude u,1 din distribuie, care exclude cte
u,uS n fiecare coad din distribuie (fig. 5.4). Aceast valoare este _2,1S2.
Deci, dac ne intereseaz o singur coad a distribuiei, trebuie cutat
valoarea t care exclude o proporie dubl din distribuie.

Figura 5.4

Estimarea intervalului de confiden al mediei populaionale pe baza
deviaiei standard a probei i cu ajutorul distribuiei t are urmtoarele
condiii de aplicare:

1. proba este prelevat aleator din populaia de interes;
2. datele sunt apreciate pe o scal de raport sau de interval;
3. variabila este aproximativ normal distribuit n prob.

Pentru a realiza estimarea este nevoie de valoarea mediei probei x i
a deviaiei standard estimate s.
Cu ajutorul deviaiei standard se calculeaz eroarea standard a
mediei:

s
x
=
s
n
.
-2,132 0 2,132
0,05
0,05
Statistic inferenial: elemente introductive 69

Se estimeaz intervalul de confiden pentru o probabilitate de u,9S
(9S%) a mediei populaiei pornind de la relaia:

p = x _s
x
t
(0,05,n-1)
.

Din aceast relaie rezult limita inferioar (II) i cea superioar
(IS) a intervalului de confiden:

II = x -s
x
t
(0,05,n-1)

IS = x +s
x
t
(0,05,n-1)
.

Concluzia estimrii este c intervalul II-IS include media populaiei
din care a fost extras proba, cu o probabilitate de 9S% (u,9S).

Exemplul 5.1. La o prob format din Su de indivizi de viper de
step (Vipera ursinii moldavica) extras aleatoriu dintr-o populaie s-a
msurat lungimea n mm de la vrful botului i pn la cloac. S-a estimat
apoi intervalul de confiden al mediei pentru o probabilitate de 9S%.

390 228 440 66 215 146 443 375 450 260
330 500 340 363 491 325 390 425 418 422
389 435 470 360 370 400 390 430 164 340

Se verific dac datele ndeplinesc condiiile de aplicare: proba a fost
prelevat aleatoriu din populaia de interes; lungimea este o variabil
continu apreciat pe o scal de raport; pentru a verifica normalitatea datelor
putem folosi elemente din statistica descriptiv a probei.

Ho = S9u
Hc = S89,S
x = S62,17

Cele trei msuri ale tendinei centrale au valori relativ apropiate. Se
poate considera c datele sunt aproximativ normal distribuite.
n continuare se calculeaz deviaia standard a probei:
70 Elemente de statistic aplicate n ecologie
s = 96,62 .

Cu ajutorul acestei valori se afl eroarea standard a mediei:

s
x
=
96,62
30
=
96,62
5,47
= 17,64 .

Se estimeaz limitele intervalului de confiden al mediei. n acest
sens, se caut valoarea t n tabel.

t
(0,05,29)
= 2,u4S

p = S62,17 _17,64 2,u4S = S62,17 _S6,u8
II = S62,17 -S6,u8 = S26,u9
IS = S62,17 +S6,u8 = S98,2S

Intervalul S26,u9-S98,2S include media populaional a lungimii de
la vrful botului la cloac cu o probabilitate de 9S%.
Reprezentarea grafic a intervalului de confiden al mediei se
realizeaz prin intermediul unor segmente dispuse deasupra i dedesubtul
mediei, ce simbolizeaz limita inferioar i cea superioar (fig. 5.5).

Figura 5.5. Intervalul de confiden al mediei (95%)

Acest tip de reprezentare poate fi folosit i atunci cnd se compar
362,17
300
320
340
360
380
400
420
x

326,09
398,25
Statistic inferenial: elemente introductive 71
mediile mai multor probe din populaii diferite. Suprapunerea intervalelor
indic absena unei diferene marcante ntre mediile celor dou populaii din
care au fost prelevate probele analizate.

5.2. ESTIMAREA UNEI PROPORII

n ecologie, se folosesc adesea frecvenele de apariie ale unei valori
n probe reprezentat sub forma unei proporii sau procent din total.
Proporia unei specii n prob reprezint o estimare a proporiei populaiei n
comunitatea analizat. Probele ulterioare reprezint estimatori ai proporiei
populaiei din specia de interes n comunitate. Proporiile rezultate din
analiza acestor probe vor fi diferite datorit erorii de selecie. Aceste
proporii ale probelor se vor distribui n jurul proporiei populaiei n acelai
fel cu modul n care se distribuie mediile probelor n jurul mediei populaiei.
Deviaia standard a distribuiei se numete eroare standard i se estimeaz
astfel:

E. S. = _
p(1-p)
n-1

p proporia speciei n numrul total de specii.

Intervalul de confiden al proporiei populaiei este:

p _(1,96 E. S. ) .

5.3. ESTIMAREA EFECTIVULUI POPULAIONAL

Indicele Lincon-Petersen este un estimator al numrului de indivizi
dintr-o populaie, pe baza proporiei indivizilor marcai n prima prob care
se regsesc (sunt recapturai) n a doua prob.

N

=
(n
1
+1)(n
2
+1)
(m
2
+1)
-1 ,
N

estimarea efectivului populaiei;

n
1
nr. indivizilor capturai, marcai i eliberai n prima prob;
n
2
nr. total al indivizilor capturai n a doua prob;
m
2
nr. indivizilor marcai, recapturai n a doua prob.
72 Elemente de statistic aplicate n ecologie
Deviaia standard aproximativ a acestui estimator este:

s = _
(n
1
+1)(n
2
+1)(n
1
-m
2
)(n
2
-m
2
)
(m
2
+1)
2
(m
2
+2)
.

Intervalul de confiden al efectivului populaiei (N) pornind de la
relaia:

N = N

_1,96 s .

5.4. ESTIMAREA INDICELUI DE DIVERSITATE

Indicii de diversitate sunt utili n aprecierea biodiversitii unei zone.
Cel mai simplu indicator al diversitii biologice este bogia specific sau
numrul de specii. Exist o serie de indici ai diversitii care, pe lng
numrul de specii, iau n consideraie i ct de echitabil sunt reprezentate
speciile din comunitate, prin intermediul numrului de indivizi. Unul dintre
cei mai folosii astfel de indici este indicele Shannon-Weaver:

E = -p

ln(p

)
p

proporia indivizilor speciei i din suma nr. de indivizi ai tuturor

speciilor.

Estimarea deviaiei standard care s descrie mprtierea valorilor
indicilor calculai pentru aceeai comunitate, n jurul unei medii
populaionale, este dificil. Din raiuni practice, valoarea indicelui trebuie
tratat ca o variabil ordinal. Astfel, o valoare a indicelui egal cu 4,u nu
trebuie considerat ca fiind de dou ori mai mare dect una egal cu 2,u.
Tehnicile statistice care se pot aplica valorilor apreciate pe o scal ordinal
sunt n general neparametrice sau independente de distribuie. De exemplu,
un set de indici obinui prin analiza mai multor probe extrase din aceeai
zon poate fi comparat cu un alt set extras rezultat din alt zon prin
intermediul testului u Mann-Whitney (seciunea 7.1.2).
O alt modalitate de comparare a indicilor const n transformarea
acestora n diversiti relative (E
cI
), exprimate proporional sau procentual:

Statistic inferenial: elemente introductive 73
E
cI
=
H
H
mcx
=
H
In(S)

E
mux
diversitatea maxim pentru acelai numr de specii
(diversitatea unei comuniti ideale cu acelai nr. de specii
cu cea real, n care toate speciile sunt reprezentate prin
acelai nr. de indivizi);
S bogia specific sau nr. de specii identificate n comunitate.

Cnd se compar valorile indicilor de diversitate (E) trebuie avute n
vedere dou aspecte: se compar indici pentru comuniti asemntoare (de
exemplu, se compar o comunitate de psri cu alta tot de psri, nu de
mamifere); se compar indici rezultai din analiza unor probe cu numere
apropiate de organisme.

Exemplul 5.2. ntr-un studiu al vegetaiei de step din rezervaia de
la Valea lui David s-au calculat diversitile pentru cinci comuniti vegetale
din asociaia Taraxaco serotinae-Festucetum valesiacae i diversitatea unei
comuniti din aceeai asociaie, studiat nainte de 1969 i notat cu A.

Releveu H H
re|
F S |n(F) |n(S)
1 1,519 0,438 0,143 32,0 -1,947 3,466
2 1,543 0,454 0,156 30,0 -1,858 3,401
3 1,971 0,579 0,239 30,0 -1,430 3,401
5 2,051 0,637 0,311 25,0 -1,168 3,219
4 2,130 0,662 0,337 25,0 -1,089 3,219
Media 1,843 0,554 0,237 28,4 -1,498 3,341
A 1,639 0,423 0,107 48,0 -2,232 3,871

Se poate observa c media indicilor de diversitate a celor cinci
relevee actuale este ceva mai mare dect valoarea indicelui pentru releveul
A, dei numrul de specii (S) n cel din urm este evident mai mare. Acest
fapt poate fi explicat prin echitabilitatea redus a speciilor n releveul A.
Echitabilitatea n acest exemplu a fost calculat pe baza relaiei:

E =
c
H
s
=> E = ln(S) +ln(E) .

74 Elemente de statistic aplicate n ecologie
Cum echitabilitatea este un numr subunitar, logaritmul va fi un
numr negativ, deci indicele de diversitate E este egal cu diversitatea
maxim E
mux
= ln(S) care este micorat de echitabilitatea sczut a
abundenei speciilor ln(E)

5.5. TESTAREA IPOTEZELOR STATISTICE

n orice tiin, progresul se obine prin realizarea observaiilor
asupra unor procese sau fenomene i prin experimente ale cror concluzii
sunt utilizate sub forma unor generalizri sau teorii care s explice
observaiile. Demersul tiinific debuteaz cu realizarea observaiilor i cu
explicarea lor. Explicaia unei observaii tiinifice se numete ipotez i are
urmtoarele caracteristici: este n concordan cu observaiile fcute, adic,
dac este adevrat, atunci va explica ceea ce s-a observat; poate fi testat
prin experimente, adic, dac este fals, atunci acest lucru poate fi dovedit.
De ce trebuie dovedit falsitatea unei ipoteze i nu veridicitatea ei?
n filosofia tiinei, se consider c s poate dovedi c o ipotez fals este
fals, n timp ce o ipotez adevrat poate s nu se dovedeasc niciodat c
este adevrat. Ca urmare, o ipotez este considerat adevrat att timp ct
nu poate fi infirmat prin alte observaii, experimente i testri. Cnd
ncercrile de a dovedi falsitatea unei ipoteze eueaz, atunci ncrederea,
confidena n ipoteza respectiv crete. Dac o astfel de ipotez are o
aplicativitate larg i explic numeroase evenimente, atunci ea devine o
teorie. La fel ca n cazul ipotezelor, o teorie adevrat s-ar putea s nu poat
fi dovedit a fi adevrat, n timp ce una fals se poate dovedi a fi fals.
Se poate astfel spune c tiina avanseaz mai degrab infirmnd
dect afirmnd i c pn la urm teoriile incorecte vor fi invalidate.
Metodologia tiinific de confirmare a unei ipoteze opereaz pe
baza logicii dac atunci: dac ipoteza este corect, atunci rezultatul
testrii trebuie s fie unul anume. Dac rezultatul testrii este altul dect cel
prezis de ipotez, aceasta se respinge i trebuie cutat o explicaie mai
bun. Acest proces tipic pentru tiin este numit testarea ipotezelor.
Testarea unor concluzii tiinifice prin procedee statistice se numete
testarea ipotezelor statistice i reprezint o aplicare specific a
metodologiei tiinifice. Formularea ipotezelor statistice se face astfel nct
Statistic inferenial: elemente introductive 75
s existe doar dou rezultate posibile. De exemplu, se pot formula dou
Dac primul enun este cel adevrat, atunci, conform filosofiei tiinei, nu se
poate dovedi acest fapt. Dac ns se testeaz al doilea enun i acesta se
dovedete a fi incorect (o ipotez fals se poate dovedi c este fals), atunci
se respinge enunul testat afirmaia A este fals i se accept cellalt
enun afirmaia A este adevrat ca unic alternativ corect.
Cnd se lucreaz pe probe extrase din populaii, deci doar cu o parte
din ntregul la care n final se va face referin, va exista ntotdeauna o
probabilitate ca proba s nu fie reprezentativ pentru toat populaia. Cu
toate acestea, se va putea preciza probabilitatea ca o ipotez din cele dou s
fie corect sau incorect. Dac probabilitatea ca ea s fie incorect este
foarte mic, atunci se poate considera c ipoteza respectiv este corect i
invers, dac probabilitatea ca ipoteza s fie corect este foarte mic, atunci
se poate concluziona c ipoteza este incorect.
n orice testare a ipotezelor statistice, ipotezele formulate sunt
ntotdeauna contradictorii. Ipoteza testat prin diferite procedee numite teste
statistice este aa-numita ipotez nul (H

). Aceasta presupune n general

lipsa efectului, lipsa diferenei i, ca urmare, conine sau implic o egalitate.
Cealalt ipotez, ipoteza alternativ (H
1
sau H
a
), se numete ipotez
alternativ. De exemplu, dac dorim s artm c A este diferit de B, atunci
E
0
va fi A = B (conine o egalitate), iar cea E
1
va fi A = B. Ipoteza care se
testeaz este de fapt E
0
. Dac aceasta se dovedete adevrat, atunci se
accept ca atare. Dac E
0
se dovedete a fi fals, atunci se respinge i se
accept E
1
ca unic alternativ.
Orice test statistic const ntr-o serie de calcule aplicate datelor din
probe care au ca rezultat o singur valoare numit statistica testului.
Statistica unui test reprezint o translaie a datelor din probe la o distribuie
cunoscut. Este un proces similar cu cel de trecere a unei valori de la o
distribuie normal particular la o valoare z a distribuiei normale standard,
valoare ce corespunde unei anumite proporii din distribuie sau unei
anumite probabiliti (seciunea 4), conform schemei x - z - p.
Statistica testului, proprie unui anumit tip de distribuie, este comparat cu o
valoare cu semnificaie de prag pentru o anumit probabilitate, numit
valoare critic. n funcie de poziionarea statisticii testului fa de valoarea
critic, se ia decizia de acceptare sau respingere a ipotezei nule. Valorile
76 Elemente de statistic aplicate n ecologie
critice pentru fiecare test statistic sunt calculate i aranjate n tabele sau se
pot calcula pornind de la funciile specifice distribuiilor.
n funcie de ntrebarea la care trebuie s rspund testul statistic,
ipotezele acestuia se pot scrie n mai multe variante. Dac ipotezele conin
semnele = i =, atunci se realizeaz un test n variant bilateral
(H

: A = B; H
1
: A = B). Denumirea provine de la faptul c exist dou
situaii n care se poate respinge ipoteza nul i accepta ipoteza alternativ:
cnd A > B i cnd A < B. Dac ipotezele conin semnele , ,> i <,
atunci se realizeaz un test n variant unilateral (H

: A B; H
1
: A > B
sau H

: A B; H
1
: A < B). n oricare din cele dou variante exist doar o
singur situaie n care se poate respinge ipoteza nul i se poate accepta
ipoteza alternativ: dac i numai dac A > B, pentru prima pereche de
ipoteze, i dac i numai dac A < B, pentru a doua pereche de ipoteze.
n general, testele unilaterale se utilizeaz doar dac exist un motiv
apriori care s sugereze o tendin direcional a datelor. Este bine ca testele
bilaterale s se fac dup o testare n variant bilateral. ntre cele dou
variante ale unui test nu exist nici o diferen n privina modului de calcul
al statisticii testului, ci difer doar ipotezele i pragul de semnificaie mai
mic n cazul testelor unilaterale (seciunea 5.1, fig. 5.3, 5.4 i explicaiile
aferente).
Luarea unei decizii statistice se realizeaz n funcie de pragul de
probabilitate. Acesta se mai numete i nivel de confiden, de ncredere
sau prag de semnificaie i se noteaz cu u. Valorile o cel mai des utilizate
n ecologie sunt u,uS sau u,u1 i se desemneaz nainte de derularea
testului. Pragul de semnificaie (o) sau probabilitatea calculat pentru o
anumit statistic a unui test (p) trebuie precizat n concluziile oricrei
cercetri n care s-au folosit teste statistice (de exemplu, rezultatul este
semnificativ n proporie de 9S% sau pentru o = u,uS sau
pentru p < u,uS sau pentru p = u,uuuS).
Se poate ntmpla ca E
0
s fie respins pentru o valoare a
probabilitii egale cu u,uS, dar s nu poat fi respins dac nivelul de
ncredere stabilit apriori este de u,u1. Aceast situaie se datoreaz faptului
c, pentru majoritatea distribuiilor, valoarea critic crete pe msur ce
nivelul de ncredere scade. Ce decizie se ia ntr-o astfel de situaie i cum
poate fi ea argumentat pentru a elimina subiectivismul?

Statistic inferenial: elemente introductive 77
n orice test statistic pot s apar dou genuri de erori statistice (tab.
5.1):
eroare de genul I, ce const n respingerea eronat a E
0
cnd este
adevrat; riscul sau probabilitatea de a face o astfel de eroare este u;
eroare de genul II, ce const n acceptarea eronat a E
0
cnd este
fals; riscul sau probabilitatea de a face o astfel de eroare este .

Tabelul 5.1. Consecinele posibile ale unei decizii statistice

E
0
E
1
Ipoteza acceptat
E
0
Corect
(1 -o)
Eroare II
p = [
E
1
Eroare I
p = o
Corect
(1 -[)

Dac se dorete reducerea riscului de a comite o eroare I, atunci o
trebuie s scad, ceea ce conduce la creterea riscului [ de a comite o eroare
II i invers. Se consider c o = u,uS asigur un echilibru ntre riscul de a
comite o eroare de genul I i cel de a comite o eroare de genul II.
Dac valoarea o se decide de la nceput sau se poate calcula pentru o
anumit statistic a unui test corespunztor unei funcii de distribuie,
valoarea lui [ nu se calculeaz. Valoarea lui [ scade pe msur ce
dimensiunea probelor (n) crete i crete pe msur ce diferena dintre
valorile comparate (A i B) scade. Riscul [ variaz de la un test la altul. Un
test puternic nseamn de fapt c are un risc mic, adic este mai puin
influenat de dimensiunea probei i de diferenele mici dintre valorile
comparate.
Legat de puterea unui test sau de riscul de a comite o eroare de genul
II, trebuie menionat c testele neparametrice sau independente de distribuie
sunt mai puin puternice dect cele parametrice, mai restrictive. Din aceast
cauz un cercettor ar putea manifesta o tendin de evitare a testelor
neparametrice n ideea folosirii unor teste mai puternice. O astfel de
atitudine se poate dovedi eronat nu trebuie sacrificat validitatea utilizrii
unui test n favoarea puterii acestuia! Regula de siguran n privina alegerii
unui test parametric sau neparametric este c, dac exist o ndoial orict
de mic cu privire la modul n care datele din probe satisfac condiiile
78 Elemente de statistic aplicate n ecologie
restrictive ale unui anumit test parametric, atunci mai bine se apeleaz la un
test neparametric alternativ celui parametric.
Rezumnd aspectele prezentate pn acum, testarea ipotezelor
statistice se realizeaz prin parcurgerea urmtoarelor etape:

1. Enunarea clar a ntrebrii la care se dorete aflarea rspunsului
n urma prelucrrii datelor din probe.
2. Identificarea tipului de variabil i a scalei de apreciere a acesteia
i aprecierea distribuiei probei. Aceast etap permite luarea
deciziei privind utilizarea unui test parametric sau a unuia
neparametric.
3. Pe baza rspunsurilor din primele dou etape se formuleaz cele
dou ipoteze statistice (practic se alege o variant bilateral sau
una unilateral a testului) i se stabilete regula de decizie (se
desemneaz nivelul de ncredere sau de confiden o).
4. Se calculeaz statistica sau statisticile testului.
5. Se compar statistica obinut cu valoarea critic corespunztoare
valorii o i gradelor de libertate i se ia o decizie privind
acceptarea sau respingerea ipotezei nule. Decizia mai poate fi
luat i prin calcularea probabilitii corespunztoare statisticii
testului (aceasta va fi de fapt probabilitatea ca E
0
cu ajutorul funciei distribuiei acesteia sau folosind un sistem de
programe pentru computere adecvat (un software).

6. TESTAREA UNEI IPOTEZE PRIVIND MEDIA UNEI
SINGURE POPULAII

Aceast testare permite compararea mediei unei probe (x

) cu o
valoare de interes care de obicei reprezint media cunoscut a unei populaii
(). Altfel spus, se verific ce probabilitate exist ca proba luat n analiz
s provin dintr-o populaie cu o anumit medie cunoscut. Populaia din
care a fost extras proba poate fi diferit de cea de referin, caz n care se
testeaz o ipotez nul conform creia nu exist o diferen semnificativ
ntre mediile celor dou populaii.
Testul care se folosete ntr-o astfel de situaie se numete Testul t
(Student) pentru o prob. Fiind un test parametric, condiiile de aplicare
ale acestuia sunt urmtoarele:

1. proba trebuie s fie extras aleator din populaie;
2. variabila trebuie s fie exprimat pe o scal de raport sau de
interval;
3. valorile probei trebuie s fie aproximativ normal distribuite.

Dac p este media populaiei din care a fost extras proba i p
0
este
media populaiei de referin sau o valoare de referin, atunci ipotezele
testului pot fi:

E
0
: p = p
0
E
0
: p p
0
E
0
: p p
0

E
1
: p = p
0
E
1
: p > p
0
E
1
: p < p
0
.

Prima pereche de ipoteze se scrie n cazul variantei bilaterale a
testului, adic atunci cnd ntrebarea este: Exist o diferen semnificativ
ntre p i p
0
?.
Ultimele dou perechi de ipoteze se scriu n cazul unui test
unilateral dreapta (Este p semnificativ mai mare dect p
0
?) i, respectiv,
unui test unilateral stnga (Este p semnificativ mai mic dect p
0
?).
80 Elemente de statistic aplicate n ecologie
Indiferent de varianta n care se realizeaz testul, statistica sa este:

t =
x -
0
s
x
.

n aceast relaie x este un estimator al mediei populaiei din care a
fost extras proba (p).
Condiia testului const n compararea statisticii acestuia cu o
valoare critic t
(u,n-1)
:

dac t t
(u,n-1)
=> E
0
se respinge i se accept E
1
pentru o
probabilitate de 1 o sau 1uu(1 o)%. Deci se accept c p i p
0

difer semnificativ una de alta. Dac t < t
(u,n1)
, atunci se accept
E
0
pentru aceeai probabilitate, adic nu exist o diferen
semnificativ ntre p i p
0
.

Dac p este semnificativ diferit de p
0
, nseamn c p este ori mai
mare, ori mai mic dect p
0
Aceasta implic faptul c x este mai mic sau
mai mare dect p
0
.
n situaia n care x este mai mare dect p
0
, atunci numrtorul
statisticii t va fi negativ i, implicit, statistica t va avea o valoare negativ.
Deci t trebuie comparat cu valoarea critic pozitiv aflat n dreapta cozii
distribuiei t. n acelai mod, dac x este mai mic dect p
0
, statistica t va fi
negativ i trebuie comparat cu valoarea critic negativ din coada stng a
cozii distribuiei.
Condiia testului ar trebui n realitate scris astfel:

dac t este mai mic dect valoarea critic negativ i mai mare dect
valoarea critic pozitiv, atunci E
0
se respinge i se accept E
1

pentru o probabilitate de 1 o sau 1uu(1 o)%.

Astfel rezult c dac t se gsete ntre valoarea critic negativ i
cea pozitiv, E
0
va fi acceptat. Deci ntre cele dou valori critice exist
zona de acceptare a ipotezei nule (1 o), n afara creia se gsesc zonele de
respingere a acesteia i de acceptare a ipotezei alternative (cte o2 n
fiecare coad a distribuiei) (fig. 6.1).
Testarea unei ipoteze privind media unei singure populaii 81

Figura 6.1. Zonele de respingere a H

pentru un test bilateral

Atunci cnd se aplic testul n variant unilateral, atunci exist o
singur zon de respingere a E
0
cantonat doar ntr-o singur coad a
distribuiei: dreapt sau stng. Dac se vizeaz coada din dreapta
distribuiei (E
1
: p > p
0
), atunci statistica testului (t) trebuie comparat cu
valoarea critic pozitiv (fig. 6.2).

Figura 6.2. Zona de respingere a H

pentru un test unilateral dreapta

Dac se urmrete coada din stnga a distribuiei (E
1
: p < p
0
),
atunci statistica testului (t) trebuie comparat cu valoarea critic negativ
(zona de respingere a E
0
se afl n partea opus fa de cum este prezentat
n figura 6.2).
H
1
-t H
0
+t H
1
1 -
/2 /2
H
0
+t H
1
1 -

82 Elemente de statistic aplicate n ecologie
Pentru a simplifica lucrurile, se poate scrie condiia testului astfel
nct s fie valabil i n cazul unui test bilateral, i n cazul testelor
unilaterale, anume cu statistica testului n modul:

dac |t| t
(u,n1)
=> E
0
se respinge i se accept E
1
cu o
probabilitate de 1 o sau 1uu(1 o)%.

Reamintim c valoarea critic pentru un anumit prag de confiden o
pentru un test unilateral este egal cu valoarea critic pentru un prag de
confiden 2o pentru un test bilateral (seciunea 5.1, fig. 5.2, 5.4).

Exemplul 6.1. ntr-un studiu s-a urmrit concentraia unui
biomarker al polurii apei n corpul unei specii de pete. O concentraie mai
mare de 1uu uniti/g indic o poluare a apei n care triesc petii. Este
poluat apa din care s-a extras aleatoriu o prob format din Su de peti?

87 90 94 94 94 95 95 98 98 101
101 102 102 103 104 105 106 106 106 107
108 110 110 111 117 118 123 124 130 137

Se parcurg etapele unei testri statistice (seciunea 5.5). Astfel, prima
etap const n clarificarea ntrebrii problemei. Din punct de vedere
statistic, ntrebarea este urmtoarea: Este media concentraiei biomarker-ului
n populaia din care s-a extras proba semnificativ mai mare dect media
populaiei de referin? sau mai concret Este media populaiei din care s-a
extras proba semnificativ mai mare dect 1uu?. Dac ntrebarea problemei
ar fi fost pus invers Provin petii din prob dintr-o ap nepoluat? ,
atunci ntrebarea din punct de vedere statistic ar fi fost Este media
populaiei din care s-a extras proba semnificativ mai mic dect 100?.

A doua etap const n identificarea tipului de variabil. Aa cum
reiese din textul problemei, variabila este concentraia biomarker-ului pe
gram. Concentraia este apreciat pe o scal de raport, deoarece valoarea
zero este absolut. Un alt aspect ce trebuie urmrit n aceast etap este
distribuia valorilor. Pentru a aprecia distribuia ne folosim de relaia dintre
msurile tendinei centrale ntr-o prob normal distribuit (seciunea 3.1).
Testarea unei ipoteze privind media unei singure populaii 83
Deci vom compara media cu mediana i, dac este posibil, i cu modul
probei:

x = S176Su = 1uS,87
Hc = 1u4,S
Ho = 1u6 .

Putem concluziona c cei trei descriptori ai tendinei centrale au
valori apropiate i, ca urmare, distribuia valorilor n probe este aproximativ
normal.
n urma parcurgerii acestei etape se poate spune c se ndeplinesc
toate condiiile de aplicare ale testului t pentru o prob.
Ipotezele testului vor corespunde unei variante unilaterale, aa cum
am stabilit n prima etap:

E
0
: p 1uu
E
1
: p > 1uu .

Cu ajutorul mediei (x = 1uS,87), valorii de referin (p
0
= 1uu) i
erorii standard a mediei (s
x
= 2,142) se calculeaz statistica testului:

t =
105,87-100
21,42
= 2,7S9 .

n continuare se verific condiia testului. Pentru aceasta trebuie
aflat valoarea critic a testului t
(u,n1)
din tabelul valorilor critice ale
distribuiei t (Student) (anexa 2). n cazul nostru, numrul gradelor de
libertate este n 1 = Su 1 = 29, iar nivelul de confiden o = u,uS. Avnd
n vedere c facem un test unilateral, t
(0,05,29)
va fi egal cu t
(0,1,29)
, care s-
ar folosi n cazul unui test unilateral, adic 1,699.

2,7S9 > 1,699 => E
0
se respinge, E
1
se accept
p = u,9S sau 9S%.

O alt modalitate de rezolvare a problemei const n calcularea
exact a probabilitii asociate valorii statisticii testului, adic s aflm
84 Elemente de statistic aplicate n ecologie
proporia din distribuia Student exclus de statistica testului t (anexa 3).
Aceast proporie reprezint probabilitatea (p) ca E
0
ce nseamn c probabilitatea ca E
0
s fie fals sau ca E
1
fi 1 p:

p = u,uuS2, adic statistica testului t = t
(0,0052,29)
.

Deci probabilitatea exact ca media concentraiei biomarker-ului n
populaia de peti s fie mai mic sau egal ca 1uu (E
1
) este de u,uuS2
(u,S2%), ceea ce nseamn c probabilitatea s fie mai mare ca 1uu este
1 u,uuS2 = u,9948 sau 99,48%.

Concluzia testului este cea surprins de E
1
: media concentraiei
biomarker-ului n populaia de peti din care a fost extras proba este
semnificativ mai mare dect valoarea de referin.
Pentru a rspunde la ntrebarea problemei, putem spune c apa din
care a fost extras proba de Su de peti este poluat.

7. TESTAREA DIFERENEI DINTRE DOU PROBE

O astfel de inferen statistic se refer la compararea tendinelor
centrale a dou probe. Cele dou probe pot fi prelevate din dou populaii
diferite, caz n care se numesc probe independente. Denumirea este
argumentat de faptul c eantionarea valorilor primei probe nu influeneaz
probabilitatea de extragere a valorilor celei de a doua probe, deoarece
prelevarea se face din populaii distincte.
Uneori, testarea diferenei se poate face pornindu-se de la probe
neindependente. ntr-un astfel de caz, cele dou probe pot fi prelevate din
aceeai populaie sau se obin prin investigarea unitilor de prob de dou
ori: nainte i dup aplicarea unui anumit tratament unitilor de prob.

7.1. COMPARAREA A DOU PROBE INDEPENDENTE

Cnd se face o astfel de comparaie, se vizeaz de fapt compararea
mediilor populaiilor din care au fost extrase probele. Deci mediile probelor
reprezint estimatori ai mediilor populaiilor din care au fost prelevate.
Cele mai utilizate teste ce pot fi folosite pentru compararea a dou
probe sunt testul t (Student) pentru probe independente i testul U
(Mann-Whitney).

7.1.1. Testul t (Student) pentru probe independente
Acesta este unul dintre cele mai utilizate teste parametrice ce se
folosesc frecvent pentru o astfel de comparaie n ecologie. Fiind un test
parametric, prezint o serie de condiii de aplicare:

1. cele dou probe trebuie s fie prelevate aleator din dou populaii
distincte;
2. variabila trebuie s fie apreciat pe o scal de interval sau de
raport;
3. valorile din cele dou probe trebuie s fie aproximativ normal
distribuite.
86 Elemente de statistic aplicate n ecologie
n funcie de tipul de comparaie, testul poate fi aplicat n variant
bilateral sau unilateral, n funcie de care se scriu ipotezele testului. Fie
populaia A din care se extrage aleator proba A i populaia B din care se
preleveaz aleator proba B. Atunci ipotezele testului pot fi:

Bilateral Unilateral
E
0
: p
A
= p
B

E
0
: p
A
p
B

E
0
: p
A
p
B

E
1
: p
A
= p
B

E
1
: p
A
> p
B

E
1
: p
A
< p
B
.

Statistica testului este urmtoarea:

t =
(x
A
-x
B
)-(
A
-
B
)
_
s
A
2
n
A
+
s
B
2
n
B

x
A
media valorilor din proba A
x
B
media valorilor din proba B
p
A
media populaiei A p
B
media populaiei B
s
A
2
variana probei A s
B
2
variana probei B
n
A
dimensiunea probei A n
B
dimensiunea probei B.

Atenie, diferena dintre mediile probelor p
A
i p
B
este u conform
ipotezelor nule!
Valoarea critic cu care se compar statistica testului se afl (anexa
2) n funcie de o i de numrul gradelor de libertate gl care se estimeaz
conform ecuaiei Welch-Satterthwaite:

gl =
_
s
A
2
n
A
+
s
B
2
n
B
_
2
1
n
A
-1
_
s
A
2
n
A
_
2
+
1
n
B
-1
_
s
B
2
n
B
_
2
.

Exist i o variant mai simpl de estimare a gradelor de libertate:

gl = min(n
A
, n
B
) -1 .

Testarea diferenei dintre dou probe 87
Condiia testului este:

dac |t| t
(u,gI)
=> E
0
se respinge, E
1
se accept, p = 1 o.

Probabilitatea asociat lui t sau E
0
se poate calcula exact (anexa 3),
iar probabilitatea E
1
se afl prin scderea acesteia din 1:

p(E
1
) = 1 p(E
0
) .

Exemplul 7.1. La o prob extras aleator dintr-o populaie de viper
de step (Vipera ursinii moldavica) s-a determinat numrul de perechi de
plci subcaudale. Este numrul de plci subcaudale semnificativ mai mare la
masculi dect la femele?

Femele (f): 31 32 29 29 29 25 29
28 28 27 31 30 28
Masculi (m): 35 37 38 38 38 36 38
39 35 36 37 31 36 38
36 37 37 38 37 32

Dac diferena dintre masculi i femele este semnificativ, nseamn
c este ca i cum ar proveni din dou populaii statistice diferite.
Datele ndeplinesc condiiile de aplicare ale testului t: datele au fost
extrase aleator din populaie, variabila este exprimat pe o scal de raport,
datele sunt aproximativ normal distribuite (x
m
= S6,4S, Hc
m
= S7; x
]
=
28,92S, Hc
]
= 29). Intervalul x _s cuprinde aproximativ 62% din valorile
femelelor i 8S% din valorile masculilor. Pentru ca datele s fie mai normal
distribuite, se realizeaz o normalizare a acestora prin logaritmare cu
ajutorul logaritmului natural (x
i
= ln(x)).

f: 3,4340 3,4657 3,3673 3,3673 3,3673 3,2189 3,3673 3,3322
3,3322 3,2958 3,4340 3,4012 3,3322
m: 3,5553 3,6109 3,6376 3,6376 3,6376 3,5835 3,6376 3,6636
3,5553 3,5835 3,6109 3,4340 3,5835 3,6376 3,5835 3,6109
3,6109 3,6376 3,6109 3,4657

88 Elemente de statistic aplicate n ecologie
Dup transformare, intervalul x _s cuprinde aproximativ 8S% din
valorile femelelor i 9u% din valorile masculilor
n continuare trebuie emise ipotezele testului. Cum ntrebarea la care
trebuie s rspund testul este dac numrul subcaudalelor la masculi este
mai mare dect cel de la femele, atunci ipoteza alternativ va exprima
aceast inegalitate.

E
0
: p
m
p
]

E
1
: p
m
> p
]

Se calculeaz statistica testului:

t =
3,3627-3,5944
_
0,0042
13
+
0,0033
20
= -1u,482 .

Numrul gradelor de libertate se poate afla n dou moduri:

gl =
[
0,0042
13
+
0,0033
20

2
1
13-1
[
0,0042
13

2
+
1
20-1
[
0,0033
20

2
= 2S,6 = 2S
gl = min(1S,2u) -1 = 1S -1 = 12 .

Valoarea critic pentru un test unilateral, pentru 0,05 nivel de
ncredere i gl grade de libertate, se poate cuta n tabel (anexa 2) sau
calcula (anexa 3):

t
(0,05,23)
= 1,714 t
(0,05,12)
= 1,782 .

Valoarea absolut a statisticii testului |-1u,482| este mai mare dect
ambele valori critice, deci se respinge E
0
i se accept E
1
numrului de subcaudale de la masculi este semnificativ mai mare dect cel
de la femele, cu o probabilitate de u,9S sau n 9S% din cazuri.
Probabilitatea ca E
0
s fie adevrat (anexa 3) este de 1,6 1u
-10

pentru 2S grade de libertate i 1,1 1u
-7
pentru 12 grade de libertate. n
ambele situaii, probabilitatea este foarte mic i se poate accepta ipoteza
nul a crei probabilitate este de 1 -p(E
0
Testarea diferenei dintre dou probe 89

7.1.2. Testul U (Mann-Whitney)
Acest test se utilizeaz ca alternativ neparametric a testului t
(Student) pentru probe independente. Unicele condiii ale testului u (Mann-
Whitney) sunt:

1. probele trebuie s fie prelevate aleator din dou populaii distincte;
2. variabila trebuie s fie apreciat pe o scal ordinal, de interval
sau de raport.

Ipotezele testului sunt n esen similare cu cele ale testului t pentru
probe independente:

Bilateral Unilateral
E
0
: A = B

E
0
: A B

E
0
: A B
E
1
: A = B

E
1
: A > B E
1
: A < B .

Aplicarea testului presupune ca valorile celor dou probe s
primeasc ranguri mpreun. Pentru aceasta, valorile din ambele probe se
ordoneaz cresctor ntr-o singur serie. Valoarea cea mai mic va primi
rangul 1, urmtoarea rangul 2 i aa mai departe. Valorile egale vor primi
media rangurilor pe care le-ar fi primit dac ar fi fost diferite (seciunea 2.1,
tab. 2.3).
Ulterior se nsumeaz rangurile corespunztoare valorilor fiecrei
probe, obinndu-se R
A
suma rangurilor corespunztoare valorilor din
proba A i, respectiv, R
B
suma rangurilor corespunztoare valorilor din
proba B. Cu valorile celor dou sume i dimensiunile probelor (n
A
i n
B
) se
calculeaz statisticile testului u
A
i u
B
:

u
A
= n
A
n
B
+
n
A
(n
A
+1)
2
-R
A

u
B
= n
A
n
B
+
n
B
(n
B
+1)
2
-R
B
.

Suma celor dou statistici ale testului trebuie s fie egal cu suma
A
+u
B
= n
A
n
B
. De unde rezult c, pentru
simplificare, putem scrie una dintre statistici, s zicem u
B
, n funcie de
cealalt:
90 Elemente de statistic aplicate n ecologie

u
B
= n
A
n
B
-u
A
.

Decizia privind respingerea sau acceptarea E
0
poate fi luat n dou
moduri, n funcie de dimensiunile celor dou probe (n
A
i n
B
).

1. Dac n
A
2u i n
B
2u, atunci condiia testului este:
Dac valoarea mai mic dintre statisticile testului este mai mic
dect valoarea critic tabelat (anexa 2), atunci se respinge E
0
i se
accept E
1
.

Dac min(u
A
, u
B
) u
(u,n
A
,n
B
)
=> E
0
se respinge, E
1
se accept
pentru p = 1 o.

Valoarea critic trebuie aleas n funcie de varianta bilateral sau
unilateral n care se aplic testul.

2. Dac n
A
> 2u i n
B
> 2u, atunci distribuia probabilistic a lui u
este aproximativ normal i se poate face conversia la distribuia
normal standard:
Pentru aceasta este nevoie s se calculeze media (x
0
) i deviaia
standard (s
0
) ale lui u, dac E
0

x
0
=
n
A
n
B
2

s
0
= _
n
A
n
B
(n
A
+n
B
+1)
12
.

Cu acestea se calculeaz valoarea z corespunztoare N(u,1), unde u
este una dintre cele dou statistici ale testului (u
A
sau u
B
):

z =
0-x
U
s
U
.

Dac |z| z
(0,95)
= 1,96 => E
0
se respinge i se accept E
1

pentru p=0,95.

Testarea diferenei dintre dou probe 91
Exemplul 7.2. S se rspund la ntrebarea de la exemplul 7.1,
considerndu-se c una dintre sau ambele condiii 2 i 3 ale testului Student
pentru probe independente nu sunt ndeplinite.

n acest caz se utilizeaz alternativa neparametric a testului Student,
adic testul Mann-Whitney. Pentru a realiza acest test se dau ranguri
valorilor din cele dou probe mpreun, dup metoda prezentat n seciunea
2.1.

Sex f f f F f f f f f f f f f m m m m
x 25 27 28 28 28 29 29 29 29 30 31 31 32 31 32 35 35
R
i
1 2 3 4 5 6 7 8 9 10 11 12 14 13 15 16 17
R
x
1 2 4 4 4 7,5 7,5 7,5 7,5 10 12 12 14,5 12 14,5 16,5 16,5
continuare
m m m M m m m m m m m m m m m m
36 36 36 36 37 37 37 37 37 38 38 38 38 38 38 39
18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
19,5 19,5 19,5 19,5 24 24 24 24 24 29,5 29,5 29,5 29,5 29,5 29,5 33

Ipotezele testului sunt similare cu cele de la exemplul 7.1:

E
0
: m
E
1
: m > .

Se calculeaz suma rangurilor valorilor de la femele:

R
x
]
= 1 +2 +4 ++14,S = 9S,S .

Statisticile testului vor fi:

u
]
= 1S 2u +
13(13+1)
2
-9S,S = 2S7,S
u
m
= 1S 2u -2S7,S = 2,S .

92 Elemente de statistic aplicate n ecologie
Deoarece dimensiunea probelor este mai mic sau egal cu 2u,
trebuie aflat valoarea critic (anexa 2). Cum testul se aplic n variant
unilateral, atunci valoarea critic din tabelul cu valorile critice u
(u,n
A
,n
B
)

din anexa 2 va fi considerat pentru un nivel de confiden de u,u2S:

u
(0,025,13,20)
= 76 .

De fapt, pentru testul Mann-Whitney exist un interval de acceptare
a E
0
. Suma limitelor acestui interval este egal cu produsul dintre
dimensiunile probelor, n cazul exemplului fiind egal cu 1S 2u = 26u.
Cum una dintre limite este valoarea critic egal cu 76, nseamn c cealalt
este egal cu 26u -76 = 184. Deci intervalul de acceptare a E
0
are limita
inferioar 76 i limita superioar 184. Cele dou statistici calculate sunt n
afara acestui interval, deci ipoteza nul se respinge i se accept n
consecin ipoteza alternativ.

u
m
II IS u
]

2,5 76 184 257,5
E
1
- - E
0
- - E
1

Concluzia este c numrul de subcaudale la masculi este
semnificativ mai mare dect la femele, cu o probabilitate de u,97S sau n
97,2S% din cazuri.

7.2. COMPARAREA A DOU PROBE NEINDEPENDENTE

Aceste comparaii au drept scop evidenierea efectului unui anumit
tratament asupra valorilor variabilei investigate. Tratamentul poate fi
aciunea unei substane, a unui factor de mediu etc. ce ar putea modifica
valorile individuale ale unei variabile.
n cazul unor astfel de comparaii, probele trebuie s fie
neindependente, deoarece se presupune c astfel s-ar elimina posibilitatea
apariiei unor diferene semnificative datorate deosebirilor dintre populaii.
Astfel, diferenele, dac apar, vor reprezenta efectul tratamentului asupra
unitilor de prob.
Testarea diferenei dintre dou probe 93
Atunci cnd este posibil, este bine ca cele dou probe s rezulte n
urma a dou investigaii repetate asupra unitilor de prob: prima, nainte
de aplicarea tratamentului, i a doua, dup aplicarea acestuia. Astfel, rezult
cte o pereche de valori pentru fiecare unitate de prob.
Existena perechilor de valori este absolut necesar n cazul testelor
ce compar probe neindependente, motiv pentru care acestea se mai numesc
i teste pentru perechi de valori sau pentru observaii perechi.
Testele cele mai uzuale care se folosesc pentru astfel de observaii
sunt testul t (Student) pentru perechi de observaii i testul T
(Wilcoxon).

7.2.1. Testul t (Student) pentru perechi de observaii
Ca i testul t pentru probe independente, i acesta este un test
parametric care necesit ca datele s ndeplineasc o serie de condiii de
aplicare:

1. probele trebuie s fie extrase aleator din aceeai populaie sau s
provin n urma unor investigaii repetate asupra acelorai uniti
de prob, iar dimensiunea probelor trebuie s fie aceeai astfel
nct s existe perechi de observaii;
2. variabila trebuie s fie apreciat pe o scal de interval sau de raport;
3. distribuia valorilor n probe trebuie s fie aproximativ normal.

n funcie de ntrebarea la care testul trebuie s rspund, se scriu
ipotezele n variant bilateral sau unilateral. n esen, ipotezele se
refer la media diferenelor (p

) dintre perechile de valori n

populaie:

Bilateral Unilateral
E
0
: p

= u

E
0
: p

u E
0
: p

u
E
1
: p

= u

E
1
: p

> u

E
1
: p

< u .

Dac se noteaz diferena dintre valorile unei perechi, iar fiecare
dintre valorile perechii aparin probei A i, respectiv, probei B, atunci:

= x
A
-x
B
.
94 Elemente de statistic aplicate n ecologie

Dac media acestor diferene n populaie este zero, atunci nseamn
c tratamentul aplicat nu a modificat semnificativ valorile variabilei. O
medie a diferenelor mai mare ca zero arat c tratamentul a dus la creterea
semnificativ a valorilor, n timp ce una mai mic dect zero arat c
tratamentul a sczut semnificativ valorile.
Principalul estimator al mediei populaionale a diferenelor este
media diferenelor dintre perechile de valori din probe (

). Deci se
calculeaz diferenele corespunztoare fiecrei perechi de valori, iar suma
diferenelor se mparte la numrul perechilor de valori (n) sau la numrul
valorilor dintr-o prob.

=

n

O alt valoare necesar pentru aflarea statisticii testului este eroarea
standard a mediei diferenelor (s

), care se calculeaz mprind deviaia

standard a mediei diferenelor (s

) la radical din numrul perechilor de

observaii (n):

s

=
_

2
-
(D)
2
n
n-1
s

=
s
D
n
.

Statistica testului (t) va fi egal cu raportul dintre media diferenelor
(

) i eroarea standard a mediei diferenelor (s

):

t =

s
D

.

Condiia testului, att pentru varianta bilateral, ct i pentru
variantele unilaterale, este:

dac |t| t
(u,n1)
=> E
0
se respinge, E
1
se accept, pentru p=1.

Valoarea critic se poate afla din tabele (anexa 2) sau se poate
calcula (anexa 3).
Testarea diferenei dintre dou probe 95
Cnd se calculeaz probabilitatea asociat valorii t (anexa 3) (adic
probabilitatea ca ipoteza nul s fie adevrat), atunci ipoteza nul se
respinge dac p(E
0
) este mai mic de nivelul o i se va accepta ipoteza
alternativ pentru o probabilitate de 1 -p(E
0
).

Exemplul 7.3. ntr-un experiment s-a urmrit reacia gndacilor de
buctrie la lumin. Pentru aceasta s-au pus 12 indivizi selectai aleatoriu n
12 incinte cu perei transpareni i la aprinderea luminii s-a urmrit cte
secunde dintr-un minut a petrecut fiecare gndac n mijlocul incintei i lng
pereii incintei. Au gndacii o tendin semnificativ de a se ascunde n
condiii de lumin?

scunde n mijloc (A) 28 17 33 24 15 23 21 21 21 32 27 34
secunde lng perete (B) 32 43 27 36 45 37 39 39 39 28 33 26

n acest exemplu, sunt prezentate dou probe rezultate prin
investigarea acelorai uniti de prob (cei 12 gndaci) de dou ori: pentru
fiecare gndac exist timpul petrecut n mijlocul incintei i timpul petrecut
lng perei. Deci probele nu sunt independente i pentru fiecare unitate de
prob (gndac) exist o pereche de valori (timpul petrecut n mijlocul
incintei i timpul petrecut lng pereii acesteia).
n continuare trebuie verificate condiiile de aplicare ale testului
Student pentru perechi de valori: probele sunt aleatoare i exist observaii
perechi, variabila este exprimat pe o scal de raport, probele au o distribuie
aproximativ normal (x
A
= 24,67, Hc
A
= 2S,S; x
B
= SS,SS, Hc = S6,S).
Condiiile sunt ndeplinite.
Pentru a emite ipotezele testului, trebuie analizat ntrebarea
problemei: dac gndacii ar avea o tendin semnificativ s se ascund,
atunci ar trebui ca timpii petrecui lng perei s fie semnificativ mai mari
dect cei petrecui n centru. Dac se calculeaz diferena = x
B
-x
A
,
atunci diferenele pozitive trebuie s fie dominante, fapt ce trebuie surprins
de ipoteza alternativ.

E
0
: p

u
E
1
: p

> u

96 Elemente de statistic aplicate n ecologie
Se calculeaz diferenele dintre valorile fiecrei perechi:

x
A

28 17 33 24 15 23 21 21 21 32 27 34
x
B

32 43 27 36 45 37 39 39 39 28 33 26
D = x
B
-x
A
4 26 6 12 30 14 18 18 18 4 6 8

Se calculeaz media diferenelor i eroarea standard a mediei
diferenelor care sunt necesare pentru aflarea statisticii testului:

=
128
12
= 1u,67
s

=
_
3056-
16384
12
12-1
= 12,S97
s

=
12,397
12
= S,S79
t =
10,67
3,579
= 2,98 .

Se afl valoarea critic pentru testul unilateral, pentru un nivel de
confiden de u,uS i 12 -1 grade de libertate (anexa 2 sau anexa 3):

t
(0,05,11)
= 1,796 .

Valoarea statisticii testului este mai mare dect valoarea critic, deci
se respinge ipoteza nul i se accept ipoteza alternativ, adic numrul de
secunde petrecut lng pereii incintei este semnificativ mai mare dect
numrul de secunde petrecute n centrul incintei, cu o probabilitate de u,9S
sau n 9S% din cazuri.
Probabilitatea ca ipoteza nul s fie adevrat (anexa 3) este de
u,uu6S, deci probabilitatea ca ipoteza nul s nu fie adevrat i s fie
adevrat ipoteza alternativ este de 1 -u,uu6S = u,99S7.

7.2.2. Testul T (Wilcoxon)
Acest test reprezint alternativa neparametric a testului t pentru
observaii perechi, deci se utilizeaz pentru dou probe neindependente sau
pentru observaii perechi realizate asupra unitilor de prob, nainte sau
dup aplicarea unui tratament. Se folosete atunci cnd nu se respect
Testarea diferenei dintre dou probe 97
condiia 2 sau 3 a testului Student pentru perechi de observaii. Condiiile de
aplicare a testului Wilcoxon sunt:

1. probele trebuie s fie extrase aleator din aceeai populaie sau s
provin n urma unor investigaii repetate asupra acelorai uniti
de prob, iar dimensiunea probelor trebuie s fie aceeai astfel
nct s existe perechi de observaii;
2. variabila trebuie s fie apreciat pe o scal ordinal, de interval
sau de raport.

n cazul acestui test, se calculeaz diferena () dintre observaiile
fiecrei perechi de valori din cele dou probe.

= x
B
-x
A

Diferenele n modul primesc apoi ranguri (|| - R

) la fel ca n
cazul testului u Mann-Whitney. n dreptul fiecrui rang se specific ntre
paranteze semnul diferenei corespunztoare.
Valorile ale cror diferene sunt nule se elimin din analiz, ceea ce
atrage dup sine reducerea corespunztoare a gradelor de libertate.
Ulterior se calculeaz suma rangurilor diferenelor pozitive (R
>0
)
i suma rangurilor diferenelor negative (R
<0
).
Ipotezele care se scriu n acest test sunt n esen similare cu cele ale
testului t pentru probe neindependente, cu excepia faptului c se refer la
sumele rangurilor diferenelor:

Bilateral Unilateral
E
0
: R
>0
= R
<0

E
0
: R
>0
R
<0

E
0
: R
>0
R
<0

E
1
: R
>0
= R
<0

E
1
: R
>0
> R
<0

E
1
: R
>0
< R
<0
.

Ce reprezint aceste diferene? Dac suma rangurilor diferenelor
pozitive este mai mare dect cea a rangurilor diferenelor negative,
nseamn c exist mai multe diferene pozitive, deci valorile din proba B,
influenate de tratament, sunt n general mai mari dect cele din proba A.
Aceasta nseamn c tratamentul aplicat a dus la creterea valorilor. Dac
suma rangurilor diferenelor pozitive este mai mic dect cea a rangurilor
98 Elemente de statistic aplicate n ecologie
diferenelor negative, nseamn c sunt mai multe diferene negative i
valorile din proba A sunt n general mai mari dect cele din B. Deci
tratamentul aplicat a determinat scderea valorilor probei B. Dac cele dou
sume sunt egale, nseamn c exist diferene negative i pozitive n egal
msur i tratamentul nu a modificat semnificativ valorile din proba B.
Statisticile testului (T i T) sunt reprezentate de suma rangurilor
diferenelor pozitive i suma rangurilor diferenelor negative:

I = min (R
>0
, R
<0
)
I
i
=
n(n+1)
2
-I sau I= mox (R
>0
, R
<0
) .

Inspectarea formulelor de mai sus arat c suma celor dou statistici
este egal cu suma rangurilor tuturor diferenelor (diferite de 0) att
pozitive, ct i negative:

I +I =
n(n+1)
2
.

Decizia de acceptare sau de respingere a E
0
se ia n funcie de

1. Dac n SS (sau dect 2S), condiia testului const n
compararea statisticilor cu valoarea critic I
(u,n)
care se gsete n
tabele (anexa 2) i se alege n funcie de varianta n care se aplic
testul i numrul gradelor de libertate egal cu numrul diferenelor
nenule.

Dac I sau I I
(u,n)
=> E
0
se respinge, E
1
se accept, pentru
p = 1 o.

Dac se accept E
1
n cazul unei variante bilaterale, concluzia este
c tratamentul a modificat semnificativ variabila. n cazul variantei
unilaterale dreapta (E
1
: R
>0
> R
<0
), concluzia va fi c
tratamentul a determinat o cretere a valorilor variabilei, iar n cazul
variantei unilaterale stnga (E
1
: R
>0
< R
<0
), c acesta le-a
sczut.
Testarea diferenei dintre dou probe 99
2. Dac n > SS, atunci distribuia I poate fi aproximat prin cea
normal standard. Pentru a putea calcula valoarea z trebuie mai
nti calculate media x
1
i deviaia standard s
1
.

x
1
=
n(n+1)
4

s
1
= _
n(n+1)(2n+1)
24

z =
1-x
T
s
T

Condiia testului este:

dac |z| z
(0,95)
= 1,96 => E
0
se respinge, E
1
se accept,
pentru p = u,9S

Exemplul 7.4. S se rezolve problema din exemplul 7.4,
considerndu-se c una dintre ultimele dou condiii ale testului Student
pentru perechi de observaii nu este ndeplinit.

n acest caz se aplic alternativa neparametric a testului Student
pentru perechi de observaii, adic testul Wilcoxon. Pentru efectuarea
acestui test se calculeaz diferenele dintre valorile fiecrei perechi.
Modulelor diferenelor li se dau ranguri, iar n dreptul fiecrui rang se
specific semnul diferenei corespunztoare.
Ipotezele testului sunt asemntoare cu cele de la exemplul 7.3. Dac
diferenele dintre valorile fiecrei perechi se calculeaz scznd din timpul
petrecut lng perete pe cel petrecut n mijlocul incintei, atunci, dac exist
o tendin semnificativ de ascundere la gndacii de buctrie, ar trebui s
se obin mai multe diferene pozitive i suma rangurilor diferenelor
pozitive ar trebui s fie mai mare dect cea a diferenelor negative. Acest
aspect trebuie surprins n ipoteza alternativ.

E
0
: R
>0
R
<0

E
1
: R
>0
> R
<0

100 Elemente de statistic aplicate n ecologie

Secunde n
centru (A)
Secunde lng
perete (B)
B - A |B - A| R
|
R
D
semnul
diferenei
28 32 4 4 1 1,5 +
32 28 4 4 2 1,5
33 27 6 6 3 3,5
27 33 6 6 4 3,5 +
34 26 8 8 5 5
24 36 12 12 6 6 +
23 37 14 14 7 7 +
21 39 18 18 8 9 +
21 39 18 18 9 9 +
21 39 18 18 10 9 +
17 43 26 26 11 11 +
15 45 30 30 12 12 +

Se calculeaz statisticile testului:

I = 1,S +S,S +S = 1u
I
i
=
12(12+1)
2
-1u = 68 .

Deoarece numrul perechilor de observaii este mai mic de 33, se
afl valoarea critic pentru varianta bilateral n funcie de nivelul de
confiden i de numrul gradelor de libertate:

I
(0,05,12)
= 17 .

i pentru testul Wilcoxon exist un interval de acceptare a E
0
. Suma
limitelor acestui interval este egal cu suma tuturor rangurilor:

R

=
12(12+1)
2
= 78 .

Cum una dintre limite este reprezentat de valoarea critic egal cu
17, nseamn c cealalt este egal cu 78 -17 = 61. Deci intervalul de
acceptare a E
0
are limita inferioar 17 i limita superioar 61. Cele dou
statistici calculate sunt n afara acestui interval, deci ipoteza nul se respinge
Testarea diferenei dintre dou probe 101
i se accept n consecin ipoteza alternativ.

I II IS I
i

10 17 61 68
E
1
- - E
0
- - E
1

Concluzia este c timpul petrecut lng perete este semnificativ mai
mare dect cel petrecut n centrul incintei, cu o probabilitate de u,9S sau n
9S% din cazuri.

8. TESTAREA DIFERENELOR DINTRE TREI SAU MAI
MULTE PROBE

Exist situaii n care, n cadrul unor investigaii ecologice, este
necesar testarea semnificaiei diferenelor dintre trei sau mai multe probe
din punctul de vedere al unei variabile. Dac datele ndeplinesc condiiile de
aplicare ale unor teste parametrice, atunci o astfel de situaie s-ar putea
rezolva printr-o serie de teste t care s verifice semnificaia diferenei pentru
fiecare pereche de probe pn la epuizarea tuturor combinaiilor unice
posibile. De exemplu, dac exist trei probe A, B i C, atunci se face cte un
test Student pentru verificarea semnificaiei diferenei dintre A i B, dintre A
i C i dintre B i C. Dac ns se compar 10 probe n loc de 3, atunci
analiza devine ceva mai dificil, pentru c trebuie efectuate 45 de teste
Student. Pe lng aceasta, ntr-o astfel de situaie mai apare si un aspect
statistic n defavoarea unei asemenea abordri.
Aa cum s-a artat n seciunea 5.5, orice test presupune un risc o de
a efectua o eroare de genul I, ce const n respingerea unei ipoteze nule care
n realitate este adevrat. Cum valoarea cea mai uzual a lui o este u,uS,
nseamn c pentru cele 45 de teste Student riscul apariiei unei astfel de
erori crete la 4S u,uS = 2,2S. Conform acestei valori, nseamn c exist
anse mari de a ajunge la cel puin dou concluzii greite cu privire la
diferenele dintre cele zece probe. O posibil rezolvare ar consta n scderea
valorii o de la u,uS la u,u1, ceea ce ar micora riscul n cazul exemplului la
4S u,u1 = u,4S. ns scznd valoarea nivelului de semnificaie, crete
riscul [ de a comite o eroare de genul II, adic de a accepta o ipotez nul
care n realitate s fie fals.
Aceste neajunsuri care pot s apar cnd se compar trei sau mai
multe probe pot fi depite cu ajutorul analizei varianei. Aceast tehnic
de analiz statistic este simbolizat prin acronimul ANOVA provenit de la
denumirea sa n limba englez (ANalysis Of VAriance), acronim pe care l
vom folosi n continuare pentru a ne referi la aceast tehnic.
ANOVA este o tehnic versatil ce poate fi utilizat pentru
Testarea diferenelor dintre trei sau mai multe probe 103
compararea a trei sau mai multor probe, grupate dup unul sau mai muli
factori, n cadrul unui singur test.

8.1. PRINCIPIUL ANOVA

n esen, ANOVA este o tehnic ce permite descompunerea
variabilitii unui set de probe n componentele sale. Dac ne imaginm c
avem de comparat trei probe, atunci variabilitatea total a acestora va fi
dat de variabilitatea valorilor individuale fa de media fiecrei probe,
adic variabilitatea intern a probelor, i de variabilitatea dintre probe
datorat diferenelor dintre mediile populaiilor din care au fost extrase
probele, adic variabilitatea extern. Dac descriptorul folosit al
variabilitii este variana (s
2
), atunci descompunerea variabilitii poate fi
rezumat prin relaia:

s
t
2
= s
cxt
2
+s
nt
2

s
t
2
variana total;
s
cxt
2
variana extern sau dintre probe;
s
nt
2
variana intern sau din probe.

n ANOVA varianele nu se folosesc ca atare, ci se consider ca
fiind sume de ptrate medii (SP

) obinute prin mprirea sumelor de ptrate

(SP) la numrul gradelor de libertate (gl).

s
2
= SP

=
SP
gI

Astfel vom vorbi de sume de ptrate medii, sume de ptrate i grade
de libertate, totale, externe i interne.
Dac probele au fost extrase aleatoriu din populaii normal
distribuite cu medii i variane egale, atunci variana intern va fi aceeai cu
cea extern. n cazul n care probele provin din populaii cu medii i variane
diferite, atunci diferenele dintre probe vor avea drept cauz principal
variabilitatea sau variana extern. Statistica ANOVA, notat cu F,
reprezint tocmai raportul dintre variana extern i cea intern i are o
distribuie particular Snedecor-Fisher n funcie de nivelul de semnificaie
(o), de gradele de libertate externe (gl
cxt
) i de gradele de libertate interne
104 Elemente de statistic aplicate n ecologie
(gl
nt
). Cu ct valoarea lui F va fi mai mare, cu att variabilitatea total va
rezulta mai mult din variabilitatea extern i mai puin din cea intern, i
invers.

ANOVA este o tehnic statistic parametric, deci presupune ca
datele analizate s ndeplineasc urmtoarele condiii:

1. probele trebuie s fie prelevate aleator;
2. variabila trebuie s fie apreciat pe o scal de interval sau de raport;
3. datele din probe trebuie s fie aproximativ normal distribuite;
4. varianele interne trebuie s nu difere semnificativ.

Ipotezele generale care se pot scrie n ANOVA sunt:

E
0
: probele au fost prelevate din populaii normal distribuite cu
variane i medii egale.
E
1
: deoarece se presupune c varianele populaiilor sunt egale,
probele au fost prelevate din populaii cu medii diferite.

Dac datele nu respect condiiile enumerate mai sus, se poate apela
la transformri ale valorilor variabilelor sau la alternative neparametrice ale
ANOVA.
Se observ c se face referire la egalitatea varianelor interne ale
probelor att la nivelul condiiilor de aplicare ale ANOVA, ct i la nivelul
ipotezelor generale. Deci, dup verificarea ndeplinirii condiiilor comune
testelor parametrice, trebuie testat dac varianele interne ale probelor difer
semnificativ.

8.1.1. Testarea omogenitii varianei interne
n acest sens se pot utiliza dou teste diferite. Cel mai rapid i mai
simplu este testul F
max
sau Hartley. Acesta const n calcularea raportului
ntre variana cea mai mare (s
mux
2
) i cea mai mic (s
mn
2
) dintre varianele
probelor analizate.

F
mux
=
s
mcx
2
s
min
2

Testarea diferenelor dintre trei sau mai multe probe 105
Valoarea F
mux
se compar cu o valoare critic pentru un anumit o,
pentru un anumit numr de probe (k) i grade de libertate (n -1) (anexa 2).

Dac F
mux
< F
mux
(o,k,n-1)
=> nu exist diferene semnificative ntre
varianele interne ale probelor pentru p = 1 -o.

Acest test se poate folosi doar dac toate probele conin acelai
numr de valori (n
1
= n
2
= = n
k
).
Dac probele au dimensiuni diferite, atunci se recomand aplicarea
testului Bartlett. Statistica testului Bartlett este una de tip _
2
i se
calculeaz pornind de la gradele de libertate ale fiecrei probe (n

-1, unde
i ia valori de la 1 la numrul de probe k), de la variana fiecrei probe (s

2
)
i de la variana medie balansat (s
w
2
).

s
w
2
=
s
i
2
(n
i
-1)
(n
i
-1)

_
2
= ln(s
w
2
) (n

-1) -|ln(s

2
)(n

-1)]

Statistica testului se compar cu o valoare critic _
2
n funcie de un
anumit nivel de confiden o i numrul de probe minus unu (k -1) grade
de libertate (anexele 2 i 3).

Dac _
2
< _
(u,k-1)
2
=> nu exist diferene semnificative ntre
varianele interne ale probelor pentru p = 1 -o.

Probabilitatea asociat valorii statisticii testului poate fi calculat i
exact (anexa 3). Cnd se calculeaz probabilitatea asociat valorii _
2
se
accept c nu exist diferene semnificative ntre varianele probelor dac p
este mai mare de nivelul o.

Exemplul 8.1. S-a urmrit numrul de exemplare ale unei plante n
cte 12 suprafee de prob din 4 zone diferite (notate de la A la ). Urmeaz
s se realizeze o analiz a varianei i este nevoie s se testeze dac
varianele probelor difer semnificativ. Datele sunt urmtoarele:

106 Elemente de statistic aplicate n ecologie
Se examineaz normalitatea distribuiei datelor
n probe.

x
A
= 24,SS Hc
A
= 2S
x
B
= 2S,66 Hc
B
= 26,S
x
C
= S8,66 Hc
C
= 4u
x

= SS,S8 Hc

= S6

Se poate considera c probele au o distribuie
aproximativ normal.
n continuare se verific omogenitatea
varianei cu ajutorul testului F
mux
, pentru efectuarea
cruia este necesar calcularea varianelor probelor:

s
A
2
=
7952-
(292)
2
12
12-1
= 76,97 s
B
2
=
9280-
(308)
2
12
12-1
= 124,97
s
C
2
=
19700-
(464)
2
12
12-1
= 1S9,88 s

2
=
39061-
(66)
2
12
12-1
= 18u,6S .

Se calculeaz statistica testului:

F
mux
=
180,63
76,97
= 2,S47 .

Valoarea critic a testului se afl n funcie de nivelul de confiden,
numrul probelor i numrul de valori per prob minus unu (anexa 2).
Pentru c valoarea pentru 4 i 11 grade de libertate lipsete din tabel, vom
considera valoarea pentru 4 i 1u:

F
mux
(0,0S,4,10)
= S,67 .

Valoarea calculat este mai mic dect valoarea critic, deci se poate
considera c varianele probelor nu difer semnificativ sau variana intern
este omogen.
Dac se folosete testul Bartlett pentru aceleai date, trebuie
calculat media balansat a varianei:
A B C D
28 32 54 59
41 10 46 63
25 12 39 71
13 25 21 53
25 38 41 66
33 14 25 74
13 37 23 35
30 43 46 62
21 16 29 53
22 20 52 49
12 28 31 53
29 33 57 29
Testarea diferenelor dintre trei sau mai multe probe 107

s
w
2
=
76,97(12-1)+124,97(12-1)+159,88(12-1)+180,63(12-1)
(12-1)+(12-1)+(12-1)+(12-1)
= 1SS,612 .

Se calculeaz suma produselor dintre variana logaritmat a probei i

|ln(s

2
)(n

-1)] = ln(76,97)(12 -1) +ln(124,97)(12 -1) +

ln(1S9,88)(12 -1) +ln(18u,6S)(12 -1) = 21S,866 .

Se calculeaz statistica testului:

_
2
= ln(1SS,612) 44 -21S,866 = 2,16S .

Se afl valoarea critic (anexa 2 sau anexa 3):

_
(0,05,4-1)
2
= 7,81S .

Statistica testului este mai mic dect valoarea critic, deci variana
intern poate fi considerat omogen. Probabilitatea ca s nu existe diferene
semnificative ntre varianele probelor este de 0,54, adic mai mare de 0,05.

8.2. TIPURI DE ANOVA

ANOVA este una dintre cele mai versatile tehnici de statistic
inferenial, putnd fi aplicat n numeroase variante n funcie de
planificarea investigaiilor, att n teren, ct i n laborator.
n cadrul ANOVA, gruparea valorilor variabilei investigate se poate
face dup unul sau mai muli factori. Un factor reprezint un grup de
tratamente similare, care la rndul lor reprezint niveluri ale factorului
respectiv. Aceast terminologie i are originea n experimentele din
agricultur, ns n prezent a cptat o extindere mult mai mare, depind
semnificaia iniial. Astfel, ntr-un experiment, nivelurile unui factor sau
tratamentele pot fi obinute n urma unor manipulri. De exemplu, trei loturi
de animale primesc fiecare un anumit tip de hran i se urmrete efectul
108 Elemente de statistic aplicate n ecologie
acestuia asupra greutii corporale. n acest exemplu, factorul este
reprezentat de hran, iar tratamentele sau nivelurile factorului sunt tipurile
de hran. Datele vor fi reprezentate de greutile animalelor i vor fi grupate
n probe, n funcie de tipul de hran. Dac ns se urmrete o anumit
variabil n trei populaii conspecifice din trei locaii diferite, atunci factorul
va fi locaia n general, iar nivelurile acestuia vor fi reprezentate de locaiile
fiecrei populaii n parte. Valorile variabilei urmrite vor fi grupate n trei
probe, n funcie de locaia fiecrei populaii. n concluzie, factorul poate fi
orice factor ecologic ale crui niveluri (tratamente) difer de la o
populaie la alta.
n funcie de numrul factorilor dup care se grupeaz datele,
ANOVA poate fi unifactorial dac ia n consideraie un singur factor, sau
multifactorial, dac se iau n calcul mai muli factori. Modelele cele mai
frecvent utilizate n cercetrile ecologice sunt modelul unifactorial i cel
bifactorial.
Un alt aspect caracteristic pentru ANOVA bifactorial este
interaciunea factorilor. Dac exist interaciune ntre factori, atunci se
utilizeaz modelul bifactorial cu replicare (cu numr egal de observaii n
celul), iar dac nu exist interaciune ntre factori atunci se folosete
modelul bifactorial fr replicare (cu o singur observaie n celul sau cu
observaii repetate). Din perspectiva ANOVA, interaciunea reprezint o
parte a variabilitii totale, datorat modificrilor unui factor, i este legat
de variabilitatea unui alt factor sau a unei combinaii de ali factori.

8.2.1. ANOVA unifactorial
n cazul acestui model datele sunt grupate n probe n funcie de un
singur factor (F). Astfel, probele coincid nivelurilor factorului sau
tratamentelor (F

= F
1
F
k
) (tab. 8.1).
Conform acestui model orice observaie poate fi definit ca:

Obs. =
Media
general
+ Efectul F

+
Eroarea
ntmpltoare.

Efectul nivelurilor factorului d variabilitatea extern (dintre probe),
iar eroarea ntmpltoare este rezultatul variabilitii interne (din cadrul
probelor).
Testarea diferenelor dintre trei sau mai multe probe 109

s
t
2
= s
cxt
2
+s
nt
2

s
2
= SP

=
SP
gI

Din aceste dou relaii rezult:

SP
t
= SP
cxt
+SP
nt

gl
t
= gl
cxt
+gl
nt
.

Tabelul 8.1. Distribuia valorilor n probe n ANOVA unifactorial
F
F
1
F
2
F
k

x
1
1

x
1
2

.
x
1
n
1
x
2
1

x
2
2

.
x
2
n
2

x
k
1

x
k
2

.
x
k
n
k

Ipotezele care se testeaz prin intermediul acestui model pot fi
formulate diferit, n funcie de sensul care se atribuie noiunii de tratament.
n cazul unor date obinute n urma unui experiment, ipotezele sunt de
forma:

E
0
: nu exist diferene semnificative ntre efectele tratamentelor
asupra variabilei;
E
1
: diferenele dintre efectele tratamentelor asupra variabilei sunt
semnificative.

n cazul unor date obinute n urma realizrii unor observaii
efectuate asupra unei variabile n populaii diferite, ipotezele pot fi
formulate astfel:

E
0
: mediile populaiilor din care s-au extras probele nu difer
semnificativ;
E
1
: mediile populaiilor din care s-au extras probele difer
semnificativ.
110 Elemente de statistic aplicate n ecologie
Dac se aplic ANOVA unifactorial pentru k probe, trebuie
parcurse urmtoarele etape:
1. Se calculeaz suma de ptrate a tuturor valorilor (x
t
2
) prin
adunarea sumelor de ptrate a valorilor pentru fiecare prob
(x

2
):

x
t
2
= x
1
2
+x
2
2
++x
k
2
.

2. Se calculeaz ptratul sumei totale ((x
t
)
2
sumelor valorilor din fiecare prob (x

), urmat de ridicarea la
ptrat:

(x
t
)
2
= (x
1
+x
2
++x
k
)
2
.

3. Se calculeaz numrul total de valori din toate probele (n
t
) prin
nsumarea dimensiunilor tuturor probelor (n

):

n
t
= n
1
+n
2
++n
k
.

4. Se calculeaz suma rapoartelor dintre ptratul sumei i
dimensiunea fiecrei probe:

j
(x
i
)
2
n
i
[ =
(x
1
)
2
n
1
+
(x
2
)
2
n
2
++
(x
k
)
2
n
k
.

5. Se calculeaz sumele de ptrate total (SP
t
), extern (SP
cxt
) i
intern (SP
nt
):

SP
t
= x
t
2
-
(x
t
)
2
n
t
SP
cxt
= j
(x
i
)
2
n
i
[ -
(x
t
)
2
n
t

SP
nt
= SP
t
- SP
cxt
.

6. Se calculeaz numrul gradelor de libertate totale (gl
t
), externe
(gl
cxt
) i interne (gl
nt
):

gl
t
= n
t
-1 gl
cxt
= k -1
gl
nt
= gl
t
-gl
cxt
= n
t
-k .
Testarea diferenelor dintre trei sau mai multe probe 111

7. Sumele de ptrate medii (SP

) se calculeaz mprind sumele de

ptrate (SP) la gradele de libertate corespunztoare (gl):

SP

cxt
=
SP
cxt
gI
cxt
SP

nt
=
SP
int
gI
int
.

8. Cu rezultatele obinute se completeaz aa-numitul tabel ANOVA
n care se va gsi i statistica testului (F):

Sursa de variaie SP g| SP

F
Extern (ntre probe) SP
cxt
gl
cxt
SP

cxt
SP

cxt
SP

nt

Intern (n probe) SP
nt
gl
nt
SP

nt

Total SP
t
gl
t

Condiia testului const n compararea statisticii F cu o valoare
critic a distribuiei Snedecor-Fisher tabelat n funcie de o, gradele de
libertate externe (gl
cxt
) i gradele de libertate interne (gl
nt
) (anexa 2).

Dac F F
(u,k-1,n
t
-k)
=> E
0
se respinge i se accept E
1
pentru o
probabilitate p = 1 -o.

Valoarea critic, precum i probabilitatea statisticii testului (adic
probabilitatea ca ipoteza nul s fie adevrat) se pot calcula (anexa 3).
Cnd se calculeaz probabilitatea asociat valorii F, atunci ipoteza nul se
respinge dac p(E
0
) este mai mic de nivelul o i se va accepta ipoteza
alternativ pentru o probabilitate de 1 -p(E
0
).
n cazul n care la sfritul testului se respinge ipoteza nul i se
accept n consecin c exist o diferen semnificativ, atunci analiza
poate continua n sensul detectrii diferenelor semnificative dintre mediile
tuturor combinaiilor de probe. O evaluare rapid a diferenelor dintre
mediile perechilor de probe const n inspectarea sau compararea grafic a
intervalelor de confiden a mediilor populaiilor (seciunea 5.1, fig. 5.5) din
care au fost extrase probele. n general, exist anse mari ca diferena dintre
dou probe s fie semnificativ, dac intervalele de confiden
corespunztoare nu se suprapun.
112 Elemente de statistic aplicate n ecologie
O modalitate mai sensibil de detectare a diferenelor semnificative
dintre medii este reprezentat de testul Tukey.
n cadrul acestui test se calculeaz diferenele n modul dintre
mediile tuturor perechilor unice de probe:

Media
Probei
x
2
x
3
x
k

x
1
|x
1
-x
2
| |x
1
-x
3
| |x
1
-x
k
|
x
2
|x
2
-x
3
| |x
2
-x
k
|

x
k-1
|x
k-1
-x
k
|

Se calculeaz apoi pentru fiecare pereche de probe cte o statistic I
a testului, pornind de la o valoare critic Tukey (q
(u,k,n
t
-k)
, anexa 2), suma
de ptrate medie intern (SP

nt
) i o medie armonic dintre dimensiunile
probelor din fiecare pereche (n
h
). Dac probele au aceeai dimensiune, n
loc de n
h
se ia n.

n
h
=
2n
1
n
2
n
1
+n
2

I
1,2
= q
(u,k,n
t
-k)
_
SP

int
n
h

Dac |x
1
-x
2
| I
1,2
=> diferena dintre mediile populaiilor din
care au fost extrase probele 1 i 2 este semnificativ pentru p = 1 -o.
Dac probele au aceeai dimensiune (n
1
= n
2
= = n
k
), atunci
diferenierea probelor se poate face prin investigarea sau compararea grafic
a suprapunerii intervalelor de confiden a mediilor fiecrei probe. Limitele
intervalului de confiden a unei medii rezult din adunarea i scderea la
aceasta a statisticii Tukey mprit la doi:

x

_
1
2
.

Exemplul 8.2. Pe baza datelor din exemplul 8.1 s se afle dac cele
patru probe sunt diferite semnificativ.

Testarea diferenelor dintre trei sau mai multe probe 113
Datele din exemplul 8.1 sunt distribuite n probe dup un singur
factor (zona), deci se realizeaz ANOVA unifactorial.
Ipotezele testului sunt:

E
0
: mediile probelor nu difer semnificativ;
E
1
:mediile probelor difer semnificativ.

Se calculeaz suma ptratelor tuturor valorilor prin adunarea sumelor
ptratelor valorilor din fiecare prob:

x
t
2
= 79S2 +928u +197uu +S9u61 = 7S99S .

Se calculeaz ptratul sumei totale prin adunarea sumelor valorilor
din fiecare prob i ridicarea sumei la ptrat:

(x
t
)
2
= (292 +Su8 +464 +667)
2
= (17S1)
2
= 2996S61 .

Se calculeaz numrul total de valori din toate probele:

n
t
= 12 +12 +12 +12 = 48 .

Se calculeaz suma rapoartelor dintre ptratul sumei i dimensiunea
fiecrei probe:

j
(x
i
)
2
n
i
[ =
(292)
2
12
+
(308)
2
12
+
(464)
2
12
+
(667)
2
12
= 7uu26,u8S .

Se calculeaz cele trei sume de ptrate:

SP
t
= 7S99S -
2996361
48
= 1SS68,81S
SP
cxt
= 7uu26,u8S -
2996361
48
= 76u1,896
SP
nt
= 1SS68,81S -76u1,896 = S966,917 .

Se calculeaz cele trei grade de libertate:

gl
t
= 48 -1 = 47 gl
cxt
= 4 -1 = S gl
nt
= 47 -S = 44 .
114 Elemente de statistic aplicate n ecologie
Se calculeaz sumele de ptrate medii:

SP

cxt
=
7601,896
3
= 2SSS,96S SP

nt
=
5966,917
44
= 1SS,612 .

Cu cele dou sume de ptrate medii se calculeaz statistica testului:

F =
2533,965
135,612
= 18,68S .

Se completeaz tabelul ANOVA:

Sursa de variaie SP g| SP

F
Extern 76u1,896 S 2SSS,96S 18,68S
Intern S966,917 44 1SS,612
Total 1SS68,81S 47

Se afl valoarea critic tabelat (anexa 2) sau se calculeaz n funcie
de nivelul de confiden, de gradele de libertate externe i de gradele de
libertate interne (anexa 3):

F
(0,05,3,44)
= 2,816 .

Statistica testului este mai mare dect valoarea critic i se poate
respinge ipoteza nul. Deci se accept c mediile probelor difer
semnificativ.
Probabilitatea ca ipoteza nul s fie adevrat este S,8 1u
-8
extrem de mic.
n continuare, pentru a compara probele dou cte dou se folosete
testul Tukey, pentru care trebuie calculate modulele diferenelor dintre
perechile de probe:

Media
Probei
25, 38, 55, 58
24, 33 1,SS 14,SS S1,2S
25, 1S 29,92
38, 16,92
Testarea diferenelor dintre trei sau mai multe probe 115

Se calculeaz statistica testului pornind de la valoarea critic Tukey
(anexa 2):

q
(0,05,4,44)
= S,79
I = S,79 _
135,612
12
= 12,74 .

Probele pentru care diferenele sunt mai mari dect statistica testului
sunt diferite semnificativ: proba A difer semnificativ de probele C i ,
proba B difer semnificativ de probele C i i proba C difer semnificativ
de proba . Probele A i B nu difer semnificativ.
Pentru c probele au acelai numr de valori, se poate reprezenta
grafic intervalul de confiden pentru fiecare prob adunnd i scznd din
valoarea fiecrei medii statistica testului mprit la doi (
1
2
=
12,74
2
= 6,S7).
Modul n care aceste intervale se suprapun arat care sunt probele diferite
semnificativ.

n grafic se observ cum intervalele probelor A i B se suprapun, n
timp ce intervalele celorlalte probe sunt separate pe vertical.

0
10
20
30
40
50
60
70
A B C D
x

Proba
116 Elemente de statistic aplicate n ecologie

8.2.2. ANOVA unifactorial neparametric Kruskal-Wallis
Acest tip de ANOVA este o alternativ neparametric a modelului
unifactorial. Ca urmare, se utilizeaz atunci cnd datele nu respect
condiiile de aplicare ale modelului unifactorial parametric.
Aranjarea datelor i ipotezele sunt similare cu cele de la ANOVA
unifactorial parametric.
Valorile din probe primesc ranguri mpreun, la fel ca n cazul
testului Mann-Whitney (seciunea 7.1.2).
Se calculeaz apoi suma rapoartelor dintre ptratele sumelor
rangurilor i numrul valorilor pentru fiecare prob:

(R
x
i
)
2
n
i
=
(R
x
1
)
2
n
1
+
(R
x
2
)
2
n
2
++
(R
x
k
)
2
n
k
.

Statistica testului E se calculeaz pornind de la valoarea prezentat
anterior i numrul total de valori din toate probele (n
t
).

E =
12
n
t
(n
t
+1)
_
(R
x
i
)
2
n
i
_ -S(n
t
+1)

Condiia testului const n compararea statisticii cu o valoare critic
_
2
n funcie de o i de k -1 grade de libertate (anexele 2 i 3).

Dac E _
(u,k-1)
2
=> E
0
se respinge i se accept E
1
pentru
p = 1 -o.

Probabilitatea pentru valoarea lui E, asociat ipotezei nule, se poate
calcula exact (anexa 3). n cazul n care p(E
0
) este mai mic dect valoarea
o, ipoteza nul se respinge i se accept ipoteza alternativ pentru o
probabilitate de 1 -p(E
0
).
La fel ca n cazul ANOVA unifactorial parametric, i n cazul
ANOVA unifactorial neparametric se pot face comparaii multiple dac
diferenele testate sunt semnificative. Pentru a compara probele dou cte
dou se poate face pentru fiecare pereche cte un test u Mann-Whitney
(seciunea 7.1.2).
Testarea diferenelor dintre trei sau mai multe probe 117
Exemplul 8.3. Pe baza datelor din exemplul 8.1 s se afle dac cele
patru probe sunt diferite semnificativ, considernd c nu sunt ndeplinite
condiiile pentru a realiza ANOVA unifactorial parametric.

n acest caz, se folosete alternativa neparametric a ANOVA
Ipotezele sunt similare cu cele de la exemplul 8.2.
Se dau ranguri valorilor din cele patru probe mpreun:

Proba x R
|
R
x
Proba x R
|
R
x

A 12 2 2,5 C 21 10 9,5
A 13 4 4,5 C 23 12 12
A 13 5 4,5 C 25 16 14,5
A 21 9 9,5 C 29 20 20
A 22 11 11 C 31 23 23
A 25 13 14,5 C 39 30 30
A 25 14 14,5 C 41 32 31,5
A 28 17 17,5 C 46 34 34,5
A 29 19 20 C 46 35 34,5
A 30 22 22 C 52 37 37
A 33 25 25,5 C 54 41 41
A 41 31 31,5 C 57 42 42
B 10 1 1 D 29 21 20
B 12 3 2,5 D 35 27 27
B 14 6 6 D 49 36 36
B 16 7 7 D 53 38 39
B 20 8 8 D 53 39 39
B 25 15 14,5 D 53 40 39
B 28 18 17,5 D 59 43 43
B 32 24 24 D 62 44 44
B 33 26 25,5 D 63 45 45
B 37 28 28 D 66 46 46
B 38 29 29 D 71 47 47
B 43 33 33 D 74 48 48

Se calculeaz apoi suma rapoartelor dintre ptratele sumelor
rangurilor i numrul valorilor pentru fiecare prob:

118 Elemente de statistic aplicate n ecologie

(R
x
i
)
2
n
i
=
(177,5)
2
12
+
(196)
2
12
+
(329,5)
2
12
+
(473)
2
12
= SSS18,4S8 .
Se calculeaz statistica testului:

E =
12
48(48+1)
SSS18,4S8 -S(48 +1) = 24,u1S .

Se afl valoarea critic pin cutare n tabel (anexa 2) sau prin
calculare (anexa 3).

_
(0,05,3)
2
= 7,81S .

Se verific condiia testului:

24,u1S > 7,81S => E
0
se respinge i se accept E
1
pentru
p = 1 -u,uS = u,9S .

Probabilitatea ca ipoteza nul s fie adevrat (anexa 3) este de
2,S 1u
-5
Concluzia testului este c probele difer semnificativ unele de altele.

8.2.3. ANOVA bifactorial fr replicare
Acest model se mai numete i model cu o singur observaie n
celul sau model cu observaii repetate.
n cazul acestui model datele sunt grupate n probe n funcie de doi
factori: C, care determin aranjarea datelor n c coloane (C

= C
1
C
c
) i R,
care determin aranjarea datelor n r rnduri sau linii (R
]
= R
1
R

) (tab.
8.2). ntre cei doi factori nu exist interaciune (seciunea 8.2.5).

Tabelul 8.2. Distribuia valorilor n probe n ANOVA bifactorial
C

C
1
C
2
C
c

R
]
R
1
x
c
1

1
x
c
2

1
x
c
c

1
R
2
x
c
1

2
x
c
2

2
x
c
c

2

R

x
c
1

r
x
c
2

r
x
c
c

r
Testarea diferenelor dintre trei sau mai multe probe 119
Denumirea de model cu o singur observaie n celul vine de la
faptul c, ntr-o celul a tabelului, adic la intersecia unui nivel al unui
factor cu un nivel al celuilalt factor (C

, R
]
) sau, mai simplu, la intersecia
unui rnd cu o coloan, se gsete o singur valoare (x
c
i
,
]
).
Denumirea de model cu observaii repetate provine de la un caz
particular n care rndurile sunt reprezentate de uniti de prob asupra
crora se fac observaii repetate. O astfel de situaie este similar cu cea n
care se compar dou probe neindependente cu ajutorul testului Student
pentru perechi de observaii (seciunea 7.2.1), cu deosebirea c n cazul
ANOVA se compar efectul a trei sau mai multe tratamente.
Conform acestui model orice observaie poate fi definit ca:

Obs. =
Media
general
+ Efectul C

+ Efectul R
]
+
Eroarea
ntmpltoare.

Efectul nivelurilor factorilor d variabilitatea extern (dintre probe),
iar eroarea ntmpltoare este rezultatul variabilitii interne (din cadrul
probelor).
n cazul acestui model, variabilitatea extern (s
cxt
2
) poate fi la rndul
ei descompus n variabilitatea dintre coloane i variabilitatea dintre rnduri
(s
c
2
+s

2
), astfel c relaia de principiu a ANOVA bifactorial devine:

s
t
2
= s
c
2
+s

2
+s
nt
2
.

Dac varianele sau sumele de ptrate medii (SP

) le considerm
rapoarte ntre sumele de ptrate (SP) i grade de libertate (gl), atunci:

SP
t
= SP
c
+SP

+SP
nt

gl
t
= gl
c
+gl

+gl
nt
.

Ipotezele care se testeaz prin intermediul acestui model pot viza
semnificaia efectului unui singur factor sau a ambilor factori, caz n care se
vor emite dou ipoteze nule i dou ipoteze alternative pentru acelai test.
Pentru date experimentare ipotezele sunt formulate astfel:

120 Elemente de statistic aplicate n ecologie
E
0
1
: nu exist diferene semnificative ntre efectele nivelurilor
primului factor (C

) asupra variabilei;
E
0
2
: nu exist diferene semnificative ntre efectele nivelurilor celui
de-al doilea factor (R
]
) asupra variabilei;
E
1
1
: diferenele dintre efectele nivelurilor primului factor (C

) asupra
variabilei sunt semnificative;
E
1
2
: diferenele dintre efectele nivelurilor celui de-al doilea factor
(R
]
) asupra variabilei sunt semnificative.

n cazul unor date obinute n urma realizrii unor observaii
efectuate asupra unei variabile n populaii diferite, ipotezele pot fi
formulate astfel:

E
0
1
: mediile populaiilor corespunztoare nivelurilor primului factor
(C

) nu difer semnificativ;
E
0
2
: mediile populaiilor corespunztoare nivelurilor celui de-al
doilea factor (R
]
) nu difer semnificativ;
E
1
1
: mediile populaiilor corespunztoare nivelurilor primului factor
(C

) difer semnificativ;
E
1
2
: mediile populaiilor corespunztoare nivelurilor primului factor
(R
]
) difer semnificativ.

Dac se aplic ANOVA unifactorial pentru c coloane i r rnduri,
trebuie parcurse urmtoarele etape:
1. Se calculeaz suma ptratelor tuturor valorilor (x
t
2
) prin
adunarea sumelor ptratelor valorilor pe coloane sau pe rnduri
(x
c
i
2
sau x

]
2
):

x
t
2
= x
c
1
2
+x
c
2
2
++x
c
c
2

Sau
x
t
2
= x

1
2
+x

2
2
++x

r
2
.

2. Se calculeaz ptratul sumei totale ((x
t
)
2
sumelor valorilor din fiecare coloan (x
c
i
) sau rnd (x

]
),
urmat de ridicarea la ptrat:
Testarea diferenelor dintre trei sau mai multe probe 121

(x
t
)
2
= (x
c
1
+x
c
2
++x
c
c
)
2

sau
(x
t
)
2
= (x

1
+x

2
++x

r
)
2
.

3. Se calculeaz numrul total de valori din toate probele (n
t
) prin
nsumarea dimensiunilor coloanelor (n
c
i
) sau rndurilor (n

]
):

n
t
= n
c
1
+n
c
2
++n
c
c

sau
n
t
= n

1
+n

2
++n

r
.

4. Se calculeaz suma rapoartelor dintre ptratul sumei i
dimensiunea fiecrei coloane:

_
[x
c
i

2
n
c
i
_ =
(x
c
1
)
2
n
c
1
+
(x
c
2
)
2
n
c
2
++
(x
c
c
)
2
n
c
c
.

5. Se calculeaz suma rapoartelor dintre ptratul sumei i
dimensiunea fiecrui rnd:

_
[x
r
]

2
n
r
]
_ =
(x
r
1
)
2
n
r
1
+
(x
r
2
)
2
n
r
2
++
(x
r
r
)
2
n
r
r
.

6. Se calculeaz sumele de ptrate: total (SP
t
), dintre coloane (SP
c
),
dintre rnduri (SP

) i cea intern (SP

nt
):

SP
t
= x
t
2
-
(x
t
)
2
n
t
SP
c
= _
[x
c
i

2
n
c
i
_ -
(x
t
)
2
n
t

SP

= _
[x
r
]

2
n
r
]
_ -
(x
t
)
2
n
t
SP
nt
= SP
t
- (SP
c
+SP

) .

122 Elemente de statistic aplicate n ecologie
7. Se calculeaz numrul gradelor de libertate totale (gl
t
), pentru
coloane (gl
c
), pentru rnduri (gl

) i cele interne (gl

nt
):

gl
t
= n
t
-1
gl
c
= c -1
gl

= r -1
gl
nt
= gl
t
-(gl
c
+gl

) = n
t
-c -r +1 = (c -1)(r -1) .

8. Sumele de ptrate medii (SP

) se calculeaz mprind sumele de

ptrate (SP) la gradele de libertate corespunztoare (gl):

SP

c
=
SP
c
gI
c

SP

=
SP
r
gI
r

SP

nt
=
SP
int
n
int
.

9. Cu rezultatele obinute se completeaz aa-numitul tabel ANOVA
n care se va gsi i statistica testului (F):

Sursa de variaie SP g| SP

F
Extern, ntre coloane SP
c
gl
c
SP

c
F
c
= SP

c
SP

nt

Extern, ntre rnduri SP

gl

SP

= SP

SP

nt

Intern SP
nt
gl
nt
SP

nt

Total SP
t
gl
t

Condiia testului const n compararea statisticii F cu o valoare
critic tabelat n funcie de o, gradele de libertate externe (gl
cxt
de libertate interne (gl
nt
) (anexa 2).

Dac F
c
F
(u,c-1,gI
int
)
=> E
0
1
se respinge i se accept E
1
1
pentru
o probabilitate p = 1 -o.
Dac F

F
(u,-1,gI
int
)
=> E
0
2
se respinge i se accept E
1
2
pentru
o probabilitate p = 1 -o.

Valoarea critic, precum i probabilitatea statisticii testului (adic
Testarea diferenelor dintre trei sau mai multe probe 123
probabilitatea ca ipoteza nul s fie adevrat) se pot calcula (anexa 3).
Cnd se calculeaz probabilitatea asociat valorii F, atunci ipoteza nul se
respinge dac p(E
0
) este mai mic de nivelul o i se va accepta ipoteza
alternativ pentru o probabilitate de 1 -p(E
0
).

Exemplul 8.4. S-a urmrit densitatea realizat de o anumit specie
de plant n cinci suprafee de prob (de la A la E) urmrite timp de patru
ani (de la I la II) dintr-o zon supus reconstruciei ecologice. A crescut
semnificativ densitatea plantei n timp?

Se poate observa c
datele sunt organizate dup doi
factori: an i prob. Deci se poate
realiza un model bifactorial de
ANOVA. Dat fiind faptul c n
fiecare celul exist o singur
valoare, se va realiza ANOVA
bifactorial fr replicare.
Fiind vorba de relativ
puine date ce reprezint numr
de entiti, se poate face o
transformare care s normalizeze
distribuia i s stabilizeze
variana probelor.

ntrebarea problemei se refer doar la diferenele semnificative
dintre ani (coloane). Dac s-ar fi dorit i evidenierea diferenelor dintre
suprafeele de prob (rnduri), atunci trebuie testate dou seturi de ipoteze:
una nul i una alternativ pentru fiecare factor:

E
0
1
: nu exist diferene semnificative ntre densiti pe ani;
E
0
2
: nu exist diferene semnificative ntre densiti pe probe;
E
1
1
: diferenele dintre densitile pe ani sunt semnificative;
E
1
2
: diferenele dintre densitile pe probe sunt semnificative.

An
I II III IF
Proba
A 3 7 10 18
B 8 10 15 20
C 17 30 33 65
D 8 11 31 60
F 2 3 17 15
I II III IF
A 1,0986 1,9459 2,3026 2,8904
B 2,0794 2,3026 2,7081 2,9957
C 2,8332 3,4012 3,4965 4,1744
D 2,0794 2,3979 3,4340 4,0943
F 0,6931 1,0986 2,8332 2,7081
124 Elemente de statistic aplicate n ecologie
Se calculeaz suma ptratelor tuturor valorilor logaritmate:

x
t
2
= 18,S6S +27,61S +44,68u +S8,8S1 = 149,Su8 .

Se calculeaz ptratul sumei totale la ptrat:

(x
t
)
2
= (8,784 +11,146 +14,774 +16,86S)
2
= (S1,S67)
2
=
= 26S9,18S .

Se calculeaz numrul total de valori din toate probele

n
t
= S +S +S +S = 2u .

Se calculeaz suma rapoartelor dintre ptratul sumei i dimensiunea
fiecrei coloane:

_
[x
c
i

2
n
c
i
_ =
(8,784)
2
5
+
(11,146)
2
5
+
(14,774)
2
5
+
(16,863)
2
5
= 14u,8u6 .

Se calculeaz suma rapoartelor dintre ptratul sumei i dimensiunea
fiecrui rnd:

_
[x
r
]

2
n
r
]
_ =
(8,237)
2
4
+
(10,086)
2
4
+
(13,905)
2
4
+
(12,006)
2
4
+
(7,333)
2
4
=
= 14u,212 .

Se calculeaz sumele de ptrate:

SP
t
= 149,Su8 -
(51,567)
2
20
= 16,S49
SP
c
= 14u,8u6 -
(51,567)
2
20
= 7,847
SP

= 14u,212 -
(51,567)
2
20
= 7,2S2
SP
nt
= 16,S49 -(7,847 +7,2S2) = 1,4Su .

Testarea diferenelor dintre trei sau mai multe probe 125
Se calculeaz numrul gradelor de libertate:

gl
t
= 2u -1 = 19 gl
c
= 4 -1 = S
gl

= S -1 = 4 gl
nt
= (4 -1)(S -1) = 12 .

Se calculeaz sumele de ptrate medii:

SP

c
=
7,847
3
= 2,616 SP

=
7,252
4
= 1,81S SP

nt
=
1,450
12
= u,121 .

Se calculeaz statisticile testului i se completeaz tabelul ANOVA:

F
c
=
2,616
0,121
= 21,62u F

=
1,813
0,121
= 14,98S .

Sursa de variaie SP g| SP

F
Extern, ntre coloane 7,847 S 2,616 21,62u
Extern, ntre rnduri 7,2S2 4 1,81S 14,98S
Intern 1,4Su 12 u,121
Total 16,S49 19

Se afl valorile critice pentru fiecare surs de variaie extern (anexa
2 sau 3):

F
(0,05,3,12)
= S,49u F
(0,05,4,12)
= S,2S9 .

Se verific condiia testului:

21,62u > S,49u => E
0
1
se respinge i se accept E
1
1
pentru o
probabilitate p = 1 -u,uS = u,9S.
14,98S > S,2S9 => E
0
2
se respinge i se accept E
1
2
pentru o
probabilitate p = 1 -u,uS = u,9S.

Probabilitile celor dou ipoteze nule se pot calcula (anexa 3):

p(E
0
1
) = S,92 1u
-5
i p(E
0
2
) = 1,18 1u
-4
.
126 Elemente de statistic aplicate n ecologie
Concluzia testului este c modificrile induse de trecerea anilor
densitii plantei analizate sunt semnificative. De asemenea, exist i o
diferen semnificativ ntre suprafeele de prob din punctul de vedere al
densitii speciei analizate.

8.2.4. ANOVA bifactorial neparametric Friedman
Se utilizeaz ca alternativ neparametric a modelului bifactorial
atunci cnd se fac observaii repetate asupra acelorai uniti de prob,
obinndu-se probe neindependente. Din acest punct de vedere ANOVA
bifactorial neparametric este similar testului Wilcoxon (seciunea 7.2.2),
doar c se folosete pentru trei sau mai multe probe.
Aranjarea datelor i ipotezele sunt similare cu cele de la ANOVA
bifactorial parametric, cu deosebirea c se testeaz doar ipotezele E
0
1
i
E
1
1
referitoare la factorul ce determin aranjarea datelor n coloane.
Valorile fiecrui rnd primesc ranguri n mod independent.
Rangurile pentru fiecare rnd se atribuie conform algoritmului prezentat n
seciunea 2.1, tab. 2.3.
Logica acestui test este c, dac nu exist diferene ntre efectele
nivelului primului factor (C

) sau, mai simplu, dac nu exist diferene ntre

coloane, sumele rangurilor coloanelor ar trebui s fie aproximativ egale,
deoarece orice rang are anse egale s apar n orice coloan.
Se calculeaz suma rangurilor valorilor din fiecare coloan (R
x
c
i
),
dup care se ridic la ptrat:

[R
x
c
i

2
= [R
x
c
i
r
1

+R
x
c
i
r
2

++R
x
c
i
r
r

2
.

Se calculeaz suma ptratelor sumelor rangurilor pe coloan:

[R
x
c
i

2
= [R
x
c
1

2
+[R
x
c
2

2
++[R
x
c
c

2
.

Statistica testului se calculeaz cu ajutorul formulei:

=
12
c(c+1)
_[R
x
c
i

2
_ -Sr(c +1) .

Testarea diferenelor dintre trei sau mai multe probe 127
Condiia testului compar valoarea statisticii cu o valoare critic _
2

tabelat (anexa 2) sau calculat (anexa 3) n funcie de o i de numrul de
coloane minus unu grade de libertate (c -1).

Dac _
(u,c-1)
2
=> E
0
1
se respinge, E
1
1
se accept pentru
p = 1 -o.

Probabilitatea pentru valoarea lui _

2
, asociat ipotezei nule, se poate
calcula exact (anexa 3). n cazul n care p(E
0
) este mai mic de valoarea o,
ipoteza nul se respinge i se accept ipoteza alternativ pentru o
probabilitate de 1 -p(E
0
).
Deci acesta verific doar setul de ipoteze care se refer la factorul
dup care se aranjeaz datele pe coloane. Cu alte cuvinte, dac se respinge
ipoteza nul, concluzia este c exist o diferen semnificativ ntre coloane.

Exemplul 8.5. S se rspund la ntrebarea de la exemplul 8.4
considernd c nu sunt ndeplinite condiiile de aplicare a ANOVA
bifactoriale fr replicare, parametrice.

n acest caz se apeleaz la alternativa neparametric a acestui tip de
Ipotezele testului sunt similare celor de la exemplul 8.4, cu
deosebirea c ANOVA Friedman testeaz doar un singur set de ipoteze, cele
care vizeaz coloanele. Pentru a testa i ipotezele referitoare la rnduri,
datele trebuie rearanjate astfel nct coloanele s devin rnduri i rndurile
coloane. Altfel spus, tabelul de date trebuie rotit.
Pentru a efectua testul trebuie ca valorile din fiecare rnd s
primeasc ranguri, dup care se calculeaz suma rangurilor pe coloane:

I II III IF
A 1 2 3 4
B 1 2 3 4
C 1 2 3 4
D 1 2 3 4
F 1 2 4 3
R
x
c
|

5 10 16 19
128 Elemente de statistic aplicate n ecologie

Se calculeaz apoi suma sumelor ridicate la ptrat ale rangurilor pe
coloane:

_[R
x
c
i

2
_ = (S)
2
+(1u)
2
+(16)
2
+(19)
2
= 742 .

Se calculeaz statistica testului:

=
12
54(4+1)
742 -S S(4 +1) = 14,u4 .

Se afl valoarea critic _
2
(anexa 2 sau anexa 3): _
(0,05,3)
2
= 7,81S .
Statistica testului este mai mare dect valoarea critic, deci se
respinge ipoteza nul (E
0
1
) i se accept ipoteza alternativ (E
1
1
).
Probabilitatea ca ipoteza nul s fie adevrat se poate calcula
(anexa 3) i este egal cu u,uu29.
Concluzia testului este c probele (coloanele) difer semnificativ.

8.2.5. ANOVA bifactorial cu replicare
Acest model se mai numete si model cu numr egal de observaii n
celul.
La fel ca i la ANOVA bifactorial fr replicare, datele sunt grupate
n probe n funcie de doi factori: C, care determin aranjarea datelor n c
coloane (C

= C
1
C
c
), i R, care determin aranjarea datelor n r rnduri
sau linii (R
]
= R
1
R

) (tab. 8.3). n cazul acestui model particularitatea de

form const n faptul c ntr-o celul a tabelului, adic la intersecia unui
nivel al unui factor cu un nivel al celuilalt factor (C

, R
]
) sau, mai simplu, la
intersecia unui rnd cu o coloan, se gsesc mai multe valori (x
c
i
,
]
,n
n observaii replicate.
Particularitatea de principiu a acestui model este reprezentat de
faptul c presupune o interaciune ntre cei doi factori. Practic, interaciunea
este evident dac efectul unor anumite niveluri ale factorilor asupra
variabilei investigate se modific ntr-o manier neaditiv.

Testarea diferenelor dintre trei sau mai multe probe 129
Tabelul 8.3. Distribuia valorilor n probe n ANOVA bifactorial

C

C
1
C
2
C
c

R
]
R
1
x
c
1

1
1

x
c
1

1
n
x
c
2

1
1

x
c
2

1
n

x
c
c

1
1

x
c
c

1
n
R
2
x
c
1

2
1

x
c
1

2
n
x
c
2

2
1

x
c
2

2
n

x
c
c

2
1

x
c
c

2
n

R

x
c
1

r
1

x
c
1

r
n
x
c
2

r
1

x
c
2

r
n

x
c
c

r
1

x
c
c

r
n

Evidenierea interaciunii se poate realiza prin vizualizarea grafic a
mediilor celulelor (a mediilor valorilor de la 1 la n din fiecare celul). Dac
liniile care unesc mediile dup un factor sunt mai mult sau mai puin
paralele, atunci ntre factori nu exist interaciune. n figura 8.1 se poate
observa c trecerea de la un nivel al factorului C la altul (trecerea de la C
1
la
C
2
) modific variabila n sensul descreterii mediilor cu aceeai valoare i
pentru rndul 1, i pentru rndul 2. Modificarea variabilei se realizeaz n
acelai sens i sub aciunea nivelurilor factorului R. Deci, n acest caz,
factorii C i R au o aciune aditiv negativ (de scdere) a variabilei
investigate.

Figura 8.1. Interaciune absent
C1 C2
x

R1
R2
130 Elemente de statistic aplicate n ecologie
Dac liniile ce unesc mediile dup un factor sunt evident neparalele,
nseamn c ntre cei doi factori exist o interaciune sau efectele factorilor
asupra variabilei sunt neaditive. n figura 8.2, efectele factorului C asupra
variabilei modific efectele factorului R n sensul c pentru R
1
efectul
trecerii de la C
1
la C
2
const ntr-o scdere mai mare dect pentru R
2
.

Figura 8.2. Interaciune: C
2
R
1

n figura 8.3 este vorba tot de interaciune ntre factori, dar n acest
caz interaciunea const ntr-o descretere mai ampl n cazul R
2
sub
aciunea factorului C.

Figura 8.3. Interaciune: C
2
R
2

C1 C2
x
R1
R2
C1 C2
x
R1
R2
Testarea diferenelor dintre trei sau mai multe probe 131
Conform acestui model orice observaie poate fi definit ca:

Obs.=
Media
general
+
Efect
C

+
Efect
R
]

+
Efect
Interaciune +
C

R
]

Eroarea
ntmpltoare.

Efectul nivelurilor factorilor d variabilitatea extern (dintre probe),
iar eroarea ntmpltoare este rezultatul variabilitii interne (din cadrul
probelor).
n cazul acestui model variabilitatea extern (s
cxt
2
) poate fi rndul ei
descompus n variabilitatea dintre coloane, variabilitatea dintre rnduri i
variabilitatea cauzat de interaciune (s
c
2
+s

2
+s

2
), astfel c relaia de
principiu a ANOVA bifactorial devine:

s
t
2
= s
c
2
+s

2
+s

2
+s
nt
2
.
Dac varianele sau sumele de ptrate medii (SP

) le considerm
rapoarte ntre sumele de ptrate (SP) i grade de libertate (gl), atunci:

SP
t
= SP
c
+SP

+SP

+SP
nt

gl
t
= gl
c
+gl

+gl

+gl
nt
.

Ipotezele care se testeaz prin intermediul acestui model pot viza
semnificaia efectului unui singur factor sau a ambilor factori, caz n care se
vor emite dou ipoteze nule i dou ipoteze alternative pentru acelai test.
Pentru date experimentale ipotezele sunt formulate astfel:

E
0
1
: nu exist diferene semnificative ntre efectele nivelurilor
primului factor (C

) asupra variabilei;
E
0
2
: nu exist diferene semnificative ntre efectele nivelurilor celui
de-al doilea factor (R
]
) asupra variabilei;
E
0
3
: efectul interaciunii nu este semnificativ;
E
1
1
: diferenele dintre efectele nivelurilor primului factor (C

) asupra
variabilei sunt semnificative;
E
1
2
: diferenele dintre efectele nivelurilor celui de-al doilea factor
(R
]
) asupra variabilei sunt semnificative;
E
1
3
: efectul interaciunii este semnificativ.
132 Elemente de statistic aplicate n ecologie
n cazul unor date obinute n urma realizrii unor observaii
efectuate asupra unei variabile n populaii diferite, ipotezele pot fi
formulate astfel:

E
0
1
: mediile populaiilor corespunztoare nivelurilor primului factor
(C

) nu difer semnificativ;
E
0
2
: mediile populaiilor corespunztoare nivelurilor celui de-al
doilea factor (R
]
) nu difer semnificativ;
E
0
3
: mediile corespunztoare interaciunii nivelurilor factorilor
(C

, R
]
) nu difer semnificativ;
E
1
1
: mediile populaiilor corespunztoare nivelurilor primului factor
(C

) difer semnificativ;
E
1
2
: mediile populaiilor corespunztoare nivelurilor primului factor
(R
]
) difer semnificativ;
E
1
3
: mediile corespunztoare interaciunii nivelurilor factorilor
(C

, R
]
) difer semnificativ.

Dac se aplic ANOVA unifactorial pentru c coloane, r rnduri i
k valori n fiecare celul, trebuie parcurse urmtoarele etape:
1. Se calculeaz suma ptratelor tuturor valorilor (x
t
2
) prin
adunarea ptratelor tuturor valorilor pe coloane sau pe rnduri
(x
c
i
2
sau x

]
2
):

x
t
2
= x
c
1
2
+x
c
2
2
++x
c
c
2

sau
x
t
2
= x

1
2
+x

2
2
++x

r
2
.

2. Se calculeaz ptratul sumei totale ((x
t
)
2
sumelor valorilor din fiecare coloan (x
c
i
) sau rnd (x

]
),
urmat de ridicarea la ptrat:

(x
t
)
2
= (x
c
1
+x
c
2
++x
c
c
)
2

sau
(x
t
)
2
= (x

1
+x

2
++x

r
)
2
.
Testarea diferenelor dintre trei sau mai multe probe 133

3. Se calculeaz numrul total de valori din toate probele (n
t
) prin
nsumarea dimensiunilor coloanelor (n
c
i
) sau rndurilor (n

]
) sau
prin nmulirea numrului de valori din celul cu numrul
celulelor egal cu produsul dintre numrul coloanelor i rndurilor:

n
t
= n
c
1
+n
c
2
++n
c
c

sau
n
t
= n

1
+n

2
++n

r

sau
n
t
= n c r .

4. Se calculeaz suma rapoartelor dintre ptratul sumei i
dimensiunea fiecrei coloane:

_
[x
c
i

2
n
c
i
_ =
(x
c
1
)
2
n
c
1
+
(x
c
2
)
2
n
c
2
++
(x
c
c
)
2
n
c
c
.

5. Se calculeaz suma rapoartelor dintre ptratul sumei i
dimensiunea fiecrui rnd:

_
[x
r
]

2
n
r
]
_ =
(x
r
1
)
2
n
r
1
+
(x
r
2
)
2
n
r
2
++
(x
r
r
)
2
n
r
r
.

6. Se calculeaz suma rapoartelor dintre ptratul sumei i
dimensiunea fiecrei celule (n
c
i

]
= n):

_
[x
c
i
r
]

2
n
c
i
r
]
_ =
(x
c
1
r
1
)
2
n
c
1
r
1
+
(x
c
1
r
2
)
2
n
c
1
r
2
++
(x
c
c
r
r
)
2
n
c
c
r
r

sau
_
[x
c
i
r
]

2
n
_ =
(x
c
1
r
1
)
2
n
+
(x
c
1
r
2
)
2
n
++
(x
c
c
r
r
)
2
n
.

134 Elemente de statistic aplicate n ecologie
7. Se calculeaz sumele de ptrate: total (SP
t
), dintre coloane (SP
c
),
dintre rnduri (SP

), de interaciune (SP

) i cea intern (SP

nt
):

SP
t
= x
t
2
-
(x
t
)
2
n
t

SP
c
= _
[x
c
i

2
n
c
i
_ -
(x
t
)
2
n
t

SP

= _
[x
r
]

2
n
r
]
_ -
(x
t
)
2
n
t

SP

= _
[x
c
i
r
]

2
n
c
i
r
]
_ -
(x
t
)
2
n
t
-(SP
c
+SP

)
SP
nt
= SP
t
- (SP
c
+SP

+SP

) .

8. Se calculeaz numrul gradelor de libertate totale (gl
t
) pentru
coloane (gl
c
), pentru rnduri (gl

), pentru interaciune (gl

) i
pentru cele interne (gl
nt
):

gl
t
= n
t
-1
gl
c
= c -1
gl

= r -1
gl

= gl
c
gl

= (c -1)(r -1)
gl
nt
= gl
t
-(gl
c
+gl

+gl

) = n
t
-cr .

9. Sumele de ptrate medii (SP

) se calculeaz mprind sumele de

ptrate (SP) la gradele de libertate corespunztoare (gl):

SP

c
=
SP
c
gI
c

SP

=
SP
r
gI
r

SP

=
SP
i
gI
i

SP

nt
=
SP
int
n
int
.

Testarea diferenelor dintre trei sau mai multe probe 135
10. Cu rezultatele obinute se completeaz aa-numitul tabel
ANOVA n care se va gsi i statistica testului (F):

Sursa de variaie SP g| SP

F
Extern, ntre coloane SP
c
gl
c
SP

c
F
c
= SP

c
SP

nt

Extern, ntre rnduri SP

gl

SP

= SP

SP

nt

Extern, de interaciune
(ntre celule)
SP

gl

SP

= SP

SP

nt

Intern SP
nt
gl
nt
SP

nt

Total SP
t
gl
t

Condiia testului const n compararea statisticii F cu o valoarea
critic tabelat n funcie de o, gradele de libertate externe (gl
cxt
de libertate interne (gl
nt
) (anexa 2 sau anexa 3).

Dac F
c
F
(u,c-1,gI
int
)
=> E
0
1
se respinge i se accept E
1
1
pentru
o probabilitate p = 1 -o.
Dac F

F
(u,-1,gI
int
)
=> E
0
2
se respinge i se accept E
1
2
pentru
o probabilitate p = 1 -o.
Dac F

F
(u,gI
i
,gI
int
)
=> E
0
3
se respinge i se accept E
1
3
pentru
o probabilitate p = 1 -o.

Valoarea critic, precum i probabilitatea statisticii testului (adic
probabilitatea ca ipoteza nul s fie adevrat) se pot calcula (anexa 3).
Cnd se calculeaz probabilitatea asociat valorii F, atunci ipoteza nul se
respinge dac p(E
0
) este mai mic de nivelul o i se va accepta ipoteza
alternativ pentru o probabilitate de 1 -p(E
0
).
Dac diferenele testate sunt semnificative, atunci se pot face
comparaii multiple. Pentru aceasta se utilizeaz testul Tukey, n cadrul
cruia se calculeaz diferenele n modul dintre mediile tuturor perechilor
unice de probe (celule):
136 Elemente de statistic aplicate n ecologie

Media
probei
x
c
2

1
x
c
3

1

x
c
c

r

x
c
1

1
|x
c
1

1
-x
c
2

1
| |x
c
1

1
-x
c
3

1
|

|x
c
1

1
-x
c
c

r
|
x
c
2

1
|x
c
2

1
-x
c
3

1
|

|x
c
2

1
-x
c
c

r
|

x
c
c-1

r-1
|x
c
c-1

r-1
-x
c
c

r
|

Se calculeaz apoi pentru statistica I a testului pornind de la o
valoare critic Tukey (q
(u,c,n
t
-c)
, anexa 2), suma de ptrate medie intern
(SP

nt
) i numrul valorilor dintr-o celul (n).

I = q
(u,c,n
t
-c)

_
SP

int
n

Dac diferena absolut dintre oricare dou medii |x
1
-x
2
| I =>
diferena este semnificativ pentru p = 1 -o.

Exemplul 8.6. ntr-un experiment s-a urmrit efectul tipului de
hran i al stresului ambiental asupra greutii unor obolani de laborator.
Pentru aceasta s-au format 4 grupuri a cte 1u obolani, care au fost supuse
urmtoarelor tratamente: un grup a primit hran normal n condiii
nestresante, un grup a primit hran normal n condiii stresante, un grup a
primit hran hipercaloric n condiii nestresante i ultimul grup a primit
hran hipercaloric n condiii stresante. Dup un timp s-au determinat
greutile la toi indivizii. Exist o interaciune semnificativ ntre cei doi
factori: tipul de hran i stres?

Avnd n vedere modul de organizare al datelor, se poate folosi
ANOVA bifactorial cu replicare (cu numr egal de observaii n celul). La
intersecia unui rnd i a unei coloane sunt zece valori. Acest model poate
rspunde la ntrebarea problemei.
Testarea diferenelor dintre trei sau mai multe probe 137
Hran
Mediu Normal Hipercaloric
Stresant
130 157
142 155
131 162
124 153
124 158
131 152
143 159
131 161
130 160
127 157
Nestresant
120 132
130 128
122 142
118 131
120 135
119 120
127 139
118 133
119 135
122 136

Pentru a vedea dac exist interaciune ntre factori la nivel de probe
(celule), trebuie reprezentate grafic mediile valorilor din fiecare celul.

131,3
157,4
121,5
133,1
115
120
125
130
135
140
145
150
155
160
165
normal hipercaloric
x

Hran
stresant
nestresant
138 Elemente de statistic aplicate n ecologie
Din analiza acestui grafic rezult c hrana hipercaloric determin o
cretere n greutate mai mare dect cea normal. Condiiile stresante
determin o cretere n greutate mai mare. Creterea n greutate cnd s-a
administrat hran hipercaloric i n condiii stresante este mai puternic
dect atunci cnd s-a administrat hran normal n condiii stresante. Deci s-
ar putea s existe o interaciune ntre cei doi factori.
Ipotezele acestui test sunt:

E
0
1
: tipul de hran nu are un efect semnificativ asupra greutii
(coloanele nu difer semnificativ);
E
0
2
: stresul nu are un efect semnificativ asupra greutii (rndurile
nu difer semnificativ);
E
0
3
: interaciunea dintre tipul de hran i stres nu este semnificativ
(celulele nu difer semnificativ);
E
1
1
: tipul de hran are un efect semnificativ asupra greutii
(coloanele difer semnificativ);
E
1
2
: stresul are un efect semnificativ asupra greutii (rndurile
difer semnificativ);
E
1
3
: interaciunea dintre tipul de hran i stres este semnificativ
(celulele difer semnificativ).

Pentru a verifica dac interaciunea este semnificativ trebuie s se
parcurg etapele de realizare ale ANOVA bifactorial cu replicare.
Se calculeaz suma ptratelor tuturor valorilor:

x
t
2
= S2uS44 +42SSSS = 74S879 .

Se calculeaz ptratul sumei totale:

(x
t
)
2
= (2S28 +29uS)
2
= (S4SS)
2
= 29S17489 .

Se calculeaz numrul total de valori din toate probele:

n
t
= 2u +2u = 4u .

Testarea diferenelor dintre trei sau mai multe probe 139
Se calculeaz suma rapoartelor dintre ptratul sumei i dimensiunea
fiecrei coloane:

_
[x
c
i

2
n
c
i
_ =
(2528)
2
20
+
(2905)
2
20
= 74149u,4S .

Se calculeaz suma rapoartelor dintre ptratul sumei i dimensiunea
fiecrui rnd:

_
[x
r
]

2
n
r
]
_ =
(2887)
2
20
+
(2546)
2
20
= 74u844,2S .

Se calculeaz suma rapoartelor dintre ptratul sumei i dimensiunea
fiecrei celule:

_
[x
c
i
r
]

2
n
c
i
r
]
_ =
(1313)
2
10
+
(1574)
2
10
+
(1215)
2
10
+
(1331)
2
10
= 74492S,1 .

Se calculeaz sumele de ptrate:

SP
t
= 74S879 -
(5433)
2
40
= 7941,77S
SP
c
= 74149u,4S -
(5433)
2
40
= SSSS,22S
SP

= 74u844,2S -
(5433)
2
40
= 29u7,u2S
SP

= 74492S,1 -
(5433)
2
40
-(SSSS,22S +29u7,u2S) = S2S,62S
SP
nt
= 7941,77S -(SSSS,22S +29u7,u2S +S2S,62S) = 9SS,9.

Se calculeaz numrul gradelor de libertate:

gl
t
= 4u -1 = S9 gl
c
= 2 -1 = 1
gl

= 2 -1 = 1 gl

= (2 -1)(2 -1) = 1
gl
nt
= 4u -4 = S6 .

140 Elemente de statistic aplicate n ecologie
Se calculeaz sumele de ptrate medii:

SP

c
=
3553,225
1
= SSSS,22S SP

=
2907,025
1
= 29u7,u2S
SP

=
525,625
1
= S2S,62S SP

nt
=
955,9
36
= 26,SSS .

Se calculeaz statisticile testului i se completeaz tabelul ANOVA:

F
c
=
3553,225
26,553
= 1SS,82 F

=
2907,025
26,553
= 1u9,48
F

=
525,625
26,553
= 19,8u .

Sursa de variaie SP g| SP

F
Extern, ntre coloane SSSS,22S 1 SSSS,22S 1SS,82
Extern, ntre rnduri 29u7,u2S 1 29u7,u2S 1u9,48
Extern, de interaciune
(ntre celule)
S2S,62S 1 S2S,62S 19,8u
Intern 9SS,9 S6 26,SSS
Total 7941,77S S9

Deoarece gradele de libertate externe sunt toate egale cu 1, valoarea
critic va fi aceeai (anexa 2 sau 3) pentru toate cele trei seturi de ipoteze:
F
(0,05,1,36)
= 4,11S.

1SS,82 > 4,11S => E
0
1
se respinge i se accept E
1
1
pentru o
probabilitate p = 1 -u,uS.
1u9,48 > 4,11S => E
0
2
se respinge i se accept E
1
2
pentru o
probabilitate p = 1 -o.
19,8u > 4,11S => E
0
3
se respinge i se accept E
1
3
pentru o
probabilitate p = 1 -o.

Probabilitile ca ipotezele nule s fie adevrate pot fi calculate
pentru fiecare statistic F (anexa 3). Ele sunt 1,1 1u
-13
pentru F
c
, 1,9
1u
-12
pentru F

i 7,9 1u
-5
pentru F

.
Concluzia testului este c hrana are un efect semnificativ asupra
Testarea diferenelor dintre trei sau mai multe probe 141
greutii, stresul are un efect semnificativ asupra greutii i interaciunea
dintre hran i stres este i ea semnificativ.
n continuare, pentru evidenierea diferenelor semnificative dintre
celule luate cte dou se poate realiza testul Tukey. Pentru aceasta se
calculeaz modulele diferenelor dintre mediile celulelor:

Hran
Mediu
Hipercaloric
Stresant
1S7,4
Normal
Nestresant
121,S
Hipercaloric
Nestresant
1SS,1
Normal
Stresant
1S1,S
26,1 9,8 1,8
1S7,4 SS,9 24,S
121,S 11,6

Se afl valoarea critic Tukey (anexa 2):

q
(0,05,4,36)
= S,8S .

Se calculeaz statistica testului:

I = S,8S _
26,55
10
= 6,27 .

Comparaia dintre modulele diferenelor dintre medii i statistica
testului evideniaz c exist diferene semnificative ntre toate perechile de
grupuri, cu excepia perechii formate de grupul hrnit normal n condiii de
stres i grupul hrnit cu hran hipercaloric n condiii nestresante, ntre care
nu exist o diferen semnificativ.
Diferenele semnificative pot fi observate i prin analiza grafic a
suprapunerii dintre intervalele de confiden ale mediilor grupurilor.
Limitele intervalelor de confiden se calculeaz scznd i adunnd la
media fiecrui grup valoarea obinut prin mprirea statisticii testului
Tukey la doi (x
c
i

]
_
6,27
2
= x
c
i

]
_S,1SS).
142 Elemente de statistic aplicate n ecologie

131,3
157,4
121,5
133,1
115
120
125
130
135
140
145
150
155
160
165
normal hipercaloric
x

Hran
stresant
nestresant

9. CORELAIA I REGRESIA

O cercetare ecologic poate urmri posibilele relaii ntre dou sau
mai multe fenomene. De cele mai multe ori se urmrete relaia dintre dou
variabile apreciate pe o scal ordinal, de interval sau de raport. Analiza
unei astfel de relaii se face prin corelaie sau regresie, aplicarea uneia din
cele dou depinznd de modalitatea de obinere a datelor i de problema
care se pune n legtur cu acestea.
Corelaia este folosit pentru a determina dac exist asociere ntre
dou variabile i ct de puternic este aceast asociere. Prin asociere se
nelege c atunci cnd o variabil se modific cealalt se modific i ea
ntr-un anumit mod. De remarcat c n cazul corelaiei nu se fac presupuneri
viznd asocieri de tipul cauz-efect ntre cele dou variabile, dei acestea ar
putea exista. Exist posibilitatea ca dinamica celor dou variabile s fie
determinat de o a treia.
Regresia, pe de alt parte, evideniaz cu precdere relaiile de tip
cauz-efect dintre dou variabile, astfel nct o proporie substanial dintre
valorile unei variabile, numit variabil dependent, s fie o funcie sau s
fie explicate de valorile celeilalte variabile, numit variabil independent.
O alt deosebire notabil dintre corelaie i regresie este faptul c n
majoritatea cazurilor de analiz a regresiei valorile variabilei independente
nu sunt obinute aleator din populaie, nu sunt normal distribuite, ci, mai
curnd, selecia lor se afl sub controlul experimentatorului.
n general, se fac suficiente confuzii privind care dintre cele dou
analize pot fi aplicate unor anumite date. Pentru a simplifica decizia privind
utilizarea analizei corelaiei sau regresiei s analizm urmtoarele trei
cazuri:
A. Se extrage aleator o prob format din oprle gravide dintr-o
populaie. Dup depunerea oulor se nregistreaz greutatea i numrul de
ou produse. Datele se reprezint grafic, desemnndu-se arbitrar care
dintre cele dou variabile va fi reprezentat pe abscis i care pe ordonat.
B. Se urmrete efectul temperaturii asupra frecvenei cardiace la
144 Elemente de statistic aplicate n ecologie
proba reprezentat de oprle. Pentru aceasta fiecare dintre ele este supus
unei anumite temperaturi cuprins ntre anumite limite. Se nregistreaz
apoi la fiecare individ frecvena cardiac. Temperatura, variabila
independent fixat arbitrar, va fi reprezentat pe abscis. Frecvena
cardiac, variabila dependent de prima, va fi reprezentat pe ordonat.
C. Se alege un anumit numr de oprle gravide dintr-o populaie
dup un anumit criteriu s aib o anumit greutate. Se urmrete mai
departe cte ou va produce fiecare animal. Greutatea, variabila
independent aleas arbitrar i n funcie de valorile creia s-a selecionat
proba, va fi reprezentat pe abscis, iar dimensiunea pontei, variabila
dependent de prima, va fi reprezentat pe ordonat.
Dintre cele 3 situaii descrise mai sus, prima (A) este o problem de
analiz a corelaiei, n timp ce situaiile B i C sunt probleme de analiz a
regresiei. Dei situaiile A i C pot conduce aparent la ideea c ambele
analize pot fi aplicate pe aceleai date, n realitate, aplicarea corelaiei sau
regresiei este dictat de modul n care a fost obinut proba: n cazul A
proba era prelevat aleator, n timp ce n cazul C proba era prelevat
arbitrar, dup un anumit criteriu.

9.1. ANALIZA CORELAIEI

Analiza corelaie are rolul de a rspunde la mai multe ntrebri:

1. Exist o relaie ntre dou 2 variabile studiate?
2. Care este tipul acestei relaii?
3. Ct de puternic este aceast relaie?
4. Este relaia detectat semnificativ?

Rspunsurile la aceste ntrebri pot fi intuite din analiza datelor prin
intermediul unor reprezentri grafice (diagram de mprtiere a punctelor
de coordonate x i y). Astfel, analiza graficelor de mai jos (fig. 9.1) permite
urmtoarele concluzii:
primul grafic prezint o corelaie direct sau pozitiv (variabilele
sunt direct proporionale), adic cele dou variabile se modific n acelai
sens cnd x crete, y crete, iar cnd x scade, y scade;
Corelaia i regresia 145
al doilea grafic prezint o corelaie invers sau negativ
(variabilele sunt invers proporionale), adic cele dou variabile se modific
n sens diferit cnd x crete, y scade, iar cnd x scade, y crete;
al treilea grafic arat c, ntre cele dou variabile, corelaia practic
nu exist;
n cazul celui de-al patrulea grafic, tragerea unei concluzii este
dificil, implicnd un grad nalt de subiectivism: fie nu exist corelaie, fie
este o corelaie pozitiv, slab (mprtierea punctelor este relativ mare).

Figura 9.1. Tipuri de corelaie

Examinarea graficelor de corelaie poate fi ns subiectiv, motiv
pentru care este necesar completarea metodei grafice cu una statistic, mai
obiectiv. O astfel de metod ce surprinde msura n care dou variabile
sunt asociate const n calcularea coeficientului de corelaie r.
Valoarea coeficientului de corelaie este cuprins ntre 1, valoarea
unei corelaii maxime negative, i +1, valoarea unei corelaii maxime
pozitive. Dac r este cuprins ntre u i +1, corelaia este pozitiv, iar dac
este cuprins ntre u i 1, corelaia este negativ. Cnd r este egal cu u,
corelaia este absent. Cnd r este egal cu +1 sau 1, punctele de
coordonate x, y sunt dispuse perfect liniar, n lungul unei drepte imaginare
(fig. 9.2, A i B). Dac variabilele urmrite sunt apreciate pe o scal
Corelaie pozitiv x
y yy
Corelaie negativ x
Corelaiei absent x
y y
y
Corelaie? x
146 Elemente de statistic aplicate n ecologie
ordinal, exist o corelaie perfect cnd toate valorile cresc sau descresc
succesiv. n acest caz, punctele din graficul de corelaie pot s nu se afle
dispuse liniar (fig. 9.2, C).

Figura 9.2. Corelaii perfecte: A pozitiv, B negativ, C perfect monoton (a
rangurilor)

Corelaiile pentru care valoarea coeficientului este mai apropiat de
+1 sau 1 sunt corelaii puternice, pozitive sau, respectiv, negative, iar cele
pentru care valoarea coeficientului este mai apropiat de 0 sunt corelaii
slabe (tab. 9.1).

Tabelul 9.1. Puterea corelaiei n funcie de valoarea lui r
_r Puterea corelaiei
0,00 0,19 Corelaie foarte slab
0,20 0,39 Corelaie slab
0,40 0,69 Corelaie moderat
0,70 0,89 Corelaie puternic
0,90 1,00
Corelaie foarte
puternic

n funcie de caracteristicile datelor celor dou variabile, corelaia
poate fi parametric sau neparametric. Pentru fiecare din cele dou se
folosesc coeficieni diferii: pentru corelaia parametric se folosete
coeficientul de corelaie Pearson; pentru corelaia neparametric se
utilizeaz coeficientul de corelaie Spearman. n funcie de utilizarea
unuia dintre cei doi coeficieni, analiza corelaiei poate fi parametric i,
respectiv, neparametric. Analiza corelaie n general const n calcularea
valorii coeficientului de corelaie i n testarea semnificaiei acestuia la
nivelul populaiei din care a fost extras proba.
A x
y yy
B x C x
yy
Corelaia i regresia 147
Semnificaia unei corelaii se apreciaz independent de puterea
acesteia. Astfel, se poate pune n eviden o corelaie puternic, pozitiv sau
negativ, care ns s nu fie semnificativ i invers, una slab care ns s se
dovedeasc a fi semnificativ.

9.1.1. Analiza corelaiei parametrice
Ca i n cazul celorlalte teste parametrice prezentate n capitolele
anterioare, analiza corelaiei parametrice presupune ca datele s
ndeplineasc urmtoarele condiii:

1. proba trebuie s fie prelevat aleator din populaia cercetat;
2. ambele variabile, x i y, trebuie s fie apreciate pe o scal de
raport sau de interval;
3. valorile ambelor trebuie variabile s fie aproximativ normal
distribuite;
4. relaia dintre cele dou variabile, dac exist, trebuie s fie liniar.

Liniaritatea relaiei poate fi verificat prin inspectarea graficului de
corelaie n care norul de puncte de coordonate x, y trebuie s nu fie curbat.
Dac datele nu ndeplinesc condiiile 2, 3, i 4, atunci trebuie
utilizat o analiz neparametric a corelaiei. n cazul n care nu este
ndeplinit numai condiia 4, se poate lua n consideraie i o transformare
care s ndrepte relaia (seciunea 9.2 Abordarea relaiilor curbilinii).
n cazul corelaiei parametrice se calculeaz coeficientul de corelaie
Pearson. Acesta msoar ct de puternic este relaia dintre dou variabile x
i y, pornind de la covariana lor n prob.
Covariana este o msur a variabilitii legate a dou variabile fa
de mediile lor. Este de fapt media produselor abaterilor celor dou variabile
fa de media fiecreia sau produsul deviaiilor variabilelor. Ca i deviaia
standard i variana, covariana poate fi o statistic a unei probe (x
xy
) sau un
parametru populaional (o
xy
). Cnd statistica se folosete ca estimator al
parametrului, atunci suma produselor abaterilor variabilelor se mparte la
numrul gradelor de libertate n 1.

o
x
=
(x-
x
)(-
j
)
n
s
x
=
(x-x )(-)
n-1

148 Elemente de statistic aplicate n ecologie
Pentru dou valori x i y, fiecare mai mare dect media sa (x > x i
y > y), abaterile (x x i y y) lor vor fi pozitive i produsul lor, tot pozitiv.
Dac o pereche de valori x i y sunt mai mici dect mediile lor, atunci
ambele abateri vor fi negative. Produsul lor ns va fi pozitiv.
Dac o valoare x este mai mic dect x, iar o valoare y este mai
mare dect y, atunci abaterea lui x va fi negativ, iar abaterea lui y va fi
pozitiv. Ca urmare, produsul abaterilor va fi negativ. La fel se ntmpl
dac x este mai mare dect x, iar y este mai mic dect y.
Din punct de vedere grafic, produsele abaterilor vor fi pozitive sau
negative n funcie de poziia punctului de coordonate x, y fa de poziia
punctului de coordonate x, y, numit i centru mediu (fig. 9.3).

Figura 9.3. Semnul produselor abaterilor n funcie de poziia fa de centrul mediu

Referindu-ne la datele dintr-o prob, din analiza figurii 9.3 rezult
c, dac majoritatea punctelor de coordonate x, y se vor dispune n
cadranele notate cu + i mai puine puncte se vor afla n cadranele notate
cu , atunci covariana va fi pozitiv. Dac vor predomina punctele din
cadranele negative, iar cele din cadranele pozitive vor fi mai puine, atunci
covariana probei va fi negativ. Deci, fcnd legtura dintre covarian i
coeficientul de corelaie, se poate spune c semnul corelaiei, al
coeficientului, este acelai cu cel al covarianei valorilor dintr-o prob.
Acest lucru este evident i dac suprapunem primele dou grafice din figura
9.1 peste cel din figura 9.3 (fig. 9.4).

x
y
y

+
+

Corelaia i regresia 149

Figura 9.4. Relaia dintre semnul covarianei i cel al corelaiei

Se poate pune urmtoarea ntrebare: dac relaia dintre variabile este
surprins de covariana lor, de ce nu se utilizeaz acest descriptor (s
x
) n
loc de coeficientul de corelaie (r)? Din perspectiva corelaiei, covariana
prezint un dezavantaj: valoarea sa este influenat de unitile de msur
ale variabilelor x i y, ceea ce face dificil comparaia. Pentru a elimina
acest neajuns, este nevoie s se realizeze o standardizare a covarianei (s
x
)
prin mprirea acesteia la produsul deviaiilor standard ale celor dou
variabile (s
x
s

). Astfel, ctul acestei mpriri va lua valori de la 1 la +1

i va reprezenta coeficientul de corelaie Pearson:

r =
s
xj
s
x
s
j
=
(x-x)(j-j)
n-1
_
(x-x)
2
n-1

(j-j)
2
n-1
.

Prin rearanjarea algebric a formulei se obine una mai uor de
folosit n practic:

r =
nx-x
_|nx
2
-(x)
2
]|n
2
-()
2
]
.

Odat calculat valoarea coeficientului de corelaie se poate trece la
testarea semnificaiei acestuia care se face sub forma unui test. Testarea
semnificaiei arat n ce msur relaia surprins de coeficientul de corelaie
a probei (r) este semnificativ la nivel de populaie (p).
x
y
y

+

+

x
y
y

+

+

150 Elemente de statistic aplicate n ecologie
n funcie de ntrebarea cu privire la relaia dintre variabile (corelaie
semnificativ, corelaie semnificativ pozitiv i corelaie semnificativ
negativ) la care trebuie s rspund testul se aleg ipotezele ce vizeaz
coeficientul de corelaie n populaie:

Bilateral Unilateral
E
0
: p = u E
0
: p u E
0
: p u
E
1
: p = u E
1
: p > u E
1
: p < u .

Primul set de ipoteze se folosete dac se dorete evidenierea unei
corelaii semnificative n populaia din care s-a extras proba, fr a se
preciza semnul acesteia. Dac se urmrete punerea n eviden a unei
corelaii pozitive semnificative, se utilizeaz al doilea set de ipoteze, iar n
cazul n care se urmrete semnificaia unei corelaii negative, se folosete
ultimul set de ipoteze.
Statistica testului este una de tip Student (t) i se calculeaz cu
ajutorul numrului de perechi de valori x i y (n) i cu valoarea
coeficientului de corelaie Pearson (r):

t = r_
n-2
1-
2
.

Condiia testului este similar cu cea a unui test t, cu meniunea c
valoarea critic se alege n funcie de o i de numrul gradelor de libertate
n 2.

Dac |t| t
(u,n-2)
=> E
0
se respinge, E
1
se accept pentru
p = 1 o.

Coeficientul de determinare r
2

Valoarea coeficientului de corelaie Pearson ridicat la ptrat
reprezint o statistic util a datelor. Acesta arat proporia n care
variabilitatea uneia dintre cele dou variabile poate fi pus pe seama
variabilitii celeilalte. Coeficientul de determinare reprezint o proporie,
dar dac se nmulete cu 1uu, rezult procentul de valori ale celor dou
variabile care sunt realmente corelate. De exemplu, dac pentru dou
Corelaia i regresia 151
variabile oarecare r
2
= u,81, nseamn c 81% din valorile celor dou
variabile sunt realmente corelate. Coeficientul de determinare poate fi
considerat un descriptor standardizat al puterii corelaiei dintre dou
variabile.

Exemplul 9.1. La 24 de indivizi de viper de step extrai aleatoriu
din populaie s-a determinat lungimea trunchiului i greutatea. Exist o
corelaie pozitiv semnificativ ntre cele dou variabile?

Nr. crt. 1 2 3 4 5 6 7 8 9 10 11 12
cm (x) 49 150 153 146 164 66 160 215 228 222 260 325
g (y) 2,5 3,6 3,6 3,8 4 4,5 4,7 9,3 10,5 10,9 14 21
Nr. crt. 13 14 15 16 17 18 19 20 21 22 23 24
cm (x)
340 430 390 373 425 450 389 422 418 435 459 470
g (y)
22 30 33,5 38,4 40 41 46,3 49,8 53,3 57 72,2 76,7

Inspectarea graficului de corelaie arat o relaie uor curb ntre cele
dou variabile, ceea ce nseamn c ultima condiie de aplicare a corelaiei
parametrice nu este respectat.

0
10
20
30
40
50
60
70
80
90
0 100 200 300 400 500
y
x
152 Elemente de statistic aplicate n ecologie
n urma logaritmrii valorilor x i y n diferite combinaii se observ
c logaritmarea doar a valorilor greutilor ndreapt cel mai bine relaia
dintre cele dou variabile.

Nr, crt, 1 2 3 4 5 6 7 8 9 10 11 12
x 49 150 153 146 164 66 160 215 228 222 260 325
y=ln(y) 0,916 1,281 1,281 1,335 1,386 1,504 1,548 2,230 2,351 2,389 2,639 3,045
Nr, crt, 13 14 15 16 17 18 19 20 21 22 23 24
x 340 430 390 373 425 450 389 422 418 435 459 470
y=ln(y) 3,091 3,401 3,512 3,648 3,689 3,714 3,835 3,908 3,976 4,043 4,279 4,340

n continuare, se calculeaz valoarea coeficientului de corelaie
Pearson dintre lungime i greutatea transformat:

r =
2423471,976-713967,341
|242546985-(7139)
2
]|24218,368-(67,341)
2
]
= u,97S .

Valoarea coeficientului arat c este vorba de o corelaie pozitiv
foarte puternic. Puterea corelaiei mai poate fi reflectat i de valoarea
coeficientului de determinare:

r
2
= u,97S
2
= u,9S .

0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
5
0 100 200 300 400 500
y
'
=
l
n
(
y
)
x
Corelaia i regresia 153
Valoarea coeficientului de determinare arat c 9S% din valorile
celor dou variabile sunt realmente corelate.
Pentru a afla dac aceast corelaie evideniat la nivel de prob este
semnificativ i la nivel de populaie, trebuie efectuat testul de semnificaie
a corelaiei. Avnd n vedere modul de formulare a ntrebrii problemei,
ipotezele testului sunt:

E
0
: p u
E
1
: p > u .

Se calculeaz statistica testului:

t = u,97S _
24-2
1-0,95
= 2u,S4 .

Se afl valoarea critic pentru un test unilateral (anexa 2 sau 3):

t
(0,05,24-2)
= 1,717 .

Statistica testului este mai mare dect valoarea critic, deci se
respinge ipoteza nul i se accept ipoteza alternativ pentru o probabilitate
de u,9S sau n 9S% din cazuri.
Probabilitatea ca ipoteza nul s fie adevrat poate fi calculat
(anexa 3). Aceast probabilitate este foarte mic (S,8 1u
-16
).
Concluzia testului este c exist o corelaie pozitiv i semnificativ
ntre lungimea corpului i greutate n populaia de vipere de step
investigat.

9.1.2. Analiza corelaiei neparametrice
n cazul n care datele nu respect condiiile corelaiei parametrice (x
i/sau y sunt apreciate pe o scal ordinal, valorile x i/sau y din prob nu
sunt aproximativ normal distribuite, relaia dintre variabile nu este liniar),
atunci se va calcula coeficientul de corelaie neparametric Spearman.
Acest coeficient, notat cu r
x
pentru prob i p pentru populaie, a
fost obinut prin prelucrarea formulei coeficientului Pearson cnd n loc de
154 Elemente de statistic aplicate n ecologie
datele brute se folosesc rangurile acestora. Deci exist o legtur strns
ntre cei doi coeficieni.
Pentru a putea calcula valoarea r
s
este nevoie ca mai nti s se dea
ranguri valorilor lui x (R
x
) i valorilor lui y (R

), separat. Algoritmul de
acordare a rangurilor este similar cu cel folosit n celelalte teste
neparametrice (seciunea 2.1, tab. 2.3). Ulterior, se calculeaz diferenele
dintre rangurile corespunztoare fiecrei perechi de valori x i y, originale
(J = R
x
R

), iar fiecare diferen se ridic la puterea a doua (J

2
). Ptratele
tuturor diferenelor se nsumeaz obinndu-se suma ptratelor diferenelor
(J
2
). Formula de calcul a coeficientului Spearman include suma ptratelor
diferenelor i numrul perechilor de valori x i y (n):

r
s
= 1 -
6d
2
n
3
-n
.

Valoarea coeficientului Spearman are aceleai proprieti
informaionale ca i cea a coeficientului Pearson: ia valori ntre 1 i +1,
semnul valorii indic, dup caz, o corelaie pozitiv sau negativ; o valoare
egal cu +1 sau 1 semnific o corelaie maxim, n timp ce una egal cu u
arat absena corelaiei; apropierea valorii de _1 indic o corelaie
puternic, n timp ce o valoare mai apropiat de 0, o corelaie slab.
Testarea semnificaiei n analiza corelaiei neparametrice se face la
fel ca n cazul corelaiei parametrice, cu deosebirea c la calcularea
statisticii testului (t) n loc de valoarea coeficientului Pearson (r) se
folosete valoarea coeficientului Spearman (r
s
):

t = r
s
_
n-2
1-
s
2
.

Coeficientul Spearman pierde din precizie dac exist un numr
relativ mare de valori egale. n general, dac mai mult de jumtate din
ranguri au valori egale, atunci se recomand calcularea coeficientului de
corelaie a rangurilor conform formulei lui Pearson, n care se nlocuiesc
valorile originale cu rangurile acestora.

Corelaia i regresia 155
Exemplul 9.2. S se rezolve problema de la exemplul 9.1
considerndu-se c datele nu ndeplinesc condiiile de aplicare ale corelaiei
parametrice.

Pentru calcularea coeficientului de corelaie parametric trebuie date
ranguri valorilor originale ale lungimii i greutii, dup care se calculeaz
suma ptratelor diferenelor dintre rangurile fiecrei perechi x, y:

cm(x) g (y) R
x
R
y
d = R
x
-R
y
d
2

49 2,5 1 1 0 0
150 3,6 4 2,5 1.5 2,25
153 3,6 5 2,5 2.5 6,25
146 3,8 3 4 -1 1
164 4 7 5 2 4
66 4,5 2 6 -4 16
160 4,7 6 7 -1 1
215 9,3 8 8 0 0
228 10,5 10 9 1 1
222 10,9 9 10 -1 1
260 14 11 11 0 0
325 21 12 12 0 0
340 22 13 13 0 0
430 30 20 14 6 36
390 33,5 16 15 1 1
373 38,4 14 16 -2 4
425 40 19 17 2 4
450 41 22 18 4 16
389 46,3 15 19 -4 16
422 49,8 18 20 -2 4
418 53,3 17 21 -4 16
435 57 21 22 -1 1
459 72,2 23 23 0 0
470 76,7 24 24 0 0
J
2
= 130,5

Se calculeaz coeficientul de corelaie Spearman:

r
s
= 1 -
6130,5
24
3
-24
= u,94S .

156 Elemente de statistic aplicate n ecologie
Acest rezultat arat c este vorba de o corelaie pozitiv foarte
puternic.

Pentru testarea semnificaiei se aplic testul la fel ca n exemplul 9.1.
Se scriu ipotezele testului:
E
0
: p u
E
1
: p > u .

Se calculeaz statistica testului:

t = u,94S _
24-2
1-(0,943)
2
= 1S,S24 .

Se afl valoarea critic pentru testul unilateral (anexa 2 sau 3):

t
(0,05,24-2)
= 1,717 .

1S,S24 > 1,717 => E
0
se respinge i se accept E
1
pentru o
probabilitate de u,9S.

Probabilitatea ipotezei nule (anexa 3) este de 2,6 1u
-12
.
Concluzia testului este c exist o corelaie pozitiv semnificativ
ntre lungimea i greutatea viperelor de step din populaia studiat.
0
5
10
15
20
25
30
0 5 10 15 20 25 30
R
y
R
x
Corelaia i regresia 157

9.2. ANALIZA REGRESIEI

Analiza regresiei este similar n unele aspecte cu analiza corelaiei,
dar este diferit de aceasta prin faptul c presupune o relaie de tip cauz-
efect ntre variabila independent, aflat sub controlul cercettorului, i cea
dependent.
n esen, se presupune c ar exista o relaie funcional care permite
prezicerea unei valori a variabilei y corespunztoare unei valori date a

y = (x) +c c eroarea aleatoare.

n cazul regresiei liniare simple, relaia are urmtoarea form:

p

= o +[x
p

media populaional a valorilor y corespunztoare unei valori x

o coeficient de regresie nlimea dreptei de regresie
[ coeficient de regresie panta dreptei de regresie.

Figura 9.5. Explicaia grafic a funcie regresiei liniare

0
x
y

x

y

y
=+x
158 Elemente de statistic aplicate n ecologie
Analiza regresiei presupune urmtoarele aspecte:

1. Regresia este folosit pentru aproximarea unei ecuaii ce descrie
relaia liniar dintre 2 variabile. Aceasta se numete ecuaie sau
funcie de regresie. Parametrii o i [ pot fi estimai pe baza unei
probe din populaie.
2. Pe baza ecuaiei se poate construi o dreapt de regresie.
3. Ecuaia de regresie poate fi folosit pentru aflarea valorilor
variabilei dependente (y) corespunztoare valorilor variabilei
independente (x).
4. Regresia poate fi folosit pentru a surprinde msura n care
variabila dependent se afl sub controlul variabilei independente.

Analiza regresiei presupune o serie de condiii:

1. Variabila independent (x) este fixat, adic valorile acesteia sunt
alese arbitrar i nu aleator din populaie.
2. Pentru orice valoare a variabilei independente (x) exist o
populaie normal distribuit de valori ale variabilei dependente
(y). Media populaional a valorilor lui y este: p

= o +[x.
3. Din condiia 2 rezult c pentru oricare valoare x exist o valoare
particular y

:
4. y

= o +[x +c.
5. c reziduu sau eroare ntmpltoare; arat msura n care o
valoare observat a lui y difer de media valorilor lui y (p

); c are
o distribuie normal standard.
6. Varianele variabilei y pentru toate valorile variabilei x sunt egale.
7. Observaiile sunt independente, adic fiecare pereche de valori
x, y provin prin investigarea unei singure uniti de prob.

Dac prima condiie nu este ndeplinit, atunci analiza regresiei nu
poate fi aplicat. n schimb, s-ar putea folosi analiza corelaiei.

Estimarea funciei i dreptei de regresie
Coeficienii de regresie, adic parametrii funciei, se estimeaz
pornind de la o prob, astfel o i [ vor fi estimai prin o i, respectiv, b.
Corelaia i regresia 159
Dreapta descris de estimatorii o i b reprezint linia care se potrivete cel
mai bine funciei de regresie i care se mai numete i dreapt de regresie
estimat. Avnd n vedere c ecuaia definete dreapta, estimarea acestora
se va face n paralel.
Dreapta de regresie va trece ntotdeauna prin punctul de coordonate
x, y. Dac pe orizontala ce trece prin acest punct se traseaz perpendiculare
din fiecare punct de coordonate x, y, atunci fiecare perpendicular va
reprezenta abaterea valorilor lui y fa de y, adic y y. Suma acestor
abateri va fi aproximativ egal cu u, dar suma ptratelor abaterilor va fi ns
mai mare dect 0 ((y y) = u; (y -y)
2
> u). Deci se obine suma
ptratelor abaterilor lui y fr a se ine cont de valorile lui x (fig. 9.6).

Figura 9.6. Variaia variabilei dependente cnd variabila independent nu este luat
n consideraie

S presupunem c orizontala poate pivota n jurul punctului x , y
astfel nct distanele de la valorile lui y la dreapt s fie minime sau suma
ptratelor abaterilor valorilor lui y fa de linie s fie minim (metoda celor
mai mici ptrate). Corespondenta unei anumite valori y pe dreapt se
noteaz cu y. Abaterea valorilor y fa de linie va fi egal cu y y. Suma
ptratelor abaterilor lui y fa de linie, cnd se ine cont i de valorile lui x,
va fi mai mic dect cea precedent, adic (y y)
2
< (y y)
2
. n
concluzie, incertitudinea lui y a fost redus prin luarea lui x n consideraie.
y -y
x
y
160 Elemente de statistic aplicate n ecologie
Diferena dintre o valoare y i corespondenta sa pe dreapta de regresie este
y y = c; c are o distribuie normal i media egal cu u, adic are o
distribuie normal standard (fig. 9.7).

Figura 9.7. Variaia variabilei dependente cnd variabila independent este luat n
consideraie

Estimarea funciei (ecuaiei) de regresie
Se calculeaz coeficienii de regresie b i o conform formulelor:

b =
x-
xj
n
x
2
-
(x)
2
n

o = y -bx .

Estimarea funciei de regresie este:

y = o +bx .

Cu ajutorul funciei de regresie se calculeaz valorile y
corespunztoare fiecrei valori x. Trasarea dreptei de regresie se face unind
punctele de coordonate x, y.

y -y = c
x
y
Corelaia i regresia 161
Testarea semnificaiei funciei de regresie
Semnificaia ecuaiei de regresie estimate se face sub forma unei
analize a varianei (ANOVA).
Principiul de descompunere a variabilitii este urmtorul: variana
total (s
t
2
) este dat de variana extern sau de regresie (s
cxt
2
) plus variana
intern sau rezidual (s
nt
2
):

s
t
2
= s
cxt
2
+s
nt
2
.

Ipotezele testului sunt similare cu cele de la corelaie, doar c n
cazul regresiei se testeaz coeficientul de regresie [ (panta sau nclinaia
dreptei) pentru populaia din care a fost prelevat proba. Dac [ este zero,
atunci nseamn c variabila y nu este dependent de x (aceast proprietate
a lui [ este similar cu cea a coeficientului de corelaie populaional p).

H
0
: =0
H
1
: 0

n continuare se calculeaz suma de ptrate total (SP
t
), suma de
ptrate extern (SP
cxt
) i suma de ptrate intern (SP
nt
), conform
formulelor:

SP
t
= y
2
-
()
2
n

SP
cxt
= b [xy -
x
n

SP
nt
= SP
t
-SP
cxt
.

Se calculeaz sumele de ptrate medii (SP

) ca raportul dintre sumele

libertate externe reprezint diferena dintre numrul variabilelor considerate
(k) din care se scade 1. Gradele de libertate totale reprezint numrul
perechilor de valori x, y (n) minus 1. Gradele de libertate interne se afl la
fel ca i suma de ptrate intern, adic din numrul gradelor de libertate
totale se scad cele externe (n 1 k +1 = n k). Raportul dintre suma de
ptrate medie extern i cea intern reprezint statistica testului (F).

162 Elemente de statistic aplicate n ecologie

Sursa de variabilitate SP g| SP

F
Extern SP
cxt

k 1 SP

cxt
SP

cxt
SP

nt

Intern SP
nt
n k SP

nt
Total SP
t
n 1

Condiia testului const n compararea statisticii testului (F) cu o
valoare critic pentru un anumit nivel de ncredere o i gradele de libertate
externe (k 1) i interne (n k).

Dac F F
(u,k-1,n-k)
=> E
0
se respinge, E
1
se accept pentru
p = 1 o.

Intervalul de confiden al coeficientului de regresie
Coeficientul de regresie n prob b este o estimare a coeficientului de
regresie populaional [. Deci b i [ sunt diferii, dar se poate calcula
intervalul de confiden pentru [ cu ajutorul erorii standard a lui b (s
b
):

s
b
=
_
SP

int
x
2
-
(x)
2

n
.

Limitele inferioar (II) i cea superioar (IS) ale intervalului de
confiden a lui [ se vor afla prin calcularea relaiei:

[ = b _s
b
t
(u,n-2)

II = b -s
b
t
(u,n-2)

IS = b +s
b
t
(u,n-2)
.

n concluzie, intervalul II-IS include coeficientul de regresie
populaional [, cu o probabilitate de 1 o sau 1uu(1 o) .

Coeficientul de determinare r
2

Se tie c variana lui y poate fi explicat n bun msur de
cunoaterea variabilei x, totui o parte rmne neexplicat. Este vorba de
Corelaia i regresia 163
variana intern. Dac valorile lui y ar fi complet dependente de valorile lui
x, atunci erorile aleatoare (c) ar fi egale cu zero, adic toate punctele de
coordonate x, y ar fi exact pe dreapta de regresie.
n cazul analizei regresiei, coeficientul de determinare (r
2
) arat
proporia varianei lui y explicat prin dependena de x.
Formula de calcul a lui r
2
este la fel ca n cazul analizei corelaiei.
Totui, pentru a simplifica calculul i pentru a folosi valori deja calculate n
etapele anterioare ale analizei regresiei, r
2
se poate calcula i dup
urmtoarea formul:

r
2
=
SP
cxt
SP
t
.

Ca i n cazul analizei corelaiei, valoarea coeficientului de
determinare se poate nmuli cu 1uu pentru a obine un procent, care, n
analiza regresiei, arat ct la sut dintre valorile lui y sunt dependente sau
determinate de valorile lui x. Diferena 1uu r
2
% arat variana individual
sau rezidual care nu poate fi explicitat de valorile lui x.

Zona de confiden a dreptei de regresie
Limitele de confiden ale dreptei de regresie se pot afla calculnd
eroarea standard pentru fiecare punct de coordonate x, y de pe dreapt,
pentru fiecare valoare a lui x din prob. Pentru fiecare valoare x se
calculeaz eroarea standard s

:

s

= _SP

nt
_
1
n
+
(x-x )
2
x
2
-
(x)
2
n
_ .

Limitele inferioar (II) i superioar (IS) ale intervalului de
confiden a fiecrui y corespunztor unei valori x din prob se calculeaz
pornind de la relaia:

p

= y _s

t
(u,n-2)

II = y -s

t
(u,n-2)

IS = y +s

t
(u,n-2)
.
164 Elemente de statistic aplicate n ecologie
Concluzia va fi c intervalele II-IS pentru fiecare valoare x includ
mediile populaiilor de valori y (p

) cu o probabilitate de 1 o.
Unirea limitelor inferioare ntre ele i a celor superioare ntre ele,
obinute pentru fiecare valoare x, duce la reprezentarea grafic a zonei de
confiden a dreptei n ansamblu (fig. 9.8). Deci dreapta de regresie n
populaia din care s-a extras proba se poate gsi ntre liniile ce unesc
limitele inferioare i cele superioare, cu o probabilitate de 1 o.

Limitele de confiden ale unei estimri individuale
Estimarea unei valori pentru o valoare individual x care nu se
regsete n prob poate fi afectat de o surs de eroare adiional, anume de
mprtierea fa de dreapt. Astfel, intervalul de confiden pentru o
valoare va fi mai larg dect cel al dreptei de regresie. Intervalul se afl
folosind relaiile de mai sus, doar c se modific formula erorii standard a
unui punct de pe dreapt prin adugarea unei uniti la valoarea dintre
parantezele ptrate.

s

= _SP

nt
_1 +
1
n
+
(x-x )
2
x
2
-
(x)
2
n
_

Limita inferioar (II) i cea superioar (IS) a intervalului de
confiden pentru o valoare corespunztoare unei valori x din prob se
calculeaz pornind de la relaia:

p

= y _s

t
(u,n-2)

II = y -s

t
(u,n-2)

IS = y +s

t
(u,n-2)
.

Concluzia va fi c intervalul II-IS pentru o valoare x include media
populaiei de valori y (p

) cu o probabilitate de 1 o.
Unirea limitelor inferioare ntre ele i a celor superioare ntre ele,
obinute pentru fiecare valoare x, duce la reprezentarea grafic a zonei de
confiden pentru estimarea lui y pornind de la o valoare unic x (fig. 9.8).

Corelaia i regresia 165

Figura 9.8. Zona de confiden a dreptei de regresie i pentru o valoare unic x

Abordarea relaiilor neliniare
Numeroase relaii dintre variabile biologice nu sunt rectilinii. Un
exemplu n acest sens l constituie creterea populaiilor i relaia dintre
mortalitate i vrst.
n astfel de cazuri, relaiile curbilinii pot fi ndreptate prin
transformarea datelor (seciunea 4.5 Transformarea datelor).
La nceput trebuie observat care din cele dou variabile trebuie
transformat. Aceasta se poate face prin ncercri repetate, adic prin
reprezentarea grafic a corelaiei cu cte o variabil transformat sau cu
amndou.
O alt modalitate const n calcularea r
2
pentru fiecare transformare
alternativ (r
x,
2
; r
xi,
2
; r
x,i
2
; r
xi,i
2
). Transformarea care va duce la obinerea
valorii celei mai mari a r
2
va fi folosit n analiza regresiei.
Transformarea variabilelor determin i modificarea funciei:

dac y - y', atunci o - o' i y
i
= o
i
+bx ;
dac y - y' i x - x', atunci y
i
= o
i
+bx' .

Dac se apeleaz la o transformare a datelor, se impune n final o
transformare invers a rezultatelor (coeficieni de regresie, limitele
intervalelor de confiden).
x

zona de confiden a
dreptei de regresie
intervalul de confiden al lui
pentru o singur valoare x
166 Elemente de statistic aplicate n ecologie
Exemplul 9.3. S se afle dac exist o relaie de tip cauz-efect
semnificativ ntre lungimea i greutatea viperelor din exemplul 9.1,
considernd c proba a fost selectat astfel nct indivizii s aib anumite
greuti. S se estimeze intervalul de confiden al greutii pentru un
individ la care lungimea este de Su cm.
Deoarece existena unei relaii liniare reprezint o condiie a
regresiei, se vor lua n consideraie valorile transformate prin logaritmare ale
greutii.
n continuare se estimeaz coeficienii funciei de regresie:

Nr. Crt. cm (x) ln(g) (y) xy
1 49 0,916 44,898
2 150 1,281 192,140
3 153 1,281 195,983
4 146 1,335 194,910
5 164 1,386 227,352
6 66 1,504 99,269
7 160 1,548 247,610
8 215 2,230 479,453
9 228 2,351 536,114
10 222 2,389 530,305
11 260 2,639 686,155
12 325 3,045 989,470
13 340 3,091 1050,954
14 430 3,401 1462,515
15 390 3,512 1369,503
16 373 3,648 1360,725
17 425 3,689 1567,774
18 450 3,714 1671,107
19 389 3,835 1491,870
20 422 3,908 1649,182
21 418 3,976 1661,941
22 435 4,043 1758,727
23 459 4,279 1964,263
24 470 4,340 2039,754
Suma 7139 67,341 23471,976
Media 297,458 2,806
(Suma)
2
50965321 4534,757
Suma de ptrate 2546985 218,368

Corelaia i regresia 167
b =
23471,976-
1396,341
24
2546985-
S096S321
24
= u,uu81S
o = 2,8u6 -u,uu81S 297,4S8 = u,S886 .

Deci ecuaia dreptei de regresie sau funcia de regresie este:

y' = u,S886 +u,uu81Sx .

Estimarea funciei de regresie se face prin ANOVA. Ipotezele
testului sunt:

H
0
: =0
H
1
: 0 .

Se calculeaz sumele de ptrate:

SP
t
= 218,S68 -
4534,757
24
= 29,42
SP
cxt
= u,uu81S[2S471,976 -
713967,341
24
= 27,96
SP
nt
= 29,42 -27,96 = 1,46 .

Se calculeaz numrul gradelor de libertate:

gl
t
= 24 -1 = 2S
gl
cxt
= 2 -1 = 1
gl
nt
= 24 -2 = 22 .

Se calculeaz sumele de ptrate medii:

SP

cxt
=
27,96
1
= 27,96 SP

nt
=
1,46
22
= u,u66S .

Se calculeaz statistica testului:

F =
27,96
0,0663
= 422,uS .

168 Elemente de statistic aplicate n ecologie
Se completeaz tabelul Anova:

Sursa de variabilitate SP g| SP

F
Extern 27,96 1 27,96 422,uS
Intern 1,46 22 u,u66S
Total 29,42 2S

Se afl valoarea critic (anexa 2 sau 3):

F
(0,05,1,22)
= 4,Su1 .

Statistica testului este mai mare dect valoarea critic, deci se
respinge ipoteza nul i se accept ipoteza alternativ pentru o probabilitate
de u,9S. Probabilitatea calculat a ipotezei nule pentru statistica testului
(anexa 3) este 7,6 1u
-16
.
Concluzia testului este c exist o relaie de tip cauz-efect
semnificativ ntre cele dou variabile, definit de funcia de regresie
estimat.

Cu ajutorul funciei de regresie se pot calcula valorile estimate y'
pentru valorile x. Prin punctele de coordonate x, y' se poate trasa dreapta de
regresie. Valoarea y' pentru prima valoare x = 49 se calculeaz astfel:

y' = u,S886 +u,uu81S 49 = u,7868 .

La fel se procedeaz i pentru celelalte valori ale variabilei x.
Pentru a construi zona de confiden a dreptei de regresie trebuie
reprezentate grafic limitele intervalului de confiden ale mediei populaiei
de valori y corespunztoare fiecrei valori x. Pentru aceasta este nevoie s
se afle valoarea critic t
(0,05,22)
(anexa 2 sau 3):

t
(0,05,24-2)
= 2,u74 .

Limitele intervalului de confiden pentru prima valoare x = 49 se
calculeaz astfel:

Corelaia i regresia 169
II' = u,7868 -2,u74 _u,u66S _
1
24
+
(49-297,458)
2
2546985-
(139)
2
24
_ = u,SSS7
IS' = u,7868 +2,u74 _u,u66S _
1
24
+
(49-297,458)
2
2546985-
(139)
2
24
_ = 1,u179 .

La fel se procedeaz i pentru celelalte valori ale variabilei x.

cm (x) ln(g) (y') y' x
yi
LI' LS'
49 0,9163 0,7868 0,1114 0,5557 1,0179
150 1,2809 1,6076 0,0785 1,4448 1,7704
153 1,2809 1,6319 0,0776 1,4709 1,7929
146 1,3350 1,5751 0,0797 1,4098 1,7403
164 1,3863 1,7213 0,0745 1,5669 1,8758
66 1,5041 0,9249 0,1056 0,7060 1,1439
160 1,5476 1,6888 0,0756 1,5320 1,8456
215 2,2300 2,1358 0,0618 2,0075 2,2640
228 2,3514 2,2414 0,0593 2,1185 2,3644
222 2,3888 2,1927 0,0604 2,0673 2,3180
260 2,6391 2,5015 0,0546 2,3882 2,6147
325 3,0445 3,0297 0,0537 2,9184 3,1410
340 3,0910 3,1516 0,0552 3,0372 3,2660
430 3,4012 3,8829 0,0742 3,7290 4,0369
390 3,5115 3,5579 0,0640 3,4251 3,6907
373 3,6481 3,4197 0,0604 3,2944 3,5451
425 3,6889 3,8423 0,0728 3,6912 3,9934
450 3,7136 4,0455 0,0800 3,8795 4,2114
389 3,8351 3,5498 0,0638 3,4174 3,6821
422 3,9080 3,8179 0,0720 3,6686 3,9673
418 3,9759 3,7854 0,0710 3,6383 3,9326
435 4,0431 3,9236 0,0756 3,7667 4,0804
459 4,2794 4,1186 0,0827 3,9470 4,2902
470 4,3399 4,2080 0,0861 4,0294 4,3866

Pentru a afla intervalul de confiden al mediei populaiei de valori y
pentru x = Suu se calculeaz relaiile:

y' = u,S886 +u,uu81S Suu = 2,826S
170 Elemente de statistic aplicate n ecologie
II' = 2,826S -2,u74 _u,u66S _1 +
1
24
+
(300-297,458)
2
2546985-
(139)
2
24
_ =
= 2,229S
IS' = 2,826S +2,u74 _u,u66S _1 +
1
24
+
(300-297,458)
2
2546985-
(139)
2
24
_ =
= S,42SS .

Valorile obinute sunt modificate de transformarea iniial a
greutilor. Pentru a obine valorile n grame este necesar transformarea
invers (anexa 3) a valorilor obinute:

y = 16,8864 II = 9,29S6 IS = Su,676u .

Concluzia este c o viper de Suu cm poate avea o greutate ntre
9,S g i Su,7 g cu o probabilitate de u,9S sau n 9S% din cazuri.

0,5
1
1,5
2
2,5
3
3,5
4
4,5
0 100 200 300 400 500
y
'
=
l
n
(
y
)
x

Li
Ls
300 cm

10. ANALIZA FRECVENELOR I A DATELOR
NOMINALE

Numeroase cercetri ecologice presupun numrarea i clasificarea
lucrurilor folosind diferite scale nominale, cum ar fi speciile, culorile,
habitatele etc. Din aceast cauz tehnicile statistice care analizeaz
frecvenele sunt deosebit de utile. Metoda clasic de analiz a frecvenelor
este testul
2
. Statistica testului este comparat cu distribuia _
2
. Acesta
este o distribuie a varianei probei. Distribuia _
2
este asimetric fa de
variana populaional (o
2
). Partea stng a distribuiei ajunge la u, n timp
ce cea dreapt poate atinge, teoretic, infinitul. Cu ct numrul gradelor de
libertate crete, cu att distribuia devine mai simetric, iar n cazul probelor
cu mai mult de 100 de uniti de prob (n > 1uu) distribuia tinde s devin
normal.
mprirea frecvenelor la numrul total de observaii duce la
transformarea distribuiei frecvenelor ntr-o distribuie a probabilitilor.
Standardizarea axei orizontale prin nmulirea varianei cu numrul gradelor
de libertate i mprirea produsului la variana populaiei duce la obinerea
distribuiei _
2
.

Figura 10.1. Distribuia varianei probei pentru 1, 3 i 10 grade de libertate
f
s
2

1 gl
3 gl
10 gl
172 Elemente de statistic aplicate n ecologie

Figura 10.2. Distribuia
2
cu zona de respingere a ipotezei nule pentru o probabilitate
de 0,05

Testele _
2
pot fi pentru omogenitate, asociere, independen i de
concordan. Principiul acestor teste este acelai: frecvenele observate sunt
comparate cu cele calculate teoretic sau estimate. Dac ntre frecvenele
observate i cele estimate exist o diferen semnificativ, atunci statistica
_
2
va fi mai mare dect valoarea critic pentru gradele de libertate
respective, caz n care E
0
se respinge, iar E
1
se accept n consecin cu
p = 1 -o.
Distribuia _
2
este una asimetric. O diferen mare ntre frecvenele
observate i cele estimate va conduce la o valoare a _
2
dreapta a distribuiei. Dac ns se obine o valoare _
2
foarte mic plasat n
coada stng (redus) a distribuiei, aceasta arat c frecvenele observate
concord foarte bine cu cele teoretice. Dat fiind faptul c sunt anse reduse
s se obin valori foarte mici sau foarte mari, n practic interesul const
doar n a arta absena concordanei.
Dificultatea testului nu const att n calcularea statisticii acestuia,
ct n calcularea frecvenelor estimate (teoretice). Acestea se pot afla
pornind de la datele din prob sau pe baza unui model matematic.

p

2

9 gl
p=0,95
p=0,05
16,92
Analiza frecvenelor i a datelor nominale 173

10.1. TESTUL
2
DE CONCORDAN

Acesta verific dac distribuia frecvenelor observate n probe
concord sau nu ntr-o oarecare msur cu o distribuie teoretic, cum ar fi
Poisson, binomial sau normal, sau cu orice alt tip specificat de distribuie.
Testul de concordan verific ct de bine se potrivete un set de
frecvene observate aparinnd la dou sau mai multe categorii distincte cu o
anumit distribuie ateptat. Testul este neparametric i necesit doar
observaii nominale sau sub form de frecvene.

Testul se folosete dac datele ndeplinesc urmtoarele condiii:

1. Variabila trebuie s fie nominal; categoriile scalei nominale ale
cror frecvene sunt urmrite trebuie s nu se suprapun.
2. Observaiile sunt independente.
3. Frecvenele estimate trebuie s fie mai mari sau egale cu 5 sau,
dac exist mai multe categorii, 80% dintre acestea trebuie s aib
frecvenele estimate mai mari sau egale cu 5.

Dac a treia condiie nu este ndeplinit, categoriile cu frecvenele
estimate mai mici de S se reunesc ntr-o singur categorie pn cnd
frecvena estimat a acesteia egaleaz sau depete valoarea S. Aceasta
determin o reducere corespunztoare a gradelor de libertate.
Ipotezele testului sunt:

E
0
: frecvenele observate nu difer semnificativ de cele estimate;
E
1
: frecvenele observate difer semnificativ de cele estimate.

Statistica testului se calculeaz n funcie de frecvenele observate
(o) i cele estimate (c):

_
2
=
(o-c)
2
c
.

Dac _
2
_
(u,gI)
2
=> E
0
se respinge i se accept E
1
pentru o
probabilitate de 1 -o (1uu (1 -o)%).
174 Elemente de statistic aplicate n ecologie

gl = k -m-1
k numrul categoriilor (claselor de frecven)
m numrul parametrilor populaionali estimai.

Dac frecvenele teoretice se obin prin folosirea modelului Poisson,
atunci m = 1 deoarece se estimeaz media populaiei necesar calculului
probabilitii n aceast distribuie (seciunea 4.2), iar dac se folosete
modelul binomial sau binomial negativ, atunci m = 2 deoarece se estimeaz
p i k (seciunile 4.1 i, respectiv, 4.3).
Cnd exist doar dou categorii de distribuie, atunci vom avea 1
grad de libertate (gl = 1), iar statisticii testului i se aplic corecia Yates
pentru continuitate. Aceasta nltur posibilitatea obinerii unor valori prea
mari ale statisticii testului. Corecia const n scderea valorii u,S din
valoarea absolut a diferenei dintre frecvena observat i cea teoretic a
fiecrei componente a formulei lui _
2
. Astfel, formula devine:

_
2
=
(|o-c|-0,5)
2
c
.

Exemplul 10.1. ntr-o prob extras aleator de pe fundul unui bazin
acvatic au fost identificate 16 larve ale unei specii de chironomid. Larvele
au fost crescute pn la stadiul de adult, dup care s-a determinat sexul
indivizilor, rezultnd 12 masculi i 4 femele. Exist o diferen
semnificativ ntre raportul dintre sexe (sex ratio) observat i cel de 1:1?

Sexul este o variabil nominal ale crei categorii se exclud reciproc.
Observaiile sunt independente. Dac sex ratio ar fi egal cu 1, atunci
frecvenele estimate ale celor dou sexe ar trebui s fie egale, adic din 16
indivizi, 8 ar trebui s fie masculi, iar 8 s fie femele. Putem concluziona c
datele ndeplinesc condiiile de aplicare ale testului
2
de concordan.

Ipotezele n cazul exemplului sunt urmtoarele:

E
0
: sex ratio este egal cu 1, adic mosculi: cmclc = 1: 1;
E
1
: sex ratio este diferit de 1.

Analiza frecvenelor i a datelor nominale 175

Frecvene
observate (u)
Frecvene
estimate (e)
Masculi 12 8
Femele 4 8
Total 16 16

Cum sunt doar dou categorii de frecvene (dou valori ale
variabilei) nseamn c numrul gradelor de libertate va fi 1. Ca urmare,
trebuie aplicat formula cu corecia pentru continuitate.

_
2
=
(|12-8|-0,5)
2
8
+
(|4-8|-0,5)
2
8
= S,u62S

Valoarea critic _
(0,05,1)
2
= S,84 (anexa 2 sau 3). Deoarece statistica
testului este mai mic dect valoarea critic, nu se poate respinge ipoteza
nul pentru p = u,uS. Probabilitatea ca ipoteza nul s fie adevrat (anexa
3) este u,u8, adic mai mare dect pragul de confiden de u,uS.
Concluzia testului este c nu exist o deosebire semnificativ ntre
sex ratio observat i cel teoretic de 1:1.

Exemplul 10.2. Pornind de la datele i rezultatele din exemplul 4.6
s se verifice semnificaia concordanei dintre frecvenele estimate i cele
teoretice.

Era vorba de densitatea indivizilor unei specii de arpe din 1uu de
suprafee de prob. Indicele de dispersie indic o dispersie aleatoare. S-au
calculat frecvenele observate pe baza probabilitilor estimate conform
distribuiei Poisson.
Dac primele condiii de aplicare a testului _
2
de concordan sunt
ndeplinite, se observ c ultima nu este ndeplinit frecvenele estimate
pentru valorile 6, 7 i 8 sunt mai mici dect valoarea 5. Pentru a putea
continua testul se impune nsumarea frecvenelor, att observate, ct i
estimate, corespunztoare acestor valori. Ca urmare, frecvenele estimate i
cele teoretice se prezint astfel:

176 Elemente de statistic aplicate n ecologie

Statistica testului se poate afla calculnd valoarea raportului pentru
fiecare pereche de frecvene, dup care se nsumeaz.

_
2
=
(7-5,727)
2
5,727
+
(16-16,379)
2
16,379
+
(25-23,422)
2
23,422
+
(18-23,329)
2
23,329
+
+
(16-15,965)
2
15,965
+
(10-9,132)
2
9,132
+
(8-6,767)
2
6,767
= 1,S44

Numrul gradelor de libertate se reduce datorit nsumrii ultimelor
trei clase de frecven. Astfel, din numrul de clase redus se scade 1 (a fost
estimat media populaional prin media probei pentru calcularea funciei
distribuiei Poisson) i nc 1:

gl = 7 -1 -1 = S .

Valoarea critic n cazul acestui exemplu (anexa 2 sau 3) este
_
(0,05,5)
2
= 11,u7. Deoarece statistica testului este mai mic dect valoarea
critic, se accept ipoteza nul pentru p = u,9S. Probabilitatea ca ipoteza
Conform ipotezei nule nu exist o diferen semnificativ ntre
frecvenele observate i cele estimate conform distribuiei Poisson.
Cum distribuia Poisson descrie probabilitatea de apariie a unor
fenomene aleatoare, iar distribuia frecvenelor observate nu difer
semnificativ de aceast distribuie, se poate concluziona c distribuia
indivizilor din populaia cercetat este aleatoare, cu o probabilitate de u,9S.
x (u)
i
(e)
0 7 5,727
1 16 16,379
2 25 23,422
3 18 22,329
4 16 15,965
5 10 9,132
6 5 4,353
7 2 1,778
8 1 0,636
x u e
0 7 5,727
1 16 16,379
2 25 23,422
3 18 22,329
4 16 15,965
5 10 9,132
6+7+8 8 6,767
Analiza frecvenelor i a datelor nominale 177
n exemplul 4.6 spuneam c exist o asemnare evident ntre
frecvenele observate i cele estimate. Prin realizarea testului _
2
de
concordan s-a completat rezolvarea problemei, n sensul c se poate
specifica faptul c asemnarea sesizat anterior este semnificativ pentru un
anumit nivel de ncredere.

10.2. TESTUL
2
DE ASOCIERE

n analiza concordanei dintre frecvenele observate i cele calculate
teoretic, era urmrit o singur variabil a crei valori apreciate pe o scal
nominal reprezentau categorii de frecven. Exist ns situaii n care se
folosesc dou variabile. De exemplu, un individ poate fi clasificat n funcie
de sex i clas de vrst, specie i habitat etc. n astfel de cazuri, frecvenele
se distribuie pe dou sau mai multe rnduri, rezultnd aa-numitul tabel sau
matrice de contingen. Acestea permit investigarea asocierii dintre
variabile. Unul dintre cele mai frecvent utilizate teste care verific
semnificaia asocierii dintre variabilele apreciate pe o scal nominal este
testul
2
de asociere. Acesta reprezint echivalentul corelaiei pentru
variabilele nominale.

Condiii de aplicare:

1. Datele trebuie s fie sub form de frecvene.
2. Observaiile sunt independente (o unitate de prob poate ocupa o
singur poziie n matricea de contingen).
3. 8u% dintre frecvenele estimate trebuie s fie mai mari sau egale
cu S i nici o frecven estimat s nu fie u; deci, pentru o matrice
de contingen de 2 2, toate celulele trebuie s aib o valoare
calculat teoretic mai mare sau egal cu S.

Ipotezele testului sunt:

E
0
: nu exist asociere ntre variabile
E
1
: exist asociere ntre variabile.

178 Elemente de statistic aplicate n ecologie
Datele se aranjeaz ntr-un tabel cu dou intrri, numit i matrice de
contingen:

Variabila y (Coloan)
Total pe rnd (TR)
Valori y
1
(C
1
) y
2
(C
2
)
x
(Rnd)
x
1
(R
1
) o b IR
1
= o +b
x
2
(R
2
) c J IR
2
= c +J
Total pe coloan (TC)
IC
1
=
= o +c
IC
2
=
= b +J
Total general (T6)
o +b +c +J

Valorile teoretice se calculeaz pentru fiecare celul n parte. De
exemplu, valoarea estimat pentru prima celul este:

c
C
1
R
1
=
1R
1
1C
1
1u
.

La fel se procedeaz i pentru celelalte celule ale matricei de
contingen:

u e
o
(u+b)(u+c)
u+b+c+d

b
(u+b)(b+d)
u+b+c+d

c
(c+d)(u+c)
u+b+c+d

J
(c+d)(b+d)
u+b+c+d

Statistica testului se calculeaz conform formulei:

_
2
=
(o-c)
2
c
.

Analiza frecvenelor i a datelor nominale 179
Dac matricea de contingen are dou linii i dou coloane, atunci
se utilizeaz corecia Yates pentru continuitate, la fel ca n cazul testului _
2

de concordan.

_
2
=
(|o-c|-0,5)
2
c

Dac _
2
_
(u,(c-1)(-1))
2
=> E
0
se respinge i se accept E
1
pentru
o probabilitate de 1 -o.

Cnd exist mai multe categorii nominale ale celor dou variabile
analizate, atunci matricea de contingen poate avea mai mult de dou
rnduri i dou coloane. n acest caz, metoda de calcul a frecvenelor
estimate i a statisticii testului este aceeai cu cea folosit pentru o matrice
de contingen cu dou rnduri i dou coloane (r c = 2 2), cu excepia
faptului c n formula de calcul a statisticii testului nu se mai aplic corecia
Yates pentru continuitate.

Exemplul 10.3. Se crede ca femelele unei specii de arpe acvatic
dintr-un lac migreaz toamna n apropierea blilor adiacente pentru
depunerea pontei. Dac este aa, atunci femelele ar trebui sa migreze mai
intens dect masculii. Dac din 27 de femele 2S au migrat i 2 nu au migrat,
iar din S4 de masculi 4 au migrat, iar Su nu, exista o asociere semnificativ
ntre migraie i sex?

Datele sunt sub form de frecvene, iar erpii pot aparine doar la una
din cele dou categorii definite de valorile variabilei nominale sex. Deci
primele dou condiii de aplicare a testului sunt respectate de datele obinute
n urma analizei probelor.
Se alctuiete tabelul de contingen:

Variabila Migraia
Valori Migratori Nemigratori TR
Sex
Femel 25 2 27
Mascul 4 30 34
TC 29 32 T6=61
180 Elemente de statistic aplicate n ecologie

Se calculeaz valorile estimate:

Sex Migraia u e
Femel
Migratori 25 (2729)/61=12,8360
Nemigratori 2 (2732)/61=14,1639
Mascul
Migratori 4 (3429)/61=16,1639
Nemigratori 30 (3432)/61=17,8360

Frecvenele teoretice (e) sunt toate mai mari ca S, deci este
ndeplinit i condiia a treia a testului _
2
de asociere.
Ipotezele testului sunt:

E
0
: nu exist asociere semnificativ ntre migraie i sex
E
1
: exist o asociere semnificativ ntre migraie i sex.

Dat fiind c numrul gradelor de libertate este 1 ((r -1)(c -1) =
(2 -1)(2 -1)) se aplic formula cu corecia pentru continuitate.

_
2
=
(|25-12,8360|-0,5)
2
12,8360
+
(|2-14,1639|-0,5)
2
14,1639
+
(|4-16,1639|-0,5)
2
16,1639
+
+
(|30-17,8360|-0,5)
2
17,8360
= S6,2484

Se afl valoarea critic (anexa 2 sau 3): _
(0,05,1)
2
= S,841.

Statistica testului este mai mare dect valoarea critic i, n
consecin, ipoteza nul se respinge i se accept ipoteza alternativ pentru o
probabilitate p = u,uS (9S%). Probabilitatea ca ipoteza nul s fie
-9
.
Se poate trage concluzia c exist o asociere semnificativ ntre sex
i migraie n populaia de erpi de ap analizat.

Exemplul 10.4. ntr-un studiu s-a investigat preferina pentru habitat
a larvelor aparinnd la trei specii de insecte (A, B, C), prin prelevarea
aleatoare a pupelor din trei ape curgtoare cu grade diferite de eutrofizare
Analiza frecvenelor i a datelor nominale 181
(oligotrofic, mezotrofic i eutrofic). Exist o asociere semnificativ ntre
preferina pentru un anumit tip de habitat i apartenena specific?

Datele sunt sub form de frecvene, iar o pup poate aparine doar la
o singur specie i poate proveni doar dintr-o singur ap curgtoare. Deci
primele dou condiii ale testului _
2
de asociere sunt ndeplinite.
Se scrie matricea de contingen S S.

Variabila Habitat
Valori Oligotrofic Mezotrofic Eutrofic TR
Specia
A 10 12 35 57
B 7 26 11 44
C 28 13 9 50
TC 45 51 55 T6=151

Se calculeaz valorile estimate:

sp. Habitat u e
A
Oligotrofic 10 (4557)/151=16,9868
Mezotrofic 12 (5157)/151=19,2517
Eutrofic 35 (5557)/151=20,7614
B
Oligotrofic 7 (4544)/151=13,1126
Mezotrofic 26 (5144)/151=14,8609
Eutrofic 11 (5544)/151=16,0265
C
Oligotrofic 28 (4550)/151=14,9007
Mezotrofic 13 (5150)/151=16,8874
Eutrofic 9 (5550)/151=18,2119

Frecvenele teoretice (e) sunt toate mai mari ca S, deci este
ndeplinit i condiia a treia a testului _
2
de asociere.
Ipotezele testului sunt:

E
0
: nu exist asociere semnificativ ntre apartenena specific i
tipul de habitat
E
1
: exist o asociere semnificativ ntre apartenena specific i tipul
de habitat.
182 Elemente de statistic aplicate n ecologie
Numrul gradelor de libertate este 4 ((r -1)(c -1) = (S -1)(S -
1)). Astfel, se aplic formula statisticii testului fr corecia pentru
continuitate.

_
2
=
(10-16,9868)
2
16,9868
+
(12-19,2517)
2
19,2517
+
(35-20,7614)
2
20,7614
+
(7-13,1126)
2
13,1126
+
+
(26-14,8609)
2
14,8609
+
(11-16,0265)
2
16,0265
+
(28-14,9007)
2
14,9007
+
(13-16,8874)
2
16,8874
+
+
(9-18,2119)
2
18,2119
= 4S,21SS

Se afl valoarea critic (anexa 2 sau 3): _
(0,05,4)
2
= 9,488.

Valoarea statisticii testului este mai mare dect valoarea critic,
ipoteza nul se respinge i se accept ipoteza alternativ pentru o
probabilitate p = u,uS (9S%). Probabilitatea ca ipoteza nul s fie
-10
, deci foarte mic.
Se poate trage concluzia c exist o asociere semnificativ ntre
apartenena specific i gradul de eutrofizare al habitatelor.

Pentru a determina care dintre speciile analizate este asociat cu un
anumit grad de eutrofizare, trebuie comparate valorile observate cu cele
estimate (ateptate, dac nu ar fi existat nici o preferin pentru habitat):
pentru specia A, frecvena observat a fost mai mare dect cea estimat n
apele eutrofe; pentru specia B, frecvena observat a depit-o pe cea
estimat n apele mezotrofe; pentru specia C, frecvena observat a fost mai
mare dect cea estimat n apele oligotrofe.
Din acest exemplu se poate trage i o concluzie de ordin general:
unde frecvenele observate sunt mai mari dect cele estimate nseamn c
exist o asociere pozitiv ntre cele dou variabile i invers, unde frecvenele
estimate sunt mai mari dect cele observate nseamn c exist o asociere
negativ ntre variabile.

Analiza frecvenelor i a datelor nominale 183

10.3. TESTUL EXACT AL LUI FISHER

Este asemntor cu testul _
2
pentru asociere i se folosete pentru
testarea asocierii dintre dou variabile nominale. Diferena dintre cele dou
teste const n faptul c testul Fisher nu prevede a treia condiie de aplicare a
testul _
2
. Primele dou condiii (privind datele sub form de frecvene i
independena probelor) trebuie ndeplinite. Acest test este foarte util pentru
analiza probelor de dimensiuni mici. Un alt avantaj fa de testul _
2
se
refer la faptul c testul Fisher se poate aplica i n variant unilateral.
Pentru calcularea testului, datele trebuie ordonate ntr-o matrice de
contingen:

Valoarea
variabilei
x Total

prezent
(C
1
)
absent
(C
2
)
Rnd (TR)
y
prezent (R
1
) o b o +b
absent (R
2
) c J c +J
Total coloan (TC) o +c b +J
I0 =
= o +b +c +J

Ipotezele testului sunt:

Bilateral Unilateral
E
0
: nu exist
asociere ntre x i y.
E
0
: indivizii care prezint x nu au tendina s
prezinte y, iar cei care nu prezint x au tendina s
prezinte y.
E
1
: exist asociere
ntre x i y.
E
1
: indivizii care prezint x au tendina s
prezinte i y, iar cei care nu prezint x au tendina
s nu prezinte nici y.

Deosebirea ntre ipotezele bilaterale i cele unilaterale, n cazul
testului Fisher, este similar cu cea dintre aceleai ipoteze n situaia unei
analize a corelaiei: ipotezele bilaterale ale testului Fisher sunt analoage
184 Elemente de statistic aplicate n ecologie
ipotezelor privind nonexistena sau existena unei asocieri ntre dou
variabile, fr a preciza tipul corelaiei; ipotezele unilaterale ale testului
Fisher sunt similare ipotezelor care specific tipul corelaiei (pozitiv sau
negativ).
Se scriu apoi toate matricele posibile pentru aceleai totaluri
marginale, adic se modific frecvenele o, b, c, i J astfel nct IC
1
, IC
2
,
IR
1
, IR
2
i I0 s rmn constante. Astfel, rezult o serie de matrice n
care la un capt poziia o va avea o valoare minim, iar la cellalt va avea o
valoare maxim.
Se calculeaz disproporionalitatea pentru fiecare matrice obinut,
dup relaia:

J =
u
u+b
-
c
c+d
.

Se calculeaz probabilitatea (p) pentru fiecare matrice a crei
disproporii (J) este mai mare sau egal cu disproporia matricei iniiale,
conform relaiei

p =
1C
1
!1C
2
!1R
1
!1R
2
!
1u!u!b!c!d!
.

Suma probabilitilor acestor matrice reprezint probabilitatea ca E
0

s fie adevrat. Se respinge ipoteza nul dac suma probabilitilor este mai
mic dect pragul de semnificaie (u,uS).
Dac testul se aplic n varianta bilateral, atunci se nsumeaz
probabilitile date de toate matricele din ambele capete ale seriei cu
disproporionalitatea mai mare sau egal cu cea a matricei iniiale. Cnd se
formuleaz ipoteze unilaterale, atunci se nsumeaz doar probabilitile
matricelor dintr-o singur parte a seriei, ale cror disproporionalitate este
mai mare sau egal cu cea a matricei iniiale.

Exemplul 10.5. ntr-un experiment s-a urmrit dac juvenilii unei
specii de arpe tind s prezinte o reacie de fug la un stimul amenintor de
deasupra sau din lateral. Ca urmare, 7 erpi au fost stimulai de deasupra
capului, iar ali 7, din lateral i s-au nregistrat tentativele de scpare.

Analiza frecvenelor i a datelor nominale 185
n aceast situaie este vorba de dou probe independente, deoarece
un individ a fost supus unui singur tratament (a fost stimulat fie de deasupra,
fie din lateral), i de categorii care se exclud reciproc (au prezentat reacia
sau nu au prezentat-o). n aceste condiii, pentru a realiza testarea, datele
trebuie aranjate ntr-un tabel de contingen. Acesta poate fi alctuit astfel
nct s reflecte dac se urmrete o ipotez bilateral sau unilateral:

Tabel de contingen pentru varianta bilateral
Reacie prezent Reacie absent
Stimul de deasupra 6 1
Stimul din lateral 1 6

Tabel de contingen pentru varianta unilateral

Reacie de scpare
da Nu
Stimul de deasupra capului
da 6 1
nu 1 6

Dac se calculeaz frecvenele estimate conform testului _
2

de
asociere, se observ c toate acestea sunt mai mici dect S (frecvenele
estimate sunt egale cu S,S), deci condiia a treia a testului nu este
ndeplinit. Ca urmare, testul _
2
de asociere nu poate fi aplicat pentru acest
exemplu.

Ipotezele testului:

Bilateral Unilateral
E
0
: nu exist asociere ntre
stimulare i apariia reaciei.
E
0
: indivizii care au fost stimulai de
deasupra nu tind s prezinte reacia de
scpare.
E
1
: exist asociere ntre
stimulare i apariia reaciei.
E
1
: indivizii care au fost stimulai de
deasupra tind s manifeste o reacie de
scpare.

Indiferent de varianta n care se aplic testul, trebuie scris seria de
matrice. Cel mai simplu este ca la valoarea din poziia o s se adune cte o
unitate pn se ajunge la captul din dreapta al seriei, iar apoi din aceeai
186 Elemente de statistic aplicate n ecologie
valoare s se scad cte o unitate pn se obine captul din stnga al seriei.
n funcie de valoarea o i totalurile marginale se completeaz celelalte
poziii ale matricelor.

#1 #2 #3 #4
0 7 1 6 2 5 3 4
7 0 6 1 5 2 4 3
d = 1 d = , 71 J = u,42 J = u,14

#5 #6 #7 #8
4 3 5 2 6 1 7 0
3 4 2 5 1 6 0 7
J = u,14 J = u,42 d = , 71 d = 1

Matricele care au J mai mare sau egal cu J matricei iniiale (#7)
sunt matricele #1, #2 i #8. Deci pentru acestea se vor calcula
probabilitile:

p(#1) =
7!7!7!7!
14!0!7!7!0!
= u,uuu29
p(#2) =
7!7!7!7!
14!1!6!6!1!
= u,u1427
p(#8) =
7!7!7!7!
14!7!0!0!7!
= u,uuu29 .

Pentru a calcula probabilitatea ipotezei nule este nevoie i de
probabilitatea dat de matricea iniial:

p(#7) =
7!7!7!7!
14!6!1!1!7!
= u,uuu29 .

Dac testul se aplic n variant bilateral, atunci probabilitatea
ipotezei nule va fi dat de suma probabilitilor celor patru matrice:

p(E
0
) = p(#1) +p(#2) +p(#7) +p(#8)
p(E
0
) = u,uuu29 +u,u1427 +u,u1427 +u,uuu29 = u,u291 .

Analiza frecvenelor i a datelor nominale 187
Dac testul se aplic n variant unilateral, atunci probabilitatea
ipotezei nule va fi suma probabilitilor calculate pe baza matricelor #7 i
#8:

p(E
0
) = p(#7) +p(#8)
p(E
0
) = u,u1427 +u,uuu29 = u,u14S .

Indiferent de varianta aplicat, condiia testului este urmtoarea:

dac p(E
0
) u,uS => E
0
se respinge i se accept E
1
.

n cazul exemplului, ambele rezultate arat c ipotezele nule
corespunztoare celor dou variante au o probabilitate foarte mic (mai mic
de u,uS). Deci se poate accepta fie c exist o asociere semnificativ ntre
stimulare i reacia de scpare, fie c exist o asociere semnificativ ntre
stimularea de deasupra capului i apariia reaciei de scpare. Evident, al
doilea rezultat (varianta unilateral) este n cazul experimentului prezentat
mai valoros, deoarece ofer un plus de informaie.

10.4. TESTUL MCNEMAR

n anumite situaii nu se dorete ca observaiile s fie independente
(de exemplu, dac se investigheaz aciunea unui tratament asupra unor
animale). Astfel, pentru a elimina diferenele individuale, aceiai indivizi
vor fi investigai de dou ori nainte i dup tratament.
n astfel de cazuri se folosete testul McNemar pentru testarea
semnificaiei schimbrilor rspunsurilor organismelor sub influena unui
tratament. Acest test este echivalentul testului t pentru perechi de valori n
cazul variabilelor nominale.
Condiii de aplicare:

1. variabila trebuie s fie nominal;
2. observaiile trebuie s fie neindependente (fiecare individ trebuie
s fie investigat de dou ori).

188 Elemente de statistic aplicate n ecologie
Se alctuiete matricea de contingen:

Tratament Tratament 1
Rspuns Rspuns 1 Rspuns 2
Tratament 2
Rspuns 1 o b
Rspuns 2 c J

Ipotezele testului sunt urmtoarele:

E
0
: rspunsul nu se modific semnificativ sub aciunea tratamentului
E
1
: rspunsul se modific semnificativ sub aciunea tratamentului

Indivizii care i-au modificat comportamentul ocup poziiile b i c
(indivizii din b au dat rspunsul 2 la tratamentul 1 i rspunsul 1 la
tratamentul 2; indivizii din c au dat rspunsul 1 la tratamentul 1 i rspunsul
2 la tratamentul 2). Indivizii din poziiile o i d nu i-au modificat rspunsul
(indiferent de tratament ei au dat fie rspunsul 1, fie 2).
Statistica testului consider doar indivizii care i-au modificat
rspunsul n funcie de tratament:

_
2
=
(|c-b|-1)
2
c+b
.

Statistica testului de compar cu o valoare critic aleas (anexa 2 sau
3) n funcie de pragul de confiden i numrul gradelor de libertate.

Dac _
2
_
(u,(c-1)(-1))
2
=> E
0
se respinge i se accept E
1
pentru
p = 1 -o.

Dac
c+b
2
< S , se poate calcula probabilitatea E
0
cu ajutorul funciei
distribuiei binomiale. n acest caz parametrii distribuiei se calculeaz
astfel:

k = c +b p = u,S x = min(c, b)
p(x) =
k!
x!(k-x)!
p
x
q
(k-x)
.
Analiza frecvenelor i a datelor nominale 189

Dac p(x) < u,uS => E
0
se respinge i se accept E
1
pentru
p = 1 -u,uS = u,9S .

Exemplul 10.6. La unele specii de amfibieni anuri, la care
dimorfismul sexual nu este evident, din repertoriul masculilor fac parte
printre altele i sunetele de eliberare. Acestea sunt emise de un mascul
atunci cnd este abordat de un altul (care l confund cu o femel) pentru a
realiza mperecherea (amplexus sau mbriare). Astfel, masculul abordat
semnalizeaz sonor c i el este tot mascul. n acest sens, ntr-un studiu
efectuat pe S1 de masculi de Pelophylax (Rana) lessonae, s-a aplicat un
stimul tactil n zona axilar (zona n care masculul prinde femela n
amplexus) i apoi un altul n zona spatelui. Rezultatele au fost urmtoarele:
2S au reacionat prin emiterea sunetului de eliberare doar n urma stimulrii
axilare, 2 au emis sunetul cnd au fost stimulai doar dorsal, S au emis
sunetul n urma ambelor stimulri i 1 nu a reacionat la niciunul dintre
stimuli. Exist o modificare semnificativ a comportamentului n funcie de
zona n care este aplicat stimulul?

n cazul acestui experiment, nu se poate aplica testul _
2
de asociere
i nici testul Fisher, deoarece aplicarea ambelor teste este condiionat de
existena unor observaii independente, iar n acest experiment acelai
individ a fost supus ambelor tratamente: o dat a fost stimulat axilar, iar a
doua oar, dorsal. Deci pentru testarea semnificaiei asocierii dintre
comportament i zona stimulat trebuie aplicat testul McNemar.

Matricea de contingen n acest caz este urmtoarea:

Zona stimulat Axilar
Sunet de eliberare Prezent Absent
Dorsal
Prezent S 2
Absent 2S 1

Ipotezele testului sunt:

190 Elemente de statistic aplicate n ecologie
E
0
: nu exist o schimbare semnificativ a comportamentului n
funcie de zona stimulat.
E
1
: exist o schimbare semnificativ a comportamentului n funcie
de zona stimulat.

n matricea de contingen, masculii care i-au schimbat
comportamentul n funcie de zona stimulat sunt cei din poziiile b (2 au
reacionat la stimulul dorsal i nu au reacionat la cel axilar) i c (2S au
reacionat la stimulul axilar i nu au reacionat la cel dorsal). Cei din
poziiile o i J nu i-au schimbat comportamentul (S au reacionat la ambele
stimulri i, respectiv, 1 nu a reacionat la nici un stimul).

Pe baza acestor date se calculeaz statistica _
2
a testului McNemar:

_
2
=
(|25-2|-1)
2
25+2
= 17,926 .

Se afl valoarea critic (anexa 2 sau 3) pentru o = u,uS i 1 grad de
libertate (tabelul are 2 rnduri i 2 coloane, deci (2 -1)(2 -1) = 1).

_
(0,05,1)
2
= S,841 .

Valoarea statisticii testului este mai mare dect valoarea critic, deci
se respinge ipoteza nul i se accept ipoteza alternativ. Probabilitatea ca
ipoteza nul s fie adevrat (anexa 3) este foarte mic (2,S 1u
-5
).
Concluzia testului este c exist o schimbare semnificativ a
comportamentului ce const n emiterea sunetului de eliberare n funcie de
zona stimulat la masculii speciei investigate.

S presupunem c rezultatul experimentului mai sus menionat se
prezint astfel:

Zona stimulat Axilar
Sunet de eliberare Prezent Absent
Dorsal
Prezent S u
Absent 9 1
Analiza frecvenelor i a datelor nominale 191

n acest caz, media dintre b i c este 4,S (o valoare mai mic dect
S) i, ca urmare, statistica testului nu mai este aproximat de distribuia
2
.
n aceast situaie se folosete un test exact bazat pe distribuia binomial,
cu p = q = u,S i k = c +b.

Parametrii necesari calculrii probabilitii sunt: x = u; p = q =
u,S; k = 9 +u = 9 .

p(u) =
9!
0!(9-0)!
u,S
0
u,S
(9-0)
= u,uu19

Valoarea obinut este mai mic dect u,uS sau probabilitatea
ipotezei nule este u,uu19, deci putem accepta ipoteza alternativ conform
creia exist o schimbare semnificativ a comportamentului n funcie de
locul unde s-a aplicat stimulul.

BIBLIOGRAFIE

Andrei T., Stancu S. (1995): Statistica teorie i aplicaie. Editura All.
Armitage P., Colton T. (2005): Encyclopedia of Biostatistics, 2nd edition.
John Wiley and Sons, Ltd.
Bailey T.J.N. (1981): Statistical Methods in Biology, 2nd edition.
Cambridge University Press.
Bart J., Fligner M.A., Notz W.I. (2004): Sampling and statistical methods
for behavioral ecologists. Cambridre University Press.
Bennett P.D., Humphries A.D. (1977): Introduction to Field Biology.
Edward Arnold (Publishers) Ltd.
Bishop O.N. (1971): The Principles of Modern Biology Statistics for
Biology, 2nd edition. Longman.
Cann A.J. (2002): Maths from Scratch for Biologists. John Wiley & Sons,
Ltd.
Ceapoiu M. (1968): Metode statistice aplicate n experienele agricole i
biologice. Editura Agro-Silvic, Bucureti.
Cox W.G. (1996): Laboratory Manual of General Ecology, 7th edition.
Wm. C. Brown Publishers.
Dragomirescu L. (1998): Biostatistic pentru nceptori. Editura
Constelaii, Bucureti.
Dragomirescu L. (1999): Lucrri practice de biostatistic. Editura Ars
Docendi, Bucureti.
Dytham C. (2003): Choosing and Using Statistics: A Biologists Guide, 2nd
edition. Blackwell Publishing.
Everitt B.S. (2002): The Cambridge Dictionary of Statistics, 2nd edition.
Cambridge University Press.
Forthofer R.N., Lee E.S., Hernandez M. (2007): Biostatistics: A Guide to
Design, Analysis, and Discovery. Elsevier Inc.
Fowler J., Cohen L., Javris P. (2000): Practical Statistics for Field Biology,
2nd edition. John Wiley and Sons, Ltd.
Glantz S.A. (2005): Primer of Biostatistics, 6th edition. McGraw-Hill.
Glaser A.N. (2001): High-Yeld
TM
Biostatistics. Lippincott Williams &
Wilkins.
Bibliografie 193
Hampton E.R. (1994): Introductory Biological Statistics. Wm. C. Brown
Publishers.
Hrdle W., Mori Y., Vieu P. (2007): Statistical Methods for Biostatistics
and Related Fields. Springer-Verlag Berlin Heidelberg.
Iosifescu M., Moineagu C., Trebici V., Ursianu E. (1985): Mica
enciclopedie de statistic. Editura tiinific i Enciclopedic,
Bucureti.
Le C.T. (2003): Introductory Biostatistics. John Wiley and Sons, Ltd.
Ludwig J.A., Reynolds J.F. (1988): Statistical Ecology: A primer on
Methods and Computing. John Wiley and Sons, Ltd.
Manly B.F.J., McDonald L.L., Thomas D.L., McDonald T.L., Erikson W.P.
(2004): Resource Selection by Animals: Statistical Design and
Analysis for Field Studies, 2nd edition. Kluwer Academic
Publishers.
Michelson S., Schofield S. (2002): The Biostatistics Cookbook: The most
user-friendly guide for the bio/medical scientist. Kluwer Academic
Publishers.
Morisita M. (1962): I

-Index, a measure of dispersion of individuals. Res.

Popul. Ecol., 4: 1-7.
Neacu P. (1987): Lucrri practice de ecologie. Bucureti.
Neacu P., Apostolache-Stoicescu Z. (1982): Dicionar de ecologie. Editura
tiinific i Enciclopedic, Bucureti.
Norman G.R., Streiner D.L. (1998): Biostatistics: The Bare Essentials. B.C.
Decker Inc.
Prvu C. (1999): Ecologie general. Editura Tehnic, Bucureti.
Petrie A., Sabin C. (2000): Medical Statistics at a Glance. Blackwell
Science Ltd.
Postelnicu V., Coatu S. (1980): Mica enciclopedie matematic (traducere
dup Kleine Enzyklopadie der Mathematik ed. VI-a, 1971 i
Mathematics at a glance, 1975). Editura Tehnic, Bucureti.
Simionescu V. (1983): Lucrri practice de ecologie. Editura Universitii
Al.I. Cuza Iai.
Slingsby D., Cook C. (1992): Practical Ecology. Macmillan Distribution
Ltd.
Smith R.L. (1996): Ecology and Field Biology, 5th edition. Harper Collins
College Publishers.
194 Elemente de statistic aplicate n ecologie
Snedecor W.G. (1968): Metode statistice aplicate n cercetrile de
agricultur i biologie (traducere din limba englez). Bucureti.
Southwood T.R.E. (1966): Ecological Methods with Particular Reference to
the Study of Insect Populations. London, Methuen and co. LTD.
Stan Gh. (1994): Metode statistice cu aplicaii n cercetrile entomologice
(IV). Bul. Inf. Soc. Lepid. Rom., 5 (1): 13-25.
Stan Gh., 1994, Metode statistice cu aplicaii n cercetrile entomologice
(V). Bul. Inf. Soc. Lepid. Rom., 5 (2): 113-126.
Stan Gh. (1994): Metode statistice cu aplicaii n cercetrile entomologice
(VI). Bul. Inf. Soc. Lepid. Rom., 5 (3-4): 257-280.
Stan Gh. (1995): Metode statistice cu aplicaii n cercetrile entomologice
(VII). Bul. Inf. Soc. Lepid. Rom., 6 (1-2): 67-96.
Stiling, P.D. (2001): Ecology Theories and Applications, 4th edition.
Prentice Hall.
Varvara M. (2000): Curs de Ecologie, vol. 1. Editura Universitii Al.I.
Cuza Iai.
Varvara M., Zamfirescu .R., Neacu V. (2001): Lucrri practice de
ecologie manual. Editura Universitii Al.I. Cuza Iai.
Zamfirescu O., Zamfirescu .R. (2007): Aspects Regarding the Vegetation
From the Floristic Reserve The Secular Hayfields From Valea Lui
David Iai, Romnia. Journal of Ecology and Safety, International
Scientific Publication, 1:32-39.
Zamfirescu .R. (2002): The Experimental Induction of the Release Calls of
Some Anuran Species (Amphibia, Anura). In: Tomescu, N., Popa,
V. (eds.), In Memoriam Prof. Dr. Doc. Vasile Ghe. Radu
Coresponding Member of Romanian Academy of Sciences. Cluj
University Press, Cluj-Napoca, pp. 169-172.
Zamfirescu .R., Zamfirescu O., Popescu I.E., Ion C., Strugariu A. (2008):
Vipera de step (Vipera ursinii moldavica) i habitatele sale din
Moldova (Romania). Editura Universitii Al.I. Cuza Iai.

ANEXA 1: CHEIE DIHOTOMIC PENTRU
DETERMINAREA TIPULUI DE ANALIZ STATISTIC

1. Aprecierea datelor:
a. datele sunt apreciate pe o scal ordinal, de interval, de raport
2
b. datele sunt apreciate pe o scal nominal i/sau sub form de
frecvene 15

2. Numrul variabilelor analizate:
a. o singur variabil (ex: lungimea, greutatea, numr de
indivizi) 3
b. dou variabile (ex: lungimea i greutatea) 13

3. Numrul probelor analizate:
a. o singur prob 4
b. mai multe probe 5

4. Scopul analizei:
a. descrierea tendinei centrale i a variabilitii probei
Statistica descriptiv.
b. compararea mediei cu o valoare control Testul Student
(t) pentru o prob.

5. Numrul probelor:
a. 2 probe 6 (Teste pentru 2 probe) 6
b. 3 sau mai multe probe 9 (ANOVA) 9

6. Independena observaiilor:
a. observaii independente (probele provin din populaii
diferite) 7
b. observaii neindependente (probele provin din aceeai
populaie sau sunt obinute prin efectuarea unor observaii
repetate asupra acelorai uniti de prob) 8
196 Elemente de statistic aplicate n ecologie
7. Distribuia valorilor i scala de apreciere a variabilei:
a. distribuie aproximativ normal, scal de interval sau de
raport Testul Student (t) pentru observaii
independente.
b. distribuie diferit de cea normal, scal de interval, de raport
sau ordinal Testul Mann-Whitney (U).

8. Distribuia valorilor i scala de apreciere a variabilei:
a. distribuie aproximativ normal, scal de interval sau de
raport Testul Student (t) pentru observaii perechi.
b. distribuie diferit de cea normal, scal de interval, de raport
sau ordinal Testul Wilcoxon (W) pentru observaii
perechi.

9. Numrul factorilor (tratamente) care influeneaz probele:
a. 1 singur factor (tratament) 10
b. 2 factori (tratamente) 11

10. Distribuia valorilor i scala de apreciere a variabilei:
a. distribuie aproximativ normal, scal de interval sau de
raport, variana intern omogen ANOVA unifactorial.
b. distribuie diferit de cea normal, scal de interval, de raport
sau ordinal, varian intern heterogen ANOVA
unifactorial neparametric Kruskal-Wallis.

11. Numrul de observaii n celul, interaciunea dintre factori:
a. o singur observaie n celul, nu exist interaciune 12
b. mai multe observaii n celul, exist interaciune
ANOVA bifactorial cu replicare.

12. Distribuia valorilor i scala de apreciere a variabilei:
a. distribuie aproximativ normal, scal de interval sau de
raport, varian intern omogen ANOVA bifactorial
fr replicare.
b. distribuie diferit de cea normal, scal de interval, de raport
sau ordinal, varian intern heterogen ANOVA
bifactorial neparametric Friedman.
ANEXA 1: Cheie dihotomic pentru determinarea tipului de analiz statistic 197
13. Relaia dintre variabile, prelevarea probei:
a. asociere liniar, proba este prelevat aleator 14 (Analiza
Corelaiei)
b. relaie liniar cauz-efect, proba este prelevat n funcie de
valorile variabilei independente Analiza Regresiei.

14. Distribuia valorilor i scala de apreciere a variabilei:
a. distribuie aproximativ normal, scal de interval sau de
raport Corelaia parametric (Coeficientul de corelaie
Pearson).
b. distribuie diferit de cea normal, scal de interval, de raport
sau ordinal Corelaia neparametric (Coeficientul de
corelaie Spearman).

15. Scopul analizei:
a. concordana dintre distribuia frecvenelor observate i cea a
frecvenelor estimate conform unei distribuii teoretice,
cunoscute Testul Chi-Ptrat de concordan.
b. asocierea dintre 2 variabile apreciate pe o scal nominal sau
sub form de frecvene 16

16. Independena observaiilor:
a. observaii independente (fiecare unitate de prob este
investigat o singur data) 17
b. observaii neindependente (sunt obinute prin efectuarea unor
investigaii repetate asupra acelorai uniti de prob)
Testul McNemar pentru semnificaia schimbrii.

17. Magnitudinea frecvenelor estimate:
a. frecvenele estimate mai mari ca 0 i cel mult 20% dintre ele
sunt mai mici ca 5 Testul Chi-Ptrat de Asociere.
b. exist frecvene estimate egale cu 0 i mai mult de 20% din
frecvenele estimate sunt mai mici ca 5 Testul exact al lui
Fisher.

ANEXA 2: TABELE CU VALORI CRITICE

Scorul z i probabilitile corespunztoare n distribuia normal standard
z
A doua zecimal
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998

ANEXA 2: Tabele cu valori critice 199

Valorile critice ale distribuiei t (Student)
libertate
(bilateral)
0,05 0,1
(unilateral)
0,025 0,05
1 12,706 6,314
2 4,303 2,920
3 3,182 2,353
4 2,776 2,132
5 2,571 2,015
6 2,447 1,943
7 2,365 1,895
8 2,306 1,861
9 2,262 1,833
10 2,228 1,812
11 2,201 1,796
12 2,179 1,782
13 2,160 1,771
14 2,145 1,761
15 2,131 1,753
16 2,120 1,746
17 2,110 1,740
18 2,101 1,734
19 2,093 1,729
20 2,086 1,725
21 2,080 1,721
22 2,074 1,717
23 2,069 1,714
24 2,064 1,711
25 2,060 1,708
26 2,056 1,706
27 2,052 1,703
28 2,048 1,701
29 2,045 1,699
30 2,042 1,697
40 2,021 1,684
60 2,000 1,671
100 1,984 1,660
120 1,980 1,658
1,960 1,645

200 Elemente de statistic aplicate n ecologie

Valorile critice ale statisticii U pentru testul Mann-Whitney pentru
u = , 5 (bilateral), u = , 25 (unilateral)
n
1

n
2

1

2

3

4

5

6

7

8

9

1
0

1
1

1
2

1
3

1
4

1
5

1
6

1
7

1
8

1
9

2
0

1

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

2

-

-

-

-

-

-

-

0

0

0

0

1

1

1

1

1

2

2

2

2

3

-

-

-

-

0

1

1

2

2

3

3

4

4

5

5

6

6

7

7

8

4

-

-

-

0

1

2

3

4

4

5

6

7

8

9

1
0

1
1

1
1

1
2

1
3

1
3

5

-

-

0

1

2

3

5

6

7

8

9

1
1

1
2

1
3

1
4

1
5

1
7

1
8

1
9

2
0

6

-

-

1

2

3

5

6

8

1
0

1
1

1
3

1
4

1
6

1
7

1
9

2
1

2
2

2
4

2
5

2
7

7

-

-

1

3

5

6

8

1
0

1
2

1
4

1
6

1
8

2
0

2
2

2
4

2
6

2
8

3
0

3
2

3
4

8

-

0

2

4

6

8

1
0

1
3

1
5

1
7

1
9

2
2

2
4

2
6

2
9

3
1

3
4

3
6

3
8

4
1

9

-

0

2

4

7

1
0

1
2

1
5

1
7

2
1

2
3

2
6

2
8

3
1

3
4

3
7

3
9

4
2

4
5

4
8

1
0

-

0

3

5

8

1
1

1
4

1
7

2
0

2
3

2
6

2
9

3
3

3
6

3
9

4
2

4
5

4
8

5
2

5
5

1
1

-

0

3

6

9

1
3

1
6

1
9

2
3

2
6

3
0

3
3

3
7

4
0

4
4

4
7

5
1

5
5

5
8

6
2

1
2

-

1

4

7

1
1

1
4

1
8

2
2

2
6

2
9

3
3

3
7

4
1

4
5

4
9

5
3

5
7

6
1

6
5

6
9

1
3

-

1

4

8

1
2

1
6

2
0

2
4

2
8

3
3

3
7

4
1

4
5

5
0

5
4

5
9

6
3

6
7

7
2

7
6

1
4

-

1

5

9

1
3

1
7

2
2

2
6

3
1

3
6

4
0

4
5

5
0

5
5

5
9

6
4

6
7

7
4

7
8

8
3

1
5

-

1

5

1
0

1
4

1
9

2
4

2
9

3
4

3
9

4
4

4
9

5
4

5
9

6
4

7
0

7
5

8
0

8
5

9
0

1
6

-

1

6

1
1

1
5

2
1

2
6

3
1

3
7

4
2

4
7

5
3

5
9

6
4

7
0

7
5

8
1

8
6

9
2

9
8

1
7

-

2

6

1
1

1
7

2
2

2
8

3
4

3
9

4
5

5
1

5
7

6
3

6
7

7
5

8
1

8
7

9
3

9
9

1
0
5

1
8

-

2

7

1
2

1
8

2
4

3
0

3
6

4
2

4
8

5
5

6
1

6
7

7
4

8
0

8
6

9
3

9
9

1
0
6

1
1
2

1
9

-

2

7

1
3

1
9

2
5

3
2

3
8

4
5

5
2

5
8

6
5

7
2

7
8

8
5

9
2

9
9

1
0
6

1
1
3

1
1
9

2
0

-

2

8

1
4

2
0

2
7

3
4

4
1

4
8

5
5

6
2

6
9

7
6

8
3

9
0

9
8

1
0
5

1
1
2

1
1
9

1
2
7

ANEXA 2: Tabele cu valori critice 201

Valorile critice ale statisticii T a testului Wilcoxon
n Bilateral =0,05 Unilateral =0,05
5 - 0
6 - 2
7 2 3
8 3 5
9 5 8
10 8 10
11 10 13
12 13 17
13 17 21
14 21 25
15 25 30
16 29 35
17 34 41
18 40 47
19 46 53
20 52 60
21 58 67
22 65 75
23 73 83
24 81 91
25 89 100
26 98 110
27 107 119
28 116 130
29 126 140
30 137 151
35 195 213
40 264 286
45 343 371
50 434 466
60 648 690
70 907 960
80 1211 1276
90 1560 1638
100 1955 2045

202 Elemente de statistic aplicate n ecologie
Valorile critice pentru testul F
max
(Hatley) pentru u = , 5
n -1
k
2 3 4 5 6 7 8 9 10 11 12
2 39,0 87,5 142 202 266 333 403 475 550 626 704
3 15,4 27,8 39,2 50,7 62,0 72,9 83,5 93,9 104 114 124
4 9,6 15,5 20,6 25,2 29,5 33,6 37,5 41,1 44,6 48,0 51,4
5 7,15 10,8 13,7 16,3 18,7 20,8 22,9 24,7 26,5 28,2 29,9
6 5,82 8,38 10,4 12,1 13,7 15,0 16,3 17,5 18,6 19,7 20,7
7 4,99 6,94 8,44 9,70 10,8 11,8 12,7 13,5 14,3 15,1 15,8
8 4,43 6,00 7,18 8,12 9,03 9,78 10,5 11,1 11,7 12,2 12,7
9 4,03 5,34 6,31 7,11 7,80 8,41 8,95 9,45 9,91 10,3 10,7
10 3,72 4,85 5,67 6,34 6,92 7,42 7,87 8,28 8,66 9,01 9,34
12 3,28 4,16 4,79 5,30 5,72 6,09 6,42 6,72 7,00 7,25 7,48
15 2,86 3,54 4,01 4,37 4,68 4,95 5,19 5,40 5,59 5,77 5,93
20 2,46 2,95 3,29 3,54 3,76 3,94 4,10 4,24 4,37 4,49 4,59
30 2,07 2,40 2,61 2,78 2,91 3,02 3,12 3,21 3,29 3,36 3,39
60 1,67 1,85 1,96 2,04 2,11 2,17 2,22 2,26 2,30 2,33 2,36
1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00

Valorile critice q pentru testul Tukey (=0,05).
n 1
k
2 3 4 5 6 7 8 9 10
1 17,97 26,98 32,82 37,08 40,41 43,12 45,40 47,36 49,07
2 6,08 8,33 9,80 10,88 11,74 12,44 13,03 13,54 13,99
3 4,50 5,91 6,82 7,50 8,04 8,48 8,85 9,18 9,46
4 3,93 5,04 5,76 6,29 6,71 7,05 7,35 7,60 7,83
5 3,64 4,60 5,22 5,67 6,03 6,33 6,58 6,80 6,99
6 3,46 4,34 4,90 5,30 5,63 5,90 6,12 6,32 6,49
7 3,34 4,16 4,68 5,06 5,36 5,61 5,82 6,00 6,16
8 3,26 4,04 4,53 4,89 5,17 5,40 5,60 5,77 5,92
9 3,20 3,95 4,41 4,76 5,02 5,24 5,43 5,59 5,74
10 3,15 3,88 4,33 4,65 4,91 5,12 5,30 5,46 5,60
11 3,11 3,82 4,26 4,57 4,82 5,03 5,20 5,35 5,49
12 3,08 3,77 4,20 4,51 4,75 4,95 5,12 5,27 5,39
13 3,06 3,73 4,15 4,45 4,69 4,88 5,05 5,19 5,32
14 3,03 3,70 4,11 4,41 4,64 4,83 4,99 5,13 5,25
15 3,01 3,67 4,08 4,37 4,59 4,78 4,94 5,08 5,20
16 3,00 3,65 4,05 4,33 4,56 4,74 4,90 5,03 5,15
17 2,98 3,63 4,02 4,30 4,52 4,70 4,86 4,99 5,11
18 2,97 3,61 4,00 4,28 4,49 4,67 4,82 4,96 5,07
19 2,96 3,59 3,98 4,25 4,47 4,65 4,79 4,92 5,04
20 2,95 3,58 3,96 4,23 4,45 4,62 4,77 4,90 5,01
24 2,92 3,53 3,90 4,17 4,37 4,54 4,68 4,81 4,92
30 2,89 3,49 3,85 4,10 4,30 4,46 4,60 4,72 4,82
40 2,86 3,44 3,79 4,04 4,23 4,39 4,52 4,63 4,73
60 2,83 3,40 3,74 3,98 4,16 4,31 4,44 4,55 4,65
120 2,80 3,36 3,68 3,92 4,10 4,24 4,36 4,47 4,56
ANEXA 2: Tabele cu valori critice 203

Valorile critice ale distribuiei F pentru =0,05.
gl
int
gl
ext

1 2 3 4 5 6 7 8 9 10
2 18,5 19,0 19,2 19,3 19,4 19,4 19,4 19,4 19,4 19,4
3 10,1 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06
7 5,59 4,74 4,35 4,12 3,97 3,87 3,77 3,73 3,68 3,64
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99
120 3,92 3,07 2,68 2,45 2,29 2,17 2,09 2,02 1,96 1,91

204 Elemente de statistic aplicate n ecologie

Valorile critice ale distribuiei
2

libertate

0,99 0,95 0,90 0,10 0,05 0,01 0,001
1 0,000157 0,00393 0,0158 2,706 3,841 6,635 10,828
2 0,0201 0,103 0,211 4,605 5,991 9,210 13,816
3 0,115 0,352 0,584 6,251 7,815 11,345 16,266
4 0,297 0,711 1,064 7,779 9,488 13,277 18,467
5 0,554 1,145 1,610 9,236 11,070 15,086 20,515
6 0,872 1,635 2,204 10,645 12,592 16,812 22,458
7 1,239 2,167 2,833 12,017 14,067 18,475 24,322
8 1,646 2,733 3,490 13,362 15,507 20,090 26,124
9 2,088 3,325 4,168 14,684 16,919 21,666 27,877
10 2,558 3,940 4,865 15,987 18,307 23,209 29,588
11 3,053 4,575 5,578 17,275 19,675 24,725 31,264
12 3,571 5,226 6,304 18,549 21,026 26,217 32,909
13 4,107 5,892 7,042 19,812 22,362 27,688 34,528
14 4,660 6,571 7,790 21,064 23,685 29,141 36,123
15 5,229 7,261 8,547 22,307 24,996 30,578 37,697
16 5,812 7,962 9,312 23,542 26,296 32,000 39,252
17 6,408 8,672 10,085 24,769 27,587 33,409 40,790
18 7,015 9,390 10,865 25,989 28,869 34,805 42,312
19 7,633 10,117 11,651 27,204 30,144 36,191 43,820
20 8,260 10,851 12,443 28,412 31,410 37,566 45,315
21 8,897 11,591 13,240 29,615 32,671 38,932 46,797
22 9,542 12,338 14,041 30,813 33,924 40,289 48,268
23 10,196 13,091 14,848 32,007 35,172 41,638 49,728
24 10,856 13,848 15,659 33,196 36,415 42,980 51,179
25 11,524 14,611 16,473 34,382 37,652 44,314 52,620
26 12,198 15,379 17,292 35,563 38,885 45,642 54,052
27 12,879 16,151 18,114 36,741 40,113 46,963 55,476
28 13,565 16,928 18,939 37,916 41,337 48,278 56,892
29 14,256 17,708 19,768 39,087 42,557 49,588 58,301
30 14,953 18,493 20,599 40,256 43,773 50,892 59,703

ANEXA 3: FUNCII MICROSOFT OFFICE EXCEL

n general, n acest program se poate realiza orice calcul prin tastarea
=, urmat de numerele sau referinele csuelor (liter coloan_numr rnd)
ce conin valorile de interes, ntre care se introduc semnele de operaie ale
formulei (+, -, *, /, sum, sqrt, power, abs, round, log pentru detalii
consultai meniu-ul Help al programului).

Modulul Data Analysis exist n meniu Tools n versiunea 97-
2003 sau Data n versiunea 2007. Dac nu apare n meniu, modulul se
poate activa astfel: pentru versiunea 97-2003 se alege Tools > Add-Ins;
n versiunea 2007 se alege Office Button > Excel Options > Add-Ins.

FUNCII SPECIALE N ORDINEA SECIUNILOR DIN CARTE:

2.1. SCALE DE MSURARE I TIPURI DE VARIABILE

=RANK(nr, ref, 1)+(COUNT(ref) + 1 RANK(nr, ref, 0)
RANK(nr, ref, 1)/2
Returneaz rangul unei valori (nr) dintr-un set de date (ref).

2.2. REPREZENTAREA DATELOR
=LOG10(nr)
Returneaz valoarea logaritmului zecimal al unui numr (nr)
=MAX(ref)
Returneaz valoarea maxim a unui set de date (ref).
=MIN(ref)
Returneaz valoarea minim a unui set de date (ref).
=FREQUENCY(ref 1, ref 2)
Returneaz frecvena cumulat a valorilor unui set de date (ref 1)
cuprinse ntre valoarea minim i limita superioar a unei clase de
frecven (ref 2).

206 Elemente de statistic aplicate n ecologie
3.1. TENDINA CENTRAL
=MODE(ref)
Returneaz valoarea modului unui set de date (ref).
=MEDIAN(ref)
Returneaz valoarea medianei unui set de date (ref).
=AVERAGE(ref)

3.2. VARIABILITATEA
Returneaz valoarea mediei aritmetice a unui set de date (ref).
=MAX(ref)
Returneaz valoarea maxim a unui set de date (ref).
=MIN(ref)
Returneaz valoarea minim a unui set de date (ref).
=SUMSQ(ref)
Returneaz suma ptratelor valorilor dintr-un set de date (ref).
=STDEV(ref)
Returneaz valoarea deviaiei standard calculat ca radical din suma
ptratelor mprit la numrul gradelor de libertate (n 1), a unui set
de date (ref).
=STDEVP(ref)
Returneaz valoarea deviaiei standard a populaiei calculat ca
radical din suma ptratelor mprit la numrul valorilor (n), a unui
set de date (ref).
=VAR(ref)
Returneaz valoarea varianei calculat ca suma ptratelor mprit
la numrul gradelor de libertate (n 1), a unui set de date (ref).
=VARA(ref)
Returneaz valoarea varianei populaiei calculat ca suma ptratelor
mprit la numrul valorilor (n), a unui set de date (ref).

Descrierea statistic a unei probe mai poate fi obinut prin apelarea
meniului DATA > DATA ANALYSIS > DESCRIPTIVE
STATISTICS i completarea cmpurilor din fereastra de dialog
urmat de bifarea Summary statistics.

ANEXA 3: Funcii Microsoft Office Excel 207
4. DISTRIBUII PROBABILISTICE
=BINOMDIST(x, k, p, cumulativ)
Returneaz probabilitatea binomial asociat numrului rezultatelor
de interes (x), n funcie de numrul total de ncercri (k), i
probabilitatea obinerii unui anumit rezultat (p), exprimat
necumulat (cumulative = false).
=POISSONDIST(x, x

, cumulativ)
Returneaz probabilitatea Poisson asociat numrului rezultatelor de
interes (x), n funcie de valoarea medie (x ), exprimat necumulat
(cumulative = false).
=NORMALIZE(x, x

, s)
Returneaz valoarea z a unei anumite valori a unei variabile (x) n
funcie de media valorilor (x ) i de deviaia standard a acesteia (s).

=NORMSINV(prob)
Returneaz scorul z corespunztor unei anumite probabiliti (prob)
exprimat ca o proporie din distribuia normal standard.
=NORMSDIST(z)
Returneaz probabilitatea ca proporie din distribuia normal
standard, din coada stng a distribuiei i pn la un anumit scor z.
=STANDARDIZE(nr, x

, s)
Returneaz scorul z al unei valori (nr) n funcie de medie (x) i
deviaie standard (s).

Transformarea datelor
=LOG10(x)
Returneaz logaritmul zecimal (x') al unei valori ce trebuie
transformate (x).
=POWER(10,x)
Returneaz antilogaritmul zecimal al unei valori transformate x' prin
logaritmare n baza10.
=LN(x)
Returneaz logaritmul natural (x') al unei valori ce trebuie
transformate (x).
=EXP(x)
Returneaz antilogaritmul natural al unei valori transformate x' prin
logaritmare n baza c.
208 Elemente de statistic aplicate n ecologie

=LOG(x, baz)
Returneaz logaritmul ntr-o baz specificat (baz) al unei valori ce
trebuie transformate (x).
=POWER(baz,x)
Returneaz antilogaritmul unei valori transformate x' prin
logaritmare ntr-o baz specificat (baz).
=ASINH(x)
Returneaz valoarea transformat prin funcia arcsinh a unei valori x
ce trebuie transformat.
=SINH(x)
Returneaz valoarea transformrii inverse a unei valori x'
transformat cu funcia arcsinh.
=SQRT(x)
Returneaz valoarea transformat prin extragerea radicalului dintr-o
valoare x ce trebuie transformat.
=POWER(x,2)
Returneaz valoarea transformrii inverse a unei valori x'
=DEGREES(ASIN(SQRT(x)))
Returneaz valoarea transformrii unei proporii (u x 1) cu
ajutorul funciei arcsin.
Returneaz o proporie (x) prin transformarea invers a unei valori
obinut cu ajutorul funciei arcsin (x').

5.1. ESTIMAREA MEDIEI POPULAIONALE
Estimarea mediei populaionale poate fi obinut prin apelarea
meniului DATA > DATA ANALYSIS > DESCRIPTIVE
STATISTICS i completarea cmpurilor din fereastra de dialog
urmat de bifarea Summary statistics i Confidence Level for
Mean. Ultimul rnd din tabelul de rezultate conine valoarea
produsului dintre eroarea standard a mediei i valoarea critic a
distribuiei Student pentru o (valoarea implicit este de u,uS) i n 1

ANEXA 3: Funcii Microsoft Office Excel 209

=TINV(prob, gl)
Returneaz valoarea critic t (Student) pentru un anumit nivel de
semnificaie (prob = o) i un anumit numr de grade de libertate (gl
= n 1).

6. TESTAREA UNEI IPOTEZE PRIVIND MEDIA UNEI
SINGURE POPULAII
=TINV(prob, gl)
Returneaz valoarea critic t (Student) pentru un anumit nivel de
semnificaie (prob = o) i un anumit numr de grade de libertate (gl
= n 1).
=TDIST(t, gl, cozi)
Returneaz probabilitatea asociat unei valori t (Student) pentru un
anumit numr de grade de libertate (gl = n 1) i n funcie de
varianta testului (cozi: 1 unilateral, 2 bilateral).

7.1.1. Testul t (Student) pentru probe independente
=TINV(prob, gl)
Returneaz valoarea critic t (Student) pentru un anumit nivel de
semnificaie (prob = o) i un anumit numr de grade de libertate (gl
= n 1).
=TDIST(t, gl, cozi)
Returneaz probabilitatea asociat unei valori t (Student) pentru un
anumit numr de grade de libertate (gl = n 1) i n funcie de
varianta testului (cozi: 1 unilateral, 2 bilateral).

Testul Student pentru probe independente se poate realiza prin
apelarea meniului DATA > DATA ANALYSIS > t-Test:
Two-Sample Assuming Unequal Variances i completarea
cmpurilor din fereastra de dialog. n cmpul Hypothesized Mean
Diference se completeaz valoarea 0.

210 Elemente de statistic aplicate n ecologie
7.2.1. Testul t (Student) pentru perechi de observaii
=TINV(prob, gl)
Returneaz valoarea critic t (Student) pentru un anumit nivel de
semnificaie (prob = o) i un anumit numr de grade de libertate (gl
= n 1).
=TDIST(t, gl, cozi)
Returneaz probabilitatea asociat unei valori t (Student) pentru un
anumit numr de grade de libertate (gl = n 1) i n funcie de
varianta testului (cozi: 1 unilateral, 2 bilateral).

Testul Student pentru perechi de observaii se poate realiza prin
apelarea meniului DATA > DATA ANALYSIS > t-Test:
Paired Two Sample for Means i completarea cmpurilor din
fereastra de dialog. n cmpul Hypothesized Mean Diference se
completeaz valoarea 0.

8.1.1. Testarea omogenitii varianei interne
=VAR(ref)
Returneaz valoarea varianei calculat ca suma ptratelor mprit
la gradele de libertate (n 1), a unui set de date (ref).
=LN(nr)
Returneaz valoarea logaritmului natural a unui numr (nr).
=CHIINV(prob, gl)
Returneaz valoarea critic _
2
pentru un anumit nivel de
semnificaie (prob = o), un anumit numr de grade de libertate (gl =
k -1).
=CHIDIST(
2
, gl)
Returneaz probabilitatea asociat unei valori _
2
pentru un anumit
numr de grade de libertate (gl = k -1).

8.2.1. ANOVA model unifactorial
=FINV(prob, glext, glint)
Returneaz valoarea critic F pentru un anumit nivel de semnificaie
(prob = o), un anumit numr de grade de libertate externe (glext =
k -1) i un anumit numr de grade de libertate interne (glint =
n
t
k).
ANEXA 3: Funcii Microsoft Office Excel 211
=FDIST(F, glext, glint)
Returneaz probabilitatea asociat unei valori F pentru un anumit
numr de grade de libertate externe (glext = k -1) i un anumit
numr de grade de libertate interne (glint = n
t
k).

Testul ANOVA model unifactorial se poate realiza prin apelarea
meniului DATA > DATA ANALYSIS > Anova: Single
Factor i completarea cmpurilor din fereastra de dialog.

8.2.2. ANOVA Kruskal-Wallis
=CHIINV(prob, gl)
Returneaz valoarea critic _
2
pentru un anumit nivel de
semnificaie (prob = o) i un anumit numr de grade de libertate (gl
= k -1).
=CHIDIST(
2
, gl)
Returneaz probabilitatea asociat unei valori _
2
pentru un anumit
numr de grade de libertate (gl = k -1).

8.2.3. ANOVA model bifactorial fr replicare
=FINV(prob, glext, glint)
Returneaz valoarea critic F pentru un anumit nivel de semnificaie
(prob = o), un anumit numr de grade de libertate externe (glext =
c -1 sau glext = r -1) i un anumit numr de grade de libertate
interne (glint = (c -1)(r -1) = n
t
-c -r +1).
=FDIST(F, glext, glint)
Returneaz probabilitatea asociat unei valori F pentru un anumit
numr de grade de libertate externe (glext = c -1 sau glext = r -1)
i un anumit numr de grade de libertate interne (gl = (c -1)(r -
1
)
= n
t
-c -r +1).

Testul ANOVA model bifactorial cu o singur observaie n celul
se poate realiza prin apelarea meniului DATA > DATA
ANALYSIS > Anova: Two Factor Without Replication i
completarea cmpurilor din fereastra de dialog.

212 Elemente de statistic aplicate n ecologie
8.2.4. ANOVA Friedman
=CHIINV(prob, gl)
Returneaz valoarea critic _
2
pentru un anumit nivel de
semnificaie (prob = o), un anumit numr de grade de libertate (gl =
c -1).
=CHIDIST(
2
, gl)
Returneaz probabilitatea asociat unei valori _
2
pentru un anumit
numr de grade de libertate (gl = c -1).

8.2.5. ANOVA model bifactorial cu replicare
=FINV(prob, glext, glint)
Returneaz valoarea critic F pentru un anumit nivel de semnificaie
(prob = o), un anumit numr de grade de libertate externe (glext =
c -1 sau glext = r -1 sau glext = (c1)(r1)) i un anumit numr
de grade de libertate interne (glint = n
t
-cr).
=FDIST(F, glext, glint)
Returneaz probabilitatea asociat unei valori F pentru un anumit
numr de grade de libertate externe (glext = c -1 sau glext = r -1
sau glext = (c1)(r1)) i un anumit numr de grade de libertate
interne (glint = n
t
-cr).

Testul ANOVA model bifactorial cu o singur observaie n celul
se poate realiza prin apelarea meniului DATA > DATA
ANALYSIS > Anova: Two Factor With Replication i
completarea cmpurilor din fereastra de dialog.

9.1. Analiza Corelaiei
=CORREL(ref x, ref y)
Returneaz valoarea coeficientului de corelaie parametric Pearson
dintre valorile variabilei x (ref x) i valorile variabilei y (ref y).
=TINV(prob, gl)
Returneaz valoarea critic t (Student) pentru un anumit nivel de
semnificaie (prob = o) i un anumit numr de grade de libertate (gl
= n 2).

ANEXA 3: Funcii Microsoft Office Excel 213
=TDIST(t, gl, cozi)
Returneaz probabilitatea asociat unei valori t (Student) pentru un
anumit numr de grade de libertate (gl = n 2) i n funcie de
varianta testului (cozi: 1 unilateral, 2 bilateral).

Coeficientul de corelaie parametric Pearson se poate realiza prin
apelarea meniului DATA > DATA ANALYSIS >
Correlation i completarea cmpurilor din fereastra de dialog.

9.2. Analiza Regresiei
Analiza regresiei se poate realiza prin apelarea meniului DATA >
DATA ANALYSIS > Regression i completarea cmpurilor
din fereastra de dialog.

10.1. Testul
2
de concordan
=CHIINV(prob, gl)
Returneaz valoarea critic _
2
pentru un anumit nivel de
semnificaie (prob = o), un anumit numr de grade de libertate (gl =
k -m-1).
=CHIDIST(
2
, gl)
Returneaz probabilitatea asociat unei valori _
2
pentru un anumit
numr de grade de libertate (gl = k -m -1).
=BINOMDIST(x, k, p, cumulativ)
Returneaz probabilitatea binomial asociat numrului rezultatelor
de interes (x), n funcie de a numrului total de ncercri (k), i a
probabilitii obinerii unui anumit rezultat (p), exprimat necumulat
(cumulative = false).
=POISSONDIST(x, x

, cumulativ)
Returneaz probabilitatea Poisson asociat numrului rezultatelor de
interes (x), n funcie de valoarea medie (x ), exprimat necumulat
(cumulative = false).

214 Elemente de statistic aplicate n ecologie
10.2. Testul
2
de asociere
=CHIINV(prob, gl)
Returneaz valoarea critic _
2
pentru un anumit nivel de
semnificaie (prob = o) i un anumit numr de grade de libertate (gl
= (c -1)(r -1)).
=CHIDIST(
2
, gl)
Returneaz probabilitatea asociat unei valori _
2
pentru un anumit
numr de grade de libertate (gl = (c -1)(r -1)).

10.3. Testul exact al lui Fisher
=FACT(x)
Returneaz valoarea x!.

10.4. Testul McNemar
=CHIINV(prob, gl)
Returneaz valoarea critic _
2
pentru un anumit nivel de
semnificaie (prob = o) i un anumit numr de grade de libertate (gl
= (c -1)(r -1)).
=CHIDIST(
2
, gl)
Returneaz probabilitatea asociat unei valori _
2
pentru un anumit
numr de grade de libertate (gl = (c -1)(r -1)).
=BINOMDIST(x, k, p, cumulativ)
Returneaz probabilitatea binomial asociat numrului rezultatelor
de interes (x), n funcie de a numrului total de ncercri (k), i a
probabilitii obinerii unui anumit rezultat (p), exprimat necumulat
(cumulative = false).

INDEX ALFABETIC

A
aleator, 9
amplitudine, 29
analiza varianei, 102
ANOVA, 102
ANOVA bifactorial cu replicare, 128
ANOVA bifactorial fr replicare, 118
ANOVA bifactorial neparametric
Friedman, 126
ANOVA unifactorial, 108
ANOVA unifactorial neparametric
Kruskal-Wallis, 116
atribut, 12
B
Bartlett, 105
C
clasa modal, 24
clas median, 26
clase de frecven, 19
coeficient, 17
coeficient de corelaie, 145
coeficient de determinare n regresie, 162
coeficient de regresie, nlimea dreptei,
157
coeficient de regresie, panta dreptei, 157
coeficient de variaie, 32
coeficientul de corelaie Pearson, 146
coeficientul de corelaie Spearman, 146
coeficientul de determinare n corelaie,
150
compararea a dou probe
neindependente, 92
corelaie, 144
corelaie direct sau pozitiv, 144
corelaie invers sau negativ, 145
corelaie neparametric, 153
corelaie parametric, 147
corelaie, puterea, 146
covarian, 147
D
date, 9, 12
deviaie standard, 30
deviaie standard a populaiei, 30
deviaie standard a probei, 30
diagrama frecvenelor, 18
dispersie, 44
dispersie aleatoare, 44
dispersie grupat, 44
dispersie uniform, 44
dispersie, indici de, 44
disproporionalitate, 184
distribuia binomial, 36
distribuia binomial negativ, 42
distribuia normal, 55
distribuia normal standard, 58
distribuia Poisson, 40
distribuia Student, 67
216 Elemente de statistic aplicate n ecologie
distribuia t, 67
distribuie bimodal, 24
distribuie multimodal, 24
distribuii probabilistice, 34
E
eroare de genul I, 77
eroare de genul II, 77
eroare standard a mediei, 66
eroare u, 77
eroare , 77
erori statistice, 77
F
factor, 107
Fisher, 183
frecven proporional, 17
Friedman, 126
G
H
Hartley, 104
histograma frecvenelor, 20
I
independen, 10
indice de dispersie, 45
indice Green, 47
indicele Lincon-Petersen, 71
indicele Shannon-Weaver, 72
interaciunea factorilor, 108
interval de clas, 20
interval de confiden al mediei
populaionale, 68
interval de variaie, 29
ipotez, 74
ipotez alternativ, 75
ipotez nul, 75
K
Kruskal-Wallis, 116
L
Laplace, 65
Lincon-Petersen, 71
M
Mann-Whitney, 89
matrice de contingen, 178
McNemar, 187
media probei, 27
median, 25
medie, 27
medie populaional, 27
meristic, 15
metode neparametrice, 61
metode parametrice, 61
metric, 15
mod, 23
model binomial, 49
model binomial negativ, 53
model Poisson, 51
Moivre, 65
N
nivel al factorului, 107
nivel de confiden, 76
Index alfabetic 217
nivel de ncredere, 76
normalizare, 63
O
observaie, 9
omogenitatea varianei interne, 104
P
parametru, 10
Pearson, 146, 149
Poisson, 40
poligonul frecvenelor, 21
populaie, 8
prag de semnificaie, 76
probabilitate, 34
prob, 8
probe independente, 85
probe neindependente, 85
procent, 17
proporie, 17
R
rang, 13
raport, 17
rat, 17
regresie, 157
regresie, estimare individual, 164
regresie, estimarea funciei, 160
regresie, interval de confiden al
coeficientului, 162
regresie, testarea semnificaiei funciei,
161
regresie, zona de confiden a dreptei,
163
regula mpririi, 34
regula nmulirii, 35
relaii neliniare, 165
reprezentarea datelor, 17
reprezentarea variabilelor continui, 19
reprezentarea variabilelor discrete, 18
S
scal, 12
scal de interval, 14
scal de raport, 14
scal nominal, 12
scal ordinal, 13
scor z, 58
Shannon-Weaver, 72
Snedecor-Fisher, 103
Spearman, 146, 153
stabilizarea varianei, 63
statistica inferenial, 65
statistica testului, 75
statistic, 10
statistic descriptiv, 23
Student, 67, 79, 85, 93
T
tendina central, 23
teorema limit central, 65
teorie, 74
test n variant bilateral, 76
test n variant unilateral, 76
test puternic, 77
test unilateral dreapta, 79
test unilateral stnga, 79
testarea diferenei dintre dou probe, 85
testarea diferenelor dintre trei sau mai
multe probe, 102
testarea ipotezelor statistice, etape, 78
teste statistice, 75
218 Elemente de statistic aplicate n ecologie
testul Fmox sau Hartley, 104
testul _2 de asociere, 177
testul _2 de concordan, 173
testul Bartlett, 105
testul exact al lui Fisher, 183
testul McNemar, 187
testul Tukey, 112
testul I (Wilcoxon), 96
testul u (Mann-Whitney), 89
testul t (Student) pentru o prob, 79
testul t (Student) pentru perechi de
observaii, 93
testul t (Student) pentru probe
independente, 85
transformarea arcsin, 64
transformarea arcsinh, 63
transformarea datelor, 63
transformarea invers, 64
transformarea logaritmic, 63
63
Tukey, 112
U
unitate de prob, 9
V
valoare critic, 75
valoare individual, 9, 12
variabil, 9, 12
variabil continu, 15
variabil dependent, 143
variabil derivat, 16
variabil discontinu, 15
variabil discret, 15
variabil independent, 143
variabil nominal, 12
variabil ordinal, 13
variabil, tipuri, 12
variabilitate extern, 103
variabilitate intern, 103
variabilitate total, 103
variabilitatea, 29
varian, 30
W
Wilcoxon, 96
Z
zon de acceptare a ipotezei nule, 80
zon de respingere a ipotezei nule, 80

