Documente Academic
Documente Profesional
Documente Cultură
Biostat Curs
Biostat Curs
INTRODUCERE ................................................................................................................. 7
1. CONCEPTE GENERALE .............................................................................................. 8
2. APRECIEREA I PREZENTAREA DATELOR ...................................................... 12
2.1. SCALE DE MSURARE I TIPURI DE VARIABILE .......................................................... 12
2.2. REPREZENTAREA DATELOR ....................................................................................... 17
3. DESCRIEREA STATISTIC A PROBELOR ECOLOGICE ................................. 23
3.1. TENDINA CENTRAL ............................................................................................... 23
U
3.2. VARIABILITATEA ...................................................................................................... 29
C
4. DISTRIBUII PROBABILISTICE ............................................................................. 34
ES
4.1. DISTRIBUIA BINOMIAL .......................................................................................... 36
4.2. DISTRIBUIA POISSON............................................................................................... 40
4.3. DISTRIBUIA BINOMIAL NEGATIV ......................................................................... 42
R
U
8.2.4. ANOVA bifactorial neparametric Friedman .............................................. 126
C
8.2.5. ANOVA bifactorial cu replicare ................................................................... 128
ES
9. CORELAIA I REGRESIA..................................................................................... 143
9.1. ANALIZA CORELAIEI ............................................................................................. 144
9.1.1. Analiza corelaiei parametrice ....................................................................... 147
R
U
cercetrilor.
n prezent, prelucrarea statistic a datelor este facilitat de utilizarea
C
computerului i a programelor corespunztoare. Utilizarea acestora trebuie
ES
s fie fcut numai dup nelegerea conceptelor i procedurilor metodelor
statistice. Altfel, aceste instrumente vor reprezenta un fel de cutie neagr
n care se introduc rezultatele cercetrilor i din care rezult nite concluzii
R
investigaiilor din diverse ramuri ale biologiei sau ale tiinelor conexe.
n prima parte a crii sunt prezentate o serie de noiuni de baz n
statistic, care s asigure nelegerea limbajului intrinsec al acestei tiine.
U
analiza numeric a fenomenelor cuantificabile, dezvluind particularitile
C
lor de volum, structur, dinamic, conexiune, precum i regulile sau legile
care le guverneaz.
ES
Pentru ecologi i pentru cei care, n general, studiaz fenomene
variabile cu implicaii preponderent probabilistice, statistica este util pentru
dirijarea colectrii, organizrii i prezentrii datelor, precum i pentru
R
doar indic probabilitatea unui anumit rezultat sau concluzii trase n urma
ZA
analizei datelor.
Att n statistic, ct i n cadrul ecologiei i a celorlalte ramuri ale
biologiei, apare noiunea de populaie. Accepiunea biologic a acestui
termen este de grup de indivizi ce aparin unei anumite specii, ntre care se
U
Principala diferen dintre numrtori i msurtori este, n cazul
msurtorilor, lipsa unui control asupra dimensiunii unitilor de prob.
C
Atunci cnd se numr entiti, se poate decide care este unitatea de prob.
ES
Coninutul unei capcane sau ptrat de prob reprezint o prob dac
entitile investigate sunt msurate, i o unitate de prob dac entitile sunt
doar numrate.
R
identificarea populaiei din care provin unitile de prob. Dac ceea ce s-a
capturat din zece capcane de sol constituie o prob, care este populaia din
M
care a fost extras aceast prob? n acest caz, populaia este reprezentat de
numrul total de capcane care ar fi putut fi instalate n ntreaga suprafa de
ZA
U
iar dac nu se face reintroducere, probabilitatea de a extrage urmtoarea
entitate este de 1/9 i aa mai departe. Deci extragerea unei entiti
C
modific probabilitatea de extragere a celorlalte i observaiile nu sunt
ES
independente. O astfel de situaie nu trebuie s constituie un motiv de
preocupare n cazul populaiilor mari, aa cum sunt majoritatea populaiilor
biologice.
R
U
necesar obinerii acesteia.
C
ES
R
FI
M
ZA
2. APRECIEREA I PREZENTAREA DATELOR
U
C
2.1. SCALE DE MSURARE I TIPURI DE VARIABILE
ES
De exemplu, ntr-o populaie de peti dintr-o anumit specie, se
investigheaz lungimea indivizilor. Lungimea reprezint o caracteristic sau
un caracter al tuturor indivizilor din populaie, deci este o variabil.
R
grup de indivizi la altul. Aceste valori ale tuturor indivizilor din populaie se
numesc valori individuale. Dac se captureaz un anumit numr de peti (se
M
U
Scala ordinal. Aceasta include proprietile scalei nominale
(identificare i clasificare), la care se mai adaug posibilitatea de ordonare a
C
categoriilor ntr-o serie, de la valoarea cea mai mic la cea mai mare, sau de
ES
specificare a magnitudinii acestora. Variabilele corespunztoare acestei
scale se numesc variabile ordinale. Oricare dou valori ale unei astfel de
variabile pot fi egale sau diferite. n cazul n care sunt diferite, valorile se
R
pot ordona, adic se poate spune c una dintre valori este mai mare dect
FI
agresiv i foarte agresiv. Doi indivizi pot fi egali sau diferii din punctul
de vedere al agresivitii, iar dac sunt diferii, atunci se poate determina c
unul este mai agresiv dect cellalt (c o valoare este mai mare dect
Tabelul 2.1
Valoare Dominat Abundent Frecvent Ocazional Rar
Rang 5 4 3 2 1
U
Scala de interval. Permite att ordonarea datelor, ct i precizarea
C
distanei dintre unitile scalei. Valorile exprimate pe aceast scal pot fi
ES
sczute unele din altele pentru a afla exact care este diferena dintre ele. Din
cauza faptului c scala de interval nu are o valoare zero absolut, nu se
poate realiza mprirea valorilor pentru a afla cu ct una este mai mare
R
interval. Dac trei specii de psri de talie mic (paseriforme) revin din
M
mult timp pentru a ncheia migraia. Un alt exemplu de scal de interval este
scala Celsius de apreciere a temperaturii: 0 este o valoare convenional,
aleas s desemneze temperatura de nghe a apei. Ca urmare, o temperatur
U
variabile reprezint caractere numrabile sau meristice (numr de solzi,
numr de ou, numr de elemente florale, numr de pui etc.). De exemplu,
C
dimensiunea pontei unei psri este o variabil discret, ale crei valori sunt
ES
ntregi i pozitive; nu exist cuiburi cu numr fracionar de ou.
Variabilele continui pot lua orice valoare dintr-un anumit interval,
iar ntre oricare dou valori exist o infinitate de valori posibile. Aceste
R
zecimalelor considerate.
ZA
Ordinal ; ; ;
De interval ; ; ; ;
De raport ; ; ; ; ;
U
adic 2 3 4 /3 3. La fel se procedeaz i n cazul celor dou valori
de 17
C
media rangurilor pe care le-ar fi primit dac ar fi fost diferite
este 5 6 /2 5,5. n continuare, pentru conversia la o scal ordinal,
ES
se consider o valoare de referin a nlimii din prob, dup care toate
celelalte valori se exprim n relaie cu aceasta: egale cu valoarea de
referin sau diferite de aceasta. Dac din anumite motive ne intereseaz
R
apte valori 17
M
Tabelul 2.3
nlimea (cm), scal de
ZA
13 15 15 15 17 17 19 21 23
interval sau raport
Ranguri intermediare
1 2 3 4 5 6 7 8 9
(dac valorile ar fi diferite)
Variabile derivate
n anumite situaii, variabilele originale sunt procesate matematic,
Aprecierea i prezentarea datelor 17
astfel nct s rezulte variabile derivate cum ar fi: rapoarte, proporii,
procente i rate.
Raportul este o relaie simpl ntre dou numere. De exemplu, dac
lungimea capului la o viper de step este 17,7 i limea de 11,7 ,
raportul lungime:lime este de 17,7: 11,7. Implicit, raportul lime:lungime
este de 11,7: 17,7. Uneori, una dintre valori poate fi convertit prin
mprire la unitate. De exemplu, dac ntr-o prob sunt 19 i
27 , atunci raportul masculi:femele este 19: 27 sau 1: 27/19, adic
1: 1,421. Raportul poate fi scris i ca o fracie. n cazul exemplului anterior,
raportul dintre masculi i femele este de 19/27 1/1,421. Rezultatul
calculrii fraciei se numete coeficient; astfel, 1/1,421 0,704.
Proporia este raportul dintre parte i ntreg. Dac lungimea total a
U
unei vipere de step este 490 , iar lungimea cozii este 65 , proporia
reprezentat de coad este 65: 490 0,13. Dac se calculeaz o proporie
C
pornind de la raportul dintre numrul de valori dintr-o categorie i numrul
ES
total de valori din toate categoriile, atunci aceasta se numete frecven
proporional.
Procentul se obine prin nmulirea valorii unei proporii cu 100.
R
Tabelul 2.4
Nr. fitoindivizi/ptrat ( ) 0 1 2 5 7 10 16 19 38 60
U
Frecvena ( ) 5 4 3 1 1 2 1 1 1 1
C
n continuare se reprezint grafic pe abscis valorile ordonate ale
ES
variabilei ( ), iar pe ordonat valorile frecvenelor ( ) corespunztoare
valorilor variabilei. Practic, frecvena fiecrei valori a variabilei este
reprezentat printr-o coloan cu nlime corespunztoare. Se obine astfel o
R
6
5
4
f 3
2
1
0
0 1 2 5 7 10 16 19 38 60
x
Figura 2.1. Diagrama reprezentrii frecvenelor prin coloane
6
5
4
f 3
2
1
U
0
C
0 1 2 5 7 10 16 19 38 60
ES
x
Figura 2.2. Diagrama reprezentrii frecvenelor prin puncte
R
1 3,3 sau 5
numrul de valori din prob.
20 Elemente de statistic aplicate n ecologie
2. Aflarea intervalului de clas. Intervalul de clas ( ) este rezultatul
relaiei:
U
C
Limita inferioar a primei clase va fi egal cu valoarea cea mai mic
ES
din prob dac aceasta este un numr ntreg, adic pentru 1,
. Dac nu este un ntreg, atunci va fi ntregul aflat prin
rotunjirea prin lips al lui . Limita superioar a primei clase se va afla
R
sau .
ZA
celorlalte clase. Ultima clas, , va trebui s includ valoarea cea mai mare
din prob, adic pe .
mijloculclasei .
U
mijlocul intervalului de clas i frecvena fiecrei clase.
C
Exemplul 2.3. n cadrul unui studiu s-a msurat lungimea n mm a
ES
100 de peti dintr-o anumit specie.
R
194 140 226 269 284 243 303 235 229 239
206 262 233 307 285 180 248 205 284 191
FI
154 224 307 236 198 288 241 252 385 220
M
299 273 275 164 137 357 246 271 246 276
229 280 227 253 286 190 291 297 296 288
ZA
225 234 244 351 267 265 239 283 190 244
288 245 289 241 289 278 255 253 240 153
208 328 235 283 214 300 228 204 343 228
194 233 218 321 303 254 225 232 196 245
223 305 220 338 269 224 319 259 240 293
100
1 3,3 100 7,6 8
385
137
31
22 Elemente de statistic aplicate n ecologie
Tabelul 2.5. Tabelul de distribuie a frecvenelor claselor de lungime (mm)
k xinf xsup mijloc f F (f cumulat)
1 137 168 152,5 5 5
2 168 199 183,5 8 13
3 199 230 214,5 19 32
4 230 261 245,5 27 59
5 261 292 276,5 23 82
6 292 323 307,5 12 94
7 323 354 338,5 4 98
8 354 385 369,5 2 100
30
25
U
Frecvena (f)
20
C
15
ES
10
5
R
0
FI
1 2 3 4 5 6 7 8
M
Clasa (k)
ZA
30
25
Frecvena (f)
20
15
10
5
0
152.5 183.5 214.5 245.5 276.5 307.5 338.5 369.5
Clasa (mijloc)
Figura 2.4. Poligonul frecvenelor
3. DESCRIEREA STATISTIC A PROBELOR
ECOLOGICE
U
n natur, atunci cnd investigm o populaie, rareori ntlnim valori
C
individuale identice ale unor variabile. La o privire mai atent a datelor, se
poate observa existena unor valori n jurul crora tind s se distribuie
ES
majoritatea, dac nu toate celelalte valori individuale. Descrierea statistic a
probelor prelevate din populaii scoate n eviden dou aspecte eseniale:
R
reprezentativ pentru toate datele din prob sau pentru valorile individuale
din populaie. De exemplu, enunuri ca majoritatea florilor dintr-o prob au
culoarea roie sau diametrul mediu al florilor este de 2 cm surprind
U
n exemplul 2.3 lungimea petilor este o variabil continu. Modul
probei este 288, pentru care exist 3 valori. Dac toate valorile ar fi fost
C
diferite, atunci s-ar fi putut afla clasa modal de distribuie a frecvenelor ca
ES
fiind clasa cu frecvena cea mai mare. n cazul exemplului luat n discuie,
clasa modal este clasa nr. 4 cu frecvena 27.
Dac ntr-o distribuie a frecvenelor apar mai multe vrfuri de
R
modul pentru femele este 29 de plci subcaudale, iar pentru masculi este 37.
ZA
8
masculi
7
6
5
femele
f 4
3
2
1
0
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
Nr. subcaudale
Figura 3.1. Diagrama distribuiei frecvenelor numrului de subcaudale la
Vipera ursinii moldavica
Descrierea statistic a probelor ecologice 25
n cazul unor astfel de distribuii, care nu sunt simetrice fa de o
singur valoare a tendinei centrale, se recomand ca analiza statistic s se
fac separat, pe categorii discrete din prob masculi, femele, juvenili
pentru care datele se prezint mai mult sau mai puin simetrice.
U
robuste msuri ale tendinei centrale, deoarece nu este influenat de
eventualele valori atipice, cum se poate ntmpla n cazul mediei, i se poate
C
utiliza chiar i n cazurile n care se cunosc doar magnitudinile (sau
ES
rangurile) unor valori ce nu au fost nregistrate.
Modalitatea de calcul a medianei depinde de numrul valorilor din
prob ( ):
R
/ /
pt. 2 , atunci sau .
U
C
Exemplu 3.1. ntr-un studiu s-a urmrit acoperirea procentual
realizat de o specie de ierburi de step, n 20 de suprafee de prob.
ES
Acoperire 80-100% 60-80% 40-60% 20-40% 0-20% f
R
Frecvena (f) 1 2 9 6 2 20
FI
10 10 30 30 30 30 30 30 50 50
50 50 50 50 50 50 50 70 70 90
U
C
,
40 20 40 20 45,56 .
ES
Media ( , ). Este unul dintre cei mai cunoscui i mai utili
R
descriptori ai tendinei centrale. Exist mai multe tipuri de medie, dar cel
mai utilizat este media aritmetic. Dac se calculeaz media lund n
FI
obinut n urma analizei datelor dintr-o prob sau media probei este o
ZA
numrul acestora:
pentru populaie ;
pentru prob ,
fiecare valoare individual din populaie sau prob;
numrul tuturor valorilor individuale din populaie;
numrul tuturor valorilor din proba prelevat din populaie.
Mo=Me=x Mo<Me<x
U
A B
C
Figura 3.2. Relaia dintre mod, median i medie: A distribuie simetric; B
ES
distribuie asimetric
Dintre cele trei msuri ale tendinei centrale, media este singura care
R
ine cont de toate datele din probe i astfel sintetizeaz ntreaga informaie
furnizat de acestea. Valoarea mediei este folosit n numeroase tehnici de
FI
din aceeai populaie, n cadrul mediei generale, atunci cnd datele sunt rare
sau greu de obinut.
ZA
mediageneral
media probei numrul de valori din proba
U
distribuie fa de aceasta.
Cei mai comuni descriptori ai variabilitii unei probe sunt
C
amplitudinea i deviaia standard.
ES
Amplitudinea ( ). Este o msur simplu de calculat a dispersiei
datelor dintr-o prob. Amplitudinea reprezint diferena dintre valoarea
R
intervaluldevariaie ,
ZA
Este msura cea mai util a variabilitii, atunci cnd o decizie este
condiionat de valorile extreme ale unei variabile. Prezint ns i o serie de
neajunsuri: depinde doar de valorile extreme care adesea sunt excepionale,
prezint fluctuaii mari de la o prob la alta i nu este influenat de simetria
repartiiei dintre extreme (poate avea aceeai valoare pentru o repartiie
30 Elemente de statistic aplicate n ecologie
simetric i pentru una puternic asimetric).
U
abaterilor, ar trebui ca abaterile tuturor valorilor s se nsumeze i apoi s se
C
mpart la numrul valorilor individuale luate n analiz ( sau ). Totui
exist o problem cu privire la acest raionament:
ES
0.
R
FI
sau
sau
U
abaterilor se mparte la 1 i nu la , ceea ce are drept efect creterea
C
valorii s.
ES
sau formula cea mai uzual
R
FI
sau % 100
U
tulpini n cm dintr-un plc compact. S-a realizat apoi descrierea statistic a
C
probei.
ES
59,3 59,6 60,3 60,6 60,9 62,6 62,7 62,8 63,7 63,7
65,5 65,8 66,6 67,1 67,2 67,5 67,8 68,1 68,9 69
R
,
69,8
,
, , , ,
47,83 6,92
47,83
U
Coeficientul de variaie se afl mprind deviaia standard la medie.
C
,
0,098, adic 9,8% .
ES
,
U
probabil, iar o probabilitate apropiat de 0 nseamn c evenimentul
C
respectiv este puin probabil.
Exist mai multe modaliti de aflare a probabilitii unui eveniment,
ES
dintre care dou sunt mai des utilizate. Prima modalitate este cea empiric,
bazat pe cunotine anterioare cu privire la evenimentul respectiv n
populaie. De exemplu, dac se tie c ntr-o populaie doi din 5 indivizi
R
individ selectat la ntmplare din populaie s fie mascul este de 2/3 sau
0,67 (sau 67%). Pentru a afla aceast probabilitate, sunt necesare cunotine
M
U
apariie a unui rezultat , probabilitatea apariiei unuia din cele dou
C
rezultate la un moment dat este, conform regulii adunrii, egal cu suma
probabilitilor individuale: sau . De exemplu, dac
ES
probabilitatea ca dintr-un ou s ias o anumit specie este de 0,2 i
probabilitatea de apariie a unei alte specii este 0,3, atunci probabilitatea ca
din ou s ias prima sau a doua specie va fi egal cu suma probabilitilor
R
U
4.1. DISTRIBUIA BINOMIAL
C
ES
Aceast distribuie are urmtoarele particulariti:
mascul sunt egale cu ansele s fie femel. Cum rezultatul poate fi doar unul
singur, nseamn c probabilitatea de a obine un mascul este 1/2 0,05,
iar probabilitatea de a obine o femel este tot 1/2 0,05. Dac este
probabilitatea de a obine mascul i este probabilitatea de a obine femel,
atunci suma probabilitilor va fi 1, iar 1 i 1 .
Distribuia probabilistic n cazul sexului unui individ este reprezentat n
figura 4.1.
Dac se extrag doi indivizi din populaie, atunci exist patru
rezultate posibile (tab. 4.1). Probabilitile fiecrui rezultat pot fi obinute
conform regulii nmulirii. Astfel, probabilitatea de a obine doi masculi va
Distribuii probabilistice 37
fi 0,5 0,5 0,5 0,25. Probabilitatea de a obine dou femele se
calculeaz n acelai fel. Probabilitatea de a obine un mascul i o femel
este egal cu probabilitatea de a obine o femel i apoi un mascul, adic
0,5 0,5 0,25.
0.6
0.5
Probabilitate
0.4
0.3
0.2
U
C
0.1 ES
0
mascul femel
Rezultat
R
Individul 1
Mascul (M) Femel (F)
0,5 0,5
ZA
Individul 2
Mascul (M) MM FM
0,5 0,25 0,25
Femel (F) MF FF
0,5 0,25 0,25
3 3 1 1.
1.
U
n aceast relaie general a distribuiei binomiale, reprezint
C
numrul de ncercri, este probabilitatea de a obine un anumit rezultat
dintr-o singur ncercare, iar este probabilitatea ca rezultatul vizat s nu
ES
apar. Distribuia binomial depinde de i de (valoarea lui depinde de
cea a lui ).
O formul mai practic pentru calculul probabilitii n distribuia
R
binomial este:
FI
!
M
,
! !
probabilitatea de a obine un anumit numr de rezultate;
ZA
4 3 2 1 0 4
U
0,2343 0,3125 0,2343 0,0937 0,0156 0,8906
C
Probabilitatea de a obine patru sau mai puini masculi este de
ES
aproximativ 89,1%.
Distribuia probabilistic pentru toate combinaiile posibile de
masculi i femele din ase indivizi se prezint astfel:
R
FI
0.35
M
0.3
0.25
ZA
0.2
p(x)
0.15
0.1
0.05
0
0 1 2 3 4 5 6
x
U
4. Entitile numrate sunt relativ rare (mult mai puine dect ar
putea s conin unitatea de prob).
C
5. Dispersia entitilor n timp i spaiu este aleatoare, ceea ce
ES
nseamn c entitile nici nu se atrag, nici nu se resping, adic
sunt independente unele fa de altele.
R
.
Deoarece aceti parametri rareori ajung s fie cunoscui, formula de
.
!
10 2,7183 0,0181 ,
!
9 2,7183 0,0363 .
!
U
C
La fel se procedeaz i pentru celelalte valori. ES
0.18
0 0,0067 0.16
R
1 0,0337 0.14
2 0,0842
FI
0.12
3 0,1404
0.1
M p(x)
4 0,1755
0.08
5 0,1755
ZA
6 0,1462 0.06
7 0,1044 0.04
8 0,0653 0.02
9 0,0363 0
10 0,0181 0 1 2 3 4 5 6 7 8 9 10
0,9863
x
U
putea s conin unitatea de prob).
5. Dispersia entitilor nu este nici uniform, nici aleatoare, ci poate
C
s fie grupat sau agregat.
ES
Spre deosebire de celelalte distribuii discrete, distribuia binomial
negativ este un model robust ce descrie dispersia a numeroase populaii
R
naturale.
FI
0 1 .
0 1 .
U
suprafa de prob este trei, iar deviaia standard este cinci.
3
C
ES
5
R
4,5 .
M
,
0 1 0,1004 .
,
p(x)
0.1
4 0,1292
5 0,0879 0.08
6 0,0556 0.06
7 0,0334 0.04
8 0,0192 0.02
U
9 0,0107 0
10 0,0058 0 1 2 3 4 5 6 7 8 9 10
C
0,9938 x
ES
Se poate observa c suma probabilitilor valorilor este mai mic
dect 1. Probabilitile pentru valorile mai mari de 10 vor fi extrem de mici.
R
U
C
ES
Figura 4.2. Tipuri de dispersie: I uniform, II aleatoare, III grupat
R
FI
Indice de dispersie .
.
46 Elemente de statistic aplicate n ecologie
Indicele de dispersie poate fi subunitar, egal cu unitatea sau
supraunitar. Astfel, n funcie de valoarea raportului, se poate decide care
este tipul de dispersie:
U
egal cu 1 sau, la fel de bine, poate fi considerat n funcie de situaie ca
fiind mai mare sau mai mic dect 1.
C
ntr-o astfel de situaie, pentru a lua o decizie obiectiv trebuie ca
ES
acesteia s i se atribuie o probabilitate, adic s se realizeze o estimare
statistic. Pentru aceasta se impune o standardizare a indicelui de dispersie
prin nmulirea acestuia cu numrul gradelor de libertate, adic cu numrul
R
1 .
M
ZA
2 2 1 1.
U
i n acest caz, nivelul de ncredere este de 0,05, deci probabilitatea
C
ca dispersia s fie de un anumit tip este de 0,95 sau 95%.
ES
Indicele de dispersie face distincia dintre cele trei tipuri, dar nu
poate indica gradul de aglomerare n cazul unei dispersii grupate, deoarece
R
datele sunt sub form de tabel de frecvene sau cu dac datele sunt sub
form de densiti pe unitatea de prob.
sau
0 0 0 5 3 48 1
2 30 5 9 22 1 0
9
207,69
,
23,08 .
U
Indicele de dispersie este evident mai mare ca 1. n continuare vom
verifica dac dispersia aglomerat este semnificativ.
C
ES
14 1 23,08 300,04
, , 5,009
ZA
, , 24,736 .
U
grafic a ambelor frecvene i prin testul de concordan (seciunea 10.1).
n seciunile urmtoare ne vom referi la compararea grafic a frecvenelor.
C
ES
4.4.2. Modelul binomial
Calcularea probabilitii binomiale de obinere a unei valori a
variabilei pe unitate de prob se bazeaz pe procedura descris n exemplul
R
.
ZA
, iar 1 .
U
.
16 17 18 19 20 21 22 Suma
C
ES
3 5 8 14 11 6 3 50
48 85 144 266 220 126 66 955
R
19,1
FI
, , ,
2,38
M
ZA
,
Indicele de dispersie = 0,124
,
0,124 50 1 6,099
2 6,099 2 50 1 1 6,356
6,356 1,96 dispersie uniform semnificativ
,
21,82 22
, ,
,
0,876 1 0,876 0,124 .
Distribuii probabilistice 51
16
f f'
14
U
16 3 0,033 1,654 12
17 5 0,082 4,107 10
frecvena
C
18 8 0,160 8,024 8
ES
19 14 0,238 11,881 6
20 11 0,251 12,534 4
21 6 0,168 8,396 2
R
22 3 0,054 2,684 0
FI
16 17 18 19 20 21 22
x
M
0 1 2 3 4 5 6 7 8 Suma
7 16 25 18 16 10 5 2 1 100
0 16 50 54 64 50 30 14 8 286
2,86
U
, , ,
3,11
C
Indicele de dispersie poate fi considerat fie aproximativ egal cu 1, fie
ES
supraunitar.
R
,
Indicele de dispersie 1,088
,
FI
, ,
0 2,7183 0,05727
!
, ,
1 2,7183 0,16379
!
frecvena
2 25 0,234 23,422 15
3 18 0,223 22,329
10
4 16 0,160 15,965
5 10 0,091 9,132 5
6 5 0,044 4,353
U
0
7 2 0,018 1,778
0 1 2 3 4 5 6 7 8
C
8 1 0,006 0,636
x
ES
Se poate observa c exist o concordan destul de mare ntre
frecvenele observate i cele estimate pe baza modelului Poisson. Deci
R
Nr. indivizi/ptrat 0 1 2 3 4 5 6 7 8 9 10 11
Frecvena 20 27 18 12 10 4 2 3 2 0 1 1
0 1 2 3 4 5 6 7 8 9 10 11 Suma
20 27 18 12 10 4 2 3 2 0 1 1 100
0 27 36 36 40 20 12 21 16 0 10 11 229
54 Elemente de statistic aplicate n ecologie
2,29
, , ,
5,16
U
Pentru distribuia binomial negativ este necesar calcularea
C
parametrului . Acesta este o variabil continu, motiv pentru care valoarea
ES
sa nu se rotunjete ca n cazul distribuiei binomiale.
,
R
1,829
, ,
FI
, ,
0 1 0,2265 ;
,
, ,
1 0,2265 0,2304 ;
, ,
, ,
2 0,2304 0,1811 .
, ,
30
0 20 0,2265 22,65 f f'
1 27 0,2304 23,04 25
2 18 0,1811 18,11
20
3 12 0,1285 12,85
frecvena
4 10 0,0863 8,63 15
5 4 0,0559 5,59
6 2 0,0354 3,54 10
7 3 0,0220 2,20
8 2 0,0135 1,35 5
9 0 0,0082 0,82
0
10 1 0,0049 0,49
U
11 1 0,0029 0,29 0 1 2 3 4 5 6 7 8 9 10 11
C
x
ES
Se poate observa c exist o concordan destul de mare ntre
frecvenele observate i cele estimate pe baza modelului distribuiei
R
U
C
ES
x
Figura 4.3. Distribuia frecvenelor valorilor unei variabile
R
.
Distribuii probabilistice 57
s1
s2
m1 m2
U
Figura 4.4. Distribuii normale diferite dup medii (m) i deviaii standard (s)
C
3. Curba este perfect simetric fa de medie, motiv pentru care
media i mediana sunt egale n distribuia normal. De asemenea,
ES
valorile variabilei egale cu media sunt cele mai frecvente i astfel
media este egal cu modul valorilor individuale. n concluzie,
R
0,9974
0,9544
0,6826
U
-3 -2 - + +2 +3 x
C
Figura 4.5. Suprafee ale distribuiei normale
ES
Distribuia normal standard
Orice distribuie normal particular ( , ) poate fi convertit la
R
0,99
U
0,95
0,6826
C
ES
-2,58 -1,96 -1 0 +1 +1,96 +2,58 z
R
sau pot fi calculate (anexa 3) pornind de la coada din stnga (cu valori
extreme negative) a 0,1 i pn la valoarea calculat.
ZA
1,568 0,058
1,322 0,907 .
U
de curb. A doua arat c din coada stng a 0,1 i pn la 1,322
C
sunt cuprinse 90,7% din suprafaa delimitat de curb.
Ca s aflm ce procent din valorile nlimii se gsesc ntre 60 i
ES
70 , trebuie sczute probabilitile:
R
sau se calculeaz (anexa 3). Avnd n vedere c att tabelul din anexa 2, ct
i funcia din anexa 3 consider probabilitatea din coada stng a 0,1 ,
nseamn c aflarea scorului pentru 0,95 va returna limita superioar
a unui interval dispus asimetric fa de medie, limita inferioar fiind ctre
. Astfel, pentru a obine scorurile care s delimiteze o suprafa de
0,95 din 0,1 simetric fa de medie, trebuie ca diferena 1 0,95
0,05 s fie mprit n mod egal n ambele cozi ale distribuiei (ca n fig.
4.6). Deci se afl scorurile pentru 0,025 i, respectiv, pentru 1
0,025 0,975. La fel ca la punctul a), primul separ 0,025 pn n coada
stng, al doilea, 0,975 pn n coada stng, iar ntre cei doi se gsete o
suprafa ce reprezint 0,95 din suprafaa total de sub clopot.
Distribuii probabilistice 61
, 1,96
, 1,96
U
Rspunsul de la punctul b) este c ntre 57,29 i 84,41 sunt
cuprinse 95% din valorile nlimii n populaie.
C
ES
4.5.1. Aprecierea normalitii datelor
Metodele statistice utilizate n ecologie sunt de dou categorii:
parametrice i neparametrice. Cele parametrice sunt mai puternice, dar
R
totodat mai restrictive n sensul c se pot aplica doar dac datele ntrunesc
FI
situaii, dar sunt mai puin puternice (seciunea 5.5, Erori statistice).
Deci, pentru a putea utiliza metode statistice parametrice, trebuie s
se verifice normalitatea distribuiei datelor. Din start trebuie subliniat c
U
valorile i , atunci se poate aprecia c variabila analizat este
aproximativ normal distribuit n prob.
C
ES
Exemplul 4.9. S se verifice rapid dac datele din exemplul 3.1 au o
distribuie apropiat de cea normal.
R
69
ZA
69,8
70,85
ntre aceste dou valori se gsesc 34 din 50 de valori, adic 68% din
valorile din prob. Acest procent este apropiat de cel cuprins n intervalul
, al unei distribuii normale, adic de 68,26%.
Dac datele nu sunt normal distribuite, atunci cel mai simplu este s
Distribuii probabilistice 63
se foloseasc o metod statistic alternativ, neparametric. Folosirea
metodelor parametrice n astfel de situaii este totui permis dac se
realizeaz o transformare a datelor care s corecteze distribuia acestora.
Transformarea datelor este necesar dac datele sunt sub form de
numr de entiti. Astfel de variabile discrete au o distribuie evident
asimetric. n astfel de situaii se folosesc transformri care au rolul de a
normaliza distribuia datelor.
Numeroase tehnici parametrice compar mediile probelor care se
presupune c au variane suficient de asemntoare i care, din aceast
cauz, pot fi ignorate. Datele discrete ce reprezint numrtori de entiti nu
ndeplinesc aceast condiie, deoarece variana este dependent de medie n
sensul c populaiile la care media are o valoare mare, mprtierea valorilor
U
fa de medie este mai mare i, implicit, variana va fi mai mare. n astfel de
situaii transformrile au rolul de a ntrerupe relaia dintre medie i varian,
C
adic de a stabiliza variana datelor.
ES
Transformrile cele mai utilizate n ecologie sunt logaritmul,
radicalul i transformarea arcsin (anexa 3). Acestea se calculeaz n diferite
condiii pentru toate valorile individuale din probe.
R
probei este mai mare dect media acesteia. De asemenea, are si rolul de a
normaliza distribuia datelor. Valoarea transformat a unei valori
M
sau .
1 sau 0,5 .
U
pentru proporii
pentru procente
C
ES
R
1.
1 sau 0,5 .
U
respective.
C
n general, se recunosc dou categorii largi de inferene statistice:
estimarea unor parametri populaionali i testarea ipotezelor statistice.
ES
5.1. ESTIMAREA MEDIEI POPULAIONALE
R
una din numeroasele probe aleatoare care se pot extrage din populaia
M
Populaie
,
Figura 5.1. Reprezentarea grafic a prelevrii repetate a probelor din populaie. (linie
U
continu sensul prelevrii; line ntrerupt sensul estimrii)
C
ES
R
FI
M
ZA
x 1 x 2 x 3 x 4 x 5 x 6
Figura 5.2. Distribuia normal a mediilor probelor fa de media populaiei
U
de libertate. Valorile lui scad odat cu creterea diferenei 1, astfel c o
C
valoare critic , , ce definete 0,95 sau exclude 0,05 din distribuia
Student pentru o infinitate de valori ca grade de libertate are valoarea 1,96,
ES
adic exact valoarea lui , ce definete aceeai proporie din distribuia
normal standard. Deci distribuia t tinde s devin normal odat cu
R
este repartizat n mod egal n cele dou cozi ale distribuiei (fig. 5.3).
0,025 0,025
-2.776 0 2.776
Figura 5.3
Deci exist de fapt dou valori : 2,776 care exclude 0,05/2
68 Elemente de statistic aplicate n ecologie
0,025 din coada din dreapta a distribuiei i 2,776 care exclude 0,025 din
coada stng a distribuiei.
Dac dorim s reprezentm valoarea care exclude 0,05 din
distribuie doar n coada dreapt pentru 4 grade de libertate, atunci trebuie
cutat n tabel valoarea ce exclude 0,1 din distribuie, care exclude cte
0,05 n fiecare coad din distribuie (fig. 5.4). Aceast valoare este 2,132.
Deci, dac ne intereseaz o singur coad a distribuiei, trebuie cutat
valoarea care exclude o proporie dubl din distribuie.
U
C
ES
0,05 0,05
R
-2.132 0 2.132
FI
Figura 5.4
M
condiii de aplicare:
.
Statistic inferenial: elemente introductive 69
Se estimeaz intervalul de confiden pentru o probabilitate de 0,95
(95%) a mediei populaiei pornind de la relaia:
, , .
, ,
, , .
U
din care a fost extras proba, cu o probabilitate de 95% (0,95).
C
Exemplul 5.1. La o prob format din 30 de indivizi de viper de
ES
step (Vipera ursinii moldavica) extras aleatoriu dintr-o populaie s-a
msurat lungimea n mm de la vrful botului i pn la cloac. S-a estimat
R
330 500 340 363 491 325 390 425 418 422
389 435 470 360 370 400 390 430 164 340
ZA
390
389,5
362,17
, , 2,045
U
362,17 36,08 398,25
C
ES
Intervalul 326,09-398,25 include media populaional a lungimii de
la vrful botului la cloac cu o probabilitate de 95%.
Reprezentarea grafic a intervalului de confiden al mediei se
R
420
ZA
400
380 326,09
360 362,17
340
320 398,25
300
x
Figura 5.5. Intervalul de confiden al mediei (95%)
U
fel cu modul n care se distribuie mediile probelor n jurul mediei populaiei.
Deviaia standard a distribuiei se numete eroare standard i se estimeaz
C
astfel:
ES
. .
R
1,96 . . .
1,
estimarea efectivului populaiei;
nr. indivizilor capturai, marcai i eliberai n prima prob;
nr. total al indivizilor capturai n a doua prob;
nr. indivizilor marcai, recapturai n a doua prob.
Deviaia standard aproximativ a acestui estimator este:
72 Elemente de statistic aplicate n ecologie
1,96 .
U
Cel mai simplu indicator al diversitii biologice este bogia specific sau
C
numrul de specii. Exist o serie de indici ai diversitii care, pe lng
numrul de specii, iau n consideraie i ct de echitabil sunt reprezentate
ES
speciile din comunitate, prin intermediul numrului de indivizi. Unul dintre
cei mai folosii astfel de indici este indicele Shannon-Weaver:
R
FI
trebuie considerat ca fiind de dou ori mai mare dect una egal cu 2,0.
Tehnicile statistice care se pot aplica valorilor apreciate pe o scal ordinal
sunt n general neparametrice sau independente de distribuie. De exemplu,
un set de indici obinui prin analiza mai multor probe extrase din aceeai
zon poate fi comparat cu un alt set extras rezultat din alt zon prin
intermediul testului Mann-Whitney (seciunea 7.1.2).
O alt modalitate de comparare a indicilor const n transformarea
acestora n diversiti relative ( ), exprimate proporional sau procentual:
Statistic inferenial: elemente introductive 73
diversitatea maxim pentru acelai numr de specii
(diversitatea unei comuniti ideale cu acelai nr. de specii
cu cea real, n care toate speciile sunt reprezentate prin
acelai nr. de indivizi);
bogia specific sau nr. de specii identificate n comunitate.
U
Exemplul 5.2. ntr-un studiu al vegetaiei de step din rezervaia de
la Valea lui David s-au calculat diversitile pentru cinci comuniti vegetale
C
din asociaia Taraxaco serotinae-Festucetum valesiacae i diversitatea unei
ES
comuniti din aceeai asociaie, studiat nainte de 1969 i notat cu A.
Releveu
R
U
urmtoarele caracteristici: este n concordan cu observaiile fcute, adic,
dac este adevrat, atunci va explica ceea ce s-a observat; poate fi testat
C
prin experimente, adic, dac este fals, atunci acest lucru poate fi dovedit.
ES
De ce trebuie dovedit falsitatea unei ipoteze i nu veridicitatea ei?
n filosofia tiinei, se consider c s poate dovedi c o ipotez fals este
fals, n timp ce o ipotez adevrat poate s nu se dovedeasc niciodat c
R
U
invers, dac probabilitatea ca ipoteza s fie corect este foarte mic, atunci
se poate concluziona c ipoteza este incorect.
C
n orice testare a ipotezelor statistice, ipotezele formulate sunt
ES
ntotdeauna contradictorii. Ipoteza testat prin diferite procedee numite teste
statistice este aa-numita ipotez nul ( ). Aceasta presupune n general
lipsa efectului, lipsa diferenei i, ca urmare, conine sau implic o egalitate.
R
U
n general, testele unilaterale se utilizeaz doar dac exist un motiv
apriori care s sugereze o tendin direcional a datelor. Este bine ca testele
C
bilaterale s se fac dup o testare n variant bilateral. ntre cele dou
ES
variante ale unui test nu exist nici o diferen n privina modului de calcul
al statisticii testului, ci difer doar ipotezele i pragul de semnificaie mai
mic n cazul testelor unilaterale (seciunea 5.1, fig. 5.3, 5.4 i explicaiile
R
aferente).
FI
n orice test statistic pot s apar dou genuri de erori statistice (tab.
Statistic inferenial: elemente introductive 77
5.1):
eroare de genul I, ce const n respingerea eronat a cnd este
adevrat; riscul sau probabilitatea de a face o astfel de eroare este ;
eroare de genul II, ce const n acceptarea eronat a cnd este
fals; riscul sau probabilitatea de a face o astfel de eroare este .
Corect Eroare II
1
Ipoteza acceptat
Eroare I Corect
U
1
C
Dac se dorete reducerea riscului de a comite o eroare I, atunci
ES
trebuie s scad, ceea ce conduce la creterea riscului de a comite o eroare
II i invers. Se consider c 0,05 asigur un echilibru ntre riscul de a
comite o eroare de genul I i cel de a comite o eroare de genul II.
R
U
una unilateral a testului) i se stabilete regula de decizie (se
desemneaz nivelul de ncredere sau de confiden ).
C
4. Se calculeaz statistica sau statisticile testului.
ES
5. Se compar statistica obinut cu valoarea critic corespunztoare
valorii i gradelor de libertate i se ia o decizie privind
acceptarea sau respingerea ipotezei nule. Decizia mai poate fi
R
U
testeaz o ipotez nul conform creia nu exist o diferen semnificativ
C
ntre mediile celor dou populaii.
Testul care se folosete ntr-o astfel de situaie se numete Testul
ES
(Student) pentru o prob. Fiind un test parametric, condiiile de aplicare
ale acestuia sunt urmtoarele:
R
Dac este media populaiei din care a fost extras proba i este
media populaiei de referin sau o valoare de referin, atunci ipotezele
: : :
: : : .
U
difer semnificativ una de alta. Dac , , atunci se accept
C
pentru aceeai probabilitate, adic nu exist o diferen
semnificativ ntre i .
ES
Dac este semnificativ diferit de , nseamn c este ori mai
R
mare, ori mai mic dect Aceasta implic faptul c este mai mic sau
mai mare dect .
FI
dac t este mai mic dect valoarea critic negativ i mai mare dect
valoarea critic pozitiv, atunci se respinge i se accept
pentru o probabilitate de 1 sau 100 1 %.
/2 /2
1-
H1 -t H0 +t H1
U
C
Atunci cnd se aplic testul n variant unilateral, atunci exist o
singur zon de respingere a cantonat doar ntr-o singur coad a
ES
distribuiei: dreapt sau stng. Dac se vizeaz coada din dreapta
distribuiei ( : ), atunci statistica testului ( ) trebuie comparat cu
R
1-
H0 +t H1
U
biomarker al polurii apei n corpul unei specii de pete. O concentraie mai
C
mare de 100 uniti/g indic o poluare a apei n care triesc petii. Este
poluat apa din care s-a extras aleatoriu o prob format din 30 de peti?
ES
87 90 94 94 94 95 95 98 98 101
R
101 102 102 103 104 105 106 106 106 107
108 110 110 111 117 118 123 124 130 137
FI
M
extras proba semnificativ mai mare dect 100?. Dac ntrebarea problemei
ar fi fost pus invers Provin petii din prob dintr-o ap nepoluat? ,
atunci ntrebarea din punct de vedere statistic ar fi fost Este media
populaiei din care s-a extras proba semnificativ mai mic dect 100?.
3176/30 105,87
104,5
106 .
U
Ipotezele testului vor corespunde unei variante unilaterale, aa cum
am stabilit n prima etap:
C
ES
: 100
: 100 .
R
,
2,739 .
,
ZA
U
Concluzia testului este cea surprins de : media concentraiei
C
biomarker-ului n populaia de peti din care a fost extras proba este
semnificativ mai mare dect valoarea de referin.
ES
Pentru a rspunde la ntrebarea problemei, putem spune c apa din
care a fost extras proba de 30 de peti este poluat.
R
FI
M
ZA
7. TESTAREA DIFERENEI DINTRE DOU PROBE
U
neindependente. ntr-un astfel de caz, cele dou probe pot fi prelevate din
C
aceeai populaie sau se obin prin investigarea unitilor de prob de dou
ES
ori: nainte i dup aplicarea unui anumit tratament unitilor de prob.
mediilor populaiilor din care au fost extrase probele. Deci mediile probelor
M
1. cele dou probe trebuie s fie prelevate aleator din dou populaii
distincte;
2. variabila trebuie s fie apreciat pe o scal de interval sau de
raport;
3. valorile din cele dou probe trebuie s fie aproximativ normal
distribuite.
86 Elemente de statistic aplicate n ecologie
n funcie de tipul de comparaie, testul poate fi aplicat n variant
bilateral sau unilateral, n funcie de care se scriu ipotezele testului. Fie
populaia din care se extrage aleator proba i populaia din care se
preleveaz aleator proba . Atunci ipotezele testului pot fi:
Bilateral Unilateral
: : :
: : : .
U
C
media valorilor din proba
ES
media valorilor din proba B
media populaiei media populaiei
variana probei variana probei
R
ipotezelor nule!
ZA
, 1.
Testarea diferenei dintre dou probe 87
Condiia testului este:
1 .
U
masculi dect la femele?
Femele (f): 31 32 29
C 29 29 25 29
ES
28 28 27 31 30 28
Masculi (m): 35 37 38 38 38 36 38
R
39 35 36 37 31 36 38
36 37 37 38 37 32
FI
:
:
U
, ,
10,482 .
C
, , ES
Numrul gradelor de libertate se poate afla n dou moduri:
R
, ,
23,6 23
FI
, ,
13,20 1 13 1 12 .
M
ZA
, , 1,714 , , 1,782 .
U
Bilateral Unilateral
C
: : :
ES
: : : .
ordoneaz cresctor ntr-o singur serie. Valoarea cea mai mic va primi
rangul 1, urmtoarea rangul 2 i aa mai departe. Valorile egale vor primi
M
media rangurilor pe care le-ar fi primit dac ar fi fost diferite (seciunea 2.1,
tab. 2.3).
ZA
Suma celor dou statistici ale testului trebuie s fie egal cu suma
tuturor rangurilor, adic . De unde rezult c, pentru
simplificare, putem scrie una dintre statistici, s zicem , n funcie de
cealalt:
90 Elemente de statistic aplicate n ecologie
U
pentru 1 .
C
Valoarea critic trebuie aleas n funcie de varianta bilateral sau
ES
unilateral n care se aplic testul.
R
normal standard:
Pentru aceasta este nevoie s se calculeze media ( ) i deviaia
M
Sex f f f F f f f f f f f f f m m m m
x 25 27 28 28 28 29 29 29 29 30 31 31 32 31 32 35 35
Ri 1 2 3 4 5 6 7 8 9 10 11 12 14 13 15 16 17
U
Rx 1 2 4 4 4 7,5 7,5 7,5 7,5 10 12 12 14,5 12 14,5 16,5 16,5
C
continuare
ES
m m m M m m m m m m m m m m m m
36 36 36 36 37 37 37 37 37 38 38 38 38 38 38 39
R
18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
FI
19,5 19,5 19,5 19,5 24 24 24 24 24 29,5 29,5 29,5 29,5 29,5 29,5 33
M
:
: .
1 2 4 14,5 93,5 .
13 20 93,5 257,5
13 20 257,5 2,5 .
92 Elemente de statistic aplicate n ecologie
Deoarece dimensiunea probelor este mai mic sau egal cu 20,
trebuie aflat valoarea critic (anexa 2). Cum testul se aplic n variant
unilateral, atunci valoarea critic din tabelul cu valorile critice , ,
din anexa 2 va fi considerat pentru un nivel de confiden de 0,025:
, , , 76 .
U
inferioar 76 i limita superioar 184. Cele dou statistici calculate sunt n
C
afara acestui interval, deci ipoteza nul se respinge i se accept n
consecin ipoteza alternativ.
ES
R
U
Ca i testul pentru probe independente, i acesta este un test
parametric care necesit ca datele s ndeplineasc o serie de condiii de
C
aplicare:
ES
1. probele trebuie s fie extrase aleator din aceeai populaie sau s
provin n urma unor investigaii repetate asupra acelorai uniti
R
populaie:
Bilateral Unilateral
: 0 : 0 : 0
: 0 : 0 : 0.
.
94 Elemente de statistic aplicate n ecologie
C
ES
O alt valoare necesar pentru aflarea statisticii testului este eroarea
standard a mediei diferenelor ( ), care se calculeaz mprind deviaia
standard a mediei diferenelor ( ) la radical din numrul perechilor de
R
observaii ( ):
FI
.
ZA
U
scunde n mijloc ( ) 28 17 33 24 15 23 21 21 21 32 27 34
secunde lng perete ( ) 32 43 27 36 45 37 39 39 39 28 33 26
C
ES
n acest exemplu, sunt prezentate dou probe rezultate prin
investigarea acelorai uniti de prob (cei 12 gndaci) de dou ori: pentru
fiecare gndac exist timpul petrecut n mijlocul incintei i timpul petrecut
R
: 0
: 0
96 Elemente de statistic aplicate n ecologie
Se calculeaz diferenele dintre valorile fiecrei perechi:
28 17 33 24 15 23 21 21 21 32 27 34
32 43 27 36 45 37 39 39 39 28 33 26
4 26 6 12 30 14 18 18 18 4 6 8
10,67
12,397
U
,
3,579
C
,
2,98 .
ES
,
, , 1,796 .
M
Valoarea statisticii testului este mai mare dect valoarea critic, deci
ZA
U
C
ES
Diferenele n modul primesc apoi ranguri (| | ) la fel ca n
cazul testului Mann-Whitney. n dreptul fiecrui rang se specific ntre
paranteze semnul diferenei corespunztoare.
R
Valorile ale cror diferene sunt nule se elimin din analiz, ceea ce
FI
Ipotezele care se scriu n acest test sunt n esen similare cu cele ale
testului t pentru probe neindependente, cu excepia faptului c se refer la
sumele rangurilor diferenelor:
Bilateral Unilateral
: : :
: : : .
,
sau = , .
U
este egal cu suma rangurilor tuturor diferenelor (diferite de 0) att
C
pozitive, ct i negative:
ES
.
R
U
dac | | , 1,96 se respinge, se accept,
C
pentru 0,95
ES
Exemplul 7.4. S se rezolve problema din exemplul 7.4,
R
:
:
100 Elemente de statistic aplicate n ecologie
U
17 43 26 26 11 11 +
C
15 45 30 30 12 12 +
ES
Se calculeaz statisticile testului:
R
1,5 3,5 5 10
10 68 .
FI
M
, , 17 .
78 .
10 17 61 68
U
C
ES
R
FI
M
ZA
8. TESTAREA DIFERENELOR DINTRE TREI SAU MAI
MULTE PROBE
U
fiecare pereche de probe pn la epuizarea tuturor combinaiilor unice
C
posibile. De exemplu, dac exist trei probe A, B i C, atunci se face cte un
test Student pentru verificarea semnificaiei diferenei dintre A i B, dintre A
ES
i C i dintre B i C. Dac ns se compar 10 probe n loc de 3, atunci
analiza devine ceva mai dificil, pentru c trebuie efectuate 45 de teste
R
n realitate este adevrat. Cum valoarea cea mai uzual a lui este 0,05,
ZA
U
variabilitii este variana ( ), atunci descompunerea variabilitii poate fi
rezumat prin relaia:
C
ES
variana total;
variana extern sau dintre probe;
R
U
Ipotezele generale care se pot scrie n ANOVA sunt:
C
: probele au fost prelevate din populaii normal distribuite cu
ES
variane i medii egale.
: deoarece se presupune c varianele populaiilor sunt egale,
probele au fost prelevate din populaii cu medii diferite.
R
FI
ANOVA.
Se observ c se face referire la egalitatea varianelor interne ale
ZA
semnificativ.
Dac , ,
nu exist diferene semnificative ntre
varianele interne ale probelor pentru 1 .
Acest test se poate folosi doar dac toate probele conin acelai
numr de valori ( ).
Dac probele au dimensiuni diferite, atunci se recomand aplicarea
testului Bartlett. Statistica testului Bartlett este una de tip i se
calculeaz pornind de la gradele de libertate ale fiecrei probe ( 1, unde
ia valori de la 1 la numrul de probe ), de la variana fiecrei probe ( )
U
i de la variana medie balansat ( ).
C
ES
1 1
R
U
29 33 57 29 cruia este necesar calcularea varianelor probelor:
C
ES
76,97 124,97
159,88 180,63 .
R
FI
,
2,347 .
,
ZA
, , ,
5,67 .
Valoarea calculat este mai mic dect valoarea critic, deci se poate
considera c varianele probelor nu difer semnificativ sau variana intern
este omogen.
Dac se folosete testul Bartlett pentru aceleai date, trebuie
calculat media balansat a varianei:
Testarea diferenelor dintre trei sau mai multe probe 107
, , , ,
135,612 .
1 76,97 12 1 124,97 12 1
159,88 12 1 180,63 12 1 213,866 .
U
135,612 44 213,866 2,165 .
C
Se afl valoarea critic (anexa 2 sau anexa 3):
ES
, , 7,815 .
R
Statistica testului este mai mic dect valoarea critic, deci variana
FI
U
multifactorial, dac se iau n calcul mai muli factori. Modelele cele mai
frecvent utilizate n cercetrile ecologice sunt modelul unifactorial i cel
C
bifactorial.
ES
Un alt aspect caracteristic pentru ANOVA bifactorial este
interaciunea factorilor. Dac exist interaciune ntre factori, atunci se
utilizeaz modelul bifactorial cu replicare (cu numr egal de observaii n
R
Media Eroarea
Obs. = + Efectul +
general ntmpltoare.
U
C
ES
R
forma:
ZA
U
.
C
3. Se calculeaz numrul total de valori din toate probele ( ) prin
ES
nsumarea dimensiunilor tuturor probelor ( ):
R
.
FI
intern ( ):
1 1
.
Testarea diferenelor dintre trei sau mai multe probe 111
Sursa de variaie
Extern (ntre probe) /
U
Intern (n probe)
Total
C
ES
Condiia testului const n compararea statisticii cu o valoare
critic a distribuiei Snedecor-Fisher tabelat n funcie de , gradele de
libertate externe ( ) i gradele de libertate interne ( ) (anexa 2).
R
FI
Media
Probei
| | | | | |
| | | |
| |
U
Se calculeaz apoi pentru fiecare pereche de probe cte o statistic
C
a testului, pornind de la o valoare critic Tukey ( , , , anexa 2), suma
de ptrate medie intern ( ) i o medie armonic dintre dimensiunile
ES
probelor din fiecare pereche ( ). Dac probele au aceeai dimensiune, n
loc de se ia .
R
FI
M
, , ,
ZA
Exemplul 8.2. Pe baza datelor din exemplul 8.1 s se afle dac cele
patru probe sunt diferite semnificativ.
Testarea diferenelor dintre trei sau mai multe probe 113
Datele din exemplul 8.1 sunt distribuite n probe dup un singur
factor (zona), deci se realizeaz ANOVA unifactorial.
Ipotezele testului sunt:
U
Se calculeaz ptratul sumei totale prin adunarea sumelor valorilor
din fiecare prob i ridicarea sumei la ptrat:
C
ES
292 308 464 667 1731 2996361 .
12 12 12 12 48 .
M
fiecrei probe:
70026,083 .
75993 13568,813
70026,083 7601,896
13568,813 7601,896 5966,917 .
48 1 47 4 1 3 47 3 44 .
114 Elemente de statistic aplicate n ecologie
Se calculeaz sumele de ptrate medii:
, ,
2533,965 135,612 .
Sursa de variaie
U
Extern 7601,896 3 2533,965 18,685
C
Intern 5966,917 44 135,612
Total 13568,813 47
ES
Se afl valoarea critic tabelat (anexa 2) sau se calculeaz n funcie
R
2,816 .
M
, , ,
ZA
Media
, , ,
Probei
, 1,33 14,33 31,25
, 13 29,92
, 16,92
Testarea diferenelor dintre trei sau mai multe probe 115
, , , 3,79
,
3,79 12,74 .
Probele pentru care diferenele sunt mai mari dect statistica testului
sunt diferite semnificativ: proba difer semnificativ de probele i ,
proba difer semnificativ de probele i i proba difer semnificativ
de proba . Probele i nu difer semnificativ.
U
Pentru c probele au acelai numr de valori, se poate reprezenta
C
grafic intervalul de confiden pentru fiecare prob adunnd i scznd din
,
valoarea fiecrei medii statistica testului mprit la doi ( 6,37).
ES
Modul n care aceste intervale se suprapun arat care sunt probele diferite
semnificativ.
R
FI
70
M
60
50
ZA
40
x
30
20
10
0
A B C D
Proba
U
.
C
ES
Statistica testului se calculeaz pornind de la valoarea prezentat
anterior i numrul total de valori din toate probele ( ).
R
3 1
FI
M
Proba Proba
A 12 2 2,5 C 21 10 9,5
A 13 4 4,5 C 23 12 12
U
A 13 5 4,5 C 25 16 14,5
A 21 9 9,5 C 29 20 20
C
A 22 11 11 C 31 23 23
A 25 13 14,5 C 39 30 30
ES
A 25 14 14,5 C 41 32 31,5
A 28 17 17,5 C 46 34 34,5
A 29 19 20 C 46 35 34,5
R
A 30 22 22 C 52 37 37
FI
A 33 25 25,5 C 54 41 41
A 41 31 31,5 C 57 42 42
M
B 10 1 1 D 29 21 20
B 12 3 2,5 D 35 27 27
ZA
B 14 6 6 D 49 36 36
B 16 7 7 D 53 38 39
B 20 8 8 D 53 39 39
B 25 15 14,5 D 53 40 39
B 28 18 17,5 D 59 43 43
B 32 24 24 D 62 44 44
B 33 26 25,5 D 63 45 45
B 37 28 28 D 66 46 46
B 38 29 29 D 71 47 47
B 43 33 33 D 74 48 48
33518,458 3 48 1 24,013 .
, , 7,815 .
U
Se verific condiia testului:
C
24,013 7,815 se respinge i se accept pentru
ES
1 0,05 0,95 .
Testarea diferenelor dintre trei sau mai multe probe 119
Denumirea de model cu o singur observaie n celul vine de la
faptul c, ntr-o celul a tabelului, adic la intersecia unui nivel al unui
factor cu un nivel al celuilalt factor ( , ) sau, mai simplu, la intersecia
unui rnd cu o coloan, se gsete o singur valoare ( , ).
Denumirea de model cu observaii repetate provine de la un caz
particular n care rndurile sunt reprezentate de uniti de prob asupra
crora se fac observaii repetate. O astfel de situaie este similar cu cea n
care se compar dou probe neindependente cu ajutorul testului Student
pentru perechi de observaii (seciunea 7.2.1), cu deosebirea c n cazul
ANOVA se compar efectul a trei sau mai multe tratamente.
Conform acestui model orice observaie poate fi definit ca:
U
Media Eroarea
Obs. = + Efectul + Efectul +
C
general ntmpltoare.
ES
Efectul nivelurilor factorilor d variabilitatea extern (dintre probe),
iar eroarea ntmpltoare este rezultatul variabilitii interne (din cadrul
R
probelor).
n cazul acestui model, variabilitatea extern ( ) poate fi la rndul
FI
U
formulate astfel:
C
: mediile populaiilor corespunztoare nivelurilor primului factor
ES
( ) nu difer semnificativ;
: mediile populaiilor corespunztoare nivelurilor celui de-al
doilea factor ( ) nu difer semnificativ;
R
( ) difer semnificativ;
: mediile populaiilor corespunztoare nivelurilor primului factor
M
( ) difer semnificativ.
ZA
Sau
.
sau
.
sau
.
U
C
4. Se calculeaz suma rapoartelor dintre ptratul sumei i
dimensiunea fiecrei coloane:
ES
.
R
FI
.
122 Elemente de statistic aplicate n ecologie
7. Se calculeaz numrul gradelor de libertate totale ( ), pentru
coloane ( ), pentru rnduri ( ) i cele interne ( ):
1
1
1
1 1 1 .
U
C
ES
.
Sursa de variaie
M
An Se poate observa c
datele sunt organizate dup doi
U
3 7 10 18 factori: an i prob. Deci se poate
realiza un model bifactorial de
C
8 10 15 20
Proba 17 30 33 65 ANOVA. Dat fiind faptul c n
ES
8 11 31 60 fiecare celul exist o singur
valoare, se va realiza ANOVA
2 3 17 15
bifactorial fr replicare.
R
5 5 5 5 20 .
U
Se calculeaz suma rapoartelor dintre ptratul sumei i dimensiunea
C
fiecrei coloane:
ES
, , , ,
140,806 .
R
FI
fiecrui rnd:
ZA
, , , , ,
140,212 .
,
149,508 16,549
,
140,806 7,847
,
140,212 7,252
16,549 7,847 7,252 1,450 .
Testarea diferenelor dintre trei sau mai multe probe 125
Se calculeaz numrul gradelor de libertate:
20 1 19 4 1 3
5 1 4 4 1 5 1 12 .
U
, ,
C
Sursa de variaie
ES
Extern, ntre coloane 7,847 3 2,616 21,620
Extern, ntre rnduri 7,252 4 1,813 14,983
R
2 sau 3):
ZA
, , , 3,490 , , , 3,259 .
3,92 10 i 1,18 10 .
126 Elemente de statistic aplicate n ecologie
Concluzia testului este c modificrile induse de trecerea anilor
densitii plantei analizate sunt semnificative. De asemenea, exist i o
diferen semnificativ ntre suprafeele de prob din punctul de vedere al
densitii speciei analizate.
U
bifactorial parametric, cu deosebirea c se testeaz doar ipotezele i
C
referitoare la factorul ce determin aranjarea datelor n coloane.
Valorile fiecrui rnd primesc ranguri n mod independent.
ES
Rangurile pentru fiecare rnd se atribuie conform algoritmului prezentat n
seciunea 2.1, tab. 2.3.
R
3 1 .
Testarea diferenelor dintre trei sau mai multe probe 127
Condiia testului compar valoarea statisticii cu o valoare critic
tabelat (anexa 2) sau calculat (anexa 3) n funcie de i de numrul de
coloane minus unu grade de libertate ( 1).
U
dup care se aranjeaz datele pe coloane. Cu alte cuvinte, dac se respinge
C
ipoteza nul, concluzia este c exist o diferen semnificativ ntre coloane.
ES
Exemplul 8.5. S se rspund la ntrebarea de la exemplul 8.4
considernd c nu sunt ndeplinite condiiile de aplicare a ANOVA
R
1 2 3 4
1 2 3 4
1 2 3 4
1 2 3 4
1 2 4 3
5 10 16 19
128 Elemente de statistic aplicate n ecologie
5 10 16 19 742 .
742 35 4 1 14,04 .
U
, ,
Statistica testului este mai mare dect valoarea critic, deci se
C
respinge ipoteza nul ( ) i se accept ipoteza alternativ ( ).
ES
Probabilitatea ca ipoteza nul s fie adevrat se poate calcula
(anexa 3) i este egal cu 0,0029.
Concluzia testului este c probele (coloanele) difer semnificativ.
R
FI
celul.
La fel ca i la ANOVA bifactorial fr replicare, datele sunt grupate
ZA
C
ES
Evidenierea interaciunii se poate realiza prin vizualizarea grafic a
mediilor celulelor (a mediilor valorilor de la 1 la din fiecare celul). Dac
liniile care unesc mediile dup un factor sunt mai mult sau mai puin
R
x R1
R2
C1 C2
Figura 8.1. Interaciune absent
130 Elemente de statistic aplicate n ecologie
Dac liniile ce unesc mediile dup un factor sunt evident neparalele,
nseamn c ntre cei doi factori exist o interaciune sau efectele factorilor
asupra variabilei sunt neaditive. n figura 8.2, efectele factorului asupra
variabilei modific efectele factorului n sensul c pentru efectul
trecerii de la la const ntr-o scdere mai mare dect pentru .
x R1
U
R2
C
ES
C1 C2
R
n figura 8.3 este vorba tot de interaciune ntre factori, dar n acest
M
x R1
R2
C1 C2
Efect
Media Efect Efect Eroarea
Obs.= + + + Interaciune +
general ntmpltoare.
U
principiu a ANOVA bifactorial devine:
C
.
ES
Dac varianele sau sumele de ptrate medii ( ) le considerm
rapoarte ntre sumele de ptrate ( ) i grade de libertate ( ), atunci:
R
FI
.
M
vor emite dou ipoteze nule i dou ipoteze alternative pentru acelai test.
Pentru date experimentale ipotezele sunt formulate astfel:
U
( ) difer semnificativ;
: mediile populaiilor corespunztoare nivelurilor primului factor
C
( ) difer semnificativ;
ES
: mediile corespunztoare interaciunii nivelurilor factorilor
( , ) difer semnificativ.
R
( sau ):
sau
.
sau
.
Testarea diferenelor dintre trei sau mai multe probe 133
sau
sau
.
U
4. Se calculeaz suma rapoartelor dintre ptratul sumei i
C
dimensiunea fiecrei coloane:
ES
.
R
FI
sau
.
134 Elemente de statistic aplicate n ecologie
7. Se calculeaz sumele de ptrate: total ( ), dintre coloane ( ),
dintre rnduri ( ), de interaciune ( ) i cea intern ( ):
U
.
C
ES
8. Se calculeaz numrul gradelor de libertate totale ( ) pentru
coloane ( ), pentru rnduri ( ), pentru interaciune ( ) i
pentru cele interne ( ):
R
FI
1
1
M
1
1 1
ZA
.
Testarea diferenelor dintre trei sau mai multe probe 135
10. Cu rezultatele obinute se completeaz aa-numitul tabel
ANOVA n care se va gsi i statistica testului ( ):
Sursa de variaie
Extern, ntre coloane /
Extern, ntre rnduri /
Extern, de interaciune
/
(ntre celule)
Intern
U
Total
C
ES
Condiia testului const n compararea statisticii cu o valoarea
critic tabelat n funcie de , gradele de libertate externe ( ) i gradele
R
o probabilitate 1 .
Dac , , se respinge i se accept pentru
ZA
o probabilitate 1 .
Dac , , se respinge i se accept pentru
o probabilitate 1 .
Media
probei
| | | | | |
| | | |
| |
U
Se calculeaz apoi pentru statistica a testului pornind de la o
C
valoare critic Tukey ( , , , anexa 2), suma de ptrate medie intern
( ) i numrul valorilor dintr-o celul ( ).
ES
R
, ,
FI
U
122 142
118 131
C
120 135
Nestresant
ES
119 120
127 139
118 133
R
119 135
122 136
FI
165
160
stresant 157,4
155
150 nestresant
145
x 140
135 131,3 133,1
130
125 121,5
120
115
normal hipercaloric
Hran
138 Elemente de statistic aplicate n ecologie
Din analiza acestui grafic rezult c hrana hipercaloric determin o
cretere n greutate mai mare dect cea normal. Condiiile stresante
determin o cretere n greutate mai mare. Creterea n greutate cnd s-a
administrat hran hipercaloric i n condiii stresante este mai puternic
dect atunci cnd s-a administrat hran normal n condiii stresante. Deci s-
ar putea s existe o interaciune ntre cei doi factori.
Ipotezele acestui test sunt:
U
: interaciunea dintre tipul de hran i stres nu este semnificativ
C
(celulele nu difer semnificativ);
: tipul de hran are un efect semnificativ asupra greutii
ES
(coloanele difer semnificativ);
: stresul are un efect semnificativ asupra greutii (rndurile
R
difer semnificativ);
: interaciunea dintre tipul de hran i stres este semnificativ
FI
20 20 40 .
Testarea diferenelor dintre trei sau mai multe probe 139
Se calculeaz suma rapoartelor dintre ptratul sumei i dimensiunea
fiecrei coloane:
741490,45 .
740844,25 .
U
C
Se calculeaz suma rapoartelor dintre ptratul sumei i dimensiunea
fiecrei celule:
ES
744923,1 .
R
FI
745879 7941,775
741490,45 3553,225
740844,25 2907,025
744923,1 3553,225 2907,025 525,625
7941,775 3553,225 2907,025 525,625 955,9.
40 1 39 2 1 1
2 1 1 2 1 2 1 1
40 4 36 .
140 Elemente de statistic aplicate n ecologie
Se calculeaz sumele de ptrate medii:
, ,
3553,225 2907,025
, ,
525,625 26,553 .
U
Sursa de variaie
C
Extern, ntre coloane 3553,225 1 3553,225 133,82
Extern, ntre rnduri 2907,025 1 2907,025 109,48
ES
Extern, de interaciune
525,625 1 525,625 19,80
(ntre celule)
R
critic va fi aceeai (anexa 2 sau 3) pentru toate cele trei seturi de ipoteze:
ZA
, , , 4,113.
probabilitate 1 0,05.
109,48 4,113 se respinge i se accept pentru o
probabilitate 1 .
19,80 4,113 se respinge i se accept pentru o
probabilitate 1 .
U
157,4 35,9 24,3
C
ES
121,5 11,6
, , , 3,85 .
M
,
3,85 6,27 .
165
160 stresant
157,4
155 nestresant
150
145
x 140
135
131,3 133,1
130
125
121,5
120
115
U
normal hipercaloric
Hran
C
ES
R
FI
M
ZA
9. CORELAIA I REGRESIA
U
Corelaia este folosit pentru a determina dac exist asociere ntre
C
dou variabile i ct de puternic este aceast asociere. Prin asociere se
nelege c atunci cnd o variabil se modific cealalt se modific i ea
ES
ntr-un anumit mod. De remarcat c n cazul corelaiei nu se fac presupuneri
viznd asocieri de tipul cauz-efect ntre cele dou variabile, dei acestea ar
putea exista. Exist posibilitatea ca dinamica celor dou variabile s fie
R
determinat de o a treia.
FI
U
analiz a corelaiei, n timp ce situaiile B i C sunt probleme de analiz a
regresiei. Dei situaiile A i C pot conduce aparent la ideea c ambele
C
analize pot fi aplicate pe aceleai date, n realitate, aplicarea corelaiei sau
ES
regresiei este dictat de modul n care a fost obinut proba: n cazul A
proba era prelevat aleator, n timp ce n cazul C proba era prelevat
arbitrar, dup un anumit criteriu.
R
FI
y y
U
Corelaie pozitiv x
C
Corelaie negativ x
ES
y y
R
FI
M
pentru care este necesar completarea metodei grafice cu una statistic, mai
obiectiv. O astfel de metod ce surprinde msura n care dou variabile
sunt asociate const n calcularea coeficientului de corelaie .
Valoarea coeficientului de corelaie este cuprins ntre 1, valoarea
unei corelaii maxime negative, i 1, valoarea unei corelaii maxime
pozitive. Dac este cuprins ntre 0 i 1, corelaia este pozitiv, iar dac
este cuprins ntre 0 i 1, corelaia este negativ. Cnd este egal cu 0,
corelaia este absent. Cnd este egal cu 1 sau 1, punctele de
coordonate , sunt dispuse perfect liniar, n lungul unei drepte imaginare
(fig. 9.2, A i B). Dac variabilele urmrite sunt apreciate pe o scal
146 Elemente de statistic aplicate n ecologie
ordinal, exist o corelaie perfect cnd toate valorile cresc sau descresc
succesiv. n acest caz, punctele din graficul de corelaie pot s nu se afle
dispuse liniar (fig. 9.2, C).
y y y
A x B x C x
U
C
Corelaiile pentru care valoarea coeficientului este mai apropiat de
ES
1 sau 1 sunt corelaii puternice, pozitive sau, respectiv, negative, iar cele
pentru care valoarea coeficientului este mai apropiat de 0 sunt corelaii
slabe (tab. 9.1).
R
Puterea corelaiei
M
puternic
U
raport sau de interval;
3. valorile ambelor trebuie variabile s fie aproximativ normal
C
distribuite;
ES
4. relaia dintre cele dou variabile, dac exist, trebuie s fie liniar.
148 Elemente de statistic aplicate n ecologie
Pentru dou valori x i y, fiecare mai mare dect media sa ( i
), abaterile ( i ) lor vor fi pozitive i produsul lor, tot pozitiv.
Dac o pereche de valori i sunt mai mici dect mediile lor, atunci
ambele abateri vor fi negative. Produsul lor ns va fi pozitiv.
Dac o valoare este mai mic dect , iar o valoare este mai
mare dect , atunci abaterea lui va fi negativ, iar abaterea lui va fi
pozitiv. Ca urmare, produsul abaterilor va fi negativ. La fel se ntmpl
dac x este mai mare dect , iar y este mai mic dect .
Din punct de vedere grafic, produsele abaterilor vor fi pozitive sau
negative n funcie de poziia punctului de coordonate , fa de poziia
punctului de coordonate , , numit i centru mediu (fig. 9.3).
U
C
y
ES
+
y
R
+
FI
M
x x
ZA
y y
+
x x x x
U
surprins de covariana lor, de ce nu se utilizeaz acest descriptor ( ) n
C
loc de coeficientul de corelaie ( )? Din perspectiva corelaiei, covariana
prezint un dezavantaj: valoarea sa este influenat de unitile de msur
ES
ale variabilelor i , ceea ce face dificil comparaia. Pentru a elimina
acest neajuns, este nevoie s se realizeze o standardizare a covarianei ( )
R
ZA
Bilateral Unilateral
: 0 : 0 : 0
: 0 : 0 : 0.
U
corelaii pozitive semnificative, se utilizeaz al doilea set de ipoteze, iar n
cazul n care se urmrete semnificaia unei corelaii negative, se folosete
C
ultimul set de ipoteze.
ES
Statistica testului este una de tip Student ( ) i se calculeaz cu
ajutorul numrului de perechi de valori i ( ) i cu valoarea
coeficientului de corelaie Pearson ( ):
R
FI
.
M
ZA
Coeficientul de determinare
Valoarea coeficientului de corelaie Pearson ridicat la ptrat
reprezint o statistic util a datelor. Acesta arat proporia n care
variabilitatea uneia dintre cele dou variabile poate fi pus pe seama
variabilitii celeilalte. Coeficientul de determinare reprezint o proporie,
dar dac se nmulete cu 100, rezult procentul de valori ale celor dou
variabile care sunt realmente corelate. De exemplu, dac pentru dou
Corelaia i regresia 151
variabile oarecare 0,81, nseamn c 81% din valorile celor dou
variabile sunt realmente corelate. Coeficientul de determinare poate fi
considerat un descriptor standardizat al puterii corelaiei dintre dou
variabile.
Nr. crt. 1 2 3 4 5 6 7 8 9 10 11 12
cm (x) 49 150 153 146 164 66 160 215 228 222 260 325
g (y) 2,5 3,6 3,6 3,8 4 4,5 4,7 9,3 10,5 10,9 14 21
U
Nr. crt. 13 14 15 16 17 18 19 20 21 22 23 24
cm (x) 340 430 390 373 425 450 389 422 418 435 459 470
C
g (y) 22 30 33,5 38,4 40 41 46,3 49,8 53,3 57 72,2 76,7
ES
Inspectarea graficului de corelaie arat o relaie uor curb ntre cele
dou variabile, ceea ce nseamn c ultima condiie de aplicare a corelaiei
R
90
M
80
ZA
70
60
50
y
40
30
20
10
0
0 100 200 300 400 500
x
152 Elemente de statistic aplicate n ecologie
n urma logaritmrii valorilor i n diferite combinaii se observ
c logaritmarea doar a valorilor greutilor ndreapt cel mai bine relaia
dintre cele dou variabile.
Nr, crt, 1 2 3 4 5 6 7 8 9 10 11 12
x 49 150 153 146 164 66 160 215 228 222 260 325
y=ln(y) 0,916 1,281 1,281 1,335 1,386 1,504 1,548 2,230 2,351 2,389 2,639 3,045
Nr, crt, 13 14 15 16 17 18 19 20 21 22 23 24
x 340 430 390 373 425 450 389 422 418 435 459 470
y=ln(y) 3,091 3,401 3,512 3,648 3,689 3,714 3,835 3,908 3,976 4,043 4,279 4,340
5
4.5
U
4
3.5
C
3
y'=ln(y)
ES
2.5
2
1.5
R
1
FI
0.5
0
M
0,975 0,95 .
Corelaia i regresia 153
Valoarea coeficientului de determinare arat c 95% din valorile
celor dou variabile sunt realmente corelate.
Pentru a afla dac aceast corelaie evideniat la nivel de prob este
semnificativ i la nivel de populaie, trebuie efectuat testul de semnificaie
a corelaiei. Avnd n vedere modul de formulare a ntrebrii problemei,
ipotezele testului sunt:
: 0
: 0.
U
0,975 20,54 .
C
, ES
Se afl valoarea critic pentru un test unilateral (anexa 2 sau 3):
1,717 .
R
, ,
FI
U
1 .
C
ES
Valoarea coeficientului Spearman are aceleai proprieti
informaionale ca i cea a coeficientului Pearson: ia valori ntre 1 i 1,
semnul valorii indic, dup caz, o corelaie pozitiv sau negativ; o valoare
R
49 2,5 1 1 0 0
150 3,6 4 2,5 1.5 2,25
153 3,6 5 2,5 2.5 6,25
U
146 3,8 3 4 -1 1
164 4 7 5 2 4
C
66 4,5 2 6 -4 16
160 4,7 6 7 -1 1
ES
215 9,3 8 8 0 0
228 10,5 10 9 1 1
222 10,9 9 10 -1 1
R
260 14 11 11 0 0
FI
325 21 12 12 0 0
340 22 13 13 0 0
M
430 30 20 14 6 36
390 33,5 16 15 1 1
ZA
373 38,4 14 16 -2 4
425 40 19 17 2 4
450 41 22 18 4 16
389 46,3 15 19 -4 16
422 49,8 18 20 -2 4
418 53,3 17 21 -4 16
435 57 21 22 -1 1
459 72,2 23 23 0 0
470 76,7 24 24 0 0
130,5
30
25
20
Ry 15
10
5
U
0
0 5 10 15 20 25 30
Rx
C
ES
Pentru testarea semnificaiei se aplic testul la fel ca n exemplul 9.1.
R
: 0.
M
0,943 13,324 .
,
, , 1,717 .
U
eroarea aleatoare.
C
n cazul regresiei liniare simple, relaia are urmtoarea form:
ES
media populaional a valorilor corespunztoare unei valori
R
y=+x
x
y
0 x
Figura 9.5. Explicaia grafic a funcie regresiei liniare
158 Elemente de statistic aplicate n ecologie
Analiza regresiei presupune urmtoarele aspecte:
U
Analiza regresiei presupune o serie de condiii:
C
ES
1. Variabila independent ( ) este fixat, adic valorile acesteia sunt
alese arbitrar i nu aleator din populaie.
2. Pentru orice valoare a variabilei independente ( ) exist o
R
particular :
ZA
4. .
5. reziduu sau eroare ntmpltoare; arat msura n care o
valoare observat a lui difer de media valorilor lui ( ); are
U
C
ES
R
FI
M
ZA
Figura 9.6. Variaia variabilei dependente cnd variabila independent nu este luat
n consideraie
U
C
ES
Figura 9.7. Variaia variabilei dependente cnd variabila independent este luat n
R
consideraie
FI
U
atunci nseamn c variabila nu este dependent de (aceast proprietate
C
a lui este similar cu cea a coeficientului de corelaie populaional ).
ES
H0: =0
H1: 0
R
Sursa de variabilitate
Extern 1 /
Intern
Total 1
U
1 .
C
Intervalul de confiden al coeficientului de regresie
ES
Coeficientul de regresie n prob b este o estimare a coeficientului de
regresie populaional . Deci i sunt diferii, dar se poate calcula
intervalul de confiden pentru cu ajutorul erorii standard a lui ( ):
R
FI
.
M
ZA
,
,
, .
Coeficientul de determinare
Se tie c variana lui poate fi explicat n bun msur de
cunoaterea variabilei , totui o parte rmne neexplicat. Este vorba de
Corelaia i regresia 163
variana intern. Dac valorile lui ar fi complet dependente de valorile lui
, atunci erorile aleatoare ( ) ar fi egale cu zero, adic toate punctele de
coordonate , ar fi exact pe dreapta de regresie.
n cazul analizei regresiei, coeficientul de determinare ( ) arat
proporia varianei lui explicat prin dependena de .
Formula de calcul a lui este la fel ca n cazul analizei corelaiei.
Totui, pentru a simplifica calculul i pentru a folosi valori deja calculate n
etapele anterioare ale analizei regresiei, se poate calcula i dup
urmtoarea formul:
U
Ca i n cazul analizei corelaiei, valoarea coeficientului de
C
determinare se poate nmuli cu 100 pentru a obine un procent, care, n
ES
analiza regresiei, arat ct la sut dintre valorile lui sunt dependente sau
determinate de valorile lui . Diferena 100 % arat variana individual
sau rezidual care nu poate fi explicitat de valorile lui .
R
FI
,
,
, .
164 Elemente de statistic aplicate n ecologie
Concluzia va fi c intervalele - pentru fiecare valoare x includ
mediile populaiilor de valori ( ) cu o probabilitate de 1 .
Unirea limitelor inferioare ntre ele i a celor superioare ntre ele,
obinute pentru fiecare valoare , duce la reprezentarea grafic a zonei de
confiden a dreptei n ansamblu (fig. 9.8). Deci dreapta de regresie n
populaia din care s-a extras proba se poate gsi ntre liniile ce unesc
limitele inferioare i cele superioare, cu o probabilitate de 1 .
U
valoare va fi mai larg dect cel al dreptei de regresie. Intervalul se afl
C
folosind relaiile de mai sus, doar c se modific formula erorii standard a
unui punct de pe dreapt prin adugarea unei uniti la valoarea dintre
ES
parantezele ptrate.
R
1
FI
,
,
, .
zona de confiden a
dreptei de regresie
U
x
C
Figura 9.8. Zona de confiden a dreptei de regresie i pentru o valoare unic
ES
Abordarea relaiilor neliniare
Numeroase relaii dintre variabile biologice nu sunt rectilinii. Un
R
dac , atunci i ;
dac i , atunci .
U
2 150 1,281 192,140
3 153 1,281 195,983
C
4 146 1,335 194,910
5 164 1,386 227,352
ES
6 66 1,504 99,269
7 160 1,548 247,610
8 215 2,230 479,453
R
0,3886 0,00813 .
H0: =0
U
H1: 0 .
,
0,00813 23471,976 27,96
FI
24 1 23
2 1 1
24 2 22 .
Sursa de variabilitate
Extern 27,96 1 27,96 422,05
Intern 1,46 22 0,0663
Total 29,42 23
, , , 4,301 .
U
respinge ipoteza nul i se accept ipoteza alternativ pentru o probabilitate
C
de 0,95. Probabilitatea calculat a ipotezei nule pentru statistica testului
(anexa 3) este 7,6 10 .
ES
Concluzia testului este c exist o relaie de tip cauz-efect
semnificativ ntre cele dou variabile, definit de funcia de regresie
R
estimat.
FI
, , 2,074 .
,
0,7868 2,074 0,0663 0,5557
,
0,7868 2,074 0,0663 1,0179 .
cm ( ) ln(g) ( )
49 0,9163 0,7868 0,1114 0,5557 1,0179
150 1,2809 1,6076 0,0785 1,4448 1,7704
U
153 1,2809 1,6319 0,0776 1,4709 1,7929
146 1,3350 1,5751 0,0797 1,4098 1,7403
C
164 1,3863 1,7213 0,0745 1,5669 1,8758
66 1,5041 0,9249 0,1056 0,7060 1,1439
ES
160 1,5476 1,6888 0,0756 1,5320 1,8456
215 2,2300 2,1358 0,0618 2,0075 2,2640
228 2,3514 2,2414 0,0593 2,1185 2,3644
R
,
2,8265 2,074 0,0663 1
2,2295
,
2,8265 2,074 0,0663 1
3,4235 .
U
C
16,8864 9,2956
ES 30,6760 .
4.5
FI
4
M
3.5
ZA
3
y'=ln(y)
2.5
2 Li
1.5 Ls
300 cm
1
0.5
0 100 200 300 400 500
x
10. ANALIZA FRECVENELOR I A DATELOR
NOMINALE
U
este o distribuie a varianei probei. Distribuia este asimetric fa de
C
variana populaional ( ). Partea stng a distribuiei ajunge la 0, n timp
ce cea dreapt poate atinge, teoretic, infinitul. Cu ct numrul gradelor de
ES
libertate crete, cu att distribuia devine mai simetric, iar n cazul probelor
cu mai mult de 100 de uniti de prob ( 100) distribuia tinde s devin
R
normal.
mprirea frecvenelor la numrul total de observaii duce la
FI
distribuiei .
1 gl
3 gl
f
10 gl
s2
Figura 10.1. Distribuia varianei probei pentru 1, 3 i 10 grade de libertate
172 Elemente de statistic aplicate n ecologie
9 gl
p=0,05
p=0,95
U
C
16,92 2
ES
Figura 10.2. Distribuia 2 cu zona de respingere a ipotezei nule pentru o probabilitate
de 0,05
R
U
1. Variabila trebuie s fie nominal; categoriile scalei nominale ale
C
cror frecvene sunt urmrite trebuie s nu se suprapun.
ES
2. Observaiile sunt independente.
3. Frecvenele estimate trebuie s fie mai mari sau egale cu 5 sau,
dac exist mai multe categorii, 80% dintre acestea trebuie s aib
R
1
numrul categoriilor (claselor de frecven)
numrul parametrilor populaionali estimai.
U
pentru continuitate. Aceasta nltur posibilitatea obinerii unor valori prea
mari ale statisticii testului. Corecia const n scderea valorii 0,5 din
C
valoarea absolut a diferenei dintre frecvena observat i cea teoretic a
ES
fiecrei componente a formulei lui . Astfel, formula devine:
| |
R
,
.
FI
Frecvene Frecvene
observate ( ) estimate ( )
Masculi 12 8
Femele 4 8
Total 16 16
| | , | | ,
3,0625
U
C
Valoarea critic , , 3,84 (anexa 2 sau 3). Deoarece statistica
ES
testului este mai mic dect valoarea critic, nu se poate respinge ipoteza
nul pentru 0,05. Probabilitatea ca ipoteza nul s fie adevrat (anexa
3) este 0,08, adic mai mare dect pragul de confiden de 0,05.
R
teoretice.
0 7 5,727
1 16 16,379 0 7 5,727
2 25 23,422 1 16 16,379
3 18 22,329 2 25 23,422
4 16 15,965 3 18 22,329
5 10 9,132 4 16 15,965
6 5 4,353 5 10 9,132
7 2 1,778 6+7+8 8 6,767
8 1 0,636
U
Statistica testului se poate afla calculnd valoarea raportului pentru
fiecare pereche de frecvene, dup care se nsumeaz.
C
ES
, , , ,
, , , ,
, , ,
1,544
R
, , ,
FI
distribuiei Poisson) i nc 1:
7 1 1 5.
U
folosesc dou variabile. De exemplu, un individ poate fi clasificat n funcie
de sex i clas de vrst, specie i habitat etc. n astfel de cazuri, frecvenele
C
se distribuie pe dou sau mai multe rnduri, rezultnd aa-numitul tabel sau
ES
matrice de contingen. Acestea permit investigarea asocierii dintre
variabile. Unul dintre cele mai frecvent utilizate teste care verific
semnificaia asocierii dintre variabilele apreciate pe o scal nominal este
R
variabilele nominale.
M
Condiii de aplicare:
ZA
3. 80% dintre frecvenele estimate trebuie s fie mai mari sau egale
cu 5 i nici o frecven estimat s nu fie 0; deci, pentru o matrice
de contingen de 2 2, toate celulele trebuie s aib o valoare
calculat teoretic mai mare sau egal cu 5.
Variabila (Coloan)
Total pe rnd ( )
Valori ( ) ( )
( )
(Rnd) ( )
Total general ( )
Total pe coloan ( )
U
C
.
ES
La fel se procedeaz i pentru celelalte celule ale matricei de
contingen:
R
FI
M
ZA
.
Analiza frecvenelor i a datelor nominale 179
Dac matricea de contingen are dou linii i dou coloane, atunci
se utilizeaz corecia Yates pentru continuitate, la fel ca n cazul testului
de concordan.
| | ,
Cnd exist mai multe categorii nominale ale celor dou variabile
analizate, atunci matricea de contingen poate avea mai mult de dou
U
rnduri i dou coloane. n acest caz, metoda de calcul a frecvenelor
estimate i a statisticii testului este aceeai cu cea folosit pentru o matrice
C
de contingen cu dou rnduri i dou coloane ( ), cu excepia
ES
faptului c n formula de calcul a statisticii testului nu se mai aplic corecia
Yates pentru continuitate.
R
Datele sunt sub form de frecvene, iar erpii pot aparine doar la una
din cele dou categorii definite de valorile variabilei nominale sex. Deci
primele dou condiii de aplicare a testului sunt respectate de datele obinute
n urma analizei probelor.
Se alctuiete tabelul de contingen:
Variabila Migraia
Valori Migratori Nemigratori
Femel 25 2 27
Sex
Mascul 4 30 34
29 32 =61
180 Elemente de statistic aplicate n ecologie
SexMigraia
Migratori 25 (2729)/61=12,8360
Femel
Nemigratori 2 (2732)/61=14,1639
Migratori 4 (3429)/61=16,1639
Mascul
Nemigratori 30 (3432)/61=17,8360
U
C
: nu exist asociere semnificativ ntre migraie i sex
: exist o asociere semnificativ ntre migraie i sex.
ES
Dat fiind c numrul gradelor de libertate este 1 ( 1 1
R
| , | , | , | , | , | ,
, , ,
M
| , | ,
36,2484
,
ZA
Datele sunt sub form de frecvene, iar o pup poate aparine doar la
o singur specie i poate proveni doar dintr-o singur ap curgtoare. Deci
primele dou condiii ale testului de asociere sunt ndeplinite.
Se scrie matricea de contingen 3 3.
Variabila Habitat
Valori Oligotrofic Mezotrofic Eutrofic
10 12 35 57
Specia 7 26 11 44
U
28 13 9 50
C
45 51 55 =151
ES
Se calculeaz valorile estimate:
R
sp. Habitat
Oligotrofic 10 (4557)/151=16,9868
FI
Mezotrofic 12 (5157)/151=19,2517
M
Eutrofic 35 (5557)/151=20,7614
Oligotrofic 7 (4544)/151=13,1126
ZA
Mezotrofic 26 (5144)/151=14,8609
Eutrofic 11 (5544)/151=16,0265
Oligotrofic 28 (4550)/151=14,9007
Mezotrofic 13 (5150)/151=16,8874
Eutrofic 9 (5550)/151=18,2119
, , , ,
, , , ,
, , , ,
, , , ,
,
45,2155
,
U
Valoarea statisticii testului este mai mare dect valoarea critic,
C
ipoteza nul se respinge i se accept ipoteza alternativ pentru o
probabilitate 0,05 (95%). Probabilitatea ca ipoteza nul s fie
ES
adevrat este 8,3 10 , deci foarte mic.
Se poate trage concluzia c exist o asociere semnificativ ntre
R
pentru specia , frecvena observat a fost mai mare dect cea estimat n
apele eutrofe; pentru specia , frecvena observat a depit-o pe cea
estimat n apele mezotrofe; pentru specia , frecvena observat a fost mai
U
contingen:
C
Valoarea
ES
Total
variabilei
prezent absent
Rnd ( )
( ) ( )
R
prezent ( )
FI
absent ( )
M
Total coloan ( )
ZA
Bilateral Unilateral
: nu exist : indivizii care prezint nu au tendina s
asociere ntre i . prezinte , iar cei care nu prezint au tendina s
prezinte .
: exist asociere : indivizii care prezint au tendina s
ntre i . prezinte i , iar cei care nu prezint au tendina
s nu prezinte nici .
U
.
C
ES
Se calculeaz probabilitatea ( ) pentru fiecare matrice a crei
disproporii ( ) este mai mare sau egal cu disproporia matricei iniiale,
conform relaiei
R
! ! ! !
FI
.
! ! ! ! !
M
s fie adevrat. Se respinge ipoteza nul dac suma probabilitilor este mai
mic dect pragul de semnificaie (0,05).
Dac testul se aplic n varianta bilateral, atunci se nsumeaz
probabilitile date de toate matricele din ambele capete ale seriei cu
U
Reacie de scpare
C
da Nu
da 6 1
ES
Stimul de deasupra capului
nu 1 6
exemplu.
ZA
Ipotezele testului:
Bilateral Unilateral
#1 #2 #3 #4
0 7 1 6 2 5 3 4
7 0 6 1 5 2 4 3
, 0,42 0,14
#5 #6 #7 #8
4 3 5 2 6 1 7 0
3 4 2 5 1 6 0 7
U
0,14 0,42 ,
C
ES
Matricele care au mai mare sau egal cu matricei iniiale (#7)
sunt matricele #1, #2 i #8. Deci pentru acestea se vor calcula
R
probabilitile:
FI
! ! ! !
#1 0,00029
! ! ! ! !
M
! ! ! !
#2 0,01427
! ! ! ! !
ZA
! ! ! !
#8 0,00029 .
! ! ! ! !
#1 #2 #7 #8
0,00029 0,01427 0,01427 0,00029 0,0291 .
Analiza frecvenelor i a datelor nominale 187
Dac testul se aplic n variant unilateral, atunci probabilitatea
ipotezei nule va fi suma probabilitilor calculate pe baza matricelor #7 i
#8:
#7 #8
0,01427 0,00029 0,0145 .
U
corespunztoare celor dou variante au o probabilitate foarte mic (mai mic
de 0,05). Deci se poate accepta fie c exist o asociere semnificativ ntre
C
stimulare i reacia de scpare, fie c exist o asociere semnificativ ntre
ES
stimularea de deasupra capului i apariia reaciei de scpare. Evident, al
doilea rezultat (varianta unilateral) este n cazul experimentului prezentat
mai valoros, deoarece ofer un plus de informaie.
R
FI
Tratament Tratament 1
Rspuns Rspuns 1 Rspuns 2
Rspuns 1
Tratament 2
Rspuns 2
U
Indivizii care i-au modificat comportamentul ocup poziiile i
C
(indivizii din au dat rspunsul 2 la tratamentul 1 i rspunsul 1 la
tratamentul 2; indivizii din au dat rspunsul 1 la tratamentul 1 i rspunsul
ES
2 la tratamentul 2). Indivizii din poziiile i d nu i-au modificat rspunsul
(indiferent de tratament ei au dat fie rspunsul 1, fie 2).
R
| |
M
.
ZA
0,5 ,
!
.
! !
Analiza frecvenelor i a datelor nominale 189
U
amplexus) i apoi un altul n zona spatelui. Rezultatele au fost urmtoarele:
25 au reacionat prin emiterea sunetului de eliberare doar n urma stimulrii
C
axilare, 2 au emis sunetul cnd au fost stimulai doar dorsal, 3 au emis
ES
sunetul n urma ambelor stimulri i 1 nu a reacionat la niciunul dintre
stimuli. Exist o modificare semnificativ a comportamentului n funcie de
zona n care este aplicat stimulul?
R
FI
individ a fost supus ambelor tratamente: o dat a fost stimulat axilar, iar a
doua oar, dorsal. Deci pentru testarea semnificaiei asocierii dintre
comportament i zona stimulat trebuie aplicat testul McNemar.
U
Pe baza acestor date se calculeaz statistica a testului McNemar:
C
| |
17,926 .
ES
Se afl valoarea critic (anexa 2 sau 3) pentru 0,05 i 1 grad de
R
, , 3,841 .
M
Valoarea statisticii testului este mai mare dect valoarea critic, deci
ZA
n acest caz, media dintre i este 4,5 (o valoare mai mic dect
5) i, ca urmare, statistica testului nu mai este aproximat de distribuia 2.
n aceast situaie se folosete un test exact bazat pe distribuia binomial,
cu 0,5 i .
U
ipotezei nule este 0,0019, deci putem accepta ipoteza alternativ conform
C
creia exist o schimbare semnificativ a comportamentului n funcie de
ES
locul unde s-a aplicat stimulul.
R
FI
M
ZA
BIBLIOGRAFIE
Andrei T., Stancu S. (1995): Statistica teorie i aplicaie. Editura All.
Armitage P., Colton T. (2005): Encyclopedia of Biostatistics, 2nd edition.
John Wiley and Sons, Ltd.
Bailey T.J.N. (1981): Statistical Methods in Biology, 2nd edition.
Cambridge University Press.
Bart J., Fligner M.A., Notz W.I. (2004): Sampling and statistical methods
for behavioral ecologists. Cambridre University Press.
Bennett P.D., Humphries A.D. (1977): Introduction to Field Biology.
U
Edward Arnold (Publishers) Ltd.
C
Bishop O.N. (1971): The Principles of Modern Biology Statistics for
Biology, 2nd edition. Longman.
ES
Cann A.J. (2002): Maths from Scratch for Biologists. John Wiley & Sons,
Ltd.
Ceapoiu M. (1968): Metode statistice aplicate n experienele agricole i
R
Constelaii, Bucureti.
Dragomirescu L. (1999): Lucrri practice de biostatistic. Editura Ars
Docendi, Bucureti.
Dytham C. (2003): Choosing and Using Statistics: A Biologists Guide, 2nd
U
Analysis for Field Studies, 2nd edition. Kluwer Academic
Publishers.
C
Michelson S., Schofield S. (2002): The Biostatistics Cookbook: The most
ES
user-friendly guide for the bio/medical scientist. Kluwer Academic
Publishers.
Morisita M. (1962): I-Index, a measure of dispersion of individuals. Res.
R
Decker Inc.
Prvu C. (1999): Ecologie general. Editura Tehnic, Bucureti.
Petrie A., Sabin C. (2000): Medical Statistics at a Glance. Blackwell
Science Ltd.
Postelnicu V., Coatu S. (1980): Mica enciclopedie matematic (traducere
dup Kleine Enzyklopadie der Mathematik ed. VI-a, 1971 i
Mathematics at a glance, 1975). Editura Tehnic, Bucureti.
Simionescu V. (1983): Lucrri practice de ecologie. Editura Universitii
Al.I. Cuza Iai.
Slingsby D., Cook C. (1992): Practical Ecology. Macmillan Distribution
Ltd.
Smith R.L. (1996): Ecology and Field Biology, 5th edition. Harper Collins
College Publishers.
194 Elemente de statistic aplicate n ecologie
Snedecor W.G. (1968): Metode statistice aplicate n cercetrile de
agricultur i biologie (traducere din limba englez). Bucureti.
Southwood T.R.E. (1966): Ecological Methods with Particular Reference to
the Study of Insect Populations. London, Methuen and co. LTD.
Stan Gh. (1994): Metode statistice cu aplicaii n cercetrile entomologice
(IV). Bul. Inf. Soc. Lepid. Rom., 5 (1): 13-25.
Stan Gh., 1994, Metode statistice cu aplicaii n cercetrile entomologice
(V). Bul. Inf. Soc. Lepid. Rom., 5 (2): 113-126.
Stan Gh. (1994): Metode statistice cu aplicaii n cercetrile entomologice
(VI). Bul. Inf. Soc. Lepid. Rom., 5 (3-4): 257-280.
Stan Gh. (1995): Metode statistice cu aplicaii n cercetrile entomologice
(VII). Bul. Inf. Soc. Lepid. Rom., 6 (1-2): 67-96.
U
Stiling, P.D. (2001): Ecology Theories and Applications, 4th edition.
Prentice Hall.
C
Varvara M. (2000): Curs de Ecologie, vol. 1. Editura Universitii Al.I.
ES
Cuza Iai.
Varvara M., Zamfirescu .R., Neacu V. (2001): Lucrri practice de
ecologie manual. Editura Universitii Al.I. Cuza Iai.
R
From the Floristic Reserve The Secular Hayfields From Valea Lui
David Iai, Romnia. Journal of Ecology and Safety, International
M
U
a. o singur variabil (ex: lungimea, greutatea, numr de
C
indivizi) 3
b. dou variabile (ex: lungimea i greutatea) 13
ES
3. Numrul probelor analizate:
R
a. o singur prob 4
b. mai multe probe 5
FI
4. Scopul analizei:
M
Statistica descriptiv.
b. compararea mediei cu o valoare control Testul Student
(t) pentru o prob.
5. Numrul probelor:
a. 2 probe 6 (Teste pentru 2 probe) 6
b. 3 sau mai multe probe 9 (ANOVA) 9
6. Independena observaiilor:
a. observaii independente (probele provin din populaii
diferite) 7
b. observaii neindependente (probele provin din aceeai
populaie sau sunt obinute prin efectuarea unor observaii
repetate asupra acelorai uniti de prob) 8
196 Elemente de statistic aplicate n ecologie
7. Distribuia valorilor i scala de apreciere a variabilei:
a. distribuie aproximativ normal, scal de interval sau de
raport Testul Student (t) pentru observaii
independente.
b. distribuie diferit de cea normal, scal de interval, de raport
sau ordinal Testul Mann-Whitney (U).
U
perechi.
C
9. Numrul factorilor (tratamente) care influeneaz probele:
ES
a. 1 singur factor (tratament) 10
b. 2 factori (tratamente) 11
R
U
corelaie Spearman).
C
15. Scopul analizei:
ES
a. concordana dintre distribuia frecvenelor observate i cea a
frecvenelor estimate conform unei distribuii teoretice,
cunoscute Testul Chi-Ptrat de concordan.
R
U
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
C
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
ES
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
R
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
FI
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
M
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
ZA
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
ANEXA 2: Tabele cu valori critice 199
U
10 2,228 1,812
11 2,201 1,796
C
12 2,179 1,782
13 2,160 1,771
ES
14 2,145 1,761
15 2,131 1,753
16 2,120 1,746
R
17 2,110 1,740
18 2,101 1,734
FI
19 2,093 1,729
20 2,086 1,725
M
21 2,080 1,721
22 2,074 1,717
ZA
23 2,069 1,714
24 2,064 1,711
25 2,060 1,708
26 2,056 1,706
27 2,052 1,703
28 2,048 1,701
29 2,045 1,699
30 2,042 1,697
40 2,021 1,684
60 2,000 1,671
100 1,984 1,660
120 1,980 1,658
1,960 1,645
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1
- - - - - - - - - - - - - - - - - - - - 1 200
2 2 2 2 1 1 1 1 1 0 0 0 0 - - - - - - - 2
8 7 7 6 6 5 5 4 4 3 3 2 2 1 1 0 - - - - 3
14 13 12 11 11 10 9 8 7 6 5 4 4 3 2 1 0 - - - 4
20 19 18 17 15 14 13 12 11 9 8 7 6 5 3 2 1 0 - - 5
27 25 24 22 21 19 17 16 14 13 11 10 8 6 5 3 2 1 - - 6
,
34 32 30 28 26 24 22 20 18 16 14 12 10 8 6 5 3 1 - - 7
ZA
41 38 36 34 31 29 26 24 22 M19 17 15 13 10 8 6 4 2 0 - 8
48 45 42 39 37 34 31 28 26 23 20 17 15 12 10 7 4 2 0 - 9
(bilateral),
55 52 48 45 42 39 36 33 29 26 23 21 17 14 11 8 5 3 0 - 10
FI
62 58 55 51 47 44 40 37 33 30 26 23 19 16 13 9 6 3 0 - 11
,
R
69 65 61 57 53 49 45 41 37 33 29 26 22 18 14 11 7 4 1 - 12
76 72 67 63 59 54 50 45 41 37 33 28 24 20 16 12 8 4 1 - 13
ES
83 78 74 67 64 59 55 50 45 40 36 31 26 22 17 13 9 5 1 - 14
C
90 85 80 75 70 64 59 54 49 44 39 34 29 24 19 14 10 5 1 - 15
(unilateral)
U
98 92 86 81 75 70 64 59 53 47 42 37 31 26 21 15 11 6 1 - 16
105 99 93 87 81 75 67 63 57 51 45 39 34 28 22 17 11 6 2 - 17
Valorile critice ale statisticii U pentru testul Mann-Whitney pentru
112 106 99 93 86 80 74 67 61 55 48 42 36 30 24 18 12 7 2 - 18
U
15 25 30
C
16 29 35
17 34 41
ES
18 40 47
19 46 53
20 52 60
R
21 58 67
22 65 75
FI
23 73 83
24 81 91
M
25 89 100
26 98 110
ZA
27 107 119
28 116 130
29 126 140
30 137 151
35 195 213
40 264 286
45 343 371
50 434 466
60 648 690
70 907 960
80 1211 1276
90 1560 1638
100 1955 2045
202 Elemente de statistic aplicate n ecologie
Valorile critice pentru testul (Hatley) pentru ,
2 3 4 5 6 7 8 9 10 11 12
2 39,0 87,5 142 202 266 333 403 475 550 626 704
3 15,4 27,8 39,2 50,7 62,0 72,9 83,5 93,9 104 114 124
4 9,6 15,5 20,6 25,2 29,5 33,6 37,5 41,1 44,6 48,0 51,4
5 7,15 10,8 13,7 16,3 18,7 20,8 22,9 24,7 26,5 28,2 29,9
6 5,82 8,38 10,4 12,1 13,7 15,0 16,3 17,5 18,6 19,7 20,7
7 4,99 6,94 8,44 9,70 10,8 11,8 12,7 13,5 14,3 15,1 15,8
8 4,43 6,00 7,18 8,12 9,03 9,78 10,5 11,1 11,7 12,2 12,7
9 4,03 5,34 6,31 7,11 7,80 8,41 8,95 9,45 9,91 10,3 10,7
10 3,72 4,85 5,67 6,34 6,92 7,42 7,87 8,28 8,66 9,01 9,34
12 3,28 4,16 4,79 5,30 5,72 6,09 6,42 6,72 7,00 7,25 7,48
15 2,86 3,54 4,01 4,37 4,68 4,95 5,19 5,40 5,59 5,77 5,93
U
20 2,46 2,95 3,29 3,54 3,76 3,94 4,10 4,24 4,37 4,49 4,59
30 2,07 2,40 2,61 2,78 2,91 3,02 3,12 3,21 3,29 3,36 3,39
C
60 1,67 1,85 1,96 2,04 2,11 2,17 2,22 2,26 2,30 2,33 2,36
ES
1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00
2 3 4 5 6 7 8 9 10
FI
U
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98
C
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85
ES
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35
4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24
R
25
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16
FI
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99
M
120 3,92 3,07 2,68 2,45 2,29 2,17 2,09 2,02 1,96 1,91
ZA
204 Elemente de statistic aplicate n ecologie
U
11 3,053 4,575 5,578 17,275 19,675 24,725 31,264
C
12 3,571 5,226 6,304 18,549 21,026 26,217 32,909
13 4,107 5,892 7,042 19,812 22,362 27,688 34,528
ES
14 4,660 6,571 7,790 21,064 23,685 29,141 36,123
15 5,229 7,261 8,547 22,307 24,996 30,578 37,697
16 5,812 7,962 9,312 23,542 26,296 32,000 39,252
R
U
poate activa astfel: pentru versiunea 97-2003 se alege Tools > Add-Ins;
C
n versiunea 2007 se alege Office Button > Excel Options > Add-Ins.
ES
FUNCII SPECIALE N ORDINEA SECIUNILOR DIN CARTE:
=MAX(ref)
Returneaz valoarea maxim a unui set de date (ref).
=MIN(ref)
Returneaz valoarea minim a unui set de date (ref).
=FREQUENCY(ref 1, ref 2)
Returneaz frecvena cumulat a valorilor unui set de date (ref 1)
cuprinse ntre valoarea minim i limita superioar a unei clase de
frecven (ref 2).
206 Elemente de statistic aplicate n ecologie
3.1. TENDINA CENTRAL
=MODE(ref)
Returneaz valoarea modului unui set de date (ref).
=MEDIAN(ref)
Returneaz valoarea medianei unui set de date (ref).
=AVERAGE(ref)
3.2. VARIABILITATEA
Returneaz valoarea mediei aritmetice a unui set de date (ref).
=MAX(ref)
Returneaz valoarea maxim a unui set de date (ref).
=MIN(ref)
U
Returneaz valoarea minim a unui set de date (ref).
=SUMSQ(ref)
C
Returneaz suma ptratelor valorilor dintr-un set de date (ref).
ES
=STDEV(ref)
Returneaz valoarea deviaiei standard calculat ca radical din suma
ptratelor mprit la numrul gradelor de libertate ( 1), a unui set
R
de date (ref).
FI
=STDEVP(ref)
Returneaz valoarea deviaiei standard a populaiei calculat ca
M
=VARA(ref)
Returneaz valoarea varianei populaiei calculat ca suma ptratelor
mprit la numrul valorilor ( ), a unui set de date (ref).
U
funcie de media valorilor ( ) i de deviaia standard a acesteia ( ).
=NORMSINV(prob)
C
Returneaz scorul corespunztor unei anumite probabiliti (prob)
ES
exprimat ca o proporie din distribuia normal standard.
=NORMSDIST(z)
Returneaz probabilitatea ca proporie din distribuia normal
R
=STANDARDIZE(nr, x , s)
Returneaz scorul al unei valori (nr) n funcie de medie ( ) i
M
deviaie standard ( ).
ZA
Transformarea datelor
=LOG10(x)
Returneaz logaritmul zecimal ( ) al unei valori ce trebuie
transformate ( ).
=POWER(10,x)
Returneaz antilogaritmul zecimal al unei valori transformate prin
logaritmare n baza10.
=LN(x)
Returneaz logaritmul natural ( ) al unei valori ce trebuie
transformate ( ).
=EXP(x)
Returneaz antilogaritmul natural al unei valori transformate prin
logaritmare n baza .
208 Elemente de statistic aplicate n ecologie
=LOG(x, baz)
Returneaz logaritmul ntr-o baz specificat (baz) al unei valori ce
trebuie transformate ( ).
=POWER(baz,x)
Returneaz antilogaritmul unei valori transformate prin
logaritmare ntr-o baz specificat (baz).
=ASINH(x)
Returneaz valoarea transformat prin funcia arcsinh a unei valori
ce trebuie transformat.
=SINH(x)
Returneaz valoarea transformrii inverse a unei valori
U
transformat cu funcia arcsinh.
=SQRT(x)
C
Returneaz valoarea transformat prin extragerea radicalului dintr-o
ES
valoare ce trebuie transformat.
=POWER(x,2)
Returneaz valoarea transformrii inverse a unei valori
R
=DEGREES(ASIN(SQRT(x)))
Returneaz valoarea transformrii unei proporii (0 1) cu
M
=POWER(SIN(RADIANS(x)), 2)
Returneaz o proporie ( ) prin transformarea invers a unei valori
obinut cu ajutorul funciei arcsin ( ).
=TINV(prob, gl)
Returneaz valoarea critic (Student) pentru un anumit nivel de
semnificaie (prob = ) i un anumit numr de grade de libertate (gl
= 1).
U
= 1).
C
=TDIST(t, gl, cozi)
Returneaz probabilitatea asociat unei valori (Student) pentru un
ES
anumit numr de grade de libertate (gl = 1) i n funcie de
varianta testului (cozi: 1 unilateral, 2 bilateral).
R
=TINV(prob, gl)
M
= 1).
=TDIST(t, gl, cozi)
Returneaz probabilitatea asociat unei valori (Student) pentru un
U
Paired Two Sample for Means i completarea cmpurilor din
C
fereastra de dialog. n cmpul Hypothesized Mean Diference se
completeaz valoarea 0.
ES
8.1.1. Testarea omogenitii varianei interne
R
=VAR(ref)
Returneaz valoarea varianei calculat ca suma ptratelor mprit
FI
=LN(nr)
Returneaz valoarea logaritmului natural a unui numr (nr).
ZA
=CHIINV(prob, gl)
Returneaz valoarea critic pentru un anumit nivel de
semnificaie (prob = ), un anumit numr de grade de libertate (gl =
1).
=CHIDIST(2, gl)
Returneaz probabilitatea asociat unei valori pentru un anumit
numr de grade de libertate (gl = 1).
U
semnificaie (prob = ) i un anumit numr de grade de libertate (gl
C
= 1).
=CHIDIST(2, gl)
ES
Returneaz probabilitatea asociat unei valori pentru un anumit
numr de grade de libertate (gl = 1).
R
U
(prob = ), un anumit numr de grade de libertate externe (glext =
1 sau glext = 1 sau glext = (c1)(r1)) i un anumit numr
C
de grade de libertate interne (glint = ).
ES
=FDIST(F, glext, glint)
Returneaz probabilitatea asociat unei valori pentru un anumit
numr de grade de libertate externe (glext = 1 sau glext = 1
R
interne (glint = ).
M
U
din fereastra de dialog.
1).
FI
=CHIDIST(2, gl)
Returneaz probabilitatea asociat unei valori pentru un anumit
M
=BINOMDIST(x, k, p, cumulativ)
Returneaz probabilitatea binomial asociat numrului rezultatelor
de interes ( ), n funcie de a numrului total de ncercri ( ), i a
U
10.4. Testul McNemar
C
=CHIINV(prob, gl)
ES
Returneaz valoarea critic pentru un anumit nivel de
semnificaie (prob = ) i un anumit numr de grade de libertate (gl
= 1 1 ).
R
=CHIDIST(2, gl)
FI
=BINOMDIST(x, k, p, cumulativ)
ZA
U
corelaie direct sau pozitiv, 144
ANOVA bifactorial cu replicare, 128 corelaie invers sau negativ, 145
C
ANOVA bifactorial fr replicare, 118 corelaie neparametric, 153
ANOVA bifactorial neparametric
ES
corelaie parametric, 147
Friedman, 126 corelaie, puterea, 146
ANOVA unifactorial, 108 covarian, 147
R
atribut, 12
date, 9, 12
M
B deviaie standard, 30
deviaie standard a populaiei, 30
ZA
dispersie aleatoare, 44
clasa modal, 24
dispersie grupat, 44
clas median, 26
dispersie uniform, 44
clase de frecven, 19
dispersie, indici de, 44
coeficient, 17
disproporionalitate, 184
coeficient de corelaie, 145
distribuia binomial, 36
coeficient de determinare n regresie, 162
distribuia binomial negativ, 42
coeficient de regresie, nlimea dreptei,
distribuia normal, 55
157
distribuia normal standard, 58
coeficient de regresie, panta dreptei, 157
distribuia Poisson, 40
coeficient de variaie, 32
distribuia Student, 67
coeficientul de corelaie Pearson, 146
216 Elemente de statistic aplicate n ecologie
distribuia t, 67 interval de confiden al mediei
distribuie bimodal, 24 populaionale, 68
distribuie multimodal, 24 interval de variaie, 29
distribuii probabilistice, 34 ipotez, 74
ipotez alternativ, 75
E ipotez nul, 75
eroare de genul I, 77
K
eroare de genul II, 77
eroare standard a mediei, 66 Kruskal-Wallis, 116
eroare , 77
eroare , 77 L
erori statistice, 77
U
Laplace, 65
Lincon-Petersen, 71
C
F ES
factor, 107 M
Fisher, 183
frecven proporional, 17 Mann-Whitney, 89
R
media probei, 27
G
median, 25
M
medie populaional, 27
H meristic, 15
metode neparametrice, 61
Hartley, 104 metode parametrice, 61
U
poligonul frecvenelor, 21 scor , 58
populaie, 8
C
Shannon-Weaver, 72
prag de semnificaie, 76 Snedecor-Fisher, 103
ES
probabilitate, 34 Spearman, 146, 153
prob, 8 stabilizarea varianei, 63
probe independente, 85 statistica inferenial, 65
R
statistic, 10
proporie, 17 statistic descriptiv, 23
M
rang, 13 T
raport, 17 tendina central, 23
rat, 17
U
independente, 85 variabil, tipuri, 12
C
transformarea arcsin, 64 variabilitate extern, 103
transformarea arcsinh, 63 variabilitate intern, 103
ES
transformarea datelor, 63 variabilitate total, 103
transformarea invers, 64 variabilitatea, 29
varian, 30
R
transformarea logaritmic, 63
transformarea prin extragerea radicalului,
FI
63 W
Tukey, 112
M
Wilcoxon, 96
ZA
U Z
unitate de prob, 9
zon de acceptare a ipotezei nule, 80
zon de respingere a ipotezei nule, 80