BIOSTATISTIC
NOTE DE CURS
ORADEA 2008
CUPRINS CAPITOLUL 1: INTRODUCERE1 CAPITOLUL 2: DISTRIBUII EXPERIMENTALE ........................ 3 2.1. TERMINOLOGIE STATISTIC ..............3 2.2.NREGISTRAREA I PRELUCRAREA PR IMAR A INFORMAIILOR.............. ................................................. 4 2.2.1.SEPARAREA DE POP ULAII OMOGENE... 4 2.2.2.NREGISTRAREA OBSERVAIILOR N TABELE ....4 2.2.3.FRECVENELE DISTR IBUIILOR EMP IRICE... 5 2.2.4. REPREZENTRI GRAFICE ALE DISTRIBUIILOR UNIDIMENS IONALE... 6 2.3. INDIC II DISTRIBUIILOR EXPERIMENTALE . 7 2.3.1.PARAMETR I POPULAIEI I INDIC II PROBEI............. ..............7 2.3.2.MOMENTE............................................................................... ..8 2.3.3.VALOR I MEDII...................................................................... ..10 2.3.4.INDIC II DISPERSIEI ( INDICATORII VARIABILIT II)............13 2.3.5.ASIMETR IA I EXCESUL DISTRIBUIILOR EXPERIMENTALE (INDICATORII FORMEI) 15 2.4.EROR I DE REPREZENTATIVITATE...................................... ........17 CAPITOLUL 3 : DISRTIBUII TEORETICE CU AP LICABILITATE N SILVICULTUR.............................................................................. .18 3.1. INTRODUCERE....................................................................... ...18 3.2. NOIUNEA DE PROBABILITATE....................................... ........19 3.3. DISTR IBUIA BINOMIAL 19 3.4. DISTR IBUIA POISSON............................................................ .22 3.5. DISTR IBUIA NORMAL.................................... ...................... 24 3.6. DISTRIBUIA CHAR LIER (TIP A) ......... 29 3.7. SISTEMUL DISTRIBUIILOR PEARSON..................... ...............32 3.8. DISTR IBU IA BETA .32 3.9. DISTR IBUIA MEYER .35 CAPITOLUL 4 : EXAMINAREA SEMNIFICAIEI .... 38 4.1. GENERALITI. 38 4.2. INTERVALUL DE NCREDERE AL MEDIEI AR ITMETICE 40 4.3. TESTE DE CONFORMITATE ..... 41 4.3.1.EXAMINAREA DIFERENEI DINTRE O MEDIE EXPER IMENTAL I O VALOARE D AT..... 41 4.3.2.EXAMINAREA SEMN IFICAIEI VAR IANEI I A DIFERENEI DINTRE VAR IA NE..... 43 4.4. TESTE DE EGALITATE................................... ........................... 44 4.5. TESTE DE AJUSTARE ......................... 54
4.6. CRITER II PENTRU ELIMI NAREA OBSERVAIILOR EXTREME ..55 CAPITOLUL 5 : ANALIZA VAR IANEI ...... 57 5.1. ASPECTE TEORETICE.................................... ........................... 57 5.2 ANAIZA S IMPL A VAR IANEI...................... ........................... 58 5.3. FOLOS IREA TESTULUI DUNCAN...................................... ........62 5.4. ANALIZA DUBL A VAR IANEI .................. 64 5.5.METODE NEPARAMETR ICE PENTRU COMPARAREA MAI MULTOR GRUPE............................................................ ..................65 CAPITOLUL 6 : ANALIZA CORELAIEI .... 66 6.1. ASPECTE TEORETICE................................... ............................ 66 6.2. METODE DE CONSTATARE A CORELAIILOR...................... ...67 6.3. COVAR IANA............ .................................... ........................... 68 6.4. COEFIC IENTUL DE CORELAIE.................... ........................... 69 BIBLIOGRAFIE .. 73
CAPITOLUL 1: INTRODUCERE
Biostatistica se ocup cu gruparea, analiza i interpretarea datelor referitoare la fenomenele de mas, precum i cu unele previziuni privind producerea lor viitoare. Biostatistica (biostatistica forestier) este o ramur a statisticii, denumit aa datorit faptului c se studiaz, interpreteaz i analizeaz date din domeniul biologic (forestier), domeniu cu anumite particulariti. n silvicultur, aproape toate procesele au un caracter probabilistic. ncepnd cu tabelele de producie i ncheind cu indicii preurilor p entru lemnul pe picior, modelele statistice sunt larg folosite. Modelele statistice sunt folosite pentru : Clasificarea sistemelor biologice , de la specie la ecosistem (analiza topologic) ; Estimarea indirect a unei caracteristici dificil de msurat : co ncentrnd eforturile de analiz pe un eantion de date complete, ce includ i variabila dependent dificil de msurat n condiii obinuite, se obine o funcie matematic ce permite, pe viitor, estimarea caracteristicii rezultative, pe baza caracteristic ilor explicative, mai uor de msurat ; Aproximarea probabilitii producerii unui fenomen (un atac de insecte, o dobortur de vnt, sau chiar adjudecarea unei partizi ntr- o licitaie) tiute fiind condiiile n care se produc, de regul, aceste fenomene ; Aproximarea preurilor posibile de adjudecare a unor partizi sau loturi de lemn, n funcie de caracteristicile acestora, particularitile pieei i condiiile de exploatare ; Estimarea impactului economic i/sau ecologic al unor schimbri sau tendin e manifestate la nivel macroeconomic ; Compararea a dou sau mai multe valori medii, referitoare la tot attea stri n care un sistem poate fi adus prin mijloace tehnice sau ca urmare a modificrii factorilor naturali de producie. (de exemplu starea la c are este adus un arboret prin aplicarea unor rrituri de intensitate diferit) ; etc Dup scopul cunoaterii, statistica, ca disciplin tiinific, are urmtoarele subdiviziuni: statistica descriptiv, statistica inferenial, statistica analitic. Stati stica descriptiv (formal), care are ca obiectiv culegerea datelor statistice i prelucrarea acestora cu ajutorul sistemului de indicatori statistici Statistica inferenial , aprut abia dup descoperirea legilor probabilistice i constituirea teoriei pr obabilitilor ca tiin, are ca obiectiv cunoaterea caracteristicilor unei colectiviti oarecare pornind de la cunoaterea unei colectiviti pariale i presupune msurarea incertitudinii rezultatelor i calcularea riscurilor pe care le implic luarea unei decizii fundamentate pe baza unei informaii ce nu poate fi
exhaustiv. Principalele probleme ale inferenei statistice sunt estimarea parametrilor distribuiei unei colectiviti i testarea ipotezelor statistice. Statistica analitic urmrete descoperirea a ceea ce este permanent, esenial, legic , n variaia proceselor stocastice i msurarea influenei factorilor care le determin variaia n timp, n spaiu,i din punct de vedere calitativ. n acest scop se folosesc, n principal, analiza de reg resie, analiza de corelaie i analiza dispersional .
Variabilitatea observaiilor
Valorile observaiilor fcute asupra anumitor caracteristici atributive prezint o anumit fluctuaie, denumit n statistic variaie . Variaia poate fi: continu , cnd caracteristica cercetat se ex prim n numere fracionare (diametrul unui arbore) discontinu ( discret), cnd caracteristica poate fi exprimat numai n numere ntregi (nr.arbori/ha, nr.ou/cuib), alternativ , cnd exist numai dou posibiliti de variaie (apt-inapt, mascul - femel) Dup natura cauzelor pe care o provoac, variaia poate fi sistematic (determinat de cauze cunoscute, controlabile) sau ntmpltoare, accidental (determinat de cauze necunoscute, necontrolabile).
Populaia statistic
O populaie (colectivitate) stati stic reprezint o totalitate de observaii efectuate asupra unor uniti relativ omogene, avnd un anumit numr de nsuiri eseniale comune.
n domeniul silviculturii de cele mai multe ori se efectueaz observaii numai asupra unui numr restrns de unit i ale populaiei, respectiv asupra unuor sondaje sau probe (colectivitate de selecie, eantion). Prin intermediul probelor se tinde spre cunoaterea statistic a ntregii populaii. Pentru aceasta proba trebuie s fie reprezentativ, s fie aleas dup principii obiective. CAPITOLUL 2: DISTRIBUII EXPERIM ENTALE 2.1. TERMINOLOGIE STATISTIC
Colectivitatea statistic reprezint o mulime format din uniti statistice calitativ omogene ce prezint una sau mai multe nsuiri comune. - colectivitatea general (populaie) este constituit dintr - un numr finit sau infinit de uniti statistice. Ea poate fi unidimensional , cnd n atenia observatorului se afl o singur caracteristic de studiat, sau multidimensional , cnd n atenia observatorului se afl dou sau mai multe caracteristici. - colectivitatea de selecie (eantion, sondaj) reprezint numai o parte dintr- o populaie, extras dup anumite criterii n vederea cercetrii uneia sau mai multor caracteristici.Un eantion este rep rezentativ dac unitile de eantionaj sunt alese randomizat i dac are un volum minim care s poat asigura precizia necesar. Unitatea statistic ( unitatea de nregistrare, de observare ) constituie cea mai mic entitate luat n considerare, n raport cu natura colectivitii i scopul observrii.Unitatea statistic poate fi simpl sau complex (format din mai multe uniti simple) . irul statistic este reprezentat de totalitatea valorilor observate, corespunztor unitilor ce alctuiesc unitatea sta tistic cercetat, scrise ntr- o anumit ordine. Seria statistic reprezint ansamblul a dou iruri de date corespondente. n primul ir sunt nscrise valorile caracteristicii de grupare, iar n cel de al doilea ir valorile caracteristicii cu care este c orelat sau frecvenele statistice.
Separarea de populaii omogene (stratificarea) este necesar pentru a putea interpreta ntreaga pop ulaie studiat, n raport cu tipurile ei calitative. 2.2.2. nregistrarea observaiilor n tabele Rezultatele observrii se inregistreaz, pe msura obinerii lor, ntr-un tabel denumit tabelul datelor iniiale (carnet de inventar, fie de observare). Exemple : carnetul de inventar la punerea n valoare a masei lemnoase pe picior (tabelul 2.1); carnetul de inventar al creterilor n diametru msurate (tabelul 2.2)
Tabelu l 2 . 1
Nr. curent
1 2 3
Specia
Fa Ca Fa
Diametrul
20 22 36
Clasa de calitate
I II IV
Tabelu l 2 . 2
Nr. crt 1 2 3
Pentru a se putea prelucra statistic datele iniiale, este necesar gruparea valorilor n clase (despuierea) (tabelele 2.3, 2.4).
Tabelu l 2 . 3
specia : FAG
categorii de diametre 8 10 12 14 16 18 20 22 24
Tabelu l 2 . 4
clasa de calitate I Punctaj Nr arbori Punctaj II Nr arbori III Punctaj Nr arbori IV Punctaj Nr arbori TOTAL ARBORI
Centrul clasei Punctaj mm 1 III 2 IIII IIII IIII II 3 IIII IIII III
Frecvene absolute 3 17 13
n urma gruprii datelor iniiale s - a obinut un ir statistic .La un ir statistic distingem: limitele clasei, centrul clasei, intervalul de clas (mrimea clasei), amplitudinea variaiei. 2.2.3. Frecvenele distribuiilo r empirice Distribuia empiric este o punere fa n fa a intervalelor de clas ale variabilei(sau numai a centrelor claselor) cu numrul de observaii cuprinse n fiecare clas. Frecvena absolut = numrul de observaii corespunztoare fiecrei clase . Frecvena absolut cumulat = frecvenele absolute ale claselor, cumulate succesiv. Frecvena relativ = raportul dintre frecvena absolut i numrul total de observaii. Frecvena relativ cumulat =sumele succesive ale frecvenelor relative.
Tabelu l 2 . 5
categorii de diametre
frecventa absoluta
frecventa relativa
8 10 12 14 16 18 20 22 24 TOTAL
3 5 6 10 12 9 8 4 2 59
3 8 14 24 36 45 53 57 59
0.051 0.085 0.102 0.169 0.203 0.153 0.136 0.068 0.034 1.000
numrul de arbori
2.2.4. Reprezentri grafice ale distribuiilor unidimensionale Scopul reprezentrii grafice este de a pune n eviden mai clar caracteristicile de baz ale unei distribuii experimentale, de a o feri o imagine mai sugestiv asupra modului de structurare al colectivitii. n cadrul reprezentrii grafice, valorile variabilei observate (X) se trec pe abscis, iar pe ordonat se trec frecvenele (absolute sau relative, simple sau cumulate). ntocmirea graficului presupune: alegerea hrtiei alegerea scrilor pentru axele de coordonate marcarea diviziunilor pe axele de coordonate nscrierea valorilor centrale n dreptul diviziunilor stabilirea legturilor ntre valorile de pe abscis i cele de pe ordon at trasarea curbei prin punctele reprezentetive ntocmirea legendei precizarea sursei de prelucrare a delor i titlul graficului. La calculator, graficele se ntocmesc mult mai rapid i uor, ntr -o mare varietare de tipuri, folosind programe speciale (ca de exemplu Excel). Tipuri de reprezentri: Diadrama bar a frecvenelor absolute Diagrama bar histograme 14 poligoane frecvene absolute 12 diagrame
10 8 6 4 2 0 8 10 12 14 16 18 20 22 24
categoria de diametre
frecvene absolute
10 8 6 4 2
70
categoria de diametre
0
60
10
frecvene 12 14 16 cumulate
18
20
22
24
Diagrama de structur
numr de arbori
50
categorii de diametre
7% 3% 5% 8% 14% 10%
40
30
20
10
15% 17%
8 10 12 14 16 18 20 22 24
categorii de diametre
21%
8 10 12 14 16 18 20 22 24
10
Denumirea caracteristicii M edia aritmetic V ariana ( disp ersia) Abaterea standard Coef icientul de variaie Covariana I ndicile asimetriei I ndicele excesului Coef icientul de corelaie Coef icientul de regresie
xy
x 2 s s s% s xy A E r b
2.3.2. Momente Momentele uureaz calculul indicilor, mai ales pentru seriile statistice formate dintr - un mare numr de observaii. Momentele reprezint medii aritmetice ale abaterilor de la un anumit punct ales ca origine, ridicate la diferite puter i. Dac se alege ca origine media aritmetic, se obin momente centrate .Dac originea se alege arbitrar, rezult momente obinuite. Momentele obinuite se calculeaz cu formula( intervalul de clas =1): k xi x0 mk N iar cele centrate dup expresia: k xi x mk N unde : m k reprezint momentul obi nuit de ordin k m k momentul centrat de ordin K x i valorile observate x - media aritmetic a distribuiei x 0 valoarea aleas arbitrar N - numrul total al observaiilor Pentru valori grupate n clase ( h = intervalul de clas), avem:
mk '
xi xo h N
mk
xi x h N
11
m 1 =0 m 2 =m 2 -m 1 m 3 =m 3 -3m 2 m 1 +2m 1 3 m 4 =m 4 -4m 3 m 1 +6m 2 m 1 2 -3m 1 4 iar pentru verificare se folosesc formulele : m 3 =m 3 -3m 1 m 2 -m 1 3 m 4 =m 4 -4m 3 m 1 +6m 2 m 1 2 -3m 1 4 Calculul momentelor prin procedeul sumelor. Este un procedeu indirect, mai simplu in cazul calculului fcut fr calculatoare. Este bazat pe urmtoarele formule: S 1 2S 2 d1 m 2' m1' ; ; N N d 1 6d 2 6d 3 m 3' ; N S 1 14S 2 36S 3 24S 4 m 4' N Exemplu: vezi tabelul 2.6
4 0.0678 59 94 2 * 71 236 m 2' 4.00 59 59 4 6 * ( 7) 6 * ( 5) m3' N m1'
Tabelu l 2 . 6
categorii de diametre 8 10 12 14 16 18 20 22 24 TOTAL d
i
Frecvena absolut 3 5 6 10 12 9 8 4 2 59
= ai bi =
Si = ai + bi =
b1 49 3 8 14 24 23 14 6 2 45 a1 -4 d1 94 S1
b2 39 3 11 25 22 8 2 32 a2 -7 d2 71 S2
b3 17 3 14 -45 10 2 12 a3 -5 d3 29 S3
4 42 30 59
76 59
1.2881
Cu formula:
8 16 3 2
mk '
1
xi xo h N
1
k
calculul este mai laborios:
1 1
10 16 5 2
12
12 16 14 16 6 10 ...... 2 2 m2 59 3 *16 5 * 9 6 * 4 10 *1 12 * 0 9 *1 8 * 4 4 * 9 2 *16 59 48 45 24 10 9 32 36 32 236 4.00 59 59 2.3.3. Valori medii Medii de poziie: Media aritmetic Pentru iruri statistice formate dintr - un numr redus de valori, media aritmetic ( x ) se calculeaz cu formula: x x1 x 2 x 3 ... x n x N N Pentru iruri statistice cu numr mare de valori, acestea se grupeaz mai nti n clase iar pentru media aritmetic se folosete procedeul multiplicrii: xi ni x1 n1 x 2 n 2 x 3 n3 ... x k n k x N N unde: x i reprezint diferitele valori ale centrelor de clas iar n i frecvenele absolute corespunztoare. Media aritmetic se poate calcu la mai simplu prin procedeul sumelor, bazat pe formula: x x 0 am1
8 16 3 2
10 16 5 2
unde: m1 este momentul obinuit de ordin 1, calculat n raport cu valoarea arbitrar x 0 , iar a este mrimea intervalului de clas. O alt modalitate, la fel de simpl, se bazeaz pe suma total a frecvenelor cumulate. Se aplic formula: D x x1 a 1 N unde x 1 reprez int centrul clasei cu cea mai mare valoare iar D suma frecvenelor cumulate, de la clasele mici la cele mari.
13
Tabelu l 2 . 7
categorii de diametre Frecvena absolut
Exemplu: x i ni x N
936 59
15.86
ni 3 8 14 24 36 45 53 57 59 299
xi 8 10 12 14 16 18 20 22 24 TOTAL
ni 3 5 6 10 12 9 8 4 2 59
x
x
x0
am1
x1 a
D 1 N
Media aritmetic ponderat Dac, pentru probe ale aceleeai populaii, se dispune de mai multe medii aritmetice, se poate calcula o singur medie general, utili znd formula mediei ponderate: x1 n1 x 2 n 2 ... x k n k x n1 n 2 ...n k
Media general x se calculeaz numai dup ce se demonstrea z prin teste statistice corespunztoare (analiza varianei), c mediile x1 , x 2, ...x k reprezint estimaii ale aceleeai medii generale .
Media armonic se determi n cu relaia: N xh pentru valori negrupate n clase, respectiv cu relaia : N 1 k 1 xk N xh pentru valori grupate n clase p nk k 1 xk unde N este numrul total al observaiilor; n k frecvena clasei k ; x k centrul clasei k , iar p numrul claselor formate Media geometric este rdcina de ordin n a produsului celor n valori observate i se utilizeaz n cazul valorilor situate n progresie geometric.
n
xg
N k 1
xg
absolute Media geometric este ntotdeauna mai mic sau cel mult egal cu media aritmetic.
14
N
N
2 nk xk
Medii de structur: Mediana, cuantilele Mediana este valoarea x a irului statistic care, atunci cnd toate valorile irului sunt aranjate n ordine c resctoare, mparte acest ir n dou grupe egale ca numr. Quartilul poate fi: inferior i superior . Primul, Q 1 , corespunde valorii care separ primii 25% din termeni; al doilea, Q 3 , reprezint valoarea care separ ultimii 25% din termeni. Mediana i qu artilele rerprezint cazuri particulare ale quantilelor . Quantilele se pot defini ca fiind variabila creia i corespunde o frecven relativ cumulat dat. Astfel, mediana este valoarea cvreia i corespunde o frecven relativ cumulat egal cu 0,5. Q uantilele se pot uor detrermina pe cale grafic. n acest sens se folosete ogiva lui Galton .ntr-un sistem de coordonate rectangulare se trec valorile x pe abscis i frecvenele cumulate pe ordonat.Astfel, de exemplu, mediana este abscisa punctului car e rezult din intersecia ogivei cu o paralel dus la abscis prin punctul N/2 al frecvenelor absolute cumulate (sau punctul 0,5 al frecvenei relative cumulate). Analitic, mediana se calculeaz cu formula:
Me
unde:
x Me
N a 2
n n Me
x M e este limi ta inferioar a clasei n care se afl mediana a = amplitudinea clasei n = suma frecvenelor cumulate pn n dreptul clasei n care se afl mediana. Mediana este des utilizat n practic deoarece depinde mai puin dect media aritme tic de forma distribuiei sau de valorile extreme ale irului statistic. Exemplu de calcul (cu datele din tabelul 2.7) :
59 24 29.5 24 2 Me 15 2 15 2 15 12 12
5.5 15.92 6
15
Modulul Modulul este valoarea variabilei creia i corespunde cea mai mare frecven , adic valoarea variabil ei cea mai probabil. Distribuiile pot fi unimodale (cu un singur vrf) sau plurimodale (cu mai multe vrfuri). Modulul distribuiilor discrete se determin citind varianta cu cea mai mare frecven. n cazul unei distribuii continui, modulul este abscis a corespunztoare vrfului curbei de frecven i se calculeaz cu formula : n 0 n1 Mo x Mo a 2n 0 n1 n 2 unde: x M o este limita inferioar a clasei modale a este amplitudinea clasei n o este frecven a clasei modale n 1 , n 2 , sunt frecvenele clasei inferioa re i superioare celei modale. Exemplu de calcul (cu datele din tabelul 12 10 4 15 15.8 2.7): Mo 15 2 24 10 9 5 2.3.4. Indicii dispersiei (indicatorii variabilitii) Valorile medii indicnd doar centrul de grupare al valorilor observate, nu pot da o imagine cuprinztoare asupra unei distribuii. Valorile medii nu spun nimic despre gradul de variabilitate, despre amplitudinea de mprtiere a valorilor observate. Indicii dispersiei completeaz caracterizarea distribuiei din aceste puncte de vedere. Cei mai uzuali sunt: am plitudinea de variaie, variana (dispersia) i abaterea standard. Amplitudinea de variaie (W) reprezint diferena dintre valoarea observat maxim i cea minim adin cadrul unui ir statistic. Este un indice puin stabil, depinznd n mare msur de num rul observaiilor efectuate i de aceea este mai puin folosit.
x max
x min
Variana (dispersia) se calculeaz ca o medie aritmetic a ptratelor abaterilor valorilor individuale ale irului statistic de la media aritmetic a irului respecti v. Variana este aproximativ egal cu momentul centrat de ordinul doi (dac N este suficient de mare). Variana are o valoare concludent dac irul statistic studiat este relativ simetric. Calculul varianei:
Procedeul
16
Direct
s
2
xi
N 1
x
2 i
s
xi
2
n xi
ni 1
x ni
2 i
Multiplicrii
s
2
x i ni ni ni 1
N N 1
s2
Momentelor
s2
m2
s2
a 2 m2
' m2
m2
n xi x
2
m1'
ni xi2
2x
x i ni
x2
2
ni
dar:
2 2
x i ni ni
n xi
ni x
2 i
xi ni ni
xi ni ni
ni
ni x
2 i
xi ni ni
Valoarea dispersiei este tot timpul mai mare sau egal cu zero. Cazul s 2 =0 poate fi ntnit numai dac toate valorile individuale coincid cu media aritmetic. Suma ptratelor abaterilor se mparte la N-1 , i nu la N , pentru c prin calcularea mediei (folosit la stabilirea abaterilor) o observaie este deja blocat, rmnnd libere doar N-1 observaii. Acest termen (numitorul formulelor) poart denumirea de grade de libertate. Numrtorul formulelor poart denumirea de suma ptratelor abaterilor i se noteaz cu Q. Abaterea standard (abaterea medie ptratic) se calculeaz ca radical de ordin doi din varian. Ea caracterizeaz modul cum s e mprtie valorile observate n jurul valori i medii.
s2
s 100 x
Abaterea standard exprimat n procente fa de media aritmetic poart numele de coeficient de variaie (s% ) i se calculeaz cu relaia:
s%
Coeficientul de variaie este singurul indicator care ofer posibilitatea comparrii omogenitii (variabilitii) a dou sau mai multe variabile exprimate n uniti de msur diferite. Cu ct valoarea lui s% este mai mic cu att colectivitatea este mai omogen Coeficientul de variaie se compar cu coeficientu l de variaie limit. dac s% 0,3 (coeficientul limit ) colectivitate omogen dac s% > 0,3 (coeficientul limit ) colectivitate neomogen
17
5(10 15.86) 2
6(12 15.86) 2 59 1
3 * ( 7.86) 2
5 * ( 5.86) 2 58
x i ni ni ni 1
2
... 2 * 8.14 2
... 16.25
x ni s2
Tabelu l 2 . 8
categorii de diametre Frecvena absolut
2 i
936 2 15792 59 59 1
15792 14849 58
' m2
943 16.25 58
m2
x ini 24 50 72 140 192 162 160 88 48 936 x
2 i
m1'
4 0.0678 2
3.9954
xi 8 10 12 14 16 18 20 22 24 TOTAL
i excesul distribuiilor experimentale ( indicatorii formei ) ASIMETRIA reprezint deplasarea pe orizontal a vrfului curbei experimentale fa de curba normal. Asimetria curbelor de frecven poate fi cauzat de numrul prea mic de observaii sau de alegerea necorespunztoare a claselor de frecven (asimetrie aparent). Aceast asimetrie dispare prin majorarea numrului deobservaii sau prin redimensionarea claselor de frecven. Asimetria real reprezint ns o particularitate obictiv a curbei de frecven i este determinat cel mai adesea de influena puternic a unui anumit factor. O msur a asimetriei este dat de relaia lui Pearson :
ni 3 5 6 10 12 9 8 4 2 59
nix
2 i
s2
a 2 m2
2 2 * 3.9954 15.98
192 500 864 1960 3072 2916 3200 1936 1152 15792
2.3.5. Asimetria
x Mo s
Cnd media este egal cu modulul Mo , distribuia este simetric. Cnd x Mo asimetria este de st nga (pozitiv) Cnd x Mo asimetria este de dreapta (negativ) Exemple : n arboretele echiene sa constatat c, n general, curba de frecven a arborilor pe categorii de diametre prezint o asimetrie de
18
stnga n timp ce curba de frecven a arborilor pe categorii de nlimi prezint o asimetrie de dreapta Un calcul riguros a l asimetriei se face cu relaiile:
N
xi A
i 1
Ns 3
k
ni xi A
i 1 k
3 i 1
m3 m2
3
Pentru A<0 , asimetr ia este negativ, iar pentru A>0 asimetria este pozitiv. Pentru ca indicele asimetriei s fie semnificativ, la o probabilitate de acoperire de 95%, trebuie ca valoarea lui s depeasc dublul erorii de reprezentativitate , calculat dup formula:
SA
6 N 3
A / sA > 2
EXCESUL sau boltirea (E) este acea proprietate a curbei modale de a fi mai mai turtit sau mai ascuit dect curba normal corespunztoare. Excesul se calcu leaz cu formula:
N
xi E
i 1
Ns 4
k
ni xi E
i 1 k
x ni
4 i 1
19
Dac E > 0 curba este ascuit (leptocurtik), iar dac E < 0 curba este turtit (platikurtic). Pentru distribuiile normale E = 0 .
2.4.ERORI DE REPREZENTATIVITATE
Erorile de reprezentativitate exprim gradu l de deprtare dintre indicatorii eantionului i parametri populaiei. Cu ct volumul probei este mai mare cu att erorile sunt mai mici.
Eroarea standard a mediei aritmetice
Mediile unor eantioane de prob ale unor populaii se distribuie ntotdeauna n jurul mediei populaiei din care probele au fost extrase dup o curb normal, chiar dac distribuia variabilei x a eantioanelor n jurul mediei populaiei se face dup o curb asimetric. Variaia mediilor eantioanelor n jurul valorii medii a popula iei se numete eroare standard a mediei aritmetice , i se exprim cu relaia :
x
unde :
- abaterea standard n - volumul eantioanelor considerate Cnd observaiile se efectueaz la nivelul unei singure probe, eroarea stan dard a probei se noteaz cu s x i se determin cu relaia:
sx
s n
,
n N 0,1 i cu relaia:
sx
s n
N N
pentru populaii finite sau cu num r redus de uniti, unde se ia n N n considerare factorul de corecie . N Intervalul de ncredere se exprim n funcie de eroarea standard : x ts x unde t este criteriul statistic bilateral Student pentru un nivel de semnificaie adoptat n funcie de n-1 grade de libertate, n fiind numrul unitilor din eantion
Eroare admis
20
e%
ts x %
ts % n
respectiv
e%
ts x %
ts % n
N N
Determinarea mrimii eantionului Pe baza ultimelor relaii se poate determina numrul de observaii sau mrimea eantionului (n ), n condiile unei anumite erori i probabiliti admise ( e% i t ), valorile coeficienilor de variaie stabindu se pe baza unui sondaj prealabil sau a datelor existente n literatura de specialitate:
n
respectiv
21
Funcia de distribuie exprim frecvenele cumulate sau probabilitile totale, funcie de diferite valori ale variabilei aleatoare. Toate distribuiile enumerate sunt bazate pe teoria probabilit ilor i de accea, nainte de a le prezenta, se impune s ne oprim asupra noiunii de probabilitate.
n N
dac n=N atunci p=1 eveniment sigur dac n=0 atunci p=0 eveniment imposibil dac 0<n<N atunci O<p<1 eveniment ntmpltor Dac notm cu q probabilitatea evenimentului contrar, atunci N n p+q=1 i q N Noiunea de probabilitate este strns legat de noiunea de frecven relativ. Frecvenele relative reprezint valori experimentale, statistice sau estimaii ale probabilitii.
22
extrageri s fie acelai. n aceste condiii, probabilitatea ca din numrul total de n exemplare ale probei, x uniti s posede caracteristica E este dat de funcia de frecven a distribuiei binomiale, respectiv de expresia:
f ( x)
sau
n! p xqn x! (n x)!
x Cn pxqn x
f ( x)
f ( x 1) f ( x)
(x
x 1
x! (n x! ( x
x)(n 1)(n
x 1)! p x 1)! q
n x
x p 1 q
f (x
1)
f ( x)
n x
x p 1 q
Cu formula de baz se calculeaz F(0) pentru x=0 , iar cu formula de recuren se calculeaz probabilitatea (frecvena) pentru celelalte valori ale lui x . Funcia de distribuie F(x) a distribuiei binomiale este dat de relaia :
n
F ( x)
x o
n! pxqn x! (n x)!
Parametri distribuiei se calculeaz astfel : np media aritmetic : dispersia : 2 npq np(1 p) Pentru n=p distribuia este simetric. Cu ct diferena dintre p i q este mai mare cu att se accentueaz asimetria. Pentru distribuiile experimentale parametri (indicii) se calculeaz dup formulele cunoscute. Variabila este discontinu . n silvicultur aplicarea distribuiei binomiale prezint importan n domeniul vari aiei alternative (prezena sau absena unui unei nsuiri, apariia unui sex sau altul, prezena sau absena arborilor cu un anumit defect, etc). Exemple:
1. ntr- un arboret de fag de productivitate superioar, s - au fcut 70 de sondaje pentru identificarea a rborilor api pentru derulaj. n fiecare punct de sondaj s - au luat cei mai apropiai 10 arbori de centrul sondajului. Dat ele culese din teren mpreun cu calculele aferente ajustrii sunt prezentate n tabelul 3.1.
23
Tabelu l 3 . 1
Frecvene experimentale n 14 22 10 7 4 2 1 0 0 0 0 60
n*x 0 22 20 21 16 10 6 0 0 0 0 95
n*x 2 0 22 40 63 64 50 36 0 0 0 0 275
Frecvene teoretice relative absolute 0.179 11 0.336 20 0.284 17 0.142 8 0.047 3 0.011 1 0.001 0 0 0 0 0.0 0 0.0 0 0.0 1 60
xi ni N
95 1.58 60
p
2
x n
1.58 10
x ni s2 s
f (0)
2 i
x i ni ni ni 1
275
95 2 60 60 1
275 150.42 59
124.58 59
2.11
s2
0.84210
0.179
f (1)
f (0
1)
f (0)
n 0 p 0 1 q n 1p 1 1 q
0.179
10 * 0.158 1* 0.842
0.336
f ( 2)
f (1
1)
f (1)
0.336
9 * 0.158 2 * 0.842
0.336
0.284
f ( 3)
f (2
1)
f ( 2)
n 2 p 2 1 q
n 3 p 3 1 q
0.284
8 * 0.158 3 * 0.842
7 * 0.158 4 * 0.842
0.284
1.264 2.526
1.106 3.368
0.142
f ( 4)
f (3
1)
f ( 3)
0.142
0.142
0.047
f (5)
f (4
1)
f ( 3)
n 4 p 4 1 q
0.142
6 * 0.158 5 * 0.842
0.047
0.948 4.210
0.011
24
f (6)
f (5
1)
f ( 3)
n 5 p 5 1 q
0.011
5 * 0.158 6 * 0.842
0.011
0.79 5.052
0.001
Compar nd frecven ele experimentale cu cele teoretice se observ o diferen semnificativ, deci i ali factori, n afara ntmplrii, au o onfluen puternic. O test are cu un criteriu tiinifiic (hi ptrat) ar fi n ecesar pentru a putea t rage concluzii bine fundamentate. 2. ntr- o plant aie de rinoase, 20% din puiei sunt atacai de insecte. Cu ajutorul distribuiei binomiale, s se stabileasc probalilit atea ca dint r - o pia de prob de 5 puiei un numr de 0,1,2, 3,4 sau 5 puiei s fie at acai.
f (0)
5! 0.2 0 0.8 5 5!
0.8 5
0.328
f (1) f ( 2)
f (0 f (1
1)
f (0)
1)
f ( 3)
f ( 4) f ( 5)
f (2
f (3 f (4
1)
1)
1)
n 0 n f (1) 1 n f ( 2) 2 n f ( 3) 3 n f ( 3) 4
0 p 5 * 0.2 0.328 0.328 *1.25 0.410 1 q 1* 0.8 1p 4 * 0.2 0.8 0.410 0.410 0.205 1 q 2 * 0.8 1.6 2 p 3 * 0.2 0.6 0.205 0.205 0.051 1 q 3 * 0.8 2.4 3 p 2 * 0.2 0.4 0.051 0.051 0.006 1 q 4 * 0.8 3.2 4 p 1* 0.2 0.2 0.006 0.006 0.000 1 q 5 * 0.8 4.0
f ( x)
unde: e =2,71828
e x!
25
- este singurul parametru al distribuiei, egal cu media aritmetic i n acelai timp cu dispersia
2
x = numrul de uniti statistice extrase din eantion ce prezint caracteristica cercetat. Distribuia este de tip discret, asimetric, apropiindu -se de cea binomial pe msur ce crete valoarea lui . Pentru x=0 avem f ( 0 ) =e - iar pentru x=1 ,2,3, se folosete relaia de recuren:
f (x
x 1
1)
f ( x)
x
x 1
f ( x) x 1
f (x
1)
e ( x 1)!
e ( x 1) x!
Ajustarea distribuiilor experimentale dup legea Poisson se face doar n cazul n care media aritmetic a distribuiei experimentale este foarte apropiat de dispersi a distribuiei i cnd observaiile s -au fcut pe uniti statistice discrete . Exemplu:
2000 de arbori dint r - un arboret au fost analizai din punct de vedere al prezen ei gelivurilor. n tabelul de mai jos sunt prezentat e rezultat ele observa iilor :
Numar de gelivuri pe arbore x i 0 1 2 3 4 5 T otal Numrul de arbori observai ni xini 0 605 310 75 16 5 1011 x i ni relative 0 605 620 225 64 25 1539 0.607 0.303 0.076 0.012 0.002 0.000 1.000 absolute
2
x i ni N
1011 2000
0.506 0.5
x ni s2 s s2 ni 0.717
2 i
x i ni ni 1
1539
0.514
Media aritmetic (0,506) este foarte apropiat de dispersia distribuiei (0,514) ceeea ce arat c n acest caz este aplicabil distribuia Poisson.
26
Cu
formula f ( x )
0.5
e x!
cal culm :
f (0)
0.5 0 e 0!
0.5
1 e
1 2.71828
0.607
Cu relaia de recuren
f (x
1)
f ( x)
x 1
, calculm:
f (1)
f ( 2)
f (1 1)
f ( 3)
f ( 4)
f (3 1) f (5)
0 1 0.5 f (1) 0.303 0.076 1 1 2 0.5 f ( 2 1) f ( 2) 0.076 0.012 2 1 3 0.5 f ( 3) 0.012 0.002 3 1 4 0.5 f ( 4 1) f ( 4) 0.002 0.000 4 1 5
f (0
1)
f (0)
0.607
0.5 0.303 1
f ( x)
1 2
(x
)2
2
unde i repre zint abaterea standard i media populaiei respective. Aceti doi parametri nu se cunosc de obicei dar pot fi estimai prin extrageri de probe.n acest caz se nlocuiete prin s iar prin x . Funcia de frecven devine:
.
f ( x)
1 e s 2
( x x )2 2s2
27
Pentru simplificare i pentru a se putea compara distribuiile de la diferite populaii, se introduce variabila ajuttoare u , denumit variabil normat : x x u Figu ra 3. 1 Curba de frecvene (sus) i s curba de distribuie (jos) a distribuiei Funcia de frecven a normale normate distribuiei normale normate va fi:
.
f (u )
1 2
u2 2
n aceste condiii, media este egal cu 0 iar abaterea standard este egal cu unitatea (figura 1). Distribu ia normal este perfect simet ric , are un maximum i dou puncte de inflexiune corespunztoare absciselor - i + . Cu ct abaterea standard este mai mic cu att curba de frecven este mai turtit i invers. Curba este asimptotic la axa absciselor , ceea ce arat c i valorile mari sunt posibile, dar probabilitatea lor este redus. Funcia de distribuie , corespunztoare frecvenelor cumulate, este dat de integrala:
F ( x)
sau, n abateri normate:
u u2 2
1 2
(x
)2
2
dx
F (u )
1 2
du
Dac integrarea se face n limitele i + funcia F(u)=1 . Integrarea n limitele 0 i u definete funcia lui Laplace :
(u )
1 2
e
0
u2 2
du
Aceast expresie reprezint suprafaa de sub curba normal de la valoarea medie pn la u (figura 2a) Pentru u
F (u )
(u )
1 , deci 2 (u)=1. 2
cumulat
frecvena i este Figura 2 : Suprafeele de sub curba normal, n diferite variante de integrare
28
suprafaa de sub curba normal cuprins ntre i valoarea u dat (figura 2d). Frecvent se utilizeaz dublul funciei Laplace:
u
2 (u )
u
f (u )du
care arat suprafaa de sub curb cuprins ntre limitele u, indicnd suma frecvenelor cuprinse n intervalul u (figura 2b). Aceast sum este denumit probabilitatea de acoperire . Probabilitatea de transgresiune (sau probabilitate de depire , nivel de semnificaie ) est e probabilitatea ca valorile variabilei s fie n afara intervalului u, deci funcia 1 -2 (u) (figura 2c). Valorile funciilor enumerate sunt calculate i prezentate n tabele pentru diferite valori ale lui u. Exprimnd n procente frecvenele se poate co nstata c:
n intervalul n afara intervalului
se gsesc urmtoarele % din numrul total al observaiilor : 68.27 95.45 99.73 31.73 4.55 0.27
O serie de distribuii asimetrice se aduc la forma normal prin 1 x ; x transformarea variabilei x. Exemple : x ; x lg(x a) ; x 1 x a . De fiecare dat se calculea z media x i abaterea x ; x x a standard s pentru variabilele transformate. Apoi se efectueaz calculele cu noile variabile.
Exem plu: Pentru seminele de br ad s -a stabilit, ca medie a populaiei, valoar ea de 55,4 grame(la 1000 semine), abaterea standard fiind de 7,85 gr ame. Se pun dou ntrebri: a) Cu ce probabilitate se poate afir ma c greutatea seminelor va depi o li mit inferioar de 35 grame ? b) Care este probabilitatea ca greut atea seminelor s se ncadreze n intervalul 40 -75 grame ? Rezolvare: a) Stabilim posibilitatea P=0,5 - ( u ) , corespunztoare prii din stnga a curbei, n funcie de valoarea: u
2.6 .
Din tabele, pentru u=2,6 P=0,5 - ( u ) =0,004661. Deci, n 0,46% din cazuri seminele vor avea greutatea sub 35grame. b) Stabilim probabilitatea P= ( u ) pentru dou valori ale lui u:
u1 u2
2.0 2.5
( u 1 ) =0,47725
( u 2 ) =0,49379
Prin ur mare, frecvena valorilor cuprinse ntre li mitele date este de:
29
(u1)+ ( u 2 ) = 97,1%. n afara acestor li mite, se vor gsi 100 -97,1=2,9% din cazuri, din care: 0,5- ( 2 , 0 ) =2,3% sub limita da 40g i 0,5 - ( 2 , 5 ) =0,6% peste li mita de 75g.
Etapele ajustrii distribuiei experi mentale dup legea normal : Reprezentarea grafic a datelor experimentale. Dac rezult un profil clopot, atunci se poate emite ipoteza c distribuia experimental urmeaz legea distribuiei normale, ipotez ce se verific n final printr -un test de ajust are ( 2 ). Redactarea tabelului de ajustare (tabelul 3.2) Calculul valorii medii x m e d , al varianei s 2 ia al abaterii 2 x i ni 2 xi ni ni x i ni 2 standard s cu relaiile: x ; s ; N ni 1
s s2
xi s x
teoretice
f(u i )
cu
funcia:
f (u i )
1 2
ui2 2
statistic pentru valori ale lui u din 0,01 n 0,01. cu relaia: n Caculul frecvenelor teoretice absolute Nh i n f (u i ) , unde h este amplitudinea clasei, s abaterea s standard iar N numrul total de observaii Verificarea calitii ajustrii cu un criteriu riguros ( 2 ).
30
Tabelu l 3 . 2
xi
14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 total x med s2 s
frecvene experimentale n i
x ini
56 256 360 680 1100 1248 1534 1540 1200 960 680 576 342 160 84 10776 26.219 31.90 5.65
x i ni
784 4096 6480 13600 24200 29952 39884 43120 36000 30720 23120 20736 12996 6400 3528 295616
ui
-2.1633 -1.8092 -1.4551 -1.1010 -0.7469 -0.3929 -0.0388 0.3153 0.6694 1.0235 1.3776 1.7317 2.0858 2.4399 2.7939
f (ui )
0.0384 0.0777 0.1384 0.2177 0.3019 0.3694 0.3987 0.3797 0.3189 0.2363 0.1545 0.0891 0.0453 0.0203 0.0081
frecvene teoretice n i
exp
4 16 20 34 50 52 59 55 40 30 20 16 9 4 2 411
6 11 20 32 44 54 58 55 46 34 22 13 7 3 1 407
0.45 1.95 0.00 0.17 0.84 0.06 0.02 0.00 0.89 0.56 0.27 0.71 0.88 0.37 0.59 7.75 5.23
f =k-3=15-3=12 2 teoretic5% =
2 exp
>
teoretic5%
31
Figu ra 3. 2
70 60
frecvene absolute
frecvene experimentale ni frecvene teoretice ni
50 40 30 20 10 0
14 16 18 20 22 24 26 28 30 32 34 36 38 40 42
categorii de diametre
dat de
ni
i n ni
i sunt frecv enele teoretice unde n i sunt frecvenele experimentale iar n absolute.
(u )
unde:
u (x s x)
f (u )
A f (u ) 6
E f 24
IV
(u )
32
f (u )
1 2
1 2 1 2
e
.
u2 2
normate
f (u ) e
. u2 2
(3u
IV
(u )
u2 2
(u 4
6u 2
f( u) A este asimetria E este excesul Pentru A=0 i E=0 distrib uia Charlier se distribuie normal. Frecvenele absolute, pe clase ale variabilei x , formula: Nh n (u ) s unde h este intervalul de clas. Funciile f(u), f (u ) , f IV (u ) se pot calcula sau se Pentru calculul indicilor acestei distribuii procedeul momentelor m3 m4 E 3 A 2 3 m 2 m2 transform ntr -o se obin aplicnd
n silvicultur acest tip de repartiie este frecvent aplicat la studiul distribuiei numrului de arbori pe clase de diematere sau pe clase de nlimi n arboretele echiene sau la alte distribuii la care indicii de asimetrie i exces prezint valori semnificative. Etapele ajustrii distribuiei experimentale dup distribuia Charlier tip A Redactarea tabelului de ajustare (tabelul 3.3) Calculul valorii medii x m e d , al varianei s 2 i al abaterii standard s .
k
ni xi
x ni
i 1 k
s3
i 1
N
xi
i 1
Ns 4
x s
33
1 2
ui2 2
,
ui3 ) f (ui )
(3ui
oridn
patru: frecven:
(u i )
(u
4 i
6u
2 i
3) f (u i )
Calculul
(u i ) f (u i )
funciei
de
cu relaia: Caculul n Nh i n (u i ) , unde h este amplitudinea clasei, s abaterea s standard iar N numrul total de observaii Verificarea calitii ajustrii cu un criteriu riguros ( 2 ).
Tabelu l 3 . 3
xi
n i exp x i n i
x i ni
ui
-2.1633 -1.8092 -1.4551 -1.1010 -0.7469 -0.3929 -0.0388 0.3153 0.6694 1.0235 1.3776 1.7317 2.0858 2.4399 2.7939 A= E=
f (ui )
0.0384 0.0777 0.1384 0.2177 0.3019 0.3694 0.3987 0.3797 0.3189 0.2363 0.1545 0.0891 0.0453 0.0203 0.0081 0.2394 -0.3070
III
(u i ) f
IV
(u i )
(u)
0.0344 0.0820 0.1548 0.2426 0.3240 0.3760 0.3853 0.3541 0.2951 0.2241 0.1546 0.0959 0.0528 0.0255 0.0106
n i teor
5 12 23 35 47 55 56 52 43 33 22 14 8 4 2 409
exp
56 784 256 4096 360 6480 680 13600 1100 24200 1248 29952 1534 39884 1540 43120 1200 36000 960 30720 680 23120 576 20736 342 12996 160 6400 84 3528 10776 295616 26.2189781 31.90 5.65
0.1397 0.0384 -0.1778 -0.4284 -0.5507 -0.4130 -0.0464 0.3473 0.5448 0.4723 0.2346 0.0002 -0.1277 -0.1465 -0.1081
-0.1222 -0.4602 -0.7228 -0.6103 -0.0110 0.7749 1.1926 0.9163 0.1633 -0.5171 -0.7393 -0.5346 -0.1893 0.0553 0.1377
0.26 1.03 0.32 0.05 0.16 0.14 0.14 0.22 0.22 0.23 0.31 0.26 0.19 0.02 0.10 3.66 3.94
f =k-5=15-5=10 2 teoretic5% =
2 exp
<
teoretic5%
34
Figu ra 3. 3
ni exp ni teor
frecvene absolute
50 40 30 20 10 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
categorii de diametre
35
( x)
a
( x a) (b x) dx
unde: a este limita inferioar a distribuiei experimentale; b este limita superioar a distribuiei experimentale iar , sunt exponenii funciei Beta. Funcia de repartiie (densitatea de repartiie), se calculeaz cu relaia: f ( x) C ( x a) (b x) , unde C este o constant aleas astfel nct suma frecvenelor absolute s fie egal cu N sau suma frecvenelor relative s fie 1. Deci, b N C ( x a) (b x) dx N C b
a
a
( x a ) (b x) dx
N
b
( x a ) (b x)
( x a ) (b x) dx
a
Fu ncia este foarte flexibil i se folosete pentru variabile continue. n silvicultur este foarte indicat pentru descrierea distribuiei arborilor n arboret pe categorii de diametre. Etapele ajustrii distribuiei experimentale dup distribuia Beta Redactarea tabelului de ajustare (tabelul 3.4) Calculul valorii medii x m e d , al varianei s 2 i al abaterii standard s . Stabilirea limitelor distribuiei: a=limita inferioar i b=limita superioar x a Calculul mediei aritmetice relative: x relativ b a 2 s 2 Calculul dispersiei relative: s relativ (b a ) 2 x relativ Calculul partametrului K: k 1 x relativ k 1 2 s r e l (1 k ) 2 n Calculul parametrilor n i m : ; 1 k x rel n m kn 1 x re m 1 ; n 1 Calculul exponenilor i cu relaiile: Calculul frecvenelor teoretice dup distribuia beta: i C ( x a) (b x) n
36
Compararea frecvenelor teoretice cu cele experimentale i verificarea calitii ajustrii cu un criteriu riguros. Figura 3. 4
Ajustarea distribiei experimentale dup distribuia Beta
ni exp
70 60
frecvene absolute
frecvene teoretice
50 40 30 20 10 0 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 categorii de diametre
Tabelu l 3 . 4
xi
14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 total
n i exp
4 16 20 34 50 52 59 55 40 30 20 16 9 4 2 411 x med = s2= s= x r elativ = K= n= m=
x ini
56 256 360 680 1100 1248 1534 1540 1200 960 680 576 342 160 84 10776
x i ni
784 4096 6480 13600 24200 29952 39884 43120 36000 30720 23120 20736 12996 6400 3528 295616
exp
0.007 2.79 0.034 14.04 0.065 26.89 0.093 38.23 0.113 46.50 0.124 51.01 0.126 51.63 0.118 48.65 0.104 42.71 0.084 34.67 0.062 25.55 0.040 16.49 0.021 8.62 0.007 2.97 0.001 0.26 1.000 411.01 C=2655x10-9 a= b= s 2 r elativ = =n-1= =m-1=
3 14 27 38 46 51 52 49 43 35 25 16 9 3 0
0.529 1.815 0.421 0.348 0.020 0.942 0.735 0.209 0.714 1.000 0.000 0.750
37
i n
ke
xi
i reprezint frecvenele teoretice; unde: n e este baza logaritmilor naturali (e=2,71828) k i sunt parametri funciei Pentru determinarea parametrilor ecuaiei, se logaritmeaz funcia de frecven: i log k xi log e i ln k log n ln n xi dar ln e 1 n aceast relaie se introduc frecvenele experimentale ale celor dou valori extreme ale variabilei (notatecu A i B), rezultnd un sistem de dou ecuaii cu dou necunoscute: i k. log n A log k A log e ln n A ln k A sau ln n B ln k B log n B log k B log e i log k xi log e nlocuim: log n i y i ; logk a i Dac n relaia log n log e b , aceasta devine y i = a+bx i , care este ecuaia unei drepte Parametri a i b se pot determina i prin metoda celor mai mici ptrate, rezolvnd sistemul de ecuaii: aN b n i x i ni y i
ni x i
n i x i2
ni xi y i
i a bxi , iar apoi, Cu noscnd valorile a i b se pate determina y i y i se pot calcula frecvenele absolute compensate deoarece log n
10 yi n
Exemplu: ntr-un arboret plurien s - au inventariat arborii i au fost grupa i pe categorii de diametre rezultnd distribuia experimental din tabelul 3.5. Se cere s se ajusteze aceast distribuie experimental dup legea Meyer.
38
Tabelu l 3 . 5
Ajustarea distibuiei experimentale a numarul de arbori pe categorii de diametre dup distribuia Mayer xi 8 12 16 20 24 28 32 36 40 44 48 52 56 60 64 total ni 395 210 101 62 39 28 45 49 56 63 42 30 16 10 3 1149 log ni 2.597 2.322 2.004 1.792 1.591 1.447 1.653 1.690 1.748 1.799 1.623 1.477 1.204 1.000 0.477 24.426 n comp 395 279 197 139 98 69 49 34 24 17 12 9 6 4 3 1335
2
Elemente de calcul
0.0 16.9 46.5 42.5 35.5 24.4 0.3 6.2 41.4 122.8 74.0 54.0 16.5 7.8 0.0 488.9
8 lg e 64 log e
2.596 0.477
2.596 3.4744
log k
2.119 24.3208
0.0871
2.5966 0.3026
k 10 2.8992
793.2
i n
793.2e
0.0871xi
1 1 a 42 93 b7 23 46 4 1 2 3 a7 73 46 8 b 0 4 9 3 6 7 5 6
ni x i
2.659
ni x
2 i
ni xi y i
0.0259
i y
2.659 0.0259 xi
10 yi n
39
Tabelu l 3 . 6
Ajustarea distibuiei experimentale a numarul de arbori pe categorii de diametre dup distribuia Mayer xi 8 12 16 20 24 28 32 36 40 44 48 52 56 60 64 540 b=
Figu ra 3. 5
log ni=yi
niyi 1025.7 487.7 202.4 111.1 62.1 40.5 74.4 82.8 97.9 113.4 68.2 44.3 19.3 10.0 1.4 2441
nixi 3160 2520 1616 1240 936 784 1440 1764 2240 2772 2016 1560 896 600 192 23736
nixi
nixi yi 8205 5852 3239 2223 1489 1135 2381 2982 3916 4988 3272 2304 1079 600 92 43756
yi comp 2.452 2.348 2.245 2.141 2.037 1.934 1.830 1.727 1.623 1.519 1.416 1.312 1.209 1.105 1.001 25.899
2.597 2.322 2.004 1.792 1.591 1.447 1.653 1.690 1.748 1.799 1.623 1.477 1.204 1.000 0.477 24.426
25280 30240 25856 24800 22464 21952 46080 63504 89600 121968 96768 81120 50176 36000 12288 748096 a=
-0.0259
2.659
Ajustarea distibuiei reale a numarul de arbori pe categorii de diametre dup distribuia Mayer
450 400 350 300
nr.arbori
12 16 20 24 28 32 36 40 44 48 52 56 60 64
categ de diam .
40
41
Erorile n verificarea ipotezei nule sunt de dou genuri : Erori de genul I , prin care pe baza rezultatelor prelucrrii datelor caracteristice eantionului, se respinge ipoteza nul cnd ea este de fapt adevrat la nivelul populaiei ; Erori de genul II , cnd , pa baza aceluiai eantion, se accept ipoteza nul, ea fiind de fapt fals la nivelul populaiei. Pentru a reduce erorile de genul I trebuie respinse numai ipotezele care se realizeaz cu o probabilitate mai mic de 5%. n unele situaii se resping ipot ezele care se realizeaz cu o probabilitate mai mic de 1% sau 0,1%. Valoarea de 5%(sau 1% sau 0,1%) se numete probabilitate de transgresiune sau nivel de semnificaie i se noteaz de obicei cu . Pentru erorile de genul II probabilitatea de a accepta H 0 , cnd de fapt ea este fals, se noteaz cu , iar n practic se alege de obicei =0,10 sau =0,05. Teste de semnificaie Verificarea ipotezelor statistice se face cu ajutorul testelor de semnificaie. Testul statistic este o metod care permite luarea unei decizii cu privire la o populaie pornind de la o informaie incomplet furnizat de un eantion. Testele statistice se aplic pentru compararea valorilor parametrilor unei populaii cu valori fixate anterior, sau la compararea ntre ele a valorilor a dou sau mai multe eantioane sau populaii. Pentru verificarea semnificaiei se folosesc mai multe categorii de teste de semnificaie, n funcie de natura ipotezelor de verificat. Frecvent utilizate sunt : Testele de conformitate destinate pentru a com para ntre ele o populaie teoretic i o prob observat, din punctul de vedere al mediilor, abaterii standard, varianei, coeficientului de corelaie, coeficientului de regresie, etc. Testele de egalitate , sau de omogenitate, permit compararea unui anum it numr de populaii prin intermediul unui numr egal de probe extrase din aceste populaii. Se aplic pentru verificarea omogenitii mediilor, varianelor, coeficienilor de corelaie, etc. Testele de ajustare permit s se verifice dac din toate punc tele de vedere, o prob observat poate fi considerat ca fiind extras dintr- o populaie dat. Aceast verificare se realizeaz prin compararea frecvenelor observate ale probei cu frecvenele teoretice a le populaiei. Testele de independen permit s s e controleze, n baza unor probe , dac sunt independente dou sau mai multe criterii de clasificare, n general calitative.
42
Clase de semnificaie . n raport cu mrimea probabilitii de transgresiune acceptat s - au format urmtoarele clase de semnificaie :
Dif erena este nesemnificativ (neasigurat) semnificativ (asigurat) distinct semnificativ (bine asigurat) foarte semnificativ (foarte bine asigurat)
Probabilitile de transgresiune, corespunztoare claselor de semnificaie, pot fi folosite pentru stabilirea limite lor n care se gsesc parametri populaiei. Aceste granie se numesc limite de ncredere. Prin intermediul lor se definete intervalul de ncredere.
DE
NCREDERE
AL
MEDIEI
n practic nu se admite indicarea simpl a mediei arit metice, ea trebuind s fie nsoit de intervalul de ncredere corespunztor probabilitii de transgresiune acceptat (5%, 1% sau 0,1%). Aceast cerin este impus de variabilitatea individual i de faptul c majoritatea cercetrilor se fac pe probe mai mult sau mai puin numeroase. Formarea intervalului de ncredere difer dup cum distribuia din care s- a extras proba este normal, binomial, Poisson etc i dac abaterea standard teoretic este sau nu cunoscut. Intevalul de ncredere al mediei n cazu l distribuiei normale. CAZUL 1 : Abaterea standard teoretic se cunoate La extragerea mai multor probe intervine, n locul abaterii standard, eroarea standard a mediei aritmetice:
sx
cunoscnd c i mediile probei se distribuie tot n ormal, n jurul aceleeai medii a populaiei, limitele intervalului de ncredere vor fi:
x us x
Pentru u=1,96 ; 2,58 sau 3,29, exist o (probabilitate de acoperire) de 95 ; 99 respectiv populaiei (med ia adevrat) s se gseasc undeva n x us x . Probabilitile de transgresiune (de depire, 5%, 1% respectiv 0,1%. siguran statistic 99,9 %, ca media intervalul definit de de a grei) sunt de
Exem plu: ntr -un arboret de molid s -a deter minat valoarea coeficientului de for m natural, prin doborrea a cinci arbori. S - a obinut o valoare medie de 0,50. Valoarea medie a coeficientului de variaie a coeficientului de f or m (s%), cunoscut din cercetri anterioare, este de 8%. (Pe baza a doar cinci
43
msurtori precizia de deter min are a abateri i standard este foarte redus i nu este indicat s o folosi m). Pentru o probabilitate de transgresiune de 5%, se cere s se stabileasc ntre ce limite este cuprins valarea adevrat a mediei coeficient ului de for m.
s%
s 100 x
0,5 * 8 100
0,04
iar
eroarea
standard
mediei:
sx
0.04 N 5
=5%
0,021
u= 1,96
CAZUL I1 : Abaterea standard teoretic nu se cun oate n acest caz, limitele intervalului de ncredere vor fi date de de expresia:
ts x
s N
Valoarea lui t se determin din tabela distribuiei Student n funcie de probabilitatea de transgresiune urmrit i de numrul gradelor de libertat e f ; f=N-1 . n cazul unui mare numr de observaii (N) , distriduiile t i u sunt identice i intevalul de ncredere va fi x us x .
Exem plu: ntr - o cultur de plop euramerican, s - au msurat 12 nlimi ale unor exemplare alese la nt mplar e, obinnd ur mtoarele rezultate:
arborele nlimea x (cm) 1 140 2 90 3 120 4 120 5 140 6 110 7 110 8 90 9 110 10 150 11 150 12 110
x 120cm
s= 20,8 cm
sx
s N
20,8 12
6,0
t= 1,96
x ts x
44
Testul u se aplic atunci cnd abaterea standard teoretic este cunoscut, cnd valoarea x provine dintr - o prob normal distribuit de volum foarte mare. Se d : - x media experimental calculat n baza unei probe cu N observaii extras dintr - o populaie cu media necunoscut. 0 - media cunoscut a unei populaii ce poate rezulta din consideraii teoretice sau din observaii anterioare. abaterea standard cunoscut Se cere s se determine dac ntre media i 0 exist diferene, deci dac este valabil ipoteza H 0 : = 0 . Se calculeaz:
x
x
Dac u e x p e r i m e n t a l > u t e o r e t i c , atunci diferena ntre cele dou medii este semnificativ i ipoteza nul se va respinge
Pe nt r u se mi ne le de bra d s - a sta bil it ca va l oa r e med ie a p op ula iei gre uta te a de 55 , 4 g p e nt ru mi a de s emi ne i o a ba ter e sta nda rd de 7, 8 5 g. O cer ce ta re e fe ct ua t n tr - o a n u mit z o n ba za t pe un n um r de 2 76 ob ser va ii a sta bil it o n ou me d ie de 61 , 3 gra me . N e in tere sea z da c n o u a med ie e ste ma i m a re de c t c e a st a bil it ca med ie a p op ula iei :
Ex empl u :
u exp
u t a b e l a r = 1,64 . D e c i, u e x p >u t a b e l a r di fe re na e ste se m n i fi ca t iv , de ci gre uta te a se m i ne l or din ca re s - a u f c ut obs er va i ile se d eo s ebe te f oa rte sem ni fi ca ti v de m e di a sta b ili t a nte ri or .
12,48
Folosirea testulu t Testul t se aplic atunci cnd nu se cunoate valoarea teoretic a abaterii standard i cnd numrul d e msurtori estze relativ mic ( N<30 ) x 0 t N s Se pune problema i n acest caz dac ntre media eantionului ( x ) i media populaiei ( 0 ) exist sau nu diferene, deci dac este sau nu valabil ipoteza nul H 0 : x 0 Raportul t se distribuie dup legea Student i este tabelat n funcie de numrul gradelor de libertate f= N-1 i probabilitatea de transgresiune acceptat. Dac t c a l c u l a t > t t e o r e t i c atunci ipoteza nul se respinge.
Exem plu: Pentru o anumit localitate s- a nregistr at, ca medie multianual, cantitatea de precipitaii de 440 mm. n ultimii 10 ani precipitaiile au fost mai reduse, media fiind de numai 400 mm, iar abaterea standard de 20 mm. Ct de semnificativ este diferena dintre cele dou m edii ?
x s
400 440 10 20
0,5 10
1.58
45
Din tabele, pentru =5%unilateral , t t a b e l a r =1,833 Deci t e x p <t t a b abaterea este nesemnificativ pentru probabilitatea de transgresiune de 5%.
4.3.2. Examinarea semnificaiei varianei i a diferenei dintre variane Compararea unei variane experimentale ( s 2 ) cu o varian teoretic dat ( 0 2 ) se face cu ajutorul criteriului 2 . Dac notm: s 2 variana experimental 2 variana populaiei 2 0 variana teoretic dat pentru populaie Se cere s se stabileasc d ac 2 se deosebete de 0 2 , adic dac este sau nu valabil ipoteza nul H 0 : 2 > 0 2 s2 Se calculeaz raportul i se compar cu valoarea teoretic a 2
0 2
raportului
unde
s2
2
i de f .
ipoteza este adevrat, deci 2 > 0 2 f De obicei intereseaz numai dac 2 > 0 2 sau dac 2 < 0 2 , i n aceste cazuri folosim testul unilatelal. Dac ne intereseaz ambele variante ( 2 > 0 2 i 2 < 0 2 ) folosim testul bilateral. Tabelele pentru 2 teoretic sunt ntocmite pentru testul unilateral. Dac
2 0
(respectiv p 100
<
).
Exem plu: Dintr -o ndelung at practic a cercetrilor, se cunote c var iana factorului de cubaj al lemnului de foc est e de 0 2 =0,0038 (sau 0 =0,062 ; %=10 ). La o nou cercetare, efectuat asupra a 59 uniti, a rezultat o abatere standard s=0,075 i o dispersie s 2 =0,0056 ( s 2 es ti meaz pe 2 ). Este oare semnificativ diferena dintre cele dou variane ( 0 2 i s 2 ) la o probabilitate de transgresiune de 5% ? H0:s2 > 02 Calculm
s2
2 0
0.0056 0.0038
1.47
2 teoretic=
=5 %i f=59 -1=58
76,8
(prin
46
76.8 1.32 58
s2
2 0
din care s - a extras pr oba are o dispersie mai mare dect cea cunoscut. Sti vele din care s - au extras cele 59 de probe sunt mai puin omogene n raport cu factorul de cubaj dect cele anterior studiate.
Limitele de ncredere ale varianei Limitele inferioar i superioar ale intervalului de ncredere, pentru o probabilitate de transgresiune , vor fi: s2 s2 2 2 s sup s inf . 2 2
1 2
f f unde: s este variana rezultat din experiment; 2 2 pentru probabilitatea p= 100- /2 1 este criteriul 2 2 pentru probabilitatea p= /2 2 este criteriul f este numrul gradelor de libertate f=N-1 Exemplu: Limitele de ncredere pentru varian a s 2 =0,0056 din exemplul anterior, pentru o probabilitate de transgresiune de 5% se calculeaz astfel: Din tabele, se ia valoarea lui 1 2 pentru probabilitatea p=1005/2=97,5 %i f=58 pentru f=50 1 2 =32,36 2 pentru f=60 pentru f=58 1 =40,48 8 2 32.36 (40.48 32.36) 38.9 1 10 se ia valoarea lui 2 2 pentru probabilitatea p=5/2=2,5% i f=58 pentru f=50 2 2 =71,42 2 pentru f=60 pentru f=58 2 =83,30 8 2 71.42 (83.30 71.42) 80.92 2 10 s2 0.0056 0.0056 s2 0.0056 0.0056 2 2 s sup 0 . 0084 s 0.0040 inf . 2 2 38.9 80.9 0.67 1.39 1 2 58 58 f f
2
Aadar, n 95% din cazuri, la repe tarea experienei, ne putem atepta la o varian cuprins ntre 0,0084 i 0,0040. Limitele abaterii standard vor fi: 0.0084 0.092 i respectiv 0.0040 0.063 .
47
aplic pentru verificarea omogenitii mediilor, varianelor, coeficienilor de corelaie. 4.4.1. Verificarea semnificaiei diferenei dintre dou variane Se varianele i s 2 2 . Se Se verific ipoteza nul H 0 : 1 2 = 2 2 unde 1 2 i 2 2 reprezint teoretice corespunztoare celor dou variane experimentale s 1 2
folosete testul F (Fischer). calculeaz raportul dintre dispersia cea mai mare (pe care o s12 notm cu s 1 2 ) i dispersia cea mia mic (notat cu s 2 2 ): Fcalc 2 s2 F c a l c se compar cu F t e o r e t i c determinat din tabele, n funcie de probabilitatea de transgresiune acceptat ( ) i numrul gredelor de libertate f 1 i f 2 . F 1 =N 1 -1 gradele de libertate al dispersiei mai mari ( s 1 2 ) F 2 =N 2 -1 gradele de libertate al dispersiei mai mici ( s 2 2 ) Dac F c a l c <F t e o r e t i c ipoteza nul se accept , diferena dintre cele dou dispersii fiind considerat ca nesemnificativ, deci cele dou probe sunt extrase din aceeai populaie. Varianele fiin d omogene se poate calcula o varian reunit care se va apropia cel mai mult de variana populaiei: 2 2 s12 ( N 1 1) s 2 ( N 2 1) s12 f 1 s 2 f2 s2 N1 N 2 2 f1 f 2 Dac F c a l c >F t e o r e t i c diferena dintre cele dou dispersii este semnificativ, varianele nu sunt omogene, provenind din populaii diferite, i nu se poate calcula o varian comun. Deoarece intereseaz 1 2 = 2 2 se va aplica criteriul F bilateral (ne intereseaz abaterile n ambele sensuri). De aceea, din tabelele pentru F unilateral se iau valorile lui F teoretic la o probabilitate de /2. De exemplu, dac ne intereseaz F bilateral pentru =5%, din tabelele cu F unilateral lum valoarea corespunztoare probabilitii de 2,5%.
Exem plu: n aceleai condiii staionale au fost instalate dou culturi de plop euramerican: pri ma di n clona A i a doua di n clona B. Au fost fol osii puiei de aceeai vrst i nlime, iar prelucrarea solului a fost identic. Dup doi ani de la plantare au fost msurate nli mile la 35 de exemplare din clona A i la 45 de exemplare din clona B. Dup prelucr area datelor respective, a rezultat o varian de 0,70 pentr u clona A i de 1,38 pentru clona B. S se stabileasc dac variabilitatea nli milor la cele dou cultur i este sau nu identic. s 1 2 = 1,38 este variana cea mai mare (a clonei B) i s 2 2 = 0,70 est e variana cea mai mic (a clonei A) Numrul gr adelor de li bertate va fi: f 1 =N 1 -1=45-1=44 i f 2 =35-1=34
48
Fcalc
s12 s
2 2
Din tabelele, pentru = 5%, i f 1 =44, f 2 =34 F t a b e l a r =1,9 ( n tabelele pentru F unilateral fol osi m probabilitatea =2,5%) Deoarece F c a l c =1,97 > 1,9=F t e o r e t i c diferena dintre cele dou dispersii este semnificativ i putem susine c cele dou clone difer din punct de vedere al variabilitii nlimilor.Varianele nefiind omogene, nu se poate calcula o varian comun.
4.4.2. Exam inarea egalitii mai multor variane Se verific ipoteza nul H 0 : 1 2 = 2 2 = 3 2 ... = k 2 Bartlett a demonstrat c variabila ntmpltoare: s i2 1 k f i ln , C i 1 s unde
C 1 1 3k 1
2
k i 1
1 fi
1 f
urmeaz aproximativ legea distribuiei fiind numrul varianelor examinate. Se calculeaz unde s 2
fi s fi
2 i
empiric cu relaia:
2.303 f lg s 2 C
f i lg s i2 ,
i 1
Din tabele, n funcie de i de numrul gradelor de libertate f=k2 1 , se obine t e o r e t i c . 2 Dac 2 c a l c u l a t se accept ipoteza nul, deci ntre teoretic varianele considerate nu exist diferene semnificative. n acest caz, pentru caracterizarea populaiei din punct de vedera al variabilitii se va lucra cu variana medie. 2 Dac 2 c a l c u l a t se respinge ipoteza nul, deoarece teoretic ntre varianele considerate exist diferene semnificative. Nu se poate calcula o varian medie, deoarece cel puin una dintre dispersii se refer la alt populaie. Se poate trece la omogeniz area sistemului, prin eliminarea din calcul a varianei care se abate cel mai mult de la celelalte. Dac dup aceast excludere sistemul este omogen se poate calcula o varian comun. Dac nu, se poate continua omogenizarea prin eliminarea urmtoarei vari ane aleas n acelai mod. Testul Hartley este un mod mult mai simplu de verificare a omogenitii mai multor variane dar se poate aplica numai n cazul grupelor cu numr egal de observaii ( n ) .
49
care se comp ar cu H t e o r e t i c luat 2 s min im din tabele, n funcie de numrul gradelor de libertate f=n-1 i de p (numrul de grupe comparate) Dac H c a l c u l a t Hteoretic ntre variane nu exist diferene semnificative. Dac H c a l c u l a t Hteoretic ntre variane exist diferene semnificative. 4.4.3. Distribuia abaterii standard Abaterea standard, privit ca o variabil aleatoare, atunci cnd numrul de observaii este mare, are o distribuie aproximativ normal, cu 2 si f i 1 2 s 1 media , unde s i variana: s . Abaterea 2f 2f fi standard va fi: s
2f u s 2f
2 s max im
Limitele de ncredere ale abaterii standard vor fi : s 4.4.4. Distribuia coeficientului de variaie
Atunci cnd numrul de msurtori este mare, coeficientu l de variaie are o distribuie normal. Abaterea standard a coeficientului de variaie este dat de relaia:
ss % % 2f
%1
% 1 2 100
u 2f
Cu limitele de ncredere:
% 1 2 100
Dac nu se cunoate valoarea coeficientului de variaie teoretic ), s e admite folosirea estimaiei s%. 4.4.5. Examinarea semnificaiei diferenei dintre dou medii
Fie x11 , x12 ,...x1n i x 21 , x 22 ,...x 2 n dou sisteme de observaii extrase randomizat din dou populaii normal distribuite, cu parametrii: 1 1 i ; 2 i 2 . Pentru fiecare prob se calculeaz indicii: x1 x2 1 ; 2 2 2 s1 1 , cu f 1 =N 1 -1 grade de libertate ;
50
2 1
N1
, respectiv
2 2
N2
.
x1 x 2 formeaz de asemenea o distribuie normal
1 2
2 2
2 d
2 1
N1
N2
2 1 2 2
sau
Decizia de ncadrare n unul dintre cele dou cazuri s e ia dup 2 verificarea ipotezei nule H 0 : 12 2 . Verificarea se face cu testul F. Dac probele nu sunt extrase din populaii cu distribuii normale, se caut s se ajung la forma normal prin transformri.
2 2 CAZUL 1 : Compararea a dou medii n situaia cnd 1 2 2 Dup verificarea ipotezei H 0 : 12 2 cu testul F, dac aceasta este
just se trece la verificarea ipotezei H 0 : 1 2 Dac aceast ipotez este just, atunci diferenele d x1 x 2 0 i cu variana formeaz o distribuie normal, cu media 1 2
2 d 2
1 1 N1 N 2 Raportul:
u exp d
d
x1
x2
1 1 N1 N 2 constituie criteriul prin intermediul cruia se examineaz semnificaia diferenei dintre cele dou medii. Dac u e x p <u t e o r e t i c determinat n funcie de , diferena dintre medii este nesemnificativ. Criteriul u se poate folosi doar atunci cnd cele dou medii provin din eantioane de volum mare normal distribuite. Dac nu se cunoate valoarea lui 2 , cnd cele dou medii provin din eantioane cu volum mic i nu avem certitudinea normalitii eantionului, parametrul 2 se nlocuieta cu estimaia s 2 .
51
Din tabele, n funcie de i f=N 1 +N 2 -2 , se obine t t e o r e t i c . Dac t e x p <t t e o r e t i c se accept ipoteza nul. n acest caz se poate calcula o medie ponderat: N 1 x1 N 2 x 2 x N1 N 2 i o varian comun: 2 2 x1i x x 2i x 2 2 s0 N1 N 2 1 Pentru noua valoare medie limitele inter valului de ncredere vor fi: x ts x Procedeul diferenelor limit (DL) se folosete la compararea 2 mediilor tot n cazul cnd 12 2 . Se aplic relaia: DL ts d Din tabele, se extrage valoarea t pentru =5%, =1% i =0,1%. s d eroarea standard a diferenei se calculeaz cu relaia:
sd s N1 N 2 , N1 N 2
unde s
s12 f 1 f1
2 s2 f2 f2
Se calculeaz diferena d x1 x 2 i se compar cu diferenele limit DL. Dac : DL 5 % >d diferena este nesemnificativ DL 1 % >d>DL 5 % diferena este semnificativ DL 0 , 1 % >d>DL 1 % diferena este distinct semnificativ d>DL 0 , 1 % diferena este foarte semnificativ d f o a r t e s e m n i f i c a t i v >DL 0 , 1 % > d d i s t i n c t >dn esemnificativ
semnificativ
Exem plu: ntr -un arboret de larice s - au extras probe de cretere la 70 de arbori pe dou direcii (Nord i Sud) ale aceleeai seciuni transversale. S se stabileasc ce influen are asupra mediilor de selecie poziia de recoltare a probelor.
52
Poziia
Media de selecie
Dispersia s 2
Nord Sud
15.42 13.64
4.1 3.7
70 70
2 1 2 2
69 69
Fexp
s12 s
2 2
F t e o r e t i c =1,47
2 1 2 2
Deoarece F e x p <F t e o r e t i c se admite ipiteza potrivit creia poate calcula o va rian comun:
i se
s2
s12 f 1 f1
2 s2 f2 f2
4.1* 69 3.7 * 69 69 69
538.2 138
3.9
s
t exp
s2
1 s N1
1.78 0.335
5.313
Pentru =5 % i f=N 1 +N 2 -2=138 , se obine t t e o r e t i c =1,98 t e x p >t t e o r e t i c mediile nu sunt estima ii ale aceleeai medii a populaiei, deci poziia de recoltare a probelor de cretere influeneaz puternic valoarea medie a creterii. Prin procedeul diferenei lim it :
N1 N 2 N1 N 2
1.97
70 70 70 * 70
1.97 *
140 4900
0.335
DL0.001 t 0.001s d
x1
x2
d=1,78>1,129=DL 0 , 1 %
2 2 CAZUL 2: Compararea a dou medii n situaia cnd 1 2 n acest caz se lucreaz cu testul t. Deoarece n acest caz testul t nu poate fi aplicat n mod obinuit, se introduce o modifica re la calculul gradelor de libertate. Astfel, n locul formulei f=N 1 +N 2 -2 , intervine expresia: s12 N1 1 1 f , unde iar f 1 N1 1 i c 2 2 2 2 2 s1 s2 s2 N1 1 c c 1 2 f1 f2 N1 N 2 s1 N 2 f2 N2 1 Se parcurg urmtoarele etape: 2 - cu ajutorul testului F se verific ipoteza H 0 : 12 2
53
Fexp
2 1 2 2
s12 2 s2
dac
- se calculeaz
t exp
x1
2 sx 1
x2
2 sx 2
sx
s N
i de f determinat
Exem plu: ntr -un arboret de molid s - au putut distinge dou poriuni: prima poriune, unde o perioad ndelungat s - a pr acticat punatul; a doua poriune ferit de punat, datorit unor mprj muiri efectuate din timp. S - a cerut s se stabileasc dac punatul a influenat asupra nlimii medii a arboretului. n acest scop, n cele dou poriuni au fost msurate cte 25 de nlimi la arbori cu diametre apropiate de diametrul mediu. n baza msurtorilor efectuate, au rezultat ur mtoarele valori ale indicilor statistici:
nlimea medie Poriuna punat Poriuna nepunat Dispersia s 2 N Grade de libertate f =N-1
25.7 27.5
2 1 2 2
2.35 1.05
25 25
24 24
- se verific ipoteza H 0 :
Fexp s12 s
2 2
cu testul F =5%
2 1 2 2
2.35 1.05
2.24
F t e o r e t i c =1,98 pentru
t exp
F e x p >F t e o r e t i c i se respinge ipoteza nul, deci se x1 x 2 x1 x 2 25.7 27.5 1.8 4.9 sx 2 2 2 2 2.35 1.05 0.369 s x1 s x2 s1 s2 25 25 N1 N 2
calculeaz
s N
s12 N1 s12 N1
1
2
2 s2 N2
0.69
iar
42 2 1 c 0.69 1 0.69 f2 24 24 - n funcie de =5% i de f=42, se extrage din tabele t t e o r e t i c =2,021 t e x p =4.9 > 2.021= t t e o r e t i c cele dou medii se refer la populaii distincte c f1
2
54
s12 N1
2 s2 N2
2.35 1.05 25 25
0.37
DL0.001 t 0.001s d
x1
x2
25.7 27.5
1.8
diferena este foarte semnificativ
d=1,8>1,31=DL 0 , 1 %
4.4.6. Testarea semnificaiei diferenei din tre dou procedee sau metode prin utilizarea metodei cuplurilor n practic, frecvent este necesar s se cunoasc dac dou procedee, aplicate n aceleai condiii, conduc la rezultate diferite sub raportul preciziei i eficienei. Prin procedeu se poate nelege: dou metode de msurare, dou agregate folosite la efectuarea aceleeai operaii, dou metode de prelucrare (a solului, a arboretului) etc. Pentru a nltura inconvenientul cu privire la variabilitatea colectivitii cercetate, se adopt de la n ceput o schem sistematic de eantionaj, n cadrul creia, pentru cele dou procedee, se ridic cupluri de valori. Procednd n acest fel se elimin variabilitatea datorat unor cauze ntmpltoare i rmne de analizat numai abaterea sistematic proprie procedeelor analizate. Pentru fiecare cuplu (pereche) de valori se calculeaz diferena: di d i xi1 xi 2 i media diferenelor: d N Se calculeaz apoi variana i abaterea standard a diferenei: 2 di 2 di 2 N 2 sd sd ; sd N 1 x1 x 2 N i se compar cu t t e o r e t i c . Se calculeaz : t exp sd Dac t e x p >t t e o r e t i c diferen semnificativ ntre cele dou procedee. Exemplu: ntr- o pepinier s - au ales douzeci de parcele perechi pentru urmrirea efectului aplicrii unui ngrmnt asupra creterii n nlime a puieilor. O pereche este format din dou parcele vecine, din care una,
55
aleas prin tragere la sori, se trateaz iar cealalt rmne martor.Rezultatele obinute sunt cele din tabelul de mai jos d i 8.3 0.83 Compararea mediilor prin procedeul cuplurilor d N 10 2 nlimea medie n di 8.3 2 2 Perechea 2 d 12 . 89 d i =x 2 -x 1 di i nr. parcela tratat cu 2 N 10 sd martor ngramnt N 1 9
1 2 3 4 5 6 7 8 9 10 5.5 5.5 6.0 6.6 6.1 7.5 6.4 7.3 7.4 5.6 Total 6.2 5.6 5.6 7.7 7.7 8.6 6.4 8.0 8.4 8.0 0.7 0.1 -0.4 1.1 1.6 1.1 0.0 0.7 1.0 2.4 8.3 0.49 0.01 0.16 1.21 2.56 1.21 0.00 0.49 1.00 5.76 12.89
0.667
sd
t exp
2 sd
0.667
x2 N
0.817
0.83 10 0.817 3.21
x1 sd
aplicrii
t e x p >t 0 , 0 5 ngrmntului,
4.4.7. Compararea a dou proporii (procente) Pentru stabilirea semnificaiei diferenei dintre dou proporii se utilizeaz testul u . 1 1 p1 p2 2N1 2N 2 u exp 1 1 p(1 p) N1 N 2 . unde: a1 p1 este proporia caracteristicii aflate n a 1 cazuri din N1 eantionul N 1 ; a2 p2 este proporia caracteristicii aflate n a 2 cazuri din N2 eantionul N 2 ; a1 a 2 p este proporia total. N1 N 2 Pentru N suficient de mare se poate renuna la coreciile 1/2N 1 i 1/2N 2 de la numrto rul relaiei de calcul a lui u. Dac u e x p > u t e o r e t i c diferena dintre proporii este semnificativ.
56
uteoretic
diferena
dintre
proporii
este
4.4.8. Compararea mai multor proporii Pentru stabilirea semnificaiei diferenei din tre mai multe proporii se utilizeaz testul hi ptrat ( 2 ) determinat cu relaia:
2
2 exp
pi
p (1 p ) Ni
N i ( pi p) 2 p (1 p )
ai este proporia i , dintre a i cazuri favorabile din numrul de Ni ai observaii N i , iar p , este proporia medie. Ni 2 2 Dac diferena dintre proporii este exp erimental> teoretic semnificativ. 2 t e o r e t i c se deetermin din tabele, n funcie de probabilitatea de transgresiune i de f=K-1 grede de libertate, unde K este numrul proporiilor analizate.
unde p i
Se folosete criteriul 2 . Este important ca la aplicarea acestui test s se respecte urmtoarele: - numrul observaiilor s fie suficient de mare - frecvenele teoretice s nu fie mai mici dect 5; n caz contrar se reunesc unele clase, astfel nct s se obin frecvene peste 5. - s se lucreze numai cu frecvene absolute.
57
Se calculeaz:
i n i sunt frecvenele teoretice absolute iar, n unde: n i sunt frecvenele experimenta le. Din tabele, se determin 2 t e o r e t i c , n funcie de probabilitatea de transgresiune i de numrul gradelor de libertate: f=k-n-1 unde: k reprezint numrul claselor rmase dup gruparea claselor cu frecvena sub 5, iar n reprezint numrul momentelor lu ate n considerare la calculul distribuiei teoretice. ( n=1 pentru distribuia binomial i Poisson; n=2 pentru distribuia normal; n=4 pentru distribuia Charlier; n=0 n cazul comparrii a dou distribuii empirice, deoarece nu se calculeaz nici un moment). 2 2 Dac diferena dintre distribuii este exp > teoretic semnificativ, se respinge ipoteza nul.
2 exp
ni
i n
Criteriul Irwin (criteriul ) Dup ce se calculeaz abaterea standard a irului cresctor, prntru valorile extreme suspecte se calculeaz:
ordonat
58
x2
x1
s s unde x 1 , x n sunt valorile extreme suspecte iar x 2 , x n - 1 sunt valori ce aparin irului. Din tabele, se extrag valorile lui t e o r e t i c : Numrul valorilor observate P 10 50 100 400 1000 valori ale lui eor etic : 0.95 1.5 1.1 1.0 0.9 0.8 0,99 2 1.6 1.5 1.3 1.2
xn
xn
exp<
teoretic teoretic
nou s 2 .
exp>
variabila dubioas se ncadreaz n irul statistic; variabila dubioas se elimin, i se calculeaz din
zq s
unde: x este media aritmetic, s abaterea standard, iar z q este un coeficient ce se determin din tabele, n funcie de probabilitatea de transgresiune acceptat i de numrul de observaii ( N ) Criteriul Romanovschi Pentru eliminarea valorilor suspecte, se propune efectuarea urmtoarelor calcule: a) Determinarea abaterii standard de selecie numai pentru N-1 mrurtori, cu relaia:
N 1 Calculul abaterii standard s pentru ntreaga colectivitate, n funcie de mrimea lui s , utiliznd relaia aproximativ: N 1 s s N Determinarea m rimii z cu relaia: xn x z exp s Determinarea lui z t e o r e t i c , din tabele, n funcie de probabilitatea de transgresiune q i de numrul de observaii ( N ). Comararea lui z c a l c u l a t cu z t e o r e t i c . Dac z c a l c u l a t > z t e o r e t i c , atunci valoarea lui x n trebuie eliminat din irul de date. s xi x ni
2
b)
c)
d)
e)
59
Criteriul Grubbs Pentru eliminarea valorilor aberante (fie x 1 , fie x n )se procedeaz astfel: a) Se ordoneaz datele irului x 1 , x 2 ,..x n n ordine cresctoare ; b) Se determin media aritmetic ( x ) i aba terea standard (s) ; c) Se calculeaz indicatorii: xn x v , pentru situaia n care x n este considerat s valoarea aberant, i x x1 v , pentru situaia n care x 1 este considerat s valoarea aberant. d) Se determin z q , din tabele , n funcie de probabilitatea de transgresiune q i de numrul de observaii ( N ). e) Se compar valorile lui v sau v cu valoarea lui z q . Dac v sau v > z q , atunci valoarea extrem trebuie eliminat. Dup ce o valoare dintr - un ir a fost eliminat printr -un criteriu oarecare, este posibil ca o nou valoare din cele rmase s par suspect. n acest caz, irul de dare rmas se supune din nou testri statistice. Dac eliminarea treptat a valorilor aberante nu mbuntete indicatorii preciziei, nseamn c materialul nu a fost omogen sau datele nu au fost culese corespunztor. n asemenea situaii rezultatele obinute nu mai pot fi considerate ca general valabile i nu pot conduce la stabilirea unor legiti cu caracter general.
60
cauzalitate nu se cunoate i el se poate datora aciunii unor factori neluai n considerare, unor erori de msurare. Aceast variaie rezidual ( s E 2 ) este folosit ca unitate de msur pentru examinarea semnificaiei celorlalte componente ale variaiei totale. n acest scop se folosete testul F : - dac F e x p e r i m e n t a l < F t e o r e t i c factorul studiat nu influeneaz caracteristica respectiv - dac F e x p e r i m e n t a l > F t e o r e t i c factorul studiat are o influen semnificativ. Dac prin testul F s- a constatat o influen semnificativ a unor anumii factori, se trece apoi la o analiza de detaliu, cu ajutorul testului t , stabilindu- se ntre care variane exist diferene semnificative. Analiz a este aplicabil atunci cnd: - varianele probelor luate n considerare sunt omogene - probele se formeaz randomizat (la ntmplare) - varianele reprezint probe extrase din populaii normal sau aproape normal distribuite - numrul observaiilor este suficient de mare Analiza varianei poate fi: - simpl cnd valorile individuale se grupeaz dup un singur criteriu - dubl cnd observaiile se grupeaz dup dou criterii - multipl cnd n experimente intervin mai mult e grupri.
Grupa
(varianele factorului T)
Valorile observate xij x11 x12 x13 ... X1n1 x21 x22 x23 ... X2n2
1 2
Suma Ti T1 T2
Media
x1
x2
xk
...
...
...
...
k Total
nk N=Sn i
Tk G=ST i
...
G/N
61
xij N
2
2 2 xij
G2 N
G 2 Q xij C N unde C este denumit termen de corecie - suma ptratelor abaterilor ntre grupe (variane) Ti 2 QT C ni - suma ptratelor abaterilor din interiorul grupelor (varianelor) QE Q QT QT 2 - variana ntre grupe (variane): sT fT QE 2 sE - variana rezidual (eroare): fE
dac se nlocuiete C
2 sT var ianta dintre grupe F - testul F: 2 varianta reziduala sE f T K 1 - numrul gradelor de libertate pentru variana ntre grupe f E N K - numrul gradelor de libertate al varianei reziduale Desfurarea calculelor este prezentat n tabelul 5.2.
Tabelu l 5 . 2
Sursa variaiei Suma ptratelor abaterilor Numrul gradelor de libertate Dispersia
s T2 QT K 1
QT
Ti 2 C ni
fT fE C
K 1 N
N -1
2 sT 2 sE
QE
Q
Q QT
2 x ij
2 sE
Total
s2
QE N K Q N 1
F 0.05 = F 0.01 =
Valoarea teoretic a lui F se extrage din tabele, n funcie de f 1 numrul gradelor de libertate al varianei mai mari ( f T sau f E ) i f 2 numrul gradelor de libertate al varianei m ai mici. Dac F c a l c u l a t > F t e o r e t i c ipoteza nul se respinge i, n acest caz, se trece la o analiz de detaliu privind stabilirea semnificaiei diferenelor dintre grupe , analiz ce se face prin intermediul testului t :
62
unde t se determin n funcie de f=N-K grade de libertate. Dif renele d xi x j dintre media varianei i i media varianei j se compar cu diferenele limit calcula te pentru diferite probabiliti. Dac: - d< DL 5 % diferena este nesemnificativ - DL 5 % <d<DL 1 % diferena este semnificativ - DL 1 % <d<DL 0 , 1 % diferena este distinct semnificativ d>DL 0 , 1 % diferena este foarte semnificativ La analiza simp a varianei, se pot utiliza grupe cu numr egal de observaii sau grupe cu numr inegal de observaii . Exempu: n vederea extinderii molidului n afara arealului natural de vegetaie se cere s se stabileasc condiiile staionale n ca re se obin cele mai bune rezultate. Pentru aceasta s -au ales randomizat, n patru tipuri de staiuni (I, II, III, IV), cte cinci arborete arborete de aceeai vrst. Pentru fiecare arboret s - a determinat nlimea medie, nlime considerat drept criter iu de estimare a productivitii arboretului. S- au obinut urmtoarele date de teren:
Tabelu l 5 . 3
Grupa
(tipul de staiune)
ni 5 5 5 5 20
Sume Ti 85 60 65 70 280
Media
x
17.0 12.0 13.0 14.0 14.0
I II III IV
63
Pentru simplificarea calculelor se scade 10 din fiecare valoare observat, fr ca prin aceasta rezul tatul calculelor s se modifice cu ceva:
Tabelu l 5 . 4
Grupa
(tipul de staiune)
ni 5 5 5 5 20
2 5 ; s II
Sume Ti 35 10 15 20 80
Media
si
I II III IV
8 3 4 5 Total
xij 7 1 3 5
x
7.0 2.0 3.0 4.0 4.0 5.0 1.0 3.5 2.0
4 3 5 3
10 1 0 2
2 I
x Ii
xI
12 12
N 1
0 32 4
32
20 4
0 2 12 12 12 12 4
4 1; 4
..... Se verific omogenitatea varianelor cu testul Hartley : 2 s max 5 H calc 5 2 s min 1 H t e o r e t i c = 20,6 - luat din tabele, n funcie de numrul gradelor de libertate f=5-1=4 i de p=4 (numrul de grupe comparate), pentru =0,05. Hcalculat Hteoretic ntre variane nu exist diferene semnificative Potrivit schemei de calcul, obinem: G 2 80 2 6400 C 320 N 20 20
Q
2 xij
(6 2
82
Ti 2 35 2 10 2 25 2 20 2 QT C 320 70 cu f T K 1 4 1 3 ni 5 grade de libertate QE Q QT 116 70 46 cu f E N K 20 4 16 grade de libertate QT 70 2 23.3 variana ntre grupe: sT fT 3 Q E 46 2 sE 2.9 variana rezidual: f E 16 Q 116 6.1 variana total: s 2 f 19 Fexp
F0,05
2 sT
s 3.24
2 E
23.3 2. 9
8
F0,01 5,29
pentru f 1 =3 i f 2 =16
64
Fexp> Fteoretic diferen distinct semnificativ ntre tipurile de staiune i, n acest caz, se trece la o analiz de detaliu privind stabilirea semnificaiei diferenelor dintre grupe , analiz ce se face prin intermediul testului t :
2 2s E 2 * 2,9 1,077 n 5 - se determin diferenele limit pentru diferite probabiliti de transgresiune: DL5% t 0,05 s d 2.12 *1.077 2.27 pentru f=N-K =16 t 0 , 0 5 =2,12
DL1%
t 0 , 0 1 =4,015
xi
xj :
Grupa I II III IV
x
7.0 4.0 3.0 2.0
I -
Deci, tipul I se deosebete semnificativ de tipul IV , distinct semnificativ de tipul III i foarte semnificativ de tipul II . Productivitatea mai ridicat a culturilor de molid din staiunea I este dovedit statistic. Deosebirile dintre celelalte tipuri de staiuni sunt statistic neasigurate.
65
Grupa
I 7.0
IV 4.0 2
III 3.0 3 2
II 2.0 4 3 2
x
rangul p fa de I rangul p fa de IV rangul p fa de III
o Din tabele, pentru f=16 grade de libertate, pentru probabilitatea de transgresiune aleas i n funcie de numrul mediilor cuprinse n serie (rang) p , se determin valorile q (amplitudini de variaie Student). Pentru exemplul c onsiderat obinem:
p q 5% q 1% 2 3.00 4.16 3 3.14 4.36 4 3.24 4.49
o Se calculeaz diferenele semnificative cele mai mici, respectiv DL5% q 5% s x i DL1% q1% s x :
p DL 5% DL 1% 2 2.3 3.2 3 2.4 3.3 4 2.5 3.4
o Diferena dintre dou medii oarecare dintr -un ir de k medii se c onsider semnificativ dac este mai mare dect DL 5 % .
T ab elu l 5 . 7
p 4 3 2 3 2 2
Diferena dintre medii este semnificativ semnificativ semnificativ nesemnificativ nesemnificativ nesemnificativ
Rezultatele se pot trece ntr -un tabel centralizator similar celui folosit la stabilirea semnificaiei diferenelor dintre grupe prin intermediul testului t .(tab.5.5) Testul Duncan este mai sever dect testul t, de aceea este mai folosit, n special n cazul cnd se compar un numr mare de variane.
66
5.4. ANALIZA DUBL A VARIANEI Valorile observate se grupeaz dup doi factori A i B. Metoda permite analiza influenei exercitate de cei doi factori A i B asupra caracteristicii luate n considerare (x i j ). Datele privind variaia caracteristicii x n raport cu facorii A, B se trec ntr-un tabel de forma: (tabelul 5.8)
Tabelu l 5 . 8
Variantele factorului A
Variantele factorului B 1 x11 x21 xi1 xm1 B1 xB1 2 x12 x22 xi2 xm2 B2 xB2 j x1j x2j xij xmj Bj xBj n X1n X2n Xin Xmn Bn xBn
Suma Ai A1 A2 Ai Am
Media
x
xn1 xn2 xni xnm
Variana si2
1 2
...
I
...
C C
Se Se -
pe total Q
2 x ij
C , unde C
G2 este termenul de mn
corecie. calcul eaz numrul gradelor de libertate ntre variantele factorului A f A m 1 ntre variantele factorului B f B n 1 fE m 1 n 1 n interiorul grupelor f mn 1 pe total calculeaz varian a QA 2 ntre variantele factorului A s A fA
67
QB fB QE fE
2 sA 2 sE 2 sB
Se calculeaz valoarea testului F e x p : pentru variantele factorului A Fexp A pentru variantele factorului B Fexp B
2 sE Se stabilete valoarea teoretic a lui F , att pentru factorul A ct i pentru factorul B , n funcie de numrul gradelor de libertate f A sau f B i f E , precum i n funcie de probabilitatea de transgresiune. Dac Fexp>Fteoretic, att pentru A ct i pentru B, se trece la analiza de detaliu privind stabilirea semnificaiei diferenelor dintre grupe, analiz ce se face cu ajutorul diferenelor limit, analog celor prezentate la analiza simpl a varianei.
68
Exemplu: S se stabileasc dac speciile de molid, brad i fag dintr -un arboret amestecat i plurien se deosebesc semnificativ ntre ele din punct de vedere al nlimilor medii. n acest scop au fost murate nlimi la arbori cu diametrul apropriat de di ametrul indicator de 50 cm.(tabelul 5.9).
Tabelu l 5 . 9
Molid 24.5 25.0 26.2 27.3 27.5 28.3 28.4 28.7 29.0 -
nlimile (m) Brad 25.3 25.7 25.9 26.3 26.9 27.0 27.2 27.5 28.0 29.0 Total Si
Fag 23.0 23.7 24.1 25.5 25.8 26.0 26.0 26.1 26.1 26.3
2 calc
12 N ( N 1)
S i2 Ni
3( N 1)
12 174.0 2 29(29 1) 9
172.5 2 10
88.5 2 10
2 tab=
3(29 1) 8.24
5,99
ipoteza nul se respinge, speciile se deosebesc semnificativ ntre ele din punct de vedere al nlimilor CAPITOLUL 6 : ANALIZA CORELAIEI 6.1. ASPECTE TEORETICE
Prin analiza varianei se pune n eviden influena unor factori asupra unei caracteristici studiate dar nu se determin gradul acestei influene, nu se spune nimic cu privire la forma legturii puse n eviden. n scopul evidenierii acestor aspecte se apeleaz la teoria corelaiei . Cercetarea este interesat s cunoasc, prin intermediul teoriei corelaiei, dependena care exi st ntre dou sau mai multe variabile. Analiza corelaiei este o metod prin care se cerceteaz i se exprim existena, natura i intensitatea legturilor dintre variabile, prin intermediul unor indicatori statistici. Distribuiile bidimensionale au dou variabile: - x , variabila independent, stabilit arbitrar i considerat ca nefiind afectat de erori - y , variabila dependent care se obine prin msurtori i care este afectat de erori.
69
Ca variabil independent se alege ntotdeauna acea mrime care se determin uor i direct iar ca variabil dependent se alege mrimea care se stabilete indirect, prin utilizarea unor instrumente. De exemplu: diametrul de baz d 1 , 3 - variabila independent iar nlimea arboretului h variabila dependent. Relaiile dint re dou variabile pot fi : r2 - relaii funcionale y f ( x) , de exemplu : S - relaii statistice (corelaii) , la care pentru aceeai valoare a lui x , pot fi valori diferite pentru y , ca de exemplu : pentru acelai diametru ( x ) putem avea nlimi diferite ( y ). n cazul relaiilor statistice corespondena nu are loc de la valoare la valoare ci de la valoare la distribuie, deci fiecrei valori x i corespunde o anumit distribuie cu caracteristicile ei statistice (medie, disper sie, etc.), caracteristici ce se modific odat cu x (pentru fiecare x distribuia este alta). Corelaia poate fi : simpl (cnd se refer la dou variabile x i y ) sau multipl (cnd asupra lui y influeneaz 2 sau mai multe caracteristici). Corelaia poate fi, de asemenea, pozitiv (direct) sau negativ (invers), liniar sau curbilinie.
70
10
Tabela de corelatie 12 14
ny
6.3. COVARIANA
n cazul a dou nsuiri corelate avem de a face cu dou distribuii de frecvene: o distribuie a variabilei x , caracterizat printr - o varian s 2 x , i o distribuie a variabilei y caracterizat prin variana s 2 y . Se poate vorbi ns i de o varian comun s 2 x y denumit covarian , care reprezint gradul de mprtiere a celor dou variabile x i i y i fa de mediile respective i este dat de relaia: xi x y i y 1 2 2 s xy s xy xi y i xy sau n 1 n Pentru valori grupate se folosete relaia: 1 1 2 s xy n ij x i y j ni xi nj yj n 1 n
2 n toate situaiile: s xy
nx
sx sy .
Covariana este un indice al corelaiei care indic i sensul acesteia. Valoarea covarianei trebuie s se ncadreze n intervalul dintre valorile celor doua variane, adic
2 s xy 2 s x2 , s y .
71
exp rim
gradul
legturii liniare dintre cele dou variabile. Datorit faptului c de cele mai multe ori
nu se cunoate, n s xy locul lui se folosete coeficientul de corelaie empiric r determinat sx s y pe baza probei extras din populaie. Coef icientul de corelaie indic gradul de mprtiere al variabilei y n jurul dreptei de regresie, rednd totodat i intensitatea legturii dintre cele dou variabile. 2 2 2 r 1, 1 . Valoarea lui r , n mrime Deoarece xy x y a bsolut, indic intensitatea corelaiei. Cu ct r este mai apropiat de +1 sau 1 cu att legtura ntre variabile este mai strns. Pentru r= 1 legtura este funcional. Semnul plus indic o corelaie direct iar semnul minus o corelaie invers. Indicaiile coeficientului de corelaie sunt valabile numai n cazul distribuiilor bidimensionale normale sau apropiate de aceasta. Pentru calculul coeficientului de corelaie se calculeaz abaterile s xy standard s x , s y i covariana s x y , dup care se aplic formula: r . sx s y Calculul se mai poate face, pentru valori negrupate n clase, cu relaia: N xy x y r , 2 2 2 2 N x x N y y iar pentru valori grupate n clase cu relaia:
N r N
x x y 2 2 x
xyn xy
x
xn x
y
yn y
2
nx x
nx x
N
y
ny y
2 y
ny y
Se pot utiliza i momentele centrate de ordin II ( m x , m y , m z ) pentru seriile x,y,z : mz mx m y r 2 mx m y Seria z se obine fcnd sumele pe diagonal n tabelul de corelaie. Cu programele de calcul statistic sau tabelar coeficientul de corelaie se calculeaz direct. De exemplu, n programul EXCEL se
72
utilizeaz funcia CORREL a foii de lucru sau Correlation din pachetul Data Analys (analiz date) - meniul Tools (instrumente). Exemplu: nrt-un arboret de salcm s - au msurat creterile radiale pe ultimii 10 ani i diametrul de baz la 20 de arbori. S se stabi leasc intensitatea corelaiei folosind coeficientul de corelaie r , deoarece din cercetri anterioare se cunoate c regresia dintre creterea radial i diametru este liniar.
Nr cr t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
TOTAL Diamet Creter ea rul cm radial
xy 200 112 162 98 240 336 242 84 112 136 56 468 180 260 144 72 140 112 384 308 3846
x2 400 256 324 196 400 576 484 196 256 289 196 676 400 400 324 144 400 256 576 484 7233
mm y
20 16 18 14 20 24 22 14 16 17 14 26 20 20 18 12 20 16 24 22 373
10 7 9 7 12 14 11 6 7 8 4 18 9 13 8 6 7 7 16 14 193
Utiliznd instrumentul Correlation din pachetul Data Analys (analiz date)- meniul Tools (instrumente) vom obine: Diametrul cm Creterea x radial mm y Diametrul cm x 1
r N x
N
2
xy x
2
x N y
2
y y
2
0,908
73
74
d) Dac numrul de msurtori este mare (N >30) i r este apropiat de 1, se poate folosi testul F a lui Fisher: ( N 2) r 2 Fexp 1 r2 Dac F e x p <F t a b e l a r corelaia este nesemnificativ.
75
1 se noteaz observaia ce a mai mare, cu 2 observaia urmtoare ca mrime i aa mai departe. Rangul N l are cea mai mic valoare. n cazul cnd exist mai multe observaii cu aceeai mrime, se calculeaz medii aritmetice de rang. De exemplu, dac pe poziia 3,4,5 i 6 observaii le au aceeai mrime, la toate li se atribuie rangul 4,5. Suma rangurilor, att pentru variabila x ct i pentru variabila y , va fi: N ( N 1) xi yi , unde x i , respectiv y i reprezint rangurile 2 n cazul unei concordane perfecte ntre rangurile ce lor dou variabile, suma ptratelor diferenelor dintre ranguri este nul ( d 2 =0 ) iar r s =1 . Pe msur ce diferenele dintre ranguri sunt mai mari, r s va scdea. Semnificaia corelaiei de rang se stabilete comparnd valoarea obinut cu valorile limit, alese n funcie de numrul gradelor de libertate f=N-2 i probabilitatea de transgresiune . Exemplu: La 10 arborete de stejar din lstari, toate de aceeai vrst i situate n aceleai condiii staionale, s - au determinat consistena i procentul arbori lor n curs de uscare. S se determine dac corelaia ntre consisten i procentul de uscare este semnificativ. Datele sunt urmtoarele:
Nr.c Consistena arboretelor rt Procentul arborilor n curs de uscare 22 26 24 26 25 20 18 17 10 15 total RANGUL
dup consisten
RANGUL
dup procentul
1 2 3 4 5 6 7 8 9 10
0,3 0,4 0,5 0,5 0,6 0,7 0,7 0,8 0,9 1,0
5 1,5 4 1,5 3 6 7 8 10 9 55
6 * 300 1800 1 1 1,82 0,82 10(100 1) 990 N ( N 1) Pentru f=10- 2=8 , din tabele, se ia coeficientul limit : 0,632 pentru =5% , 0,765 pentru =1% i 0,872 pentru =0,1%. Din comparaie, rezult c, pentru o probabilitate de transgresiune de 1%, corelaia ntre procentul de uscare i consistena arboretelor este semnificativ. rs 1
2
76
BIBLIOGRAFIE
1. F.Wilcoxon: Individual comparisons by ranking methods, BiometricsBul.,180-83,1947 2. Hollander, Wolfe DA; Non methods, J.Wiley,New York, 1973 parametric statistical
3. Vaduva, I. (1970) Analiz dispersional . Bucuresti, Ed. Tehnic 4. Saporta, C. (1990) Probabilit, Analyse des donnes et statistique.Paris, Ed. Technip 5. M. Iosifescu, Gh. Mihoc, R. Teodorescu, Teoria probabilitatilor si statistica matematica, Ed. Tehnica, Bucuresti, 1966 6. M. Tiron, teoria erorilor de masurare si metoda celor mai mici patrate, Ed. Tehnica, Bucuresti, 1972 7. M. R. Spiegel, Probability and statistique, McGraw Hill, New York, 1980
77