Sunteți pe pagina 1din 15

CURS 3

CUPRINS

3. DISTRIBUŢII TEORETICE FRECVENT ÎNTÂLNITE ÎN


SILVICULTURĂ (continuare)
3.2.3 Ajustarea distribuţiei experimentale după legea
binomială
3.3 Distribuţia evenimentelor rare (Poisson)
3.3.1 Aspecte teoretice
3.3.2 Ajustarea distribuţiei experimentale după legea
Poisson
3.4 Distribuţia normală
3.4.1 Aspecte teoretice
3.4.2 Aplicaţii practice
3.4.3 Ajustarea distribuţiei experimentale după legea
distribuţiei normale

3.2.3 Ajustarea distribuţiei experimentale după legea binomială

În vederea verificării, în cadrul unei cercetări statistice, a ipotezei


potrivit căreia distribuţia experimentală obţinută cu această ocazie
urmează o lege specifică distribuţiei binomiale, se determină elementele
care permit stabilirea informaţiilor caracteristice funcţiei de frecvenţă a
distribuţiei teoretice.
În acest scop, în baza distribuţiei experimentale obţinute, se
determină următorii parametri:
• media aritmetică ( x );
• probabilitatea producerii evenimentului E p :
x
p= ;
n
• probabilitatea producerii evenimentului complementar lui E q :
q = 1 – p.
Cu aceste valori se calculează, cu ajutorul relaţiilor (3.1) – (3.2),
frecvenţele teoretice specifice distribuţiei binomiale.
Frecvenţele teoretice se compară cu cele experimentale. Apropierea
valorilor celor două frecvenţe denotă faptul că fenomenul studiat se
produce cu aproximaţie după legea binomială.
Concluzii statistic asigurate, referitoare la concordanţa dintre
distribuţia experimentală şi cea teoretică (binomială), se vor putea formula
după parcurgerea capitolului privind „analiza semnificaţiei”.
Aplicaţie: Într-o plantaţie de plop euramerican, efectuată în condiţii
staţionale omogene şi cu material săditor uniclonal, după 2 ani de la
plantare s-a procedat la verificarea % de prindere. În acest scop s-au
efectuat 120 sondaje, fiecare sondaj conţinând 10 locuri de puieţi iniţial
plantaţi (conform schemei de plantare), înregistrându-se numărul
exemplarelor dispărute.
După gruparea observaţiilor iniţiale a rezultat distribuţia
experimentală din Tabelul 3.1.

Tabelul 3.1

Comparaţia unei distribuţii experimentale cu distribuţia binomială

Numărul (x) de Numărul de Frecvenţe teoretice


exemplare sondaje
dispărute (frecvenţe Relative Absolute
din 10 iniţiale experimentale
1 2 3 4
0 43 0,349 42
1 47 0,387 47
2 21 0,194 23
3 7 0,057 7
4 1 0,011 1
5 0 0,001 -
6 1 - -
7 - - -
8 - - -
9 - - -
10 - - -
Total 120 0,999 120

Indicatorii necesari stabilirii frecvenţelor teoretice relative specifice


distribuţiei binomiale:

0 ⋅ 43 + 1 ⋅ 47 + 2 ⋅ 21 + ...
• x= = 1,00
120

• parametrul n = 10

x 1
• p= = = 0,10
n 10

• q = 1 – p = 1 – 0,1 = 0,90

2
După relaţia (3.1), pentru valoarea x = 0 obţinem:

f (0) =
10!
0,100 ⋅ 0,9010 − 0 = 0,349
0!(10 − 0)!

Celelalte frecvenţe teoretice relative se obţin în baza relaţiei de


recurenţă (3.2). Astfel pentru următoarea frecvenţă:

10 − 0 0,1
f (0 + 1) = f (0)
10 1
⋅ = 0,349 ⋅ ⋅ = 0,387 ş.a.m.d.
0 + 1 0,9 1 9

Valorile astfel obţinute sunt înregistrate în col. 3 din Tabelul 3.1.


Frecvenţele teoretice absolute se obţin prin multiplicarea
frecvenţelor teoretice relative cu numărul total de observaţii (120).
Comparând cele două distribuţii, se constată o apropiere apreciabilă
între ele, ceea ce indică faptul că fenomenul analizat se produce
aproximativ după legea distribuţiei binomială.
Dovedirea statistică a acestei apropieri urmează să fie făcută prin
testarea semnificaţiei (Capitolul Analiza semnificaţiei).

3.3 Distribuţia evenimentelor rare (Poisson)

3.3.1 Aspecte teoretice

Distribuţia Poisson, numită şi distribuţia evenimentelor rare,


reprezintă un caz particular al distribuţiei binomiale. Este specifică
fenomenelor şi proceselor în care probabilitatea de producere a
evenimentului este foarte mică (de aici denumirea distribuţia
evenimentelor rare). Această distribuţie apare atunci când (p → 0) şi (q →
1), chiar dacă (n → ∞) şi se aplică când (n · p) are o valoare finită.
Funcţia de frecvenţă a distribuţiei Poisson are următoarea expresie:

λx e − λ
f (x ) = (3.5)
x!

unde: f(x) reprezintă frecvenţa relativă pentru variabila x;


λ – parametrul distribuţiei Poisson egal cu media aritmetică (μ)
şi cu dispersia (δ2) (λ = μ = δ2);
e – baza logaritmilor naturali (e = 2,71828);
x – numărul de unităţi statistice ce prezintă caracteristica
cercetată.

3
Aplicarea formulei (3.5) în determinarea frecvenţelor teoretice
relative ale distribuţiei Poisson este dificilă, astfel că în practică se
utilizează o relaţie de recurenţă:

x=0 f(0) = e-λ


λ
x = 1,2,3,... f (x + 1) = f (x )
x +1
(3.6)

Alura graficului distribuţiei Poisson este puternic influenţată de


valorile parametrului (λ) (Fig. 3.2).

Fig. 3.2

În domeniul silviculturii, distribuţia Poisson se întâlneşte la apariţia


fenomenului de bifurcare a arborilor, apariţia unor defecte rare provocate
de cauze naturale, apariţia de arbori cu calităţi deosebite (lemn de
rezonanţă, arbori plus etc.), apariţia seminţelor forestiere cu doi embrioni
etc.
O condiţie esenţială pentru a afirma că o distribuţie experimentală
urmează o lege apropiată de distribuţia Poisson este dată de apropierea
dintre media aritmetică şi dispersia distribuţiei experimentale. O verificare
riguroasă a concordanţei valorilor celor două distribuţii se face prin teste
de semnificaţie (ex: criteriul x2).

4
3.3.2 Ajustarea distribuţiei experimentale după legea Poisson

Compararea distribuţiei experimentale cu distribuţia teoretică


Poisson se face în conformitate cu procedura descrisă la 3.3.1.
Prezentăm în continuare procedura de ajustare a distribuţiei
experimentale în cazul unei cercetări statistice efctuate într-un arboret de
fag.

Aplicaţie: Într-un arboret de fag au fost analizaţi, din punctul de


vedere al prezenţei gelivurii, un număr de 2006 arbori. La majoritatea
arborilor, gelivura a lipsit; la un număr s-a găsit câte o gelivură, iar la un
număr mai redus de arbori s-au observat câte 2, 3, 4 şi 5 gelivuri.
Frecvenţa arborilor în raport cu numărul gelivurilor identificate pe fiecare
arbore este redată în Tabelul 3.2.
Media aritmetică (0,51) este apropiată de dispersia distribuţiei
experimentale (0,65), astfel că este posibil ca distribuţia Poisson să fie
aplicată în acest caz.

Tabelul 3.2

Comparaţie între distribuţia experimentală şi distribuţia Poisson


(x = numărul gelivurilor pe un arbore)

Numărul de Numărul Frecvenţe teoretice Poisson


gelivuri pe arbore de arbori Relative Absolute
x observaţi
0 1220 0,607 1218
1 601 0,303 608
2 155 0,076 153
3 25 0,012 24
4 4 0,002 4
5 1 0,000 -
Total 2006 1,000 2007

Pentru stabilirea frecvenţelor teoretice relative ale distribuţiei


Poisson, se determină prima frecvenţă teoretică cu relaţia (3.5)

f(x) = e-0,50 = 0,607

Celelalte frecvenţe se stabilesc prin intermediul formulei de


recurenţă (3.6):

5
f (0 + 1) = f (0) ⋅ = 0,303; f (1 + 1) = f (1) ⋅ = 0,076; f (2 + 1) = f (2) ⋅
0,50 0,50 0,50
= 0,012;
0 +1 1+1 2 +1
f (3 + 1) = f (3) ⋅ = 0,002; f (4 + 1) = f (4 ) ⋅
0,50 0,50
= 0,000
3 +1 4 +1

Frecvenţele teoretice absolute ale distribuţiei Poisson s-au obţinut


prin multiplicarea frecvenţelor teoretice relative cu numărul total de
observaţii (N = 2006).
Comparând frecvenţele absolute experimentale cu cele teoretice se
constată o bună concordanţă între cele două distribuţii.

3.4 Distribuţia normală

3.4.1 Aspecte teoretice

Distribuţia normală este frecvent întâlnită în cercetarea statistică a


fenomenelor şi proceselor naturale.
Funcţia de frecvenţă a acestei distribuţii este dată de relaţia:


( x − µ )2
f (x ) =
1 2σ 2
e (3.7)
σ 2π

unde: (δ) şi (μ) reprezintă abaterea standard şi media populaţiei


analizate. Întrucât aceşti parametri nu se cunosc la nivelul întregii
populaţii, aceştia se estimează prin extragere de probe, astfel că (δ) se
înlocuieşte cu (s), iar (μ) cu ( x ). Cu cât volumul eşantionului este mai
mare, cu atât (s) se apropie de (δ), iar ( x ) de (μ).
Pentru simplificarea relaţiei (3.7) se introduce o variabilă ajutătoare
(u), denumită variabila normată:

x−x
u= (3.8)
s

Variabila u se exprimă în unităţi (s). În acest caz relaţia (3.7) devine


o funcţie de frecvenţă a distribuţiei normale normate, în care media
este egală cu zero, iar abaterea standard este egală cu unitatea:

u2
1 −2
f (u ) = e (3.9)

Graficul distribuţiei normale normate este simetric faţă de axa 0Y,


prezintă un maxim şi două puncte de inflexiune. Curba este asimtotică la

6
axa absciselor (sunt posibile valori mari ale variabilelor dar cu frecvenţe
foarte reduse).

Funcţia de distribuţie, corespunzătoare frecvenţelor cumulate este


dată de expresia:
x ( x −µ ) 2
1
F(x ) = ∫

e 2 σ dx
2
(3.10)
σ 2 π −∞

sau în exprimare în valori normate (u):


u 2
1
F(u ) =
u



e 2 du (3.11)
2 π −∞

Reprezentarea grafică a funcţiei de frecvenţă (f(u)) şi a funcţiei de


distribuţie (F(u)) a distribuţiei normale normate este redată în Fig. 3.3.

Fig. 3.3

10 Dacă limitele de integrare ale funcţiei de distribuţie sunt -∞, +∞,


atunci F(u) = 1.
20 Integrarea în limitele (0, u) defineşte o funcţie numită funcţia
Laplace:
7
u 2
1
φ(u ) =
u



e 2 du (3.12)
2π 0

Expresia acestei funcţii (ţinând cont de interpretarea geometrică a


integralei) reprezintă suprafaţa de sub curba normală de la valoarea medie
(0 – în variabilă normată) şi până la (u) (Fig. 3.4a).

Fig. 3.4

u → +∞ ⇒ φ (u ) = ⇒ 2φ (u ) = 1
1
30 Dacă 2 ,
u ∈ (− ∞, ∞ ) ⇒ F (u ) = 1 ⇒ F (u ) = + φ (u )
1
2

adică această expresie reprezintă suprafaţa de sub curba normală


cuprinsă între (-∞, u), ceea ce este echivalent cu a constata că aceasta
reprezintă probabilitatea totală (frecvenţa cumulată) până la valoarea (u)
(Fig. 3.4d).

8
40 Prezintă interes deosebit dublul funcţiei Laplace, notată cu (P):
u

P = 2φ(u ) = f (u )du

−u

(3.13)

Această expresie reprezintă suprafaţa de sub curbă cuprinsă în


intervalul (-u, u) şi este numită probabilitate de acoperire (Fig. 3.4b).

50 În practică, prezintă interes şi suprafaţa de sub curbă rămasă în


afara intervalului (-u, u) (Fig. 3.4c).

P T = 1 – 2φ(u) (3.14)

Această funcţie arată suprafaţa corespunzătoare probabilităţii ca


valorile variabilei să se afle în afara intervalului (-u, u) şi este denumită
probabilitate de transgresiune (probabilitate de depăşire).

60 Pentru aplicaţii practice, în Tabela 2 (anexă) sunt prezentate


valorile funcţiilor enumerate mai sus corespunzătoare diferitelor valori ale
variabilei normate (u).

70 Extrăgând din Tabela 2 valorile 2φ(u) şi 1 - 2φ(u) pentru (u): 1, 2 şi


3 şi exprimându-le în % obţinem:

u 2φ(u) 2φ(u) 1 - 2φ(u) 1 - 2φ(u)


% %
1 0,68269 68,27 0,31730 31,73
2 0,95450 95,45 0,04550 4,55
3 0,99730 99,73 0,00270 0,27

Pe baza acestor valori se pot da următoarele interpretări:

Interval Valori în % din numărul total al observaţiilor:


în interiorul intervalului în afara intervalului
±u 68,27 31,73
±2u 95,45 4,55
±3u 99,73 0,27

sau altfel spus:

• 68,27% din observaţii se găsesc faţă de medie în intervalul [-δ, δ];

9
• 31,73% din observaţii se găsesc faţă de medie în afara intervalului
(-δ, δ);
• 95,45% din observaţii se găsesc faţă de medie în intervalul [-2δ,
2δ];
• 4,55% din observaţii se găsesc faţă de medie în afara intervalului (-
2δ, 2δ);
• 99,73% din observaţii se găsesc faţă de medie în intervalul [-3δ,
3δ];
• 0,27% din observaţii se găsesc faţă de medie în afara intervalului (-
3δ, 3δ);

În termeni probabilistici, în cazul distribuţiei normale, probabilitatea


ca o valoare a să se afle, faţă de medie, în limitele ±δ este de 68,27%
(≅68%), iar probabilitatea ca ea să se afle în intervalul ±2δ este de
95,45% (≅95%). Aceste valori sunt probabilităţi de acoperire (aflate în
intervalul urmărit).
Prezintă interes, pentru calcule statistice, şi cunoaşterea
probabilităţii (frecvenţei) observaţiilor care depăşesc o anumită limită
(prag, nivel), noţiune cunoscută sub termenul de probabilitate de
transgresiune (depăşire). Astfel, valoarea de 4,55% va reprezenta
probabilitatea de transgresiune a observaţiilor care depăşesc limitele ±2δ
faţă de medie.
Refăcând calculele, astfel încât să se obţină valori ale probabilităţii
de transgresiune de 5%, 1%, 0,1%, rezultă următoarele valori ale pragului
depăşit:

5% ⇒ ± 1,96δ
1% ⇒ ± 2,58δ
0,1% ⇒ ± 3,29δ

Cunoscând că între probabilitatea de acoperire (p) şi probabilitatea


de transgresiune (∝) există relaţia:

p = 1 - ∝ (sau în %: p = 100 - ∝)

devine evident că la o probabilitate de acoperire de 95% ⇒


probabilitate de transgresiune de 5%.
De subliniat faptul că la un prag al probabilităţii de transgresiune de
1,96:
- probabilitatea ca o valoare să fie mai mare decât (media +1,96δ)
este de 2,5% iar
- probabilitatea ca o valoare să fie mai mică decât (media -1,96δ)
este tot de 2,5%.
În silvicultură, distribuţia normală este frecvent întâlnită în cazurile
distribuţiilor experimentale aferente:
10
• caracteristicilor biometrice ale seminţelor forestiere şi ale furnirelor
la arborii forestieri;
• indicilor şi coeficienţilor de formă ai arborilor dintr-un arboret;
• proprietăţilor fizico – mecanice ale lemnului;
• creşterile arborilor;
• grosimii cojii la arborii cu diametre apropiate;
• cuantumului în substanţă uscată la fructele de pădure.

3.4.2 Aplicaţii practice

10 Repartiţia numărului de arbori pe clase ale indicelui de formă (k)


urmează aproximativ legea distribuţiei normale. Coeficientul de variaţie al
indicelui de formă în arboret este de circa 8%. Pentru un arboret (molid în
vârstă de 70 ani), s-a stabilit prin eşantion că media aritmetică a lui (k)
este 0,70. Să se calculeze limitele în care se vor încadra 95% din arbori.
Din informaţiile prezentate rezultă:
• probabilitatea de acoperire - 95%;
• probabilitatea de transgresiune - 5%;
• valoarea pragului de depăşire (u) - 1,96δ;
• limitele intervalului de acoperire:
x ±1,96s = 0,70 ± 1,96s;
• abaterea standard (s) se stabileşte din relaţia de calcul a
coeficientului de variaţie (s%):

s s ⋅x 8 ⋅ 0,7
s % = 100 ⇒ s = % ⇒ s = = 0,056
x 100 100
[ ]
x ± 1,96 s = x ± 1,96 ⋅ 0,056 = x ± 0,11 = 0,70 ± 0,11 ⇒ 0,59, 0,81

Se poate afirma că 95% din arbori au coeficientul de formă cuprins


în intervalul [0,59, 0,81] şi doar 5% din arbori au coeficientul de formă cu
valori în afara intervalului [0,59, 0,81].

20 Pentru arboretul cu caracteristicile prezentate în 10 să se


calculeze:
a) probabilitatea ca indicii de formă să se încadreze în intervalul
[0,62, 0,78];
b) probabilitatea ca indicii de formă să nu depăşească valoarea de
0,80.
a) - intervalul [0,62, 0,78] ⇒ 0,70 ± 0,08;
- probabilitatea de acoperire p = 2φ(u), unde:
x − x 0,78 − 0,70
u= = = 1,43
s 0,056

11
Din Tabela 2, pentru u = 1, 4 ⇒ P = 2φ(u) = 0,838 ≅ 0,84, sau în
exprimare procentuală 84% (Fig. 3.4b).
În concluzie, în arboretul analizat, 84% din arbori vor avea coeficienţi
de formă cuprinşi în intervalul [0,62, 0,78];
b) - se determină valoarea lui (u) corespunzătoare valorii limită
de 0,80 a coeficientului de formă:
0,80 − 0,70
u= = 1,8 ;
0,056

- se calculează probabilitatea P = 0,5 + φ(u) (Fig. 3.4d),


utilizând Tabela 2:
P = 0,96407 sau %, P = 96,4%.

Pe această bază, se poate afirma cu probabilitate de 96,4% că


indicii nu vor depăşi valoarea de 0,80. În mod corespunzător rezultă o
probabilitate de 3,6% ca indicii să depăşească valoarea de 0,80
(probabilitatea de transgresiune se poate calcula şi utilizând relaţia: ∝ =
0,5 - φ(u) şi extrăgând din tabel valoarea corespunzătoare lui u = 1,8).

30 Pentru un lot de seminţe de brad s-a stabilit, ca medie a


populaţiei, valoarea de 55,4 g pentru greutatea seminţelor şi o abatere
standard fiind de 7,85 g. Să se stabilească:
a) care este probabilitatea ca greutatea să depăşească limita
inferioară de 35 g;
b) care este probabilitatea ca greutatea seminţelor să se încadreze
în intervalul [40, 75] grame.
a) – se calculează valoarea (u) corespunzătoare limitei
inferioare de 35 g:
x − x 35 − 55,4
u= = = −2,6 ;
s 7,85
– se extrage din Tabela 2, pentru (u) = 2,6, valoarea
funcţiei P = 0,5 - φ(u) ⇒ 0,004661, astfel că răspunsul urmărit este: 0,46%
din cazuri vor avea greutatea mai mică decât 35 g;
b) – se calculează valorile (u) aferente limitelor intervalului
urmărit [40, 75]:
40 − 55,4
u1 = = −2,0
7,85
;
75 − 55,4
u2 = = 2,5
7,85
– se extrage din Tabela 2, corespunzător celor 2 valori (u),
φ(u 1 ) = 0,47725 şi φ(u 2 ) = 0,49379;
– probabilitatea căutată va fi dată de suma φ(u 1 ) + φ(u 2 ) =
0,47725 + 0,49379 = 0,97104 (97,1%), adică probabilitatea ca valorile să
fie încadrate în limitele cerute este de 97,1%;

12
– în afara acestor limite se vor găsi 2,9% (100 – 97,1), din
care:
. 0,5 - φ(u 1 ) = 0,5 - φ(2,0) = 2,3%;
. 0,5 - φ(u 2 ) = 0,5 - φ(2,5) = 0,6%.

3.4.3 Ajustarea distribuţiei experimentale după legea


distribuţiei normale

Dacă există suficiente informaţii din care să rezulte că distribuţia


experimentală urmează aproximativ legea de distribuţie normală, se poate
trece la ajustarea frecvenţelor experimentale potrivit acestei legi.
Frecvenţele teoretice relative se bazează pe funcţia de frecvenţă a
distribuţiei normale normată:

u2
1 −2
f (u ) = e (3.15)

Valorile f(u) pentru valori ale variaţiei normate (u), din 0,01 în 0,01
sunt calculate şi prezentate în Tabela 3 (vezi anexă).
Frecvenţele teoretice absolute (n̂ ) se stabilesc, ţinând cont că
valorile (u) sunt exprimate în unităţi de măsuri (s), iar numărul de
observaţii este (N), prin intermediul relaţiei:

⋅ f (u )
Nh
najustat = nˆ = (3.16)
s

unde: h reprezintă mărimea intervalului în care se grupează valorile


observaţiilor;
s – abaterea standard experimentală;
N – numărul total de observaţii:

Aplicaţie: Într-un arboret echien de molid au fost determinate


valorile indicelui de formă natural pentru 620 arbori, rezultând frecvenţele
experimentale din Tabelul 3.3.

13
Tabelul 3.3

Ajustarea distribuţiei experimentale după legea distribuţiei normale (indici


de formă la un arboret de molid)

Frecvenţe Frecvenţe
x experimentale u f(u) teoretice
n nˆ =
Nh
f (u )
s
0,60 - -3,74 0,0004 0,1
62 1 -3,22 0,0022 0,7
64 6 -2,70 0,0104 3,3
66 14 -2,18 0,0371 11,9
68 32 -1,66 0,1006 32,4
70 52 -1,14 0,2083 67,1
72 105 -0,62 0,3292 106,0
74 133 -0,10 0,3970 127,9
76 126 0,41 0,3668 148,1
78 80 0,93 0,2589 83,4
80 47 1,45 0,1394 44,9
82 15 1,97 0,0573 18,4
84 7 2,49 0,0180 5,8
86 1 3,01 0,0043 1,4
88 1 3,53 0,0008 0,3
90 - 4,05 0,0001 0,0
Total 620 - - 621,7
x − x x − 0,744 Nh 620 ⋅ 0,02
x = 0,744; u = = ; s = 0,0389; s corectat = 0,0385; = = 322,078
s 0,0385 s 0,0385

Indicii distribuţiei experimentale, luaţi în considerare la stabilirea


frecvenţelor teoretice, au următoarele valori:

x = 0,744 ; s cor = 0,0385

Ei sunt utilizaţi în locul parametrilor (μ) şi (δ) ai populaţiei din care s-


Nh 620 ⋅ 0,02
a extras eşantionul. Raportul = = 322,078 reprezintă o constantă
s 0,0385
în relaţia de calcul a frecvenţelor teoretice absolute.
Calculele desfăşurate tabelar necesită parcurgerea următorilor paşi:
• determinarea valorilor variabilei normate (u) prin intermediul
relaţiei;

x−x
u= ;
s

14
• în funcţie de valorile obţinute (col. 3 din tabel) se extrag valorile f(u)
din Tabela 3 (anexă) şi se înscriu în col. 4 din Tabelul 3.3. Dacă valorile
variabilei (u) nu se suprapun peste cele din tabela 3 se pot realiza
interpolări pentru obţinerea valorilor f(u);
• frecvenţele ajustate (n̂ ) se obţin prin multiplicarea valorilor f(u) cu
Nh
raportul = 322,078 .
s
Particularizând distribuţia normală pentru distribuţia experimentală
se obţine:

u2
1 −2
nˆ = 322,078 e

x − 0,744
unde: u =
0,0385

Fig.3.5
Tabelul 3.3

Reprezentarea grafică a frecvenţelor absolute ale distribuţiilor


experimentale şi normale (Fig. 3.5) conduce la concluzia că între cele
două distribuţii există o concordanţă destul de bună.

15

S-ar putea să vă placă și