Sunteți pe pagina 1din 18

Teoria probabilităților și statistică matematică/ Statistică economică

CURS 3

2. STATISTICĂ MATEMATICĂ. DISTRIBUȚII DE PROBABILITATE

2.3. DISTRIBUȚII DE PROBABILITATE TEORETICE

2.3.1. Distribuția binomială (Bernoulli)


Este o distribuție de probabilitate discretă care se aplică atunci când există numai două
rezultate posibile: succes sau eșec, admis sau respins, promovat sau nepromovat, produs
conform sau produs neconform (rebut), alb sau negru, zero sau unu, adevărat sau fals etc.
De exemplu, variabila probabilistă considerată este reprezentată de numărul experimentelor
cu ”succes”: dacă probabilitatea p a ”succesului” este aceeași pentru fiecare din cele n
experimente, iar experimentele sunt independente, atunci funcția de probabilitate
(frecvențele relative) este definită prin probabilitatea ca numărul experimentelor de succes să
fie egal cu o anumită valoare x și poate fi calculată cu expresia:
n! n!
f ( x;n,p ) = p ( x ) = Cnx  px  (1 − p)n−x =  px  (1 − p)n−x =  px  qn−x (2.21)
x! (n − x )! x! (n − x )!

unde x = 0, 1, 2, …, n; p reprezintă probabilitatea ”succesului”; q = 1 – p reprezintă


probabilitatea ”eșecului”; n este numărul total de experimente (n și p sunt parametrii
distribuției).
n− x
Deoarece Cn  p  q este termenul general al dezvoltării binomului (p + q) se numește
x x n

distribuție binomială.
Funcția de distribuție cumulativă (frecvențele relative cumulate) are expresia:
x
n!
F ( x;n,p ) = P ( X  x ) =   p x  (1 − p )
n− x
(2.22)
x = 0 x! (n − x )!

Funcția de probabilitate Funcția de distribuție cumulativă

1
Teoria probabilităților și statistică matematică/ Statistică economică

Cunoscând funcția de probabilitate se obțin expresiile mediei și dispersiei distribuției


binomiale:

M X  = m = n  p (2.23)

D  X  = 2 = n  p  ( 1 − p ) (2.24)

APLICAȚIE. Într-o turnătoriei, din cercetări anterioare s-a stabilit că probabilitatea statistică (obținută în urma unei
cercetări experimentale) ca o șarjă să fie necorespunzătoare este egală cu 0,2 (2 șarje din 10, 3 din 15, 4 din 20, ...,
20 din 100 etc.). De acum încolo stabilitatea procesului tehnologic de elaborare a șarjelor se bazează pe acest
rezultat experimental. Într-un schimb se elaborează 10 șarje, să se stabilească care este numărul șarjelor
necorespunzătoare care să indice faptul că a intervenit o schimbare în procesul de elaborare al acestora.

Rezolvare

Care este raționamentul?

Existând numai două rezultate posibile de tip produs conform sau produs neconform (rebut), rezultatul
procesului tehnologic ”ascultă” de distribuția teoretică binomială.

Într-un schimb, în turnătorie sunt elaborate 10 șarje. Ne interesează calculul probabilităților (pe baza funcției de
probabilitate) ca din 10 șarje, 0 șarje să fie necorespunzătoare, 1 șarjă să fie necorespunzătoare, 3 șarje să fie
necorespunzătoare, ..., 10 șarje să fie necorespunzătoare. Pe baza acestor probabilități putem calcula
probabilitățile cumulative (pe baza funcției de distribuție cumulativă), adică care este probabilitatea ca cel mult 0
șarje să fie necorespunzătoare, probabilitatea ca cel mult 1 șarjă să fie necorespunzătoare, probabilitatea ca cel
mult 2 șarje să fie necorespunzătoare, probabilitatea ca cel mult 3 șarje să fie necorespunzătoare, ...,
probabilitatea ca cel mult 10 șarje să fie necorespunzătoare.

Nr. șarje Probabilități Probabilitățile cumulate


necoresp.
col.1 col.2 col.3
0 p(0) P (nr. sarje necoresp. = 0 ) = p ( 0 )
1 p(1) P (nr. sarje necoresp.  1 ) = p ( 0 ) + p (1 )
2 p(2) P (nr. sarje necoresp.  2 ) = p ( 0 ) + p (1 ) + p ( 2 )
3 p(3) P (nr. sarje necoresp.  3 ) = p ( 0 ) + p (1 ) + p ( 2 ) + p ( 3 )
... ... ...
10 p(10) P (nr. sarje necoresp.  10 ) = p ( 0 ) + p (1 ) + p ( 2 ) + ... + p (10 )
Conform experimentului nostru, numărul de ”succese” este în acest caz numărul de șarje necorespunzătoare.

Metoda 1 de rezolvare

Pentru calculul probabilităților din col.2 se aplică formula (2.21) în care x ia succesiv valorile 0; 1; 2; 3; … 10; n = 10;
p = 0,2

10!
p ( x = 0 ) = C10  0,2  (1 − 0,2)
10 − 0 10 − 0
=  0,2  (1 − 0) = 0,1073741824
0 0 0
ex:
0! ( 10 − 0 )!

10!
p ( x = 1 ) = C10  0,2  (1 − 0,2)
10 − 1 10 − 1
=  0,2  (1 − 0,2) = 0,268435456
1 1 1

1! ( 10 − 1 )!

10!
p ( x = 2 ) = C10  0,2  (1 − 0,2)
10 − 2 10 − 2
=  0,2  (1 − 0,2) = 0,301989888
2 2 2

2! ( 10 − 2 )!

2
Teoria probabilităților și statistică matematică/ Statistică economică

De exemplu, probabilitatea cumulată p ( x  2 ) din col.3 este:

p ( x  2 ) = p ( 0 ) + p (1 ) + p ( 2 ) = 0,6777995264

Metoda 2 de rezolvare

Rezolvăm problema în Excel: fișierul CURS 3.xlsx, sheet-ul BINOMIALĂ.


În Excel pentru calculul distribuției teoretice binomiale se folosește funcția
BINOM.DIST(numar_s,incercari,probabilitate_s,val_logica)
Sintaxa funcției BINOM.DIST are următoarele argumente de intrare:
numar_s Obligatoriu. Este numărul de succese din experimente
incercari Obligatoriu. Este numărul total de experimente independente
probabilitate_s Obligatoriu. Este probabilitatea de succes
val_logica Obligatoriu. Este o valoare logică: Dacă este TRUE, atunci
BINOM.DIST calculează valorile funcției de distribuție
(cumulativă); dacă este FALSE, BINOM.DIST calculează valorile
funcției de probabilitate

Introducerea datelor:
Celula A2: numărul total de experimente independente (numărul de șarje pe schimb)
Celula B2: probabilitatea de succes
Celulele C2÷C12: numărul de succese din experimente (numărul posibil de șarje
necorespunzătoare pe schimb)
Celula D2: scriem formula =BINOM.DIST(C2;$A$2;$B$2;FALSE); $A$2 și $B$2 înseamnă că
celulele A2 și B2 sunt blocate la indexare când se copiază formula în celulele D3÷D12
Celula E2: scriem formula =BINOM.DIST(C2;$A$2;$B$2; TRUE) și copiem formula în celulele
E3÷E12
Celula F2: scriem formula =A2*B2 care calculează media cu relația (2.23)
Celula G2: scriem formula =A2*B2*(1-B2) care calculează dispersia cu relația (2.24)

Interpretarea rezultatelor:

Probabilitatea ca numărul șarjelor necorespunzătoare să fie mai mic sau cel mult egal cu 4 este egală cu 0,967
(celula E6):

P ( X  4 ) = 0,967

3
Teoria probabilităților și statistică matematică/ Statistică economică

iar probabilitatea ca numărul șarjelor necorespunzătoare să fie mai mare decât 4 este:

P ( X  4 ) = 1 − 0,967 = 0,033  0,05 (vom studia în cursurile viitoare ce reprezintă probabilitatea


de 0,05)

Concluzii: 1) De câte ori sunt produse cel mult patru șarje necorespunzătoare înseamnă că procesul de
elaborare a șarjelor este conform;

2) Dacă numărul șarjelor necorespunzătoare este mai mare decât 4 înseamnă că a intervenit o
schimbare în procesul de elaborare a șarjelor care trebuie să fie investigată.

2.3.2. Distribuția polinomială


Este o distribuție discretă de probabilitate care se aplică atunci când există 3, sau 4, …, sau k
rezultate posibile. Exemplu pentru 3 rezultate posibile: produs conform - produs neconform
recuperabil - produs neconform nerecuperabil (rebut), alb - gri - negru, client care ia creditul -
client care se mai gândește - client care nu ia creditul etc.
Funcția de probabilitate este dată de formula:
n!
f ( x1 ,x 2 ,...,xk ;n,p1 ,p2 ,...,pk ) =  p1x1  p2x2  ...  pkxk , (2.25)
x1 ! x2 ! ...  xk !

unde x1 + x2 + ... + xk = n și p1 + p2 + ... + pk = 1 (n și pi sunt parametrii distribuției).

Denumirea de distribuție polinomială se datorează faptului că Pn ( x1 ,x 2 ,...,xk ) , reprezintă

termenul general al dezvoltării (p1 + p2 + ... + pk ) .


n

2.3.3. Distribuția Poisson


Este o distribuție discretă de probabilitate care se aplică în cazul unor evenimente
întâmplătoare independente. Variabila probabilistă este reprezentată de numărul de
evenimente care pot avea loc într-o unitate (interval) de timp, de spațiu (distanță, arie sau
volum) etc.
Astfel, numărul persoanelor care sosesc într-o stație de servire într-un interval de o oră pentru
a solicita un serviciu (clienți la un ghișeu de bancă, autoturisme la o stație de benzină etc.),
numărul defecțiunilor care apar într-o oră pe o linie de producție, numărul de reparații care
trebuie făcute unei mașini în 50.000 km parcurși, sau numărul de pungi din 1.000 de pungi de
cafea rezultate de pe o linie de ambalare care nu corespund standardelor de greutate, este o
variabilă probabilistă al cărei comportament poate fi descris de o distribuție Poisson.
Pentru a putea utiliza distribuția Poisson este nevoie să fie îndeplinite două condiții:
1. Probabilitatea de apariție a evenimentului este aceeași, pentru oricare două intervale
(de timp, spațiu etc.) de aceeași lungime;
2. Apariția sau neapariția evenimentului în oricare interval este independentă de
apariția sau neapariția evenimentului în oricare alt interval.

4
Teoria probabilităților și statistică matematică/ Statistică economică

Adică, evenimentele sunt întâmplătoare și independente!!!


Exemplu:
 numărul accidentelor fatale ale zborurilor comerciale produse într-un an poate fi
aproximat prin distribuția Poisson;
 numărul de decese datorate accidentelor fatale ale zborurilor comerciale produse într-
un an nu poate fi aproximat prin distribuția Poisson.
Funcția de probabilitate (frecvențele relative) pentru această distribuție este probabilitatea ca
numărul evenimentelor care au loc într-o unitate specificată să fie egal cu o anumită valoare x
și poate fi calculată cu expresia:

 x  e−
f(x; ) = , (2.26)
x!
unde: x = 0, 1, 2, …; λ este numărul mediu al evenimentelor dintr-un interval specificat (λ este
parametrul distribuției); e = 2,7182818... este numărul lui Euler (este constanta distribuției).
Funcția de distribuție cumulativă (frecvențele relative cumulate) este:
x x
 x  e−
F ( x;  ) = P ( X  x ) =  f ( x,  ) =  . (2.27)
x =0 x =0 x!

Funcția de probabilitate Funcția de distribuție cumulativă


Se arată că media și dispersia variabilei X distribuită după legea Poisson sunt egale cu
parametrul λ:

M X  = m =  , (2.28)

D  X  = 2 =  . (2.29)

5
Teoria probabilităților și statistică matematică/ Statistică economică

APLICAȚIE. Să se verifice dacă distribuția numărului ruperilor


firului în cazul unui ring al unei mașini de filat cu 400 de fuse în
timpul unui schimb de 8 ore respectă distribuția lui Poisson.
Pentru aceasta se va compara funcția de distribuție empirică
(pe baza experimentului) cu funcția de distribuție teoretică
Poisson.

Rezolvare

Pentru a stabili distribuția teoretică de probabilitate


caracterizează o distribuție empirică sunt folosite diverse teste
prezentate în cursurile viitoare. Ring cu fuse (Filatura LAMA-Benna-Italia)
Deocamdată putem să comparăm distribuția empirică obținută în urma unui experiment cu o anumită distribuție
teoretică: dacă diferențele nu sunt mari, atunci putem trage o concluzie parțială.

Datele cercetării experimentale privind ruperea firului în cazul unui ring al unei mașini de filat cu 400 de fuse în
timpul unui schimb de 8 ore sunt date în tabelul următor:

Nr. ruperi Nr. fuselor la care firul s-a rupt Numărul de ruperi
de x ori (frecvența absolută)
xi ni xi*ni
0 53 0
1 110 110
2 107 214
3 72 216
4 37 148
5 16 80
6 4 24
7 0 0
8 1 8
Total 400 800
Pe baza datelor experimentale rezultă că numărul mediu al ruperilor/fus este:

800
= = 2,0
400

Pentru a compara distribuția empirică obținută în urma experimentului cu o distribuție teoretică Poisson, vom
compara frecvențele relative cumulate ale distribuției empirice cu valorile funcției de distribuție cumulativă.

Calculul frecvențelor relative:

au fost constatate 0 ruperi în 53 de cazuri dintr-un total de 400 de cazuri: f(0)=53/400=0,1325;

au fost constatate 1 rupere în 110 de cazuri dintr-un total de 400 de cazuri: f(1)=110/400=0,2750;

au fost constatate 2 ruperi în 107 de cazuri dintr-un total de 400 de cazuri: f(2)=110/400=0,2675;

...

au fost constatate 8 ruperi în 1 caz dintr-un total de 400 de cazuri: f(8)=1/400=0,0025;

Calculul frecvențelor relative cumulate:

au fost constate cel mult 0 ruperi în 53 de cazuri dintr-un total de 400 de cazuri: fc(0)=f(0)=0,1325

au fost constate cel mult 1 rupere în 163 de cazuri dintr-un total de 400 de cazuri: fc(1)=f(0)+f(1)=0,4075

au fost constate cel mult 2 ruperi în 270 de cazuri dintr-un total de 400 de cazuri: fc(1)=f(0)+f(1)+f(2)=0,675

...

6
Teoria probabilităților și statistică matematică/ Statistică economică

În fișierul CURS 3.xlsx, sheet-ul POISSON este prezentat calculul frecvențelor relative și acelor cumulate:
Celula E3: scriem formula =B3/$B$12; $B$12 înseamnă că celula B12 este blocată la
indexare (când se copiază formula în celulele E4÷E11)
Celula E12: scriem formula =SUM(E3:E11) (suma trebuie să fie 1, adică evenimentul
sigur)
Celula F3: scriem formula =E3 (fc(0)=f(0))
Celula F4: scriem formula =F3+E4 care se copiază în celulele F5÷F11
fc(1)=f(0)+f(1)=fc(0)+f(1)
fc(2)=f(0)+f(1)+f(1)=fc(1)+f(2)
etc.
În Excel pentru calculul distribuției teoretice Poisson se folosește funcția
POISSON.DIST(x,media,val_logica)
Sintaxa funcției POISSON.DIST are următoarele argumente de intrare:
x Obligatoriu. Este numărul de evenimente
media Obligatoriu. Este valoarea numerică așteptată (media)
val_logica Obligatoriu. Dacă val_logică este TRUE, funcția POISSON.DIST calculează
valorile funcției de distribuție (cumulativă); în cazul FALSE,
POISSON.DIST calculează valorile funcției de probabilitate
Celula G3: scriem formula =POISSON.DIST($A3;$D$3;TRUE); $A$3 și $D$3 înseamnă că
celulele A3 și D3 sunt blocate la indexare (când se copiază formula în celulele
G4÷G11)
Celula H3: scriem formula =ABS(F3-G3) și copiem în celulele H4÷H11 (funcția ABS
calculează valoarea absolută (modulul))

Comparând cele două șiruri de valori ale funcției de distribuție empirică (coloana 6) și cea teoretică (coloana 7), se
vede că valorile corespunzătoare unui x dat sunt foarte apropiate între ele (diferențele absolute din coloana 8 sunt
foarte mici), deci numărul de ruperi ale firului pentru cele 400 fuse se distribuie după legea Poisson.

2.3.4. Distribuția exponențială


Este o distribuție continuă de probabilitate, fiind utilizată pentru a descrie timpul dintre
diferite evenimente cum sunt, de exemplu, intervalele de timp dintre sosirile clienților într-un
sistem de așteptare, în fiabilitate descrie rata medie de defectare (timpul până la prima
defectare).

7
Teoria probabilităților și statistică matematică/ Statistică economică

Se poate demonstra că dacă numărul sosirilor poate fi descris de o distribuție Poisson, atunci
intervalul dintre sosiri urmează o distribuție exponențială.
Funcția densitate de probabilitate este dată de relația:

f ( x;  ) =   e−x , (2.30)

unde: x ≥ 0; λ este inversul timpului mediu dintre sosiri (λ este parametrul distribuției);
e = 2,7182818 este numărul lui Euler.
Funcția de distribuție cumulativă este:

F ( x;  ) = P ( X  x ) = 1 − e−x , (2.31)

Rezultă că P ( X  x ) = e .
−x

Funcția densitate de probabilitate Funcția de distribuție cumulativă


Media și dispersia distribuției exponențiale sunt:

M X  = m =  −1 , (2.32)

D X  = 2 =  −2 . (2.33)

2.3.5. Distribuția normală (Gauss-Laplace)


Distribuția normală sau distribuția Gauss-Laplace este o distribuție continuă și are un rol
fundamental în teoria probabilităților și statistică.
Acest tip de distribuție descrie caracteristici ale populației (înălțimea, greutatea), distribuțiile
unor mărimi care sunt sume de alte mărimi, de exemplu prelucrarea prin așchiere (conform
teoremei limitei centrale) sau durata totală de realizare a unui proiect, ca sumă a duratelor
probabiliste ale activităților de pe drumul critic.
Funcția densitate de probabilitate este o funcție cu doi parametri, m și σ, de forma:


( x −m)2
1
f ( x;m,  ) = e 22 . (2.34)
  2

8
Teoria probabilităților și statistică matematică/ Statistică economică

Observație: Se demonstrează că parametrii distribuției m și σ reprezintă chiar media și


abaterea medie pătratică (abaterea standard) !!!
Funcția densitate de probabilitate a distribuției normale nu poate fi integrată exact.
Funcția de distribuție cumulativă, adică probabilitatea ca variabila X să ia valori mai mici sau
egale decât o valoare dată x este:
x x

( x −m)2
1
F ( x;m,  ) = P ( X  x ) =  f ( x;m,  ) dx =
2 
22
e dx . (2.35)
−  −

Funcția de distribuție F ( x;m,  ) = P ( X  x ) satisface condițiile:

F(x )  0 , (2.36)

F ( x1 )  F ( x 2 ) , x1  x2 , (2.37)

F ( − ) = P ( X  − ) = 0 , (2.38)

F ( + ) = P ( X  + ) = 1 . (2.39)

Funcția densitate de probabilitate Funcția de distribuție cumulativă


Din figura funcției densitate de probabilitate, rezultă că distribuția normală este simetrică față
de ordonata corespunzătoare valorii x = m.
Valoarea maximă a funcției densitate de probabilitate se obține pentru valoarea x = m și este
1
. Modulul și mediana variabilei întâmplătoare care urmează legea normală coincid cu
  2
media:

Mo  X  = Me  X  = MX  = m . (2.40)

9
Teoria probabilităților și statistică matematică/ Statistică economică

Pe măsură ce variabila X ia valori care se


îndepărtează de punctul x=m, ordonata
corespunzătoare descrește; curba are ca asimptotă
axa absciselor. Punctele de inflexiune ale curbei se
găsesc la o distanță egală cu abaterea medie
pătratică față de axa de simetrie.
Cu cât abaterea medie pătratică este mai mică, cu
atât ordonata maximă este mai mare. În schimb,
dacă abaterea medie pătratică crește curba se
Fig.8
turtește, luând din ce în ce formă plată.
În figura 8 sunt reprezentate patru curbe având diferite abateri medii pătratice.
Din graficele funcției densitate de probabilitate și funcției de distribuție rezultă că
probabilitatea ca valorile variabilei X să fie situate în intervalul (m − 3; m + 3 ) este de
0,9974. Cu alte cuvinte, 99,74% din valorile variabilei X se află în intervalul (m − 3; m + 3 ) ,
afirmație cunoscută sub numele de regula celor 6σ (6 abateri standard).
Afirmații logice:
- probabilitatea ca toate măsurătorile din setul de date să se afle între cele două extreme este 1
(evenimentul sigur);
- probabilitatea ca orice dată din setul de date considerat să fie mai mică decât valoarea medie,
este 0,5;
- probabilitatea ca orice dată din setul de date considerat să fie mai mare decât valoarea medie,
este 0,5;
- cele mai multe valori din setul de date se află în apropierea mediei (care este și modul și
mediană);
- este mai probabil ca o valoare individuală să fie mai aproape de valoarea medie decât de
valorile extreme;
- în apropierea extremităților se afla mai puține valori decât în apropierea mediei.
Probabilitatea ca valoarea unei
variabile probabiliste X cu
distribuție normală (Gauss-
Laplace) să fie cuprinsă în
intervalul [a, b] este:

P ( a  X  b ) = P ( X  b ) − P ( X  a) (2.41)

10
Teoria probabilităților și statistică matematică/ Statistică economică

Până la apariția calculatoarelor, calculul ariilor necesare pentru determinarea probabilităților


P ( a  X  b ) și a funcției de distribuție (cumulativă) se baza pe tabelele distribuției normale
standard a unei variabile probabiliste cu media m=0 și abaterea medie pătratică σ=1 (se va
studia în subcapitolul următor).
În Excel există funcțiile care permit calculul numeric (cel analitic nu este posibil) al funcțiilor
specifice.
+0 ,1
APLICAȚIE. O mașină-unealtă produce o piesă circulară cu diametrul  = 40 −0 ,1 . În urma măsurătorilor realizate în
cadrul unei cercetări a rezultat că media diametrelor pieselor prelucrate are valoarea 40,02 mm și abaterea medie
pătratică 0,05mm. Care este probabilitatea de rebut la mașina-unealtă respectivă?

Rezolvare:

Trebuie calculată probabilitatea ca diametrul pieselor fabricate să fie cuprinse între 39,9mm și 40,1mm, știind că
acesta are o distribuție normală cu media 40,02mm și abaterea standard 0,05mm.

Probabilitatea de rebut P ( X  39,9 X  40,1 ) este egală cu probabilitatea ca diametrul pieselor să fie mai mic
decât 39,9mm, respectiv mai mare decât 40,1mm.

Probabilitatea de rebut se calculează cu relația:

P ( X  39,9 X  40,1 ) = 1 − P ( 39,9  X  40,1)

unde 1 reprezintă probabilitatea evenimentului sigur (probabilitatea evenimentului ca piesele să fie prelucrate pe
MU din experiment: piese conforme și piese neconforme (rebuturi)).

Metoda 1

Probabilitatea P ( 39,9  X  40,1 ) se calculează pe baza relației (2.41)

P ( 39,9  X  40,1 ) = P ( X  40,1 ) − P ( X  39,9 )

Probabilitățile P ( X  40,1 ) și P ( X  39,9 ) se calculează în Excel.

În Excel pentru calculul distribuției teoretice normală (Gauss-Laplace) se folosește


funcția NORM.DIST(x,media,ab_standard,val_logica)
Sintaxa funcției NORM.DIST are următoarele argumente de intrare:
x Obligatoriu. Este valoarea pentru care doriți să calculați repartiția
media Obligatoriu. Este media aritmetică a repartiției
ab_standard Obligatoriu. Este abaterea standard a repartiției
val_logica Obligatoriu. Dacă cumulative este TRUE, NORM.DIST calculează valorile
funcției de distribuție cumulativă; dacă este FALSE, NORM.DIST calculează
valorile funcției de densitate a probabilității

În fișierul CURS 3.xlsx, sheet-ul NORMALA, este prezentat calculul probabilității de rebut:

Celula C2: scriem formula =NORM.DIST(40,1;A2;B2;TRUE)

11
Teoria probabilităților și statistică matematică/ Statistică economică

Celula D2: =NORM.DIST(39,9;A2;B2;TRUE)


Celula E2: =C2-D2
Celula F2: =1-E2

Răspuns: probabilitatea de rebut este 0,063 (6,3%).

Metoda 2: se folosește distribuția normală standard Z (în subcapitolul următor).

2.3.6. Distribuția normală standard Z


Pentru a transforma o variabilă probabilistă X cu distribuția normală într-o variabilă
x −m
probabilistă Z cu distribuția normală standard (sau normată) se utilizează formula z = .

În Excel calculul valorii normalizată dintr-o repartiție caracterizată prin media
medie și abaterea standard cu funcția STANDARDIZE(x,medie,ab_standard)
Sintaxa funcției STANDARDIZE are următoarele argumente de intrare:
x Obligatoriu. Este valoarea pe care vreți să o normalizați
medie Obligatoriu. Este media aritmetică a repartiției
ab_standard Obligatoriu. Este abaterea standard a repartiției

Funcția densitate de probabilitate a distribuției normale standard Z are expresia:


2
z
1 −
f (z) = e 2 , (2.42)
2
Funcția de distribuție cumulativă:
2
z z z
1 −
F ( z ) = P ( Z  z ) =  f ( z ) dz =  e 2
dz . (2.43)
− 2  −

În tabelele distribuției normale


standard se găsesc probabilitățile
P ( 0  Z  z ) , care reprezintă valoarea
ariei de sub curba funcției densitate
de probabilitate f(z), cuprinsă între
media 0 și valoarea z specificată
(figura 9).

Fig.9

Aria hașurată din figura 9, se numește funcția lui Laplace,  ( z ) .

În Anexa 1 sunt date tabelar valorile funcției distribuției normale standard Z, adică
probabilitățile P ( 0  Z  z ) .

12
Teoria probabilităților și statistică matematică/ Statistică economică

Tabelul 5 (Extras din Anexa 1)

▪ De exemplu, probabilitatea ca valoarea lui Z să fie cuprinsă între 0 și z = 1,25 se citește din
tabelul 5 din celula de pe linia 1.20 și coloana 0.05, adică:

P ( 0  Z  1,25 ) =  (1,25) = 0,3944 (2.44)


În Excel dacă se știe z, Φ(z) se calculează cu relația =NORM.S.DIST(z;TRUE)-0,5
Pentru calculul distribuției teoretice normală standard (are o medie de 0 (zero)
și o deviație standard de 1) se folosește funcția NORM.S.DIST(z,val_logica)
Sintaxa funcției NORM.S.DIST are următoarele argumente de intrare:
z Obligatoriu. Este valoarea pentru care doriți să calculați repartiția
val_logica Obligatoriu. Dacă cumulative este TRUE, NORM.S.DIST calculează
valorile funcției de distribuție cumulativă; dacă este FALSE, NORM.S.DIST
calculează valorile funcției de densitate a probabilității
Obs. funcția lui Laplace, Φ(z) din tabele reprezintă probabilitatea (aria)
P ( 0  Z  z ) . În Excel funcția NORM.S.DIST calculează probabilitatea (aria)
P ( −  Z  z ) . Din acest motiv, pentru a calcula Φ(z) relația în Excel este:
=NORM.S.DIST(z;TRUE)-0,5, adică se scade din P ( −  Z  z ) valoarea 0,5 care
reprezintă P ( −  Z  0 ) .

Calculul probabilității ca valoarea lui Z să fie cuprinsă între 0 și z = 1,25 în


Excel:
=NORM.S.DIST(1,25;TRUE)-0,5
rezultă 0,394350

▪ De exemplu, dacă se dă probabilitatea P ( 0  z ) =  ( z ) = 0, 3685 , se caută cea mai


apropiată valoare din tabel, care este 0,3686 căreia îi corespunde valoarea z = 1,12 .
În Excel dacă se cunoaște Φ(z), z se calculează cu relația:
=NORM.S.INV(probabilitate+0,5)
Pentru calculul inversei repartiției normale cumulative standard (calculează
valoarea lui z corespunzătoare probabilității date) se folosește funcția
NORM.S.INV(probabilitate)
Sintaxa funcției NORM.S.INV are un singur argument de intrare:
probabilitate Obligatoriu. Este probabilitatea pentru care se calculează z
Calculul valorii lui z pentru probabilitatea p=0,3686 în Excel:

13
Teoria probabilităților și statistică matematică/ Statistică economică

=NORM.S.INV(0,3685+0,5)
rezultă 1,119328

Datorită distribuției simetrice rezultă că P ( −z  Z  0 ) = P ( 0  Z  z ) .

De exemplu, probabilitatea ca valoarea variabilei Z să fie cuprinsă între –1,25 și 0 este egală cu
probabilitatea ca valoarea variabilei Z să fie cuprinsă între 0 și 1,25, adică
P ( −1,25  Z  0 ) = P ( 0  Z  1,25 ) = 0,3944 .

Deoarece P ( −z  Z  0 ) = − ( −z ) și P ( 0  Z  z ) =  ( z ) rezultă că − ( −z ) =  ( z ) .

De asemenea:

Valoarea funcției distribuției normale standard cumulative este:

F ( z ) = P ( Z  z ) = 0,5 + P ( 0  Z  z ) (2.45)

F ( −z ) = P ( Z  −z ) = 0,5 − P ( 0  Z  z ) (2.46)

Pentru variabilele probabiliste cu distribuției normală având media m și abaterea medie


pătratică σ, valoarea funcției de distribuției (cumulativă) se poate determina astfel:

 x − m  x − m x − m
F(x ) = P(X  x ) = P Z   = 0,5 + P  0  Z   = 0,5 +    (2.47)
        
Probabilitatea ca valoarea unei variabile probabiliste X să fie cuprinsă în intervalul [a, b]
utilizând distribuția Z este:

 b −m   a−m 
P ( a  X  b ) =P ( X  b ) − P ( X  a) = P  Z   − P Z  =
     
 b −m    a − m 
= 0,5 + P  0  Z   − 0,5 + P  0  Z   =
       
(2.48)
 b −m   a −m 
= P 0  Z   − P 0  Z  =
     
 b −m   a−m 
=   −  
     
+0 ,1
APLICAȚIE. Revenim la problema anterioară: o mașină-unealtă produce o piesă circulară cu diametrul  = 40 −0 ,1 . În
urma cercetării s-a stabilit că diametrul pieselor are o repartiție normală cu media egală cu 40,02mm și abaterea
medie pătratică 0,05mm. Care este probabilitatea de rebut la mașina-unealtă respectivă?

14
Teoria probabilităților și statistică matematică/ Statistică economică

Rezolvare: Calcul cu ”creionul pe hârtie”

Conform formulei (2.48), probabilitatea ca o piesă să fie bună este:


P ( 39,90  X  40,10 ) =P ( X  40,10 ) − P ( X  39,90 ) = P  Z 
40,10 − 40,02   39,90 − 40,02  =
 − P Z  
 0,05   0,05 
 40,10 − 40,02  −   39,90 − 40,02  =  1,6 −  −2,4 =  1,6 +  2,4 = 0,4452 + 0,4918 = 0,9370
=     ( ) ( ) ( ) ( )
 0,05   0,05 
Valorile  (1,6 ) și  ( 2,4 ) din Anexa 1.

Rezultă atunci că probabilitatea de rebut este 1 – 0,9370 = 0,063. Metoda se aplică atunci când nu avem acces la
un program de calcul.

2.3.7. Distribuția t (Student)


Să presupunem că dintr-o colectivitate generală distribuită normal din punct de vedere al
caracteristicii X cu media m și abaterea medie pătratică (abaterea standard)  s-a extras o
selecție de mărime n. Fie x1 , x2 ,..., xn valorile caracteristicii obținute pentru selecția dată.
Media aritmetică de selecție x se supune ea însăși unei legi de repartiție normală, dar cu o
abaterea medie pătratică (abatere standard) mai mică decât abatere standard valorilor
individuale!!!
Se demonstrează că abaterea medie pătratică a mediei, notată cu  0 , este:


0 = (2.49)
n

Dacă media de selecție x se distribuie normal cu media m și abaterea standard , mărimea:
n

x −m x −m
z= = (2.50)
0 
n
se distribuie normal cu media 0 și dispersia  2 egală cu 1.
Acest lucru este valabil în cazul când dispersia colectivității generale  2 este cunoscută. Sunt
însă numeroase cazurile când dispersia colectivității generale  2 nu este cunoscută. Atunci în
locul dispersiei  2 se utilizează estimația s2 :

( x − x ) + ( x2 − x ) + ... + ( xn − x )
2 2 2

s 2
= 1 (2.51)
n−1
determinată pe baza observațiilor.
Prin această înlocuire mărimea z din (2.50) devine:
x −m
t= (2.52)
s
n

15
Teoria probabilităților și statistică matematică/ Statistică economică

Această mărime nu se mai distribuie după legea normală, ci are o distribuție numită distribuția
”Student” sau distribuția t.
Se scrie mărimea t sub forma:
x −m x −m z
t= = = . (2.53)
s  s s

n n  
Se poate demonstra că funcția densitate de probabilitate a variabilei t are expresia:

 f +1
  
f +1
2 − 2
 2   1+ t 
f ( t;f ) =   , (2.54)
f  f 
 f  
2

unde f = n – 1 este numărul gradelor de libertate (f este parametru).


În figura alăturată sunt reprezentate
funcțiile densitate de probabilitate ale
variabilei t pentru cazurile când numărul
gradelor de libertate f este egal cu 1, 2, 5
și + .
Forma curbelor distribuției t amintește de
curba distribuției normale.

Funcția densitate de probabilitate


În figura 11 se dă reprezentarea grafică a
distribuției normale standard Z, respectiv
a distribuției t.
Comparând cele două curbe se constată
că, curba distribuției t se apropie mai
încet de axa absciselor atunci când t tinde
către − sau + , mai ales pentru
valorile mici ale numărului gradelor de
libertate f.

Fig.11
La distribuția t s-a ajuns înlocuind pe  prin s. Cum însă estimația s tinde către  atunci când
numărul gradelor de libertate tinde către + , rezultă că și distribuția t tinde către distribuția
standard atunci când f →  .

16
Teoria probabilităților și statistică matematică/ Statistică economică

Funcția de distribuție cumulativă a variabilei t este:

 f +1
  
f +1
2 − 2

tP

F ( t;f ) = P ( t  tP ) =   2   1+ t
dt . (2.55)
 
f  f 
0  f  
2
În matematică, funcția gamma, reprezentată prin litera grecească  , este o funcție care
extinde noțiunea de factorial de la numerele întregi la numerele reale și complexe.

Dacă n este un număr întreg pozitiv, atunci  (n ) = (n − 1 )! , ceea ce arată legătura funcției
gamma cu factorialul numerelor întregi pozitive. Funcția gamma generalizează funcția factorial
la valori neîntregi și complexe ale lui n.
Ca urmare a simetriei distribuției t, quantilul tP, adică valoarea lui t corespunzătoare valorii P a
funcției de distribuție F(t), este egală cu quantilul t1-P (valoarea lui t corespunzătoare valorii
F ( t;f ) = 1 − P ), adică:

tP = −t1−P (2.56)

Vom reveni la distribuția Student în cursurile următoare.

BIBLIOGRAFIE

1. *** Probabilități și statistică, www.edumanager.ro


2. Bulgaru, M., Elemente de teoria probabilităților, www.cermi.utcluj.ro
3. Pop, M., ș.a., Probabilități și statistică-teorie și aplicații, Editura RISOPRINT, Cluj-Napoca,
2008
4. Rancu, N., Tovissi, L., Statistică matematică cu aplicații în producție, Editura Academiei
Române, 1963

17
Teoria probabilităților și statistică matematică/ Statistică economică

ANEXA 1

18

S-ar putea să vă placă și