Sunteți pe pagina 1din 51

Probabilităţi şi distribuţii teoretice

1. Distribuţia normală standard

Pentru ţările U.E. a fost observata rata de creştere PIB (variabila X), pentru care se cunoaste
că X ~ N(3.2, 2.8).
Se cere să se calculeze si sa se interpreteze:
a. P(X>5)
b. P(X<2)
c. P(2.2 < X < 4.2)
d. P(1.5 < X < 2.5)
e. Să se calculeze P(    <X<    )
f. Să se calculeze P(   2 <X<   2 )
g. Să se calculeze P(   3 <X<   3 )
h. Ştiind că P(-zi<Z<zi)=0.682, să se afle valorile zi şi xi
i. Ştiind că P(-zi<Z<zi)=0.95, să se afle valorile zi şi xi

Rezolvare

Variabila X este normal distribuita, deci ne orientam spre o variabila teoretica cu aceeasi lege
de distributie, care sa ajute la suplinirea informatiilor lipsa din populatia reala, cea observata.

Distribuţia normală (generalizată)


Repartiţia normală generalizată se simbolizează prin N ( μ , σ2 )
Nota: μ reprezinta media variabilei, iar σ2 reprezinta varianța variabilei.

Pentru scopuri practice, de calcul rapid si facil al probabilitatilor, vom folosi valorile si
probabilitatile variabilei normale standard, Z, care are valorile zi si probabilitatile associate
acestora, φ(zi).

Variabila normală standard se obţine dintr-o variabilă normală generalizată prin procedeul de
standardizare:
X−μ
Z=
σ

Z ~ N(0, 1).

Tabelul de probabilitate pentru variabila normala standard, Z – valorile zi si probabilitatile


acestora, φ(zi), este prezentat mai jos.
0.00 0.01 0.02 0.03
0.0 0.0000 0.0040 0.0080 0.0120
0.1 0.0398 0.0438 0.0478 0.0517
0.2 0.0793 0.0832 0.0871 0.0910
0.3 0.1179 0.1217 0.1255 0.1293
0.4 0.1554 0.1591 0.1628 0.1664
0.5 0.1915 0.1950 0.1985 0.2019
0.6 0.2257 0.2291 0.2324 0.2357

Modul de citire al valorilor din tabelului de probabilitate:


- Valorile zi sunt pe prima linie si pe prima coloana – pe prima coloana sunt intregul si prima
zecimala a valorii zi, pe prima coloana gasiti a doua zecimala a valorii zi.

- Probabilitatea asociata fiecarei valori zi, adica φ(zi), se gaseste la intersectia liniei si a
coloanei care compun valoarea zi.

- De exemplu, pentru zi=0.21, φ(0.21)=0.0832

Proprietăţile funcţiei lui Laplace, Φ(z), necesare pentru a calcula orice tip de probabilitate,
sunt urmatoarele:
 Φ(zi)=P(0<Z<zi)
 Φ(0) = 0
 Φ(-zi) = - Φ(zi)

 Dacă z1< z2, atunci P( z 1 <Z < z 2 )=Φ ( z2 )−Φ( z 1 )

1
P( Z < z i )= +φ ( z i )
 2

1
 P(Z>zi)=1-P(Z<zi)=   ( zi )
2

Pentru exemplul nostru, X ~ N(3.2, 2.8), deci μ=3.2%, iar σ2=2.8, adica σ=1.67

A 1. P(X>5)

P(X>5)=P(Z>1.07)=0.5-φ(1.07)=0.5-0.3577 =0.1423

xi −μ
z i=
σ

P ( Z > z i ) =0 .5−φ ( z i )

zi=(5-3.2)/1.67=1.07

Exista 14.23% sanse ca o tara din UE sa aiba o rata de crestere a PIB-ului mai mare decat 5%.
Sau, alternativ: cel mai probabil, 14.23% din tarile din UE au rate de crestere a PIB-ului mai
mari de 5%.

B 2. P(X<2)

P(X<2)=P(Z<-0.71)=0.5+ φ(-0.71)=0.5- φ(0.71)=0.5-0.2611=0.2389

1
P( Z < z i )= +φ ( z i )
2

zi = (2-3.2)/1.67=-0.71

Exista 23.89% sanse ca o tara din UE sa aiba o rata de crestere a PIB-ului mai mica decat 2%.
C 3. P(2.2 < X < 4.2)=P(-0.59<Z<0.59)= φ(0.59)- φ(-0.59)= φ(0.59) + φ(0.59)=
= 2* φ(0.59)=2*0.2224=0.4448
P( z 1 <Z < z 2 )=Φ ( z2 )−Φ( z 1 )

z1 = (2.2-3.2)/1.67=-0.59
z2 = (4.2-3.2)/1.67=0.59

Exista 44.48% sanse ca o tara din UE sa aiba o rata de crestere a PIB-ului cuprinsa intre
2.2%-4.2%.
Cel mai probabil, 44.48% dintre tarile UE au rate cuprinse intre 2.2% si 4.2%.

C 4. P(1.5<X<2.5)= P(-1.01<Z<-0.41)= φ(-0.41)- φ(-1.01)= -φ(0.41) + φ(1.01)=


= -0.1591+0.3438=0.1847

z1 = (1.5-3.2)/1.67=-1.01
z2 = (2.5-3.2)/1.67=-0.41

Exista 18.47% sanse ca o tara din UE sa aiba o rata de crestere a PIB-ului cuprinsa intre
1.5%-2.5%.

D 5. P(μ-σ<X< μ+σ)=P(0-1<Z<0+1) = P(-1<Z<1) = φ(1)-φ(-1)=2φ(1)=2*0.3413=0.6826

68.26% dintre valori sunt situate la o abatere standard distanță de media lor.

E 6. P(μ-2σ<X< μ+2σ)=P(0-2<Z<0+2) = P(-2<Z<2) = φ(2)-φ(-2)=2φ(2)=2*0.4772=0.9544

95.44% dintre valori sunt situate la o doua abateri standard distanță de media lor.

F 7. P(μ-3σ<X< μ+3σ)=P(0-3<Z<0+3) = P(-3<Z<3) = φ(3)-φ(-3)=2φ(3)=


= 2*0.4987=0.9974

99.74% dintre valori sunt situate la o trei abateri standard distanță de media lor.

Tema:

8. Ştiind că P(-zi<Z<zi)=0.682, să se afle valorile zi şi xi


9. Ştiind că P(-zi<Z<zi)=0.95, să se afle valorile zi şi xi

2. Stiind ca la notele obtinute la un test de catre o serie de studenti X ~ N(5, 4), sa se


precizeze cum sunt distribuite notele in randul studentilor.
68.2% din studenti au note intre 3 si 7.
95.4% din studenti au note intre 1 si 9.
99.7% din studenti au note intre 0 si 10 (minim si maxim, in acest caz, pentru ca nu exista
note negative sau mai mari ca 10).

3. Se considera salariile a trei angajati la trei companii diferite. Primul salariat are salariul
(X1) de 1580 euro, iar salariul in compania sa este normal distribuit, cu media 2300 si
varianta 400. Al doilea salariat are salariul (X2) de 2500 de dolari, salariul fiind normal
distribuit cu media 3200 si varianta 324. Al treilea salariat (X3) are salariul de 180000 yen,
salariul fiind normal distribuit, cu media 320000 si varianta 37000.
Care este salariatul care este cel mai bine pozitionat ca salarizare in cadrul companiei sale?
Rezolvare

X1~N(2300, 400)

X2~N(3200, 324)

X3~N(320000, 37000)

Valorile variabilelor au unitati diferite de masura, deci nu putem compara performantele


angajatilor intre ele pana nu standardizam salariile, aducandu-le la aceeasi unitate de masura.

Formula de standardizare este:


xi −μ
z i=
σ

Pentru primul angajat vom standardiza salariul sau de 1580 euro:

1580−2300
z 1= =−36
20

Pentru al doilea salariat vom standardiza salariul sau de 2500 dolari:

2500−3200
z 2= =−38 .88
18

Pentru al treilea salariat vom standardiza salariul sau de 180000 yen:

180000−320000
z 3= =−727 .83
192 . 35

Cea mai mare valoare a lui Z arata cea mai buna pozitionare. Ierarhia este: angajatul 1,
angajatul 2 si angajatul 3.

3. Pentru o variabilă aleatoare care urmează o lege de repartiţie Student cu v = 20 grade de


libertate (X ~ t (20)), să se citească valoarea teoretică t0.025,20.
n\p 0.10 0.05 0.025 0.01
1 3,078 6,314 12,706 31,821
2 1,886 2,920 4,303 6,965
3 1,638 2,353 3,182 4,541
4 1,533 2,132 2,776 3,747
5 1,476 2,015 2,571 3,365
6 1,440 1,943 2,447 3,143
7 1,415 1,895 2,365 2,998
8 1,397 1,860 2,306 2,896
9 1,383 1,833 2,262 2,821

Valorile variabilei aleatoare t se citesc in functie de cele doua elemente: de o probabilitate p si


de df, gradele de libertate care sunt date de n, volumul esantionului.

De exemplu, t0.025,7=2,365.

In cazul problemei noastre, valoarea teoretică t0.025,20 = 2.086


4. Pentru o variabilă X ~ F(3, 6), se cere citească valoarea teoretică F0.05,3,6

n2/n1 1 2 3 4 5
1 161,448 199,500 215,707 224,583 230,162
2 18,513 19,000 19,164 19,247 19,296
3 10,128 9,552 9,277 9,117 9,014
4 7,709 6,944 6,591 6,388 6,256
5 6,608 5,786 5,410 5,192 5,050
6 5,987 5,143 4,757 4,534 4,387
7 5,591 4,737 4,347 4,120 3,972
8 5,318 4,459 4,066 3,838 3,688
9 5,117 4,257 3,863 3,633 3,482
10 4,965 4,103 3,708 3,478 3,326
11 4,844 3,982 3,587 3,357 3,204
12 4,747 3,885 3,490 3,259 3,106
13 4,667 3,806 3,411 3,179 3,025

Pe prima linie se gasesc valorile df1, iar pe prima coloana valorile df2.

De exemplu, F0.05,2,5=5.786

Pentru exemplul nostru, valoarea teoretică F0.05,3,6 = 4.757.


Distribuţii de selecţie

Numărul de eşantioane care se pot extrage

- în cazul eşantionării aleatoare repetate:


k=Nn
De exemplu, dacă dintr-o populaţie de adultă de 240.000 de persoane, se doreşte
extragerea unui eşantion de 800 de persoane, atunci, din populaţie se pot extrage un număr
de:
240.000800 = 1,47e4304 eşantioane de 800 de persoane.

- în cazul eşantionării aleatoare nerepetate:

k  C Nn  C240000
800

Proprietatile estimatorilor

1. Nedeplasarea - media estimatorului este egala cu valoarea parametrului

^
M ( θ)=θ
2. Convergenta – cand creste volumul esantionului, se reduce varianta estimatorului

^
V ( θ)→0 , când n →N
3. Eficienta – estimatorul are varianta minima

^
V ( θ)=min .

Aplicatie
Un grup de studiu la Bazele Statisticii are șase studenți (N=6), cu vârstele: 18, 18, 19, 20, 20,
21. Vom construi distribuția de selecție a mediei de vârstă pentru eșantioane de 2 studenți (n =
2). Esantioanele vor fi extrase prin selectie aleatoare repetata.

Rezolvare
În primul rând, extragem toate cele k eșantioane de volum n = 2 și calculăm mediile de vârstă
pentru toate eșantioanele.

Numarul total de esantioane de extras:


k=Nn=62=36 esantioane
Tema:
Să se construiască distribuţia de selecţie a mediei la nivelul tuturor eşantioanelor de volum
n=2, considerând datele de la nivelul unei populaţii de muncitori, pentru care s-a înregistrat
numărul de piese produse într-o zi.

X: {2, 4, 6, 8}

Esantioanele vor fi extrase prin procedeul selectiei aleatoare nerepretate.


Verificati proprietatea de nedeplasare a mediei de selectie.
Estimarea parametrilor unei distributii

Estimarea punctuala si prin interval de incredere (IC) a mediei unei populatii

- daca se cunoaste varianta la nivelul unei populatii (σ2) – se foloseste variabila Z


σ σ
P( μ^ −z α /2 ≤μ≤ μ^ +z α /2 )=(1−α )
√n √n

σ σ
[ x̄ −z α /2
√n
, x̄ + z α / 2
√n ]
- daca nu se cunoaste varianta la nivelul unei populatii (σ2) – se foloseste variabila t

 s' s' 
 x  t /2, n 1 , x  t /2, n 1 
 n n

Alta abordare:
Estimarea punctuala si prin interval de incredere (IC) a proportiei unei populatii

- când se cunoaşte varianţa variabilei alternative:

σπ σπ
[ p−z α / 2
√n
, p+ z α /2
√n ]
- când nu se cunoaşte varianţa variabilei alternative:

 p (1  p ) p(1  p) 
 p  t / 2,n 1 , p  t / 2,n 1 
 n n 
Aplicatii

1. Dintr-un lot de 1000 de piese se extrage un esantion de 5 piese, care se observa dupa
greutate. Datele inregistrate la nivelul esantionului sunt 9, 11, 9, 8, 13. Se cere să se estimeze
punctual şi prin interval de încredere greutatea medie a pieselor la nivelul lotului. Se
consideră un risc de 5%.

2. Din populaţia firmelor din Iaşi, de volum N=15000 se extrage aleator un eşantion de 100 de
firme, observate după numărul angajaţilor, şi se obţine că x̄ este 150, iar abaterea standard
la nivelul populatiei este 15. Să se estimeze prin interval de incredere numărul mediu de
angajaţi la nivelul firmelor din Iaşi, cu un risc de 5%.
3. Dintr-un lot de 1000 de piese se extrage aleator un eşantion de 50 de piese, care au fost
observate după calitate. În urma observării a rezultat un număr de 7 rebuturi. Se cere să se
estimeze prin interval de incredere proporţia rebuturilor la nivelul întregului lot, riscul asumat
fiind de 5%.
Tema

4. Din totalul localitatilor României se extrage aleator un eşantion de 50 de localitati, care au


fost observate după castigul salarial net. La nivelul eşantionului s-a obţinut xi=100,
∑ ( xi− x̄ )2=8 . Se cere să se estimeze prin interval de incredere câştigul mediu la nivelul
tuturor localitatilor, considerând un risc de 5%.
5. La nivelul unui eşantion de 150 de persoane s-a observat statusul cu privire la fumat si s-a
inregistrat ca 68% dintre persoanele din esantion sunt fumatoare. Stiind ca varianta la nivelul
populatiei este de 0.12, să se estimeze prin interval de incredere proporţia fumatorilor la
nivelul întregii populatii, riscul asumat fiind de 10%.

IC pentru μ: [5-4.108, 5+4.108]=[0.892, 9.108]


Estimarea prin IC in SPSS

Descriptives

Statistic Std. Error


durata Mean 5,0000 1,29099
95% Confidence Lower Bound ,8915
Interval for Mean Upper Bound
9,1085

5% Trimmed Mean 5,0000


Median 5,0000
Variance 6,667
Std. Deviation 2,58199
Minimum 2,00
Maximum 8,00
Range 6,00
Interquartile Range 5,00
Skewness ,000 1,014
Kurtosis -1,200 2,619

Lower Bound este limita inferioara a intervalului de incredere

Upper Bound este limita superioara a intervalului de incredere

Deci, IC pt μ este: [0.8915; 9.1085]

Calculul volumului eşantionului

2 2
z α / 2⋅σ π
n= 2
Δπ

Unde Δ π este eroarea maximă admisibilă (marja de eroare), iar este abaterea standard a
variabilei alternative pentru care se estimează π.

În practică, se fixează probabilitatea sau nivelul de încredere, (1-α), cu care dorim să garantăm
rezultatul (de regulă, 0,95) şi eroarea maxim admisibilă Δ π (de exemplu, ±3% ). Având aceste date,
se poate calcula volumul eşantionului care estimează, cu un anumit nivel de încredere, parametrul π.

Parametrul σ2, care exprimă gradul de omogenitate al populaţiei, de regulă nu se cunoaşte, însă în
calculul volumului eşantionului se poate utiliza valoarea lui maximă, care este egală cu 0,25.

Aplicatii
1. Să se calculeze volumul eşantionului pentru o probabilitate de 0,95, o eroarea maxim admisibilă de
±3 % şi o varianţă de 0,25.

Tema

2. Să se calculeze volumul eşantionului pentru o probabilitate de 0,95, o eroarea maxim admisibilă de


±5 % şi o varianţă de 0,25.
Indicatori ai seriilor de timp

O serie de timp este o serie care prezintă valorile înregistrate de un fenomen Y în diferite
momente de timp, t=1,n.

Indicatorii care măsoară dinamica unui fenomen pot fi calculaţi:


- în mărime absolută şi se numesc indicatori absoluţi;
- în mărime relativă şi se numesc rate/indici;
- ca mărimi medii şi se numesc indicatori medii.

Indicatori absoluţi – masoara variatia variabilei in unitatea de masura a acesteia


- nivelul absolut: yt
- volumul absolut: Σ yt
- sporul absolut: Δt - Arată cu cât s-a modificat nivelul unei variabile la un moment
dat, numit moment curent (t), faţă de un alt moment anterior, numit moment de referinţă.

Sporul absolut poate fi calculat:


- cu baza fixă (folosim acelasi moment de referinta): Δ t/0 = y t − y 0

- cu baza în lanţ (momentul de referinta este perioada anterioara perioadei curente):

Δ t/t−1= y t − y t−1

Indicatori (indici) relativi:


- rata (indicele) de variaţie it: arată de câte ori s-a modificat nivelul unei variabile într-
un moment faţă de alt moment (de referinţă)
- rata sporului rt: exprimă cu cât s-a modificat, în mărime relativă nivelul fenomenului
Y în momentul curent, t, faţă de un alt moment (de referinţă).
Rata (indicele) de variatie

Poate fi calculat: yt
- cu baza fixă: i t/0 = ( x 100 )
y0

yt
- cu baza în lanţ: i t/t−1= ( x 100 )
y t−1

Daca it >1, atunci fenomenul a inregistrat o crestere in momenul t fata de alt moment
Daca 0< it <1, atunci fenomenul a inregistrat o scadere in momenul t fata de alt moment

Rata sporului (rata de crestere)

Poate fi calculat:
 t /0 y  y0
- cu baza fixă: rt /0  ( x100)  t ( x100)  it /0  1 ( x100)
y0 y0

t / t 1 y  yt 1
- cu baza în lanţ: rt / t 1  ( x100)  t ( x100)  it / t 1  1 ( x100)
yt 1 yt 1

Daca rt >0, atunci fenomenul a inregistrat o crestere in momenul t fata de alt moment
Daca rt <0, atunci fenomenul a inregistrat o scadere in momenul t fata de alt moment

Indicatori medii
- nivelul mediu
- sporul mediu
- rata medie de variaţie
- rata medie a sporului

Sporul mediu

Δ̄=
∑ Δt /t−1 = Δ n/1 = y n − y 1
n−1 n−1 n−1

- arată modificarea medie absolută pe unitatea de timp înregistrată de un fenomen într-o


perioadă de timp.
- daca sporul mediu este pozitiv, atunci, pe perioada analizata, fenomenul a inregistrat o
evolutie crescatoare (crestere)
- daca sporul mediu este negativ, atunci fenomenul analizat a inregistrat o evolutie
descendenta (scadere) in perioada considerata.
Rata medie de variatie

yt yn
i=

n−1
Π
y t−1
=

n−1
y1

- arată modificarea medie relativă pe unitatea de timp înregistrată de un fenomen într-o


perioadă de timp.
- daca rata medie de variatie >1, atunci, in medie, fenomenul a inregistrat o crestere
- daca 0< rata medie de variatie <1, atunci, in medie, fenomenul a inregistrat o scadere.

Rata medie a sporului

r=i−1(x100 )
- daca rata medie a sporului >0, atunci, in medie, fenomenul a inregistrat o crestere
- daca rata medie a sporului <0, atunci, in medie, fenomenul a inregistrat o scadere.
Aplicatii
I. Se consideră preţurile unui produs (lei), în perioada 2009-2012, prezentate în tabelul de mai
jos.

Anul Pretul unitar (Y)


2009 20
2010 22
2011 18
2012 51
Total 111

Se cere:
1. Să se calculeze şi să se interpreteze sporurile absolute:
a. cu bază fixa anul 2009
b. cu baza în lanţ
2. Să se calculeze şi să se interpreteze ratele de variaţie
a. cu bază fixa anul 2009
b. cu baza în lanţ
3. Să se calculeze şi să se interpreteze ratele sporului
a. cu baza fixă anul 2009
b. cu bază în lanţ
4. Sa se calculeze şi să se interpreteze nivelul mediu al pretului
5. Să se calculeze şi să se interpreteze sporul mediu
6. Să se calculeze şi să se interpreteze rata medie de variaţie
7. Să se calculeze şi să se interpreteze rata medie a sporului

Rezolvare

1. Sporurile absolute
- perioada de referinta = y0 = y2009 = 20

Anul Pretul t
Unitar Δt/0=yt-y0 Δt/t-1=yt-yt-1
(Y)
2009 20 1 Δ1/0 = y1 – y0 = 20-20=0 -
2010 22 2 Δ2/0 = y2 – y0 = 22-20=2 Δ2/1 = y2 – y1 = 22-20=2
2011 18 3 Δ3/0 = y3 – y0 = 18-20=-2 Δ3/2 = y3 – y2 = 18-22=-4
2012 51 4 Δ4/0 = y4 – y0 = 51-20=31 Δ4/3 = y4 – y3 = 51-18=33
Total 111 - 31

Interpretare pentru anul 2012


- Δ4/0 = 31 lei: Pretul produsului a crescut in 2012 cu 31 de lei fata de pretul din 2009
- Δ4/3 = 33 lei: Pretul produsului a crescut in 2012 cu 33 lei fata de pretul din 2011

2. Ratele de variatie
- perioada de referinta = y0 = y2009 = 20
Anul Pretul t
Unitar it/0=yt/y0 it/t-1=yt/yt-1
(Y)
2009 20 1 i1/0 = y1 / y0 = 20/20=1 -
2010 22 2 i2/0 = y2 / y0 = 22/20=1.1 i2/1 = y2 / y1 = 22/20=1.1
2011 18 3 i3/0 = y3 / y0 = 18/20=0.9 i3/2 = y3 / y2 = 18/22=0.81
2012 51 4 i4/0 = y4 / y0 = 51/20=2.55 i4/3 = y4 / y3 = 51/18=2.83
Total 111

Interpretare pentru anul 2012


- i4/0 = 2.55: Pretul produsului a crescut in 2012 de 2.55 ori fata de pretul din 2009, sau pretul
produsului in 2012 este la 255% fata de nivelul din 2009
- i4/3 = 2.83: Pretul produsului a crescut in 2012 de 2.83 ori fata de pretul din 2011

Extra:
i3/0 = 0.9: Pretul produsului in 2011 este la 90% din nivelul de pret din 2009.

3. Ratele sporului
- perioada de referinta = y0 = y2009 = 20

Anul Pretul t
Unitar rt/0=(it/0-1)*100 rt/t-1=(it/t-1-1)*100
(Y)
2009 20 1 r1/0 = (i1/0-1)*100=(1-1)*100=0 -
2010 22 2 r2/0 = (i2/0-1)*100=(1.1-1)*100=10 r2/1 = (i2/1-1)*100=(1.1-1)*100=10
2011 18 3 r3/0 = (i3/0-1)*100=(0.9-1)*100=-10 r3/2 = (i3/2-1)*100=(0.81-1)*100=-19
2012 51 4 r4/0 = (i4/0-1)*100=(2.55-1)*100=155 r4/3 = (i4/3-1)*100=(2.83-1)*100=183
Total 111

Interpretare pentru anul 2012


- r4/0 = 155: Pretul produsului a crescut in 2012 cu 155% fata de pretul din 2009
- r4/3 = 183: Pretul produsului a crescut in 2012 cu 183% fata de pretul din 2011

Extra:
r3/0 = -10: Pretul produsului a scazut in 2011 cu 10% fata de pretul din 2009.

4. Nivelul mediu al pretului

ȳ=
∑ y t =111 =27 . 75 lei
n 4

Pe perioada analizata, produsul a inregistrat un pret mediu anual de 27.75 lei.

5. Sporul mediu

Δn/1 y n − y 1 51−20
Δ̄= = = =10 . 33 lei
n−1 n−1 3
Δ̄=
∑ Δt /t−1 =31 =10 . 33 lei
n−1 3

In medie, in perioada 2009-2012, pretul produsului a crescut cu 10.33 lei anual.

6. Rata medie de variatie

yn
ī =
√ √
n−1
y1
=
3 51
20
=1 . 36

In medie, in perioada 2009-2012, pretul produsului a crescut de 1.36 ori anual.

7. Rata medie a sporului

r̄=( ī −1 )⋅100=(1. 36−1)⋅100=36 %

In medie, in perioada 2009-2012, pretul produsului a crescut 36% anual.

In concluzie:

 Cum ne dam seama ce indicator trebuie calculat?


 Cand se compara o perioada cu alta perioada:
 Daca vrem sa aflam cu cate unitati a crescut sau a scazut y, atunci se
calculeaza sporul absolut
 Daca vrem sa aflam de cate ori a crescut/scazut y, se calculeaza rata de
variatie
 Daca vrem sa aflam cu cat % a crescut / scazut y, se calculeaza rata
sporului
 Cand analizam variatia pe toata perioada considerata, in medie:
 Daca vrem sa aflam cu cate unitati a crescut sau a scazut y, atunci se
calculeaza sporul mediu absolut
 Daca vrem sa aflam de cate ori a crescut/scazut y, se calculeaza rata
medie de variatie
 Daca vrem sa aflam cu cat % a crescut / scazut y, se calculeaza rata
medie a sporului
TEMA

II. Se considera valorile PIB in preturi curente (mil. Euro), pentru perioada 2006-2010. Se
cere sa se calculeze si interpreteze rata de crestere PIB.

Anu Rata de crestere PIB


PIB preturi curente
l (%)
200
6 9100,00
200
7 10400,00
200
8 11700,00
200
9 11000,00
201
0 11400,00
Testarea statistica

Obiectivele testării statistice


- verificarea ipotezelor asupra unui parametru al unei populaţii
- verificarea ipotezelor privind două sau mai multe populaţii
- verificarea ipotezelor privind legea de distribuţie a unei populaţii

Demersul testării statistice

1. Formularea ipotezelor statistice


O ipoteză este o presupunere cu privire la valoarea unui parametru, legea de distribuţie
a variabilei studiate etc.
Ipoteza nulă H0 : se presupune egalitatea unui parametru cu o valoare fixă sau se face o
presupunere cu privire la legea de repartiţie a unei variabile.
Ipoteza alternativă H1: este opusul ipotezei nule.

2. Alegerea testului statistic

3. Alegerea pragului de semnificaţie α al testului şi citirea valorii critice din tabelul


repartiţiei statisticii test
- riscul (pragul de semnificaţie) α reprezintă probabilitatea de a respinge ipoteza nulă,
atunci când aceasta este adevărată.

4. Calculul valorii statisticii test, folosind datele observate la nivelul eşantionului.

5. Regiunea de respingere/acceptare a ipotezei nule

Regiunea de respingere – intervalul dintr-o distribuţie de probabilitate în care se respinge


ipoteza nulă, acest interval este acoperit de probabilitatea α
Regiunea de acceptare (interval de încredere) – intervalul în care nu se respinge ipoteza nulă
şi este acoperit de probabilitatea 1- α
Regiunea critica pentru:
a) test bilateral
b) test unilateral dreapta
c) test unilateral stanga

Aplicarea regulii de decizie folosind valoarea calculata si valoarea teoretica


a testului
Aplicarea regulii de decizie folosind p-value (Sig.) si α
Ca principiu, testarea statistica vizeaza verificarea unor presupuneri pe care
le facem cu privire la comportamentul populatiilor. Astfel:

 Mai intai, se presupune, prin reducere la absurd, ca ipoteza H0 este


adevarata.
 Apoi, folosind un instrument de analiza (testul statistic potrivit pentru
ipoteza H0), vedem ce dovezi in sprijinul ipotezei H0 aduc datele pe care le
avem la nivel de esantion (valoarea calculata a testului).
 Apoi verificam daca aceste dovezi inclina spre a confirma sau a infirma, cu
o anumita probabilitate, ipoteza H0 (prin compararea valorii calculate a
testului cu valoarea teoretica a testului)
 Daca datele de la nivelul esantionului produc suficiente dovezi pentru a
sustine afirmatia de la H0 (valoarea calculata a testului este mai mica decat
valoarea teoretica a testului), garantam, cu probabilitatea 1- α, ca ipoteza
H0 nu poate fi respinsa ca fiind falsa.
 In caz contrar (valoarea calculata a testului este mai mare decat valoarea
teoretica a testului), afirmam, cu un risc asumat α, ca ipoteza H0 este
respinsa.
Testarea ipotezelor asupra mediei unei populaţii

c) Alegerea pragului de semnificaţie şi citirea din tabel a valorii critice a statisticii test

d). Calculul valorii statisticii test pe baza datelor eşantionului

x̄−μ0 x̄−μ0
z calculat = t calculat =
σ / √n s '/ √n
Testarea ipotezelor asupra proporţiei

Demersul testării:
a) Formularea ipotezelor statistice

H 0 : π =π 0
H 1 : π ≠π 0
b) Alegerea pragului de semnificaţie

c) Testul statistic

p−π 0
t calculat =
√ p(1−p )/ √ n

c) Regula de decizie

d) Decizie si interpretare

Testarea ipotezelor privind două eşantioane (cazul eşantioanelor


independente)
În cazul eşantioanelor independente, statistica test folosită în testarea ipotezelor statistice este
statistica Z sau t.

Ipoteze statistice

H 0 : μ1 −μ2 =0
H 1 : μ1 −μ2 ≠0

Statistica test:
- daca se cunoaste σ12 si σ22, se foloseste testul Z

x̄ 1− x̄ 2 σ ' 21 (n1 −1)+σ ' 22 (n2 −1)


z calculat =
σ'
p⋅¿ 1 1
√ n
¿

1
+
n
2
σ ' p=
√ n1 +n 2−2

- daca nu se cunoaste σ12 si σ22, se foloseste testul t

x̄1 − x̄ 2 s ' 21 ( n1 −1)+ s ' 22 ( n2 −1)


t calculat =
s'
p⋅¿
√ n
1
+
1
n
1
2
¿ s ' p=
√ n1 + n2 −2
e) Regula de decizie

f) Decizie si interpretare

Testarea egalităţii a trei sau mai multe medii (ANOVA


unifactoriala)
Obiectiv
- procedeu de analiză a variaţiei în funcţie de sursa acesteia
- permite compararea mediilor a 3 sau mai multe grupe sau populaţii cu scopul de a
verifica dacă există diferenţe semnificative între acestea

Se bazează pe descompunerea variaţiei totale (VT sau TSS) pe componente:


- variaţia explicată (variaţia sub influenţa factorului de grupare): VE sau ESS
- variaţia reziduală (variaţia sub influenţa factorilor întâmplători ): VR sau RSS

V T =V E +V R

TSS=ESS+RSS

1. Ipoteze statistice:

H 0 : μ1 =μ2 =…=μ k

H 1 : mediile a cel putin doua populatii sunt diferite

Notatie: k reprezinta numarul grupurilor comparate

2. Se alege statistica test Fisher

3. Se alege pragul de semnificaţie şi se citeşte valoarea critică a testul F din tabelul


repartiţiei Fisher, pentru riscul α admis, şi v1 = k-1 si v2 = n-k grade de libertate,

4. Valoarea statisticii F se calculează astfel:

ESS n−k
F calculat = ⋅
RSS k−1
5. Regula de decizie

6. Decizia si interpretarea
APLICATII

1. Din totalul autoturismelor vandute intr-un an de o firma a fost extras un esantion de 1000
de autoturisme pentru care a fost inregistrat pretul (mii euro). Datele cunoscute sunt:
x̄=28 , σ=4 . Pentru un risc asumat de 5%, se cere sa se testeze daca exista diferente
semnificative intre pretul mediu al lotului de autoturisme vandute in anul curent si pretul
mediu inregistrat anul trecut, de 30 mii euro.
2. Din totalul autoturismelor vandute intr-un an de o firma a fost extras un esantion de 1000
de autoturisme pentru care a fost inregistrat pretul (mii euro). Datele cunoscute sunt:
x̄=28 ,s'=4. Pentru un risc asumat de 5%, se cere sa se testeze daca exista diferente
semnificative intre pretul mediu al lotului de autoturisme vandute in anul curent si pretul
mediu inregistrat anul trecut, de 30 mii euro.
3. Din totalul autovehiculelor vandute intr-un an de o firma a fost extras un esantion de 150
autovehicule pentru care a fost inregistrat tipul acestora (autoturism sau motocicleta). La
nivelul eşantionului s-au inregistrat 30 de motociclete vândute. Pentru un risc asumat de 5%,
se cere sa se testeze daca exista diferente semnificative intre ponderea autoturismelor vandute
de firma si ponderea autoturismelor vandute de principalul competitor, de 75%.
4. Pentru o cercetare prin sondaj asupra opiniei consumatorilor unui produs se cunoaşte că
media de vârstă a consumatorilor din eşantion este de 38 de ani. Pentru un risc asumat de 5%
şi o valoare Sig. de 0,008 se cere să se verifice dacă există diferenţe semnificative de vârstă
intre consumatorii produsului si o valoare stabilită prin strategia de marketing, de 40 de ani.
Tema

1. Din totalul localitatilor României se extrage aleator repetat un eşantion de 50 localitati, care
au fost observate după castigul salarial net. La nivelul eşantionului s-a obţinut xi=100,
∑ ( xi− x̄ )2=8 . Se cere sa se verifice daca exista diferente semnificative intre castigul
salarial mediu al Romaniei si castigul salarial mediu al U.E., de 5 u.m.

2. Din totalul salariaţilor unei firme se extrage un eşantion de 23 de persoane. Salariaţii sunt
observaţi după educaţie (ani) si, pe baza datelor de eşantion, se obtine o valoare calculata a
testului de 10,58. Pentru un risc asumat de 5% se cere să se verifice dacă există diferenţe
semnificative de educaţie între firmă şi principalul concurent, cu un nivel medie de 13 ani de
şcoală.
Testarea diferentei dintre doua medii

1. Pentru două eşantioane extrase din două populaţii cu varianţe egale, se cunosc n1=n2=100,
x̄ 1=42 , x̄ 2 =37 , s '1=4 , s '2 =7 .
Pentru un risc asumat de 5%, se cere să se verifice dacă există diferenţe
semnificative între mediile celor două populaţii.

Interpretare: Pentru un risc asumat de 5%, exista diferente semnificative intre cele doua medii ale populatiilor.
2. Din totalul angajatilor unei firme am extras un esantion de angajati observati dupa vechimea in munca (luni) si
sexul angajatului (M, F). Datele obţinute la nivelul eşantioanelor sunt: nM=50, nF=100,
x̄ F =70 , x̄ M =30 , σ F=4 , σ M =4 . Pentru un risc asumat de 5%, se cere sa se testeze daca exista
diferente semnificative intre vechimea medie a angajatilor de sex ma sculin si vechimea medie a angajatilor de
sex feminin.

Interpretare: Pentru un risc asumat de 5%, exista diferente semnificative de vechime intre barbati si femei.
ANOVA

1. Un eşantion de 50 de consumatori de băuturi răcoritoare ale firmei Coca-Cola a fost observat după au
consumul înregistrat într-o lună. În urma observării a rezultat, pentru cele 5 mărci de băuturi răcoritoare, că ESS
= 5400 şi RSS = 1200. Considerând un risc de 5%, să se verifice dacă marca băuturii răcoritoare influenţează
semnificativ consumul.

n = 50
ESS = 5400
RSS = 1200
α = 0.05
k=5

1. Formularea ipotezelor
H0: μ1 = μ2 = ... = μ5 (Nu exista diferente semnificative intre mediile de consum pentru cele 5 marci, sau marca
nu influenteaza semnificativ consumul)

H1: Cel putin doua medii sunt diferite (exista diferente semnificative intre mediile de consum pentru cele 5
marci, sau marca influenteaza semnificativ consumul)

2. Alegerea testului: F

3. Valoarea teoretica a testului

Fteoretic = Fα, k-1, n-k= F0.05,4,45 = 2,606

4. Valoarea calculata a testului


ESS n−k 5400 45
F calculat = ⋅ = ⋅ =50 .62
RSS k−1 1200 4

5. Luarea deciziei

Fcalculat = 50.62 > Fteoretic = 2.606 : Se respinge H0

6. Interpretare

Pentru un risc asumat de 5%, exista diferente semnificative de consum in functie de marca, adica marca
influenteaza semnificativ consumul.

2. Din totalul angajatilor unei firme am extras un esantion de angajati observati dupa vechimea in munca (luni) si
pozitia ierarhica ocupata (functionar, middle management, top management). Datele sunt prezentate in tabelul de
mai jos. Pentru un risc asumat de 5%, se cere sa se testeze daca vechimea este influentata de pozitia ierarhica
(daca exista diferente semnificative de vechime in functie de pozitia ierarhica ocupata in firma).

ANOVA

Months since Hire


Grade de Estimatori ai
Variatia libertate variantei F Sig.
Intergrupe 6,227 2 3,114 ,031 ,970
Intragrupe 47872,068 471 101,639
Total 47878,295 473

ANOVA

Months since Hire


Sum of
Squares df Mean Square F Sig.
Between Groups 6,227 2 3,114 ,031 ,970
Within Groups 47872,068 471 101,639
Total 47878,295 473

k-1 = 2, deci k = 3

n-k = 471

n – 1 = 473, deci n = 474

ESS = 6.227
RSS = 47872.068

Fcalculat = 0.031
α = 0.05

1. Formularea ipotezelor
H0: μ1 = μ2 = μ3 (Nu exista diferente semnificative de vechime in functie de pozitia ierarhica ocupata in firma,
sau vechimea nu este influentata de pozitia ierarhica)

H1: Cel putin doua medii sunt diferite (Exista diferente semnificative de vechime in functie de pozitia ierarhica
ocupata in firma, sau vechimea este influentata de pozitia ierarhica)
2. Alegerea testului: F

3. Valoarea teoretica a testului

Fteoretic = Fα, k-1, n-k= F0.05,2,471 = 2,996

4. Valoarea calculata a testului

ESS n−k 6 . 227 471


F calculat = ⋅ = ⋅ =0. 031
RSS k−1 47872. 068 2

5. Luarea deciziei

Fcalculat = 0.031 < Fteoretic = 2.996 : Se accepta H0

Sig = 0.97 < α = 0.05: se accepta H0

6. Interpretare

Pentru o probabilitate de 95%, garantam ca nu exista diferente semnificative de vechime in functie de pozitia
ierarhica ocupata in firma, adica vechimea nu este influentata de pozitia ierarhica.

S-ar putea să vă placă și