Documente Academic
Documente Profesional
Documente Cultură
Pentru ţările U.E. a fost observata rata de creştere PIB (variabila X), pentru care se cunoaste
că X ~ N(3.2, 2.8).
Se cere să se calculeze si sa se interpreteze:
a. P(X>5)
b. P(X<2)
c. P(2.2 < X < 4.2)
d. P(1.5 < X < 2.5)
e. Să se calculeze P( <X< )
f. Să se calculeze P( 2 <X< 2 )
g. Să se calculeze P( 3 <X< 3 )
h. Ştiind că P(-zi<Z<zi)=0.682, să se afle valorile zi şi xi
i. Ştiind că P(-zi<Z<zi)=0.95, să se afle valorile zi şi xi
Rezolvare
Variabila X este normal distribuita, deci ne orientam spre o variabila teoretica cu aceeasi lege
de distributie, care sa ajute la suplinirea informatiilor lipsa din populatia reala, cea observata.
Pentru scopuri practice, de calcul rapid si facil al probabilitatilor, vom folosi valorile si
probabilitatile variabilei normale standard, Z, care are valorile zi si probabilitatile associate
acestora, φ(zi).
Variabila normală standard se obţine dintr-o variabilă normală generalizată prin procedeul de
standardizare:
X−μ
Z=
σ
Z ~ N(0, 1).
- Probabilitatea asociata fiecarei valori zi, adica φ(zi), se gaseste la intersectia liniei si a
coloanei care compun valoarea zi.
Proprietăţile funcţiei lui Laplace, Φ(z), necesare pentru a calcula orice tip de probabilitate,
sunt urmatoarele:
Φ(zi)=P(0<Z<zi)
Φ(0) = 0
Φ(-zi) = - Φ(zi)
1
P( Z < z i )= +φ ( z i )
2
1
P(Z>zi)=1-P(Z<zi)= ( zi )
2
Pentru exemplul nostru, X ~ N(3.2, 2.8), deci μ=3.2%, iar σ2=2.8, adica σ=1.67
A 1. P(X>5)
P(X>5)=P(Z>1.07)=0.5-φ(1.07)=0.5-0.3577 =0.1423
xi −μ
z i=
σ
P ( Z > z i ) =0 .5−φ ( z i )
zi=(5-3.2)/1.67=1.07
Exista 14.23% sanse ca o tara din UE sa aiba o rata de crestere a PIB-ului mai mare decat 5%.
Sau, alternativ: cel mai probabil, 14.23% din tarile din UE au rate de crestere a PIB-ului mai
mari de 5%.
B 2. P(X<2)
1
P( Z < z i )= +φ ( z i )
2
zi = (2-3.2)/1.67=-0.71
Exista 23.89% sanse ca o tara din UE sa aiba o rata de crestere a PIB-ului mai mica decat 2%.
C 3. P(2.2 < X < 4.2)=P(-0.59<Z<0.59)= φ(0.59)- φ(-0.59)= φ(0.59) + φ(0.59)=
= 2* φ(0.59)=2*0.2224=0.4448
P( z 1 <Z < z 2 )=Φ ( z2 )−Φ( z 1 )
z1 = (2.2-3.2)/1.67=-0.59
z2 = (4.2-3.2)/1.67=0.59
Exista 44.48% sanse ca o tara din UE sa aiba o rata de crestere a PIB-ului cuprinsa intre
2.2%-4.2%.
Cel mai probabil, 44.48% dintre tarile UE au rate cuprinse intre 2.2% si 4.2%.
z1 = (1.5-3.2)/1.67=-1.01
z2 = (2.5-3.2)/1.67=-0.41
Exista 18.47% sanse ca o tara din UE sa aiba o rata de crestere a PIB-ului cuprinsa intre
1.5%-2.5%.
68.26% dintre valori sunt situate la o abatere standard distanță de media lor.
95.44% dintre valori sunt situate la o doua abateri standard distanță de media lor.
99.74% dintre valori sunt situate la o trei abateri standard distanță de media lor.
Tema:
3. Se considera salariile a trei angajati la trei companii diferite. Primul salariat are salariul
(X1) de 1580 euro, iar salariul in compania sa este normal distribuit, cu media 2300 si
varianta 400. Al doilea salariat are salariul (X2) de 2500 de dolari, salariul fiind normal
distribuit cu media 3200 si varianta 324. Al treilea salariat (X3) are salariul de 180000 yen,
salariul fiind normal distribuit, cu media 320000 si varianta 37000.
Care este salariatul care este cel mai bine pozitionat ca salarizare in cadrul companiei sale?
Rezolvare
X1~N(2300, 400)
X2~N(3200, 324)
X3~N(320000, 37000)
1580−2300
z 1= =−36
20
2500−3200
z 2= =−38 .88
18
180000−320000
z 3= =−727 .83
192 . 35
Cea mai mare valoare a lui Z arata cea mai buna pozitionare. Ierarhia este: angajatul 1,
angajatul 2 si angajatul 3.
De exemplu, t0.025,7=2,365.
n2/n1 1 2 3 4 5
1 161,448 199,500 215,707 224,583 230,162
2 18,513 19,000 19,164 19,247 19,296
3 10,128 9,552 9,277 9,117 9,014
4 7,709 6,944 6,591 6,388 6,256
5 6,608 5,786 5,410 5,192 5,050
6 5,987 5,143 4,757 4,534 4,387
7 5,591 4,737 4,347 4,120 3,972
8 5,318 4,459 4,066 3,838 3,688
9 5,117 4,257 3,863 3,633 3,482
10 4,965 4,103 3,708 3,478 3,326
11 4,844 3,982 3,587 3,357 3,204
12 4,747 3,885 3,490 3,259 3,106
13 4,667 3,806 3,411 3,179 3,025
Pe prima linie se gasesc valorile df1, iar pe prima coloana valorile df2.
De exemplu, F0.05,2,5=5.786
k C Nn C240000
800
Proprietatile estimatorilor
^
M ( θ)=θ
2. Convergenta – cand creste volumul esantionului, se reduce varianta estimatorului
^
V ( θ)→0 , când n →N
3. Eficienta – estimatorul are varianta minima
^
V ( θ)=min .
Aplicatie
Un grup de studiu la Bazele Statisticii are șase studenți (N=6), cu vârstele: 18, 18, 19, 20, 20,
21. Vom construi distribuția de selecție a mediei de vârstă pentru eșantioane de 2 studenți (n =
2). Esantioanele vor fi extrase prin selectie aleatoare repetata.
Rezolvare
În primul rând, extragem toate cele k eșantioane de volum n = 2 și calculăm mediile de vârstă
pentru toate eșantioanele.
X: {2, 4, 6, 8}
σ σ
[ x̄ −z α /2
√n
, x̄ + z α / 2
√n ]
- daca nu se cunoaste varianta la nivelul unei populatii (σ2) – se foloseste variabila t
s' s'
x t /2, n 1 , x t /2, n 1
n n
Alta abordare:
Estimarea punctuala si prin interval de incredere (IC) a proportiei unei populatii
σπ σπ
[ p−z α / 2
√n
, p+ z α /2
√n ]
- când nu se cunoaşte varianţa variabilei alternative:
p (1 p ) p(1 p)
p t / 2,n 1 , p t / 2,n 1
n n
Aplicatii
1. Dintr-un lot de 1000 de piese se extrage un esantion de 5 piese, care se observa dupa
greutate. Datele inregistrate la nivelul esantionului sunt 9, 11, 9, 8, 13. Se cere să se estimeze
punctual şi prin interval de încredere greutatea medie a pieselor la nivelul lotului. Se
consideră un risc de 5%.
2. Din populaţia firmelor din Iaşi, de volum N=15000 se extrage aleator un eşantion de 100 de
firme, observate după numărul angajaţilor, şi se obţine că x̄ este 150, iar abaterea standard
la nivelul populatiei este 15. Să se estimeze prin interval de incredere numărul mediu de
angajaţi la nivelul firmelor din Iaşi, cu un risc de 5%.
3. Dintr-un lot de 1000 de piese se extrage aleator un eşantion de 50 de piese, care au fost
observate după calitate. În urma observării a rezultat un număr de 7 rebuturi. Se cere să se
estimeze prin interval de incredere proporţia rebuturilor la nivelul întregului lot, riscul asumat
fiind de 5%.
Tema
Descriptives
2 2
z α / 2⋅σ π
n= 2
Δπ
Unde Δ π este eroarea maximă admisibilă (marja de eroare), iar este abaterea standard a
variabilei alternative pentru care se estimează π.
În practică, se fixează probabilitatea sau nivelul de încredere, (1-α), cu care dorim să garantăm
rezultatul (de regulă, 0,95) şi eroarea maxim admisibilă Δ π (de exemplu, ±3% ). Având aceste date,
se poate calcula volumul eşantionului care estimează, cu un anumit nivel de încredere, parametrul π.
Parametrul σ2, care exprimă gradul de omogenitate al populaţiei, de regulă nu se cunoaşte, însă în
calculul volumului eşantionului se poate utiliza valoarea lui maximă, care este egală cu 0,25.
Aplicatii
1. Să se calculeze volumul eşantionului pentru o probabilitate de 0,95, o eroarea maxim admisibilă de
±3 % şi o varianţă de 0,25.
Tema
O serie de timp este o serie care prezintă valorile înregistrate de un fenomen Y în diferite
momente de timp, t=1,n.
Δ t/t−1= y t − y t−1
Poate fi calculat: yt
- cu baza fixă: i t/0 = ( x 100 )
y0
yt
- cu baza în lanţ: i t/t−1= ( x 100 )
y t−1
Daca it >1, atunci fenomenul a inregistrat o crestere in momenul t fata de alt moment
Daca 0< it <1, atunci fenomenul a inregistrat o scadere in momenul t fata de alt moment
Poate fi calculat:
t /0 y y0
- cu baza fixă: rt /0 ( x100) t ( x100) it /0 1 ( x100)
y0 y0
t / t 1 y yt 1
- cu baza în lanţ: rt / t 1 ( x100) t ( x100) it / t 1 1 ( x100)
yt 1 yt 1
Daca rt >0, atunci fenomenul a inregistrat o crestere in momenul t fata de alt moment
Daca rt <0, atunci fenomenul a inregistrat o scadere in momenul t fata de alt moment
Indicatori medii
- nivelul mediu
- sporul mediu
- rata medie de variaţie
- rata medie a sporului
Sporul mediu
Δ̄=
∑ Δt /t−1 = Δ n/1 = y n − y 1
n−1 n−1 n−1
yt yn
i=
√
n−1
Π
y t−1
=
√
n−1
y1
r=i−1(x100 )
- daca rata medie a sporului >0, atunci, in medie, fenomenul a inregistrat o crestere
- daca rata medie a sporului <0, atunci, in medie, fenomenul a inregistrat o scadere.
Aplicatii
I. Se consideră preţurile unui produs (lei), în perioada 2009-2012, prezentate în tabelul de mai
jos.
Se cere:
1. Să se calculeze şi să se interpreteze sporurile absolute:
a. cu bază fixa anul 2009
b. cu baza în lanţ
2. Să se calculeze şi să se interpreteze ratele de variaţie
a. cu bază fixa anul 2009
b. cu baza în lanţ
3. Să se calculeze şi să se interpreteze ratele sporului
a. cu baza fixă anul 2009
b. cu bază în lanţ
4. Sa se calculeze şi să se interpreteze nivelul mediu al pretului
5. Să se calculeze şi să se interpreteze sporul mediu
6. Să se calculeze şi să se interpreteze rata medie de variaţie
7. Să se calculeze şi să se interpreteze rata medie a sporului
Rezolvare
1. Sporurile absolute
- perioada de referinta = y0 = y2009 = 20
Anul Pretul t
Unitar Δt/0=yt-y0 Δt/t-1=yt-yt-1
(Y)
2009 20 1 Δ1/0 = y1 – y0 = 20-20=0 -
2010 22 2 Δ2/0 = y2 – y0 = 22-20=2 Δ2/1 = y2 – y1 = 22-20=2
2011 18 3 Δ3/0 = y3 – y0 = 18-20=-2 Δ3/2 = y3 – y2 = 18-22=-4
2012 51 4 Δ4/0 = y4 – y0 = 51-20=31 Δ4/3 = y4 – y3 = 51-18=33
Total 111 - 31
2. Ratele de variatie
- perioada de referinta = y0 = y2009 = 20
Anul Pretul t
Unitar it/0=yt/y0 it/t-1=yt/yt-1
(Y)
2009 20 1 i1/0 = y1 / y0 = 20/20=1 -
2010 22 2 i2/0 = y2 / y0 = 22/20=1.1 i2/1 = y2 / y1 = 22/20=1.1
2011 18 3 i3/0 = y3 / y0 = 18/20=0.9 i3/2 = y3 / y2 = 18/22=0.81
2012 51 4 i4/0 = y4 / y0 = 51/20=2.55 i4/3 = y4 / y3 = 51/18=2.83
Total 111
Extra:
i3/0 = 0.9: Pretul produsului in 2011 este la 90% din nivelul de pret din 2009.
3. Ratele sporului
- perioada de referinta = y0 = y2009 = 20
Anul Pretul t
Unitar rt/0=(it/0-1)*100 rt/t-1=(it/t-1-1)*100
(Y)
2009 20 1 r1/0 = (i1/0-1)*100=(1-1)*100=0 -
2010 22 2 r2/0 = (i2/0-1)*100=(1.1-1)*100=10 r2/1 = (i2/1-1)*100=(1.1-1)*100=10
2011 18 3 r3/0 = (i3/0-1)*100=(0.9-1)*100=-10 r3/2 = (i3/2-1)*100=(0.81-1)*100=-19
2012 51 4 r4/0 = (i4/0-1)*100=(2.55-1)*100=155 r4/3 = (i4/3-1)*100=(2.83-1)*100=183
Total 111
Extra:
r3/0 = -10: Pretul produsului a scazut in 2011 cu 10% fata de pretul din 2009.
ȳ=
∑ y t =111 =27 . 75 lei
n 4
5. Sporul mediu
Δn/1 y n − y 1 51−20
Δ̄= = = =10 . 33 lei
n−1 n−1 3
Δ̄=
∑ Δt /t−1 =31 =10 . 33 lei
n−1 3
yn
ī =
√ √
n−1
y1
=
3 51
20
=1 . 36
In concluzie:
II. Se considera valorile PIB in preturi curente (mil. Euro), pentru perioada 2006-2010. Se
cere sa se calculeze si interpreteze rata de crestere PIB.
c) Alegerea pragului de semnificaţie şi citirea din tabel a valorii critice a statisticii test
x̄−μ0 x̄−μ0
z calculat = t calculat =
σ / √n s '/ √n
Testarea ipotezelor asupra proporţiei
Demersul testării:
a) Formularea ipotezelor statistice
H 0 : π =π 0
H 1 : π ≠π 0
b) Alegerea pragului de semnificaţie
c) Testul statistic
p−π 0
t calculat =
√ p(1−p )/ √ n
c) Regula de decizie
d) Decizie si interpretare
Ipoteze statistice
H 0 : μ1 −μ2 =0
H 1 : μ1 −μ2 ≠0
Statistica test:
- daca se cunoaste σ12 si σ22, se foloseste testul Z
1
+
n
2
σ ' p=
√ n1 +n 2−2
f) Decizie si interpretare
V T =V E +V R
TSS=ESS+RSS
1. Ipoteze statistice:
H 0 : μ1 =μ2 =…=μ k
ESS n−k
F calculat = ⋅
RSS k−1
5. Regula de decizie
6. Decizia si interpretarea
APLICATII
1. Din totalul autoturismelor vandute intr-un an de o firma a fost extras un esantion de 1000
de autoturisme pentru care a fost inregistrat pretul (mii euro). Datele cunoscute sunt:
x̄=28 , σ=4 . Pentru un risc asumat de 5%, se cere sa se testeze daca exista diferente
semnificative intre pretul mediu al lotului de autoturisme vandute in anul curent si pretul
mediu inregistrat anul trecut, de 30 mii euro.
2. Din totalul autoturismelor vandute intr-un an de o firma a fost extras un esantion de 1000
de autoturisme pentru care a fost inregistrat pretul (mii euro). Datele cunoscute sunt:
x̄=28 ,s'=4. Pentru un risc asumat de 5%, se cere sa se testeze daca exista diferente
semnificative intre pretul mediu al lotului de autoturisme vandute in anul curent si pretul
mediu inregistrat anul trecut, de 30 mii euro.
3. Din totalul autovehiculelor vandute intr-un an de o firma a fost extras un esantion de 150
autovehicule pentru care a fost inregistrat tipul acestora (autoturism sau motocicleta). La
nivelul eşantionului s-au inregistrat 30 de motociclete vândute. Pentru un risc asumat de 5%,
se cere sa se testeze daca exista diferente semnificative intre ponderea autoturismelor vandute
de firma si ponderea autoturismelor vandute de principalul competitor, de 75%.
4. Pentru o cercetare prin sondaj asupra opiniei consumatorilor unui produs se cunoaşte că
media de vârstă a consumatorilor din eşantion este de 38 de ani. Pentru un risc asumat de 5%
şi o valoare Sig. de 0,008 se cere să se verifice dacă există diferenţe semnificative de vârstă
intre consumatorii produsului si o valoare stabilită prin strategia de marketing, de 40 de ani.
Tema
1. Din totalul localitatilor României se extrage aleator repetat un eşantion de 50 localitati, care
au fost observate după castigul salarial net. La nivelul eşantionului s-a obţinut xi=100,
∑ ( xi− x̄ )2=8 . Se cere sa se verifice daca exista diferente semnificative intre castigul
salarial mediu al Romaniei si castigul salarial mediu al U.E., de 5 u.m.
2. Din totalul salariaţilor unei firme se extrage un eşantion de 23 de persoane. Salariaţii sunt
observaţi după educaţie (ani) si, pe baza datelor de eşantion, se obtine o valoare calculata a
testului de 10,58. Pentru un risc asumat de 5% se cere să se verifice dacă există diferenţe
semnificative de educaţie între firmă şi principalul concurent, cu un nivel medie de 13 ani de
şcoală.
Testarea diferentei dintre doua medii
1. Pentru două eşantioane extrase din două populaţii cu varianţe egale, se cunosc n1=n2=100,
x̄ 1=42 , x̄ 2 =37 , s '1=4 , s '2 =7 .
Pentru un risc asumat de 5%, se cere să se verifice dacă există diferenţe
semnificative între mediile celor două populaţii.
Interpretare: Pentru un risc asumat de 5%, exista diferente semnificative intre cele doua medii ale populatiilor.
2. Din totalul angajatilor unei firme am extras un esantion de angajati observati dupa vechimea in munca (luni) si
sexul angajatului (M, F). Datele obţinute la nivelul eşantioanelor sunt: nM=50, nF=100,
x̄ F =70 , x̄ M =30 , σ F=4 , σ M =4 . Pentru un risc asumat de 5%, se cere sa se testeze daca exista
diferente semnificative intre vechimea medie a angajatilor de sex ma sculin si vechimea medie a angajatilor de
sex feminin.
Interpretare: Pentru un risc asumat de 5%, exista diferente semnificative de vechime intre barbati si femei.
ANOVA
1. Un eşantion de 50 de consumatori de băuturi răcoritoare ale firmei Coca-Cola a fost observat după au
consumul înregistrat într-o lună. În urma observării a rezultat, pentru cele 5 mărci de băuturi răcoritoare, că ESS
= 5400 şi RSS = 1200. Considerând un risc de 5%, să se verifice dacă marca băuturii răcoritoare influenţează
semnificativ consumul.
n = 50
ESS = 5400
RSS = 1200
α = 0.05
k=5
1. Formularea ipotezelor
H0: μ1 = μ2 = ... = μ5 (Nu exista diferente semnificative intre mediile de consum pentru cele 5 marci, sau marca
nu influenteaza semnificativ consumul)
H1: Cel putin doua medii sunt diferite (exista diferente semnificative intre mediile de consum pentru cele 5
marci, sau marca influenteaza semnificativ consumul)
2. Alegerea testului: F
5. Luarea deciziei
6. Interpretare
Pentru un risc asumat de 5%, exista diferente semnificative de consum in functie de marca, adica marca
influenteaza semnificativ consumul.
2. Din totalul angajatilor unei firme am extras un esantion de angajati observati dupa vechimea in munca (luni) si
pozitia ierarhica ocupata (functionar, middle management, top management). Datele sunt prezentate in tabelul de
mai jos. Pentru un risc asumat de 5%, se cere sa se testeze daca vechimea este influentata de pozitia ierarhica
(daca exista diferente semnificative de vechime in functie de pozitia ierarhica ocupata in firma).
ANOVA
ANOVA
k-1 = 2, deci k = 3
n-k = 471
ESS = 6.227
RSS = 47872.068
Fcalculat = 0.031
α = 0.05
1. Formularea ipotezelor
H0: μ1 = μ2 = μ3 (Nu exista diferente semnificative de vechime in functie de pozitia ierarhica ocupata in firma,
sau vechimea nu este influentata de pozitia ierarhica)
H1: Cel putin doua medii sunt diferite (Exista diferente semnificative de vechime in functie de pozitia ierarhica
ocupata in firma, sau vechimea este influentata de pozitia ierarhica)
2. Alegerea testului: F
5. Luarea deciziei
6. Interpretare
Pentru o probabilitate de 95%, garantam ca nu exista diferente semnificative de vechime in functie de pozitia
ierarhica ocupata in firma, adica vechimea nu este influentata de pozitia ierarhica.