Documente Academic
Documente Profesional
Documente Cultură
1
M. Popa – Aplicaţii SPSS (Regresia liniară simplă)
Cornelia Nistor, Elemente de statistică, Ed. Cartea Universitară, Bucureşti, 2005.
Dorin Jula, Introducere în econometrie, Ed. PROFESSIONAL CONSULTING, Bucureşti, 2003
Suport curs metodologia cercetarii –Purica I
REGRESIA LINIARA
lineara
nelineara
sinusoidala
În definirea funcţiei de regresie liniară sunt considerate, cel mai frecvent, patru ipoteze:
seriile de date nu sunt afectate de erori de înregistrare.
pentru fiecare valoare fixată a caracteristicii factoriale, variabila reziduală
este de medie zero,
2
M. Popa – Aplicaţii SPSS (Regresia liniară simplă)
Cornelia Nistor, Elemente de statistică, Ed. Cartea Universitară, Bucureşti, 2005.
Dorin Jula, Introducere în econometrie, Ed. PROFESSIONAL CONSULTING, Bucureşti, 2003
Suport curs metodologia cercetarii –Purica I
lipsa corelării reziduurilor exprimă faptul că între termenii reziduali nu se
manifestă fenomenul de covarianţă
ipoteza necorelării variabilei reziduale cu cea independentă,
STUDIU DE CAZ
In vederea rezolvarii problemei propuse in studiul de caz ecuatiile au fost generate cu
ajutorul programului informatics Microsoft Mathematics, iar analiza statistica prin
intermediul programului Excel.
Pentru exemplificarea notiunilor teoretice susmentionate,in tabelul următor avem date
referitoare la 15 agenţi de asigurări angajaţi ai unei companii de asigurări de viaţă ( timpul
mediu, în minute), petrecut de un agent cu un potenţial client ( numărul de poliţe încheiate
într-o săptămână).
Dacă X reprezintă timpul mediu, iar Y reprezintă numărul de poliţe, avem urmatoarele date
astfel:
Tabel 1.1.
X Y
Nr.crt
Timp mediu(min) Polite incheiate(nr)
1 25 10
2 23 11
3 30 14
4 25 12
5 20 8
6 33 18
7 18 9
8 21 10
9 22 10
10 30 15
11 26 11
12 26 15
13 27 12
14 29 14
15 20 11
Se urmareste sa se afle :
a) Estimarea parametrilor modelului liniar de regresie
b) Semnificaţia parametrilor modelului pentru un prag de semnificaţie = 5%;
c) Determinarea erorile reziduale;
3
M. Popa – Aplicaţii SPSS (Regresia liniară simplă)
Cornelia Nistor, Elemente de statistică, Ed. Cartea Universitară, Bucureşti, 2005.
Dorin Jula, Introducere în econometrie, Ed. PROFESSIONAL CONSULTING, Bucureşti, 2003
Suport curs metodologia cercetarii –Purica I
d) Verificarea validitatii modelului de regresie pentru un nivel de semnificaţie = 5%;
e) Măsurarea intensitatii legăturii dintre cele două variabile folosind un indicator adecvat şi
testaţi semnificaţia acestuia pentru un nivel de încredere de 0,5%;
f) Efectuarea unei previzionari punctuale şi pe interval de încredere a numărului de poliţe
încheiate de un agent care petrece în medie 24 de minute cu un potenţial client.
Rezolvare:
Tabel 1.2
220
200
180
160
140
120
100
80
60
40
20
0
0 10 20 30 40 50 60 70 80
1 cm OY = 5 poliţe;1 cm OX = 2 minute
^y i=a0 +a1 x i
Parametrii a şi b se vor determina cu ajutorul metodei celor mai mici pătrate:
n n
∑ ( y i− ^y i )
i
2
min ⇔ ∑ ( y i −a0−a1 xi )
i
2
min ⇔ { na0 +a1 ∑ x i =∑ y i
n
i=1
n
i=1
n
a0 ∑ x i +a 1 ∑ x2i =∑ x i y i
i =1 i=1 i =1 n=15
4
M. Popa – Aplicaţii SPSS (Regresia liniară simplă)
Cornelia Nistor, Elemente de statistică, Ed. Cartea Universitară, Bucureşti, 2005.
Dorin Jula, Introducere în econometrie, Ed. PROFESSIONAL CONSULTING, Bucureşti, 2003
Suport curs metodologia cercetarii –Purica I
Pentru a rezolva sistemul vom folosi următorul tabel în care sunt prezentate valorile
intermediare conform tabelului 1.3:
Tabelul 1.2.
xi yi 2
xi yi 2
xi
yi
2
( yi− y ) 2
( x i−x )
25 10 625 250 100 4 0
23 11 529 253 121 1 4
30 14 900 420 196 4 25
25 12 625 300 144 0 0
20 8 400 160 64 16 25
33 18 1089 594 324 36 64
18 9 324 162 81 9 49
21 10 441 210 100 4 16
22 10 484 220 100 4 9
30 15 900 450 225 9 25
26 11 676 286 121 1 1
26 15 676 390 225 9 1
27 12 729 324 144 0 4
29 14 841 406 196 4 16
20 11 400 220 121 1 25
∑ xi
=37 ∑ x 2i = ∑ x i y i= ∑ y2i =
5 ∑ yi =180 9639 4645 2262 102 264
Astfel:
y i=α 0 +α 1 x i +u i
iar la nivelul eşantionului este:
y i=a0 + a1 x i +ui
Testarea semnificaţiei parametrului 1:
H0 : 1 = 0
deoarece n = 15 30 avem eşantion de volum redus şi pentru testare vom utiliza testul t:
a1 −α 1 a1−0 a1 0 ,5492
t= = = = =6,8
sa sa sa 0 , 08
1 1 1
2 s 2u 1 , 7199
sa = 2
= =0 , 0064
i
∑ ( x i−x ) 264
i
∑ ( y i− ^yi )2
i 22 , 35
s 2u = = = 1, 7199
n−k −1 15−2
k – reprezintă numărul variabilelor factoriale (în cazul modelului unifactorial k = 1).
15
∑ xi
i=1 375
x= = =25
15 15
a0 −α 1 a0 −0 a −1 ,73
t= = = 0 = =−0 , 84
s a0 sa0 s a0 2 , 096
1 x2 1 25
0
2
s a =s + 2
u
n ∑ ( x i− x ) 2
[
=1 , 71 +
15 264
i
=4 , 186
] [ ]
t calc=−0 ,84 >−t α /2; n−2 =−1 , 35 se acceptă ipoteza nulă, adică parametrul a 0 nu
este semnificativ statistic.
6
M. Popa – Aplicaţii SPSS (Regresia liniară simplă)
Cornelia Nistor, Elemente de statistică, Ed. Cartea Universitară, Bucureşti, 2005.
Dorin Jula, Introducere în econometrie, Ed. PROFESSIONAL CONSULTING, Bucureşti, 2003
Suport curs metodologia cercetarii –Purica I
c) Erorile reziduale sunt ui = y i− ^y i şi sunt prezentate în tabelul de mai jos:
3) se calculează testul F:
2
sx 79 , 64
F= = = 46 , 3
s2
u
1 , 71
∑ ( ^y i − y )2
i 79 ,64
s 2x= = =79 , 64
k 1
∑ ( y i− ^yi )2
i 22 , 35
s 2u = = = 1, 71
n−k −1 15−2
15
∑ yi
i =1 180
y= = =12
15 15
n ∑ x i y i −∑ x i⋅∑ y i
r= =
2 2
√[ n ∑ x2
i− ( ∑ xi) ][ n ∑ y2
i −(∑ yi) ]
15⋅4645 −375⋅180
= =0 , 88 → 1 >0
√ [ 15⋅9639−375 2 ] [ 15⋅2262−1802 ]
Rezultă că între cele două variabile există o legătură directă foarte puternică.
7
M. Popa – Aplicaţii SPSS (Regresia liniară simplă)
Cornelia Nistor, Elemente de statistică, Ed. Cartea Universitară, Bucureşti, 2005.
Dorin Jula, Introducere în econometrie, Ed. PROFESSIONAL CONSULTING, Bucureşti, 2003
Suport curs metodologia cercetarii –Purica I
- se stabileşte ipoteza nulă: H0: nu este semnificativ statistic;
- se calculează testul t:
r r √ n−2 0 , 88⋅√ 13
t= = = =6 ,75
sr √ 1− r 2
√ 1−0 , 88 2
R=
√ ∑ ( ^y i − y )2
i= 1
n
∑ ( yi− y )
i= 1
2
= 0 , 88
Deoarece R = r = 0,88, apreciem că există o legătură liniară, puternică şi directă între cele două
variabile.
Cum:
8
M. Popa – Aplicaţii SPSS (Regresia liniară simplă)
Cornelia Nistor, Elemente de statistică, Ed. Cartea Universitară, Bucureşti, 2005.
Dorin Jula, Introducere în econometrie, Ed. PROFESSIONAL CONSULTING, Bucureşti, 2003
Suport curs metodologia cercetarii –Purica I
2 2
1 ( x n+ 1−x )
2
n+1
2
s ^y =su 1+ +
[
n ∑ ( xi −x )2
1 (24−25)
=1,71 1+ +
15
i
264
=1,82
] [ ]
s ^y =1 , 35
n+1
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.883621
R Square 0.780786
Adjusted R 0.763923
Square
Observations 15.000000
ANOVA
df SS MS F Significance F
9
M. Popa – Aplicaţii SPSS (Regresia liniară simplă)
Cornelia Nistor, Elemente de statistică, Ed. Cartea Universitară, Bucureşti, 2005.
Dorin Jula, Introducere în econometrie, Ed. PROFESSIONAL CONSULTING, Bucureşti, 2003
Suport curs metodologia cercetarii –Purica I
RESIDUAL OUTPUT
SUMMARY OUTPUT
Regression Statistics
n n
Multiple R
Raportul de corelatie (R)
R Square
0.883621 Ry , x =
√ √
Δ2y /x
∑ ( y^ i − ȳ )2
i=1
n
∑ ( y i −ȳ )2
i=1
Δ 2e
= 1−
n
∑ ( y i− y^ i )2
i=1
n
∑ ( y i −ȳ )2
i=1
∑ ( ^y i− y ) 2
i=1
Coeficientul (gradul ) de 0.780786 R2 = =1− =
Δ2y Δ2y n
determinaţie ∑ ( y i− y ) 2
i=1
Adjusted R Square
Valoarea ajustată a
0.763923
coeficientului de Δ 2u /n−k−1
R2 =1− 2
determinaţie Δ y /n−1
10
M. Popa – Aplicaţii SPSS (Regresia liniară simplă)
Cornelia Nistor, Elemente de statistică, Ed. Cartea Universitară, Bucureşti, 2005.
Dorin Jula, Introducere în econometrie, Ed. PROFESSIONAL CONSULTING, Bucureşti, 2003
Suport curs metodologia cercetarii –Purica I
Standard Error n
15
Numărul observaţiilor (n)
Tabel 2.
ANOVA
df MS =SS/df
Sursa SS (varianţa)
(grade de (media pătratelor) F Significance F
variaţiei (suma pătratelor)
libertate) (dispersia corectată)
Regression
Testul
(variaţia n Δ 2x 0.000013< 0.05
s 2x= F=46.302727
1 (k) Δ 2x = ∑ ( y^ i − y ) 2
k =
datorată SSR= i=1 = 2 2 (resping H0 –
regresiei) 79.640152 79.640152 F=
sx /
su model valid)
Residual n Δ 2u
s 2u =
13 (n-k-1) Δ 2u=∑ ( y i− ^y i )2 n−k −1 =
(variaţia SSE= i=1 =
reziduală) 22.359848 1.719988
n
Δ 2y =∑ ( y i − y )2
SST= i=1 = Δ 2y
14 (n-1) s 2y =
102.000000 n−1
Total (variaţia
totală) SST=SSR + SSE
Tabel 3
Standard
Error
Coefficients Lower
(Abaterea t Stat P-value Upper 95%
(Coeficienţi) 95%
medie
patratică)
Limita inf.
a Limita sup.
a
intervalul
ui de intervalului
încredere de încredere
Intercept
sa ta 0.412843
=
(termenul a0= -1.731061 -6.151434 2.689313
0 0
11
M. Popa – Aplicaţii SPSS (Regresia liniară simplă)
Cornelia Nistor, Elemente de statistică, Ed. Cartea Universitară, Bucureşti, 2005.
Dorin Jula, Introducere în econometrie, Ed. PROFESSIONAL CONSULTING, Bucureşti, 2003
Suport curs metodologia cercetarii –Purica I
Timpul sa t a1 =
0.000013
a1 = 0.549242 1 0.374866 0.723619
mediu =0.080716 6.804611 < 0,05
Tabel 4.
RESIDUAL OUTPUT
Predicted
^y i Residuals
Observatio
n y i− ^yi
Numărul de poliţe
1 338.5796 -14.9986
2 371.2542 -27.5722
3 376.1748 -0.9108
4 332.8525 18.3895
5 311.8281 16.5889
6 310.6962 7.3728
7 325.9235 5.0355
8 287.8659 -20.6299
9 310.9763 9.9067
10 382.3073 27.2277
11 336.2188 -19.9568
12 369.2938 -17.4878
13 338.7504 -5.0954
14 367.2528 5.4262
15 346.0917 16.7043
12
M. Popa – Aplicaţii SPSS (Regresia liniară simplă)
Cornelia Nistor, Elemente de statistică, Ed. Cartea Universitară, Bucureşti, 2005.
Dorin Jula, Introducere în econometrie, Ed. PROFESSIONAL CONSULTING, Bucureşti, 2003
Suport curs metodologia cercetarii –Purica I
În acest tabel este calculat testul F pentru validarea modelului de regresie. Întrucât
F=46.302727, iar Significance F (pragul de semnificatie) este 0.000013 (valoare mai mica de 0.05)
atunci modelul de regresie construit este valid şi poate fi utilizat pentru analiza dependenţei dintre
cele două variabile.
Intercept este termenul liber, deci coeficientul a0 este -1.731061. Termenul liber este punctul
în care variabila explicativă (factorială) este 0. Deci numărul de poliţe încheiate, dacă timpul
ta
petrecut este 0. Deoarece 0 = -0.846021iar pragul de semnificaţie P-value este
0.412843>0,05 înseamnă că acest coeficient este nesemnificativ. De altfel faptul că limita
inferioară a intervalului de încredere (-6.151434 ¿ α 0≤ 2.689313) pentru
acest parametru este negativă, iar limita superioară este pozitivă arată că parametrul din
colectivitatea generală este aproximativ zero.
Coeficientul a1 este 0.549242, ceea ce însemnă că la creşterea timpului petrecut cu un minut,
13
M. Popa – Aplicaţii SPSS (Regresia liniară simplă)
Cornelia Nistor, Elemente de statistică, Ed. Cartea Universitară, Bucureşti, 2005.
Dorin Jula, Introducere în econometrie, Ed. PROFESSIONAL CONSULTING, Bucureşti, 2003
Suport curs metodologia cercetarii –Purica I