Documente Academic
Documente Profesional
Documente Cultură
CURS 2
Regresia liniară simplă (RLS)
1. Modelul RLS
2. Estimarea punctuală a parametrilor modelului RLS
3. Estimarea prin interval de încredere a parametrilor modelului
RLS
4. Probleme specifice utilizând Excel şi SPSS
5. Estimarea indicatorilor de corelaţie (coeficientul de corelaţie,
raportul de corelaţie, raportul de determinaţie)
2
1. Modelul de regresie simplă liniară
Interpretarea geometrică şi statistică a regresiei
Exemplu
•Se consideră repartiţia a 50 de firme după profitul realizat (Y,
variabilă dependentă, sute mil. lei) şi cheltuielile cu publicitatea (X,
variabilă independentă, mil. lei).
YX 0 1 X
6
1. Modelul de regresie simplă liniară
7
1. Modelul de regresie simplă liniară
Deci:
yi = β0+ β1xi + εi
8
1. Modelul RLS
Componentele modelului RLS sunt:
9
1. Modelul de regresie simplă liniară
Parametrii modelului de regresie liniară simplă
Y
0
1
0 X
Linia de regresie sau media condiţionată
1. Modelul de regresie simplă liniară
Parametrii modelului de regresie liniară simplă
o reprezintă constanta sau termenul liber al modelului şi reprezintă
valoarea medie a variabilei Y atunci când X=0.
M(Y|X=0) =
Grafic, parametrul reprezintă ordonata la origine sau intersecţia
dreptei de regresie liniară cu axa OY (engl. intercept).
Daca
Grafic, parametrul reprezintă tangenta unghiului format dintre dreapta
de regresie şi axa OX sau panta dreptei de regresie (engl. slope).
1. Modelul de regresie simplă liniară
Dacă β1>0 => ceea ce indică o legătură directă sau pozitivă între variabilele
X şi Y (de exemplu, dacă X creşte cu o unitate, Y creşte, în medie, cu β1 unităţi);
Dacă β1<0 => există o legătură inversă între variabilele Y şi X între variabile
există o legătură inversă (de exemplu, la o creştere a lui X cu o unitate, Y scade,
în medie, cu β1 unităţi);
12
1. Modelul de regresie simplă liniară
unde:
- yˆ i ˆ0 ˆ1 xi este estimatorul mediei condiţionate M(Y│X=xi);
- ̂ 0 este estimatorul parametrului 0
- ˆ este estimatorul parametrului 1
1
- este estimatorul erorii stohastice εi
i
Pentru un eşantion observat, modelul de regresie liniară simplă poate fi
scris:
yi b0 b1 xi ei
13
2. Estimarea punctulă a parametrilor
modelului RLS
Estimarea parametrilor modelului de regresie liniară
simplă
•Estimarea reprezintă procedeul de aflare a unui parametru al unei
populaţii ( o , 1 ) pe baza datelor înregistrate la nivelul unui
eşantion.
n n n n
n n n
S
ˆ
2 yi ˆ0 ˆ1 xi 1 0 nˆ0 ˆ1 x y i i
i 1
0
i 1 i 1
n n n n
S
2 y i ˆ0 ˆ1 xi xi 0 ˆ0 xi ˆ1 xi2 yx i i
1 i 1 i 1 i 1 i 1
ˆ
y x x x y
i
2
i i
;
i i
ˆ1
n x y x y ;
i i i i ˆ0 y ˆ1 x
n x x n x x
0 2 2
2 2
i i i i
sau
n
3. Estimarea prin interval de încredere a
parametrilor modelului RLS
Proprietăţile estimatorilor paramerilor modelului de
regresie
•Estimatorii parametrilor modelului de regresie sunt variabile de
selecţie care:
-urmează o repartiţie normală: 0
ˆ0 ~ N 0 , 2ˆ ˆ1 ~ N 1 , 2ˆ1
-sunt nedeplasaţi: M ˆ
M ˆ0 , 0 1 1
unde
k = numărul parametrilor estimaţi în model (pentru modelul liniar k=2),
n = volumul eşantionului pe baza căruia se fac estimările.
3. Estimarea prin interval de încredere a
parametrilor modelului RLS
2 1 x 2
2 1 x 2
ˆ ˆ 2ˆ , respectiv sˆ sˆ s
2
2
0 0
n
ix x 2
0 0
n xi x
i i
ˆ 2 s2
ˆ ˆ 2ˆ
1 n
s
, respectiv 1ˆ s 2
ˆ1
n
( x x) ( x x)
1
2 2
i i
i 1 i 1
Funcţia de consum
-consumul populaţiei în funcţie de venit:
Legea cererii
-cererea în funcţie de preţul produselor:
Ci 0 1 Pi i , unde parametrul 1
arată cu cât scade cererea la o creştere a preţului cu o unitate.
este de regulă negativ şi
22
4. Probleme specifice utilizând Excel si
SPSS
xi yi
10 800
12 1000
12 1200
14 1600
16 1800
23
Estimatiile punctuale ale parametrilor
24
1. Tabelul coeficientilor de regresie
Rezultate Excel
Rezultate SPSS
25
Estimatiile punctuale ale parametrilor
; ;
28
In estimarea prin IC a pantei dreptei se foloseşte
statistica t Student.
IC 95% este:
;
;
= t0,025;3=3,182.
29
Valorile distribuţiei Student
19 2,093
∞ 1,96
30
IC devine:
; ;
32
In estimarea prin IC a ordonatei la origine se
foloseşte statistica t Student.
IC 95% este:
; = t0,025;3=3,182.
33
IC devine:
Rezultate Excel
Rezultate SPSS
35
1. Tabelul coeficientilor de regresie
36
5. Estimarea indicatorilor de corelaţie
Coeficientul de corelaţie (se foloseşte doar pentru modelul liniar):
N
cov( X , Y )
(x i x )( yi y )
( X ,Y ) i 1 , -1≤ ρ ≤+1
x y N x y
n n n n
( x x)( y y )
i i n xi yi xi yi
̂ ( X , Y ) r i 1
i 1 i 1 i 1
nsx s y n n n n
[n x ( xi ) ][n y ( yi ) 2 ]
2
i
2 2
i
i 1 i 1 i 1 i 1
38
2. Tabelul coeficientilor de corelatie
Rezultate SPSS
0,973
39
5. Estimarea indicatorilor de corelaţie
Descompunerea variaţiei totale a variabilei Y
Descompunerea variaţiei totale a variabilei Y
41
5. Estimarea indicatorilor de corelaţie
VT = (y
i
i - y )2 , reprezintă variaţia totală (Total Sum of Squares);
VT = VE VR
(TSS = ESS + RSS)
Descompunerea variaţiei totale a variabilei Y
RSS 43
RSS = 36923,077
Descompunerea variaţiei totale a variabilei Y
Rezultate Excel
ANOVA
df SS MS F Significance F
Regression 1 651076,9231 651076,923 52,9 0,005364071
Residual 3 36923,07692 12307,6923
Total 4 688000
Rezultate SPSS
( yˆ i y)2
VE V
2
i
1 R , cu 0 ≤ η2 ≤1
(y
i
i y)2 VT VT
0 1
(b b x y ) 2
ESS RSS
R 2= i
1
(y
i
i y)2 TSS TSS
(b b x y )
0 1
2
ESS RSS
R i
= 1
(y y)
i
i
2
TSS TSS
48
Estimaţia raportului de corelaţie:
49
4. Tabelul indicatorilor de corelatie
Rezultate Excel
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,973
R Square 0,946
Adjusted R Square 0,928
Standard Error 110,940
Observations 5,000
Rezultate SPSS
50
2. Se consideră datele cu privire la Valoarea vânzărilor (sute mii
euro), Y, şi Cheltuielile cu publicitatea (sute euro), X, pentru un
eşantion de 4 firme. Datele sunt prezentate în tabelul următor.
xi yi
10 2500
20 4100
50 5000
100 7500
51
Model Summary
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound
1 (Constant) -45.163 15.015 -3.008 .095 -109.766 19.439
chelt_publicitate .019 .003 .977 6.422 .023 .006 .032
a. Dependent Variable: Val_vanzari
Correlations
vanzari chelt_publ
vanzari Pearson Correlation 1 .977*
Sig. (2-tailed) .023
N 4 4
chelt_publ Pearson Correlation .977* 1
Sig. (2-tailed) .023
N 4 4
*. Correlation is significant at the 0.05 level (2-tailed).
52
1. Tabelul coeficientilor de regresie
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound
1 (Constant) -45.163 15.015 -3.008 .095 -109.766 19.439
chelt_publicitate .019 .003 .977 6.422 .023 .006 .032
a. Dependent Variable: Val_vanzari
53
Estimarea prin IC a pantei dreptei:
; ;
54
In estimarea prin IC a pantei dreptei se foloseşte
statistica t Student.
IC 95% este:
; = t0,025;2=4,303.
55
Valorile distribuţiei Student
19 2,093
∞ 1,96
56
IC devine:
CURSUL 3
Iaşi
- 2021 -
CURS 3 - REGRESIA LINIARĂ SIMPLĂ
3.1. Testarea parametrilor de regresie
3.2. Testarea modelului de regresie
3.3. Testarea indicatorilor de corelaţie
2
3. Modelul de regresie liniară simplă
3.1. Testarea parametrilor modelului de regresie
1. Formularea ipotezelor:
H 0 : 0 0 H 0 : 1 0
H1 : 0 0 H1 : 1 0
2. Alegerea pragului de semnificaţie: α=0.05
3. Alegerea statisticii test:
ˆ0 0 H 0 ˆ0 ˆ1 1 H 0 ˆ1
t ~ t (n 2) t ~ t (n 2)
ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ
0 0 1 1
6. Regula de decizie:
- dacă | t calc | tteoretic , nu se respinge ipoteza H 0 cu o probabilitate 1- α
- , se respinge ipoteza cu un risc asumat α
4
3. Modelul de regresie liniară simplă
3.1. Testarea parametrilor modelului de regresie
6. Regula de decizie:
-
Se compara p-value (Sig.) si α
Sig. H 0
Sig.
5
3. Modelul de regresie liniară simplă
3.1. Testarea parametrilor modelului de regresie
6. Regula de decizie:
- dacă | t calc | tteoretic , se respinge ipoteza H 0 cu un risc asumat α
6
3. Modelul de regresie liniară simplă
3.1. Testarea parametrilor modelului de regresie
6. Regula de decizie:
-
Se compara p-value (Sig.) si α
Sig. H1
Sig.
7
3. Modelul de regresie liniară simplă
Probleme specifice utilizând Excel
Aplicaţia (1)
xi yi
10 800
12 1000
12 1200
14 1600
16 1800
64 6400
8
Rezultate Excel
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,973
R Square 0,946
Adjusted R Square 0,928
Standard Error 110,940
Observations 5,000
ANOVA
df SS MS F Significance F
Regression 1 651076,9231 651076,9231 52,9 0,005364071
Residual 3 36923,07692 12307,69231
Total 4 688000
1. Formularea ipotezelor:
H 0 : 1 0
H1 : 1 0
2. Alegerea pragului de semnificaţie: α=0.05
3. Alegerea statisticii test: testul Student
; = t0,025;3=3,182.
10
Valorile distribuţiei Student
19 2,093
∞ 1,96
11
3. Modelul de regresie liniară simplă
Testarea semnificatiei pantei dreptei
𝑏 176,92
𝑡 = = = 7,27
𝑠 24,325
12
3. Modelul de regresie liniară simplă
3.1. Testarea semnificatiei pantei dreptei de regresie
6. Regula de decizie:
- dacă | t calc | tteoretic , nu se respinge ipoteza H 0
- dacă | t calc | tteoretic , se respinge ipoteza H 0 cu un risc asumat α
13
3. Modelul de regresie liniară simplă
3.1. Testarea semnificatiei pantei dreptei de regresie
7. Decizia:
Deoarece ( =3,182)
, se respinge ipoteza H
0
1. Formularea ipotezelor:
H 0 : 0 0
H1 : 0 0
2. Alegerea pragului de semnificaţie: α=0.05
3. Alegerea statisticii test: testul Student
; = t0,025;3=3,182.
15
3. Modelul de regresie liniară simplă
Testarea semnificatiei ordonatei la origine
16
3. Modelul de regresie liniară simplă
3.1. Testarea semnificatiei pantei dreptei de regresie
6. Regula de decizie:
- dacă | t calc | tteoretic , nu se respinge ipoteza H 0
- dacă | t calc | tteoretic , se respinge ipoteza H 0 cu un risc asumat α
17
3. Modelul de regresie liniară simplă
3.1. Testarea semnificatiei ordonatei la origine
7. Decizia:
Deoarece ( =3,182)
, nu se respinge ipoteza H 0
19
3. Modelul de regresie liniară simplă
3.2. Testarea modelului de regresie
1.Formularea ipotezelor:
(modelul nu este semnificativ, adică X nu explică semnificativ variaţia lui Y)
(modelul este bine specificat sau modelul explică semnificativ legătura liniară dintre
cele două variabile)
20
3. Modelul de regresie liniară simplă
3.2. Testarea modelului de regresie
1.Formularea ipotezelor:
(modelul nu este semnificativ, adică X nu explică semnificativ variaţia lui Y)
(modelul este bine specificat sau modelul explică semnificativ legătura liniară dintre
cele două variabile)
- SAU Sig. H 0
𝑆𝑖𝑔.
𝑐𝑎𝑙𝑐
22
2. Modelul de regresie liniară simplă
3.2. Testarea modelului de regresie
6. Regula de decizie:
- dacă Fcalc Fteoretic , se respinge ipoteza H 0 cu un risc asumat α
- SAU Sig. H 1
𝑆𝑖𝑔.
𝑐𝑎𝑙𝑐
23
7. Luarea deciziei
3. Tabelul ANOVA de regresie (RLS)
24
3. Modelul de regresie liniară simplă
3.2. Testarea modelului de regresie dintre Studii si Venit
1.Formularea ipotezelor:
(modelul nu este semnificativ; Studiile nu explică semnificativ variaţia Venitului)
(modelul este bine specificat sau modelul explică semnificativ legătura liniară dintre
Studii di Venit)
, ; ;
25
Tabelul Fisher
v2/v1 1 2 3 4 5 6 7
1 161,448 199,500 215,707 224,583 230,162 233,986 236,768
26
3. Modelul de regresie liniară simplă
3.2. Testarea modelului de regresie
5. Determinarea valorii calculate a testului (la nivelul eşantionului):
ANOVA
df SS MS F Significance F
Regression k-1 = 1 ESS = 651076,92 651076,92 52,9 0,0054
Residual n-k = 3 RSS = 36923,077 12307,692
Total n-1 =4 TSS = 688000
27
2. Modelul de regresie liniară simplă
3.2. Testarea modelului de regresie
6. Regula de decizie:
- dacă Fcalc Fteoretic , nu se respinge ipoteza H 0 cu o probabilitate 1- α
- dacă Fcalc Fteoretic , se respinge ipoteza H 0 cu un risc asumat α
7. Luarea deciziei
128 H1
29
3. Modelul de regresie liniară simplă
3.3. Testarea indicatorilor de corelaţie
6. Regula de decizie:
- dacă | t calc | tteoretic, nu se respinge ipoteza H 0 ( ρ nu este semnificativ)
- dacă | tcalc | tteoretic, se respinge ipoteza H 0 cu un risc asumat α ( ρ este
semnificativ)
7. Luarea deciziei: 30
3. Modelul de regresie liniară simplă
Testarea semnificatiei coeficientului de corelatie
1. Formularea ipotezelor:
(Variabilele Studii si Venit nu sunt corelate semnificativ; nu există o
legătură de tip liniar intre Studii si Venit)
(Variabilele Studii si Venit sunt corelate semnificativ; există o legătură de
tip liniar intre Studii si Venit)
2. Alegerea pragului de semnificaţie: α=0.01
3. Alegerea statisticii test: testul Student
;
= t0,005;3=5,841
31
4. Determinarea valorii calculate a testului (relaţia scrisă pentru
date de la nivelul eşantionului):
, , , ,
= =7,25
, , , ,
0,973
32
3. Modelul de regresie liniară simplă
3.3. Testarea indicatorilor de corelaţie
6. Regula de decizie:
- dacă | t calc | tteoretic, nu se respinge ipoteza H 0 cu o probabilitate 1- α
- dacă | tcalc | tteoretic, se respinge ipoteza H 0 cu un risc asumat α ( ρ este
semnificativ)
33
3. Modelul de regresie liniară simplă
3.3. Testarea indicatorilor de corelaţie
7. Decizia:
Deoarece ( =5,841)
, se respinge ipoteza H
0
34
3. Modelul de regresie liniară simplă
3.3. Testarea indicatorilor de corelaţie
Testarea raportului de determinaţie η2
1.Formularea ipotezelor:
02 0
H 0 : (între cele două variabile nu există o legătură semnificativă de tip liniar)
02 0
H1 : (între cele două variabile există o legătură semnificativă de tip liniar)
35
3. Modelul de regresie liniară simplă
3.3. Testarea indicatorilor de corelaţie
6. Regula de decizie:
- dacă Fcalc Fteoretic, nu se respinge ipoteza H 0 ( η2 nu este semnificativ)
- dacă Fcalc Fteoretic, se respinge ipoteza H 0 cu un risc asumat α ( η2 este
semnificativ)
7. Luarea deciziei: 36
3. Modelul de regresie liniară simplă
3.3. Testarea indicatorilor de corelaţie
Testarea raportului de determinaţie η2 dintre Studii si Venit
1.Formularea ipotezelor:
02 0
H 0 : (între Studii si Venit nu există o legătură semnificativă de tip liniar)
02 0
H1 : (între Studii si Venit există o legătură semnificativă de tip liniar)
, ; ; 37
Tabelul Fisher
v2/v1 1 2 3 4 5 6 7
1 161,448 199,500 215,707 224,583 230,162 233,986 236,768
38
3. Modelul de regresie liniară simplă
3.3. Testarea indicatorilor de corelaţie
Testarea raportului de determinaţie η2
1.Determinarea valorii calculate a testului (la nivelul eşantionului):
39
2. Modelul de regresie liniară simplă
3.2. Testarea indicatorilor de corelatie
6. Regula de decizie:
- dacă Fcalc Fteoretic , nu se respinge ipoteza H 0
- dacă Fcalc Fteoretic , se respinge ipoteza H 0 cu un risc asumat α
7. Luarea deciziei
128 H1
41
3. Modelul de regresie liniară simplă
3.3. Testarea indicatorilor de corelaţie
6. Regula de decizie:
- dacă Fcalc Fteoretic, nu se respinge ipoteza H 0 ( η2 nu este semnificativ)
- dacă Fcalc Fteoretic, se respinge ipoteza H 0 cu un risc asumat α ( η2 este
semnificativ)
7. Luarea deciziei: 42
3. Modelul de regresie liniară simplă
Probleme specifice utilizând SPSS
Aplicaţia (2)
• Se consideră datele cu privire la valoarea vânzărilor şi cheltuielile cu
publicitatea pentru un eşantion de 4 firme. Datele sunt prezentate în
tabelul următor:
43
3. Modelul de regresie liniară simplă
Probleme specifice utilizând SPSS
Rezultatele modelării econometrice
Model Summary
Unstandardized Standardized
Coefficients Coefficients 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound
1 (Constant) -45.163 15.015 -3.008 .095 -109.766 19.439
chelt_publicitate .019 .003 .977 6.422 .023 .006 .032
a. Dependent Variable: Val_vanzari
Correlations
vanzari chelt_publ
vanzari Pearson Correlation 1 .977*
Sig. (2-tailed) .023
N 4 4
chelt_publ Pearson Correlation .977* 1
Sig. (2-tailed) .023
N 4 4
44
*. Correlation is significant at the 0.05 level (2-tailed).
3. Modelul de regresie liniară simplă
Probleme specifice utilizând SPSS
Aplicaţia (3)
Se consideră rata mortalităţii infantile şi PIB-ul (Produsul Intern Brut)
înregistrate pentru judeţele României, în anul 2010.
45
3. Modelul de regresie liniară simplă
Probleme specifice utilizând SPSS
Aplicaţia (3) – rezultatele modelării econometrice
2. Estimarea şi testarea parametrilor de regresie
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound
1 (Constant) 13,636 ,825 16,526 ,000 11,969 15,304
PIB -,00016 ,00004 -,00016 -4,140 ,000 -,00023 -,00008
a. Dependent Variable: Rata mortalitatii infantile
46
3. Modelul de regresie liniară simplă
Probleme specifice utilizând SPSS
Aplicaţia (3) – rezultatele modelării econometrice
3. Estimarea şi testarea coeficientului de corelaţie
Correlations
Rata
mortalitatii
infantile PIB
Rata mortalitatii infantile Pearson Correlation 1 -,548**
Sig. (2-tailed) ,000
N 42 42
PIB Pearson Correlation -,548** 1
Sig. (2-tailed) ,000
N 42 42
**. Correlation is significant at the 0.01 level (2-tailed).
47
3. Modelul de regresie liniară simplă
Probleme specifice utilizând SPSS
Aplicaţia (3) – rezultatele modelării econometrice
4. Estimarea şi testarea raportului de determinaţie şi raportului de
corelaţie
Model Summary
Sum of
Model Squares df Mean Square F Sig.
1 Regression 71,382 1 71,382 17,142 ,000a
Residual 166,568 40 4,164
Total 237,951 41
a. Predictors: (Constant), PIB 48
b. Dependent Variable: Rata mortalitatii infantile
ECONOMETRIE
CURSUL 4
Iaşi
- 2021 -
CURS 4 - REGRESIA LINIARĂ SIMPLĂ
4.1. Regresia prin origine
4.2. Exemplu de model RLS prin origine
2
Regresia prin origine (1)
1500
Venit
1000 y = 101.9x
R² = 0.9823
500
0
0 5 10 15 20
Studii
3
Regresia prin origine (2)
4
Regresia prin origine (3)
5
Regresia prin origine (4)
Prin anularea derivatei de ordinul întâi se obţine:
64 6400
8
Exemplu de model RLS prin origine
Standard
Coefficients Error t Stat P-value Lower 95% Upper 95%
Intercept 0 #N/A #N/A #N/A #N/A #N/A
Nivelul studiilor (ani) 101,9048 6,834619 14,91009 0,000118 82,92882 120,8807
Tabelul ANOVA
Significance
df SS MS F F
Regression 1 8723048 8723048 222,3107 0,000655
Residual 4 156952,4 39238,1
Total 5 8880000
9
Raportul de corelaţie şi raportul de determinaţie
Regression Statistics
Multiple R 0,991123
R Square 0,982325
10
ECONOMETRIE
CURSURI 5-7
CURS 5 – MODELUL DE REGRESIE LINIARĂ MULTIPLĂ
1. Prezentarea modelului
2. Estimarea parametrilor modelului
3. Estimarea indicatorilor de corelaţie (coeficientul de corelaţie
parţială, raportul de corelaţie, raportul de determinaţie)
4. Probleme specifice utilizând SPSS
2
Modelul de regresie liniară multiplă
1. Prezentare generală
•unde:
Y este variabila dependentă;
sunt cele p variabile independente;
este variabila eroare sau reziduu;
reprezintă cei k (k = p+1) parametrii ai modelului sau coeficienţi
de regresiei
3
Modelul de regresie liniară multiplă
1. Prezentare generală
•iar:
p este numărul de variabile independente;
k este numărul de parametri din model;
n este volumul de date disponibile. 4
Modelul de regresie liniară multiplă
1. Prezentare generală
Interpretarea coeficienţilor de regresie
• este valoarea medie a variabilei dependente, în condiţiile în care
influenţa variabilelor independente este nulă. Acest parametru se
numeşte constanta sau termenul liber al modelului, pentru că este
coeficientul asociat unei variabile degenerate, 1;
• fiecare parametru din modelul de regresie liniară multiplă este
cunoscut precum coeficient de regresie parţial, care indică efectul
sau influenţa parţială a unei variabile explicative asupra variabilei
explicate, considerând constante sau eliminând efectul celorlalte
variabile independente;
7
Modelul de regresie liniară multiplă
2. Estimarea parametrilor modelului
Metoda celor mai mici pătrate (MCMMP)
•MCMMP presupune ca estimatorii parametrilor modelului de regresie să
respecte condiţia:
8
Modelul de regresie liniară multiplă
2. Estimarea parametrilor modelului
Estimarea punctuală
• Parametrii modelului de regresie j se estimează punctual,
considerând estimaţiile b j calculate la nivelul unui eşantion
reprezentativ extras din populaţia de referinţă, pe baza relaţiilor
obţinute pentru estimatorii ˆ j .
j b j t / 2,nk sˆ , b j t / 2,nk sˆ
j j
9
Exemplu
• Se consideră rata mortalităţii infantile, PIB-ul (Produsul Intern Brut) şi
populaţia urbană înregistrate pentru judeţele României, în anul 2013.
Coefficientsa
Unstandardized Standardized
Coeff icients Coeff icients Correlations
Model B Std. Error Beta t Sig. Zero-order Partial Part
1 (Constant) 14,314 1,182 12,113 ,000
Produs Intern Brut -,00012 ,00005 -,439 -2,312 ,026 -,548 -,347 -,307
Populatia urbana -,027 ,033 -,153 -,804 ,426 -,466 -,128 -,107
a. Dependent Variable: Rata mortalitatii inf antile
10
Modelul de regresie liniară multiplă
3. Estimarea indicatorilor de corelaţie
a) Coeficientul de corelaţie parţială
r12 ry1ry 2
r12. y
(1 ry21 )(1 ry22 )
11
Modelul de regresie liniară multiplă
3. Estimarea indicatorilor de corelaţie
etc.
12
Estimarea coeficienţilor de corelaţie bivariată (coloana Zero-order) şi
parţială (coloana Partial)
Coeffi ci entsa
Unstandardized St andardized
Coef f icients Coef f icients Correlations
Model B St d. Error Beta t Sig. Zero-order Part ial Part
1 (Constant) 14,314 1,182 12,113 ,000
Produs I ntern Brut -,00012 ,00005 -,439 -2,312 ,026 -,548 -,347 -,307
Populatia urbana -,027 ,033 -,153 -,804 ,426 -,466 -,128 -,107
a. Dependent Variable: Rata mortalitatii inf antile
13
Estimarea şi testarea coeficienţilor de corelaţie parţială
Correlati ons
Rata
mortalitatii Produs
Control Variables inf antile Intern Brut
Populatia urbana Rata mortalitatii inf antile Correlation 1,000 -,347
Signif icance (2-tailed) . ,026
df 0 39
Produs I ntern Brut Correlation -,347 1,000
Signif icance (2-tailed) ,026 .
df 39 0
Correlati ons
Rata
mortalitatii Populatia
Control Variables inf antile urbana
Produs Intern Brut Rata mortalitatii inf antile Correlation 1,000 -,128
Signif icance (2-t ailed) . ,426
df 0 39
Populatia urbana Correlation -,128 1,000
Signif icance (2-t ailed) ,426 .
df 39 0
14
Modelul de regresie liniară multiplă
3.Estimarea indicatorilor de corelaţie
Raportul de determinaţie multiplă
15
Modelul de regresie liniară multiplă
3. Estimarea indicatorilor de corelaţie
Raportul de corelaţie multiplă
Modelul de regresie liniară multiplă
3. Estimarea indicatorilor de corelaţie
Raportul de determinaţie multiplă ajustat
17
Estimarea raportului de determinaţie multiplă şi raportului de corelaţie
multiplă
Estimarea raportului de determinație multiplă ajustat
Model Summary
Adjusted St d. Error of
Model R R Square R Square the Estimate
1 ,558a ,311 ,276 2,0497
a. Predictors: (Constant), Populat ia urbana, Produs
Intern Brut
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 74,098 2 37,049 8,818 ,001a
Residual 163,852 39 4,201
Total 237,951 41
a. Predictors: (Const ant), Populatia urbana, Produs Intern Brut
b. Dependent Variable: Rata mortalitatii inf antile
18
CURS 6 - REGRESIA LINIARĂ MULTIPLĂ
4. Testarea parametrilor modelului
5. Testarea indicatorilor de corelaţie
6. Testarea modelului de regresie
19
Modelul de regresie liniară multiplă
4. Testarea parametrilor modelului de regresie
1. Formularea ipotezelor:
20
Modelul de regresie liniară multiplă
4. Testarea parametrilor modelului de regresie
6. Regula de decizie:
21
Modelul de regresie liniară multiplă
5. Testarea indicatorilor de corelaţie
Testarea coeficientului de corelaţie parţială
22
Modelul de regresie liniară multiplă
5. Testarea indicatorilor de corelaţie
Testarea coeficientului de corelaţie parţială
23
Testarea coeficienţilor de corelaţie parţială
Correlati ons
Rata
mortalitatii Produs
Control Variables inf antile Intern Brut
Populatia urbana Rata mortalitatii inf antile Correlation 1,000 -,347
Signif icance (2-tailed) . ,026
df 0 39
Produs I ntern Brut Correlation -,347 1,000
Signif icance (2-tailed) ,026 .
df 39 0
Correlati ons
Rata
mortalitatii Populatia
Control Variables inf antile urbana
Produs Intern Brut Rata mortalitatii inf antile Correlation 1,000 -,128
Signif icance (2-t ailed) . ,426
df 0 39
Populatia urbana Correlation -,128 1,000
Signif icance (2-t ailed) ,426 .
24
df 39 0
Modelul de regresie liniară multiplă
5. Testarea indicatorilor de corelaţie
Testarea raportului de determinaţie η2
1.Formularea ipotezelor:
H 0 : 02 0 (între variabile nu există o legătură semnificativă de tip liniar)
02 0
H1 : (între variabile există o legătură semnificativă de tip liniar)
25
Modelul de regresie liniară simplă
5. Testarea indicatorilor de corelaţie
6. Regula de decizie:
- dacă Fcalc Fteoretic, nu se respinge ipoteza H 0 ( η2 nu este semnificativ)
- dacă Fcalc Fteoretic, se respinge ipoteza H 0 cu un risc asumat α ( η2 este
semnificativ)
7. Luarea deciziei: 26
Modelul de regresie liniară mutiplă
6. Testarea modelului de regresie
27
Modelul de regresie liniară multiplă
6. Testarea modelului de regresie
28
Testarea modelului de regresie liniară multiplă
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 74,098 2 37,049 8,818 ,001a
Residual 163,852 39 4,201
Total 237,951 41
a. Predictors: (Const ant), Populatia urbana, Produs Intern Brut
b. Dependent Variable: Rata mortalitatii inf antile
29
CURS 7 - REGRESIA LINIARĂ MULTIPLĂ
7. Testarea influenţei marginale a unei variabile independente
8. Ierarhizarea inportanţei factorilor de influenţă (variabilelor
independente)
9. Probleme specifice utilizând SPSS
30
Modelul de regresie liniară multiplă
7. Testarea influenţei marginale a unei variabile independente
Testarea influenţei marginale a unei variabile
independente introduse în model
EXEMPLUL 1
Change Statistics
Adjusted St d. Error of R Square
Model R R Square R Square the Estimate Change F Change df 1 df 2 Sig. F Change
1 .661a .436 .435 $12,833.540 .436 365.381 1 472 .000
2 .663b .439 .437 $12,815.280 .003 2.346 1 471 .126
a. Predictors: (Constant), Educat ional Lev el (y ears)
b. Predictors: (Constant), Educat ional Lev el (y ears), Months since Hire
EXEMPLUL 2
Change Statistics
Adjusted St d. Error of R Square
Model R R Square R Square the Estimate Change F Change df 1 df 2 Sig. F Change
1 .661a .436 .435 $12,833.540 .436 365.381 1 472 .000
2 .890b .792 .792 $7,796.524 .356 807.889 1 471 .000
a. Predictors: (Constant), Educat ional Lev el (y ears)
b. Predictors: (Constant), Educat ional Lev el (y ears), Beginning Salary
Modelul de regresie liniară multiplă
7. Testarea influenţei marginale a unei variabile independente
Testarea influenţei marginale a unei variabile
independente excluse din model
EXEMPLUL 3
Change Statistics
Adjusted St d. Error of R Square
Model R R Square R Square the Estimate Change F Change df 1 df 2 Sig. F Change
1 .910a .828 .818 5.2961 .828 83.271 4 69 .000
2 .907b .822 .814 5.3542 -.006 2.544 1 69 .115
a. Predictors: (Constant), Av erage f emale lif e expectancy , People liv ing in cities (%), Daily calorie intake, People who read (%)
b. Predictors: (Constant), Av erage f emale lif e expectancy , Daily calorie intake, People who read (%)
35
Modelul de regresie liniară multiplă
8. Ierarhizarea importanţei factorilor de influenţă
36
Modele cu variabile standardizate
37
Exemplu
38
Modelul de regresie liniară multiplă
9. Probleme specifice utilizând SPSS
Aplicaţia (1)
• Se consideră rata mortalităţii infantile, PIB-ul (Produsul Intern Brut) şi
populaţia urbană înregistrate pentru judeţele României, în anul 2013.
39
Modelul de regresie liniară multiplă
9. Probleme specifice utilizând SPSS
Aplicaţia (1) – rezultatele modelării econometrice
1. Estimarea şi testarea parametrilor de regresie
Coefficientsa
Unstandardized Standardized
Coeff icients Coeff icients Correlations
Model B Std. Error Beta t Sig. Zero-order Partial Part
1 (Constant) 14,314 1,182 12,113 ,000
Produs Intern Brut -,00012 ,00005 -,439 -2,312 ,026 -,548 -,347 -,307
Populatia urbana -,027 ,033 -,153 -,804 ,426 -,466 -,128 -,107
a. Dependent Variable: Rata mortalitatii inf antile
40
Modelul de regresie liniară multiplă
9. Probleme specifice utilizând SPSS
Aplicaţia (1) – rezultatele modelării econometrice
2. Estimarea coeficienţilor de corelaţie bivariată (coloana Zero-order) şi
parţială (coloana Partial)
Coeffi ci entsa
Unstandardized St andardized
Coef f icients Coef f icients Correlations
Model B St d. Error Beta t Sig. Zero-order Part ial Part
1 (Constant) 14,314 1,182 12,113 ,000
Produs I ntern Brut -,00012 ,00005 -,439 -2,312 ,026 -,548 -,347 -,307
Populatia urbana -,027 ,033 -,153 -,804 ,426 -,466 -,128 -,107
a. Dependent Variable: Rata mortalitatii inf antile
41
Modelul de regresie liniară multiplă
9. Probleme specifice utilizând SPSS
Aplicaţia (1) – rezultatele modelării econometrice
3. Estimarea şi testarea coeficienţilor de corelaţie parţială
Correlati ons
Rata
mortalitatii Produs
Control Variables inf antile Intern Brut
Populatia urbana Rata mortalitatii inf antile Correlation 1,000 -,347
Signif icance (2-tailed) . ,026
df 0 39
Produs I ntern Brut Correlation -,347 1,000
Signif icance (2-tailed) ,026 .
df 39 0
Correlati ons
Rata
mortalitatii Populatia
Control Variables inf antile urbana
Produs Intern Brut Rata mortalitatii inf antile Correlation 1,000 -,128
Signif icance (2-t ailed) . ,426
df 0 39
Populatia urbana Correlation -,128 1,000
Signif icance (2-t ailed) ,426 .
42
df 39 0
Modelul de regresie liniară multiplă
9. Probleme specifice utilizând SPSS
Aplicaţia (1) – rezultatele modelării econometrice
4. Estimarea şi testarea raportului de determinaţie multiplă şi
raportului de corelaţie multiplă
Model Summary
Adjusted St d. Error of
Model R R Square R Square the Estimate
1 ,558a ,311 ,276 2,0497
a. Predictors: (Constant), Populat ia urbana, Produs
Intern Brut
Sum of
Model Squares df Mean Square F Sig.
1 Regression 74,098 2 37,049 8,818 ,001a
Residual 163,852 39 4,201
Total 237,951 41
a. Predictors: (Const ant), Populatia urbana, Produs Intern Brut
b. Dependent Variable: Rata mortalitatii inf antile
43
Modelul de regresie liniară multiplă
9. Probleme specifice utilizând SPSS
Aplicaţia (1) – rezultatele modelării econometrice
6. Testarea influenţei marginale a unei variabile independente
introduse în model
Modelul de regresie liniară multiplă
9. Probleme specifice utilizând SPSS
Aplicaţia (1) – rezultatele modelării econometrice
7. Testarea influenţei marginale a unei variabile independente excluse
din model
Model Summary
Change Statistics
Adjusted Std. Error of R Square
Model R R Square R Square the Estimate Change F Change df 1 df 2 Sig. F Change
1 ,558a ,311 ,276 2,0497 ,311 8,818 2 39 ,001
2 ,548b ,300 ,282 2,0406 -,011 ,646 1 39 ,426
a. Predictors: (Constant), Produs Intern Brut, Populatia urbana
b. Predictors: (Constant), Produs Intern Brut
Modelul de regresie liniară multiplă
9. Probleme specifice utilizând SPSS
Aplicaţia (1) – rezultatele modelării econometrice
8. Ierarhizarea importanţei factorilor de influenţă (ierarhizarea
variabilelor independente)
Coeffi ci entsa
Unstandardized St andardized
Coef f icients Coef f icients Correlations
Model B St d. Error Beta t Sig. Zero-order Part ial Part
1 (Constant) 14,314 1,182 12,113 ,000
Produs I ntern Brut -,00012 ,00005 -,439 -2,312 ,026 -,548 -,347 -,307
Populatia urbana -,027 ,033 -,153 -,804 ,426 -,466 -,128 -,107
a. Dependent Variable: Rata mortalitatii inf antile
Modelul de regresie liniară multiplă
9. Probleme specifice utilizând SPSS
Aplicaţia (1) – rezultatele modelării econometrice
8. Ierarhizarea importanţei factorilor de influenţă (ierarhizarea
variabilelor independente)
Coeffi ci entsa
Unstandardized St andardized
Coef f icients Coef f icients Correlations
Model B St d. Error Beta t Sig. Zero-order Part ial Part
1 (Constant) 14,314 1,182 12,113 ,000
Produs I ntern Brut -,00012 ,00005 -,439 -2,312 ,026 -,548 -,347 -,307
Populatia urbana -,027 ,033 -,153 -,804 ,426 -,466 -,128 -,107
a. Dependent Variable: Rata mortalitatii inf antile
47