Documente Academic
Documente Profesional
Documente Cultură
CURS 2
Regresia liniară simplă (RLS)
1. Modelul RLS
2. Estimarea punctuală a parametrilor modelului RLS
3. Estimarea prin interval de încredere a parametrilor modelului
RLS
4. Probleme specifice utilizând Excel şi SPSS
5. Estimarea indicatorilor de corelaţie (coeficientul de corelaţie,
raportul de corelaţie, raportul de determinaţie)
2
1. Modelul de regresie simplă liniară
Interpretarea geometrică şi statistică a regresiei
Exemplu
•Se consideră repartiţia a 50 de firme după profitul realizat (Y,
variabilă dependentă, sute mil. lei) şi cheltuielile cu publicitatea (X,
variabilă independentă, mil. lei).
YX 0 1 X
6
1. Modelul de regresie simplă liniară
7
1. Modelul de regresie simplă liniară
Deci:
yi = β0+ β1xi + εi
8
1. Modelul RLS
Componentele modelului RLS sunt:
9
1. Modelul de regresie simplă liniară
Parametrii modelului de regresie liniară simplă
Y
0
1
0 X
Linia de regresie sau media condiţionată
1. Modelul de regresie simplă liniară
Parametrii modelului de regresie liniară simplă
o reprezintă constanta sau termenul liber al modelului şi reprezintă
valoarea medie a variabilei Y atunci când X=0.
M(Y|X=0) =
Grafic, parametrul reprezintă ordonata la origine sau intersecţia
dreptei de regresie liniară cu axa OY (engl. intercept).
Daca
Grafic, parametrul reprezintă tangenta unghiului format dintre dreapta
de regresie şi axa OX sau panta dreptei de regresie (engl. slope).
1. Modelul de regresie simplă liniară
Dacă β1>0 => ceea ce indică o legătură directă sau pozitivă între variabilele
X şi Y (de exemplu, dacă X creşte cu o unitate, Y creşte, în medie, cu β1 unităţi);
Dacă β1<0 => există o legătură inversă între variabilele Y şi X între variabile
există o legătură inversă (de exemplu, la o creştere a lui X cu o unitate, Y scade,
în medie, cu β1 unităţi);
12
1. Modelul de regresie simplă liniară
unde:
- yˆ i ˆ0 ˆ1 xi este estimatorul mediei condiţionate M(Y│X=xi);
- ̂ 0 este estimatorul parametrului 0
- ˆ este estimatorul parametrului 1
1
- este estimatorul erorii stohastice εi
i
Pentru un eşantion observat, modelul de regresie liniară simplă poate fi
scris:
yi b0 b1 xi ei
13
2. Estimarea punctulă a parametrilor
modelului RLS
Estimarea parametrilor modelului de regresie liniară
simplă
•Estimarea reprezintă procedeul de aflare a unui parametru al unei
populaţii ( o , 1 ) pe baza datelor înregistrate la nivelul unui
eşantion.
n n n n
n n n
S
ˆ
2 yi ˆ0 ˆ1 xi 1 0 nˆ0 ˆ1 x y i i
i 1
0
i 1 i 1
n n n n
S
2 y i ˆ0 ˆ1 xi xi 0 ˆ0 xi ˆ1 xi2 yx i i
1 i 1 i 1 i 1 i 1
ˆ
y x x x y
i
2
i i
;
i i
ˆ1
n x y x y ;
i i i i ˆ0 y ˆ1 x
n x x n x x
0 2 2
2 2
i i i i
sau
n
3. Estimarea prin interval de încredere a
parametrilor modelului RLS
Proprietăţile estimatorilor paramerilor modelului de
regresie
•Estimatorii parametrilor modelului de regresie sunt variabile de
selecţie care:
-urmează o repartiţie normală: 0
ˆ0 ~ N 0 , 2ˆ ˆ1 ~ N 1 , 2ˆ1
-sunt nedeplasaţi: M ˆ
M ˆ0 , 0 1 1
unde
k = numărul parametrilor estimaţi în model (pentru modelul liniar k=2),
n = volumul eşantionului pe baza căruia se fac estimările.
3. Estimarea prin interval de încredere a
parametrilor modelului RLS
2 1 x 2
2 1 x 2
ˆ ˆ 2ˆ , respectiv sˆ sˆ s
2
2
0 0
n
ix x 2
0 0
n xi x
i i
ˆ 2 s2
ˆ ˆ 2ˆ
1 n
s
, respectiv 1ˆ s 2
ˆ1
n
( x x) ( x x)
1
2 2
i i
i 1 i 1
Funcţia de consum
-consumul populaţiei în funcţie de venit:
Legea cererii
-cererea în funcţie de preţul produselor:
Ci 0 1 Pi i , unde parametrul 1
arată cu cât scade cererea la o creştere a preţului cu o unitate.
este de regulă negativ şi
22
4. Probleme specifice utilizând Excel si
SPSS
xi yi
10 800
12 1000
12 1200
14 1600
16 1800
23
Estimatiile punctuale ale parametrilor
24
1. Tabelul coeficientilor de regresie
Rezultate Excel
Rezultate SPSS
25
Estimatiile punctuale ale parametrilor
; ;
28
In estimarea prin IC a pantei dreptei se foloseşte
statistica t Student.
IC 95% este:
;
;
= t0,025;3=3,182.
29
Valorile distribuţiei Student
19 2,093
∞ 1,96
30
IC devine:
; ;
32
In estimarea prin IC a ordonatei la origine se
foloseşte statistica t Student.
IC 95% este:
; = t0,025;3=3,182.
33
IC devine:
Rezultate Excel
Rezultate SPSS
35
1. Tabelul coeficientilor de regresie
36
5. Estimarea indicatorilor de corelaţie
Coeficientul de corelaţie (se foloseşte doar pentru modelul liniar):
N
cov( X , Y )
(x i x )( yi y )
( X ,Y ) i 1 , -1≤ ρ ≤+1
x y N x y
n n n n
( x x)( y y )
i i n xi yi xi yi
̂ ( X , Y ) r i 1
i 1 i 1 i 1
nsx s y n n n n
[n x ( xi ) ][n y ( yi ) 2 ]
2
i
2 2
i
i 1 i 1 i 1 i 1
38
2. Tabelul coeficientilor de corelatie
Rezultate SPSS
0,973
39
5. Estimarea indicatorilor de corelaţie
Descompunerea variaţiei totale a variabilei Y
Descompunerea variaţiei totale a variabilei Y
41
5. Estimarea indicatorilor de corelaţie
VT = (y
i
i - y )2 , reprezintă variaţia totală (Total Sum of Squares);
VT = VE VR
(TSS = ESS + RSS)
Descompunerea variaţiei totale a variabilei Y
RSS 43
RSS = 36923,077
Descompunerea variaţiei totale a variabilei Y
Rezultate Excel
ANOVA
df SS MS F Significance F
Regression 1 651076,9231 651076,923 52,9 0,005364071
Residual 3 36923,07692 12307,6923
Total 4 688000
Rezultate SPSS
( yˆ i y)2
VE V
2
i
1 R , cu 0 ≤ η2 ≤1
(y
i
i y)2 VT VT
0 1
(b b x y ) 2
ESS RSS
R 2= i
1
(y
i
i y)2 TSS TSS
(b b x y )
0 1
2
ESS RSS
R i
= 1
(y y)
i
i
2
TSS TSS
48
Estimaţia raportului de corelaţie:
49
4. Tabelul indicatorilor de corelatie
Rezultate Excel
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,973
R Square 0,946
Adjusted R Square 0,928
Standard Error 110,940
Observations 5,000
Rezultate SPSS
50
2. Se consideră datele cu privire la Valoarea vânzărilor (sute mii
euro), Y, şi Cheltuielile cu publicitatea (sute euro), X, pentru un
eşantion de 4 firme. Datele sunt prezentate în tabelul următor.
xi yi
10 2500
20 4100
50 5000
100 7500
51
Model Summary
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound
1 (Constant) -45.163 15.015 -3.008 .095 -109.766 19.439
chelt_publicitate .019 .003 .977 6.422 .023 .006 .032
a. Dependent Variable: Val_vanzari
Correlations
vanzari chelt_publ
vanzari Pearson Correlation 1 .977*
Sig. (2-tailed) .023
N 4 4
chelt_publ Pearson Correlation .977* 1
Sig. (2-tailed) .023
N 4 4
*. Correlation is significant at the 0.05 level (2-tailed).
52
1. Tabelul coeficientilor de regresie
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound
1 (Constant) -45.163 15.015 -3.008 .095 -109.766 19.439
chelt_publicitate .019 .003 .977 6.422 .023 .006 .032
a. Dependent Variable: Val_vanzari
53
Estimarea prin IC a pantei dreptei:
; ;
54
In estimarea prin IC a pantei dreptei se foloseşte
statistica t Student.
IC 95% este:
; = t0,025;2=4,303.
55
Valorile distribuţiei Student
19 2,093
∞ 1,96
56
IC devine: