Documente Academic
Documente Profesional
Documente Cultură
1
Planul cursului
1. Introducere
2. Modelul de regresie liniară simplă
3. Modelul de regresie liniară multiplă
4. Modele de regresie neliniară
5. Ipoteze statistice: normalitatea erorilor,
homoscedasticitatea, necorelarea erorilor,
multicoliniaritatea.
2
2. Modelul de regresie liniară simplă
2.1. Noţiuni introductive
2.2. Forma generală a modelului de regresie liniară simplă
2.3. Ipoteze clasice formulate
2.4. Estimarea parametrilor modelului
2.5. Estimarea indicatorilor de corelaţie
2.6. Testarea modelului şi a parametrilor
2.7. Aplicaţii
3
2.1. Noţiuni introductive
Corelaţie.
4
2.2. Forma generală a modelului
de regresie liniară simplă
A. Identificarea pe cale grafică a formei legăturii dintre
variabile:
5
2.2. Forma generală a modelului
de regresie liniară simplă
B. Modelul econometric de regresie liniară simplă
Y 0 1 X
y i o 1 xi i
Dacă se consideră că regresia este o medie condiționată,
componenta deterministă este:
M ( Y / X xi ) o 1 xi
iar modelul este:
6
Parametrii modelului:
Y 0 1 X
yi bo b1 xi ei
y xi bo b1 xi
Parametrii modelului sunt:
β0 – este constanta modelului (intercept).
β1 – este panta dreptei de regresie.
7
2.3. Ipoteze clasice
Normalitatea, homoscedasticitatea și autocorelarea
erorilor;
Multicoliniaritatea.
8
2.4. Estimarea parametrilor modelului
a. Noţiuni teoretice
b. Metoda de estimare
c. Estimarea punctuală a parametrilor modelului
d. Estimarea prin interval de încredere
e. Valorile estimate ale parametrilor modelului de
regresie în SPSS
9
a. Noţiuni teoretice
1. estimare punctuală.
2. estimare prin interval de încredere.
10
b. Metoda de estimare
i ) min
(
i
e 2
11
b. Metoda de estimare
Metoda celor mai mici pătrate:
2
i
S e yi y xi y b
2
i o b1 xi min
2
i i i
12
c. Estimarea punctuală a parametrilor
modelului
S ei2 min
i
S
2 ( yi b0 b1 xi ) ( 1 ) 0
b0
S
2 ( yi b0 b1 xi ) ( xi ) 0
b1
13
2
i i xi xi y i
y x
b0 sau b0 y b1 x
n xi2 xi 2
n xi y i xi y i
b1
n xi2 xi 2
14
Derivatele parţiale de ordinul doi:
S
2
S 2
S
2
b0
2
2 n;
b0 b1
2
i
xi ;
b1
2
2
i
x 2
i .
n
x
i
i
xi i xi
2
i
15
Derivatele parţiale de ordinul doi – pozitiv
definite:
2
n x xi n 2 0
2
i
i i
16
d. Estimarea prin interval de încredere (IC) a
parametrilor modelului
Estimatorii parametrilor βi urmează o lege normală
şi sunt:
nedeplasaţi (în condiţiile respectării ipotezei că
variabila X este nestochastică şi pe baza proprietăţii
că variabilele aleatoare yi urmează aceeaşi lege de
repartiţie);
convergenţi (pentru un volum al eşantionului
suficient de mare);
eficienţi.
17
d. Estimarea prin interval de încredere (IC) a
parametrilor modelului
A.- Parametrul β0 ˆ
0 ~ N ( 0 , ˆ )
2
0
i
x 2
n xi x
0 2
18
I.C. este definit de limitele de încredere care acoperă
valoarea unui parametru, pentru un coeficient de
încredere.
ˆ
0 ~ N ( 0 , ˆ ) Z ~ N (0,1)
2
0
după relaţia:
ˆ0 0
Z
ˆ ˆ
0
19
sau când nu se cunoaşte varianţa:
ˆ0 0
t
sˆ
0
20
Această variabilă t Student (Z) permite să se
construiască un interval de încredere, astfel:
ˆ0 0
P(t / 2 t / 2 ) 1
sˆ
0
21
Prin prelucrarea datelor la nivelul unui eşantion, se
obţine o estimaţie punctuală a parametrului β0,
respectiv valoarea b0.
b0 0
P( t / 2 t / 2 ) 1
s ˆ
0
22
I.C. pentru parametrul β0:
b t
0 / 2 ;n 2 s ˆ
0
unde:
▪ b0 este o estimaţie punctuală a parametrului β0;
23
i
x 2
sˆ i
se2
n xi x
0 2
e 2
i
s
2
e
i
; ei yi y xi ; y xi b0 b1 xi
n2
24
B. Parametrul β1:
ˆ
1 ~ ( 1 , ˆ )
2
1
ˆ ˆ 2
M ( 1 ) 1 ; V ( 1 ) ˆ
2
xi x
1 2
25
I.C. pentru parametrul β1:
b t
1 |2 ;n 2 sˆ
1
unde: b1 este o estimaţie punctuală a parametrului β1;
se2
sˆ
xi x
1 2
26
e 2
i
se2 i
; ei yi y xi .
n2
y xi b0 b1 xi
27
e. Valorile estimate ale parametrilor modelului
de regresie în SPSS
Pret (lei/kg) Consum (kg)
5 15
7 12
9 13
11 10
14 8
28
e. Valorile estimate ale parametrilor modelului
de regresie în SPSS
29
Exemplu:
Pe baza datelor din output-ul de mai sus, cunoscând
n=5, se cere:
1. Să se scrie modelul legăturii dintre cele două
variabile;
2. Să se precizeze sensul legăturii dintre aceste
variabile;
3. Să se calculeze limitele intervalului de încredere
pentru parametrul β1, considerând un risc de 0.05.
30
2.5. Estimarea indicatorilor de corelaţie
Obiectiv: studiul intensităţii legăturii dintre
variabile.
31
1. Coeficientul de corelaţie
cov( X , Y )
(x i X ) ( yi Y )
i
X Y N X Y
X
1
Y
• Domeniul de variaţie
• Interpretare 32
Observaţie:
Dacă se realizează o standardizare a variabilelor X
şi Y, atunci estimatorul coeficientului de corelaţie
pentru aceste variabile este identic cu cel al
coeficientului de regresie β1.
33
Exemplu
34
2. Raportul de determinaţie
măsoară gradul de corelaţie dintre variabile şi
calitatea ajustării norului de puncte prin dreapta de
regresie (goodness of fit).
35
yx y
2
VE VR
2 i
1
yi y 2
VT VT
i
36
Domeniul de variaţie
Interpretare
37
( yxi
y) 2
( b0 b1 xi y ) 2
ESS RSS
2
R i
i
1
( yi y )2
i
( y y )2
TSS TSS
i i
ESS este estimaţia variaţiei explicate;
RSS este estimaţia variaţiei reziduale;
TSS este estimaţia variaţiei totale.
38
Exemplu
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 25.970 1 25.970 24.125 .016a
Residual 3.230 3 1.077
Total 29.200 4
a. Predictors: (Constant), Pret
b. Dependent Variable: Consum
39
Observaţii:
raportul de determinaţie poate fi folosit pentru
compararea calităţii modelelor care au aceeaşi
variabilă dependentă Y.
40
3. Raportul de corelaţie
xy y 2
VE VR
2 i
1
yi y
2
VT VT
i
- domeniul de variaţie.
41
Estimarea raportului de corelaţie
yx 2
y
2
i
ESS RSS
R R i
1
yi y
2
TSS TSS
i
42
2.5.2 Indicatori de corelaţie în SPSS
Model Summary
43
Exemplu
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 25.970 1 25.970 24.125 .016a
Residual 3.230 3 1.077
Total 29.200 4
a. Predictors: (Constant), Pret
b. Dependent Variable: Consum
44
2.6 Testarea parametrilor modelului
Ipoteze statistice
Regula de decizie
Interpretare
45
Exemplu
46
Exemplu
47
Pe baza datelor din output-ul de mai sus, se cere:
48
2.7 Testarea modelului de regresie
Ipoteze
Ho: β0= 0; β1= 0
H1: β0 # 0; β1# 0
Calculul statisticii test
ESS
Fcalc k 1
RSS
nk
49
Regula de decizie
Dacă F F , atunci se
calc , k 1, n k
50
Exemplu
51
Exemplu
52
2.8. Testarea indicatorilor de corelaţie
a) Testarea coeficientului de corelaţie
Ipoteze statistice
Statistica test
Decizie
53
Exemplu
54
Exemplu
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 25.970 1 25.970 24.125 .016a
Residual 3.230 3 1.077
Total 29.200 4
a. Predictors: (Constant), Pret
b. Dependent Variable: Consum
55
b) Testarea raportului de corelaţie
Ipoteze statistice
Statistica test
Decizie
56
Exemplu
57
Exemplu
58
2.9 Regresia prin origine
Parametrul β0 poate să nu fie semnificativ statistic.
Modelul de regresie este:
Y 1 X
S ei2 y i y xi 2 yi b1 xi 2 min
i i i
59
S
2 ( y i b1 xi ) ( xi ) 0
b1
2
b1 xi xi y i
60
Probleme:
1. Nerespectarea condiţiei ei 0
i
61
Observaţii:
Se recomandă evitarea eliminării parametrului β0 din
ecuaţia de regresie.
În cazul variabilelor standardizate, problemele
menţionate mai sus dispar (panta dreptei de regresie
este egală cu valoarea coeficientului de corelaţie
Pearson şi nu este necesară calcularea unui alt
coeficient).
62
Aplicație modelul de regresie liniară simplă
Chelt. public. (mii
Vânzări (mil lei)
lei)
7 8
14 10
12 12
27 20
19 15
25 17
15 10
18 15
25 17
8 9
Se cere:
1. Să se scrie ecuaţia estimată a legăturii dintre Vânzări și
Cheltuieli de publicitate.
2. Să se precizeze cu cât cresc, în medie, vânzările dacă se
măresc cheltuielile de publicitate cu 10 mii lei.
3. Să se estimeze cât ar trebui să se cheltuiască pentru
publicitate pentru a avea vânzări de 20 mil. lei.
4. Să se testeze dacă influența cheltuielilor de publicitate asupra
vânzărilor este semnificativă statistic (pentru un risc de 0.05).
5. Să se testeze dacă modelul de regresie este corect specificat
(pentru un risc de 0.05).