Sunteți pe pagina 1din 209

ECONOMETRIE

CURS 1
Planul cursului

1. Introducere
2. Modelul de regresie liniară simplă
3. Modelul de regresie liniară multiplă
4. Modele de regresie neliniară
5. Verificarea ipotezelor modelului de regresie

2
Evaluare

• 30% - test de evaluare pe parcurs, test grilă (temele 1 – 3);

• 30% - evaluare la seminar;

• 40% - examen final, test grilă (temele 4 – 5).

3
Manuale

4
Manuale

5
Ce este econometria?
Termenul econometrie provine din cuvintele greceşti
“oikonomia” (economie) si “metron” (măsură) măsurare
în teoria economică sau cuantificarea relaţiilor economice

Termenul econometrie a fost introdus în anul 1926 de către


economistul şi statisticianul norvegian Ragnar Frisch,
distins cu Premiul Nobel pentru economie, în anul 1910.

Prin eforturile specialistilor Ragnar Frisch si Irving Fisher, în


anul 1930, în SUA (Cleveland), se înfiinţează Societatea de
Econometrie
- 1933 – prima revistă de econometrie, “Econometrica”

6
Ce este econometria?
Econometria este o disciplină care s-a conturat ca o sinteză între
economie, matematică şi statistică.

7
 În perioada contemporană, contribuţii importante la dezvoltarea econometriei
au fost aduse de:
 în domeniul analizei economice a cererii: M. Friedman, T. Haavelmo, R.
Stone, H. Wald.
 în domeniul funcţiilor de producţie: C. W. Cobb, P. H. Douglas, K. J.
Arrow, G. Tintner
 în domeniul modelelor macroeconomice: A. S. Goldberger, O. Onicescu,
L. V. Kantarevici, L. R. Klein, J. Tinbergen, H. Theil
 în domeniul metodelor de analizã a datelor sau al econometriei „fãrã
modele”: T. W. Anderson, J. P. Benzécri, H. Hotelling, R. A. Fisher
 În momentul actual, econometria a devenit un instrument metodologic de
bază, indispensabil teoriei şi practicii economice pentru investigarea riguroasã
a fenomenelor şi proceselor economice.

8
Ce este econometria?

 Econometria ajută la identificarea şi măsurarea relaţiei de


cauzalitate care există între variabilele economice.
 Economiştii sunt interesaţi de descrierea legăturii dintre două
sau mai multe variabile.
 Relaţiile identificate între variabilele economice sunt folosite
pentru:
 analiza şi predicţia fenomenelor;

 adoptarea deciziilor, fundamentarea unor politici, în general,


la nivel macroeconomic (monetare, fiscale).

9
Ce este econometria?
Obiectul de studiu al econometriei
 Pe baza datelor din economie, econometria construieşte
modele (expresii cantitative) pentru realităţile economice
studiate care au un corespondent în teoriile economice.
 Econometria estimează, prin procedeele de inferenţă
statistică, parametrii modelelor şi realizează predicţii asupra
realităţii studiate.
 Aria de studiu a econometriei este realitatea economică privită
ca un ansamblu de relaţii şi intercondiţionări abordate cu
preponderenţă sub aspect cantitativ.

10
Exemple

 Relaţia dintre rata inflaţiei şi rata şomajului:


1
rata _ inf   o  1 
somaj
• Relaţia dintre venituri şi consum (modelul consumului
lui Keynes):
consum   o  1  venit

 Relaţia dintre cerere şi preţ: cerere   o  1  pret


 Relaţia dintre producţie şi factorii de producţie;
 Relaţia dintre rata dobânzii şi investiţii;
 Modelul econometric al veniturilor – venitul este funcţie
de nivelul de educaţie, experienţa în muncă, genul
persoanei etc. 11
12
13
Ce este econometria?
Metoda de lucru
 Econometria studiază realităţile economice sub aspect cantitativ,
cu ajutorul unui instrument specific: modelul econometric.

 În construcţia unui model econometric, economia trebuie tratată


ca sistem. Alegerea variabilelor trebuie făcută cu multă grijă,
într-o dependenţă fundamentată economic:

 Diminuarea ratei dobânzii  creşterea investiţiilor  scăderea


şomajului;
 În paralel, diminuarea ratei dobânzii  creşterea cererii pentru
bunurile durabile (cumpărate în rate)  creşterea importului unor
astfel de bunuri.
14
Modelul economic

Modelul, în sensul larg al cuvântului, este o reprezentare teoretică


şi simplificată a unui fenomen, proces sau sistem din lumea
reală.
Modelul este o schemă simplificată a realităţii studiate.
 Modelul economic - descrierea unei economii sau a unui
sector din economie, folosind anumite ipoteze simplificatoare
şi adecvate.
 Modelarea economică – exprimarea, prin relaţii matematice,
a dependenţelor deterministe existente între variabilele
economice analizate.

15
Modelul economic

Exemplu pentru un model economic


 Legea cererii – unul din factorii care determină cererea este
preţul
D   0  1 P
 D – cantitatea cerută
 P – preţul

  şi  constante reale,  0 >0 şi


0 1
1<0

 Relaţie deterministă, de tip liniar, de sens invers.

16
Modelul econometric

Modelul econometric presupune exprimarea modelului


economic într-o formă testabilă empiric.
De exemplu, modelul econometric al cererii este:
Modelul liniar: D   0  1 P  

Modelul neliniar: D   0  P 1  

unde, pe lângă variabilele D, P şi parametrii  0 , 1 , din modelul


economic, apare variabila reziduală  .
17
Modelul econometric

18
Modelul econometric

 Modelul econometric este compus din:


 O componentă deterministă care descrie legătura dintre
variabile atunci când nu există erori;

D   0   1P
 O componentă stochastică, eroare: 

19
Modelul econometric

 Modelul econometric este o ecuaţie sau un sistem de ecuaţii


construit pe baza variabilelor economice.

Forma generală a unui model econometric:

Y  f ( X 1 ,  , X j ,  , X k ;  0 , 1 ,  ,  j ,  ,  k )  
În orice model econometric, se întâlnesc următoarele elemente:
1) variabile observabile;
2) variabilele reziduale neobservabile;
3) parametrii (coeficienţii modelului).
20
Modelul econometric
Variabilele observabile se clasifică în:
 variabile independente (exogene, explicative , factor- X) şi
 variabile dependente (endogene, explicate, rezultat - Y).
- variabila dependentă, numită şi variabilă explicată, endogenă sau
răspuns, cuantifică un fenomen economic complex, determinat de o
serie de factori (este notată cu Y);
- variabila independentă, numită şi variabilă explicativă, exogenă sau
stimul, este o variabilă statistică prin intermediul căreia se măsoară
acţiunea unui factor economic asupra rezultantei (este notată cu X);
Variabila independentă este inclusă în modelul econometric cu scopul de a
explica modificările unei variabile endogene.
Variabilele independente sunt numite şi variabile factoriale sau factori de
influenţă care determină un anumit efect asupra variabilei rezultat.
Spre deosebire de variabila dependentă, pentru care pot fi obţinute valori
estimate, prin intermediul modelului, variabila independentă este descrisă de
date statistice obţinute exclusiv „din afara modelului“. 21
Modelul econometric

Variabila reziduală este o variabilă aleatoare, neobservabilă, a


cărei prezenţă în modelul econometric se poate justifica prin:

 alegerea neadecvată a formei funcţionale a dependenţei


deterministe în modelul economic;
 neincluderea în model a unor variabile exogene importante;
 existenţa unor posibile erori în măsurarea datelor.

22
Modelul econometric

 De regulă, variabila reziduală apare în model ca sumă a


tuturor influenţelor necunoscute sau care nu sunt specificate.
 În cercetarea econometrică, variabila eroare este o variabilă
aleatoare care respectă anumite proprietăţi numite şi ipoteze
clasice (ex: ipoteza de normalitate a erorilor).
 Se simbolizează cu  .

23
Modelul econometric

• Parametrii modelului (coeficienţii de regresie) sunt mărimi fixe, dar


necunoscute, cu ajutorul cărora se exprimă relaţiile dintre variabile în
cadrul modelului.
- se notează cu β şi fac obiectul procesului de estimare şi testare
statistică.

• Estimatorii sunt variabile aleatoare cu distribuţii de probabilitate


cunoscute şi cu proprietăţi specifice în baza cărora se realizează
procesul de estimare a parametrilor modelului econometric.
- se notează cu ̂ .

• Estimaţiile sunt valori posibile ale estimatorilor calculate la nivelul


unui eşantion sau set de date reale observate din realitate.
- se notează cu b.

24
Clasificarea modelelor econometrice
1) După natura dependenţei dintre variabile:
a) modele de regresie deterministe: Y=f(x)
- variabila dependentă este explicată în totalitate de variabila sau
variabilele independente din model.

b) modele de regresie probabiliste: Y=f(x) +ε,


- unde ε este o variabilă numită eroare sau reziduu, care
sintetizează ansamblul factorilor cu influenţă asupra variabilei Y,
dar care nu pot fi comensuraţi şi care nu sunt prinşi în mod
explicit în model.

25
Clasificarea modelelor econometrice

2) După numărul variabilelor independente incluse în model:


a) modele de regresie simplă (unifactoriale, univariate)
- variabila Y este explicată printr-un singur factor determinant,
ceilalţi factori au o acţiune aleatoare sau nesemnificativă.
Exemplu: funcţia de consum (consum-venituri).

b) modele de regresie multiplă (multivariate)


- variabila Y este explicată de doi sau mai mulţi factori.
Exemplu: funcţia de producţie, în care producţia depinde de
stocul de capital şi de forţa de muncă.

26
Clasificarea modelelor econometrice

3) După forma legăturii dintre variabile:


a) modele de regresie liniară – dacă Y este o funcţie liniară de
variabila sau variabile explicative;

Y  0  1 X  
b) modele de regresie neliniară

Y   0  1 X   2 X  
2

27
Clasificarea modelelor econometrice
4) După timpul la care se referă datele din model:
a) modele de regresie statice
- variabilele incluse în model se referă la acelaşi moment de
timp sau la aceeaşi perioadă de timp.
- se construiesc pe baza datelor de sondaj sau a cercetărilor de
moment.
b) modele de regresie dinamice
- sunt modele în care factorul timp apare explicit, ca variabilă
independentă:
Yt=f(t)+ε.

28
Demersul cercetării econometrice

Demersul metodologic al modelării econometrice


Demersul cercetării econometrice

a) Formularea problemei în termeni economici, plecând de la


o teorie economică.
Exemplu: legea cererii care postulează dependenţa deterministă a
cererii de preţ.

b) Specificarea modelului matematic al teoriei economice


Exemplu: modelul economic al cererii este dat de funcţia cerere ,
D   0  1 P

unde D – cererea, P – preţul unitar,  0  0 şi 1  0 .

30
Demersul cercetării econometrice

c) Specificarea modelului econometric, adică exprimarea


modelului economic într-o formă testabilă empiric.
De exemplu, modelul econometric al cererii este dat de
D   0  1 P  

unde, pe lângă variabilele D, P şi parametrii  0 , 1 , din modelul


economic, apare variabila reziduală  .
Această variabilă trebuie să satisfacă anumite ipoteze. (ex:
variabila reziduală urmează repartiţia probabilistă normală de
medie zero şi varianţă  2 )

31
Demersul cercetării econometrice

d) Estimarea parametrilor modelului econometric


- se realizează cel mai adesea prin metoda celor mai mici pătrate
(MCMMP);
- altă metodă de estimare a parametrilor modelului econometric:
metoda verosimilităţii maxime.

e) Testarea ipotezelor statistice


- se verifică semnificaţia statistică a parametrilor şi a
modelului, precum şi îndeplinirea condiţiilor cerute de teoria
economică şi de metodologia statistică.
32
Demersul cercetării econometrice

f) Testarea adecvării modelului econometric conduce la una


dintre situaţiile:
1) Modelul econometric nu este adecvat, situaţie în care
se reia analiza, începând cu reformularea etapei c);
2) Modelul econometric este adecvat, situaţie în care se
continuă analiza cu etapele următoare.

33
Demersul cercetării econometrice

g) Interpretarea parametrilor modelului econometric în cadrul


teoriei economice
De exemplu, în cazul funcţiei cerere, semnul minus al ratei
marginale indică faptul că cererea scade, dacă preţul creşte.

h) Utilizarea modelului econometric estimat pentru


predicţii şi luarea de decizii în politica economică

34
ECONOMETRIE

CURS 2
Regresia liniară simplă (RLS)

1. Modelul RLS
2. Estimarea punctuală a parametrilor modelului RLS
3. Estimarea prin interval de încredere a parametrilor modelului
RLS
4. Probleme specifice utilizând Excel şi SPSS
5. Estimarea indicatorilor de corelaţie (coeficientul de corelaţie,
raportul de corelaţie, raportul de determinaţie)

2
1. Modelul de regresie simplă liniară
Interpretarea geometrică şi statistică a regresiei
Exemplu
•Se consideră repartiţia a 50 de firme după profitul realizat (Y,
variabilă dependentă, sute mil. lei) şi cheltuielile cu publicitatea (X,
variabilă independentă, mil. lei).

•Pe baza datelor de mai sus, putem construi 5 repartiţii condiţionate.


3
1. Modelul de regresie simplă liniară
Interpretarea geometrică şi statistică a regresiei

4
1. Modelul de regresie simplă liniară
Interpretarea geometrică a regresiei
•Mediile condiţionate corespunzătoare celor 5 repartiţii:

5
1. Modelul de regresie simplă liniară

 O valoare a variabilei condiţionate Y | X  xi se poate scrie:


yxi  0  1 xi
 Dreapta de regresie: mediile distribuţiilor condiţionate

YX  0  1 X

6
1. Modelul de regresie simplă liniară

 Forma generală a unui model de regresie este: M(Y│X)=f(x).

 Pentru modelul de regresie liniară simplă forma modelului


devine:
M(Y│X) = β0+β1X
unde:
M(Y│X) – media condiţionată corespunzătoare variabilei
stohastice Y
β0 şi β1 – parametrii modelului.

7
1. Modelul de regresie simplă liniară

 În cele mai multe cazuri, valorile reale yi diferă de valorile


aşteptate (teoretice) M(Y│X=xi) = yxi = .
 Abaterea valorilor reale faţă de valorile teoretice reprezintă
valorile variabilei stohastice, ε, denumită eroare de modelare.

εi = yi – yxi = yi - M(Y│X=xi)  yi = M(Y│X=xi) + εi = β0+ β1xi + εi

Deci:
yi = β0+ β1xi + εi

sau Y= β0+ β1X + ε

8
1. Modelul RLS
 Componentele modelului RLS sunt:

1. Componenta deterministă este reprezentată de media


condiţionată: M(Y│X=xi) = β0+ β1xi

2. Componenta aleatoare ε depinde de: natura fenomenului,


specificarea incompletă a modelului şi erorile de măsurare.

9
1. Modelul de regresie simplă liniară
Parametrii modelului de regresie liniară simplă
Y

0
1
0 X
Linia de regresie sau media condiţionată

10
1. Modelul de regresie simplă liniară
Parametrii modelului de regresie liniară simplă
  o reprezintă constanta sau termenul liber al modelului şi reprezintă
valoarea medie a variabilei Y atunci când X=0.
M(Y|X=0) =
 Grafic, parametrul reprezintă ordonata la origine sau intersecţia
dreptei de regresie liniară cu axa OY (engl. intercept).

 1 reprezintă variaţia medie absolută a variabilei dependente, Y, la o


variaţie absolută cu o unitate a variabilei independente, X.

Daca
 Grafic, parametrul reprezintă tangenta unghiului format dintre dreapta
de regresie şi axa OX sau panta dreptei de regresie (engl. slope).
11
1. Modelul de regresie simplă liniară

 Dacă β1>0 => ceea ce indică o legătură directă sau pozitivă între variabilele
X şi Y (de exemplu, dacă X creşte cu o unitate, Y creşte, în medie, cu β1 unităţi);

 Dacă β1<0 => există o legătură inversă între variabilele Y şi X între variabile
există o legătură inversă (de exemplu, la o creştere a lui X cu o unitate, Y scade,
în medie, cu β1 unităţi);

 Dacă β1=0 nu există legătură de tip liniar între variabilele Y şi X.

12
1. Modelul de regresie simplă liniară

 La nivelul unui eşantion, modelul yi   0  1 xi   i poate fi scris pe


baza estimatorilor yi  ˆ0  ˆ1 xi  ˆi sau y i  yˆ i  ˆi .

unde:
- yˆ i  ˆ0  ˆ1 xi este estimatorul mediei condiţionate M(Y│X=xi);
- ̂ 0 este estimatorul parametrului  0
- ˆ este estimatorul parametrului  1
1
-  este estimatorul erorii stohastice εi
i
 Pentru un eşantion observat, modelul de regresie liniară simplă poate fi
scris:
yi  b0  b1 xi  ei

13
2. Estimarea punctulă a parametrilor
modelului RLS
Estimarea parametrilor modelului de regresie liniară
simplă
•Estimarea reprezintă procedeul de aflare a unui parametru al unei
populaţii (  o , 1 ) pe baza datelor înregistrate la nivelul unui
eşantion.

•Estimarea se poate realiza:


-punctual: metoda celor mai mici pătrate (MCMMP);

-prin interval de încredere.

•Problemele pe care le ridică estimarea parametrilor modelului de


regresie vizează metodele de determinare a estimatorilor,
proprietăţile estimatorilor obţinuţi printr-o anumită metodă şi
metodele de estimare a parametrilor. 14
2. Estimarea punctuală a parametrilor
modelului RLS
Estimarea parametrilor modelului de regresie liniară
simplă
•Metode de determinare a estimatorilor parametrilor modelului de
regresie: metoda celor mai mici pătrate, metoda momentelor,
metoda verosimilităţii maxime etc.

•Principalele proprietăţi ale estimatorilor parametrilor modelului de


regresie sunt: nedeplasarea, convergenţa, eficienţa.

•Metoda celor mai mici pătrate presupune estimarea unei linii de


regresie care să aproximeze cel mai bine datele reale, adică între
valorile estimate și cele reale să existe o distanță cât mai mică.

15
2. Estimarea punctuală a parametrilor
modelului RLS
Metoda celor mai mici pătrate (MCMMP)
•Criteriul
care stă la baza metodei celor mai mici pătrate constă în
minimizarea pătratelor erorii de modelare:
2

   
n n n n

 i  i i   yi  (ˆ0  ˆ1 xi )   yi  ˆ0  ˆ1 xi


 2 2
S 
ˆ 2
 y  ˆ
y  min
i 1 i 1 i 1 i 1

• Rezolvarea acestei probleme de minim presupune îndeplinirea a două


condiţii:
-anularea derivatelor parţiale de ordinul I ale lui S în raport cu ̂ 0 şi ̂1

S ( ˆ0 , ˆ1 ) şi S ( ˆ0 , ˆ1 )


0 0
ˆ ˆ  2S
0 1
2S 
 
-matricea derivatelor parţiale de   2 ˆ0 ˆ0 ˆ1 
det 2 0
ordinul doi să fie pozitiv definită:  S 2S 
 
 ˆ ˆ  1 
2 ˆ 16
 0 1
2. Estimarea punctulă a parametrilor
modelului RLS
Metoda celor mai mici pătrate (MCMMP)
•Anularea derivatelor parţiale de ordinul I ale lui S în raport cu estimatorii
celor doi parametri:

 
n n n
S
ˆ
2 y i  ˆ0  ˆ1 xi  1  0 nˆ0  ˆ1 x y i i
0 i 1
 i 1 i 1

 
n n n n
S
2 y i  ˆ0  ˆ1 xi  xi   0 ˆ0  xi  ˆ1  xi2  yx i i
 1 i 1 i 1 i 1 i 1

ˆ0 
 
yi  x x y
xi2 
;
i i i
ˆ1 
n x y x  y ;
i i i i ˆ0  y  ˆ1 x
n x   x  n x   x 
2 2 2 2
i i i i

•Matricea derivatelor parţiale de ordinul II


n
 x i 
 este pozitiv
 x x 2
definită fiindcă: n  x 2    x   n 2 2 . 0
2  i i 
i i
17
2. Estimarea punctulă a parametrilor
modelului RLS
Estimarea punctuală
• Parametrii modelului de regresie se estimează punctual, considerând
estimaţiile calculate la nivelul unui eşantion reprezentativ extras din
populaţia de referinţă, pe baza relaţiilor obţinute pentru estimatori:

sau

18
3. Estimarea prin interval de încredere a
parametrilor modelului RLS
Proprietăţile estimatorilor paramerilor modelului de
regresie
•Estimatorii parametrilor modelului de regresie sunt variabile de
selecţie care:
-urmează o repartiţie normală:  0

ˆ0 ~ N  0 , 2ˆ ˆ1 ~ N 1 , 2ˆ1  
-sunt nedeplasaţi:   M ˆ   
M ˆ0 ,   0 1 1

-sunt convergenţi: ˆ  ,  ˆ   


0 nN 0 1 nN 1

-sunteficienţi: dintre toţi estimatorii posibili pentru , are varianţa


cea mai mică.

19
3. Estimarea prin interval de încredere a
parametrilor modelului RLS

• Estimarea prin interval de încredere se bazează pe distribuţiile de


selecţie ale estimatorilor parametrilor  şi  .
0 1

• Atât pentru  0 , cât şi pentru 1 , intervalele de încredere se vor construi


pentru un nivel de încredere de (1-α):
IC (  0 ) : [ ˆ0  t / 2,n  k ˆ ˆ ] IC ( 1 ) : [ ˆ1  t / 2,n  kˆ ˆ ]
0 1

• Pe baza datelor de la nivelul unui eşantion, se vor utiliza estimaţiile


parametrilor:
IC (  0 ) : [b0  t / 2,n k s ˆ ] IC ( 1 ) : [b1  t / 2,n k sˆ ]
0 1

unde
k = numărul parametrilor estimaţi în model (pentru modelul liniar k=2),
n = volumul eşantionului pe baza căruia se fac estimările. 20
3. Estimarea prin interval de încredere a
parametrilor modelului RLS

• Abaterile standard ale estimatorilor şi estimaţiile acestora se determină


după relaţiile:

   

2 1 x 2   1 x 2 
ˆ  0  ˆ 2ˆ      , respectiv sˆ0  sˆ0  s  
2 2
2 

 i   n  xi  x  
2
0
n x  x 
 i   i 

ˆ 2 s2
ˆ   ˆ 2ˆ 
1 n
s
, respectiv ˆ1  s 2
ˆ1
 n

 ( xi  x)  i
1
2
( x  x) 2

i 1 i 1

unde ˆ 2 este estimatorul varianţei erorii de modelare, iar s 2 este


estimaţia acestuia:
ˆ  ˆ x ) 2 , respectiv 2  ei2  ( yi  b0  b1 xi ) 2
ˆ 2   i   i
ˆ 2
( y   0 1 i
s  
n2 n2 n2 n  2 21
Exemple de modele liniare simple în
teoria economică

Funcţia de consum
-consumul populaţiei în funcţie de venit:

Ci   0  1Vi   i , unde parametrul 1


 arată cu cât creşte consumul unui anumit produs (Ci ) la o creştere
cu o unitate a venitului;
 este de regulă pozitiv.

Legea cererii
-cererea în funcţie de preţul produselor:
Ci   0  1 Pi   i , unde parametrul 1
 arată cu cât scade cererea la o creştere a preţului cu o unitate.
 este de regulă negativ şi

22
4. Probleme specifice utilizând Excel si
SPSS

1. Se consideră datele cu privire la Nivelul studiilor (ani), X, şi


Venitul (euro), Y, pentru un eşantion de 5 angajaţi . Datele
sunt prezentate în tabelul următor.

xi yi

10 800
12 1000
12 1200
14 1600
16 1800

23
Estimatiile punctuale ale parametrilor

24
1. Tabelul coeficientilor de regresie

Rezultate Excel

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept -984,615 315,291 -3,123 0,052 -1988,011 18,781
Nivelul studiilor (ani) 176,923 24,325 7,273 0,005 99,509 254,337

Rezultate SPSS

25
Estimatiile punctuale ale parametrilor

Pentru eşantionul observat, modelul de regresie liniară simplă poate fi


scris:

Ecuatia dreptei de regresie este:

b1: Daca nivelul studiilor creste cu 1 an ( ), venitul creste, in


medie, cu 176,92 euro ( = ).
Daca nivelul studiilor creste cu 2 ani ( ), venitul creste, in
medie, cu 353,84 euro ( = ).
b0: Daca, ipotetic, nivelul studiilor este egal cu 0 ani, venitul mediu
estimat este egal cu -984,62 euro (M(Y|X=0) = . 26
Venitul estimat
in functie de
Venitul real
studii
Erorile

(euro)

Valorile 𝑦 reprezinta valorile venitului estimat in functie de studii, adica 𝑦 .


Daca X=10, atunci Yx=-984,62+176,92*10 --> Yx=784,62
Daca X=12, atunci Yx=-984,62+176,92*12 --> Yx=1138,46
Daca X=14, atunci Yx=-984,62+176,92*14 --> Yx=1492,31
Daca X=16, atunci Yx=-984,62+176,92*16 --> Yx=1846,15
27
Estimarea prin IC a parametrilor

 Estimarea prin IC a pantei dreptei:

; ;

Din tabelul Coefficients:


=176,92 (Unstd. Coeff.)
= 24,325 (Std. Error)

28
 In estimarea prin IC a pantei dreptei se foloseşte
statistica t Student.
 IC 95% este:
;

 Din Tabelul repartiţiei Student (Anexă) se citeşte


valoarea:

; = t0,025;3=3,182.

29
Valorile distribuţiei Student

v t0.1 t0.05 t0.025

1 3,078 6,314 12,706

2 1,886 2,920 4,303

3 1,638 2,353 3,182

... ... ... ...

19 2,093

∞ 1,96

30
 IC devine:

 Se poate garanta cu o probabilitate de 95% că


panta dreptei de regresie este acoperită de
intervalul (99,52; 254,32).
 La o crestere cu 1 an a nivelului de studii, venitul
creste, in medie, cu o valoare acoperita de
intervalul (99,52; 254,32) euro.

31
 Estimarea prin IC a ordonatei la origine:

; ;

Din tabelul Coefficients (de pe randul Intercept / Constant):


=-984,62 (Unstd. Coeff.)
= 315,291 (Std. Error)

32
 In estimarea prin IC a ordonatei la origine se
foloseşte statistica t Student.

 IC 95% este:

 Din Tabelul repartiţiei Student (Anexă) se citeşte


valoarea


; = t0,025;3=3,182.

33
 IC devine:

 Se poate garanta cu o probabilitate de 95% că


ordonata la origine este acoperită de intervalul
.
 Atunci cand, ipotetic, nivelului de studii este 0
ani, venitul mediu estimat este egal cu o valoare
acoperita de intervalul euro.

34
1. Tabelul coeficientilor de regresie

Rezultate Excel

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept -984,615 315,291 -3,123 0,052 -1988,011 18,781
Nivelul studiilor (ani) 176,923 24,325 7,273 0,005 99,509 254,337

Rezultate SPSS

35
1. Tabelul coeficientilor de regresie

36
5. Estimarea indicatorilor de corelaţie
Coeficientul de corelaţie (se foloseşte doar pentru modelul liniar):
N

cov( X , Y )
 (x i   x )( yi   y )
 ( X ,Y )   i 1 , -1≤ ρ ≤+1
 x y N x y

n n n n

 ( x  x)( y  y)
i i n xi yi  xi  yi
̂ ( X , Y )  r  i 1
 i 1 i 1 i 1
nsx s y n n n n
[n x  ( xi ) ][n y  ( yi ) 2 ]
2
i
2 2
i
i 1 i 1 i 1 i 1

•Legătura dintre estimația coeficientului de corelație (r) și estimația


coeficientului de regresie liniară (b1) se realizează prin relația:
s x2 2
r  b1 2
2 , unde s x şi
s y reprezintă estimațiile varianțelor variabilei
sy
X, respectiv a variabilei Y. 37
5. Estimarea indicatorilor de corelaţie
Coeficientul de corelaţie

38
2. Tabelul coeficientilor de corelatie

Rezultate SPSS

0,973

Legatura dintre Studii si Venit este o legatura directa si foarte


stransa.

39
Descompunerea variaţiei totale a variabilei Y

40
5. Estimarea indicatorilor de corelaţie

Descompunerea variaţiei totale a variabilei Y

VT = 
i
(yi - y )2 , reprezintă variaţia totală (Total Sum of Squares);

VE =  (yˆ i - y )2 , reprezintă variaţia explicată (Explained Sum of Squares);


i

𝑉 = (𝑦 − 𝑦 ) = 𝑒 , reprezintă variaţia reziduală (Residual Sum of Squares).

•Variaţia totală este egală cu suma celorlalte două variaţii componente

VT = VE  VR
(TSS = ESS + RSS)
41
Descompunerea variaţiei totale a variabilei Y

TSS = ESS + RSS

TSS = 688000 TSS 2

ESS= 651076,923 ESS 2

RSS 42
RSS = 36923,077
Descompunerea variaţiei totale a variabilei Y

3. Tabelul ANOVA de regresie

Rezultate Excel
ANOVA
df SS MS F Significance F
Regression 1 651076,9231 651076,923 52,9 0,005364071
Residual 3 36923,07692 12307,6923
Total 4 688000

TSS = ESS + RSS


TSS = Total Sum of Squares = 688000
ESS = Regression Sum of Squares = 651076,923
RSS = Residual Sum of Squares = 36923,077
43
3. Tabelul ANOVA de regresie

Rezultate SPSS

TSS = ESS + RSS


TSS = Total Sum of Squares = 688000
ESS = Regression Sum of Squares = 651076,923
RSS = Residual Sum of Squares = 36923,077
44
5. Estimarea indicatorilor de corelaţie
Raportul de determinaţie

 ( yˆ i  y ) 2
VE V
 2
 i
  1  R , cu 0 ≤ η2 ≤1
(y
i
i  y)2 VT VT

•O estimaţie a raportului de determinaţie se obţine prin relaţia:

 0 1
(b  b x  y ) 2
ESS RSS
R 2= i
  1
 i
(
i
y  y ) 2
TSS TSS

R2 măsoară ponderea variaţiei variabilei Y explicată prin variabila X.

45
Estimaţia raportului de determinaţie se obţine prin relaţia:

R2 măsoară ponderea variaţiei variabilei Y explicată prin variabila X.

Variatia Venitului este explicata in proportie de 94,6% de variatia


Nivelului studiilor.
Variatia Venitului este explicata in proportie de 5,4% de variatia factorilor
46
aleatori.
5. Estimarea indicatorilor de corelaţie
Raportul de corelaţie la nivelul populatiei totale
(parametrul)
0≤η≤1

Estimaţia raportului de corelaţie:

 (b  b x  y )
0 1
2
ESS RSS
R i
=  1
( y  y)
i
i
2
TSS TSS

47
Estimaţia raportului de corelaţie:

Legatura dintre Studii si Venit este o legatura foarte stransa.

48
4. Tabelul indicatorilor de corelatie
Rezultate Excel
SUMMARY OUTPUT

Regression Statistics

Multiple R 0,973
R Square 0,946
Adjusted R Square 0,928
Standard Error 110,940
Observations 5,000

Rezultate SPSS

49
2. Se consideră datele cu privire la Valoarea vânzărilor (sute mii
euro), Y, şi Cheltuielile cu publicitatea (sute euro), X, pentru un
eşantion de 4 firme. Datele sunt prezentate în tabelul următor.

xi yi

10 2500
20 4100
50 5000
100 7500

50
Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 .977a .954 .931 10.64486
a. Predictors: (Constant), chelt_publicitate

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound
1 (Constant) -45.163 15.015 -3.008 .095 -109.766 19.439
chelt_publicitate .019 .003 .977 6.422 .023 .006 .032
a. Dependent Variable: Val_vanzari

Correlations

vanzari chelt_publ
vanzari Pearson Correlation 1 .977*
Sig. (2-tailed) .023
N 4 4
chelt_publ Pearson Correlation .977* 1
Sig. (2-tailed) .023
N 4 4
*. Correlation is significant at the 0.05 level (2-tailed).
51
1. Tabelul coeficientilor de regresie

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound
1 (Constant) -45.163 15.015 -3.008 .095 -109.766 19.439
chelt_publicitate .019 .003 .977 6.422 .023 .006 .032
a. Dependent Variable: Val_vanzari

Pentru eşantionul observat, modelul de regresie liniară simplă poate fi


scris:

Daca cheltuielile de publicitate cresc cu 100 euro, atunci valoarea


vanzarilor creste, in medie, cu 1900 euro.

52
 Estimarea prin IC a pantei dreptei:

; ;

Din tabelul Coefficients:


=0,019 (Unstd. Coeff.)
= 0,003 (Std. Error)

53
 In estimarea prin IC a pantei dreptei se foloseşte
statistica t Student.

 IC 95% este:

 Din Tabelul repartiţiei Student (Anexă) se citeşte


valoarea


; = t0,025;2=4,303.

54
Valorile distribuţiei Student

v t0.1 t0.05 t0.025

1 3,078 6,314 12,706

2 1,886 2,920 4,303

3 1,638 2,353 3,182

... ... ... ...

19 2,093

∞ 1,96

55
 IC devine:

 Se poate garanta cu o probabilitate de 95% că


panta dreptei de regresie este acoperită de
intervalul .
 La o crestere cu 100 de euro a cheltuielior de
publicitate, vanzarile cresc, in medie, cu o valoare
acoperita de intervalul (600; 3200) euro.

56
ECONOMETRIE

CURSUL 3
CURS 3 - REGRESIA LINIARĂ SIMPLĂ
3.1. Testarea parametrilor de regresie
3.2. Testarea modelului de regresie
3.3. Testarea indicatorilor de corelaţie

3.4. Probleme specifice utilizând SPSS

2
3. Modelul de regresie liniară simplă
3.1. Testarea parametrilor modelului de regresie

1. Formularea ipotezelor:
H 0 : 0  0 H 0 : 1  0
H1 :  0  0 H1 : 1  0
2. Alegerea pragului de semnificaţie: α=0.05
3. Alegerea statisticii test:
ˆ0   0 H 0 ˆ0 ˆ1  1 H 0 ˆ1
t  ~ t ( n  2) t  ~ t ( n  2)
ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ
0 0 1 1

4. Determinarea valorii teoretice a testului:


tteoretic  t / 2; n  2 tteoretic  t / 2; n  2

5. Determinarea valorii calculate a testului:


b0 b1
tcalc  t calc 
sˆ s ˆ
1
3
0
3. Modelul de regresie liniară simplă
3.1. Testarea parametrilor modelului de regresie

6. Regula de decizie:
- dacă | t calc |  tteoretic , nu se respinge ipoteza H 0 cu o probabilitate 1- α
- , se respinge ipoteza cu un risc asumat α

4
3. Modelul de regresie liniară simplă
3.1. Testarea parametrilor modelului de regresie

6. Regula de decizie:
-
Se compara p-value (Sig.) si α
Sig.    H 0

Sig.

5
3. Modelul de regresie liniară simplă
3.1. Testarea parametrilor modelului de regresie

6. Regula de decizie:
- dacă | t calc | tteoretic , se respinge ipoteza H 0 cu un risc asumat α

6
3. Modelul de regresie liniară simplă
3.1. Testarea parametrilor modelului de regresie

6. Regula de decizie:
-
Se compara p-value (Sig.) si α
Sig.    H 1

Sig.

7
3. Modelul de regresie liniară simplă
Probleme specifice utilizând Excel

Aplicaţia (1)

 Se consideră datele cu privire la Nivelul studiilor (ani), X, şi


Venitul (euro) pentru un eşantion de 5 angajaţi. Datele sunt
prezentate în tabelul următor.

xi yi
10 800
12 1000
12 1200
14 1600
16 1800
64 6400

8
Rezultate Excel
SUMMARY OUTPUT

Regression Statistics
Multiple R 0,973
R Square 0,946
Adjusted R Square 0,928
Standard Error 110,940
Observations 5,000

ANOVA
df SS MS F Significance F
Regression 1 651076,9231 651076,9231 52,9 0,005364071
Residual 3 36923,07692 12307,69231
Total 4 688000

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept -984,615 315,291 -3,123 0,052 -1988,011 18,781
Nivelul studiilor (ani) 176,923 24,325 7,273 0,005 99,509 254,337
9
3. Modelul de regresie liniară simplă
Testarea semnificatiei pantei dreptei

1. Formularea ipotezelor:
H 0 : 1  0
H1 : 1  0
2. Alegerea pragului de semnificaţie: α=0.05
ˆ1  1 H 0 ˆ1
3. Alegerea statisticii test: testul Student t   ~ t ( n  2)
ˆ ˆ ˆ ˆ
1 1

4. Determinarea valorii teoretice (critice) a testului: tteoretic  t / 2; n 2

Din Tabelul repartiţiei Student (Anexă) se citeşte valoarea:

;
= t0,025;3=3,182.

10
Valorile distribuţiei Student

v=(n-2)gl t0.1 t0.05 t0.025

1 3,078 6,314 12,706

2 1,886 2,920 4,303

3 1,638 2,353 3,182

... ... ... ...

19 2,093

∞ 1,96

11
3. Modelul de regresie liniară simplă
Testarea semnificatiei pantei dreptei

5. Determinarea valorii calculate a testului:

Din tabelul Coefficients:


=176,92 (Unstd. Coeff.)
= 24,325 (Std. Error)

12
3. Modelul de regresie liniară simplă
3.1. Testarea semnificatiei pantei dreptei de regresie

6. Regula de decizie:
- dacă | t calc |  tteoretic , nu se respinge ipoteza H 0
- dacă | t calc | tteoretic , se respinge ipoteza H 0 cu un risc asumat α

Se compara p-value (Sig.) si α


Sig.    H 1
Sig.    H 0

13
3. Modelul de regresie liniară simplă
3.1. Testarea semnificatiei pantei dreptei de regresie

7. Decizia:

Deoarece ( =3,182)

, se respinge ipoteza H 
0

Deci, cu un risc de 5%, putem afirma ca panta dreptei de regresie difera


semnificativ de 0. Deci, legatura dintre Venit si Studii este semnificativa
statistic.
14
3. Modelul de regresie liniară simplă
Testarea semnificatiei ordonatei la origine

1. Formularea ipotezelor:
H 0 : 0  0
H1 :  0  0
2. Alegerea pragului de semnificaţie: α=0.05
3. Alegerea statisticii test: testul Student

4. Determinarea valorii teoretice (critice) a testului: tteoretic  t / 2; n 2

Din Tabelul repartiţiei Student (Anexă) se citeşte valoarea:

;
= t0,025;3=3,182.

15
3. Modelul de regresie liniară simplă
Testarea semnificatiei ordonatei la origine

5. Determinarea valorii calculate a testului:


b0
tcalc 
sˆ
0

Din tabelul Coefficients:


=-984,62 (Unstd. Coeff.)
= 315,29 (Std. Error)

16
3. Modelul de regresie liniară simplă
3.1. Testarea semnificatiei ordonatei la origine

6. Regula de decizie:
- dacă | t calc |  tteoretic , nu se respinge ipoteza H 0
- dacă | t calc | tteoretic , se respinge ipoteza H 0 cu un risc asumat α

Se compara p-value (Sig.) si α


Sig.    H 1
Sig.    H 0

17
3. Modelul de regresie liniară simplă
3.1. Testarea semnificatiei ordonatei la origine

7. Decizia:

Deoarece ( =3,182)

, nu se respinge ipoteza H 0 

Deci, cu o probabilitate de 95%, putem afirma ca ordonata la origine nu


difera semnificativ de 0.
18
1. Tabelul coeficientilor de regresie

19
3. Modelul de regresie liniară simplă
3.2. Testarea modelului de regresie

1.Formularea ipotezelor:
(modelul nu este semnificativ, adică X nu explică semnificativ variaţia lui Y)
(modelul este bine specificat sau modelul explică semnificativ legătura liniară dintre
cele două variabile)

2.Alegerea pragului de semnificaţie: α=0.05


3.Alegerea statisticii test: statistica test Fisher

4.Determinarea valorii teoretice a testului:


; ; ;

20
3. Modelul de regresie liniară simplă
3.2. Testarea modelului de regresie

1.Formularea ipotezelor:
(modelul nu este semnificativ, adică X nu explică semnificativ variaţia lui Y)
(modelul este bine specificat sau modelul explică semnificativ legătura liniară dintre
cele două variabile)

2.Alegerea pragului de semnificaţie: α=0.05


3.Alegerea statisticii test: statistica test Fisher

1.Determinarea valorii teoretice a testului:

; ; ;

2.Determinarea valorii calculate a testului (relaţia scrisă pentru date de la


nivelul eşantionului):
ESS 2

RSS 21
2. Modelul de regresie liniară simplă
3.2. Testarea modelului de regresie
6. Regula de decizie:
- dacă Fcalc  Fteoretic , nu se respinge ipoteza H 0 cu o probabilitate 1- α

- SAU Sig.    H 0

𝑆𝑖𝑔.

𝑐𝑎𝑙𝑐

22
2. Modelul de regresie liniară simplă
3.2. Testarea modelului de regresie
6. Regula de decizie:
- dacă Fcalc  Fteoretic , se respinge ipoteza H 0 cu un risc asumat α

- SAU Sig.    H1

𝑆𝑖𝑔.

𝑐𝑎𝑙𝑐

23
7. Luarea deciziei
3. Tabelul ANOVA de regresie (RLS)

24
3. Modelul de regresie liniară simplă
3.2. Testarea modelului de regresie dintre Studii si Venit

1.Formularea ipotezelor:
(modelul nu este semnificativ; Studiile nu explică semnificativ variaţia Venitului)
(modelul este bine specificat sau modelul explică semnificativ legătura liniară dintre
Studii si Venit)

2.Alegerea pragului de semnificaţie: α=0.05


3.Alegerea statisticii test: Testul Fisher

4.Determinarea valorii teoretice a testului:


; ; ;

Din tabelul repartitiei Fisher, se citeste valoarea teoretica (critica) a testului:

, ; ;

25
Tabelul Fisher
v2/v1 1 2 3 4 5 6 7
1 161,448 199,500 215,707 224,583 230,162 233,986 236,768

2 18,513 19,000 19,164 19,247 19,296 19,330 19,353

3 10,128 9,552 9,277 9,117 9,014 8,941 8,887


4 7,709 6,944 6,591 6,388 6,256 6,163 6,094
5 6,608 5,786 5,410 5,192 5,050 4,950 4,876

6 5,987 5,143 4,757 4,534 4,387 4,284 4,207


n>120 3,842 2,996 2,605 2,372 2,214 2,099 2,010

26
3. Modelul de regresie liniară simplă
3.2. Testarea modelului de regresie
5. Determinarea valorii calculate a testului (la nivelul eşantionului):

ANOVA

df SS MS F Significance F
Regression k-1 = 1 ESS = 651076,92 651076,92 52,9 0,0054
Residual n-k = 3 RSS = 36923,077 12307,692
Total n-1 =4 TSS = 688000

27
2. Modelul de regresie liniară simplă
3.2. Testarea modelului de regresie
6. Regula de decizie:
- dacă Fcalc  Fteoretic , nu se respinge ipoteza H 0 cu o probabilitate 1- α
- dacă Fcalc  Fteoretic , se respinge ipoteza H 0 cu un risc asumat α

Se compara p-value (Sig.) si α


Sig.    H1
Sig.    H 0

7. Luarea deciziei

128  H1

Deci, exista o legatura liniara semnificativa intre Venit si Studii.


28
Modelul RLS este semnificativ statistic.
3. Modelul de regresie liniară simplă
3.3. Testarea indicatorilor de corelaţie
Testarea coeficientului de corelaţie 
1.Formularea ipotezelor:
H0 :  0 (între cele două variabile nu există o legătură de tip liniar sau cele două variabile nu sunt
corelate semnificativ)
H1 :   0 (coeficientul de corelaţie este semnificativ statistic, adică cele două variabile sunt corelate
semnificativ; legătura de tip liniar dintre cele două variabile este semnificativă)
2.Alegerea pragului de semnificaţie: α=0.05
3.Alegerea statisticii test : statistica test Student

4.Determinarea valorii teoretice a testului:


tteoretic  t / 2; n  2

5.Determinarea valorii calculate a testului (la nivelul eşantionului observat):

29
3. Modelul de regresie liniară simplă
3.3. Testarea indicatorilor de corelaţie
6. Regula de decizie:
- dacă | tcalc | tteoretic, nu se respinge ipoteza H 0 ( ρ nu este semnificativ)
- dacă | t calc | tteoretic, se respinge ipoteza H 0 cu un risc asumat α ( ρ este
semnificativ)

7. Luarea deciziei 30
3. Modelul de regresie liniară simplă
Testarea semnificatiei coeficientului de corelatie

1. Formularea ipotezelor:
(Variabilele Studii si Venit nu sunt corelate semnificativ; nu există o
legătură de tip liniar intre Studii si Venit)
(Variabilele Studii si Venit sunt corelate semnificativ; există o legătură de
tip liniar intre Studii si Venit)
2. Alegerea pragului de semnificaţie: α=0.01
3. Alegerea statisticii test: testul Student

4. Determinarea valorii teoretice (critice) a testului: tteoretic  t / 2; n 2

Din Tabelul repartiţiei Student (Anexă) se citeşte valoarea:

;
= t0,005;3=5,841

31
4. Determinarea valorii calculate a testului (relaţia scrisă pentru
date de la nivelul eşantionului):

, , , ,
= =7,25
, , , ,

Tabelul coeficientilor de corelatie

0,973

32
3. Modelul de regresie liniară simplă
3.3. Testarea indicatorilor de corelaţie
6. Regula de decizie:
- dacă | tcalc | tteoretic, nu se respinge ipoteza H 0 cu o probabilitate 1- α
- dacă | t calc | tteoretic, se respinge ipoteza H 0 cu un risc asumat α ( ρ este
semnificativ)

33
3. Modelul de regresie liniară simplă
3.3. Testarea indicatorilor de corelaţie

7. Decizia:

Deoarece ( =5,841)

, se respinge ipoteza H 
0

Deci, cu un risc de 1%, coeficientul de corelatie Pearson difera semnificativ


de 0. Deci, legatura dintre Venit si Studii este semnificativa statistic.

34
3. Modelul de regresie liniară simplă
3.3. Testarea indicatorilor de corelaţie
Testarea raportului de determinaţie η2
1.Formularea ipotezelor:
 02  0
H 0 : (între cele două variabile nu există o legătură semnificativă de tip liniar)

 02  0
H1 :  (între cele două variabile există o legătură semnificativă de tip liniar)

2.Alegerea pragului de semnificaţie: α=0.05


3.Alegerea statisticii test : statistica test Fisher

4.Determinarea valorii teoretice a testului:


Fteoretic  F ; k -1; n  k

5.Determinarea valorii calculate a testului (la nivelul eşantionului):

35
3. Modelul de regresie liniară simplă
3.3. Testarea indicatorilor de corelaţie
6. Regula de decizie:
- dacă Fcalc  Fteoretic, nu se respinge ipoteza H 0 ( η2 nu este semnificativ)
- dacă Fcalc  Fteoretic, se respinge ipoteza H 0 cu un risc asumat α ( η2 este
semnificativ)

7. Luarea deciziei 36
3. Modelul de regresie liniară simplă
3.3. Testarea indicatorilor de corelaţie
Testarea raportului de determinaţie η2 dintre Studii si Venit
1.Formularea ipotezelor:
 02  0
H 0 : (între Studii si Salariul curent nu există o legătură semnificativă de tip liniar)

 02  0
H1 :  (între Studii si Salariul curent există o legătură semnificativă de tip liniar)

2.Alegerea pragului de semnificaţie: α=0.05


3.Alegerea statisticii test: statistica test Fisher

4.Determinarea valorii teoretice a testului:


; ; ;

Din tabelul repartitiei Fisher, se citeste valoarea teoretica (critica) a testului:

, ; ; 37
Tabelul Fisher
v2/v1 1 2 3 4 5 6 7
1 161,448 199,500 215,707 224,583 230,162 233,986 236,768

2 18,513 19,000 19,164 19,247 19,296 19,330 19,353

3 10,128 9,552 9,277 9,117 9,014 8,941 8,887


4 7,709 6,944 6,591 6,388 6,256 6,163 6,094
5 6,608 5,786 5,410 5,192 5,050 4,950 4,876

6 5,987 5,143 4,757 4,534 4,387 4,284 4,207


n>120 3,842 2,996 2,605 2,372 2,214 2,099 2,010

38
3. Modelul de regresie liniară simplă
3.3. Testarea indicatorilor de corelaţie
Testarea raportului de determinaţie η2
Determinarea valorii calculate a testului (la nivelul eşantionului):

39
2. Modelul de regresie liniară simplă
3.2. Testarea indicatorilor de corelatie
6. Regula de decizie:
- dacă Fcalc  Fteoretic , nu se respinge ipoteza H 0 cu o probabilitate 1 – α
- dacă Fcalc  Fteoretic , se respinge ipoteza H 0 cu un risc asumat α

Se compara p-value (Sig.) si α


Sig.    H1
Sig.    H 0

7. Luarea deciziei

128  H1

Deci, exista o legatura liniara semnificativa intre Venit si Studii, in


conditiile unui risc de 5%. 40
3. Modelul de regresie liniară simplă
3.3. Testarea indicatorilor de corelaţie
Testarea raportului de corelaţie η
1.Formularea ipotezelor:
(între cele două variabile nu există o legătură semnificativă de tip liniar)

(între cele două variabile există o legătură semnificativă de tip liniar)

2.Alegerea pragului de semnificaţie: α=0.05


3.Alegerea statisticii test : statistica test Fisher

4.Determinarea valorii teoretice a testului:


Fteoretic  F ; k -1; n  k

5.Determinarea valorii calculate a testului (la nivelul eşantionului):

41
3. Modelul de regresie liniară simplă
3.3. Testarea indicatorilor de corelaţie
6. Regula de decizie:
- dacă Fcalc  Fteoretic, nu se respinge ipoteza H 0 ( η2 nu este semnificativ)
- dacă Fcalc  Fteoretic, se respinge ipoteza H 0 cu un risc asumat α ( η2 este
semnificativ)

7. Luarea deciziei 42
3. Modelul de regresie liniară simplă
Probleme specifice utilizând SPSS
Aplicaţia (2)
• Se consideră datele cu privire la valoarea vânzărilor şi cheltuielile cu
publicitatea pentru un eşantion de 4 firme. Datele sunt prezentate în
tabelul următor:

43
3. Modelul de regresie liniară simplă
Probleme specifice utilizând SPSS
Rezultatele modelării econometrice
Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 .977a .954 .931 10.64486
a. Predictors: (Constant), chelt_publicitate
Coefficientsa

Unstandardized Standardized
Coefficients Coefficients 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound
1 (Constant) -45.163 15.015 -3.008 .095 -109.766 19.439
chelt_publicitate .019 .003 .977 6.422 .023 .006 .032
a. Dependent Variable: Val_vanzari

Correlations

vanzari chelt_publ
vanzari Pearson Correlation 1 .977*
Sig. (2-tailed) .023
N 4 4
chelt_publ Pearson Correlation .977* 1
Sig. (2-tailed) .023
N 4 4
44
*. Correlation is significant at the 0.05 level (2-tailed).
3. Modelul de regresie liniară simplă
Probleme specifice utilizând SPSS
Aplicaţia (3)
Se consideră rata mortalităţii infantile şi PIB-ul (Produsul Intern Brut)
înregistrate pentru judeţele României, în anul 2010.

1. Reprezentarea grafică a legăturii dintre cele două variabile analizate

45
3. Modelul de regresie liniară simplă
Probleme specifice utilizând SPSS
Aplicaţia (3) – rezultatele modelării econometrice
2. Estimarea şi testarea parametrilor de regresie

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound
1 (Constant) 13,636 ,825 16,526 ,000 11,969 15,304
PIB -,00016 ,00004 -,00016 -4,140 ,000 -,00023 -,00008
a. Dependent Variable: Rata mortalitatii infantile

46
3. Modelul de regresie liniară simplă
Probleme specifice utilizând SPSS
Aplicaţia (3) – rezultatele modelării econometrice
3. Estimarea şi testarea coeficientului de corelaţie

Correlations

Rata
mortalitatii
infantile PIB
Rata mortalitatii infantile Pearson Correlation 1 -,548**
Sig. (2-tailed) ,000
N 42 42
PIB Pearson Correlation -,548** 1
Sig. (2-tailed) ,000
N 42 42
**. Correlation is significant at the 0.01 level (2-tailed).

47
3. Modelul de regresie liniară simplă
Probleme specifice utilizând SPSS
Aplicaţia (3) – rezultatele modelării econometrice
4. Estimarea şi testarea raportului de determinaţie şi raportului de
corelaţie
Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 ,548 a ,300 ,282 2,0406
a. Predictors: (Constant), PIB

5. Testarea modelului de regresie (Estimarea şi testarea raportului de


determinaţie şi raportului de corelaţie)
ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 71,382 1 71,382 17,142 ,000a
Residual 166,568 40 4,164
Total 237,951 41
a. Predictors: (Constant), PIB 48
b. Dependent Variable: Rata mortalitatii infantile
ECONOMETRIE

CURSUL 4
CURS 4 - REGRESIA LINIARĂ SIMPLĂ
4.1. Regresia prin origine
4.2. Exemplu de model RLS prin origine

2
Regresia prin origine (1)

 Modelul de regresie prin origine:


Y  1 X  
2000

1500
Venit

1000 y = 101.9x
R² = 0.9823
500

0
0 5 10 15 20
Studii
3
Regresia prin origine (2)

 Există situaţii în care am putea construi un model


de regresie prin origine:

 În urma testării parametrilor modelului, parametrul β0 are


o valoare nesemnificativă statistic, iar parametrul β1 este
semnificativ statistic;

 Există suport teoretic care să impună estimarea unui


model care trece prin origine.

4
Regresia prin origine (3)

 În cazul modelului de regresie prin origine, aplicarea


metodei celor mai mici pătrate se simplifică.

 Problema de minim care trebuie rezolvată este de


forma:

5
Regresia prin origine (4)
 Prin anularea derivatei de ordinul întâi se obţine:

 Estimatorul ˆ1 este nedeplasat.


 Avem n-1 grade de libertate.
6
Regresia prin origine (5)
 Probleme ale utilizării în practică:
o Suma erorilor nu mai este zero;

o R2 poate avea o valoare foarte mare, prin urmare,


interpretarea acestuia nu mai are sens.
o Se utilizează o variantă a lui R2, şi anume:

 Aceste probleme dispar dacă modelul de regresie liniară


are variabilele standardizate.
o În acest caz, panta dreptei de regresie are aceeaşi valoare cu
coeficientul de corelaţie Pearson.
7
Exemplu de model RLS prin origine

 Se consideră datele cu privire la xi yi


Nivelul studiilor (ani), X, şi
Venitul (lei) pentru un eşantion
de 5 angajaţi . Datele sunt 10 800
prezentate în tabelul următor. 12 1000
12 1200
14 1600
16 1800

64 6400

8
Exemplu de model RLS prin origine

 Tabelul coeficienţilor de regresie

Standard
Coefficients Error t Stat P-value Lower 95% Upper 95%
Intercept 0 #N/A #N/A #N/A #N/A #N/A
Nivelul studiilor (ani) 101,9048 6,834619 14,91009 0,000118 82,92882 120,8807

 Tabelul ANOVA

Significance
df SS MS F F
Regression 1 8723048 8723048 222,3107 0,000655
Residual 4 156952,4 39238,1
Total 5 8880000

9
 Raportul de corelaţie şi raportul de determinaţie

Regression Statistics

Multiple R 0,991123

R Square 0,982325

Adjusted R Square 0,732325

Standard Error 198,0861


Observations 5

10
ECONOMETRIE

Tema 3 – Regresie liniara multipla


MODELUL DE REGRESIE LINIARĂ MULTIPLĂ
1. Prezentarea modelului
2. Estimarea parametrilor modelului
3. Estimarea indicatorilor de corelaţie (coeficientul de corelaţie
parţială, raportul de corelaţie, raportul de determinaţie)
4. Testarea parametrilor modelului
5. Testarea indicatorilor de corelaţie
6. Testarea modelului de regresie
7. Testarea influenței marginale a unei variabile independente
8. Modele cu variabile standardizate – Ierarhizarea inportanţei
factorilor de influenţă (variabilelor independente)
9. Probleme specifice utilizând SPSS
Modelul de regresie liniară multiplă
1. Prezentare generală

Ecuaţia modelului de regresie liniară multiplă


•Considerăm un model de regresie liniară multiplă care conţine p
variabile independente: .
•Formal, modelul este dat prin relaţia:
Y  M Y / X      0   1 X 1   2 X 2  ...   p X p  
•unde:
 Y este variabila dependentă;
 sunt cele p variabile independente;
 este variabila eroare sau reziduu;
 reprezintă cei k (k = p+1) parametrii ai modelului sau coeficienţi
de regresiei
Modelul de regresie liniară multiplă
1. Prezentare generală

Ecuaţia modelului de regresie liniară multiplă


•Modelul multiplu admite şi o abordare cu ajutorul matricelor. Acesta se
poate scrie sub formă matriceală astfel:

•iar:
 p este numărul de variabile independente;
 k este numărul de parametri din model;
 n este volumul de date disponibile.
Modelul de regresie liniară multiplă
1. Prezentare generală
Interpretarea coeficienţilor de regresie
• este valoarea medie a variabilei dependente, în condiţiile în care
influenţa variabilelor independente este nulă (X1=0, X2=0, …., Xp=0).
Acest parametru se numeşte constanta sau termenul liber al modelului,
pentru că este coeficientul asociat unei variabile degenerate, 1;
• este coeficient de regresie parţial și indică efectul sau influenţa
parţială a unei variabile explicative asupra variabilei explicate,
considerând constante sau eliminând efectul celorlalte variabile
independente;

• arată variaţia absolută a variabilei dependente la o variaţie absolută


cu o unitate a variabilei independente , în condiţiile în care influenţa
celorlalte variabile independente este menținută constantă sau este
controlată;
Modelul de regresie liniară multiplă
2. Estimarea parametrilor modelului
Estimarea parametrilor modelului de regresie liniară
multiplă
•Estimarea reprezintă procedeul de determinare a unui parametru al
unei populaţii pe baza datelor înregistrate la nivelul unui eşantion.

•Estimarea se poate realiza:


-punctual: metoda celor mai mici pătrate (MCMMP);

-prin interval de încredere.

•Problemele pe care le ridică estimarea parametrilor modelului de


regresie vizează metodele de determinare a estimatorilor,
proprietăţile estimatorilor obţinuţi printr-o anumită metodă şi
metodele de estimare a parametrilor.
Modelul de regresie liniară multiplă
2. Estimarea parametrilor modelului
Estimarea parametrilor modelului de regresie liniară
multiplă
•considerăm modelul de regresie liniară multiplă, cu două variabile
independente, la nivelul unei populații:

•la nivelul unui eşantion, acesta devine:


Modelul de regresie liniară multiplă
2. Estimarea parametrilor modelului
Metoda celor mai mici pătrate (MCMMP)
•MCMMP presupune ca estimatorii parametrilor modelului de regresie să
respecte condiţia:

• Prin rezolvarea problemei de minim, se obţine sistemul de ecuaţii:


Modelul de regresie liniară multiplă
2. Estimarea parametrilor modelului
Estimarea punctuală
• Parametrii modelului de regresie  j se estimează punctual,
considerând estimaţiile b j calculate la nivelul unui eşantion
reprezentativ extras din populaţia de referinţă, pe baza relaţiilor
obţinute pentru estimatorii ̂ j .

Estimarea prin interval de încredere


• Pe baza datelor de la nivelul unui eşantion, se vor utiliza estimaţiile
parametrilor:


 j  b j  t / 2,nk  sˆ , b j  t / 2,nk  sˆ
j j

Modelul de regresie liniară multiplă
3. Estimarea indicatorilor de corelaţie
a) Coeficientul de corelaţie parţială

r12  ry1ry 2
r12. y 
(1  ry21 )(1  ry22 )
Modelul de regresie liniară multiplă
3. Estimarea indicatorilor de corelaţie

Coeficienţi de corelaţie parţială măsoară dependenţa dintre


variabile prin excluderea succesivă a influenţei celorlalţi factori,
considerând influenţa lor constantă (variabile de control) și
menţinând numai influenţa factorului măsurat.
În funcţie de numărul variabilelor a căror influenţă se menține
constantă, coeficienţii de corelaţie parţială pot fi:
 de ordinul întâi (pentru o variabilă de control),

 de ordinul doi (pentru două variabile de control)

 etc.

11
Modelul de regresie liniară multiplă
3.Estimarea indicatorilor de corelaţie
unde:
Modelul de regresie liniară multiplă
3.Estimarea indicatorilor de corelaţie
b) Raportul de determinaţie multiplă
Modelul de regresie liniară multiplă
3. Estimarea indicatorilor de corelaţie
c) Raportul de corelaţie multiplă
Modelul de regresie liniară multiplă
3. Estimarea indicatorilor de corelaţie
d) Raportul de determinaţie multiplă ajustat
Modelul de regresie liniară multiplă
4. Testarea parametrilor modelului de regresie
1. Formularea ipotezelor:

2. Alegerea pragului de semnificaţie: α=0.05


3. Alegerea statisticii test:
Modelul de regresie liniară multiplă
4. Testarea parametrilor modelului de regresie

4. Determinarea valorii teoretice a testului:

5. Determinarea valorii teoretice a testului:

6. Regula de decizie:
3. Modelul de regresie liniară multiplă
5. Testarea indicatorilor de corelaţie
a) Testarea coeficientului de corelaţie bivariată
3. Modelul de regresie liniară multiplă
5. Testarea indicatorilor de corelaţie
3. Modelul de regresie liniară multiplă
5. Testarea indicatorilor de corelaţie
b) Testarea coeficientului de corelaţie parţială
3. Modelul de regresie liniară multiplă
5. Testarea indicatorilor de corelaţie
c) Testarea raportului de corelaţie si a raportului de determinaţie

Raportul de determinaţie si raportul de corelatie


se testează cu testul F după algoritmul prezentat la
modelul liniar simplu, ţinând cont de faptul că k=p+1
reprezintă numărul parametrilor modelului multiplu.

22
3. Modelul de regresie liniară mutiplă
6. Testarea modelului de regresie
3. Modelul de regresie liniară multiplă
4. Testarea modelului de regresie
3. Modelul de regresie liniară multiplă
7. Testarea influenţei marginale a unei variabile independente
Testarea influenţei marginale a unei variabile
independente introduse în model
EXEMPLUL 1

H0: variabila Months since hire (Vechimea) nu are o


influenţă semnificativă asupra Salariului.
H1: variabila Months since hire (Vechimea) are o influenţă
semnificativă asupra Salariului.
Model Summary

Change Statistics
Adjusted Std. Error of R Square
Model R R Square R Square the Estimate Change F Change df1 df2 Sig. F Change
1 .661a .436 .435 $12,833.540 .436 365.381 1 472 .000
2 .663b .439 .437 $12,815.280 .003 2.346 1 471 .126
a. Predictors: (Constant), Educational Level (years)
b. Predictors: (Constant), Educational Level (years), Months since Hire
EXEMPLUL 2

H0: variabila Beginning Salary (Salariul la angajare) nu are


o influenţă semnificativă asupra Salariului curent.
H1: variabila Beginning Salary (Salariul la angajare) are o
influenţă semnificativă asupra Salariului curent.
Model Summary

Change Statistics
Adjusted Std. Error of R Square
Model R R Square R Square the Estimate Change F Change df1 df2 Sig. F Change
1 .661 a .436 .435 $12,833.540 .436 365.381 1 472 .000
2 .890 b .792 .792 $7,796.524 .356 807.889 1 471 .000
a. Predictors: (Constant), Educational Level (years)
b. Predictors: (Constant), Educational Level (years), Beginning Salary
3. Modelul de regresie liniară multiplă
7. Testarea influenţei marginale a unei variabile independente
Testarea influenţei marginale a unei variabile
independente excluse din model
EXEMPLUL 3

H0: variabila People living in cities (Populația din urban) nu


are o influenţă semnificativă asupra Mortalităţii infantile)
H1: variabila People living in cities (Populația din urban) are
o influenţă semnificativă asupra Mortalităţii infantile)
Model Summary

Change Statistics
Adjusted Std. Error of R Square
Model R R Square R Square the Estimate Change F Change df1 df2 Sig. F Change
1 .910a .828 .818 5.2961 .828 83.271 4 69 .000
2 .907b .822 .814 5.3542 -.006 2.544 1 69 .115
a. Predictors: (Constant), Average female life expectancy, People living in cities (%), Daily calorie intake, People who read (%)
b. Predictors: (Constant), Average female life expectancy, Daily calorie intake, People who read (%)
3. Modelul de regresie liniară multiplă
8. Ierarhizarea importanţei factorilor de influenţă

30
3. Modelul de regresie liniară multiplă
8. Ierarhizarea importanţei factorilor de influenţă
3. Modelul de regresie liniară multiplă
8. Ierarhizarea importanţei factorilor de influenţă
•Fiecare coeficient arată impactul parţial al variaţiei cu o
unitate a variabilei independente standardizate asupra
variabilei dependente standardizate.
•În urma standardizării, discutăm despre variaţia în unităţi
de abateri standard pentru fiecare variabilă.
• Valoarea coeficienţilor de regresie din modelul
standardizat se interpretează ca unităţi de abateri
standard pentru variabila dependentă.
•Cel mai mare coeficient în valoare absolută indică cea mai
mare influenţă asupra variabilei dependente, iar semnul
coeficientului arată sensul acestei influenţe.

32
Exemplu

33
3. Modelul de regresie liniară multiplă
9. Probleme specifice utilizând SPSS
Aplicaţia (1)
• Se consideră rata mortalităţii infantile, PIB-ul (Produsul Intern Brut) şi
populaţia urbană înregistrate pentru judeţele României, în anul 2013.
3. Modelul de regresie liniară multiplă
9. Probleme specifice utilizând SPSS
Aplicaţia (1) – rezultatele modelării econometrice
1. Estimarea şi testarea parametrilor de regresie
Coefficientsa

Unstandardized Standardized
Coefficients Coefficients Correlations
Model B Std. Error Beta t Sig. Zero-order Partial Part
1 (Constant) 14,314 1,182 12,113 ,000
Produs Intern Brut -,00012 ,00005 -,439 -2,312 ,026 -,548 -,347 -,307
Populatia urbana -,027 ,033 -,153 -,804 ,426 -,466 -,128 -,107
a. Dependent Variable: Rata mortalitatii infantile
3. Modelul de regresie liniară multiplă
9. Probleme specifice utilizând SPSS
Aplicaţia (1) – rezultatele modelării econometrice
2. Estimarea coeficienţilor de corelaţie bivariată (coloana Zero-order) şi
parţială (coloana Partial)
Coefficientsa

Unstandardized Standardized
Coefficients Coefficients Correlations
Model B Std. Error Beta t Sig. Zero-order Partial Part
1 (Constant) 14,314 1,182 12,113 ,000
Produs Intern Brut -,00012 ,00005 -,439 -2,312 ,026 -,548 -,347 -,307
Populatia urbana -,027 ,033 -,153 -,804 ,426 -,466 -,128 -,107
a. Dependent Variable: Rata mortalitatii infantile
3. Modelul de regresie liniară multiplă
9. Probleme specifice utilizând SPSS
Aplicaţia (1) – rezultatele modelării econometrice
3. Estimarea şi testarea coeficienţilor de corelaţie parţială
Correlations

Rata
mortalitatii Produs
Control Variables infantile Intern Brut
Populatia urbana Rata mortalitatii infantile Correlation 1,000 -,347
Significance (2-tailed) . ,026
df 0 39
Produs Intern Brut Correlation -,347 1,000
Significance (2-tailed) ,026 .
df 39 0

Correlations

Rata
mortalitatii Populatia
Control Variables infantile urbana
Produs Intern Brut Rata mortalitatii infantile Correlation 1,000 -,128
Significance (2-tailed) . ,426
df 0 39
Populatia urbana Correlation -,128 1,000
Significance (2-tailed) ,426 .
df 39 0
3. Modelul de regresie liniară multiplă
9. Probleme specifice utilizând SPSS
Aplicaţia (1) – rezultatele modelării econometrice
4. Estimarea şi testarea raportului de determinaţie multiplă şi
raportului de corelaţie multiplă
Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 ,558a ,311 ,276 2,0497
a. Predictors: (Constant), Populatia urbana, Produs
Intern Brut

5. Testarea modelului de regresie liniară multiplă


ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 74,098 2 37,049 8,818 ,001a
Residual 163,852 39 4,201
Total 237,951 41
a. Predictors: (Constant), Populatia urbana, Produs Intern Brut
b. Dependent Variable: Rata mortalitatii infantile
3. Modelul de regresie liniară multiplă
9. Probleme specifice utilizând SPSS
Aplicaţia (1) – rezultatele modelării econometrice
6. Testarea influenţei marginale a unei variabile independente
introduse în model
3. Modelul de regresie liniară multiplă
9. Probleme specifice utilizând SPSS
Aplicaţia (1) – rezultatele modelării econometrice
7. Testarea influenţei marginale a unei variabile independente excluse
din model
Model Summary

Change Statistics
Adjusted Std. Error of R Square
Model R R Square R Square the Estimate Change F Change df1 df2 Sig. F Change
1 ,558a ,311 ,276 2,0497 ,311 8,818 2 39 ,001
2 ,548b ,300 ,282 2,0406 -,011 ,646 1 39 ,426
a. Predictors: (Constant), Produs Intern Brut, Populatia urbana
b. Predictors: (Constant), Produs Intern Brut
3. Modelul de regresie liniară multiplă
9. Probleme specifice utilizând SPSS
Aplicaţia (1) – rezultatele modelării econometrice
8. Ierarhizarea importanţei factorilor de influenţă (ierarhizarea
variabilelor independente)
Coefficientsa

Unstandardized Standardized
Coefficients Coefficients Correlations
Model B Std. Error Beta t Sig. Zero-order Partial Part
1 (Constant) 14,314 1,182 12,113 ,000
Produs Intern Brut -,00012 ,00005 -,439 -2,312 ,026 -,548 -,347 -,307
Populatia urbana -,027 ,033 -,153 -,804 ,426 -,466 -,128 -,107
a. Dependent Variable: Rata mortalitatii infantile
3. Modelul de regresie liniară multiplă
9. Probleme specifice utilizând SPSS
Aplicaţia (2)
Pentru un eşantion de 77 de mărci de cereale, se studiaza
legătura dintre ratingul acordat de consumatori unei mărci
de cereale (Y) şi factorii de influenţă: cantitatea de grăsimi
(X1), zahăr (X2), fibre (X3) exprimate in grame şi nr. de calorii
(X4) .
Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 ,789a ,622 ,612 8,75456
a. Predictors: (Constant), sugars, fat

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 9325,268 2 4662,634 60,836 ,000a
Residual 5671,533 74 76,642
Total 14996,800 76
a. Predictors: (Constant), sugars, fat
b. Dependent Variable: rating

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 61,089 1,953 31,284 ,000
fat -3,066 1,036 -,220 -2,958 ,004
sugars -2,213 ,235 -,700 -9,428 ,000
a. Dependent Variable: rating

43
Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 ,930a ,865 ,859 5,35086
a. Predictors: (Constant), fat, fiber, sugars

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 12503,728 3 4167,909 145,570 ,000a
Residual 1946,958 68 28,632
Total 14450,686 71
a. Predictors: (Constant), fat, fiber, sugars
b. Dependent Variable: rating

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 53,673 1,389 38,637 ,000
fiber 2,938 ,261 ,507 11,265 ,000
sugars -1,992 ,150 -,622 -13,238 ,000
fat -3,347 ,656 -,238 -5,103 ,000
a. Dependent Variable: rating

44
45
46
Coeficienţii de corelaţiei parţială (de ordinul 2)
Coeficienţii de corelaţiei parţială (de ordinul 2)
Coeficienţii de corelaţiei parţială (de ordinul 2)
Regresie liniara multipla

Problema I.

Pe baza datelor pentru un esantion de 74 de tari, s-a estimat legătura dintre Rata mortalitatii
infantile (%) si setul de variabile independente Nr. de cazuri de SIDA (Aids cases – numar
cazuri), Rata de alfabetizare (People who read - %), PIB/locuitor (Gross domestic
product/capita - $/locuitor) şi Aportul zilnic de calorii (Daily calorie intake – numar calorii).

Model Summary

Change Statistics
Adjusted Std. Error of R Square
Model R R Square R Square the Estimate Change F Change df1 df2 Sig. F Change
1 .942a .888 .883 13.2502 .888 184.690 3 70 .000
2 .944b .890 .884 13.2005 .002 1.529 1 69 .220
a. Predictors: (Constant), Aids cases, People who read (%), Daily calorie intake
b. Predictors: (Constant), Aids cases, People who read (%), Daily calorie intake, Gross domestic product / capita

Să se verifice dacă introducerea variabilei PIB/locuitor a determinat o îmbunătăţire a


modelului iniţial.

Modelul 1 old: Rm = b0 + b1*Aids + b2*Ra +b3*Aportcal + e

kold=4 parametrii

R2 old = 0,888

88,8% din var Rm este explicata de cele 3 var indep.

Modelul 2 new: Rm = b0 + b1*Aids + b2*Ra +b3*Aportcal + b4*PIB + e

knew=5 parametrii

R2 new = 0,890

89% din var Rm este explicate de cele 4 var indep.

Prin includerea variabilei indep PIB, puterea explicativa a modelului (R2) a crescut cu 0,2%
(0,002).

R2 Change = R2 new - R2 old = 0,002 (0,2%)

H0: Variabila PIB nu are o influenta marginala semnificativa statistic / modelul new nu este
mai bun decat modelul old / R2 Change (cresterea lui R2) nu este semnificativa statistic

H1: Variabila PIB are o influenta marginala semnificativa statistic / modelul new este mai bun
decat modelul old / R2 Change (cresterea lui R2) este semnificativ statistic
Testul Fisher

𝑅 −𝑅 𝑛−𝑘
𝐹= ×
1−𝑅 𝑘 −𝑘
, ,
𝐹= ,
× = ,
× = 1,529

df1 = 𝑘 −𝑘 =1
df2 = 𝑛 − 𝑘 = n-5 = 69

Fcalc = F Change = 1,529 (Tabelul Model Summary – Change Statistics)

Fteor = F0,05,1,69 = 4,001 (Tabelul Fisher)

Decizia:

Fcalc < F teor  Nu se respinge ip H0.

SAU

SigF Change = 0,220 > α = 0,05  Nu se respinge ip H0, cu o probabilitate de 95%.

Deci, cu o prob de 95%, putem afirma ca:


 variabila nou introdusa in model, PIB, nu are o influenta marginala semnificativa
statistic
 modelul new (cu variabila PIB inclusa) nu este mai bun decat modelul old (fara PIB)
 R2 Change (cresterea lui R2) nu este semnificativ statistic
 cel mai bun este modelul old
 introducerea variabilei PIB/locuitor nu a determinat o îmbunătăţire semnificativa a
modelului iniţial.
Problema II.

Pe baza datelor pentru un esantion de 74 de tari, s-a estimat legătura dintre Rata mortalitatii
infantile (%) si setul de variabile independente Nr. de cazuri de SIDA (Aids cases – numar
cazuri), Rata de alfabetizare (People who read - %), PIB/locuitor (Gross domestic
product/capita - $/locuitor) şi Aportul zilnic de calorii (Daily calorie intake – numar calorii).

Model Summary

Change Statistics
Adjusted Std. Error of R Square
Model R R Square R Square the Estimate Change F Change df1 df2 Sig. F Change
1 .944a .890 .884 13.2005 .890 139.946 4 69 .000
2 .942b .888 .883 13.2502 -.002 1.529 1 69 .220
3 .941c .886 .883 13.2606 -.002 1.111 1 70 .295
a. Predictors: (Constant), Gross domestic product / capita, Aids cases, People who read (%), Daily calorie intake
b. Predictors: (Constant), Aids cases, People who read (%), Daily calorie intake
c. Predictors: (Constant), People who read (%), Daily calorie intake

1) Să se verifice dacă excluderea variabilei PIB/locuitor a condus la obţinerea unui model


îmbunătăţit faţa de modelul 1.

Modelul 1 old: Rm = b0 + b1*Aids + b2*Ra +b3*Aportcal + b4*PIB + e

kold=5 parametrii

R2 old = 0,890

89% din var Rm este explicate de cele 4 var indep.

Modelul 2 new: Rm = b0 + b1*Aids + b2*Ra +b3*Aportcal + e

knew=4 parametrii

R2 new = 0,888

88,8% din var Rm este explicate de cele 3 var indep.

Prin excluderea variabilei indep PIB din model, puterea explicativa a modelului (R2) a scazut
cu 0,2% (0,002).

R2 Change = - 0,002 ( - 0,2%)

H0: Variabila PIB exclusa din model nu are o influenta marginala semnificativa statistic / R2
Change (scaderea lui R2) nu este semnificativ statistic / excluderea var PIB nu aduce o
imbunatatire modelului

H1: Variabila PIB exclusa are o influenta marginala semnificativa statistic / R2 Change
(scaderea lui R2) este semnificativ statistic
Testul Fisher

df1 = 𝑘 −𝑘 =1
df2 = 𝑛 − 𝑘 = n-4 = 70

Fcalc = F Change = 1,111

Fteor = F0,05,1,70 = 4,001

Decizia:

Fcalc < F teor  Nu se respinge ip H0.

SAU

SigF Change = 0,220 > α = 0,05  Nu se respinge ip H0, cu o probabilitate de 95%.

Deci, cu o prob de 95%, putem afirma ca:


 variabila PIB exclusa din model nu are o influenta marginala semnificativa statistic.
 modelul new (fara variabila PIB) este mai bun decat modelul old (cu variabila PIB)
 R2 Change (scaderea lui R2) nu este semnificativa statistic
 cel mai bun este modelul new
 excluderea variabilei PIB/locuitor nu a determinat o scadere semnificativa a puterii
explicative a modelului iniţial.
 excluderea variabilei PIB a fost corecta

2) Să se verifice dacă excluderea variabilei Numarul de cazuri SIDA a condus la obţinerea


unui model îmbunătăţit faţă de modelul 2.

Modelul 2 old: Rm = b0 + b1*Aids + b2*Ra +b3*Aportcal + e

kold=4 parametrii

R2 old = 0,888

88,8% din var Rm este explicate de cele 3 var indep.

Modelul 3 new: Rm = b0 + b1*Ra +b2*Aportcal + e

knew=3 parametrii

R2 new = 0,886

88,6% din var Rm este explicate de cele 2 var indep.


Prin excluderea variabilei indep. Aids din model, puterea explicativa a modelului (R2) a
scazut cu 0,2% (0,002).

R2 Change = - 0,002 ( - 0,2%)

H0: Variabila AIDS exclusa din model nu are o influenta marginala semnificativa statistic /
R2 Change (scaderea lui R2) nu este semnificativ statistic / excluderea var PIB aduce o
imbunatatire modelului

H1: Variabila AIDS exclusa are o influenta marginala semnificativa statistic / R2 Change
(scaderea lui R2) este semnificativ statistic / excluderea var PIB nu aduce o imbunatatire
modelului

Testul Fisher

df1 = 𝑘 −𝑘 =1
df2 = 𝑛 − 𝑘 = n-5 = 69

Fcalc = F Change = 1,529

Fteor = F0,05,1,69 = 4,001

Decizia:

Fcalc < F teor  Nu se respinge ip H0.

SAU

SigF Change = 0,295 > α = 0,05  Nu se respinge ip H0.

Deci, cu o prob de 95%, putem afirma ca:


 variabila AIDS exclusa din model nu are o influenta marginala semnificativa statistic /
var AIDS a fost corect exclusa din model
 modelul new (fara variabila AIDS) este mai bun decat modelul old (cu variabila AIDS)
 R2 Change (scaderea lui R2) nu este semnificativa statistic
 cel mai bun este modelul new
 prin excluderea variabilei AIDS se obtine un model mai bun
 excluderea variabilei AIDS nu a determinat o scadere semnificativa a puterii
explicative a modelului iniţial.
Problema III.
Pentru un esantion de 474 de angajati, s-a estimat legătura dintre Y - Salariul anual (USD) si
un set de variabile explicative.

Model Summary

Change Statistics
Adjusted Std. Error of R Square
Model R R Square R Square the Estimate Change F Change df1 df2 Sig. F Change
1 .661a .436 .435 $12,833.540 .436 365.381 1 472 .000
2 .663b .439 .437 $12,815.280 .003 2.346 1 471 .126
a. Predictors: (Constant), Educational Level (years)
b. Predictors: (Constant), Educational Level (years), Months since Hire

1) Să se verifice dacă includerea variabilei Vechimea in munca a condus la obţinerea


unui model îmbunătăţit faţă de modelul iniţial.

Modelul 1 old: Salariul curent= b0 + b1*Studii + e

kold=2 parametrii

R2 old = 0,436

43,6% din var Salariului este explicata de var indep Studii.

Modelul 2 new: Salariul curent = b0 + b1*Studii + b2*Vechimea + e

knew=3 parametrii

R2 new = 0,439

43,9% din var Salariului este explicata de var indep Studii si Vechime.

Prin includerea variabilei indep Vechimea, puterea explicativa a modelului (R2) a crescut cu
0,3% (0,003).

R2 Change = 0,003 (0,3%)

H0: Variabila Vechimea nu are o influenta marginala semnificativa statistic / modelul new nu
este mai bun decat modelul old / R2 Change (cresterea lui R2) nu este semnificativa statistic

H1: Variabila Vechimea are o influenta marginala semnificativa statistic / modelul new este
mai bun decat modelul old / R2 Change (cresterea lui R2) este semnificativ statistic
Testul Fisher

df1 = 𝑘 −𝑘 =1
df2 = 𝑛 − 𝑘 = n-3 = 471

Fcalc = F Change = 2,346

Fteor = F0,05,1,471 = 3,842

Decizia:

Fcalc < F teor  Nu se respinge ip H0.

SAU

SigF Change = 0,126 > α = 0,05  Nu se respinge ip H0, cu o probabilitate de 95%

Deci, cu o prob de 95%, putem afirma ca:


 variabila Vechimea nu are o influenta marginala semnificativa statistic
 modelul new (cu variabila Vechimea inclusa) nu este mai bun decat modelul old (fara
Vechimea)
 R2 Change (cresterea lui R2) nu este semnificativ statistic
 cel mai bun este modelul old (fara Vechimea)
 introducerea variabilei Vechimea nu a determinat o îmbunătăţire semnificativa a
modelului iniţial.

Model Summary

Change Statistics
Adjusted Std. Error of R Square
Model R R Square R Square the Estimate Change F Change df1 df2 Sig. F Change
1 .661a .436 .435 $12,833.540 .436 365.381 1 472 .000
2 .890b .792 .792 $7,796.524 .356 807.889 1 471 .000
a. Predictors: (Constant), Educational Level (years)
b. Predictors: (Constant), Educational Level (years), Beginning Salary

1) Să se verifice dacă includerea variabilei Salariul la angajare a condus la obţinerea


unui model îmbunătăţit faţă de modelul iniţial.

Modelul1 old: Salariul curent = b0 + b1*Studii + e

kold=2 parametrii

R2 old = 0,436

43,6% din var Salariului este explicata de var indep Studii.


Modelul 2 new: Salariul = b0 + b1*Studii + b2* Sal la angajare + e

knew=3 parametrii

R2 new = 0,792

79,2% din var Salariului este explicata de var indep Studii si Salariul la angajare.

Prin includerea variabilei indep Salariul la angajare, puterea explicativa a modelului (R2) a
crescut cu 35,6% (0,356).

R2 Change = 0,356 (35,6%)

H0: Variabila Sal la angajare nu are o influenta marginala semnificativa statistic / modelul
new nu este mai bun decat modelul old / R2 Change (cresterea lui R2) nu este semnificativ
statistic

H1: Variabila Sal la angajare are o influenta marginala semnificativa statistic / modelul new
este mai bun decat modelul old / R2 Change (cresterea lui R2) este semnificativ statistic

Testul Fisher

df1 = 𝑘 −𝑘 =1
df2 = 𝑛 − 𝑘 = n-3 = 471

Fcalc = F Change = 807,889

Fteor = F0,05,1,471 = 3,842

Decizia:

Fcalc > F teor  Se respinge ip H0.

SAU

SigF Change = 0,000… < α = 0,05  Se respinge ip H0, cu un risc de 5%.

Deci, cu un risc de 5%, putem afirma ca:


 variabila Sal la angajare are o influenta marginala semnificativa statistic
 modelul new (cu variabila Sal la angajare inclusa) este mai bun decat modelul old (fara
Sal la angajare)
 R2 Change (cresterea lui R2) este semnificativ statistic
 cel mai bun este modelul new (cu variabila Sal la angajare inclusa)
 introducerea variabilei Sal la angajare a determinat o îmbunătăţire a modelului iniţial.
Problema IV.

Pe baza datelor pentru un esantion de 74 de tari, s-a estimat legătura dintre Rata mortalitatii
(%) si setul de variabile independente Speranta de viata a populatiei feminine, Ponderea
populatiei din urban, Rata de alfabetizare (People who read - %) şi Aportul zilnic de calorii
(Daily calorie intake – numar calorii).

Model Summary

Change Statistics
Adjusted Std. Error of R Square
Model R R Square R Square the Estimate Change F Change df1 df2 Sig. F Change
1 .910a .828 .818 5.2961 .828 83.271 4 69 .000
2 .907b .822 .814 5.3542 -.006 2.544 1 69 .115
a. Predictors: (Constant), Average female life expectancy, People living in cities (%), Daily calorie intake, People who read (%)
b. Predictors: (Constant), Average female life expectancy, Daily calorie intake, People who read (%)

1) Să se verifice dacă excluderea variabilei Ponderea populatiei din urban a condus la


obţinerea unui model îmbunătăţit faţă de modelul iniţial.

Modelul 1 old: Rm = b0 + b1*Spviata + b2*Ra +b3*Aportcal + b4*PopU + e

kold=5 parametrii

R2 old = 0,828

82,8% din var Rm este explicate de cele 4 var indep.

Modelul 2 new: Rm = b0 + b1*Spviata + b2*Ra +b3*Aportcal + e

knew=4 parametrii

R2 new = 0,822

82,2% din var Rm este explicate de cele 3 var indep.

Prin excluderea variabilei indep PopU din model, puterea explicativa a modelului (R2) a
scazut cu 0,6% (0,006).

R2 Change = - 0,006 ( - 0,6%)

H0: Variabila PopU exclusa din model nu are o influenta marginala semnificativa statistic
H1: Variabila PopU exclusa are o influenta marginala semnificativa

Testul Fisher

df1 = 𝑘 −𝑘 =1
df2 = 𝑛 − 𝑘 = n-4 = 69
Fcalc = F Change = 1,111

Fteor = F0,05,1,70 = 4,001

Decizia:

Fcalc < F teor  Nu se respinge ip H0.

SAU

SigF Change = 0,115 > α = 0,05  Nu se respinge ip H0.

Deci, cu o prob de 95%, putem afirma ca:


 Variabila Pop U exclusa din model nu are o influenta marginala semnificativa statistic.
 Variabila Pop U a fost correct exclusa din model
 modelul new (fara variabila PopU) este mai bun decat modelul old (cu variabila PopU)
 R2 Change (scaderea lui R2) nu este semnificativa statistic
 cel mai bun este modelul new
 excluderea variabilei Pop U nu a determinat o scadere semnificativa a puterii
explicative a modelului iniţial.
Problema V.

Pe baza datelor pentru un esantion de 74 de tari, s-a estimat legătura dintre Rata mortalitatii
infantile (%) si setul de variabile independente Nr. de cazuri de SIDA (Aids cases – numar
cazuri), Rata de alfabetizare (People who read - %), PIB/locuitor (Gross domestic
product/capita - $/locuitor) şi Aportul zilnic de calorii (Daily calorie intake – numar calorii).

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1
2 (Constant) 193.080
184.407 7.782
10.454 24.812
17.639 .000
Daily calorie intake -.016 .005 -.236 -3.522 .001
People who read (%) -1.195 .094 -.713 -12.689 .000
Aids cases 4.47E-005 .000 .056 1.335 .186
Gross domestic
.000 .000 -.081 -1.236 .220
product / capita
a. Dependent Variable: Infant mortality (deaths per 1000 live births)

1) Să se ierarhizeze variabilele independente dupa importanta lor.


2) Sa se interpreteze coef standardizat asociat var Rata alfabetizarii

1) Pentru ierrahizarea var indep se compara coef standardizati in marime absoluta.

|𝑏 | > |𝑏 | > |𝑏 | > |𝑏 |


Ordinea var indep dupa importanta lor este: X2 - Rata alfabetizarii, X1 - Aport caloric,X4 - PIB, X3 -
AIDS

1) b2 = -1,195 Daca Ra creste cu o unitate (1%), atunci Rm scade, in medie, cu 1,195%0, in


conditiile in care celelate var indep se mentin constante.

2) 𝑏 = −0,713: Daca Ra creste cu o abatere standard, atunci Rm scade, in medie, cu 0,713


abateri standard, in conditiile in care celelate var indep se mentin constante.
Problema VI.

Pentru 77 de marci de cereale se cunosc urmatoarele date: Calories - Numar calorii pentru
100g, Fat - Grasimi (g), Sugars - Zahar (g) si Rating - Scorul mediu de preferinta obtinut
pentru un esantion de respondenti. Rezultatele obţinute pentru modelul de regresie multiplă
liniară sunt prezentate in tabelul următor :

1) Să se ierarhizeze variabilele independente dupa importanta lor.


2) Sa se interpreteze coef standardizat al var indep calories

2) Pentru ierrahizarea var indep se compara coef standardizati in marime absoluta.

|𝑏 | > |𝑏 | > |𝑏 |
Ordinea var indep dupa importanta lor este: X2 - sugars, X3 - calories,X1 - fat

𝑏 = −0,336: Daca var calories creste cu o abatere standard, atunci rating scade, in
medie, cu 0,336 abateri standard, in conditiile in care celelate var indep se mentin constante.

S-ar putea să vă placă și