Sunteți pe pagina 1din 35

Econometrie - Seminar 2

1. Utilizarea tabelelor Student, Fisher, calcul de probabilități

2. Noțiunile de Parametri, Estimatori, Estimații (tabel de sinteză)

3. Estimatori pentru medie şi dispersie – proprietăţi

 (x
i 1
i  x)2
s' 2 
n 1 - dispersia corectată calculată la nivelul eșantionului

1
4.

a. Se cunoaste 

b. Nu se cunoste 
s' s'
( x  t / 2;n 1  )    ( x  t / 2;n 1  )
n n
Aplicația 1

2
R.

5.

3
e. Regula de decizie

Aplicatia 2
a) Se verifică calitatea unui lot de ciocolată privind greutatea unei bucăţi. Se fac 25 de
măsurători pentru care se obţine o greutate medie de 95 g şi o abatere standard de 5g. În contractul
de livrare se prevede că greutatea medie a unei ciocolate este de 90 g. Să se verifice, pe baza
sondajului realizat, dacă lotul corespunde calitativ, în condiţiile unui risc acceptat de 5%.
b) Pt. pb. de mai sus, se consideră că în contractul de livrare este prevăzut că greutatea
medie a unei ciocolate este de 100 g.

4
Aplicatia 3 – Estimare si Testare

5
1. Etapele demersului modelării econometrice

(1) Formularea problemei în termeni economici


(ex. cererea depinde de preț)
(2) Specificarea modelului matematic al teoriei economice
(ex. 𝑌 = 𝛽 + 𝛽 𝑋 unde Y = cererea, X = prețul iar 𝛽 > 0 și 𝛽 < 0)
(3) Specificarea modelului econometric
(ex. 𝑌 = 𝛽 + 𝛽 𝑋 + 𝜀)
(4) Estimarea parametrilor modelului econometric
(5) Testarea ipotezelor statistice
(6) Interpretarea parametrilor modelului econometric în cadrul teoriei economice
(7) Utilizarea modelului econometric pentru predicții și luarea de decizii în politica economică

2. Analiza grafică a setului de date reale


3. Prezentarea modelului de regresie liniară simplă

Foma generală: 𝑌 = 𝛽 + 𝛽 𝑋 + 𝜀

Componentele modelului:
- 𝛽 + 𝛽 𝑋 – componenta deterministă a modelului (observabilă)
- 𝜀 – componenta reziduală a modelului (neobservabilă)

Elementele modelului:
(1) variabile:
- 𝑌 – variabila dependentă (endogenă, explicată)
- 𝑋 – variabila independentă (exogenă, explicativă)
- 𝜀 – variabila reziduală (reprezintă suma tuturor influențelor necunoscute sau care nu sunt
specificate în model)

(2) parametrii:
- 𝛽 – ordonata la origine (valoarea medie a lui Y atunci când X=0)
- 𝛽 – panta dreptei de regresie (semnul indică sensul legăturii dintre
X și Y, iar valoarea indică gradul de dependență dintre acestea)

𝛽 > 0 – legătură directă (pozitivă) între X și Y


– modificarea cu o unitate a variabilei independente X
determină modificarea, în medie, în același sens, cu 𝛽
unități a variabilei dependente Y
𝛽 < 0 – legătură inversă (negativă) între X și Y
– modificarea cu o unitate a variabilei independente X
determină modificarea, în medie, în sens invers, cu 𝛽
unități a variabilei dependente Y
𝛽 = 0 – nu există o legătură liniară între X și Y

𝛽 >0 𝛽 <0 𝛽 =0

4. Estimarea punctuală și prin interval de încredere a parametrilor modelului


(1) Estimarea punctuală:
- are la bază criteriul minimizării erorilor
- criterii de estimare a parametrilor:
(a) erorile să fie minime: min {|𝑒 |}
(b) suma erorilor să fie minimă: ∑ |𝑒 | : 𝑚𝑖𝑛
(c) suma pătratelor erorilor să fie minimă: ∑(𝒆𝒊 )𝟐 : 𝒎𝒊𝒏

(2) Estimarea prin interval de încredere:


- are la bază distribuțiile de selecție ale estimatorilor
- IC pentru 𝛽 : 𝑏 ± 𝑡 / , ∙𝑆
- IC pentru 𝛽 : 𝑏 ± 𝑡 / , ∙𝑆

Exemplul 1:
Pentru 7 studenți se analizează legătura dintre următoarele variabile: X – numărul de ore alocate
studiului pentru un test și Y – punctajul obţinut la test.

* ecuația estimată a modelului de regresie:


𝑦 = 4,108 + 0,901 ∙ 𝑥

* interpretarea estimațiilor punctuale ale parametrilor de regresie:


𝑏 = 4,108 – valoarea medie a punctajului obținut la test este egală cu 4,108 puncte atunci
când numărul de ore alocate studiului pentru test este egal cu 0.
𝑏 = 0,901 – modificarea cu o oră a numărului de ore alocate studiului pentru test determină
modificarea, în medie, în același sens,cu 0,901 puncte a punctajului obținut la test

* determinarea și interpretarea intervalelor de încredere obținute pentru parametrii modelului de


regresie considerând un risc de 5%:
𝑏 ±𝑡 / , ∙ 𝑆 = 4,108 ± 𝑡 , / , ∙ 0,703 = 4,108 ± 2,571 ∙ 0,703 = [2,301; 5,915] –
Interpretare.........

𝑏 ±𝑡 / , ∙𝑆 = 0,901 ± 𝑡 , / , ∙ 0,117 = 0,901 ± 2,571 ∙ 0,117 = [0,601; 1,201] –

Interpretare...........
Exemplul2:
Se studiaza legatura dintre rata dobanzii pe termen lung si rata de crestere economica, pentru un esantion
de 30 tari. In urma prelucrarii datelor, se obtin rezultatele prezentate mai jos.

a) Să se identifice pe cale grafică forma legăturii dintre cele două variabile


b) Să se estimeze punctual parametrii modelului de regresie dintre cele două variabile și să
se interpreteze rezultatele obținute
c) Sa se scrie ecuatia estimata a modelului de regresie identificat
d) Să se estimeze printr-un interval de încredere garantat cu o probabilitate de 90% panta
dreptei de regresie
e) Să se estimeze printr-un interval de încredere garantat cu o probabilitate de 95% ordonata
la origine a dreptei de regresie
5. Estimarea indicatorilor de corelație

(1) Coeficientul de corelație:


- se utilizează doar în cazul regresiei liniare simple
- notații: 𝜌 – populație, r - eșantion
- ia valori în intervalul [-1,1]
- r = -1 sau 1 => există o legătură perfectă între X și Y
- r > 0 => există o legătură directă între X și Y
- r < 0 => există o legătură inversă între X și Y
- r = 0 => nu există o legătură între X și Y
Valorile coeficientului pt care corelația este slabă / moderată / puternică
+ Relația dintre coefic. de corelație și coefic de regresie B1

(2) Raportul de determinație:


- se aplică atât în cazul regresie liniare simple, cât și în cazul regresiei liniare multiple
- notații: 𝜂 – populație, R2 – eșantion
- ia valori în intervalul [0,1]
- formulă de calcul: 𝑅 =
- măsoară cât din variația variabilei Y este explicată de variația variabilei independente X din
model, restul de până la 100% fiind explicată de variația variabilei reziduale

(3) Raportul de corelație:


- se aplică atât în cazul regresie liniare simple cât și în cazul regresiei liniare multiple
- notații: 𝜂 – populație, R – eșantion
- ia valori în intervalul [0,1]
- măsoară intensitatea legăturii dintre variabilele X și Y

- R > 0,70 => există o legătură puternică între variabile


- 0,40 ≤ R < 0,70 => există o legătură medie / moderata între variabile
- 0 < R < 0,4 => există o legătură slabă între variabile
- R = 0 => nu există o legătură între variabile

- indică doar intensitatea legăturii, nu și sensul acesteia

(4) Relația dintre indicatorii de corelație: |r| = R = √R


+ relația scrisă în pătrate

Exemplu:
Pentru 7 studenți se analizează legătura dintre următoarele variabile: X – numărul de ore alocate
studiului pentru un test și Y – punctajul obţinut la test.

* să se interpreteze valoarea coeficientului de corelație


Correlations

y x
y Pearson Correlation 1 .961**
Sig. (2-tailed) .001
N 7 7
x Pearson Correlation .961** 1
Sig. (2-tailed) .001
N 7 7
**. Correlation is significant at the 0.01 level
(2-tailed).
r = 0,961 – între numărul de ore alocate studiului pentru test și punctajul obținut
la test există o legătură puternică și directă

* să se determine și să se interpreteze valorile raportului de determinație și ale raportului de


corelație
ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 38.751 1 38.751 59.645 .001a
Residual 3.249 5 .650
Total 42.000 6
a. Predictors: (Constant), x
b. Dependent Variable: y

Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 .961a .923 .907 .80604
a. Predictors: (Constant), x

,
𝑅 = = = 0,923 – 92,3% din variația punctajului obținut la test este explicată de
variația numărului de ore alocate studiului pentru test, restul de până la 100% fiind explicată de
variația factorilor neincluși în model.

R = √R = 0,961 – între numărul de ore alocate studiului pentru test și punctajul obținut la test
există o legătură puternică
6. Testarea coeficienților de regresie (testul t)

Etapele testării:
(1) Definirea ipotezelor:
𝐻 :𝛽 = 0 | 𝐻 :𝛽 = 0
𝐻 :𝛽 ≠ 0 | 𝐻 :𝛽 ≠ 0
(2) Pragul de semnificație: 𝛼

(3) Alegerea testului: t

(4) Valoarea critică a statisticii test pentru riscul admis 𝛼: 𝑡 =𝑡 / ,

(5) Valoarea calculată a statisticii test:


𝑡 = | 𝑡 =

(6) Regula de decizie:


|𝑡 |>𝑡 sau 𝑆𝑖𝑔 < 𝛼 => se respinge H0
|𝑡 |≤𝑡 sau 𝑆𝑖𝑔 ≥ 𝛼 => nu se respinge H0

(7) Decizie și interpretare

* Folosind datele de la Exemplul 1, să se testeze semnificația parametrului 𝛽 .

(1) Definirea ipotezelor:


𝐻 :𝛽 = 0
𝐻 :𝛽 ≠ 0

(2) Pragul de semnificație: 𝛼 = 0,05

(3) Alegerea testului: t

(4) Valoarea critică a statisticii test pentru riscul admis 𝛼:


𝑡 =𝑡 / , =𝑡 , ; = 2,571

(5) Valoarea calculată a statisticii test:


,
𝑡 = = = 5,844
,
(6) Regula de decizie:
(|𝑡 | = 5,844) > (𝑡 = 2,571) sau (𝑆𝑖𝑔 = 0,002) < (𝛼 = 0,05) => se respinge
H0

(7) Decizie și interpretare:


Pentru un risc de 5%, putem afirma că parametrul 𝛽 este semnificativ statistic.

Exemplul2:
Se studiaza legatura dintre rata dobanzii pe termen lung si rata de crestere economica, pentru un
esantion de 30 tari. In urma prelucrarii datelor, se obtin rezultatele prezentate mai jos.
a. Să se testeze semnificaţia parametrului de regresie 0, pentru un risc de 5%.
b. Să se testeze semnificaţia parametrului 1 , pentru un risc de 10%.
c. Să se estimeze punctual şi să se interpreteze valoarea coeficientului de corelaţie
d. Să se verifice semnificaţia coeficientului de corelaţie Pearson (pt 5%)
e. Să se estimeze și să se interpreteze valoarea obținută a raportului de determinație
f. Să se estimeze și să se interpreteze valoarea obținută a raportului de corelație
g. Să se testeze semnificaţia raportului de corelaţie (pt 5%)
h. Să se testeze dacă modelul de regresie este semnificativ / corect specificat, , pentru un risc
de 5%.
i. Să se determine nota unui student care studiază 6 ore.
j. Să se verifice relația dintre raportul de corelație și coeficientul de corelație, specifică
regresiei liniare simple.
k. Să se verifice relația dintre coeficientul de corelație și coeficientul de regresie 1
standardizat.
7. Testarea semnificației indicatorilor de corelație
a) Testarea coeficientului de corelație (testul t)

Etapele testării:
(1) Definirea ipotezelor:
𝐻 :𝜌 = 0
𝐻 :𝜌 ≠ 0

(2) Pragul de semnificație: 𝛼

(3) Alegerea testului: t

(4) Valoarea critică a statisticii test pentru riscul admis 𝛼: 𝑡 =𝑡 / ,


(5) Valoarea calculată a statisticii test: 𝑡 =

(6) Regula de decizie:


|𝑡 |>𝑡 sau 𝑆𝑖𝑔 < 𝛼 => se respinge H0
|𝑡 |≤𝑡 sau 𝑆𝑖𝑔 ≥ 𝛼 => nu se respinge H0

(7) Decizie și interpretare

Exemplu:
Pentru 7 studenți se analizează legătura dintre următoarele variabile: X – numărul de ore alocate
studiului pentru un test și Y – punctajul obţinut la test.

* să se testeze semnificația coeficientului de corelație bivariată (Pearson) pentru un risc de 5%.


Correlations

y x
y Pearson Correlation 1 .961**
Sig. (2-tailed) .001
N 7 7
x Pearson Correlation .961** 1
Sig. (2-tailed) .001
N 7 7
**. Correlation is significant at the 0.01 level
(2-tailed).

(1) Definirea ipotezelor:


𝐻 :𝜌 = 0
𝐻 :𝜌 ≠ 0
(2) Pragul de semnificație: 𝛼 = 0,05

(3) Alegerea testului: t

(4) Valoarea critică a statisticii test pentru riscul admis 𝛼:


𝑡 =𝑡 / , =𝑡 , / , = 2,571
(5) Valoarea calculată a statisticii test:
√ , √ , ∙ , ,
𝑡 = = = = = 7,77
√ , √ , ,

(6) Regula de decizie:


(|𝑡 | = 7,77) > (𝑡 = 2,571) sau (𝑆𝑖𝑔 = 0,001) < (𝛼 = 0,05) => se respinge
H0

(7) Decizie și interpretare:


Pentru un risc de 5% putem afirma că există o legătură semnificativă între numărul de ore alocate
studiului și punctajul obținut la test.

b) Testarea raportului de corelație (testul F)

Etapele testării:
(1) Definirea ipotezelor:
𝐻 :𝜂 = 0
𝐻 :𝜂 > 0

(2) Pragul de semnificație: 𝛼

(3) Alegerea testului: F

(4) Valoarea critică a statisticii test pentru riscul admis 𝛼:


𝐹 =𝐹 , , =𝐹 , ,

(5) Valoarea calculată a statisticii test: 𝐹 = ∙

(6) Regula de decizie:


𝐹 >𝐹 sau 𝑆𝑖𝑔 < 𝛼 => se respinge H0
𝐹 ≤𝐹 sau 𝑆𝑖𝑔 ≥ 𝛼 => nu se respinge H0
(7) Decizie și interpretare

Exemplu:
Pentru 7 studenți se analizează legătura dintre următoarele variabile: X – numărul de ore alocate
studiului pentru un test și Y – punctajul obţinut la test.
* să se testeze semnificația raportului de corelație, pt risc de 5%
ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 38.751 1 38.751 59.645 .001a
Residual 3.249 5 .650
Total 42.000 6
a. Predictors: (Constant), x
b. Dependent Variable: y

Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 .961a .923 .907 .80604
a. Predictors: (Constant), x

(1) Definirea ipotezelor:


𝐻 :𝜂 = 0
𝐻 :𝜂 > 0

(2) Pragul de semnificație: 𝛼 = 0,05

(3) Alegerea testului: F

(4) Valoarea critică a statisticii test pentru riscul admis 𝛼:


𝐹 =𝐹 , , =𝐹 , , = 𝐹 , , , = 6,608

(5) Valoarea calculată a statisticii test:


, ,
𝐹 = ∙ = ∙ = ∙ 5 = 59,935
, ,

(6) Se compară valoarea calc si th:


(𝐹 = 59,935) > (𝐹 = 6,608) sau (𝑆𝑖𝑔 = 0,001) < (𝛼 = 0,05) => se respinge
H0

(7) Decizie și interpretare:


Se respinge ipoteza nulă, deci putem afirma că raportul de corelație este semnificativ statistic,
variabila independentă X (numărul de ore alocate studiului pentru test) influențează semnificativ
variația variabilei dependente Y (punctajul obținut la test), în condițiile riscului asumat de 5%.

8. Testarea modelului de regresie (testul F)

Etapele testării:
(1) Definirea ipotezelor:
𝐻 : modelul nu este semnificativ statistic
𝐻 : modelul este semnificativ statistic

(2) Pragul de semnificație: 𝛼

(3) Alegerea testului: F


(4) Valoarea critică a statisticii test pentru riscul admis 𝛼:
𝐹 =𝐹 , , =𝐹 , ,
(5) Valoarea calculată a statisticii test: 𝐹 = ∙

(6) Regula de decizie:


𝐹 >𝐹 sau 𝑆𝑖𝑔 < 𝛼 => se respinge H0
𝐹 ≤𝑡 sau 𝑆𝑖𝑔 ≥ 𝛼 => nu se respinge H0

(7) Decizie și interpretare

Exemplu:
Pentru 7 studenți se analizează legătura dintre următoarele variabile: X – numărul de ore alocate
studiului pentru un test și Y – punctajul obţinut la test.

* să se testeze semnificația modelului de regresie pt risc de 5%

(1) Definirea ipotezelor:


𝐻 : modelul nu este semnificativ statistic
𝐻 : modelul este semnificativ statistic

(2) Pragul de semnificație: 𝛼

(3) Alegerea testului: F

(4) Valoarea critică a statisticii test pentru riscul admis 𝛼:


𝐹 =𝐹 , , =𝐹 , , = 𝐹 , , , = 6,608

(5) Valoarea calculată a statisticii test:


, ,
𝐹 = ∙ = ∙ = ∙ 5 = 59,635
, ,

(6) Regula de decizie:


(𝐹 = 59,635) > (𝐹 = 6,608) sau (𝑆𝑖𝑔 = 0,001) < (𝛼 = 0,05) => se respinge
H0

(7) Decizie și interpretare:


Se respinge ipoteza nulă, deci modelul de regresie estimat între variabilele rezultatul la test și
numărul de ore alocate pentru studiu este semnificativ statistic, în condițiile riscului asumat de 5%.
Exemplul2:
Se studiaza legatura dintre rata dobanzii pe termen lung si rata de crestere economica, pentru un
esantion de 30 tari. In urma prelucrarii datelor, se obtin rezultatele prezentate mai jos.
a. Să se testeze semnificaţia parametrului de regresie 0, pentru un risc de 5%.
b. Să se testeze semnificaţia parametrului 1 , pentru un risc de 10%.
c. Să se estimeze punctual şi să se interpreteze valoarea coeficientului de corelaţie
d. Să se verifice semnificaţia coeficientului de corelaţie Pearson (pt 5%)
e. Să se estimeze și să se interpreteze valoarea obținută a raportului de determinație
f. Să se estimeze și să se interpreteze valoarea obținută a raportului de corelație
g. Să se testeze semnificaţia raportului de corelaţie (pt 5%)
h. Să se testeze dacă modelul de regresie este semnificativ / corect specificat, pentru un risc
de 1%.
i. Să se determine nota unui student care studiază 6 ore.
j. Să se verifice relația dintre raportul de corelație și coeficientul de corelație, specifică
regresiei liniare simple.
k. Să se verifice relația dintre coeficientul de corelație și coeficientul de regresie 1
standardizat.
Regresie liniară multiplă

1. Prezentarea modelului de regresie liniară multiplă

Forma generală: 𝑌 = 𝛽 + 𝛽 𝑋 + 𝛽 𝑋 + ⋯ + 𝛽 𝑋 + 𝜀, 𝑗 = 1, 𝑝

Componentele modelului:
- 𝛽 + 𝛽 𝑋 + 𝛽 𝑋 + ⋯ + 𝛽 𝑋 – componenta deterministă a modelului (observabilă), media
condiționată a variabilei dependente Y în raport cu variabilele independente X j
- 𝜀 – componenta reziduală a modelului (neobservabilă)

Elementele modelului:
(1) variabile:
- 𝑌 – variabila dependentă (endogenă, explicată)
- 𝑋 – variabilele independente (exogene, explicative)
- 𝜀 – variabila reziduală (reprezintă suma tuturor influențelor necunoscute sau care nu sunt
specificate în model)

(2) parametrii:
- 𝛽 – termen constant (valoarea medie a lui 𝑌 atunci când 𝑋 = 0)
- 𝛽 – coeficienți de regresie parțială (semnul indică sensul legăturii
dintre 𝑋 și 𝑌, iar valoarea absolută indică influența parțială a variabilei independente 𝑋
asupra variabilei dependente 𝑌)
𝛽 > 0 – legătură directă (pozitivă) între 𝑋 și 𝑌
– modificarea cu o unitate a variabilei independente 𝑋
determină modificarea medie, în același sens, cu 𝛽
unități a variabilei dependente 𝑌, atunci când influența
celorlalte variabile independente din model este menținută constantă
𝛽 < 0 – legătură inversă (negativă) între 𝑋 și 𝑌
– modificarea cu o unitate a variabilei independente 𝑋
determină modificarea, în medie, în sens invers cu 𝛽
unități a variabilei dependente 𝑌, atunci când influența
celorlalte variabile independente din model este menținută constantă
𝛽 = 0 – nu există o legătură liniară între 𝑋 și 𝑌

2. Estimarea punctuală și prin interval de încredere a parametrilor modelului

(1) Estimarea punctuală:


- are la bază criteriul minimizării erorilor
- criterii de estimare a parametrilor:
(a) erorile să fie minime: min {|𝑒 |}
(b) suma erorilor să fie minimă: ∑ |𝑒 | : 𝑚𝑖𝑛
(c) suma pătratelor erorilor să fie minimă: ∑(𝑒 ) : 𝑚𝑖𝑛 = MCMMP
(2) Estimarea prin interval de încredere:
- are la bază distribuțiile de selecție ale estimatorilor
- k = numărul de parametrii
- IC pentru 𝛽 : 𝑏 ± 𝑡 / , ∙𝑆
* arată intervalul în care, cu o probabilitate 1-α, se află valoarea medie a lui 𝑌 când 𝑋 = 0
- IC pentru 𝛽 : 𝑏 ± 𝑡 / , ∙𝑆
* arată intervalul în care, cu o probabilitate 1-α, se află valoarea coeficientului de regresie
parțială 𝛽

Exemplu:
Pentru un esantion de 6 salariați se consideră legătura liniară dintre Salariu (Y – mii lei) și factorii
de influență Nr. de ani de școală absolviți (X1 – ani) și Vechimea (X2 – luni).

a
Coefficients

Unstandardized Standardized
Coefficients Coefficients 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound Tolerance
1 (Constant) 1.806 .592 3.050 .055 -.078 3.691
ani de scoala .261 .052 .347 5.045 .015 .096 .426
vechime 1.415 .131 .741 10.773 .002 .997 1.833
a. Dependent Variable: salariu

* Să se scrie ecuația estimată a modelului de regresie.

𝑦 = 1,806 + 0,261 ∙ 𝑥 + 1,415 ∙ 𝑥

*Să se estimeze punctual și să se interpreteze valorile coeficientilor de regresie.

𝑏 = 1,806 – valoarea medie a salariului este egală cu 1,806 mii lei atunci când numărul de ani
de școală și vechimea sunt egale cu 0.
𝑏 = 0,261 – modificarea cu un an a numărului de ani de școală absolviți determină
modificarea, în medie, în același sens cu 0,261 mii lei a salariului, atunci când vechimea se menține
constantă.
𝑏 = 1,415 – modificarea cu o lună a vechimii determină modificarea, în medie, în același sens
cu 1,415 mii lei a salariului, atunci când numărul de ani de școală absolviți se menține constant.

* Să se estimeze coeficienții de regresie prin intervale de incredere garantate cu o probabilitate de


95%.

𝑏 ±𝑡 / , ∙ 𝑆 = 1,806 ± 𝑡 , / , ∙ 0,592 = 1,806 ± 3,182 ∙ 0,592 = [−0,078; 3,691]


Interpretare……..
𝑏 ±𝑡 / , ∙ 𝑆 = 0,261 ± 𝑡 , / , ∙ 0,052 = 0,261 ± 3,182 ∙ 0,052 = [0,096; 0,426] –
Interpretare…….

𝑏 ±𝑡 / , ∙𝑆 = 1,415 ± 𝑡 , / , ∙ 0,131 = 1,415 ± 3,182 ∙ 0,131 = [0,997; 1,833]


Interpretare……..

3. Testarea parametrilor (testul t)

Etapele testării:
(1) Definirea ipotezelor:
𝐻 : 𝛽 = 0, 𝑗 = 0, 𝑘 , k = nr. de parametrii din model
𝐻 : 𝛽 ≠ 0, 𝑗 = 0, 𝑘

(2) Pragul de semnificație: 𝛼

(3) Alegerea testului: t

(4) Valoarea critică a statisticii test pentru riscul admis 𝛼: 𝑡 =𝑡 / ,


(5) Valoarea calculată a statisticii test:
𝑡 =

(6) Regula de decizie:


|𝑡 |>𝑡 sau 𝑆𝑖𝑔 < 𝛼 => se respinge H0
|𝑡 |≤𝑡 sau 𝑆𝑖𝑔 ≥ 𝛼 => nu se respinge H0

(7) Decizie și interpretare

Exemplu:

* Folosind datele din tabelul anterior, testați semnificația parametrului 𝛽 pentru un risc de 5%.

(1) Definirea ipotezelor:


𝐻 :𝛽 = 0
𝐻 :𝛽 ≠ 0

(2) Pragul de semnificație: 𝛼 = 0,05

(3) Alegerea testului: t

(4) Valoarea critică a statisticii test pentru riscul admis 𝛼:


𝑡 =𝑡 / , =𝑡 , / , = 3,182

(5) Valoarea calculată a statisticii test:


,
𝑡 = = = 3,050
,

(6) Regula de decizie:


(|𝑡 | = 3,050) < (𝑡 = 3,182) sau (𝑆𝑖𝑔 = 0,055) > (𝛼 = 0,05) => nu se
respinge H0

(7) Decizie și interpretare:


Pentru un risc de 5%, putem afirma că parametrul 𝛽 nu este semnificativ statistic.

**Folosind datele din tabelul anterior, testați semnificația parametrului 𝛽 pentru un risc de 10%.

Exemplul 2.
Se studiază variația ratei de creștere economică în raport cu rata dobânzii și speranța de
viață la naștere, pentru un eșantion de țări din Europa. Rezultatele obținute prin prelucrarea
datelor cu programul SPSS sunt prezentate în tabelele de mai jos.
Se cere:

1. Să se scrie ecuația estimată a modelului de regresie liniară multiplă


2. Să se precizeze numărul de parametri ai modelului și volumul eșantionului
3. Să se interpreteze estimațiile punctuale ale coeficienților de regresie
4. Să se estimeze prin interval de încredere, garantat cu o probabilitate de 95%, coeficientul de
regresie 𝛽
5. Să se testeze semnificația statistică a coeficientului de regresie 𝛽 , considerând un risc de 1%.
6. Să se estimeze și să se interpreteze coeficienții de corelație bivariată 𝑟 , 𝑟 𝑠𝑖 𝑟
7. Să se testeze semnificația statistică a coeficienților de corelație bivariată pt un risc de 5%
8. Să se estimeze coeficienții de corelație parțială 𝑟 ∙ 𝑠𝑖 𝑟 ∙
9. Să se testeze semnificația coeficienților de corelație parțială pt risc de 5%. Aceeași cerință pt risc
de 1%.
10. Să se stimeze si să se interpreteze raportul de determinație multiplă
11. Să se estimeze și sa se testeze raportul de corelație, pt risc de 5%
12. Să se testeze semnificația în ansamblu a parametrilor modelului de regresie pt risc de 1%.
13. Să se specifice factorul cu cea mai puternică influență asupra ratei de crestere economică.
14. Să se estimeze nivelul ratei de creștere economica pentru o rata a dobanzii de 2,5% și speranța
de viata la naștere de 75 ani.
RLM continuare
4. Estimarea indicatorilor de corelație

(1) Coeficientul de corelație simplă (bivariată):


- notații (model de regresie liniară multiplă cu 2 variabile independente):
* 𝜌 (pop.) /𝑟 (eș) – arată legătura dintre 𝑌 și 𝑋
* 𝜌 (pop.) /𝑟 (eș) – arată legătura dintre 𝑌 și 𝑋
* 𝜌 (pop.) /𝑟 (eș) – arată legătura dintre 𝑋 și 𝑋
- ia valori în intervalul [-1,1]
- măsoară dependența dintre 2 variabile fără a lua în considerare influența
celorlalte variabile independente din model
- valoarea unui coef. de corelație simplă/bivariată se interpretează astfel:
* dacă este -1 sau 1 => există o legătură perfectă între cele 2 variabile
* dacă este > 0 => există o legătură directă între cele 2 variabile
* dacă este < 0 => există o legătură inversă între cele 2 variabile
* dacă este = 0 => nu există o legătură între cele 2 variabile
** dacă valoarea absolută ∈ [0,7; 0,99] => există o legătură puternică între cele 2 variabile
** dacă valoarea absolută ∈ [0,4; 0,7) => există o legătură medie/moderată între cele 2
variabile
** dacă valoarea absolută ∈ (0; 0,4) => există o legătură slabă între cele 2 variabile

(2) Coeficientul de corelație parțială:


- notații (model de regresie liniară multiplă cu 2 variabile independente):
* 𝜌 . (pop.) /𝑟 . (eș) – arată legătura dintre 𝑌 și 𝑋 când 𝑋 este constant
* 𝜌 . (pop.) /𝑟 . (eș) – arată legătura dintre 𝑌 și 𝑋 când 𝑋 este constant
- ia valori în intervalul [-1,1]
- măsoară dependența dintre 2 variabile considerând constantă influența
celorlalte variabile independente din model
- valoarea unui coeficient de corelație parțială se interpretează astfel:
* dacă este -1 sau 1 => există o legătură perfectă între cele 2 variabile,
atunci când celelalte variabile din model sunt constante
* dacă este > 0 => există o legătură directă între cele 2 variabile,
atunci când celelalte variabile din model sunt constante
* dacă este < 0 => există o legătură inversă între cele 2 variabile,
atunci când celelalte variabile din model sunt constant
* dacă este = 0 => nu există o legătură între cele 2 variabile,
atunci când celelalte variabile din model sunt constante

* dacă valoarea absolută ∈ [0,70; 1] => există o legătură puternică între cele
2 variabile, atunci când celelalte
variabile din model sunt constante
* dacă valoarea absoluă ∈ [0,4; 0,70) => există o legătură medie între cele
2 variabile, atunci când celelalte
variabile din model sunt constante
* dacă valoarea absoluă ∈ (0; 0,4) => există o legătură slabă între cele

1
2 variabile, atunci când celelalte
variabile din model sunt constante

(3) Raportul de determinație multiplă:


- notații: 𝜂 – populație, R2 – eșantion
- ia valori în intervalul [0,1]
- formulă de calcul: 𝑅 =
- măsoară cât % din variația variabilei 𝑌 este explicată de variația simultană
a variabilelor independente 𝑋 din model, restul de până la 100% fiind
explicată de variația variabilei reziduale

(4) Raportul de determinație ajustat:


- se aplică în cazul regresiei liniare multiple
- notații: 𝜂 – populație, 𝑅 – eșantion
- ia valori în intervalul [0,1]
- formulă de calcul: 𝑅 = 1 − (1 − 𝑅 ) ∙
- se folosește pentru compararea a 2 sau mai multe modele, modelul cel mai
bun fiind cel care are valoarea cea mai mare pentru 𝑅

(5) Raportul de corelație:


- notații: 𝜂 – populație, R – eșantion
- ia valori în intervalul [0,1]
- măsoară intensitatea legăturii dintre variabilele inependente și 𝑌
- nu indică sensul sensul legăturii dintre variabilele inependente și 𝑌
- valoarea raportului de corelație se interpretează astfel:
* 0,70 ≤ R ≤ 1 => există o legătură puternică între variabilele 𝑋 și 𝑌
* 0,40 ≤ R < 0,70=> există o legătură medie între variabilele 𝑋 și 𝑌
* 0 < R < 0,40 => există o legătură slabă între variabilele 𝑋 și 𝑌
* R = 0 => nu există o legătură între variabilele 𝑋 și 𝑌
(6) Relația dintre indicatorii de corelație: R = √R

Exemplu:
Pentru un eșantion de 6 salariați se consideră legătura liniară dintre Salariu (Y – mii lei) și factorii
de influență: Nr. de ani de școală absolviți (X1 – ani) și Vechimea (X2 – luni).

1) să se interpreteze valoarea coeficientului de corelație bivariată 𝑟

2
Correlations

vechime ani de scoala salariu


vechime Pearson Correlation 1 .627 .958**
Sig. (2-tailed) .183 .003
N 6 6 6
ani de scoala Pearson Correlation .627 1 .811*
Sig. (2-tailed) .183 .049
N 6 6 6
salariu Pearson Correlation .958** .811* 1
Sig. (2-tailed) .003 .049
N 6 6 6
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).

𝑟 = 0,811 – între salariu și numărul de ani de școală absolviți există o legătură


directă si puternică

2) să se interpreteze valoarea coeficientului de corelație parțială 𝑟 .


Correlations

Control Variables salariu ani de scoala


vechime salariu Correlation 1.000 .946
Significance (2-tailed) . .015
df 0 3
ani de scoala Correlation .946 1.000
Significance (2-tailed) .015 .
df 3 0

𝑟 . = 0,946 – între salariu și numărul de ani de școală absolviți există o


legătură directă si puternică atunci când vechimea este constantă

3) să se determine și să se interpreteze valorile raportului de determinație multiplă și ale raportului


de corelație

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 40.482 2 20.241 172.812 .001a
Residual .351 3 .117
Total 40.833 5
a. Predictors: (Constant), vechime, ani de scoala
b. Dependent Variable: salariu

Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 .996a .991 .986 .34224
a. Predictors: (Constant), vechime, ani de scoala

3
,
𝑅 = = = 0,991 – 99,1% din variația salariului este explicată de variația simultană a
,
numărului de ani de școală absolviți și a vechimii, restul de până la 100% fiind explicată de variația
factorilor neincluși în model.

R = √R = 0,996 – între salariu, numărul de ani de școală absolviți și vechime există o legătură
puternică.

4) folosind datele din tabelul de mai jos, să se specifice modelul cel mai bun

(comparăm valorile raportului de determinație ajustat)

Model Summary

Change Statistics
Adjusted Std. Error of R Square
Model R R Square R Square the Estimate Change F Change df1 df2 Sig. F Change
1 .661a .436 .435 $12,833.540 .436 365.381 1 472 .000
2 .890b .792 .792 $7,796.524 .356 807.889 1 471 .000
a. Predictors: (Constant), Educational Level (years)
b. Predictors: (Constant), Educational Level (years), Beginning Salary

𝑅 pentru Model 1 este 0,436


𝑅 pentru Model 2 este 0,792
0,792 > 0.436 => Modelul 2 este mai bun decât Modelul 1.

5. Testarea coeficientilor de corelație (testul t)

Etapele testării:
(1) Definirea ipotezelor:
𝐻 : 𝜌 = 0, unde 𝜌 poate fi 𝜌 , 𝜌 , 𝜌 , 𝜌 . sau 𝜌 .
𝐻 : 𝜌 ≠ 0, unde 𝜌 poate fi 𝜌 , 𝜌 , 𝜌 , 𝜌 . sau 𝜌 .

(2) Pragul de semnificație: 𝛼

(3) Alegerea testului: t

(4) Valoarea critică a statisticii test pentru riscul admis 𝛼:


- pentru coeficienții de corelație simplă (bivariată): 𝑡 =𝑡 / ,
- pentru coeficienții de corelație parțială: 𝑡 =𝑡 / ,

(5) Valoarea calculată a statisticii test:



- pentru coeficienții de corelație simplă (bivariată): 𝑡 = ,

unde r poate fi 𝑟 , 𝑟 , 𝑟

- pentru coeficienții de corelație parțială: 𝑡 = ,

4
unde r poate fi 𝑟 . sau 𝑟 .

(6) Regula de decizie:


|𝑡 |>𝑡 sau 𝑆𝑖𝑔 < 𝛼 => se respinge H0
|𝑡 |≤𝑡 sau 𝑆𝑖𝑔 ≥ 𝛼 => nu se respinge H0

(7) Decizie și interpretare

Exemplu:
Pentru un eșantion de 6 salariați, se consideră legătura liniară dintre Salariu (Y – mii lei) și factorii
de influență Nr. de ani de școală absolviți (X1 – ani) și Vechimea (X2 – luni).
* să se testeze semnificația coeficientului de corelație parțială 𝜌 .
(1) Definirea ipotezelor:
𝐻 :𝜌 . = 0
𝐻 :𝜌 . ≠ 0

(2) Pragul de semnificație: 𝛼 = 0,05

(3) Alegerea testului: t

(4) Valoarea critică a statisticii test pentru riscul admis 𝛼:


𝑡 =𝑡 / , =𝑡 , / , = 3,182

(5) Valoarea calculată a statisticii test:


. √ , √ , ∙ , ,
𝑡 = = = = = 5,04
, √ , ,
.

(6) Regula de decizie…..

(7) Se compară..
(|𝑡 | = 5,04) > (𝑡 = 3.182) sau (𝑆𝑖𝑔 = 0,015) < (𝛼 = 0,05) => se respinge
H0

(8) Decizie și interpretare:


Pentru un risc de 5% putem afirma că valoarea coeficientului de corelație parțială 𝜌 . este
semnificativ diferită de zero, deci există o legătură semnificativă între salariu și numărul de ani de
școală absolviți, atunci când vechimea se menține constantă.

6. Testarea modelului de regresie (testul F)

Etapele testării:
(1) Definirea ipotezelor:
𝐻 : modelul nu este semnificativ statistic
𝐻 : modelul este semnificativ statistic

5
(2) Pragul de semnificație: 𝛼

(3) Alegerea testului: F


(4) Valoarea critică a statisticii test pentru riscul admis 𝛼:
𝐹 =𝐹 , , =𝐹 , ,

(5) Valoarea calculată a statisticii test: 𝐹 = ∙

(6) Regula de decizie:


𝐹 >𝐹 sau 𝑆𝑖𝑔 < 𝛼 => se respinge H0
𝐹 ≤𝑡 sau 𝑆𝑖𝑔 ≥ 𝛼 => nu se respinge H0

(7) Decizie și interpretare

Exemplu:
Se consideră pentru 6 salariați legătura liniară dintre Salariu (Y – mii lei) și factorii de influență
Nr. de ani de școală absolviți (X1 – ani) și Vechimea (X2 – luni).

* să se testeze semnificația modelului de regresie

(1) Definirea ipotezelor:


𝐻 : modelul nu este semnificativ statistic
𝐻 : modelul este semnificativ statistic

(2) Pragul de semnificație: 𝛼=0,05

(3) Alegerea testului: F

(4) Valoarea critică a statisticii test pentru riscul admis 𝛼:


𝐹 =𝐹 , , =𝐹 , , = 𝐹 , , , = 9,552

(5) Valoarea calculată a statisticii test:


, ,
𝐹 = ∙ = ∙ = ∙ = 172,812
, ,

(6) Regula de decizie……

(7) Se compară
(𝐹 = 172,812) > (𝐹 = 9,552) sau (𝑆𝑖𝑔 = 0,001) < (𝛼 = 0,05) => se
respinge H0

(8) Decizie și interpretare:


Cu un risc de 5% putem afirma că modelul estimat între salariu, numărul de ani de școală absolviți
și vechime este semnificativ statistic.

6
Exemplul 2.
Se studiază variația ratei de creștere economică în raport cu rata dobânzii și speranța de
viață la naștere, pentru un eșantion de țări din Europa. Rezultatele obținute prin prelucrarea
datelor cu programul SPSS sunt prezentate în tabelele de mai jos.

7
8
Se cere:

1. Să se scrie ecuația estimată a modelului de regresie liniară multiplă


2. Să se precizeze numărul de parametri ai modelului și volumul eșantionului
3. Să se interpreteze estimațiile punctuale ale coeficienților de regresie
4. Să se estimeze prin interval de încredere, garantat cu o probabilitate de 95%, coeficientul de
regresie 𝛽
5. Să se testeze semnificația statistică a coeficientului de regresie 𝛽 , considerând un risc de 1%.
6. Să se estimeze și să se interpreteze coeficienții de corelație bivariată 𝑟 , 𝑟 𝑠𝑖 𝑟
7. Să se testeze semnificația statistică a coeficienților de corelație bivariată pt un risc de 5%
8. Să se estimeze coeficienții de corelație parțială 𝑟 ∙ 𝑠𝑖 𝑟 ∙
9. Să se testeze semnificația coeficienților de corelație parțială pt risc de 5%. Aceeași cerință pt risc
de 1%.
10. Să se stimeze si să se interpreteze raportul de determinație multiplă si raportul de corelatie.
11. Să se testeze raportul de corelație, pt risc de 5%
12. Să se testeze semnificația în ansamblu a parametrilor modelului de regresie pt risc de 1%.
13. Să se specifice factorul cu cea mai puternică influență asupra ratei de crestere economică.
14. Să se estimeze nivelul ratei de creștere economica pentru o rata a dobanzii de 2,5% și speranța
de viata la naștere de 75 ani.

S-ar putea să vă placă și