Sunteți pe pagina 1din 6

Regresie liniară multiplă

1. Prezentarea modelului de regresie liniară multiplă

Forma generală: 𝑌 = 𝛽 + 𝛽 𝑋 + 𝛽 𝑋 + ⋯ + 𝛽 𝑋 + 𝜀, 𝑗 = 1, 𝑝

Componentele modelului:
- 𝛽 + 𝛽 𝑋 + 𝛽 𝑋 + ⋯ + 𝛽 𝑋 – componenta deterministă a modelului (observabilă), media
condiționată a variabilei dependente Y în raport cu variabilele independente X j
- 𝜀 – componenta reziduală a modelului (neobservabilă)

Elementele modelului:
(1) variabile:
- 𝑌 – variabila dependentă (endogenă, explicată)
- 𝑋 – variabilele independente (exogene, explicative)
- 𝜀 – variabila reziduală (reprezintă suma tuturor influențelor necunoscute sau care nu sunt
specificate în model)

(2) parametrii:
- 𝛽 – termen constant (valoarea medie a lui 𝑌 atunci când 𝑋 = 0)
- 𝛽 – coeficienți de regresie parțială (semnul indică sensul legăturii
dintre 𝑋 și 𝑌, iar valoarea absolută indică influența parțială a variabilei independente 𝑋
asupra variabilei dependente 𝑌)
𝛽 > 0 – legătură directă (pozitivă) între 𝑋 și 𝑌
– modificarea cu o unitate a variabilei independente 𝑋
determină modificarea medie, în același sens, cu 𝛽
unități a variabilei dependente 𝑌, atunci când influența
celorlalte variabile independente din model este menținută constantă
𝛽 < 0 – legătură inversă (negativă) între 𝑋 și 𝑌
– modificarea cu o unitate a variabilei independente 𝑋
determină modificarea, în medie, în sens invers cu 𝛽
unități a variabilei dependente 𝑌, atunci când influența
celorlalte variabile independente din model este menținută constantă
𝛽 = 0 – nu există o legătură liniară între 𝑋 și 𝑌

2. Estimarea punctuală și prin interval de încredere a parametrilor modelului

(1) Estimarea punctuală:


- are la bază criteriul minimizării erorilor
- criterii de estimare a parametrilor:
(a) erorile să fie minime: min {|𝑒 |}
(b) suma erorilor să fie minimă: ∑ |𝑒 | : 𝑚𝑖𝑛
(c) suma pătratelor erorilor să fie minimă: ∑(𝑒 ) : 𝑚𝑖𝑛 = MCMMP
(2) Estimarea prin interval de încredere:
- are la bază distribuțiile de selecție ale estimatorilor
- k = numărul de parametrii
- IC pentru 𝛽 : 𝑏 ± 𝑡 / , ∙𝑆
* arată intervalul în care, cu o probabilitate 1-α, se află valoarea medie a lui 𝑌 când 𝑋 = 0
- IC pentru 𝛽 : 𝑏 ± 𝑡 / , ∙𝑆
* arată intervalul în care, cu o probabilitate 1-α, se află valoarea coeficientului de regresie
parțială 𝛽

Exemplu:
Pentru un esantion de 6 salariați se consideră legătura liniară dintre Salariu (Y – mii lei) și factorii
de influență: Nr. de ani de școală absolviți (X1 – ani) și Vechimea (X2 – luni).

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound Tolerance
1 (Constant) 1.806 .592 3.050 .055 -.078 3.691
ani de scoala .261 .052 .347 5.045 .015 .096 .426
vechime 1.415 .131 .741 10.773 .002 .997 1.833
a. Dependent Variable: salariu

* Să se scrie ecuația estimată a modelului de regresie.

𝑦 = 1,806 + 0,261 ∙ 𝑥 + 1,415 ∙ 𝑥

*Să se estimeze punctual și să se interpreteze valorile coeficientilor de regresie.

𝑏 = 1,806 – valoarea medie a salariului este egală cu 1,806 mii lei atunci când numărul de ani
de școală și vechimea sunt egale cu 0.
𝑏 = 0,261 – modificarea cu un an a numărului de ani de școală absolviți determină
modificarea, în medie, în același sens cu 0,261 mii lei a salariului, atunci când vechimea se menține
constantă.
𝑏 = 1,415 – modificarea cu o lună a vechimii determină modificarea, în medie, în același sens
cu 1,415 mii lei a salariului, atunci când numărul de ani de școală absolviți se menține constant.

* Să se estimeze coeficienții de regresie prin intervale de incredere garantate cu o probabilitate de


95%.

𝑏 ±𝑡 / , ∙ 𝑆 = 1,806 ± 𝑡 , / , ∙ 0,592 = 1,806 ± 3,182 ∙ 0,592 = [−0,078; 3,691]


Interpretare……..
𝑏 ±𝑡 / , ∙ 𝑆 = 0,261 ± 𝑡 , / , ∙ 0,052 = 0,261 ± 3,182 ∙ 0,052 = [0,096; 0,426] –
Interpretare…….

𝑏 ±𝑡 / , ∙𝑆 = 1,415 ± 𝑡 , / , ∙ 0,131 = 1,415 ± 3,182 ∙ 0,131 = [0,997; 1,833]


Interpretare……..

3. Testarea parametrilor de regresie (testul t)

Etapele testării:
(1) Definirea ipotezelor:
𝐻 : 𝛽 = 0, 𝑗 = 0, 𝑘 , k = nr. de parametrii din model
𝐻 : 𝛽 ≠ 0, 𝑗 = 0, 𝑘

(2) Pragul de semnificație: 𝛼

(3) Alegerea testului: t

(4) Valoarea critică a statisticii test pentru riscul admis 𝛼: 𝑡 =𝑡 / ,


(5) Valoarea calculată a statisticii test:
𝑡 =

(6) Regula de decizie:


|𝑡 |>𝑡 sau 𝑆𝑖𝑔 < 𝛼 => se respinge H0
|𝑡 |≤𝑡 sau 𝑆𝑖𝑔 ≥ 𝛼 => nu se respinge H0

(7) Decizie și interpretare

Exemplu:

* Folosind datele din tabelul anterior, testați semnificația parametrului 𝛽 pentru un risc de 5%.

(1) Definirea ipotezelor:


𝐻 :𝛽 = 0
𝐻 :𝛽 ≠ 0

(2) Pragul de semnificație: 𝛼 = 0,05

(3) Alegerea testului: t

(4) Valoarea critică a statisticii test pentru riscul admis 𝛼:


𝑡 =𝑡 / , =𝑡 , / , = 3,182

(5) Valoarea calculată a statisticii test:


,
𝑡 = = = 3,050
,

(6) Regula de decizie:


(|𝑡 | = 3,050) < (𝑡 = 3,182) sau (𝑆𝑖𝑔 = 0,055) > (𝛼 = 0,05) => nu se
respinge H0

(7) Decizie și interpretare:


Pentru un risc de 5%, putem afirma că parametrul 𝛽 nu este semnificativ statistic.

**Folosind datele din tabelul anterior, testați semnificația parametrului 𝛽 pentru un risc de 10%.

Exemplul 2.
Se studiază variația ratei de creștere economică în raport cu rata dobânzii și speranța de
viață la naștere, pentru un eșantion de țări din Europa. Rezultatele obținute prin prelucrarea
datelor cu programul SPSS sunt prezentate în tabelele de mai jos.
Se cere:

1. Să se scrie ecuația estimată a modelului de regresie liniară multiplă


2. Să se precizeze numărul de parametri ai modelului și volumul eșantionului
3. Să se interpreteze estimațiile punctuale ale coeficienților de regresie
4. Să se estimeze prin interval de încredere, garantat cu o probabilitate de 95%, coeficientul de
regresie 𝛽
5. Să se testeze semnificația statistică a coeficientului de regresie 𝛽 , considerând un risc de 1%.
6. Să se estimeze și să se interpreteze coeficienții de corelație bivariată 𝑟 , 𝑟 𝑠𝑖 𝑟
7. Să se testeze semnificația statistică a coeficienților de corelație bivariată pt un risc de 5%
8. Să se estimeze coeficienții de corelație parțială 𝑟 ∙ 𝑠𝑖 𝑟 ∙
9. Să se testeze semnificația coeficienților de corelație parțială pt risc de 5%. Aceeași cerință pt risc
de 1%.
10. Să se stimeze si să se interpreteze raportul de determinație multiplă
11. Să se estimeze și sa se testeze raportul de corelație, pt risc de 5%
12. Să se testeze semnificația în ansamblu a parametrilor modelului de regresie pt risc de 1%.
13. Să se specifice factorul cu cea mai puternică influență asupra ratei de crestere economică.
14. Să se estimeze nivelul ratei de creștere economica pentru o rata a dobanzii de 2,5% și speranța
de viata la naștere de 75 ani.

S-ar putea să vă placă și