Sunteți pe pagina 1din 9

RLM continuare

4. Estimarea indicatorilor de corelație

(1) Coeficientul de corelație simplă (bivariată):


- notații (model de regresie liniară multiplă cu 2 variabile independente):
* 𝜌𝑦1 (pop.) /𝑟𝑦1 (eș) – arată legătura dintre 𝑌 și 𝑋1
* 𝜌𝑦2 (pop.) /𝑟𝑦2 (eș) – arată legătura dintre 𝑌 și 𝑋2
* 𝜌12 (pop.) /𝑟12 (eș) – arată legătura dintre 𝑋1 și 𝑋2
- ia valori în intervalul [-1,1]
- măsoară dependența dintre 2 variabile fără a lua în considerare influența
celorlalte variabile independente din model
- valoarea unui coef. de corelație simplă/bivariată se interpretează astfel:
* dacă este -1 sau 1 => există o legătură perfectă între cele 2 variabile
* dacă este > 0 => există o legătură directă între cele 2 variabile
* dacă este < 0 => există o legătură inversă între cele 2 variabile
* dacă este = 0 => nu există o legătură între cele 2 variabile
** dacă valoarea absolută ∈ [0,7; 0,99] => există o legătură puternică între cele 2 variabile
** dacă valoarea absolută ∈ [0,4; 0,7) => există o legătură medie/moderată între cele 2
variabile
** dacă valoarea absolută ∈ (0; 0,4) => există o legătură slabă între cele 2 variabile

(2) Coeficientul de corelație parțială:


- notații (model de regresie liniară multiplă cu 2 variabile independente):
* 𝜌𝑦1.2 (pop.) /𝑟𝑦1.2 (eș) – arată legătura dintre 𝑌 și 𝑋1 când 𝑋2 este constant
* 𝜌𝑦2.1 (pop.) /𝑟𝑦2.1 (eș) – arată legătura dintre 𝑌 și 𝑋2 când 𝑋1 este constant
- ia valori în intervalul [-1,1]
- măsoară dependența dintre 2 variabile considerând constantă influența
celorlalte variabile independente din model
- valoarea unui coeficient de corelație parțială se interpretează astfel:
* dacă este -1 sau 1 => există o legătură perfectă între cele 2 variabile,
atunci când celelalte variabile din model sunt constante
* dacă este > 0 => există o legătură directă între cele 2 variabile,
atunci când celelalte variabile din model sunt constante
* dacă este < 0 => există o legătură inversă între cele 2 variabile,
atunci când celelalte variabile din model sunt constant
* dacă este = 0 => nu există o legătură între cele 2 variabile,
atunci când celelalte variabile din model sunt constante

* dacă valoarea absolută ∈ [0,70; 1] => există o legătură puternică între cele
2 variabile, atunci când celelalte
variabile din model sunt constante
* dacă valoarea absoluă ∈ [0,4; 0,70) => există o legătură medie între cele
2 variabile, atunci când celelalte
variabile din model sunt constante
* dacă valoarea absoluă ∈ (0; 0,4) => există o legătură slabă între cele

1
2 variabile, atunci când celelalte
variabile din model sunt constante

(3) Raportul de determinație multiplă:


- notații: 𝜂2 – populație, R2 – eșantion
- ia valori în intervalul [0,1]
𝐸𝑆𝑆
- formulă de calcul: 𝑅 2 = 𝑇𝑆𝑆
- măsoară cât % din variația variabilei 𝑌 este explicată de variația simultană
a variabilelor independente 𝑋𝑗 din model, restul de până la 100% fiind
explicată de variația variabilei reziduale

(4) Raportul de determinație ajustat:


- se aplică în cazul regresiei liniare multiple
- notații: ̅̅̅
𝜂2 – populație, ̅𝑅̅̅2̅ – eșantion
- ia valori în intervalul [0,1]
𝑛−1
- formulă de calcul: ̅𝑅̅̅2̅ = 1 − (1 − 𝑅 2 ) ∙ 𝑛−𝑘
- se folosește pentru compararea a 2 sau mai multe modele, modelul cel mai
bun fiind cel care are valoarea cea mai mare pentru ̅𝑅̅̅2̅

(5) Raportul de corelație:


- notații: 𝜂 – populație, R – eșantion
- ia valori în intervalul [0,1]
- măsoară intensitatea legăturii dintre variabilele inependente și 𝑌
- nu indică sensul sensul legăturii dintre variabilele inependente și 𝑌
- valoarea raportului de corelație se interpretează astfel:
* 0,70 ≤ R ≤ 1 => există o legătură puternică între variabilele 𝑋𝑗 și 𝑌
* 0,40 ≤ R < 0,70=> există o legătură medie între variabilele 𝑋𝑗 și 𝑌
* 0 < R < 0,40 => există o legătură slabă între variabilele 𝑋𝑗 și 𝑌
* R = 0 => nu există o legătură între variabilele 𝑋𝑗 și 𝑌
(6) Relația dintre indicatorii de corelație: R = √R2

Exemplu:
Pentru un eșantion de 6 salariați se consideră legătura liniară dintre Salariu (Y – mii lei) și factorii
de influență: Nr. de ani de școală absolviți (X1 – ani) și Vechimea (X2 – luni).

1) să se interpreteze valoarea coeficientului de corelație bivariată 𝑟𝑦1

2
Correlations

vechime ani de scoala salariu


vechime Pearson Correlation 1 .627 .958**
Sig. (2-tailed) .183 .003
N 6 6 6
ani de scoala Pearson Correlation .627 1 .811*
Sig. (2-tailed) .183 .049
N 6 6 6
salariu Pearson Correlation .958** .811* 1
Sig. (2-tailed) .003 .049
N 6 6 6
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).

𝑟𝑦1 = 0,811 – între salariu și numărul de ani de școală absolviți există o legătură
directă si puternică

2) să se interpreteze valoarea coeficientului de corelație parțială 𝑟𝑦1.2


Correlations

Control Variables salariu ani de scoala


vechime salariu Correlation 1.000 .946
Significance (2-tailed) . .015
df 0 3
ani de scoala Correlation .946 1.000
Significance (2-tailed) .015 .
df 3 0

𝑟𝑦1.2 = 0,946 – între salariu și numărul de ani de școală absolviți există o


legătură directă si puternică atunci când vechimea este constantă

3) să se determine și să se interpreteze valorile raportului de determinație multiplă și ale raportului


de corelație

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 40.482 2 20.241 172.812 .001 a
Residual .351 3 .117
Total 40.833 5
a. Predictors: (Constant), vechime, ani de scoala
b. Dependent Variable: salariu

Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 .996a .991 .986 .34224
a. Predictors: (Constant), vechime, ani de scoala

3
𝐸𝑆𝑆 40,482
𝑅 2 = 𝑇𝑆𝑆 = 40,833 = 0,991 – 99,1% din variația salariului este explicată de variația simultană a
numărului de ani de școală absolviți și a vechimii, restul de până la 100% fiind explicată de variația
factorilor neincluși în model.

R = √R2 = 0,996 – între salariu, numărul de ani de școală absolviți și vechime există o legătură
puternică.

4) folosind datele din tabelul de mai jos, să se specifice modelul cel mai bun

(comparăm valorile raportului de determinație ajustat)

Model Summary

Change Statistics
Adjusted Std. Error of R Square
Model R R Square R Square the Estimate Change F Change df1 df2 Sig. F Change
1 .661 a .436 .435 $12,833.540 .436 365.381 1 472 .000
2 .890 b .792 .792 $7,796.524 .356 807.889 1 471 .000
a. Predictors: (Constant), Educational Level (years)
b. Predictors: (Constant), Educational Level (years), Beginning Salary

̅̅̅
𝑅 2̅ pentru Model 1 este 0,436
̅̅̅
𝑅 2̅ pentru Model 2 este 0,792
0,792 > 0.436 => Modelul 2 este mai bun decât Modelul 1.

5.1 Testarea coeficientilor de corelație (testul t)

Etapele testării:
(1) Definirea ipotezelor:
𝐻0 : 𝜌 = 0, unde 𝜌 poate fi 𝜌𝑦1 , 𝜌𝑦2 , 𝜌12 , 𝜌𝑦1.2 sau 𝜌𝑦2.1
𝐻1 : 𝜌 ≠ 0, unde 𝜌 poate fi 𝜌𝑦1 , 𝜌𝑦2 , 𝜌12 , 𝜌𝑦1.2 sau 𝜌𝑦2.1

(2) Pragul de semnificație: 𝛼

(3) Alegerea testului: t

(4) Valoarea critică a statisticii test pentru riscul admis 𝛼:


- pentru coeficienții de corelație simplă (bivariată): 𝑡𝑡𝑒𝑜𝑟𝑒𝑡𝑖𝑐 = 𝑡𝛼/2,𝑛−2
- pentru coeficienții de corelație parțială: 𝑡𝑡𝑒𝑜𝑟𝑒𝑡𝑖𝑐 = 𝑡𝛼/2,𝑛−𝑘

(5) Valoarea calculată a statisticii test:


𝑟√𝑛−2
- pentru coeficienții de corelație simplă (bivariată): 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 = ,
√1−𝑟 2
unde r poate fi 𝑟𝑦1 , 𝑟𝑦2 , 𝑟12
𝑟√𝑛−𝑘
- pentru coeficienții de corelație parțială: 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 = ,
√1−𝑟 2

4
unde r poate fi 𝑟𝑦1.2 sau 𝑟𝑦2.1

(6) Regula de decizie:


|𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 | > 𝑡𝑡𝑒𝑜𝑟𝑒𝑡𝑖𝑐 sau 𝑆𝑖𝑔 < 𝛼 => se respinge H0
|𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 | ≤ 𝑡𝑡𝑒𝑜𝑟𝑒𝑡𝑖𝑐 sau 𝑆𝑖𝑔 ≥ 𝛼 => nu se respinge H0

(7) Decizie și interpretare

Exemplu:
Pentru un eșantion de 6 salariați, se consideră legătura liniară dintre Salariu (Y – mii lei) și factorii
de influență Nr. de ani de școală absolviți (X1 – ani) și Vechimea (X2 – luni).
* să se testeze semnificația coeficientului de corelație parțială 𝜌𝑦1.2
(1) Definirea ipotezelor:
𝐻0 : 𝜌𝑦1.2 = 0
𝐻1 : 𝜌𝑦1.2 ≠ 0

(2) Pragul de semnificație: 𝛼 = 0,05

(3) Alegerea testului: t

(4) Valoarea critică a statisticii test pentru riscul admis 𝛼:


𝑡𝑡𝑒𝑜𝑟𝑒𝑡𝑖𝑐 = 𝑡𝛼/2,𝑛−𝑘 = 𝑡0,05/2,6−3 = 3,182

(5) Valoarea calculată a statisticii test:


𝑟𝑦1.2 √𝑛−𝑘 0,946√6−3 0,946∙1,732 1,638
𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 = = = = 0,325 = 5,04
√1−𝑟𝑦1.2 2 √1−0,9462 √1−0,894

(6) Regula de decizie…..

(7) Se compară..
(|𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 | = 5,04) > (𝑡𝑡𝑒𝑜𝑟𝑒𝑡𝑖𝑐 = 3.182) sau (𝑆𝑖𝑔 = 0,015) < (𝛼 = 0,05) => se respinge
H0

(8) Decizie și interpretare:


Pentru un risc de 5% putem afirma că valoarea coeficientului de corelație parțială 𝜌𝑦1.2 este
semnificativ diferită de zero, deci există o legătură semnificativă între salariu și numărul de ani de
școală absolviți, atunci când vechimea se menține constantă.

5.2 Testarea raportului de corelație (testul F)

6. Testarea modelului de regresie (testul F)

Etapele testării:

5
(1) Definirea ipotezelor:
𝐻0 : modelul nu este semnificativ statistic
𝐻1 : modelul este semnificativ statistic

(2) Pragul de semnificație: 𝛼

(3) Alegerea testului: F


(4) Valoarea critică a statisticii test pentru riscul admis 𝛼:
𝐹𝑡𝑒𝑜𝑟𝑒𝑡𝑖𝑐 = 𝐹𝛼,𝑣1,𝑣2 = 𝐹𝛼,𝑘−1,𝑛−𝑘

𝐸𝑆𝑆 𝑛−𝑘
(5) Valoarea calculată a statisticii test: 𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 = 𝑅𝑆𝑆 ∙ 𝑘−1

(6) Regula de decizie:


𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 > 𝐹𝑡𝑒𝑜𝑟𝑒𝑡𝑖𝑐 sau 𝑆𝑖𝑔 < 𝛼 => se respinge H0
𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 ≤ 𝑡𝑡𝑒𝑜𝑟𝑒𝑡𝑖𝑐 sau 𝑆𝑖𝑔 ≥ 𝛼 => nu se respinge H0

(7) Decizie și interpretare

Exemplu:
Se consideră pentru 6 salariați legătura liniară dintre Salariu (Y – mii lei) și factorii de influență
Nr. de ani de școală absolviți (X1 – ani) și Vechimea (X2 – luni).

* să se testeze semnificația modelului de regresie

(1) Definirea ipotezelor:


𝐻0 : modelul nu este semnificativ statistic
𝐻1 : modelul este semnificativ statistic

(2) Pragul de semnificație: 𝛼=0,05

(3) Alegerea testului: F

(4) Valoarea critică a statisticii test pentru riscul admis 𝛼:


𝐹𝑡𝑒𝑜𝑟𝑒𝑡𝑖𝑐 = 𝐹𝛼,𝑣1,𝑣2 = 𝐹𝛼,𝑘−1,𝑛−𝑘 = 𝐹0,05,2,3 = 9,552

(5) Valoarea calculată a statisticii test:


𝐸𝑆𝑆 𝑛−𝑘 40,482 6−3 40,482 3
𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 = 𝑅𝑆𝑆 ∙ 𝑘−1 = 0,351 ∙ 3−1 = 0,351 ∙ 2 = 172,812

(6) Regula de decizie……

(7) Se compară
(𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑡 = 172,812) > (𝐹𝑡𝑒𝑜𝑟𝑒𝑡𝑖𝑐 = 9,552) sau (𝑆𝑖𝑔 = 0,001) < (𝛼 = 0,05) => se
respinge H0

(8) Decizie și interpretare:

6
Cu un risc de 5% putem afirma că modelul estimat între salariu, numărul de ani de școală absolviți
și vechime este semnificativ statistic.

Exemplul 2.
Se studiază variația ratei de creștere economică în raport cu rata dobânzii și speranța de
viață la naștere, pentru un eșantion de țări din Europa. Rezultatele obținute prin prelucrarea
datelor cu programul SPSS sunt prezentate în tabelele de mai jos.

7
8
Se cere:

1. Să se scrie ecuația estimată a modelului de regresie liniară multiplă


2. Să se precizeze numărul de parametri ai modelului și volumul eșantionului
3. Să se interpreteze estimațiile punctuale ale coeficienților de regresie
4. Să se estimeze prin interval de încredere, garantat cu o probabilitate de 95%, coeficientul de
regresie 𝛽2
5. Să se testeze semnificația statistică a coeficientului de regresie 𝛽1 , considerând un risc de 1%.
6. Să se estimeze și să se interpreteze coeficienții de corelație bivariată 𝑟𝑌1 , 𝑟𝑌2 𝑠𝑖 𝑟12
7. Să se testeze semnificația statistică a coeficienților de corelație bivariată pt un risc de 5%
8. Să se estimeze coeficienții de corelație parțială 𝑟𝑌1∙2 𝑠𝑖 𝑟𝑌2∙1
9. Să se testeze semnificația coeficienților de corelație parțială pt risc de 5%. Aceeași cerință pt risc
de 1%.
10. Să se stimeze si să se interpreteze raportul de determinație multiplă si raportul de corelatie.
11. Să se testeze raportul de corelație, pt risc de 5%
12. Să se testeze semnificația în ansamblu a parametrilor modelului de regresie pt risc de 1%.
13. Să se specifice factorul cu cea mai puternică influență asupra ratei de crestere economică.
14. Să se estimeze nivelul ratei de creștere economica pentru o rata a dobanzii de 2,5% și speranța
de viata la naștere de 75 ani.

S-ar putea să vă placă și