Sunteți pe pagina 1din 13

Exemplu RLS

Y – Salariul curent (USD)

X – Studii (ani)

n=474 angajati

Coefficientsa
Unstandardized Standardized
Coefficients Coefficients 95.0% Confidence Interval for B
Std.
Model B Error Beta t Sig. Lower Bound Upper Bound
1
𝑏
𝑠 𝑡 = 𝑏 −𝑡 ⋅𝑠 𝑏 +𝑡 ⋅𝑠
(Constant) b0 𝑠 P(t>tcalc) ; ;

𝑏
b1 𝑠 𝑡 = 𝑏 −𝑡 ⋅𝑠 𝑏 +𝑡 ⋅𝑠
X r 𝑠 P(t>tcalc) ; ;

a. Dependent Variable: Y

a) Sa se scrie ecuatia modelului de regresie si sa se interpreteze.

Ecuatia modelului de regresie liniara simpla, la nivelul populatiei totale, este: Y=β0+β1*X +ε

Ecuatia dreptei de regresie este: Yx=β0+β1*X

k=2 parametrii

Parametrii β0 si β1 sunt valori reale si necunoscute la nivelul populatiei (N = 10.000 angajati).

Ecuatia modelului de regresie liniara simpla, la nivelul esantionului observat, este: Y=b0+b1*X +e

b0 - estimatia punctuala a parametrului β0 (ordonata la origine)

b1 - estimatia punctuala a parametrului β1 (panta dreptei de regresie)

Din tabelul Coef. de regresie:

b0 = - 18831,2 estimatia punctuala a parametrului β0 (ordonata la origine)

b1 = 3909,07 estimatia punctuala a parametrului β1 (panta dreptei de regresie)

Ecuatia dreptei de regresie este: Yx=-18831,2+3909,907*X

1
Pentru a interpreta panta dreptei calculam derivata.
𝑑𝑌 𝑑(𝑏 + 𝑏 𝑋)
= =𝑏
𝑑𝑋 𝑑𝑋
𝛥𝑌
𝑏 = ⇒ 𝛥𝑌 = 𝑏 ∗ 𝛥𝑋
𝛥𝑋
ΔY=y2-y1 - variatia absoluta a variabilei dependente Y

ΔX=x2-x1 - variatia absoluta a variabilei independente X

Daca 𝛥𝑋 = 1 atunci 𝛥𝑌=𝑏

Daca X creste cu 1 unitate, atunci Y creste sau scade, in medie, cu 𝑏 unitati.

Daca Nivelul studiilor creste cu 1 an, atunci Salariul creste, in medie, cu 3909,907 USD.

b1>0 legatura directa intre Studii si Salariul curent (dreapta de regresie are panta pozitiva).

Yx=b0+b1*X

Daca X=0, atunci Yx=b0

M(Y|X=0)=b0

Daca, ipotetic, un angajat are 0 ani de studii, atunci acesta are un salariul mediu estimat egal cu -18831,2
USD.

b) Sa se estimeze prin interval de incredere panta dreptei (α = 0,05)

IC 95% pt panta dreptei:


𝑏 −𝑡 ;
⋅𝑠 ≤𝛽 ≤ 𝑏 +𝑡 ;
⋅𝑠

2
Din tabelul Coefficients:

𝑏 =3909,907 (Unstd. Coeff.)

𝑠 = 204,547 (Std. Error) – estimatia abaterii standard a estimatorului 𝛽

Din tabelul Student citim pt α = 0,05

𝑡 ;
=𝑡 , ; = 1,96

IC 95% pt panta dreptei este:

𝑏 ±𝑡 ; ⋅𝑠 = (3909,907 ± 1,96 ⋅ 204,547) = (3909,907 ± 400,9121) =


(3509,17;  4311,84)
Deci,   3509,17 ≤ 𝛽 ≤ 4311,84
Se poate garanta cu o probabilitate de 95% că panta dreptei de regresie este acoperită de intervalul
(3509,17;  4311,84).

La o crestere cu 1 an a nivelului de studii, salariul creste, in medie, cu o valoare acoperita de intervalul


(3509,17;  4311,84) USD.

c) Sa se testeze semnificatia pantei dreptei

Testarea parametrului 𝛽

Din tabelul Student citim pt α = 0,05

𝑡 ;
=𝑡 , ; = 1,96

3
Din tabelul Coefficients:

𝑏 =3909,907 (Unstd. Coeff.)

𝑠 = 204,547 (Std. Error)

𝑏 3909,907
𝑡 = = = 19,115
𝑠 204,547

4
7. Decizia:
(|𝑡 | = 19,115) > (𝑡 =1,96)
Deoarece se respinge ipoteza H0  β1≠0.

𝑆𝑖𝑔. = 0,000 … < 𝛼 = 0,05 ⇒ se respinge 𝐻

Deci, cu un risc de 5%, putem afirma ca panta dreptei de regresie difera semnificativ de 0. Deci, legatura
dintre Salariul curent si Studii este semnificativa statistic.

Tabelul coeficientilor de corelatie simpla

5
d) Sa se estimeze coeficientul de corelatie Pearson

r - estimatia coeficientului de corelatie Pearson (ρ) – masoara sensul si intensitatea legaturii dintre X si Y
(pentru legatura liniara)

r = 0,661

𝑟 ∈ [−1, +1]
Intre Studii si Salariul curent exista o legatura directa si relativ stransa.

OBS:
𝑟 = 𝑏 ∗ – panta dreptei de regresie pentru modelul cu variabile standardizate
𝑟 = 0,661 (Tabelul coeficientilor de regresie, coloana Std. Coefficients - Beta)

e) Sa se testeze semnificatia coeficientul de corelatie Pearson

Din tabelul Student citim pt α = 0,05

𝑡 ;
=𝑡 , ; = 1,96

5. Determinarea valorii calculate a testului

𝑟
𝑡 =
1−𝑟
𝑛−2

, , , ,
𝑡 = = = = = 19,159
, , , ,

6
7. Decizia:

Deoarece (|𝑡 | = 19,159) > (𝑡 =1,96) se respinge ipoteza H0  ρ≠0.

𝑆𝑖𝑔. = 0,000 … < 𝛼 = 0,05 ⇒ se respinge 𝐻

Deci, cu un risc de 5%, putem afirma ca ρ difera semnificativ de 0. Deci, legatura dintre Salariul curent si
Studii este semnificativa statistic.

Tabelul ANOVA de regresie

ANOVAa
Sum of
Model Squares df Mean Square F Sig.
1 Regression ESS v1 = k – 1=1 ESS/(k – 1)=ESS 𝐸𝑆𝑆
𝐸𝑆𝑆
Residual RSS v2 = n – k = n – 2 RSS/(n – k)= 𝐹 = −1 =
𝑘
P(F>Fcalc)
𝑅𝑆𝑆 𝑅𝑆𝑆
𝑛−𝑘 𝑛−2
Total TSS v=n–1
a. Dependent Variable: Y
b. Predictors: (Constant), X


OBS: 𝑠 = = – estimatia variantei erorii

7
f) Sa se estimeze raportul de determinatie

R2 - estimatia raportului de determinatie (η2) – masoara ponderea variatiei explicate de factorul X.

Din tabelul ANOVA:

ESS = ∑ (𝑦 − 𝑦) =6,017*1010

RSS= ∑ (𝑦 − 𝑦 ) = ∑ 𝑒 =7,773*1010

TSS= ∑ (𝑦 − 𝑦) =13,791*1010
TSS = ESS + RSS

Estimatia raportului de determinatie:

𝐸𝑆𝑆 6,017 ∗ 10 6,017


𝑅 = = = = 0,436
𝑇𝑆𝑆 13,791 ∗ 10 13,791
𝑅𝑆𝑆 7,773 ∗ 10 7,773
𝑅 =1− =1− =1− = 1 − 0,564 = 0,436
𝑇𝑆𝑆 13,791 ∗ 10 13,791
𝑅 ∈ [0, 1]

Variatia variabilei independente Nivelului de studii explica 43,6% din variatia variabilei dependente Salariul
curent. 56,4% din variatia variabilei dependente Salariul curent este explicata de factorii aleatori reziduali.

g) Sa se estimeze raportul de corelatie

R - estimatia raportului de corelatie (η) – masoara intensitatea legaturii dintre X si Y.

Estimatia raportului de corelatie (pe baza Tabelului ANOVA):

𝐸𝑆𝑆 𝑅𝑆𝑆
𝑅= = 1− = 0,436 = 0,661
𝑇𝑆𝑆 𝑇𝑆𝑆

R= [0, 1]

OBS: Pentru modelul RLS, R=|r| sau R2=r2

Intre Studii si Salariul curent exista o legatura relativ stransa.

8
h) Sa se testeze daca modelul RLS este semnificativ

5. Determinarea valorii calculate a testului (la nivelul eşantionului): (Tabel ANOVA)

𝐸𝑆𝑆
𝐸𝑆𝑆 6,017 ∗ 10 6,017
𝐹 = 𝑘−1 = = = = 365,5
𝑅𝑆𝑆 𝑅𝑆𝑆 7,773 ∗ 10 0,01646
𝑛−𝑘 𝑛−2 472

9
7. Luarea deciziei

𝐹 = 365,5 > 𝐹 = 3,842 ⇒ se respinge ipoteza H0

𝑆𝑖𝑔. = 0,000 < 𝛼 = 0,05 ⇒ 𝑠𝑒 𝑟𝑒𝑠𝑝𝑖𝑛𝑔𝑒 𝑖𝑝𝑜𝑡𝑒𝑧𝑎 𝐻

Deci, exista o legatura liniara semnificativa intre Salariul curent si Studii, in conditiile unui risc α=5% .
Modelul RLS este semnificativ statistic.

10
i) Sa se testeze daca exista o corelatie semnificativa intre X si Y (testarea raportului de determinatie)

5. Determinarea valorii calculate a testului (la nivelul eşantionului):

𝑅
𝑅 0,436 0,436
𝐹 = 𝑘−1 = = = = 363,33
1−𝑅 1−𝑅 0,564 0,0012
𝑛−𝑘 𝑛−2 472

7. Luarea deciziei

𝐹 = 363,33 > 𝐹 = 3,842 ⇒ se respinge ipoteza H0

Deci, exista o legatura liniara semnificativa intre Salariul curent si Studii, in conditiile unui risc de 5%.

11
i) Sa se testeze daca exista o corelatie semnificativa intre X si Y (testarea raportului de corelatie)

5. Determinarea valorii calculate a testului (la nivelul eşantionului):

𝑅
𝑅 0,436 0,436
𝐹 = 𝑘−1 = = = = 363,33
1−𝑅 1−𝑅 0,564 0,0012
𝑛−𝑘 𝑛−2 472

7. Luarea deciziei

𝐹 = 363,33 > 𝐹 = 3,842 ⇒ se respinge ipoteza H0

Deci, exista o legatura liniara semnificativa intre Salariul curent si Studii, in conditiile unui risc de 5%.

12
Valoarea
Indicator RLS Parametru Estimator Estimatie Ipoteze Statistica test Valoarea calculata
teoretica

Panta dreptei de regresie 𝐻 :𝛽 =0 Student 𝑏


𝛽 𝛽 𝑏 𝑡 =𝑡 / ; 𝑡 =
(coeficientul de regresie) 𝐻 : 𝛽 ≠0 𝑡(𝑛 − 2) 𝑠

𝐻 :𝛽 =0 Student 𝑏
Ordonata la origine (constanta) 𝛽 𝛽 𝑏 𝑡 =𝑡 / ; 𝑡 =
𝐻 : 𝛽 ≠0 𝑡(𝑛 − 2) 𝑠
𝑟
Coeficientul de corelatie 𝐻 :𝜌 =0 Student 𝑡 =
𝜌 𝜌 𝑟 𝑡 =𝑡 / ; 1−𝑟
Pearson 𝐻 :𝜌 ≠ 0 𝑡(𝑛 − 2)
𝑛−2
𝑅
𝐻 :𝜂 = 0 Fisher
Raportul de corelatie 𝜂 𝜂̂ 𝑅 𝐹 =𝐹 ; ; 𝐹 = −1
𝑘
𝐻 :𝜂 > 0 𝐹(1, 𝑛 − 2) 1−𝑅
𝑛−𝑘

𝑅
𝐻 :𝜂 = 0 Fisher
Raportul de determinatie 𝜂 𝜂̂ 𝑅 𝐹 =𝐹 ; ; 𝐹 = −1
𝑘
𝐻 :𝜂 > 0 𝐹(1, 𝑛 − 2) 1−𝑅
𝑛−𝑘

13

S-ar putea să vă placă și