Sunteți pe pagina 1din 19

REGRESIA LINIAR UNIFACTORIAL:

INFERENA STATISTIC



1.Testarea semnificaiei parametrilor
modelului unifactorial liniar
Estimatorii a i b ai coeficienilor din ecuaia de regresie n
colectivitatea general au distribuii de eantionare, cu urmtoarele
proprieti:
a i b sunt estimatori nedeplasai ai parametrilor i , adic:

Distribuiile de eantionare ale estimatorilor a i b sunt normal
distribuite, cu mediile i i dispersiile: i
( ) o = a ( ) | = b
2
a
s
2
b
s
( )

=
2
2
2 2
x x n
x
s s
i
i
e a
( )


=
2
2 2
1
x x
s s
i
e b
( )
2

2
2

=

n
y y
s
i i
e
|
|
|
|
.
|

\
|

+ =

=
n
i
i
e a
x x
x
n
s s
1
2
2
2 2
) (
1
Testarea semnificaiei parametrului
(panta dreptei)
Ipotezele statistice pestru testul bilateral:
H0: = 0
H1: 0
Dac eantionul este de volum mare:
Testul z:

Regiunea critic: dac sau se respinge H0.
Dac eantionul este de volum mic:
Testul t:


Reg. Critic: dac sau se respinge H0.

( )
b b
calc
s
b
s
b b
z
0
=

=

2 / o
z z
calc
<
2 / o
z z
calc
>
( )
b b b
calc
s
b
s
b
s
b b
t =

=
0
2 , 2 /
<
n calc
t t
o
2 , 2 /
>
n calc
t t
o
Testarea semnificaiei parametrului
(panta dreptei)
Teste unilaterale:
Test unilateral dreapta:
H0: = 0
H1: > 0
Test unilateral stnga:
H0: = 0
H1: < 0
Regiunea critic:
Pt. test unilat. dreapta:
Pt. test unilat. stnga:
Intervalul de ncredere pentru :
2 ,
>
n calc
t t
o
2 ,
<
n calc
t t
o
( )
b b b
calc
s
b
s
b
s
b b
t =

=
0
b n b n
s t b s t b + s s
2 , 2 / 2 , 2 / o o
|
Testarea semnificaiei parametrului

Ipotezele statistice pestru testul bilateral:
H
0
: = 0
H
1
: 0
Testul t:

Reg. Critic: dac sau
se respinge H
0
, deci este semnificativ statistic.
Intervalul de incredere pentru parametrul este:
2 , 2 /
<
n calc
t t
o
( )
a a a
calc
s
a
s
a
s
a a
t =

=
0
2 , 2 /
>
n calc
t t
o
a n a n
s t a s t a + s s
2 , 2 / 2 , 2 / o o
o
r poate fi folosit pentru a oferi o estimaie pe interval de
ncredere a parametrului , coeficientul de corelaie din
colectivitatea general.



sau, prin transformri elementare:







= =

= =
=
n
1 i
2
i
n
1 i
2
i
n
1 i
i i
y x
xy
y x
xy
) y y ( ) x x (
) y y )( x x (
s s
s
s s
) y , x cov(
r
(
(

|
.
|

\
|

(
(

|
.
|

\
|

=


= = = =
= = =
n
1 i
2
n
1 i
i
2
i
n
1 i
2
n
1 i
i
2
i
n
1 i
n
1 i
n
1 i
i i i i
xy
y y n x x n
y x y x n
r
2. Coeficientul de corelaie: calcul,
testarea semnificaiei
2. Coeficientul de corelaie: calcul,
testarea semnificaiei
b se mai poate scrie:




Numrtorul lui b este:


Numitorul lui b este:
2
2
x
n
x
y x xy
i

( )
2
2
2
2
|
|
.
|

\
|


=
A
A
=




n
x
n
x
n
y
n
x
n
y x
x x n
y x y x n
b
b
i i
i i i i
i i
i i i i
( )
n
y
n
x
n
y x
y x xy y x
i i i i
= = , cov
2
2
2
|
|
.
|

\
|
=

n
x
n
x
s
i i
x
Deci b se mai poate scrie:

Din expresia coeficientului de corelaie:


Rezult deci c:
( )
2
, cov
x
s
y x
b =
( )
y
x
y x
x
y x
xy
s
s
b
s s
s
b
s s
y x
r =

=
2
, cov
x
y
xy
s
s
r b =
2. Coeficientul de corelaie: calcul,
testarea semnificaiei



cu condiia ca cele dou variabile s aib o distribuie bivariat normal.
Media estimatoare r este i abaterea medie ptratic este
Semnificaia coeficientului de corelaie (r) poate fi testat utiliznd testul t.
H
0
: = 0, cu ipoteza alternativ: H
1
: = 0 n cazul testului bilateral i
> 0 sau < 0 n cazul testului unilateral dreapta, respectiv testul
unilateral stnga.
Statistica t este:


(



= = =

= =
=
N
i
Y i
N
i
X i
N
i
Y i X i
y x
xy
y x
y x
y x
Y X COV
1
2
1
2
1
) ( ) (
) )( (
) , (


o o
o
o o

= ) r (
2
1
2

=
n
r
s
r
2
2 n
r 1
2 n r
t

2. Coeficientul de corelaie: calcul,


testarea semnificaiei
Se observ c statistica t pentru testarea ipotezei H
0
: = 0 este identic,
de fapt, cu testul t pentru testarea ipotezei H
0
: | = 0, pornind de la
relaia: .
Ipoteza nul se respinge dac valoarea calculat t
n2
t
o/2,n2
pentru testul
bilateral i t
calc.
>t
o,n2
sau t
calc.
< -t
o,n2
pentru testul unilateral dreapta,
respectiv, stnga.







) s / s ( b r
2
y
2
x
2 2
=
2. Coeficientul de corelaie: calcul,
testarea semnificaiei
4. Exemplu rezolvare n EXCEL
Ziua Nr. spoturi
publicitare
Profit din vanzari
(u.m.)
1 7 22
2 5 12
3 1 8
4 8 20
5 10 40
6 2 10
7 6 15

Se cunosc datele:
Nr. Spoturi publicitare: 7 5 1 8 10 2 6
Profit din vnzri (u.m.): 22 12 8 20 40 10 15

Rezolvare folosind EXCEL:
Introducei datele pe dou coloane. n celula A1 se scrie Nr. spoturi iar
n B1 Profit.
Apsai TOOLS/DATA ANALYSIS i apoi REGRESSION
La Input Y Range selectai B1:B8
La Input X Range selectai A1:A8
Selectai Labels
Dac dorii s calculai valorile reziduale selectai Residuals.
Apsai OK
Exemplu rezolvare n EXCEL
Exemplu:
y = 2.9884x + 1.4931
0
5
10
15
20
25
30
35
40
45
0 2 4 6 8 10 12
Nr. spoturi
P
r
o
f
i
t

Corelograma (Scatter diagram)
Exemplu rezolvare n EXCEL
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,879293972
R Square 0,77315789
Adjusted R
Square 0,727789468
Standard Error 5,686932715
Observations 7
ANOVA
df SS MS F
Signifi-
cance F
Regression 1 551,151124 551,151 17,0418 0,00910121
Residual 5 161,706019 32,3412
Total 6 712,857143
Coefficients
Standard
Error t Stat P-value Lower 95% Upper 95%
Intercept 1,493055556 4,57023275 0,32669 0,75713 -10,255102 13,2412128
Nr.spoturi publicitare 2,988425926 0,7239111 4,12817 0,0091 1,1275532 4,84929865
RESIDUAL OUTPUT
Observation Predicted Profit din vanz. Residuals
1 22,41204 -0,41204
2 16,43519 -4,43519
3 4,48148 3,51852
4 25,40046 -5,40046
5 31,37731 8,62269
6 7,46991 2,53009
7 19,42361 -4,42361
Exemplu rezolvare n EXCEL
SUMMARY OUTPUT

Regression Statistics
Multiple R (R) 0,8793
R Square (R
2
) 0,7731
Adjusted R Square 0,7278
Standard Error (s
e
) 5,6869
Observations (n) 7

Interpretri:
R : legtura dintre X i Y este puternic.
R
2
: 77,3% din variaia lui Y este determinat de
influena lui X (este explicat de model)

Exemplu rezolvare n EXCEL
ANOVA
df SS MS F
Signifi-
cance F
Regression k = 1
2
/ x y
A
= 551,1511
=
2
/ x y
s
551,1511
F
calc
=
17,04176
minim
o
=
0,0091
Residual n-k-1 = 5
2
e
A
= 161,7060
=
2
e
s
32,3412

Total n-1 = 6
2
y
A
= 712,8571


Interpretri:
Modelul de regresie este semnificativ statistic (valid) (adic se accept
H1) pentru o probabilitate de cel mult 100-0,91=99,01%>95% (100-
Significance F %)

Grade de libertate
(Degrees of Freedom)
Varian
(Sum-of-Squares)
Dispersie corectat
(Mean-Squares)
Valoarea calculata
a testului F
Exemplu rezolvare n EXCEL
Coefficients
Standard
Error t Stat P-value
Lower
95%
Upper
95%
Intercept a = 1,4930
s
a
=
4,5702
=
o
calc
t
0,3267
0,7571 -10,2551 13,2412
Nr.spoturi
publicitare b =2,9884
s
b

=0,7239
=
|
calc
t
4,1282
0,0091 1,1275 4,8493

Interpretri:
- Parametrul nu este semnificativ, deoarece probabilitatea cu care se poate accepta
H1 (care susine c este semnificativ) este de cel mult 100-75,71=24,29%<95%.
2412 , 13 2551 , 10 s s o

- Parametrul este semnificativ, deoarece probabilitatea cu care se poate accepta H1
(care susine c este semnificativ) este de cel mult 100-0,91=99,01%>95%
8493 , 4 1275 , 1 s s |

Exemplu rezolvare n EXCEL