Sunteți pe pagina 1din 10

Testarea semnificației parametrilor

modelului unifactorial de regresie


Testarea semnificaţiei parametrilor
modelului unifactorial de regresie
 În cazul regresiei liniare, coeficienţii ecuaţiei de
regresie la nivelul eşantionului, a şi b , sunt
estimaţii ale coeficienţilor ecuaţiei de regresie la
nivelul populaţiei generale,  şi .
Analog, media variabilei cauzale la nivelul
eşantionului, x , este un estimator al mediei, μx,
la nivelul colectivităţii generale. În plus, aceşti
coeficienţi au distribuţii de eşantionare.
Testarea semnificaţiei parametrilor
modelului unifactorial de regresie
 Estimatorul dispersiei variabilei reziduale se determină
ca: n

(y 2
i  yˆ i )
se2  i 1
n  k 1
unde: k reprezintă numărul variabilelor independente
considerate, iar (n-k-1) reprezintă numărul gradelor de
libertate. În cazul regresiei simple liniare, k=1 şi (n-k-1)=n-2.
 Abaterea medie pătratică a variabilei reziduale (eroarea
standard a estimaţiei) este:
n

e
2  i i
( y  ˆ
y ) 2

se  s e 
2
 i 1
n2 n  k 1
Testarea semnificaţiei parametrilor
modelului unifactorial de regresie
 se2 este un indicator important în determinarea intervalului de
încredere pentru estimatorii parametrilor modelului de
regresie, deoarece regresia se studiază, în general, pe bază
de eşantioane.
 b este estimatorul parametrului , coeficientul de regresie,
necunoscut, din colectivitatea generală,iar a este estimatorul
termenului liber , aceşti estimatori având o distribuţie de
eşantionare.
 Coeficientul este un estimator nedeplasat al parametrului  , adică

 (Este necesar să cunoaştem media şi abaterea medie pătratică a


distribuţiei coeficientului )
Testarea semnificației parametrilor modelului
unifactorial de regresie
Testarea semnificaţiei parametrilor modelului
Ecuaţia de regresie:
la nivelul colectivităţii generale este:
y i     xi   i
la nivelul eşantionului este:
y  ˆ
a  ˆx  e
b
Testarea semnificaţiei parametrului : i i i
H0 : = 0 (adică  nu este semnificativ diferit de zero, deci nu este
semnificativ statistic)
H1 :  0, (adică  este semnificativ diferit de zero, deci  este semnificativ
statistic)
Daca n  30 avem eşantion de volum redus deci vom utiliza testul t (Student)
air pentru n > 30 se vom utiliza testul z.

calc  t  / 2; n  2
Decizia: dacă , t H0 se respinge ˆ   aˆ
a
t calculat 
Determinarea lui tcalculat se face cu relaţia : S aˆ

S aˆ  s e
x 2
i
z calculat 
ˆ   aˆ
a
n  x  x 
2
i S aˆ
7. Regresia simplă 5
Testarea semnificației parametrilor
modelului unifactorial de regresie
 Observaţii:
 eroarea standard a termenului liber este

proporţională cu eroarea standard ,


 este mai mică dacă volumul eşantionului creşte

 este mai mare dacă este mai mare (pozitiv sau


negativ)
 ţine cont şi de dispersia variabilei independente ( ).

 Intervalul de încredere pentru parametrul este dat de


relatia:
aˆ  t / 2,n2  s aˆ    aˆ  t / 2,n 2  s aˆ
7. Regresia simplă 6
Testarea semnificației parametrilor modelului
unifactorial de regresie
Testarea semnificaţiei parametrului  :
H0 :   0( adică nu este semnificativ diferit de zero, deci nu este
semnificativ statistic)
H1 :   0, (adică este semnificativ diferit de zero, deci  este semnificativ
statistic)
Dacă n  30 avem eşantion de volum redus şi pentru testare vom utiliza
testul t (student) pentru n > 30 vom utiliza testul z
Decizia: dacă , t calc  t / 2;n  2 atunci H0 se respinge
Determinarea lui tcalculat se face cu relaţia : bˆ   bˆ
t calc 
S bˆ
se
S bˆ  ; ˆ 
b ˆ
n
z calc  b

  xi  x
2
S bˆ
i 1
Intervalul de încredere pentru parametrul  este:

bˆ  t / 2,n  2  sbˆ    bˆ  t / 2,n  2  sbˆ


7. Regresia simplă 7
Estimarea valorilor variabilei dependente
• Dacă presupunem că variabila independentă ia valoarea specificată Xn+1
şi legătura liniară se menţine, atunci valoarea corespunzătoare a variabilei
dependente Yn+1 este:
Yn+1,i = β0 + 1Xn+1,i + n+1,
• Ecuaţiile de mai sus sunt utilizate pentru estimarea mediei de răspuns şi
pentru estimarea unui răspuns individual.
• Pentru amândouă estimaţiile putem obţine estimaţii punctuale sau pe
intervale de încredere.
• Pentru a obţine estimaţii punctuale, folosim ecuaţia de regresie liniară în
eşantion:yi = b0 + b1xi + ei şi atunci, înlocuind cu valoarea dată Xn+1,
obţinem: ŷ n 1 = bo + b1xn+1
• Construirea intervalului de încredere pentru previzionare necesită
cunoaşterea distribuţiei, mediei şi dispersiei pentru
ŷ n 1
ŷ n 1
• Variabila urmează o distribuţie t cu (n – 2) grade de libertate.
Dispersia asociată variabilei poate fi identificată în trei cazuri şi anume:
Estimarea valorilor variabilei dependente
• Caz 1.determinarea intervalului de încredere pentru media de răspuns,
când xn+1 = x.
– Ştim că:
yˆ n 1  y  b x  bx n 1  y  b x n 1  x  
dacă xn+1 = x , atunci ŷ n 1  y, iar estimatorul dispersiei pentru ŷ n 1 este:
2
s
s 2ŷ   s 2 y   e
n 1
n se
ŷ n 1  t  / 2 ,n 2
n
– Intervalul de încredere este, în acest caz:

• Caz 2.determinarea
x intervalului de încredere pentru media de răspuns,
când xn+1  .
ŷ n 1  y  b( x n 1  x )
– În acest caz: ŷ n 1
 
 dispersiei pentru
– iar estimatorul  este:
2 1 ( xn 1  x ) 2 
s yˆ n1   se
2

x 
n n
2 
 i x 
 i 1 
Estimarea valorilor variabilei dependente

-Intervalul de încredere pentru media de răspuns este:

ŷ n 1  t  / 2 ,n  2 s e
1

x n 1
x  2

 x 
n
n x
2

i
i 1

– Caz 3.determinarea intervalului de încredere pentru un răspuns


individual. Dispersia în eşantion este:
   
 2   2 
2 1 ( xn 1  x)  2 2 1 ( xn 1  x) 
s2yˆ n  1, i 
 s2yˆ   s   s  s 1   n
n  1  y n  1, i e
n n
2 
e e
 n 2 



i 1
( xi  x ) 



i 1
( xi  x ) 

1 ( xn 1  x) 2
yˆ n 1,i  t / 2de
– Intervalul se 1  pentru
, n  2 încredere n media de răspuns este:
n ( x  x) 2  i 1
i

S-ar putea să vă placă și