Sunteți pe pagina 1din 13

C4.

Regresie simpl inferen


Intervale de ncredere pentru parametrii
1
i
2
ai modelului
Intervalul n care se situeaz (1-)100% din valori:
Inferen n modelul de regresie liniar simpl:
intervale de ncredere si testarea ipotezelor


Estimarea intervalelor de ncredere = procedur de
determinare a intervalelor de valori n care se ncadreaz
parametrii modelului.

) ( ) (
, / , /
b se t b b se t b
T T 2 2 2 2
+ s s
o o
|

Exemplu: modelul liniar simplu al cheltuielilor alimentare:
Estimatia b
2
=0,1194
Eroarea standard se(b
2
)=0.0297
Pentru =0.05 valoarea critic t
c
=2.024 (din tabelul statistic al
distributiei t, pentru /2=0.025 i T-2=38 grade de libertate)
intervalul de ncredere de 95% pentru
2
este:


n 95% din cazuri
2
se situeaz ntre aceste limite.
| | 1795 0 0593 0 0297 0 024 2 1194 0 024 2
2 2
. ; . . . . ) ( . = = b se b
Limita inferioar i
superioar a
intervalului de
ncredere pentru
1

Limita inferioar i superioar a
intervalului de ncredere pentru
2
Etape:

definirea ipotezelor:
- ipoteza nul= presupunerea formulat asupra parametrilor sau
asupra modelului econometric
- ipotez alternativ = enunul complementar
alegerea pragului de semnificaie:
ex. = 0,05 acceptm c n 5% din cazuri decizia poate fi
greit => nivelul de ncredere este de 95%.
calcularea statisticii testului
decizia testului: dac valoarea testului se gsete n regiunea critic,
atunci se va respinge ipoteza nul
Testarea ipotezelor
Testarea ipotezelor parametrul
2

1. Ipoteza nul H
0
specific valoarea parametrului: H
0
:
2
= c.
2. Ipoteza alternativ H
1
poate fi:
H
1
:
2
c sau H
1
:
2
>c sau H
1
:
2
< c.
3. Statistica testului:


ntruct, de regul, eantionul este mic, se utilizeaz testul t (distribuia
Student n locul celei normale).

) (
) (
2
2
2 2

=
T
t
b se
b
t
|
prag de semnificaie
t
c
valoarea critic a repartiiei t
Zona roie = regiunea de respingere pentru testul bilateral
4. Regiunea de respingere este intervalul de valori ale statisticii t pt
care se respinge ipoteza nul depinde de valoarea critic t
c
:
- dac t - t
c
sau t t
c
se respinge ipoteza nul
- dac t este ntre valorile critice t
c
i t
c
, nu se respinge
ipoteza nul.


Ex. testarea ipotezelor pentru modelul cheltuielilor alimentare

1. Ipoteza nul H
0
:
2
=0.10. Ipoteza alternativ H
1
:
2
0.10.

2. Statistica testului: dac ipoteza nul este adevrat.

3. Selectm =0.05 => valoarea critic t
c
= 2.024 (pentru /2=0.025 i
(T-2)=38 grade de libertate)
respingem ipoteza nul in favoarea alternativei dac t 2.024 sau t
-2.024.
4. Folosind rezultatele precedente (b
2
=0.1194 i se(b
2
)=0.0297)
valoarea statisticii t este:


5. Concluzie: deoarece t=0.6532 < t
c
=2.024 nu respingem ipoteza nul
c
2
=0.10.
) (
) (
2
2
2 2

=
T
t
b se
b
t
|
6532 0
0297 0
10 0 1194 0
2
2 2
.
.
. .
) (
=

=
b se
b
t
|

Teste de semnificaie
Ipoteza nul H
0
:
2
=0 afirm c variabila independent x nu are nici un
efect asupra variabilei dependente y. Respingerea ei implic existena
unei legturi statistic semnificative ntre x i y.

Exemplu- modelul cheltuielilor alimentare:
1.Ipoteza nul a nesemnificaiei este H
0
:
2
=0. Ipoteza alternativ este
H
1
:
2
0.
2. Statistica testului: dac ipoteza nul e adevrat.

3.Selectm =0.05 => valoarea critic este t
c
= 2.024 pentru distribuia t
cu /2=0.025 i (T-2)=38 grade de libertate => respingem ipoteza nul
in favoarea alternativei dac t 2.024 sau t -2.024.

4. nlocuind b
2
=0.1194 i se(b
2
)=0.0297 statistica t este:



) (
) (
2
2
2

~ =
T
t
b se
b
t
02 4
0297 0
1194 0
2
2
.
.
.
) (
= = =
b se
b
t


5. Concluzie: deoarece t=4.02 > t
c
=2.024 respingem ipoteza nul =>
exist o legtura statistic semnificativ ntre venituri i cheltuielile
alimentare.
Probabilitatea asociat testului t (p-value) este definit ca
probabilitatea ca distributia t s ia o valoare mai mare sau egal cu
valoarea absolut a statisticii t n cazul eantionului dat: P ( t
c
|t| ).
Regula de respingere:
- cnd p-value < pragul de semnificaie ales => respingem ipoteza
nul.
-dac p-value > => nu respingem ipoteza nul.

Exemplu- modelul cheltuielilor alimentare :
Probabilitatea p-value pentru testul de semnificaie H
0
:
2
=0 este
raportat automat n output-ul Excel:
p=0.00027 < =0.05 => respingem ipoteza nul.

Probabilitatea pentru
testul de semnificaie
H
0
:
2
=0
Statistica t pentru testul
de semnificaie
H
0
:
2
=0
Intervale de prognoz
Pentru o valoare dat x
0
a variabilei cauz x prognozm valoarea y
0
a
variabilei dependente y:
-n (1-)% din cazuri, valoarea lui y
0
se va situa n intervalul:

unde se(f) reprezint eroarea standard corespunztoare
prognozei i se calculeaz pe baza variaiei estimate a erorii
prognozate:
(
(

+ + =
2
2
2
1
1
) (
) (

) r( a

v
x x
x x
T
f
t
o
o
) (

f se t y
c

0
) r( a

v ) ( f f se =
Exemplu. Pentru o valoare dat de $750 a venitului sptmnal
(variabila cauz x
0
), am calculat valoarea variabilei dependente y
o
:
1026 137 750 1194 0 5526 47
0 2 1 0
. . . = + = + = x b b y
Variaia estimat a erorii prognozate este:
1458 1508
1
1
2
2
2
.
) (
) (
) r( a v =
(

+ + =

x x
x x
T
f
t
o
o
Eroarea standard corespunztoare prognozei este:

Dac selectm 1-=0,95, atunci t
c
=2.024 i intervalul de ncredere de
95% pentru y
0
este:
8348 38. ) r( a v ) ( = = f f se
| | 7042 215 5010 58 6016 78 1026 137
0
. ; . . . ) ( = = f se t y
c
Concluzie: o familie cu venituri sptmnale de $750 va cheltui
pentru alimente ntre $58.5 i $215.7.

S-ar putea să vă placă și