Sunteți pe pagina 1din 12

INFERENE STATISTICE

Modelul clasic de regresie (cu folosirea testelor t i F)

1. Abordarea clasic nu avem probleme speciale n date S presupune c dispune de infor a!ii pri"ind "enitul disponi#il i cererea de consu la ni"elul unei econo ii na!ionale$ pe un ori%ont de ti p de &' ani( )atele sunt cele din ta#elul &( Mld( *S)
Anul &+,' &+,& &+,/ &+,1 &+,2 &+,&+,. &+,, &+,0 &+,+ Venitul net ,-&(. ,,+(/ 0&'(1 0.2(, 0-,(0,2(+ +'.(0 +2/(+ +00(0 &'&-(, Consumul personal .,/(& .+.(0 ,1,(2 ,.,(+ ,./(0 ,,+(2 0/1(& 0.2(1 +'1(/ +/,(.

Tabelul 1. Date privind venitul i consumul )ori s e3pri printr4un odel econo etric$ folosind datele din ta#elul &$ legtura dintre "enitul disponi#il i consu 5 apoi$ odat odelul "alidat$ s pute s4l folosi pentru a face predic!ii la ni"el acroecono ic( A"e doar o singur "aria#il predictor( Este util s face ai 6nt7i o repre%entare grafic de tip XY( Re%ultatul cu aplica!ia E3cel$ este pre%entat 6n figura &(
Functia de consum
950 y = 0.979x - 67.28 R 2 =0.9916

900

850

800

750

700

650 750 800 850 900 Venitul di sponibil 950 1000 1050

Figura 1. Gra icul venit disponibil vs. consum

Toate indiciile sunt 6n direc!ia folosirii unui odel clasic de regresie (dependen!a pare liniar$ erorile par a a"ea dispersia constant$ ter enul li#er pare a fi diferit de %ero)( Folosind un soft clasic$ de e3e plu odulul Regression din aplica!ia Excel$ o#!ine ur toarele re%ultate ("e%i ta#elul /)(
SUMMARY OUTPUT Regression Statistics Multiple R R Square Adjusted R Square Standard Error O)ser*ations A+O,A df Re-ression Residual Total % " SS MS F #'.(#'&'!" Significance F %.(# 0&E.0 &#( #.&%!(# &#( #.&$ !#(.'""&! ! &'. '(!" &# (".#0# Coefficients Standard Error t Stat P-value .&'.$"00%"&! $".0"&#$ 0$ .$.( !#& 0.0#(#"(#'& 0. '" ! %$$ 0.0(%"0&0! (0.'' 0% %.(# 0&E.0 Lower 95% Upper 95% .%($.0#'##0% .$.!%$& 0. 0!&%# %.0!$(0# 0. !"0#$# 0. %&$&0"! 0. 0!' (#& ".$##&0 $ & %0

A( @onitatea odelului

!( )esco punerea "arian!ei totale$ testul F

C( Esti a!ii pentru coeficien!i$ erorile lor standard$ testul t, inter"ale de 6ncredere

/ntercept 0 ,aria)le %

Tabelul ). *utput de regresie liniar simpl S anali% pe r7nd re%ultatele din casetele e"iden!iate 6n ta#elul /(

Caseta A ofer infor a!ii despre coeficientul de deter ina!ie ultipl R / 8i a9ustate (Multiple R)$ coeficientul de corela!ie dintre "alorile yi o#ser"ate i "alorile y / prin ecua!ia de regresie (R Square)$ i coeficientul de deter ina!ie a9ustat R (Adjusted R Square)( Cu c7t R / i R / au "alori ai apropiate de & cu at7t regresia este mai bun( Tot 6n caseta A a"e infor a!ii despre eroarea standard esti at a odelului s (Standard Error) ce esti ea% eroarea standard i nu rul de o#ser"a!ii din eantion( :entru aplica!ia noastr$ cu to!i indicatorii de #onitate enu era!i sunt apropia!i de &$ pute conclu%iona c odelul de regresie liniar si pl este #un( Eroarea standard esti at prin eantion este 0(/2 iar nu rul de o#ser"a!ii este &'( Caseta !$ se refer la desco punerea "arian!ei totale "##T$ a "aria#ilei dependente 6n dou co ponente; varian%a e&plicat prin regresie "##'$ i varian%a nee&plicat "##($( Aici identific i gradele de li#ertate asociate desco punerii$ ai precis$ dac a"e k regresori 6n odel i n o#ser"a!ii$ a"e egalitatea n & < k = (n (k + &)) ( >n aceast caset e3ist dou celule i portante la care tre#uie s fi aten!i$ i anu e; F i Significance F( ?alorile din aceste celule ne dau ele ente i portante ce stau la #a%a "alidrii odelului de regresie (6n totalitatea sa)( Ele ne furni%ea% infor a!ii pri"ind "aloarea calculat a statisticii test F i erorii pe care pute s4o face c7nd respinge odelului de regresie ca fiind neadec"at(

Regula de deci%ie pri"ind acceptarea odelului este; "alori F i "alori ici pentru Significance F(

ari pentru statistica test

:e datele noastre$ cu F < #'.(#'&'!" este o "aloare foarte are i Significance F < %.(# 0&E.0 $ deci o "aloare foarte ic$ accept c odelul ales a9ustea% #ine datele din eantion( Caseta C ne ofer infor a!ii despre "alorile esti ate ale coeficien!ilor odelului de regresie 6n coloana Coefficients$ erorile standard ale coeficien!ilor 6n coloana Standard Error$ ele ente pentru aplicarea testului de se nifica!ie t-Student pentru fiecare coeficient (coloanele t Stat i P-value()( Tot aici a"e infor a!ii despre inter"alele de 6ncredere calculate pentru fiecare coeficient din odelul de regresie( Cu anali% infor a!iile din aceast casetA &) :entru ca un coeficient s fie se nificati" diferit de %ero$ deci "aria#ila regresor asociat lui s influen!e%e "aria#ila dependent$ tre#uie ca 6n coloana P-value s a"e "alori ici$ de e3e plu -B sau su# -B (e"ident 6n coloana t Stat a"e atunci "alori ari$ 6n odul)( Concret$ pentru ter enul li#er al odelului ( /ntercept$ a"e P-value < '('21$ adic pute afir a c dac respinge ipote%a c interceptul este egal cu %ero$ face o eroare doar de 2B( Respinge deci aceast afir a!ie i accept ca ade"rat ipote%a c interceptul este diferit de %ero( (Analog$ a9unge la conclu%ia c i panta dreptei de regresie este diferit statistic de %ero)( /) *lti ele dou coloane ne dau infor a!ii pri"ind inter"alele de 6ncredere +-B pentru fiecare coeficient al odelului( Astfel$ pentru ter enul li#er (teoretic) al odelului o#!ine inter"alul (.%($.0#'##0%1 .$.!%$&). Analog$ pentru panta ecua!iei de regresie a"e inter"alul de 6ncredere (0. 0!&%#1 %.0!$(0#). Este foarte i portant faptul c nici unul dintre aceste inter"ale de 6ncredere nu con!ine pe '$ sunte 6ncura9a!i astfel 6n a afir a c odelul este #un( ). Testarea ipote+elor, c-teva concepte C ipote+ statistic este o afir a!ie despre un para etru care descrie o popula!ie (sau despre distri#u!ia "alorilor unei "aria#ile asociate)( Ade"rul acestei afir a!ii poate fi testat cu a9utorul unui eantion e3tras din popula!ie( )e regul$ se e ite o aa4nu it ipote+ nul$ adic o afir a!ie despre "aloarea para etrului$ notat tradi!ional H ' $ care se refer la "aloarea cea ai nefa"ora#il (fa! de "aloarea real)( Ipote%ei nule i se asocia% aa4nu ita ipote+ alternativ$ notat cu H& prin care se afir faptul c para etrul ia alte "alori dec7t cea din ipote%a nul( Se ur rete respingerea ipote%ei nule$ pentru ca prin aceasta s se accepte auto at ipote%a alternati" (ca ade"rat)( :rin testarea ipote+ei (sau testul statistic) se 6n!elege o e"aluare statistic a deci%iei de respingere a ipote%ei nule H ' ( Etapele testrii unei ipote%e statistice sunt ur toarele; For ularea ipote%ei nule i a celei alternati"e5 Alegerea ni"elului de se nifica!ie al testului5 Alegerea statisticii adec"ate i deter inarea distri#u!iei "alorilor ei$ 6n condi!iile 6n care ipote%a nul este ade"rat5

)efinirea regiunii critice (de respingere) i sta#ilirea regulii de deci%ie5 Efectuarea calculelor pe #a%a datelor dintr4un eantion i luarea deci%iei( odelului liniar de

:entru testarea ipote%elor statistice 6n ca%ul para etrilor regresie (si pl) e3ist dou a#ordri; &( a#ordarea DpunctualE prin testul de se nifica!ie5 /( a#ordarea prin construirea inter"alelor de 6ncredere( .. Testul de semni ica%ie S re"eni la odelul de regresie i = &$ /$(((($ n statistic "aloarea para etrului ( yi = + xi + ei pentru care dori A$ Despre ipote+e Ipote%a nul poate fi for ulat astfel; H' ; = F

s e"alu

6n care F este o "aloare particular pe care o poate lua para etrul regul "aloarea cea ai nefa"ora#il)( Ipote%a alternati" poate s ai# una dintre for ele; a) H& ; F (ipote%a #ilateral)5 #) H& ; < F sau H& ; > F (ipote%e unilaterale)( !$ Despre nivelul de semni ica%ie S consider cele dou deci%ii posi#ile; Deci+ia #itua%ia real H ' este ade"rat H& este ade"rat H ' nu este respins (este acceptatA) )eci%ia corect Deci+ia incorect (Riscul de genul II)

odelului (de

H ' este respins Deci+ia incorect (Riscul de genul I$ ) )eci%ia corect

Ni"elul de se nifica!ie este riscul acceptat de genul I( Acesta este de regul ic$ de ordinul -B$ &B sau cGiar ai ic( )ac alege ni"elul de se nifica!ie -B $ pute afir a c 6ncrederea acordat re%ultatului statistic o#!inut este de +-B ( C$ Determinarea distribu%iei olosite "alegerea statisticii test$ )ac test o ipote% statistic (aplic un test de se nifica!ie) asupra para etrului din odelul de regresie$ ne #a% pe cele cinci ipote%e cerute 8; odelului i pe ur torul re%ultat statistic asociat esti atorului CHS

&) "aria#ila aleatoare

8 are o distri#u!ie nor al standard N ('$&) 5 8) Var ( & ( ( xi x )/

8) = s /) eroarea standard a esti atorului este SE (

)in afir a!iile &) i /) se o#!ine un re%ultat statistic i portant i anu e; 8 #tatistica test pe care pute s4o folosi este ( Ea are o reparti!ie t cu n 8) SE ( 8 : t (n /) (re%ultat statistic i portant pe care nu 6l 4/ grade de li#ertate$ adic 8) SE ( de onstr I) D$ Determinarea regiunii critice )ac ni"elul de se nifica!ie este fi3at la -B$ pe #a%a statisticii test folosite$ regiunile de respingere pentru cele trei situa!ii a) H& ; F #) H& ; < F 5 c) H& ; > F sunt pre%entate 6n figurile &a4c)(

a)

#)

c) Figura & A notat cu tcrt "aloarea critic a statisticii test$ ai precis acea "aloare (o#!inut din ta#ele) care arcGea% regiunea de respingere( (Aceast regiune de respingere este for at din dou inter"ale$ ($ tcrt ) i (tcrt $ +) $ 6n pri a situa!ie()

Etapele testului de se nifica!ie pentru H' ; = F Ipote%a nul Ipote%a alternati" H& ; > F sunt pre%entate 6n caseta ur toare; &( C#!ine /( Calcul 8 i eroarea sa standard SE ( 8) 5 esti a!ii CHS pentru

8F "aloarea statisticii test t8 = unde F este "aloarea 8) SE ( para etrului din ipote%a nul5 din ta#elele

1( Fi3 ni"elul de se nifica!ie$ de e3e plu la -B i gsi reparti!iei t (n /) "aloarea critic tcrt 5 2( Regula de deci%ie (testul unilateral dreapta);

dac valoarea statisticii test t8 > tcrt , atunci sunte !n regiunea de res"ingere a i"ote#ei nule $i, "rin ur are, acce"t i"ote#a alternativ% dac valoarea statisticii test t8 < tcrt , atunci nu "ute res"inge i"ote#a nul $i nu "ute acce"ta i"ote#a alternativ&

)espre "-value >naintea 6nceperii unui test statistic clasic$ se pune pro#le a alegerii unui ni"el de se nifica!ie( Acesta e3pri riscul a3i al de a grei pe care sunte dispui s4l accept (de regul -B$ &B sau cGiar ai ic) atunci c7nd lu deci%ia de respingere a ipote%ei nule( Softul odern ofer posi#ilitatea Din"ersE( Anu e$ este e"aluat riscul de a lua deci%ia greit$ pe #a%a datelor de care dispune $ r 7n7nd la latitudinea fiecruia dac 6i asu sau nu acest risc( Acest risc e"aluat pe #a%a datelor apare 6n ta#ele$ la fiecare test de se nifica!ie$ i se nu ete valoarea " ("-value)(

/. Anali+a varian%ei pentru modelul de regresie liniar cu k regresori "testul F al lui Fis0er1#nedecor$ Ne interesea% s e"alu $ lu7nd 6n considerare toate cele n puncte$ e3presia 8i )/ SSE = ( yi y nu it suma ptratelor abaterilor (sau erorilor2 "e%i i criteriul ales pentru opti i%areI) :entru a e"alua e3presia$ ne folosi 8i y ) + ( yi y 8i ) yi y = ( y Se de onstrea% c egalitatea se pstrea% (atunci c7nd folosi CHS) i pentru su a ptratelor de"ia!iilor SS'$ adic 8 y) + (y y 8) (y y) = (y
/ / i i i i /

de ur toarea rela!ie e"ident

esti a!ii

sau$ cu nota!iile anterioare 8i y ) + SSE SS' = ( y


/

)ac ne pune pro#le a co parrii su elor SS' i SSE$ "o constata c / 8i y ) ( Aceasta este notat diferen!a dintre ele este toc ai su a ( y
/

8i y ) i repre%int suma ptratelor devia%iilor valorilor a3ustate de la SSR = ( y edia y ( :ute s scrie astfel; SS' = SSR + SSE afir a c e3pri ur toarea desco punere;

despre care pute

Varian%a total 4 Varian%a e&plicat prin valorile x 5 Varian%a nee&plicat Corespun%tor desco punerii lui SS' a"e i o parti!ionare a gradelor de li#ertate( Astfel$ SS' are n (& grade de li#ertate (deoarece din cele n puncte a esti at edia y pier%7nd un grad de li#ertate) iar SSE are asociate n ( (k=&) grade de li#ertate (din cele n s4au pierdut k=& prin esti area celor k para etrii coeficien!i ai "aria#ilelor regresori plus ter enul li#er)( :ri ur are$ a"7nd ur toarea parti!ionare; SS' = SSR + SSE $ (n &) k (n (k + &)) pentru SSR "or r 7ne k grad de li#ertate( Su elor SSR$ SSE le "o asocia SSE SSR adic )SR = i )SE = ( n (k + &) k ediile 6n raport cu gradele de li#ertate$

Se o#inuiete a se folosi ur torul ta#el nu it al Anali+ei varian%ei (ANC?A) pentru odelul de regresie; #ursa varia%iei Regresie Eroare Total Grade de libertate
(k regresori)

k n ( (k=&) n (&

#uma ptratelor "##$ SSR SSE SS'

6edia sumei Valoarea ptratelor statisticii F7 "6#$ )SR )SR )SE )SE

)SR care (ca )SE esti ator) ur ea% o distri#u!ie F cu k i respecti" n ( (k=&) grade de li#ertate( C#!ine $ aa4nu itul test F (Snedecor4FisGer)$ ce se folosete pentru "erificarea e3isten!ei unei dependen!e liniare 6ntre "aria#ila dependent i cele k "aria#ile independente( Ipote%a nul (ce a "rea s4o respinge )$ se refer la to!i para etrii odelului$ ai pu!in ter enul li#er i are for a; )in acest ta#el ne interesea% 6n od special raportul H ' ; & = / = ((( = k = ' i alternati"a H& ; nu to!i para etrii sunt %ero( Testul folosete aa cu a afir at$ distri#u!ia F cu (k$ n ( (k=&)) grade de li#ertate( Cu F are doar "alori po%iti"e$ i nu este si etric$ ipote%a nul este respins doar dac "aloarea calculat FF depete "aloarea critic Fcrt ( Adic$ pentru o eroare fi3at $ regula de deci%ie este ur toarea; dac F F Fcrt atunci respinge ipote%a H ' 5 dac F F < Fcrt sunte 6n %ona de acceptare a ipote%ei nule( ?aloarea critic Fcrt se o#!ine din ta#elul distri#u!iei F$ Fcrt = F'('-5( n $ n k &) pentru ni"elul de se nifica!ie fi3at -B( ai precis

E"ident$ 6n ta#elul ANC?A a"e i coloana Significance F care d valoarea " al erorii pe care o face prin respingerea ipote%ei nule c7nd ea este de fapt ade"rat( ?alori ici pentru valoarea " ne conduc la conclu%ia c pute respinge ipote%a nul i deci accept ca ade"rat ipote%a alternati" adic odelul de regresie este adec"at datelor(

&'

&&

&/

S-ar putea să vă placă și