Documente Academic
Documente Profesional
Documente Cultură
Cuprins:
1. Scopul i obiectivele cursului 2. Covariana. Coeficientul de corelaie liniar simpl 3 Inferena statistica n cadrul modelului liniar simplu 4. Asumpiile re resiei !. "roarea standard a estimrii #est de autoevaluare Bibliografie minimal
vei nele e utilitatea determinrii raportului de corelaie i a coeficientului de determinaie vei nele e importana testrii validit'ii modelului liniar simplu& a coeficienilor de re resie& a coeficientului de corelaie vei nele e importana verificrii asumpiilor re resiei vei fi capabili s determinai i interpretai eroarea standard a estimrii vei obine un scor de cel puin -./ ntr0un interval de timp de ma1im 2. minute la testul de la sf3ritul acestei unit)i de nv)are.
cov9 x& y 8 =
9 x
i =1
x 89 yi y 8 n
Interpretarea covarianei este urm)toarea* dac cov9 x& y 8 = . & cele dou variabile sunt independente dac cov9 x& y 8 > . & le )tura dintre cele dou variabile este direct& po%itiv dac cov9 x& y 8 < . & le )tura dintre cele dou variabile este invers& ne ativ. $ns) valoarea numeric a covarianei nu are nici o semnificaie pentru cercet)tor. :aloarea absolut a covarianei tinde spre
mare cu at3t este mai intens le )tura dintre cele dou variabile. 5nul dintre cei mai importani indicatori de estimare a intensitii le )turii dintre dou variabile statistice este ns) coeficientul de corelaie liniar simpl ;ravais0<earson. 7ormula de calcul a acestuia este*
ry = x =
9
i =1
xi x yi y 8 x y n
cov9 x& y 8
ry = x =
9 x
i =1
x 89 yi y 8 n x y
4bservm c ry = x = x y
Interpretarea coeficientului de corelaie simpl liniar ry = x dac ry = x = . & cele dou variabile anali%ate sunt independente
este urmtoarea*
dac ry = x > . & le tura dintre cele dou variabile este direct& po%itiv dac ry = x < . & le tura dintre cele dou variabile este invers& ne ativ dac . ry = x < .&2 & le tura dintre cele dou variabile nu e1ist sau este foarte slab dac .&2 ry = x < .&! & le tura dintre cele dou variabile este slab dac .&! ry = x < .&A! & le tura dintre cele dou variabile este de intensitate medie dac .&A! ry = x < .&B! & le tura dintre cele dou variabile este puternic dac .&B! ry = x 1 & le tura dintre cele dou variabile este funcional Coeficientul de corelaie liniar simpl ;ravais0<earson se utili%ea% doar n ca%ul le turilor de tip liniar. 5tili%area coeficientului <earson pentru aprecierea intensitii unei le turi neliniare va coduce la erori rave de interpretare. >e e1emplu& o valoare a lui ry = x de .&1 ne poate duce la conclu%ia c le tura dintre cele dou variabile anali%ate este foarte slab& iar n realitate aceasta s fie foarte puternic& dar neliniar. $n ca%ul le turilor neliniare& pentru aprecierea intensitii acestora vom utili%a raportul de corelaie. ac le!tura a fost demonstrat ca fiind liniar" pentru estimarea intensitii acesteia putem utili%a atCt coeficientul <earson c3t i raportul de corelaie. $n acest ca%& ry = x = R y = x & e alitatea put3nd fi utili%at pentru verificarea liniaritii le turii.
Importana anali%ei de corelaie trebuie s o nele em n conte1tul problematicii reali%rii prediciilor. >ac ry = x = . & variabilele sunt independente& i deci nu putem reali%a nici o predicie despre valoarea uneia pe ba%a variaiei celeilalte. >ac ns acest coeficient este diferit de %ero& putem pre%ice cu o preci%ie mai mare sau mai mic valoarea variabilei
1 & atunci considerat dependent pe ba% valorilor variabilei independente& cau%. >ac ry = x =
Comple1itatea fenomenelor social0economice face imposibil studierea aciunii tuturor factorilor ce influenea%) o variabil considerat ca fiind endo en 9 Y8. >e aceea& n practica statistic=econometric se iau n consideraie numai le turile semnificative dintre variabila endo en Y i variabila sau variabilele e1o ene X. >eoarece re resia este o metod inferenial& ce operea%) pe un eantion de observaii& oferind posibilitatea deducerii i enerali%rii conclu%iilor asupra ntre ii populaii& este absolut necesar testarea validit'ii modelului ales& a semnificaiei coeficienilor de re resie i determinarea intervalelor de ncredere corespun%toare& pentru un nivel de semnificaie . <redicia presupune estimarea valorilor unei variabile considerat endo en pe ba%a valorilor variabilei identificat ca e1o en. Inferena presupune estimarea parametrului din populaia anali%at pe ba%a statisticii obinut pe ba%a unui eantion aleator.
7ie statistica t =
estimatorului parametrului
specific) n mod unic modelul relativ la ntrea a populaie statistic)& ce are ca surs) a datelor o observare e1Daustiv)& iar sa este eroarea standard a estimatorului a. >efinim probabilitatea*
a = t n 2 E = 2 s a
(a t
n 2 E = 2
s a a + t n 2E = 2 s a ) = 1
unde t n 2E= 2 este valoarea critic tabelat a repartiiei Student pentru pentru (n-2) rade de libertate i riscul & a este estimaia parametrului de re resie standard a !oefi!ientului a" :om considera ipote%ele* a8 b8 Ipote%a nul) # o * . = . & unde . este o valoare aleatoare a parametrului Ipote%a alternativ) # 1 * . . . Fespin erea ipote%ei nule presupune ca . s) se afle n afara intervalului de ncredere corespun%)tor nivelului de semnificaie ales& adic)*
. t sa
& iar
s a repre%int) eroarea
b t n 2E = 2 s = b
(b t
n 2E = 2
sb b + t n 2E = 2 s b ) = 1
unde t n 2E= 2 repre%int) valoarea critic) tabelat) a distribuiei Student pentru (n-2) rade de libertate i riscul & b este estimaia parametrului de re resie & iar s b repre%int) eroarea standard a !oefi!ientului b" :om considera ipote%ele* a8 b8 Ipote%a nul) # o * . = . & unde . este o valoare aleatoare a parametrului . Ipote%a alternativ) # 1 * . . . Fespin erea ipote%ei nule presupune ca . s) se afle n afara intervalului de ncredere corespun%)tor nivelului de semnificaie ales& adic)*
.
sb t
difer semnificativ de %ero. "ste practic un ca% particular al relaiilor pre%entate anterior& c3nd
. = . i respectiv . = . . >ac t !al!ulat > t tabelat vom respin e ipote%a nul)& parametrul de
re resie difer semnificativ de .. <e l3n testarea utilit'ii estimatorilor parametrilor de re resie& este necesar i testarea calit'ii a6ustrii prin modelul de re resie a datelor de observaie. Aprecierea calit'ii a6ustrii se reali%ea% utili%3nd anali%a de tip dispersional. :om descompune variaia total a variabilei endo ene Y n raport cu cele dou surse de variaie identificabile& variaia datorat re resiei i variaia re%idual.
>in cursul anterior tim cvalorilor a6ustate sunt Yx = a + b xi iar eroarea este
i
ei = yi Yxi . Abaterea valorilor empirice yi de la media lor este* yi y = 9 yi Yxi 8 + 9Yxi y 8 yi y = ei + 9Yxi y 8 >eci vom avea yi = ei + Yxi = a + bxi + ei = y bx + bxi + ei
:ariaia total a variabilei endo ene Y se obine ca sum a ptratelor abaterilor valorilor individuale de la media lor& adic*
n n n n n 2 2 2 2 2 9 y y 8 = 9 Y y 8 + 9 y Y 8 9 y y 8 = 9 Y y 8 + i xi i xi i xi e2i n i =1 i =1 i =1 i =1 i =1 i =1
9Y
i =1 n
xi
y 8 2 = 9 yi y 8 2 e 2 i
i =1 i =1
9 y
i =1
n Yxi 8 2 = e 2 i i =1
#rebuie s e1plicm aici noiunea de rade de libertate. $n statistic& radul de libertate este e al cu numrul comparaiilor independente ntre elementele unei mrimi de observaie sau numrul valorilor care pot fi alese arbitrar n cadrul unei specificri. >e e1emplu& numrul radelor de libertate ntr0un tabel de contin en cu p r3nduri i I coloane ntr0o distribuie arbitar este e al cu 9 , 189+ 18.
9 y
i =1
9Y
i =1
xi
variaia re%idual
9 y
i =1
Anali%a varianei este pre%entat ntr0o form sistemati%at n tabelul 1. #abelul 1* %nali&a varian'ei Sursa variaiei "1plicat Fe%idual Suma ptratelor n 9Yx y 8 2
i =1 n
i
n 2 9 y Y 8 i xi H e 2 i
i =1
i =1
se =
n-$
e
i =1 n i =1
n2
#otal
9 y
i =1
y8
sy =
9y
y82
n 1
Calitatea a6ustrii datelor de observaie pe ba%a dreptei de re resie se poate aprecia cu a6utorul testului ( 9(is)er- *nede!or)" Statistica ( are e1presia*
(=
9Y
i =1
xi
y82 =1
*nede!or cu 1 i n02 rade de libertate 9 ( J (1& n 2 8. <entru aprecierea semnificaiei lobale a modelului de re resie vom compara valoarea calculat) a statisticii ( cu valoarea tabelat) ( 91& n 2& 8 a distribuiei 7isDer pentru cele dou) rade de libertate 1 i (n-2) asociate estimaiilor de dispersie corespun%)toare i pentru un pra de semnificaie dat. >ac) (!al!ulat > (tabelat vom respin e ipote%a nul)& variabilitatea factorialei X influenea%) semnificativ variabilitatea re%ultativei Y& n ca% contrar se accept) ipote%a nul)& modelul de re resie este nesemnificativ. <entru testarea semnificaiei valorii coeficientului de corelaie <earson vom considera ipote%ele* a8 Ipote%a nul) # o * ry = x = . & ceea ce ar nsemna c) cele dou) variabile ale modelului sunt Ipote%a alternativ) # 1 * ry = x . . Statistica t este descris) de relaia* t= ry = x 1 r2 y=x n2&
independente b8
urm3nd o distribuie Student cu (n-2) rade de libertate. :om confrunta valoarea calculat) a statisticii t cu valoarea tabelat)& pentru (n-2) rade de libertate i un nivel de semnificaie dat. >ac) t !al!ulat > t tabelat vom respin e ipote%a nul) i vom conclu%iona& cu un risc dat 9u%ual este de !/8 c) valoarea coeficientului <earson este diferit) de %ero& deci ntre cele 2 variabile e1ist) o le )tur)& i aceasta este semnificativ).
#. Asumiile re!resiei
5tili%area anali%ei de re resie ofer cercettorului posibilitatea obinerii unor re%ultate acurate dac i numai dac sunt verificate o serie de ipote%e 9asumpii8* Asumpii !enerale$ Ipote%a liniaritii. (iniaritatea se verific prin e1aminarea vi%ual a norului de puncte& cu a6utorul corelo ramei 9scatter8 :ariabilele anali%ate sunt numerice. <utem utili%a n modelul de re resie i variabile calitative& prin transformarea cate oriilor acestora n variabile dummy.
Ku e1ist erori de msurare. "rorile de msurare ale variabilelor anali%ate pot s apar atunci c3nd subiecii cercetrii nu ofer rspunsurile adecvate sau c3nd operatorii de teren nu nre istrea% datele n mod corect sau c3nd operatorii de calculator nu introduc n mod corect datele n calculator.
-@ i ? = . & i.$/n
>istribuia de probabilit'i a erorii i este independent de valorile luate de variabila e1o en X"
-@ i ? = 2 i -@ 2 1 ? = 2 1 & pentru
heteroscedasticitate.
i 1&
este
cunoscut
sub
numele
de
"rorile repre%int o secven de variabile aleatoare necorelate ntre ele 9nu sunt autocorelate8. Adic& cov@i & 1 ? = -@i & 1 ? = . oricare ar fi i 1
i 2 9.& 2 8
:alorile observate ale variabilei e1o ene X nu sunt corelate cu i & adic*
9 y
i =1
Yxi 8 2 . Apoi&
9 y
i =1
Yxi 8 2 n
. <rin
calcularea celor doi coeficieni de re resie pierdem dou rade de libertate. 7ormula erorii standard a estimrii este deci*
Yxi 8 2
se =
9y
i =1
n2
endo ene Y atunci c3nd valorile variabilei X sunt cunoscute i ofer posibilitatea cunoaterii abaterii standard a erorilor n 6urul dreptei de re resie.
"roarea standard a estimrii este o msur a variaiei nee1plicate. Cu c3t aceast statistic are o valoare mai mic& cu at3t proporia variaiei nee1plicate este mai mic.
Test de autoevaluare
1. <reci%ai care este deosebirea dintre anali%a de re resie si anali%a de corelatie 2. >ac le tura dintre dou variabile este neliniar& pentru estimarea intensit'ii acesteia vom utili%a* a8 coeficientul de corelaie simpl liniar b8 raportul de corelaie c8 coeficientul de determinaie d8 nici un rspuns nu este corect 3. "1plicati importanta calculrii erorii standard a estimrii 4. <entru verificarea validit'ii unui model econometric liniar simplu utili%m* a8 testul & b8 testul t-*tudent c8 testul 7isDer0Snedecor d8 destul Mald !. 5tili%Cnd datele de la e1emplu anterior& cursul 2& se cere* a8 s se verifice validitatea modelului econometric si semnificatia statistica a estimatorilor
b8 s se estime%e i s se caracteri%e%e intensitatea le turii dintre cele dou variabile anali%ate. Biblio ra!ie minimala 1. Geor escu& :. 92..!8& *tatisti! des!ri,tiv 3i inferen'ial/ "ditura 5niversitaria& Craiova 2. Gu6arati 92..48& Basi! -!onometri!s/ 4tD "dition& +cGraNOPill KeN QorR 3. Pinton& <.F. 92..48& *tatisti!s -x,lained/ 2nd "dition& Foutled e KeN QorR. 4. Dttp*==NNN.Soutube.com=resultsTsearcDUIuerSHsimpleVliniarVre ressionWsmH3 !. Dttp*==NNN.Soutube.com=resultsTsearcDUIuerSHolsVmetDodWsmH1 2. Dttp*==NNN.Soutube.com=NatcDTvH4"XKedim>+s