Sunteți pe pagina 1din 10

CURSUL 3 +odelul liniar simplu , partea II

Durata medie de studiu individual 4 ore

Cuprins:
1. Scopul i obiectivele cursului 2. Covariana. Coeficientul de corelaie liniar simpl 3 Inferena statistica n cadrul modelului liniar simplu 4. Asumpiile re resiei !. "roarea standard a estimrii #est de autoevaluare Bibliografie minimal

1. Scopul i obiectivele cursului


$n cadrul acestui curs sunt pre%entate aspecte le ate determinarea coeficientului de corelaie liniar simpl& interpretarea acestuia& determinarea raportului de corelaie& testul liniarit'ii le turii dintre dou variabile economice anali%ate& inferena statistic n cadrul modelului liniar simplu& asumpiile re resiei precum i determinarea si interpretarea erorii standard a estimrii. (a finalul parcur erii acestei unit)i de nv)are* vei nele e deosebirea dintre re resie i corelaie vei fi capabili s determinai i s interpretai valoarea coeficientului de corelaie liniar simpl

vei nele e utilitatea determinrii raportului de corelaie i a coeficientului de determinaie vei nele e importana testrii validit'ii modelului liniar simplu& a coeficienilor de re resie& a coeficientului de corelaie vei nele e importana verificrii asumpiilor re resiei vei fi capabili s determinai i interpretai eroarea standard a estimrii vei obine un scor de cel puin -./ ntr0un interval de timp de ma1im 2. minute la testul de la sf3ritul acestei unit)i de nv)are.

2. Covariana. Coeficientul de corelaie liniar simpl


Analiza de corelaie este nrudit) cu anali%a de re resie& i totui conceptual diferit) de aceasta. 4biectivul principal al anali%ei de corelaie este de a m)sura intensitatea le )turii ntre dou) sau mai multe variabile anali%ate. Suntem de e1emplu interesai s) estim)m intensitatea le )turii dintre cantitatea cerut) dintr0un bun i preul acestuia& dintre cantitatea oferit) pentru un bun i preul acesteia& dintre nota la e1amenul de econometrie i num)rul de ore acordate studiului individual pe parcursul semestrului& etc. 5n prim indicator statistic cu a6utorul c)ruia putem aprecia tipul si intensitatea le )turii dintre dou variabile este covariana. 7ormula de calcul a covarianei este*
n

cov9 x& y 8 =

9 x
i =1

x 89 yi y 8 n

Interpretarea covarianei este urm)toarea* dac cov9 x& y 8 = . & cele dou variabile sunt independente dac cov9 x& y 8 > . & le )tura dintre cele dou variabile este direct& po%itiv dac cov9 x& y 8 < . & le )tura dintre cele dou variabile este invers& ne ativ. $ns) valoarea numeric a covarianei nu are nici o semnificaie pentru cercet)tor. :aloarea absolut a covarianei tinde spre

cu c3t valoarea covarianei este mai

mare cu at3t este mai intens le )tura dintre cele dou variabile. 5nul dintre cei mai importani indicatori de estimare a intensitii le )turii dintre dou variabile statistice este ns) coeficientul de corelaie liniar simpl ;ravais0<earson. 7ormula de calcul a acestuia este*

ry = x =

9
i =1

xi x yi y 8 x y n
cov9 x& y 8

ry = x =

9 x
i =1

x 89 yi y 8 n x y

4bservm c ry = x = x y

. >e asemenea& ry = x = rx = y 9asocierea dintre x i y este e al cu

@ 1&1? . asocierea dintre y i x8. Coeficientul de corelaie simp liniar ry = x

Interpretarea coeficientului de corelaie simpl liniar ry = x dac ry = x = . & cele dou variabile anali%ate sunt independente

este urmtoarea*

dac ry = x > . & le tura dintre cele dou variabile este direct& po%itiv dac ry = x < . & le tura dintre cele dou variabile este invers& ne ativ dac . ry = x < .&2 & le tura dintre cele dou variabile nu e1ist sau este foarte slab dac .&2 ry = x < .&! & le tura dintre cele dou variabile este slab dac .&! ry = x < .&A! & le tura dintre cele dou variabile este de intensitate medie dac .&A! ry = x < .&B! & le tura dintre cele dou variabile este puternic dac .&B! ry = x 1 & le tura dintre cele dou variabile este funcional Coeficientul de corelaie liniar simpl ;ravais0<earson se utili%ea% doar n ca%ul le turilor de tip liniar. 5tili%area coeficientului <earson pentru aprecierea intensitii unei le turi neliniare va coduce la erori rave de interpretare. >e e1emplu& o valoare a lui ry = x de .&1 ne poate duce la conclu%ia c le tura dintre cele dou variabile anali%ate este foarte slab& iar n realitate aceasta s fie foarte puternic& dar neliniar. $n ca%ul le turilor neliniare& pentru aprecierea intensitii acestora vom utili%a raportul de corelaie. ac le!tura a fost demonstrat ca fiind liniar" pentru estimarea intensitii acesteia putem utili%a atCt coeficientul <earson c3t i raportul de corelaie. $n acest ca%& ry = x = R y = x & e alitatea put3nd fi utili%at pentru verificarea liniaritii le turii.

Importana anali%ei de corelaie trebuie s o nele em n conte1tul problematicii reali%rii prediciilor. >ac ry = x = . & variabilele sunt independente& i deci nu putem reali%a nici o predicie despre valoarea uneia pe ba%a variaiei celeilalte. >ac ns acest coeficient este diferit de %ero& putem pre%ice cu o preci%ie mai mare sau mai mic valoarea variabilei
1 & atunci considerat dependent pe ba% valorilor variabilei independente& cau%. >ac ry = x =

putem reali%a predicii cu un rad ridicat de preci%ie.

3. Inferena statistica n cadrul modelului liniar simplu

Comple1itatea fenomenelor social0economice face imposibil studierea aciunii tuturor factorilor ce influenea%) o variabil considerat ca fiind endo en 9 Y8. >e aceea& n practica statistic=econometric se iau n consideraie numai le turile semnificative dintre variabila endo en Y i variabila sau variabilele e1o ene X. >eoarece re resia este o metod inferenial& ce operea%) pe un eantion de observaii& oferind posibilitatea deducerii i enerali%rii conclu%iilor asupra ntre ii populaii& este absolut necesar testarea validit'ii modelului ales& a semnificaiei coeficienilor de re resie i determinarea intervalelor de ncredere corespun%toare& pentru un nivel de semnificaie . <redicia presupune estimarea valorilor unei variabile considerat endo en pe ba%a valorilor variabilei identificat ca e1o en. Inferena presupune estimarea parametrului din populaia anali%at pe ba%a statisticii obinut pe ba%a unui eantion aleator.

7ie statistica t =

9a 8 & ce urmea% o distribuie Student cu (n-2) rade de libertate. a este sa

estimatorului parametrului

din modelul de re resie& este parametrul de re resie ce

specific) n mod unic modelul relativ la ntrea a populaie statistic)& ce are ca surs) a datelor o observare e1Daustiv)& iar sa este eroarea standard a estimatorului a. >efinim probabilitatea*
a = t n 2 E = 2 s a

(a t

n 2 E = 2

s a a + t n 2E = 2 s a ) = 1

unde t n 2E= 2 este valoarea critic tabelat a repartiiei Student pentru pentru (n-2) rade de libertate i riscul & a este estimaia parametrului de re resie standard a !oefi!ientului a" :om considera ipote%ele* a8 b8 Ipote%a nul) # o * . = . & unde . este o valoare aleatoare a parametrului Ipote%a alternativ) # 1 * . . . Fespin erea ipote%ei nule presupune ca . s) se afle n afara intervalului de ncredere corespun%)tor nivelului de semnificaie ales& adic)*
. t sa

& iar

s a repre%int) eroarea

Analo pentru parametrul de re resie putem defini probabilitatea*

b t n 2E = 2 s = b

(b t

n 2E = 2

sb b + t n 2E = 2 s b ) = 1

unde t n 2E= 2 repre%int) valoarea critic) tabelat) a distribuiei Student pentru (n-2) rade de libertate i riscul & b este estimaia parametrului de re resie & iar s b repre%int) eroarea standard a !oefi!ientului b" :om considera ipote%ele* a8 b8 Ipote%a nul) # o * . = . & unde . este o valoare aleatoare a parametrului . Ipote%a alternativ) # 1 * . . . Fespin erea ipote%ei nule presupune ca . s) se afle n afara intervalului de ncredere corespun%)tor nivelului de semnificaie ales& adic)*
.
sb t

5n test u%ual n practica statistic este acela de a verifica dac parametrii

difer semnificativ de %ero. "ste practic un ca% particular al relaiilor pre%entate anterior& c3nd
. = . i respectiv . = . . >ac t !al!ulat > t tabelat vom respin e ipote%a nul)& parametrul de

re resie difer semnificativ de .. <e l3n testarea utilit'ii estimatorilor parametrilor de re resie& este necesar i testarea calit'ii a6ustrii prin modelul de re resie a datelor de observaie. Aprecierea calit'ii a6ustrii se reali%ea% utili%3nd anali%a de tip dispersional. :om descompune variaia total a variabilei endo ene Y n raport cu cele dou surse de variaie identificabile& variaia datorat re resiei i variaia re%idual.

>in cursul anterior tim cvalorilor a6ustate sunt Yx = a + b xi iar eroarea este
i

ei = yi Yxi . Abaterea valorilor empirice yi de la media lor este* yi y = 9 yi Yxi 8 + 9Yxi y 8 yi y = ei + 9Yxi y 8 >eci vom avea yi = ei + Yxi = a + bxi + ei = y bx + bxi + ei

:om scdea y din ambii membrii i vom avea*


yi y = Yxi y + ei = b9 xi x 8 + ei

:ariaia total a variabilei endo ene Y se obine ca sum a ptratelor abaterilor valorilor individuale de la media lor& adic*
n n n n n 2 2 2 2 2 9 y y 8 = 9 Y y 8 + 9 y Y 8 9 y y 8 = 9 Y y 8 + i xi i xi i xi e2i n i =1 i =1 i =1 i =1 i =1 i =1

:ariaia e1plicat a variabilei Y& datorat re resiei este*

9Y
i =1 n

xi

y 8 2 = 9 yi y 8 2 e 2 i
i =1 i =1

Iar pentru variaia re%idual a lui Y avem*

9 y
i =1

n Yxi 8 2 = e 2 i i =1

#rebuie s e1plicm aici noiunea de rade de libertate. $n statistic& radul de libertate este e al cu numrul comparaiilor independente ntre elementele unei mrimi de observaie sau numrul valorilor care pot fi alese arbitrar n cadrul unei specificri. >e e1emplu& numrul radelor de libertate ntr0un tabel de contin en cu p r3nduri i I coloane ntr0o distribuie arbitar este e al cu 9 , 189+ 18.

<rin urmare& calculul variaiei totale


n

9 y
i =1

y 8 2 se ba%ea% pe (n-$) rade de libertate&

calculul variaiei e1plicate

9Y
i =1

xi

y 8 2 se ba%ea% pe un sin ur rad de libertate& iar pentru

variaia re%idual

9 y
i =1

Yxi 8 2 avem 9n01801& adic n-2 rade de libertate.

Anali%a varianei este pre%entat ntr0o form sistemati%at n tabelul 1. #abelul 1* %nali&a varian'ei Sursa variaiei "1plicat Fe%idual Suma ptratelor n 9Yx y 8 2
i =1 n
i

Grade de libertate 1 n-2

<tratul mediu n 9Yx y 8 2 = 1


i =1
i

n 2 9 y Y 8 i xi H e 2 i
i =1

i =1

se =
n-$

e
i =1 n i =1

n2

#otal

9 y
i =1

y8

sy =

9y

y82

n 1

Calitatea a6ustrii datelor de observaie pe ba%a dreptei de re resie se poate aprecia cu a6utorul testului ( 9(is)er- *nede!or)" Statistica ( are e1presia*

(=

Dis,ersia e1p li!ata = Dis,ersia re&iduala

. ( urmea% o distribuie (is)er 2 9 yi Yxi 8 =9n 28


n i =1

9Y
i =1

xi

y82 =1

*nede!or cu 1 i n02 rade de libertate 9 ( J (1& n 2 8. <entru aprecierea semnificaiei lobale a modelului de re resie vom compara valoarea calculat) a statisticii ( cu valoarea tabelat) ( 91& n 2& 8 a distribuiei 7isDer pentru cele dou) rade de libertate 1 i (n-2) asociate estimaiilor de dispersie corespun%)toare i pentru un pra de semnificaie dat. >ac) (!al!ulat > (tabelat vom respin e ipote%a nul)& variabilitatea factorialei X influenea%) semnificativ variabilitatea re%ultativei Y& n ca% contrar se accept) ipote%a nul)& modelul de re resie este nesemnificativ. <entru testarea semnificaiei valorii coeficientului de corelaie <earson vom considera ipote%ele* a8 Ipote%a nul) # o * ry = x = . & ceea ce ar nsemna c) cele dou) variabile ale modelului sunt Ipote%a alternativ) # 1 * ry = x . . Statistica t este descris) de relaia* t= ry = x 1 r2 y=x n2&

independente b8

urm3nd o distribuie Student cu (n-2) rade de libertate. :om confrunta valoarea calculat) a statisticii t cu valoarea tabelat)& pentru (n-2) rade de libertate i un nivel de semnificaie dat. >ac) t !al!ulat > t tabelat vom respin e ipote%a nul) i vom conclu%iona& cu un risc dat 9u%ual este de !/8 c) valoarea coeficientului <earson este diferit) de %ero& deci ntre cele 2 variabile e1ist) o le )tur)& i aceasta este semnificativ).

#. Asumiile re!resiei
5tili%area anali%ei de re resie ofer cercettorului posibilitatea obinerii unor re%ultate acurate dac i numai dac sunt verificate o serie de ipote%e 9asumpii8* Asumpii !enerale$ Ipote%a liniaritii. (iniaritatea se verific prin e1aminarea vi%ual a norului de puncte& cu a6utorul corelo ramei 9scatter8 :ariabilele anali%ate sunt numerice. <utem utili%a n modelul de re resie i variabile calitative& prin transformarea cate oriilor acestora n variabile dummy.

Ku e1ist erori de msurare. "rorile de msurare ale variabilelor anali%ate pot s apar atunci c3nd subiecii cercetrii nu ofer rspunsurile adecvate sau c3nd operatorii de teren nu nre istrea% datele n mod corect sau c3nd operatorii de calculator nu introduc n mod corect datele n calculator.

Asumpii cu privire la eroarea i Sperana matematic a erorii i este nul*

-@ i ? = . & i.$/n

>istribuia de probabilit'i a erorii i este independent de valorile luate de variabila e1o en X"

0ar@ i ? = -@ i ? = 2 = !ons tan t oricare ar fi i

Aceast proprietate poart numele de homoscedasticitate. Ca%ul contrar& c3nd

-@ i ? = 2 i -@ 2 1 ? = 2 1 & pentru
heteroscedasticitate.

i 1&

este

cunoscut

sub

numele

de

"rorile repre%int o secven de variabile aleatoare necorelate ntre ele 9nu sunt autocorelate8. Adic& cov@i & 1 ? = -@i & 1 ? = . oricare ar fi i 1

"rorile urmea% o le e de distribuie normal& de medie nul i dispersie 2 & deci

i 2 9.& 2 8

:alorile observate ale variabilei e1o ene X nu sunt corelate cu i & adic*

cov@ xi & i ? = -@ xi & i ? = xi - 9 i 8 = .

%. &roarea standard a estimrii


Acurateea prediciei obinute cu a6utorul anali%ei de re resie se verific cu a6utorul statisticii eroarea standard a estimrii. Ltim de la statistic formula pentru abaterea standard. <entru calculul erorii standard a estimaiei vom ridica mai nt3i la ptrat erorile i le vom nsuma& obin3nd

9 y
i =1

Yxi 8 2 . Apoi&

suntem interesai s determinm o valoare medie a ptratelor erorilor&

9 y
i =1

Yxi 8 2 n

. <rin

calcularea celor doi coeficieni de re resie pierdem dou rade de libertate. 7ormula erorii standard a estimrii este deci*
Yxi 8 2

se =

9y
i =1

. Aceast eroare standard a estimrii msoar abaterea standard a variabilei

n2

endo ene Y atunci c3nd valorile variabilei X sunt cunoscute i ofer posibilitatea cunoaterii abaterii standard a erorilor n 6urul dreptei de re resie.

"roarea standard a estimrii este o msur a variaiei nee1plicate. Cu c3t aceast statistic are o valoare mai mic& cu at3t proporia variaiei nee1plicate este mai mic.

Test de autoevaluare
1. <reci%ai care este deosebirea dintre anali%a de re resie si anali%a de corelatie 2. >ac le tura dintre dou variabile este neliniar& pentru estimarea intensit'ii acesteia vom utili%a* a8 coeficientul de corelaie simpl liniar b8 raportul de corelaie c8 coeficientul de determinaie d8 nici un rspuns nu este corect 3. "1plicati importanta calculrii erorii standard a estimrii 4. <entru verificarea validit'ii unui model econometric liniar simplu utili%m* a8 testul & b8 testul t-*tudent c8 testul 7isDer0Snedecor d8 destul Mald !. 5tili%Cnd datele de la e1emplu anterior& cursul 2& se cere* a8 s se verifice validitatea modelului econometric si semnificatia statistica a estimatorilor

b8 s se estime%e i s se caracteri%e%e intensitatea le turii dintre cele dou variabile anali%ate. Biblio ra!ie minimala 1. Geor escu& :. 92..!8& *tatisti! des!ri,tiv 3i inferen'ial/ "ditura 5niversitaria& Craiova 2. Gu6arati 92..48& Basi! -!onometri!s/ 4tD "dition& +cGraNOPill KeN QorR 3. Pinton& <.F. 92..48& *tatisti!s -x,lained/ 2nd "dition& Foutled e KeN QorR. 4. Dttp*==NNN.Soutube.com=resultsTsearcDUIuerSHsimpleVliniarVre ressionWsmH3 !. Dttp*==NNN.Soutube.com=resultsTsearcDUIuerSHolsVmetDodWsmH1 2. Dttp*==NNN.Soutube.com=NatcDTvH4"XKedim>+s

S-ar putea să vă placă și