Sunteți pe pagina 1din 11

FACULTATEA DE TIINE ECONOMICE CURSURI UNIVERSITARE DE MASTERAT SPECIALIZAREA: MANAGEMENT FINANCIAR PUBLIC I PRIVAT DURATA STUDIILOR: 2 ANI FORMA

DE NVMNT: ZI ANUL I

ECONOMETRIE APLICAT N FINANE Regresie liniar simpl


TITULAR CURS, CONF . UNIV. DR. CTLIN ANGELO IOAN

MASTERAND, SOARE C. CONSTANTIN

GALAI,2012

Introducere Modelul unifactorial de regresie este o relaie matematic construit pe baza teoriei economice, care presupune c fenomenul economic Y ( fenomenul efect ) este rezultatul aciunii a dou categorii de factori: prima, construit dintr-un factor principal, esenial, determinat-X, a doua- format din toi ceilali factori considerai neeseniali, cu aciune ntmpltoare sau constant, invariabil, asupra lui Y. n vederea analizrii regresiei liniare simple, am luat n considerare doi indicatori de natur economic, dar mai ales instituional i anume populaia colar i personalul didactic. Aceste dou variabile sunt analizate pe o perioad de zece ani, din anul 2001 pn n anul 2010, populaia colar reprezint variabila cauz iar personalul didactic reprezint variabila efect. Populaia colar reprezint totalitatea copiilor, elevilor i studenilor cuprini n procesul de instruire i educaie la nceputul anului colar/universitar indiferent de formele de nvmnt pe care le frecventeaz ( zi, seral, frecvent redus, deschis la distan ) i de vrst. Personalul didactic - reprezint persoanele fizice care sunt angajate n sistemul de nvmnt i predau n cadrul procesului educaional i de instruire (cu norm ntreag i cu norm parial). Fiecare cadru didactic se nregistreaz o singur dat, numai la unitatea colar la care are funcia de baz (are cartea de munc) sau pred numrul cel mai mare de ore didactice. Cele dou variabile sunt interconectate deoarece personalul didactic depinde dimensiunea populaiei colare, n mod direct proporional. Educaia este considerat un drept fundamental n sine i una dintre cheile exercitrii altor drepturi inerente naturii umane. Ca un drept ce contribuie la autonomia individului, educaia este principalul instrument care permite adulilor i copiilor

marginalizai din punct de vedere economic i social s ias din srcie i s obin mijlocul de a participa, din plin, la viaa comunitii. Totui n urma analizei efectuate asupra cadrelor didactice n nvmnt, se constat o scdere a numrului acestora n ultima perioad, urmat de scderea populaiei colare. Aceast scdere poate fii determina de reducerea ratei natalitii, reducere manifestat n special dup anul 2000, din cauza creterii abandonului colar,sau chiar a faptului c educaia necesit cheltuieli pe care majoritatea familiilor nu le suport. n tabelul de mai jos avem prezentate datele privind evoluia populaiei colare i a cadrelor didactice: Tabel nr.1. Evoluia variabilelor Anul Populaia colar (numr persoane) Cadrul didactic (numr persoane)

X Y 2001 4643351 309306 2002 4631164 311570 2003 4578383 301416 2004 4565279 294938 2005 4554466 300108 2006 4496786 286670 2007 4472493 281272 2008 4390931 285861 2009 4360831 281034 2010 4345581 277318 Total 49400096 2929493 Surs: Institutul Naional de Statistic

Interpretarea rezultatelor, analiza rezultatelor din Excell

Summary output arat bonitatea modelului. SUMMARY OUTPUT Regression Statistics Multiple R 0.927760205 R Square 0.860738997 Adjusted R Square 0.843331372 Standard Error 4853.997158 Observations 10 Acest tabel ofer informaii despre coeficientul de corelaie Multiple R care are o valoare de 0.927760205, ceea ce arat o legtur puternic ntre cele dou variabile, populaia colar i personalul didactic. R Square este coeficientul de determinaie, care arat c 86.07% din variaia cadrelor didactice este determinat de influena populaiei colare. Tot n cadrul acestui tabel avem informaii despre eroarea standard estimat a modelului s (Standard Error) ce estimeaz eroarea standard i numrul de observaii din eantion. Valoarea acesteia este de 4853.997158. n concluzie putem spune c modelul de regresie liniar simpl este bun, deoarece toi indicatorii calculai au valori apropiate de 1, ceea ce determin o relaie direct ntre populaia colar i numrul de cadre didactice. Aceast analiz a fost realizat pentru un numr de observaii egal cu 10. Testarea semnificaiei raportului de corelaie Ipotezele:
H 0 : R nu este semnificativ statistic

H 1 : R este semnificativ statistic

Testarea se face cu ajutorul testului Fisher Dac Fcalculat > Fcritic , rezult resping ipoteza nul i accept ipoteza alternativ. 4

Fcalculat

n k 1 R2 = Fisher( k ,n k 1) k 1 R2
8 0.860738997 6.885911976 = = 49.44072932 1 1 0.860738997 0.1392761003

Fcalculat =

Fcritic=5.32 Fcalculat >Fcritic , rezult resping ipoteza nul i accept ipoteza alternativ conform creia modelul este semnificativ statistic. Anova se refer la descompunerea varianei totale (SST) a variabilei dependente n dou componente: variana explicat prin regresie (SSR) i variana neexplicat (SSU) sau variana rezidual. Aici identificm i gradele de libertate asociate descompunerii, mai precis, dac avem k regresori n model i n observaii, avem egalitatea n 1 = k + (n (k + 1)) . Regula de decizie privind acceptarea modelului este: valori mari pentru statistica test F i valori mici pentru Significance F. Significance F reprezinta valoarea erorii pe care o facem prin respingerea ipotezei nule cand de fapt ea este adevarata. ANOVA df SS
2 y/ x=

MS
s2 y / x =

1165013573 Regression Residual Total k=1


e = 188490307.3
2

1165013573
s e= 23561288.41
2

F Fcalculat= 49.446089 4

Significance F

0.000109126

n-k-1=8
2 y=

1353503880 n-1=9 Pentru datele noastre Fcalculat =49.4460894, iar Sinificance F =0.000109126 (Significance F= 0.000109126 <5%) , o valoare foarte mic, ceea ce ne face s acceptm c modelul ales ajusteaz bine datele din eantion. Modelul de regresie este semnificativ statistic pentru o probabilitate egal cu 100%-0.0109126%= 99.9890874%.

Verificarea validitii modelului de regresie Ipotezele:


H 0 :Modelul nu este valid statistic

H 1 : Modelul este valid statistic

Se aplic testul Fisher

F=

s2 y s

x 2 e

Fisher( k ,n k 1)
1165013573 = 49.4460894 23561288.41

Fcalculat =

Se compar Fcalculat cu F corespunztor lui ( = 0.05 ) i k(n-k-1) F,k(n-k-1) = F0.05,1,8 = F critic = 5.32 Fcalculat > F criric, rezult ne aflm n regiunea de respingere, respingem ipoteza nul, conform creia modelul nu este valid statistic i acceptm ipoteza alternativ, conform creia modelul este valid statistic. O alt metod de observare dac modelul este valid statistic o reprezint comparaia Significance F cu . Dac Significance F < , suntem n regiunea de respingere, i respingem ipoteza nul. n concluzie pentru verificarea validitii modelului de regresie, se accept ipoteza alternativ. Estimaii pentru coeficieni, erorile lor standard, testul t, intervale de ncredere Tabelul ne ofer informaii despre valorile estimate ale coeficienilor modelului de regresie n coloana Coefficients, erorile standard ale coeficienilor n coloana Standard Error, elemente pentru aplicarea testului de semnificaie t-Student pentru fiecare coeficient (coloanele t Stat i P-value.). Tot aici avem informaii despre intervalele de ncredere calculate pentru fiecare coeficient din modelul de regresie.

Intercep

Coefficients -

Standard Error t Stat 66899.5574 -2.650997901 6

P-value Lower 95% 0.0292105 -331621.3425

Upper 95% -23079.8

4 t X 177350.5865 0.104419974 0.01484969 7 9 7.031791336 0.0001091 3 0.070176488 0.138663

Pentru ca un coeficient s fie semnificativ diferit de zero, deci variabila regresor asociat lui s influeneze variabila dependent, trebuie ca n coloana P-value s avem valori mici, de exemplu 5% sau sub 5% (evident n coloana t Stat avem atunci valori mari, n modul). Concret, pentru termenul liber al modelului (Intercept) avem P-value = 0.02921054, adic putem afirma c dac respingem ipoteza c interceptul este egal cu zero, facem o eroare doar de 2%. Respingem deci aceast afirmaie i acceptm ca adevrat ipoteza c interceptul este diferit de zero. Desemenea pentru X avem Pvalue=0.00010913, valoare mai mic dect 5%. Ultimele dou coloane ne dau informaii privind intervalele de ncredere 95% pentru fiecare coeficient al modelului. Astfel, pentru termenul liber (teoretic) al modelului obinem intervalul (-331621.3425; -23079.8). Analog, pentru panta ecuaiei de regresie avem intervalul de ncredere (0.070176488; 0.138663). Este foarte important faptul c nici unul dintre aceste intervale de ncredere nu conine pe 0, suntem ncurajai astfel n a afirma c modelul este bun.

Testarea semnificaiei parametrului


H 0 : =0 sau b=0

H 1 : 0 sau b0

Y= a X + b Se consider statistica T =
Tcalculat = t Stat =
b 0 Student ( n 2 ) sb

0.104419974 0 = 7.031791336 0.014849697

, n 2 Testul este bilateral, comparm Tcalculat cu t , = 0.05. 2

Cum /2=0.025 care este mai mare dect P-value= 0.00010913, rezult c ne aflm n regiunea de respingere, resping ipoteza nul i accept ipoteza alternativ, conform creia 0 i semnificativ. Lower i upper reprezint capetele intervalului de ncredere. Intervalul de ncredere ( 1- )% pentru sau b este dat de formula:
b t
2 , n 2

s b Beta b + t
2

, n 2

sb

t
2

, n 2

= t 0.025,8 = 2.306

( 1- )%=95% 0.104419974-2.306*0.014849697 0.104419974+2.306*0.014849697 0.070176488 b 0.138663


s b s b Deasemenea cum b t reprezint lower i b +t reprezent upper, ,n 2 , n 2 2 2

avem lower 95% upper 95%, rezult 0.070176488 b 0.138663. Cum coeficientul de ncredere pentru b, nu conine pe 0 atunci coeficientul b este semnificativ i diferit de 0. Testarea semnificaiei parametrului
H 0 : =0 sau a=0

H 1 : 0 sau b0

Y= a X + b Se consider statistica T =
Tcalculat = t Stat =
t
2 , n 2

a 0 Student ( n 2) sb

177350.5865 0 = 2.650997901 66899.55749

= t 0.025,8 = 2.306

Dac P-value este > /2, se accept ipoteza nul, i invers.

P-value= 0.02921054 > 0.025 , rezult c se poate ntmpla ca a sau s fie 0. Lower i upper reprezint capetele intervalului de ncredere. Intervalul de ncredere ( 1- )% pentru sau b este dat de formula:
a t
2 , n 2

s a Alfa a + t
2

, n 2

sa

-177350.5865-2.306*66899.55749 -177350.5865+2.306*66899.55749 -331621 -23079.8


s a s a Deasemenea cum a t reprezint lower i a +t reprezint upper, , n 2 , n 2 2 2

avem lower95%upper95%, rezult -331621.3425 a -23079.8. Identificarea variabilelor X = variabila ce arat mrimea populaie colare, exprimat n numr persoane, numit i variabila cauz, independent, exogen sau explicativ Y = variabila ce arat mrimea personalului didactic, exprimat n numr persoane, numit i variabila efect, dependent, endogen sau explicat Specificarea modelului de regresie: regresie simpla liniara Estimarea metodelor de regresie Se realizeaz o selecie de volum n= 10, din populaiile X i Y, obinndu-se perechile de observaii ( X 1 , Y1 ), ( X 2 , Y2 )...( X 10 , Y10 ). . Modelul probabilistic este yi = + xi + i , unde i sunt parametri ce trebuie determinai. Numrul observaiilor este de 10, iar este eroarea. Ne intereseaz s estimm parametri i pa baza datelor de selecie (
(Yi , X i ) i = 1, 5
Y = f ( X ) = a + bX Yi = f ( X i ) = a + bX i , i = 1, n Yi Yi = ei

Se determin suma ptratelor a, b astfel nct suma ptratelor erorilor


n n S ( a ,b ) = (Yi Yi ) 2 = (Yi a bX i ) 2 s fie minim. i =1 i =1

Pentru determinarea valorii lui a i b se are n vedere urmtorul sistem de ecuaii:

n n na + b xi = y i i =1 i =1 n n n a xi + b xi2 = xi y i i =1 i =1 i =1

Din rezolvarea celor dou ecuaii rezult c: a = -177350.5865 (intercept) b = 0.104419974 (x) Valorile estimate ale lui Y sunt:
Yi = 177350.5865 + 0.1014419974 X i , i =1,10 Erorile i = Yi Yi , i =1.10 astfel nct suma erorilor s fie 0.

Observation 1 2 3 4 5 6 7 8 9 10

Predicted y 307508.0026 306235.4364 300724.0458 299355.7264 298226.6333 292203.6892 289667.0148 281150.3129 278007.2717 276414.8671

Residuals 1797.997383 5334.563602 691.9542314 -4417.726434 1881.366741 -5533.689178 -8395.014758 4710.687133 3026.72834 903.1329388

n concluzie, dup analiza prin regresie liniar simpl a celor dou variabile, am constatat c cele dou respectiv populaia colar i numrul cadrelor didactice se influeneaz n mod direct, n sensul c dac crete populaia colar, crete i numrul de cadre didactice, respectiv, dac scade populaia colar, scade i numrul de cadre didactice, ducnd la apariia unor dezechilibre n economie. Din punct de vedere statistic s-a putut demonstra c ntre cele dou variabile exist o legtur puternic iar modelul de regresie este semnificativ din punct de vedere statistic.

10

11