Sunteți pe pagina 1din 4

1.

Tipuri de date
In modelele econometrice intilnim 2 tipuri de date:
date spatiale
serii cronologice
Exemple de date spatiale:
date despre volumul productiei, numarul de angajati , venitul,etc la diferite intreprinderi in acelasi timp.
Cursul de vinzare/cumparare a valutei in una si aceeasi zi la diferite puncte de schimb valutar in oras.
Exemple de serii cronologice:
Date trimestriale despre inflatie , salariul mediu, venit national, emitere de bani in ultimii ani.
Cursul zilnic al dolarului in oras in ultimii 10 ani
2.Clasificarea modelelor econometrice:
Pot fi evidentiate 3 clase principale de modele care se utilizeaza pentru analiza econometrica:
1. Modele ale seriilor cronologice:
a) Modele de tip trend:
Y(t)=T(t)+(t) , unde T(t)- trend in timp de forma parametrica, daca T(t)= a+bt;
(t)- componenta aleatoare.
b) Modele sezoniere:
Y(t) =S(t)+ (t) , unde S(t) este o componenta sezoniera.
c)Modele de tip trend si sezoniere:
Y(t)=T(t)+S(t)+ (t) (aditiv)
Y(t)= T(t)*S(t)+ (t) (multiplicativ)
Trasatura comuna a acestor modele consta in faptul ca ele lamuresc comportarea seriei cronologice reiesind numai
din valorile ei anterioare, astfel de modele pot fi utilizate spre exemplu pentru studierea si prognozarea volumului
de vinzare a biletelor de avion, cerere la inghetata.
2)Modele de regresie cu o ecuatie( unifactoriale):
In aceste modele variabila dependenta y este reprezentata ca functie f(x mediu: mediu)=(x1,x2,xk, 1, 2
p).
In dependenta de functia de mai sus modelele pot fi:
*liniare
*neliniare
3) Sisteme de ecuatii simultane:
Aceste modele se descriu de sisteme de ecuatie. Sistemele pot fi alcatuite din identitati si ecuatii de regresie.
Fiecare ecuatie poate include atit variabile exogene cit si endogene din alte ecuatii ale sistemului.
3.Clasificarea variabilelor:
Clasificarea variabilelor dup modul de exprimare
variabile calitative variabile, valorile crora sunt exprimate prin cuvinte care desemneaz apartenena
individului la una din categoriile scalei (exemple: sexul, calificativul, profesia, starea civil etc.).
Variabilele calitative sunt de 2 tipuri: nominale i ordinare.
variabile cantitative variabile, valorile crora se exprim numeric (exemple: vrsta, salariul, inaltimea etc.).
Variabilele cantitative sunt de 2 tipuri: de interval i de raport.
Clasificarea variabilelor dup numrul de valori (sau a variantelor de rspuns)
dihotomice (binare, alternative) variabile calitative scala crora e compus din 2 valori antonime (da nu,
prezent absent, aprins stins etc.). Noiunea de variabil binar provine de la codificarea valorilor acestora
cu 0 i 1.Codificarea prin 0/1 permite utilizarea acestor variabile n proceduri dedicate nivelurilor mai nalte de
msurare (ordinal, interval).
nealternative (categoriale) celelalte variabile calitative, ce nu posed proprieti ale variabilelor dihotomice.
Clasificarea variabilelor dup modul de obinere
primare variabile obinute n etapa de culegere a datelor (exemplu: vrsta nregistrat n ani, notele primite la
examenele din sesiune etc.);
derivate (auxiliare) variabile obinute n urma procesului de prelucrare a variabilelor primare (exemplu:
vrsta calculat pe grupe de vrst, nota medie la sesiune etc.)
Clasificarea variabilelor dup natura variaiei caracteristicii numerice
continue, care pot lua orice valoare din scala lor de variaie (exemple: nlime, greutate, cifr de afaceri
etc.);
discrete, care nu pot lua dect anumite valori pe scala lor de variaie, de regul numere ntregi (exemple:
numrul de copii dintr-o familie, numrul de sate dintr-un raion etc.).

4.Ipotezele clasice ale modelului liniar classic:


unifactorial
1.modelul specifica o relatie liniara intre variabilele X,Y
Yt=a+bxt+t, t=1,n.
Inseamna ca valoarea medie a oricarei perturbatii t este nula, iar E(Yt)=a+bxt
2.Xt este variabila determinista; vectorul (X1,X2,..Xn) nu este coliniar vectorului i=(1,1,1)
Inseamna ca toate perturbatiile t, t=1,n au una si aceeasi variantza, adica variantza perturbatiei t nu depinde de
numarul observarii.
3.a) valoarea medie E(t)=0 , E(t2 )=V(t)=sigma2 , t=1,n
Aceasta observatie se numeste homoscedasticitate. In caz contrar se spune ca perturbatiile sunt heteroscedastice.
3.b) E(t, s)=0 pentru t diferit de s, adica perturbatiile sunt independente 2 cite 2.
Deoarece cov(t s)=E(t- E(t))*( s-E(s))=E(t s)=0.
Rezulta ca perturbatiile t la observari diferite sunt necorelate.
3.c) t ,t=1,n au aceeasi repartitie normala cu valoarea medie =0 si varianta sigma2
multifactorial
1.modelul specifica o relatie liniara intre variabilele X1,X2Xk si Y;
Yt=1Xt1+ 2Xt2++ kXtk, t+1,n.
2.Xt1Xtk sint variabile deterministe. Vectorii xs mediu =(X1s,Xns), s=1,k. sint liniari independenti in Rn
3.a) valoarea medie E(t)=0 , E(t2 )=V(t)=sigma2 , t=1,n
3.b) E(t, s)=0 pentru t diferit de s- independenta statistica a erorilor la observari diferite .
3.c) ) t ,t=1,n au simultan aceeasi repartitie normala tN(0,sigma 2).
5. Teorema Gauss-Markov
a) simplu
Daca sunt satisfacute ipotezele:
1.Yt=a+bxt+ t, t=1,n
2. Xt,t=1,n este variabila determinista
3.a) E(t)=0, E(t2 )=V(t)=sigma2 , t=1,n
3b) ) E(t, s)=0 pentru t diferit de s
Atunci estimatorii a^,b^ obtinuti prin metoda celor mai mici patrate, au cea mai mica varianta in clasa tituror
estimatorilor liniari nedeplasati.
B)general
Daca :
1. y= X+
2. Xeste matrice determinista de tip n*k, n>k, avind rangul maximal egal cu k,adica rangX=k
3. valoarea medie E(t)=0 , E(E(t)=0 , E(* )=V()=sigma2*In, atunci estimatorul =(X,X)-1*Xy
obtinut prin metoda celor mai mici patrate este cel mai eficient estimator in clasa estimatorilor liniari.
6. Intervalele de incredere ale coeficientilor regresiei liniare
Rezolvind inecuatia tcrit<b^-b/sb^ din relatia P{-tcrit<b^-b/sb^<tcrit}=1- in raport cu coeficientul b, obtinem b^-t crit*sb^<b<-b^+tcrit*sb^ ; b-tcrit<b<b^+tcrit*sb^
Adica (b^-tcrit*sb^; b^+tcrit*sb^) este intervalul de incredere pentru parametrul b cu probabilitatea de incredere 1-.
Intervalul de incredere contine valoarea reala a parametrului b cu probabilitatea data 1-.
Intre intervalul de incredere al parametrului si ipoteza acceptata in cadrul testului Student exista o legatura strinsa si
anume:
Daca in cadrul testului Student poteza H0: b=0 se respinge atunci intervalul de incredere al parametrului nu include
valoarea 0 si reciproc ,daca in cadrul testului Student ipoteza H0: b=0 se accepta atunci intervalul de incredere al
parametrului include valoarea 0 si reciproc.
7. Testul Student
Statistica Student se utilizeaza pentru verificarea ipotezei H0: b=0 si a ipotezei de alternative H1: b nu=0 cu pragul de
semnificatie . In probleme cu character economic pragul de semnificatie se ia 0.05; 0.01;0.001. Daca|tb|>t crit , atunci
ipoteza H0 se respinge.
Inegalitatea |tb|>tcrit permite de a face concluzia despre faptul ca coeficientul b al regresiei este seminificativ diferit de
zero la pragul de semnificatie indicat, adica despre existenta dependentei liniare intre variabila exogena X si variabila
endogena Y.
8. Fenomenul de autocorelatie
Msoar gradul n care valorile actuale ale unei variabile sunt influenate de valorile sale anterioare.
Are la baz autocovariana
(t,k) =Cov (yt, yt-k ) = E[(yt )(yt-k )]
n cazul n care coeficienii de autocorelaie tind nspre 0 la diferite lag-uri, nseamn c valori succesive ale
unei serii cronologice sunt independente una de cealalt.

Dac seria are trend, valori succesive ale seriei vor fi puternic corelate. Coeficienii de autocorelaie sunt
semnificativ diferii de 0 pentru primele lag-uri, scznd, apoi treptat pn la anulare. Coeficientul
autocorelaiei de ordinul 1 este foarte apropiat de valoarea 1.
Dac seria are sezonalitate, coeficienii autocorelaiei vor fi semnificativi cu un lag egal cu numrul de
perioade ale componentei sezoniere.
Dac seria este staionar, coeficienii autocorelaiei scad rapid nspre 0, de obicei dup al doilea sau al treilea
lag.
O alt modalitate de scriere a coeficientului autocorelaiei.
Autocorelaia parial
Msoar relaia direct dintre valorile yt i yt-p prin eliminarea efectelor indirecte date de valorile care se afl
ntre ele.
Autocorelaia parial este o metod de estimare a numrului de lag-uri optim ntr-o relaie autoregresiv.
Autocorelaia parial de ordinul 1 (lag 1) este coeficientul de regresie al unui proces autoregresiv de ordin 1
i, n acelai timp, este egal cu coeficientul autocorelaiei totale.
Coeficientul autocorelaiei pariale de ordin p este coeficientul de regresie al valorii cu lag p dintr-un proces
autoregresiv.
Red o imagine mai clar despre legtura care exist ntre dou valori, eliminnd orice interferen care ar
putea exista ntre ele datorit altor valori.
Cel mai utilizat test pentru determinarea autocorelarii erorilor este procedeul Durbin-Watson.
9.Multicoliniaritatea
Multicoliniaritatea poate fi definit ca o legtur liniar funcional existent ntre dou sau mai multe variabile
independente ale unui model de regresie.
Surse i efecte ale multicoliniaritii
Metode de colectare a adatelor
Specificarea modelului
Model supradeterminat
Restricii asupra modelului/populaiei observate
Consecine ale coliniaritii perfecte: nu se pot estima parametrii de regresie (matricea
XX nu este inversabil)
Consecine ale coliniaritii imperfecte:
Crete variana estimatorilor acelor parametrii ai modelului ce corespund variabilelor aflate n
dependen liniar semnificativ
Intervale de ncredere mari (riscul acceptrii ipotezei nenule)
Valori ridicate ale lui R2
Identificarea multicoliniaritii
Criteriul Klein
se determin raportul de corelaie Ry2 i coeficienii
liniari de corelaie a variabilelor exogene , rxi/xj,i diferit j
dou variabile exogene Xi i Xj
sunt coliniare dac:
sunt identificate numai dependenele liniare dintre
dou variabile exogene.
Criteriul Belsley
se calculeaz valorile proprii ale matricei XX, deci soluii ale ecuaiei: |XX-Ip|=0
n cazul n care una sau mai multe valori proprii sunt zero sau aproximativ zero, fenomenul de colinearitate este
semnificativ i va afecta ntr-o bun msur calitatea estimatorilor.
o valoare cuprins ntre 20 i 30 sau mai mare, pentru datele
reale, relev o colinearitate puternic a variabilelor exogene.
Factorul de inflaie a varianei (VIF)
Msoar viteza cu care cresc varianele i covarianele:
VIF = 1/(1-R2)
Pe msur ce R crete, i VIF crete
Dac este peste 10, este o problem.
Obs.: in SPSS i alte pachete soft de specialitate VIF este

o msur implicit a coliniaritii


Exist mai multe reguli de remediere a multicoliniaritii, dar care nu reprezint metode sigure de nlturare a ei.
creterea volumului eantionului este eficient numai dac se adaugobservri semnificativ diferite de cele care sunt
deja considerate n model, ncaz contrar, multicoliniaritatea se menine;
nlturarea variabilei puternic correlate poate conduce la o specificare incorect a modelului. Eroarea de specificare
duce la obinerea de estimatori eronai, fiind mai duntoare dect acceptarea unei multicoliniariti mici;
transformarea variabilelor n serii ale diferenelor de ordinul 1. Modelul de regresie pe diferenele de ordinul 1, reduce
severitatea multicoliniaritii.
utilizarea altor metode: analiza factorial, analiza n componente principale,sunt deseori folosite pentru a rezolva
problema multicoliniaritii.
Aplicarea n practic a uneia din modalitile de remediere, depinde de natura datelor i de severitatea
multicoliniaritii. Nu se recomand utilizarea regresiei afectat de multicoliniaritate, pentru previziune.
10.Prognoza-obtinerea estimatiilor valorilor variabilei endogene pentru unele valori ale variabilei exogene.
Pot fi deosebite:
Prognoza punctuala-este un numar
Prognoza cu intervale- interval caruia ii apartine valoarea reala a variabilei endogene cu probabilitatea de
incredere 1- a
Intervalul de incredere pentru valoarea reala Yp se determina astfel:
Yp apartine (Yp^-tcrit *sep ; Yp^+tcrit *sep)
11. Testul Fisher
Statistica F se utilizeaza pentru verificarea ipotezei nule H0:b=b0 si a ipotezei de alternativa H1:b diferit b0.
Pentru a accepta una din ipoteze mai intii din tabelul repartitiei Fisher pentru pragul de semnificatie si (1;n-2) se
determina Fcrit.
Ipoteza Ho se respinge la pragul de semnificatie daca F>Fcrit.In caz contrar se accepta ipoteza H1.
11.Variabile fictive descriu in mod cantitativ un factor calitativ. Deosebirea calitativa poate fi formalizata utilizind
orice variabila ce primeste 2 valori 0 si 1 deoarece in acest caz interpretarea economica arata mai simplu.
12.Heteroscedasticitatea
n cazul modelelor heteroscedastice, dispersiile, elementele de pe diagonala principal nu coincid, sau nu sunt egale.
De exemplu: dac analizm dependena cererii de venit: Y 0 1 X . Valorile dispersiilor de pe diagonala principal
a matriciei covarianelor sunt diferite. Cu ct venitul este mai mare cu att mai diversificat(mai diferit) devine
consumul.
Pentru depistarea heteroscedasticitatii se utilizeaza de obicei urmatoarele teste:
Coldfeld-Quandt
White
Breush-Pagan
Una din metodele de combatere a heteroscedasticitatii este metoda celor mai mici patrate ponderate. In toate testele
pentru depistarea heteroscedasticitatii se verisica ipoteza
Ho: 12= 22==n2
13. Modelul generalizat de regresie liniara.Teorema Aitken.
Estimatorul liniar nedeplasat efficient al vectorului pentru modelul generalizat de regresie este stabilit de teorema
Aitken. Astfel estimatorul ^*=(X-1)*X-1y obtinut prin metoda celor mai mici patrate generalizate are cea mai
mica matrice de covarianta in clasa estimatorilor liniari nedeplasati ai vectorului . In cazul cind = 2I (modelul este
homoscedastic) se obtine estimatorul metodei celor mai mici patrate ordinare =(XX)-1*Xy
Pentru determinarea sumelor se utilizeaza abaterile medii patratice:

1.sx1=radical 1/n xt12= n*sx12


2.sx2=radical 1/n xt22=n*sx22
3.sy=radical 1/n yt2=n*sy2
4.r(X1, Y)=(1/n xt1yt ) / sx1*sy =xt1yt=n*r(X1 ,Y)*sx1*sy
5. r(X2, Y)=(1/n xt2yt ) / sx2*sy =xt2yt=n*r(X2 ,Y)*sx2*sy
6. r(X1, X2)=(1/n xt1xt2 ) / sx1*sx2 =xt1xt2=n*r(X1 ,X2)*sx1*sx2

S-ar putea să vă placă și