Sunteți pe pagina 1din 80

ECONOMETRIE

INTRODUCERE
Într-o economie de piaţă, unde fenomenele economice sunt din ce în ce mai complexe,
specialistul din acest domeniu are nevoie de o pregătire superioară, constând în cunoştinţe
multiple
şi profunde în vederea observării şi rezolvării acestor fenomene pe baze ştiinţifice. Modelele
econometrice analizează calitatea şi cantitatea proceselor economice şi evoluţia lor.
Econometria
prin caracterul său general crează modele abstracte ale fenomenelor economice.
Cursul de Econometrie, elaborat pe baza programei analitice aprobate în cadrul
Departamentului de Contabilitate, Audit şi Finanţe, se adresează studenţilor care urmează
specializările: Contabilitate şi Informatică de Gestiune, Finanțe Bănci şi Informatică
Economică,
forma de învăţământ: ZI și învăţământ la distanţă.
Unitatea de învăţare, în esenţă, pune în evidenţă noţiuni şi concepte teoretice din baza de
cunoştinţe matematice, statistice și economie ale unui student, precum și noţiuni şi concepte
teoretice noi de econometrie, cum ar fi modelul econometrie, metoda celor mai mici pătrate,
regresia simplă și multiplă.
Scopul cursului este de a sigura studenţilor din anul II, respectiv III pregătirea
econometrică necesară înţelegerii noţiunilor şi tehnicelor de specialitate cu referire la
modelarea
economică.
Obiectivele principale ale acestui curs sunt:
Însuşirea cunoştinţelor de bază din teoria probabilităților şi statisticii matematice utilizate în
ecomometrie;
Fundamentele matematice ale fenomenelor economice;
Însuşirea cunoştinţelor necesare abordării cantitative a fenomenelor economice;
Însuşirea metodei explicative, confirmarea sau informarea teoriei economice;
Formarea competenţelor şi abilităţile necesare utilizării instrumentelor econometrice de
analiză;
Dezvoltarea competenţelor de analiză critică a valenţelor şi limitelor analizei cantitative:
Rezolvarea şi utilizarea modelelor econometrice la fundamentarea deciziilor;
Utilizarea pachetelor de programe informatice pentru rezolvarea modelelor econometrice;
Formarea deprinderilor de interpretare a fenomenelor economice folosind modele
econometrice
Structura cursului ţine seama de problematica tratată pentru aceeaşi specializare la forma
de învăţământ zi, adaptată în funcţie de specificul modului de organizare a învăţământului la
distanţă.
Timpul de studiu individual, estimat pentru parcurgerea materialui prezentat în curs este
de 3-4 ore/săptămână.
Mod de evaluare: examen scris – conform planificării din sesiunea de examene; nota
finală se stabileşte, procentual, astfel:
- Portofoliu cu cele două referate: 50%
- Examen scris: 50%.
Recomandare: Cursurile de Matematici aplicate în economie, Economie 1 și 2, Statistică.
Unitatea de învăţare I.
Introducere
În acest capitol, este prezentat un scurt istoric al econometriei, după care
prezentăm definiţia econometriei și o introducere a datelor în SPSS.
1.1. Repere istorice
Econometria este o disciplină ştiinţifică apărută la începutul secolului XX . În
anul 1926, economistul şi statisticianul norvegian Ragnar Frisch introduce termenul
de econometrie, care etimologic provine din cuvintele greceşti eikonomia (economie )
şi metren (măsură), prin analogie cu termenul „biometrie" utilizat de Fr. Galton şi K.
Pearson la sfârşitul secolului XIX. Biometria desemna cercetările biologice cu
ajutorul modelelor statisticii şi matematicii.
Un rol important în dezvoltatea econometriei la avut Cleveland Societatea de
Econometrie, precum şi revista acestei socităţi „Econometrica”. Fondatorii Societăţii
de Econometrie (29 decembrie 1930) sunt Irving Fischer, L. V. Bortkiewicz, R.
Frisch, H. Hotelling, L. Schumpeter, N. Wiener, etc.
Privind din punct de vedere istoric, primele încercări de studiere şi exprimare
cantitativă a fenomenelor economice sunt mult mai vechi. La baza econometrie stă:
Şcoala Aritmeticii politice din Anglia la începuturile secolului al XVlI-lea.
Englezul W. Petty folosind studii legate de populaţie, finanţe, comerţ exterior
sau impozitare pune bazele "aritmeticii politice".
Laboratoarele biometrice din Anglia de la sfârşitul secolului al XIX-lea şi
începutul secolului al XX-lea, unde se desfăşura o activitate ştiinţifică
remarcabilă de cercetare a legilor naturii şi a geneticii umane.
Societatea de econometrie.
În secolul XX, econometria se dezvoltă prin contribuţia unor cercetători
importanţi, cum ar fii:
C.W. Cobb şi P.H. Douglas, în domeniul funcţiilor de producţie;
M. Friedman, T. Haavelmo, H. Wald, R. Stone, în domeniul analizei
economice a cererii;
K. Schultz şi P.A. Samuelson, în domeniul cererii de consum;
A.S. Goldberger, L.V. Kantarevici, L.R. Klein, O. Onicescu, J. Tinbergen, H.
Theil, în domeniul metodelor macroeconomice;
2
J. Timbergen, T. Haavelmo, R. Frisch, L.R. Klein, H. Theil , în domeniul
cererii teoriile economice şi construirea modelelor;
T.W. Anderson, H. Hotelling, R.A. Fisher, în domeniul metodelor de analiză a
datelor;
J.M. Kcynes, în studiul riscului şi incertitudinii în economie, modele
macroeconomice, J.M. Keynes.
1.2. Definirea econometriei
Într-o economie de piaţă, unde fenomenele economice sunt din ce în ce mai
complexe și cuantificabile, specialistul din acest domeniu are nevoie de o pregătire
superioară, constând în cunoştinţe multiple şi profunde în vederea observării şi
rezolvării acestor fenomene pe baze ştiinţifice, cunoscând anumite legi. Aceste
fenomene economice sunt observate și reale. Așadar, pentru a studia econometria
avem nevoie de fenomene economice reale.
În anul 1933, R. Frich publică în primul număr al revistei „Econometrica”
definiţia econometriei astfel: "the quanlitative analysis of actual economic
phenomena based on the concurrent development of theory and observation, related
by appropriate methods of inference1"
Econometria este o disciplină economică de frontieră, care s-a conturat ca o
sinteză între:
teoria economică,
teoria matematică,
statistică.
Aşadar, econometria studiază fenomenele economice folosind datele empirice
şi metodele de prelucrare a acestora cu ajutorul modelelor matematicii care exprimă
teoriile economice. Pornind de la date economice reale şi complexe, econometria
simplifică aceste date prin procedeele de inferenţă statistică, determină funcţiile care
au ca variabile mărimi economice şi realizează predicţii asupra acestora pentru luarea
unor decizii.
“Econometria studiază legăturile dintre fenomenele economice, dintre diferite
componente ale economiei în ansamblul său. Econometria studiază realităţile
economice sub aspect cantitativ, utilizând metoda statisticii. Econometria contribuie
la cunoaşterea realităţii economice prin modul său specific de a surprinde cantitativ
relaţiile din viaţa economică reală cu ajutorul unui instrument specific: modelul
econometric.”2
Scopul principal al econometriei este:
identificarea unor trăsături caracteristice modelului economic,
estimarea modelului economic,
studierea dependenţei în modelul economic,
testarea unor ipoteze statistice specifice modelului,
efectuarea unor previziuni în timp a modelului economic.
1 Samuelson, P., Koopmans, T., Stone, R., Report of the Evaluative Committee for Econometrica,
Econometrica 1954, pag. 142;
2 Jaba, E., Jemma, D. - Econometrie, Editura Sedcom Libris, Iaşi, 2006;

3
1.3. Introducerea datelor în SPSS
Aplicaţia SPSS (Statistical Package for the Social Sciences – pachet de programe
statistice aplicabile şiinţelor sociale) este un program de analiză a datelor din domeniu și
“reprezintă un instrument modern de calcul şi analiză a datelor statistice fără a reclama o
pregătire deosebită în domeniul statisticii, punând accent pe aplicarea diferitelor metode
statistice de prelucrare a datelor, în special din economie, sociologie, medic ină, cercetare
e xperimentală şi pe interpretarea, în condiţii de incert itudine, a rezultatelor statistice din
output -ul SPSS”3.
Pornind de la date reale a anui fenomen economic, social sau politic și folosind
acesta aplicație fără ca utilizatorii să cunoască formulele de calcul obținem informații
statistice în urma căreia putem fundamenta laurea unor decizii cât mai corecte. Aplicația
are la bază calculul tabelar, pentru condensarea datelor în tabele avem fereastra:
Aplicația are mai multe tipuri de ferestre:
1. Data Editor – este o fereastră care se deschide automat când se pornește aplicația
și permite editarea datelor, crearea de noi înregistrări, liminarea unor în registrări etc.
Datele pot fi văzute în două ipostaze:
Data View - Activând tab-ul Data View se vor introduce sau se vor afişa
înregistrările fişierului de date într-un tabel, coloanele reprezentând
variabilele, liniile reprezentând date reale, calitative sau cantitative, a anui
fenomen economic, social sau politic pe baza elementelor eşantionului
studiat.
3 Drd. ing. Carmen Maria Trif, ANALIZĂ DATELOR DE MARKETING, Suport de curs,
www.mim.utcluj.ro/uploads/.../21_Analiza_datelor_de_marketing_D10...., pag. 312
4
Variable View - Activând tab-ul Variable View se vor afişa metadatele
asociate variabile lor (numele variabilei, tipul variabilei, indicaţii de afişare
etc.).
2. Viewer - este utilizată pentru afişarea rezultatelor: statistici, tabele, diagrame etc. Dacă
nu există o fereastră Viewer deschisă, se va crea automat una la prima comandă care
produce ieşiri. Rezultatele afişate pot fi editate, deplasate, eliminate etc. într-un mediu
similar cu cel din Microsoft Explorer.
Prelucrările SPSS pot fi executate prin acţionarea comenzilor din meniuri. Fiecare
fereastră SPSS are propriile meniuri şi unelte corespunzătoare acestora.
Tipuri de meniuri în SPSS:
Meniuri comune: File, Edit, View, Analyze, Graphs, Utilities, Extensions,
Window, Help
Meniuri specifice: Data, Transform, Direct Marketing
1. File – Meniul comun File este folosit pentru creare unui nou fișier (New), deschidere
unui fișier existent (Open), importul de date, salvare (Save sau Save As), export de fişiere
diverse: date, rezultate, comenzi, tipărire etc.
5
2. Edit – Acest meniu editează în ferestrele cu date numerice, text sau obiecte grafice
anumite comenzi cum ar fi: tăieri (Cut), copiere (Copy), a lipiri (Paste / Paste Variables),
ștergere (Clear), inserare de variabile și cazuri (Insert Variable, Insert Cases), căutare
rapidă (Find) etc. în aceeaşi aplicaţie sau nu.
Ultima comandă în acest meniu este Options unde sunt definite o multitudine de
opțiuni care personalizează meniul.
6
3. View – Acest meniu conține comenzi care indentifică modul de afişare sau neafișare a
uneltelor (Status bar, Toolbars), modificarea fontului (Fonts), a liniaturii din ferestrele de
editare (Grid lines), a identificatorilor de valori ().
4. Data - Este un meniu specific aplicației SPSS și cu ajutorul acestui meniu se realizează
modificări asupra ferestrei Data Editor, cum ar fi definirea variabilelor, a datelor
calendaristice și a timpului, transpunerea variabilelor şi cazurilor, filtrarea cazurilor și a
variabilelor (Sort Cases, Sort Variables), unirea și împărțirea fișierelor (Merge Files, Slipt
File), selectarea și stabilirea ponderilor anumitor cazuri (Select Cases, Weight Cases), etc.
Toate modificările deoarece sunt făcute temporare se vor salva în fişierul.
5. Transform - Este un meniu specific aplicației SPSS care permite transformarea unor
variabile şi determinarea unor variabile noi folosind calculatorul cu formule (Compute
Variable). Deoarece modificările sunt temporare în sesiunea curentă, ele trebuie salvate în
fişierul iniţial.
7
6. Analyze - Este meniul cel mai important și cu ajutorul acestuia se realizează analizele
statistice.
7. Direct Marketing
8. Graphs - Permite crearea diagramelor, histogramelor, etc. folosind variabilele. Orice
diagramă poate fi modificată prin Chart Editor, afişată la dublu click pe diagramă.
9. Utilities - Permite afișarea informaţiilor despre variabile curente (Variables), despre
conținutul fișierelor (Data File Comments), definirea și utilizarea mulţimilor de variabile
(Define Variable Sets, Use Variable Sets), lansarea scripturilor (Run Script) etc.
8
10. Extensions
11. Window – Acest meniu conține operaţii asupra ferestrelor.
12. Help- Deschide o fereastră standard de ajutor și ne permite cunoșterea aplicației
SPSS. Opțiunea Topics afișează în funcție de subiect meniul contextual.
Bara de instrumente Data Editor:
Simbol
Deschiderea unei fișier de tip .sav sau .spv
Salvarea unei fișier de tip .sav sau .spv
Tipărirea unei fișier de tip .sav sau .spv
Anularea acțiunii precedente
Revenirea la acțiunea precedentă
Accesează caseta de dialog Go To și caută
anumite cazuri
Accesează caseta de dialog Go To și caută
anumite variabile
9
Accesează caseta de dialog Variabilele
Accesează caseta de dialog Find and Replace –
Date View și caută date
Inserează un caz (un rând)
Inserează variabile (coloane)
Accesează caseta de dialog Split file
Accesează caseta de dialog Weight Cases
Accesează caseta de dialog Select Cases
Accesează caseta de dialog Use Variable Sets și
Pentru a putea avea o modelare a datelor din SPSS avem nevoie de pregătirea
eșantionului nostru și introducerea acestuia în SPSS sub formă de variabile cantitative sau
calitative. Prelucrările din SPSS se aplică variabilelor cantitative sau calitative și sunt
introduse într-un fișier de date conținut în Data Editor – Data View și definite în
Variable View. Aplicația SPSS utilizează datele organizate în Data View:
coloanele reprezintă variabilele cercetării
liniile reprezintă cazurile (observaţiile).
10
În SPSS, variabilele au anumite proprietăți (Nume, Type, Width, Decimals,
Label, Values, Missing, Columns, Align, Measure, Role).
1. Nume – Fiecare variabilă introdusă în SPSS trebuie să fie denumită, cu identificatori
de maxim 8 caractere (litere / cifre, primul caracter este literă) şi care nu conțin spații și
caractere special (. , &, !, ? , ', *, etc.).
2. Type – În SPSS fiecare variabilă este de un anumit tip
Tipul unei variabile poate fi numerice ( Numeric, Comma, Dot, Scientific notation,
Restricted numeric), cu forme speciale (Date, Dollar, Custom currency) și alfanumerice
(String). Se recomandă pentru variabile tip string ca de exemplu: Da, Nu, Nu știu, să fie
codificate de la început, folosind Values, atribuindui fiecăruia câte un număr ca de
exemplu 1 pentru Da, 2 pentru Nu și 3 pentru Nu știu și declarate de tip Numeric.
3. Width – Precizează numărul maxim de caractere
4. Decimals – Precizează numărul maxim de zecimale,
5. Label – Lavel conține un text explicit privind semnificaţia variabilei și poate conține
256 de caractere.
11
6. Values – Reprezintă codificarea variabilelor (de exemplu, 1=Da, 2=Nu, 3=Nu știu),
când variabila este de măsură Nominală. SPSS permite definirea şi memorarea
codificărilor utilizate pentru fiecare variabilă.
7. Missing – Când setul de date este incomplet atunci pentru fiecare variabilă se va
preciza dacă conține o valoarea lipsă. Pentru exactitatea prelucrării statistice trebuie
precizare valorile lipsă.
8. Columns – Precizează numărul de caractere afişate, este definit automat cu 8 caractere
, dar se poate schimba acest număr, până la maxim 255.
9. Align – Precizează alinierea valorilor în coloană: Left – stânga, Right – dreapta și
Center - centru.
10. Measure – Precizează sistemul de măsurare.
11. Role –
12
Unitatea de învăţare II
Noţiuni fundamentale de Econometrie
În acest capitol, sunt prezentate noţiunile fundamentale ale disciplinei
ştiinţifice econometrie: variabile aleatoare și repartiții clasice, model econometric,
metoda celor mai mici pătrate și testarea și evaluarea modelelor de regresie .
2.1. Variabile aleatoare şi repartiţii clasice
Variabila aleatoare este o noţiune fundamentală în teoria probabilităţilor şi este
modelată matematic cu ajutorul conceptului de câmp de probabilitate.
Definiţia 2.1.1: Fie (, K, P) un câmp (borelian) de probabilitate. Se numeşte
variabilă aleatoare unidimensională pe acest câmp, o funcţie definită pe spaţiul
evenimentelor elementare cu valori reale, X :X :X , cu
proprietatea:
/, X xK, () x. (1)
Proprietatea (1) impune ca mulţimea evenimentelor elementare pentru care
X() x, () xsă fie un eveniment ataşat aceleaşi experienţe. Mulţimea dată în
proprietatea (1) se mai notează / X xsau (X x), iar X() este valoarea
variabilei aleatoare.
Definiţia 2.1.2: Fie (, K, P) un câmp (borelian) de probabilitate şi X :o
variabilă aleatoare. Funcţia
:  / , ( ) ,
not

F F x P X x P X x x


se numeşte funcţie de repartiţie a variabilei aleatoare X.
Propoziţia 2.1.1: Orice funcţie de repartiţie are proprietăţile caracteristice:




1
2
3
4
0 1, ( ) .
lim 1; lim 0.
,.
,(),,.
not not
xx
RFxx
RFxFFxF
R P a X b F b F a cu a b
R F este nedescrescatoare pe adica a b a b F a F b





13
R5) F este continuă la stânga în orice punct x0 ,
adică: 
0
0

00 lim 0 .
not
xx
xx
FxFxFx



Definiţia 2.1.3: Variabila aleatoare X se numeşte variabilă aleatoare simplă dacă ia
un număr finit de valori, adică X() = x1, x2, ..., xn.
Definiţia 2.1.4: Variabila aleatoare X se numeşte variabilă aleatoare discretă dacă
mulţimea valorilor sale este cel mult numărabilă, adică X() = {xi / i I, I * .
Definiţia 2.1.5: Corespondenţa dintre valorile variabilei aleatoare discrete X şi
probabilităţile matematice (calculate apriori) cu care aceste valori sunt luate se
numeşte repartiţia discretă a variabilei aleatoare X.
Această repartiţie se indică cu ajutorul unui tablou (tablou de repartiţie, tablou
de distribuţie) de forma:
1 2
1 2 1,
1 : n: i
niin
xxxx
X sau X
pppp



, pentru variabile aleatoare simple
sau
1 2
12*
2 : i: i
iiiIN
xxxx
X sau X
p p p p 



, pentru variabile aleatoare
discrete, unde, în ambele cazuri, pi = P(X = xi).
Repartiţia determină complet o variabilă aleatoare discretă în sensul că la
variabile aleatoare discrete diferite corespund repartiţii diferite şi reciproc.
Deoarece pe prima linie a tabloului de repartiţie au fost trecute toate valorile pe
care variabila aleatoare discretă le ia şi, cum două valori distincte nu pot fi luate
simultan, rezultă că evenimentele (X = xi) formează un sistem complet de evenimente,
adică:






1' 1 ,
,
2'
,
n
i
i
ij
i
iI
ij
Xx
respectiv
XxXxij
Xx
XxXxij











În (1’) şi (2’), aplicând formula de calcul a probabilităţii reuniunii
evenimentelor incompatibile, obţinem:

*
1
0, 1, 0,
1'' , 2'' 1. 1
ii
n
i
iiI
i
pinpiI
respectiv p p






Condiţiile (1’’) sau (2’’) trebuie verificate atunci când decidem dacă un tablou
de forma (1) sau (2) este tablou de repartiţie pentru o variabilă aleatoare simplă,
respectiv discretă.
Pentru variabila aleatoare simplă sau discretă X, funcţia de repartiţie este dată
de expresia
14

/ 
,(),
i
i
ixx
Fxpx


şi indică probabilitatea ca variabila aleatoare X să ia valori strict la stânga lui x.
Definiţia 2.1.6: Fie (, K, P) un câmp (borelian) de probabilitate. Variabila aleatoare
X :se numeşte continuă, dacă există o funcţie reală f : [0,) ,
integrabilă pe , astfel încât
,
x
F x f t dt



unde F(x) este funcţia de repartiţie a lui X. În acest caz funcţia f se numeşte densitate
de probabilitate (de repartiţie), iar expresia f(x) dx se numeşte probabilitate
elementară.
Definiţia 2.1.7: Corespondenţa dintre valorile x ale variabilei aleatoare continue
X şi f(x) se numeşte repartiţie (continuă) a variabilei aleatoare X.
Vom scrie

:,.
x
Xx
fx



Propoziţia 2.1.2: Funcţia f(x) are următoarele proprietăţi caracteristice:
a) f x0, () x, b) f xdx 1.




Definiţia 2.1.8: Fie (, K, P) un câmp (borelian) de probabilitate. Variabilele
aleatoare simple
1, 1,
: , : ij
iinjjm
xy
XY
p q 



sunt independente, dacă
, ,
( ) 1, , ( ) 1, .
not
PXxYyPXxYyPXxPYypq
ijijijij
injm



Variabilele aleatoare discrete
**
: , : ij
iiIjjJ
xy
XY
p q 



sunt independente, dacă
, ,( ) , .
not
ijijijij PX x Y y P X x Y y P X x P Y y p q iI jJ

Variabila aleatoare continue

:,:
xy
XY
fxgy



sunt independente, dacă
, ,( ) , ,
not
XYPX x Y y P X x Y y P X x P Y y F x F y x y
unde FX şi FY sunt funcţiile de repartiţie ale celor două variabile.
Fie (, K, P) un câmp (borelian) de probabilitate şi X, Y: , două
variabile aleatoare definite pe acest câmp.
Definiţia 2.1.9: Se numeşte variabilă aleatoare bidimensională (vector aleator
bidimensional), o funcţie definită pe spaţiul evenimentelor elementare cu valori în
2,
15
Z : 2 Z() = (X(), Y()), () .
În acest caz variabilele aleatoare X şi Y se numesc variabile aleatoare
marginale. O variabilă aleatoare bidimensională se va nota, pe scurt, Z = (X, Y).
Definiţia 2.1.10: Funcţia F : 2definită astfel F(x, y) = P(Xx, Y y), ()
(x,y)2 se numeşte funcţie de repartiţie a variabilei aleatoare bidimensionale Z
=(X,Y).
Definiţia 2.1.11: Variabila aleatoare Z = (X,Y) se numeşte variabilă aleatoare
bidimensională discretă dacă variabilele marginale X şi Y sunt discrete.
În acest caz, mulţimea: Z() = (X(), Y()) = {(xi, yj)/(i, j)I x J, I* , J
*este cel mult numărabilă. Dacă I şi J sunt mulţimi finite de indici, atunci Z este
variabilă aleatoare bidimensională simplă.
Repartiţia variabilei Z (corespondenţa dintre valori şi probabilităţi) se deduce
cu ajutorul repartiţiilor marginale.
Fie X, Y cu repartiţiile:


*
*
0
: , , 1,
0
: , , 1.
i
i
ii
iiiIiI
j
j
jj
jjjJjJ
xp
XpPXxpp
yq
YqPYyqq











Repartiţia variabilei aleatoare Z = (X, Y), se scrie:




,
,
: , , ij
ij i j
ij i j I J
xy
ZpPXxYy
p





.
Deoarece evenimentele (X = xi, Y = yj)(i,j)IxJ formează un sistem complet de
evenimente, adică:


,,
,,,,,
ij
iIjJ
ijpl
XxYy
X x Y y X x Y y pentru i j p l





deducem că probabilităţile pij satisfac următoarele proprietăţi caracteristice
0, ( ), ,
1.
ij
ij
iIjJ
pijIJ
p





Între probabilităţile pij, pi, qj există următoarele relaţii: ij i
jJ
pp

şi ij j
iI
pq

.
Definiţia 2.1.12: Se numeşte media variabilei aleatoare X, numărul real notat cu
M(X), dat de


,,
,.
ii
iI
x p dacă X este de tip discret
MX
x f x dx dacă X este continuă










16
Propoziţia 2.1.3: Media unei variabile aleatoare are următoarele proprietăţi:
1. M(a) = a, () a
2. M(aX) = aM(X), () a
3. M(a + X) = a + M(X), () a
4. M(X + Y) = M(X) + M(Y)
5. M(XY) = M(X) M(Y), dacă X şi Y sunt variabile aleatoare independente.
Definiţia 2.1.13: Se numeşte dispersia variabilei aleatoare X, un număr nenegativ
notat D2(X), definit prin egalitatea D2(X) = M[(X – M(X))2] .
Din definiţia mediei unei variabile aleatoare, obţinem pentru dispersie
următoarele formule de calcul



2
2
2
,;
,.
ii
iI
x M X p dacă X este de tip discret
DX
x M X f x dx dacă X este continuă









Propoziţia 2.1.4: Proprietăţi ale dispersiei:
1. D2(X) = M(X 2) – M 2(X)
2. D2(a) = 0, () a
3. D2(aX) = a2D2(X), () a
4. D2(a + X) = D2(X), () a
5. D2(X + Y) = D2(X) + D2(Y), în ipoteza că X şi Y sunt variabile aleatoare
independente.
Definiţia 2.1.14: Definim abatere medie pătratică, astfel D X D2 x .
Definiţia 2.1.15: Se numeşte momentul centrat de ordinul k, k N, al variabilei
aleatoare X, momentul iniţial de ordinul k al variabilei X – M(X) (abaterea faţă de
medie a variabilei aleatoare X), adică: k (X) = mk (X – M(X)) = M[(X – M(X))k]
Definiţia 2.1.16: Se numeşte funcţie de regresie a lui Y în raport cu X, funcţia dată de
/ , y R x M Y X x x. Graficul acestei funcţii se numeşte curba de regresie a
lui Y faţă de X. Analog, se defineşte funcţia de regresie a lui X în raport cu Y:
/ , x R y M X Y y y.
Definiţia 2.1.17: Se numeşte covarianţa dintre variabilele aleatoare X şi Y, notată
cov(X, Y), momentul centrat de ordinul (1,1) al vectorului aleator bidimensional Z=(X,
Y), adică
1,1 cov X,Y M X M X Y M Y .
Propoziţia 2.1.5 (proprietăţi ale covariaţiei):
17




2
1. cov , .
, cov , 0,
2. cov , 0 ,
cov , 0 , .
3. cov , cov , ; cov , .
X Y M XY M X M Y
Dacă X Y sunt independente X Y
Dacă X Y nu rezultă că X şi Y sunt independente
Dacă X Y X Y sunt dependente
XYYXXXDX











1212
1212
4. cov , 0; cov , 0; ( ) , .
5. cov , cov , ; ( ) , .
cov , cov , cov ,
6.
cov , cov , cov , .
XbaYab
aX bY ab X Y a b
XXYXYXY
XYYXYXY





Definiţia 2.1.18: Se numeşte coeficientul de corelaţie dintre variabilele X şi Y, un
număr notat (X,Y) dat de relaţia



cov ,
,
XY
XY
D X D Y 

unde D(X) este abaterea pătratică a lui X, D X D Y 0, D X D2 X .
Observaţie: Se utilizează şi notaţiile:


222 ;
.
notat
notat
X
DXX
DXX




Propoziţia 2.1.6 (proprietăţi ale coeficientului de corelaţie):
1. Dacă X şi Y sunt independente (X,Y) = 0,
Dacă (X,Y) = 0 nu rezultă că X şi Y sunt independente (X, Y necorelate),
Dacă (X,Y) 0 X şi Y sunt dependente.
2. 1(X,Y) 1
3. Între variabilele X şi Y există o dependenţă liniară de forma

0
,1
a

Y aX b X Y

.
4. (X,X) = 1, (X,X) = 1, cu D(X) 0.
Definiţia 2.1.19: Se numeşte matricea de covarianţă (corelaţie) a variabilei Z,
matricea




.
cov X,Y D Y
D X cov X,Y
cov Y,X cov Y,Y
cov X,X cov X,Y
C
2
2










Definiţia 2.1.20: O variabilă aleatoare X are o repartiţie uniformă discretă dacă
admite o repartiţie de forma
1 2 1,
12
::,
xnxxn
xnx
X sau X
ppppp



unde

1 , ( ) 1, . x p P X x x n
n 
18
Definiţia 2.1.21: Funcţia 
f : 1,2, ,n 0,1 , f x 1 , k 1,n
n se numeşte legea
de repartiţie uniformă discretă.
Definiţia 2.1.22: O variabilă aleatoare X are o repartiţie binomială de parametrii n şi
p, dacă admite o repartiţie de forma
01
01
:,
xn
xn
X
pppp



unde x x n x , 0, 0, 1,
x n p P X x C p q p q p q n .

Definiţia 2.1.23: Funcţia :0,1, , , , 0,1, x x n x


x n f x n f x p C p q se
numeşte legea de repartiţie binomială. Mulţimea variabilelor aleatoare cu repartiţia
binomială de parametri n şi p se notează B(n, p).
Definiţia 2.1.24: O variabilă aleatoare X are o repartiţie hipergeometrică de
parametrii n, a, N, dacă admite o repartiţie de forma

01
**
,
:,;,.
xnx
aNa
xn
xxxxN
x C C X unde p P X x a n
pC






Definiţia 2.1.25: Funcţia 
xnx
aNa
nN
fxCC
C




se numeşte legea de repartiţie


hipergeometrică.
Definiţia 2.1.26: O variabilă aleatoare X are o repartiţie Poisson de parametru ,
dacă admite o repartiţie de forma
:,
x
x
X
p



unde , 0, .
!
x
xpex
x




Definiţia 2.1.27: Funcţia 
!
x
xfxpe
x
se numeşte legea de repartiţie Poisson.
Definiţia 2.1.28: Variabila aleatoare continuă X are o repartiţie uniformă continuă
dacă admite densitatea de repartiţie (probabilitate)


1 , , , 0,
0, .
xabba
fxba
în rest




Funcţia f se numeşte legea de repartiţie uniformă continuă
Definiţia 2.1.29: Variabila aleatoare X are repartiţia normală (Gauss-Laplace) de
parametrii şi , dacă admite densitatea de probabilitate (de repartiţie)

12
1 2 , , , 0.
2
x
fxex









19
Mulţimea variabilelor aleatoare cu repartiţia normală de parametrii şi se
notează cu N(, ). Funcţia f se numeşte funcţia de repartiţie normală.
Figure 2.1: Graficul densității normale pentru câteva valori ale mediei și dispersiei
2 .

Definiţia 2.1.30: Variabila aleatoare X are repartiţia gama de parametri a şi b, dacă


admite densitatea de repartiţie

1 1 , 0, 0, 0,
0, 0.
x
ab
axexab
fxba
x








Funcţia f se numeşte legea de repartiţie gama.
Definiţia 2.1.31: Variabila aleatoare X are o repartiţie exponenţial negativă dacă
admite densitatea de repartiţie

, 0, 0,
0, 0.
e xx
fx
x



Funcţia f se numeşte legea de repartiţie exponenţial negativă.
Definiţia 2.1.32: Variabilă aleatoare X are repartiţia 2 de parametrii şi ,
X N ,dacă admite densitatea de repartiţie:

12
22
2
1,0
2
2
0 , 0.
x
xex
fx
x











Funcţia f se numeşte legea de repartiţie hi-pătrat.
Definiţia 2.1.33: Variabila aleatoare X are repartiţia beta de parametrii a şi b, dacă
admite densitatea de repartiţie

1 1 1 1 , 0,1 , 0, 0,
,
0,.
xa x b x a b
fxab
în rest





20
Funcţia f se numeşte legea de repartiţie beta.
Definiţia 2.1.34: Variabila aleatoare X are repartiţia Student cu n grade de libertate,
xS ndacă admite densitatea de repartiţie

1
22
*
1
21,,.
2
nn
fxxxn
nnn






Funcţia f se numeşte legea de repartiţie Student.
1 ( ) ii
iIiI
PAPA




.
2.2. Noţiuni şi concepte fundamentale ale econometriei
În cercetarea econometrică, pornind de la modele economice reale şi
complexe, econometrie studiază aceste modele, identifică variabilele, parametrii,
estimatorii, estimaţii, etc..
Noţiunea de model a fost preluată din teoria matematică şi economică.
Modelul este un instrument de cercetare ştiinţifică, o imagine homomorfă şi
simplificată a realităţii economice care are rolul de a explica fenomenul economic
studiat în mod fundamental şi esenţial.
Modelul economic este un instrumente de măsurare şi de observare, folosind
cunoştinţe teoretice şi date empirice, a realităţii fenomenului economic.
Modelul econometric este o prezentare formalizată a problemei sau a
realităţii economice studiate.4 Modelele econometrice analizează calitatea şi cantitatea
proceselor economice şi evoluţia lor.
Modelul econometric este o ecuaţie sau un sistem de ecuaţii cu două sau mai
multe variabile ( caracteristice sau variabile statistice) şi se notează cu ( ) j Y f X ,
j 1, k .
Într-o economie de piaţă pornind de la date reale trebuie alcătuit modelul
econometric pentru a înţelege şi explica fenomenul economic, astfel încât să se poată
efectua previziuni practice.
În cercetarea econometrică pornind de la variabilele economice se utilizează
variabile statistice, cum ar fi populaţii reale şi finite, între care există relaţii de
interdependenţă. Tipuri de variabile sunt:
variabile dependente, numite şi variabile explicate, rezultative sau efect şi
se notează cu Y. Aceaste variabile explică fenomenul economic
determinat de diferiţi factori.
variabile independente, numite şi variabile explicative, factoriale sau
factori de influenţă şi de notează cu Xj, j 1, k , unde k este numărul de
4 Jaba, E., Jemma, D. - Econometrie, Editura Sedcom Libris, Iaşi, 2006;
21
factori. Aceaste variabile determină un anumit rezultat asupra variabilei
dependente.
variabile aleatoare, numite şi variabile reziduale sau eroare şi de notează
cu . Aceste variabile respectă anumite proprietăţi şi ipoteze clasice şi
reprezintă suma tuturor influenţelor care nu apar explicit în modelul
economic.
Parametrii modelului econometrie, numiţi şi coeficienţi de regresie, sunt
mărimi reale şi necunoscute care apar în model în diferite expresii alături de variabile3
şi se notează cu , j , j 1, k . Procesului de estimare şi testare statistică se
determină cu ajutorul acestor parametrii.
Estimatorii sunt variabile aleatoare, convenabil construite în procesul de
estimare, cu distribuţii de probabilitate cunoscute şi cu proprietăţi specifice în baza
cărora se realizează procesul de estimare a parametrilor modelului econometric3 şi se
notează cu ˆ , ˆ
j , j 1, k
Dacă notăm parametrul cu simbolul şi un estimator al acestuia cu ˆ ,
atunci avem următoarele proprietăţi ale estimatorilor:
nedeplasarea - un estimator este nedeplasat dacă verifică relaţia: M(ˆ) ,
adică media sau speranţa matematică a acestuia este egală cu parametrul. În
caz contrar el este deplasat.
convergenţa - un estimator este convergent dacă verifică relaţia
lim ˆ 0 n n
P 


, pentru orice (0,1) , adică pentru un eşantion cu


volum suficient de mare şirul estimatorilor converge către parametru
eficienţa - estimatirul ˆ este eficient dacă are dispersia sau varianţa cea mai
mică dintre toţi estimatorii posibili pentru parametru .
Estimaţiile sunt valori ale estimatorilor calculate la nivelul unui eşantion sau
set de date reale observate din realitate5 şi se notează cu , j , j 1, k .
Obiectivele modelării econometrice sunt:
prezentarea fenomenului economic,
confruntarea teoriei economice cu realitatea,
estimarea parametrilor,
testarea ipotezelor despre comportamentul economic,
validarea modelului,
previzionarea variabilelor economice.
Econometria prin caracterul său general creează modele abstracte ale
fenomenelor economice. Etapele modelării econometrice sunt:
culegerea datelor şi formularea problemei în termeni economici,
identificarea variabilelor în problema economică,
identificarea tipului de variabile,
alegerea modelului econometric,
estimarea parametrilor modelului econometric ales,
testarea modelului econometric ales,
utilizarea modelului pentru predicţii.
5 Jaba, E., Jemma, D. - Econometrie, Editura Sedcom Libris, Iaşi, 2006;
22
2.3. Metoda celor mai mici pătrate
Fie X o variabilă independentă şi fie Y o variabilă dependentă de X. Asupra
variabilelor X şi Y se fac n observaţii şi astfel se obţin perechile de date numerice:
12
12
, , ...
, , ...
n
n
xxx
yyy



(2.3.1)
Deoarece variabila Y depinde X, problema ajustării constă în determinarea
unei funcţii f : , care să reprezinte cât mai bine legea de variaţie a variabilei
Y în raport cu variabila X, adică f (X) Y .
Notăm cu:
yi valori observate, i 1,n ;
ˆi y valori ajustate ale valorii observate yi;
S(Y,Yˆ) distanţa sau abaterea dintre datele observate Y şi cele ajustate
Yˆ .
Dacă se cunoaşte funcţia f , atunci se pot determina valorile yi şi valorile
ˆ ( ) i i y f x , i 1,n .
Distanţa dintre datele observate Y şi cele ajustate Yˆ , apare ca distanţa dintre
două puncte din spaţiul n , adică un punct de coordonate 1 2 , , ... , n y y y şi altul de
coordonate 1 2 ˆ , ˆ , ... , ˆn y y y , şi este definită de relaţia:
2
1
( , ˆ) ˆ
n
ii
i
SYYyy

(2.3.2)
Definiţie 2.3.1: Se spune că f0 este funcţia optimă de ajustare sau soluţia optimă a
problemei ajustării, dacă aceasta satisface relaţia:
2 2
0
11
( ) min ( )
nn
iifiiii
yfxyfx




(2.3.3)
Rezolvarea problemei ajustării constă în:
- determinarea unei clase sau unui tip de funcţii din care face parte funcţia f;
- pentru o anumită clasă de funcţii, determinarea celei mai bune.
Rezolvarea efectivă a problemei definite de relaţia (2.3.3) reprezintă metoda
celor mai mici pătrate sau metoda lui Lagendre-Gauss.
Presupunem că nu se cunoaşte forma analitică a funcţiei de ajustare f.
Considerăm că acesta depinde de m parametri şi este de forma:
1 2 ( ) ( ; , , ... , ) i i m f x f x , i 1,n , (2.3.4)

unde parametri 1 2 , , ... , m urmează a fi determinaţi pe baza


observaţiilor 1 2 1 2 ( , , ... , ; , , ... , ) n n x x x y y y . În aceste condiţii, determinarea funcţiei f
este echivalentă cu determinarea valorilor parametrilor 1 2 , , ... , m .
23
Vom presupune, că funcţia unifactorială f este un polinom de gradul I, adică
de forma Y f (X) X , adică variabila Y depinde liniar de variabila X sau
evoluţia acesteia este liniară. Eroarea care se produce în punctul i x este
i y f x , i 1,n . În aceste condiţii avem funcţia eroare pătratică sau distanţa
ii

de forma:
2 2
11
( , ˆ) ( , )
nn
iii
ii

S Y Y y x S 




, (2.3.5)
iar problema (2.3.3) va căpăta forma particulară concretă
2
1
min ( , )
n
ii
i

S y x

, ,* (2.3.6)


şi avem astfel o problemă de extrem local.
Dacă derivăm funcţia f în raport cu cele două variabile şi , vom avea:

1
2
n
ii
i

S y x 



și 
1
2
n
iii
i

S x y x 




şi conform algoritmului de determinare a extremelor locale avem ecuaţiile
SS0




, care conduc la sistemul normal al lui Gauss
11
2
111
nn
ii
ii
nnn
iiii
iii
nxy
xxxy












(2.3.7)
Rezolvând sistemul (2.3.7), vom avea soluţia unică (ˆ,ˆ) de forma:
11
111
2
2
11
11ˆˆ
ˆ
nn
ii
ii
nnn
iiii
iii
nn
ii
ii
yx
nn
nxyxy
nxx

















2
1111
2
2
11
111
2
2
11
ˆ
ˆ
nnnn
iiiii
iiii
nn
ii
ii
nnn
iiii
iii
nn
ii
ii
yxxxy
nxx
nxyxy
nxx





















(2.3.8)
Dacă derivăm funcţia f de două ori în raport cu cele două variabile şi ,
vom avea:
2
2 S 2n




,
2
2
2
1
2
n
i
i
Sx



și
2
1
2
n
i
i
Sx



.
Alcătuim matricea Hessiană:
1
2
11
22
(,)
22
n
i
i
nn
ii
ii
nx
H
xx










24
Conform algoritmului de determinare a extremelor locale avem
2
12
S ( ˆ, ˆ) 0





22
22222
22222
2
( ˆ, ˆ) ( ˆ, ˆ)
( ˆ, ˆ) ( ˆ, ˆ) ( ˆ, ˆ) 0
( ˆ, ˆ) ( ˆ, ˆ)
SS
SSS
SS











În aceste condiţii soluţia (ˆ,ˆ) este punct de minim local, aşadar,
minimizează abaterea pătratică (2.3.6). În acest caz punctele , i i x y , i 1,n se
plasează aproximativ pe o dreaptă. Sistemul normal se particularizează.
În mod analog se va proceda dacă funcţia unifactorială f este un polinom de
gradul al II-lea, adică de forma f (X ) Y X X 2 , adică variabila Y
depinde neliniar de variabila X sau evoluţia acesteia este parabolică. Eroarea care se
produce în punctul i x este i i i y f x , i 1,n . În aceste condiţii avem funcţia
eroare pătratică sau distanţa de forma:
 222
11
(,,)
nn
iiii
ii

S y x x




, (2.3.9)
iar problema (2.3.9) va căpăta forma particulară concretă
 22
1
min ( , , )
n
iii
i

S y x x


, ,,(2.3.10)
şi avem astfel iar o problemă de extrem local. Pentru determinarea punctelor de
extrem, vom folosi algoritmul de determinare a extremelor locale, în mod analog.
Dacă derivăm funcţia f în raport cu cele două variabile , şi , vom
avea:
 2
1
2
n
iii
i

S y x x 



,
 2
1
2
n
iiii
i

S x y x x 



,
 22
1
2
n
iiii
i

S x y x x 




şi conform algoritmului de determinare a extremelor locale avem ecuaţiile
SSS0




, care conduc la sistemul normal al lui Gauss
25
2
111
23
1111
2342
1111
nnn
iii
iii
nnnn
iiiii
iiii
nnnn
iiiii
iiii
nxxy
xxxxy
xxxxy


















(2.3.11)
Rezolvând sistemul (2.3.11), vom avea soluţia unică (ˆ,ˆ,ˆ) .
Dacă derivăm funcţia f de două ori în raport cu cele două variabile , şi
, vom avea:
2
2 S 2n




,
2
2
2
1
2
n
i
i
Sx



,
2
4
2
1
2
n
i
i
Sx



,
2
1
2
n
i
i
Sx



,
2
2
1
2
n
i
i
Sx



și
2
3
1
2
n
i
i
Sx



.
Alcătuim matricea Hessiană:
2
11
23
111
234
111
222
(,,)222
222
nn
ii
ii
nnn
iii
iii
nnn
iii
iii
nxx
Hxxx
xxx
















Conform algoritmului de determinare a extremelor locale avem
2
12
S ( ˆ, ˆ, ˆ) 0





22
2
222
2
( ˆ, ˆ, ˆ) ( ˆ, ˆ, ˆ)
0
( ˆ, ˆ, ˆ) ( ˆ, ˆ, ˆ)
SS
SS









222
2
222
32
222
2
( ˆ, ˆ, ˆ) ( ˆ, ˆ, ˆ) ( ˆ, ˆ, ˆ)
( ˆ, ˆ, ˆ) ( ˆ, ˆ, ˆ) ( ˆ, ˆ, ˆ) 0
( ˆ, ˆ, ˆ) ( ˆ, ˆ, ˆ) ( ˆ, ˆ, ˆ)
SSS
SSS
SSS













În aceste condiţii soluţia (ˆ,ˆ,ˆ) este punct de minim local, aşadar,
minimizează abaterea pătratică (2.3.10). În acest caz punctele , i i x y , i 1,n se
plasează aproximativ pe o dreaptă. Sistemul normal se particularizează.
Considerăm două funcţii de ajustare 1f (X ) şi 2f (X ) , determinate pe baza
observaţiilor ( , ) i i x y , i 1,n . Alegerea celei mai bune dintre cele două ajustări, în
26
ipotezele în care s-a determinat funcţia 1 f pentru un trend liniar şi funcţia 2 f pentru
un trend parabolic, înseamnă determinarea celei mai mici abateri dintre datele reale şi
cele ajustate, adică

 22
12
11
min ˆ ( ) , ˆ ( )
nn
fiiiiii
yfxyfx




, (2.3.17)
unde ˆ( ) i i y f x , i 1,n .
Pe baza observaţiilor reale sau simulate, cu referire la trecutul unui anumit
proces sau a unui fenomen oarecare, se va determina funcţiile de ajustare. În aceste
condiţii se va cunoaşte tendinţa de evoluţie a variabilei dependente Y în funcţie de
variabila independentă X, iar cu ajutorul funcţiei fˆ (X ) se pot face simulări viitoare,
presupunându-se diferite valori posibile viitoare. Previziunea sau prognozarea este
procedeul unor fenomene sau procese viitoare. Corectitudinea acestor fenomene
depind de:
rigoarea cu care s-au determinat parametri funcţiei fˆ (X ) ;
mărimea volumului de observaţii considerat, necesar asigurării unui grad
mare de stabilitate a modelului;
condiţii de utilizarea practică;
Exerciţii propuse:
Folosind metoda celor mai mici pătrate să de determine sistemul normal al lui
Gauss și estimațiile parametrilor de regresie pentru următoarele funcții:
a) Y 1
X ,
b) Y X X 2 X 3 ,
c) Y ln X 
d) Y X,
e) Y X ,
f) Y eX 
g) Y eX 
2.4. Testarea și evaluarea modelelor de regresie
2.4.1. Teste statistice
Testele statistice sunt metode de decizie care ne ajută la validarea sau
invalidarea cu un anumit grad de siguranţă a unei ipoteze statistice. Testele statistice
verifică veridicitatea unor ipoteze. Definim cele două ipoteze6:
1. Ipoteza H0 sau ipoteza nulă – datele nu prezintă legături între ele, sunt
independente sau valorile comparate nu diferă între ele.
6 http://www.umfcv.ro/files/b/i/Biostatistica%20MG%20-%20Cursul%205%20-%20Corelatii.pdf

27
2. Ipoteza H1 sau ipoteza alternativă – datele prezintă legături între ele, sunt
dependente sau valorile comparate diferă între ele.
Dacă se respinge ipoteza H0, adică se acceptă ipoteza H1, atunci putem afirma
că rezultatul obținut este semnificativ din punct de vedere statistic, iar dacă se acceptă
ipoteza H0, atunci putem afirma că rezultatul obținut este nesemnificativ din punct de
vedere statistic.
Pragul de semnificaţie, notat cu p, reprezintă mărimea riscului de eroare având
o semnificație statistică și anume măsoară circumstanța ca decizia de a respinge
ipoteza H0 să fie incorectă. În practica economică se consideră, de regulă, un prag de
semnificație de 0.05, adică se consideră un risc de 5% de a respinge pe ipoteza H0.
Rezultatul sig. al testului este un număr cuprins între 0 şi 1, reprezintă
probabilitate de a face o eroare dacă respingem ipoteza H0. Dacă valoarea sig. este
mai mic de cât pragul de semnificație ales (p), atunci se respinge ipoteza H0 şi se va
admite ca adevărată ipoteza H1.
Valoarea sig.-ului la testele statistice se interpretează astfel:
Dacă sig. < 0.05, atunci avem o legătură seminificativă, cu o încredere de 95%.
Dacă sig. < 0.01, atunci avem o legătură seminificativă, cu o încredere de 99%.
Dacă sig. < 0.001, atunci avem o legătură înalt seminificativă, cu o încredere de
99.9%.
Dacă sig. > 0.05, atunci avem o legătură neseminificativă.
Pașii unui test statistic sunt:
1. Definirea ipotezelor - formularea problemei în termenii ipotezelor statistice (H0 , H1
)
2. Alegerea pragului de semnificatie p (p = 1 - P) și apoi calcularea pragului de
separare sig. dintre valorile acceptabile și cele considerate inacceptabile
(probabilitatea P se alege intre 99% si 95%).
3. Alegerea statisticii test adaptate fiecărei problemei (t sau F)
4. Calcularea valorii statisticii test folosind datele eșantionului.
5. Citirea valorii teoretice a testului din tabelele corespunzătoare fiecărui test dat de
nivelul de semnificație ales .
6. Formularea deciziei, adică se respinge sau se acceptă ipoteza nulă, se realizează
prin compararea valorii statisticii test calculate și valoarea teoretică a testului.
Cele mai importante teste statistice sunt:
Testele parametrice – de semnificație. Aceste teste se folosec pentru testatrea
indicatorilor variabilelor cantitative, cum ar fi media, variația, coeficient de
corelație, abatere standard, etc. Exemple de teste parametrice:
- Testul Student
- Testul ANOVA
- Testul Fisher pentru dispersii
Testele neparametrice - de concordanță. Se utilizează pentru testarea indicatorilor
variabililor calitative, cum ar fi distrubuții de frecvență, coeficienți de asociere.
Testul Student sau testul t este un testul de comparare și anume când
abaterile standard sunt egale compară două medii. Acest tip de test se aplică în
următoarele cazuri:
- dacă măsurătorile efectuate la cele două eşantioane sunt independente.
28
- dacă eşantioanele provin din populaţii care sunt normal distribuite sau
urmează o distribuție normală și acest lucru care trebuie verificat înainte
de aplicarea testului.
- dacă populațiile din care provin eşantioanele au dispersii egale sau abateri
standard.
Testul t se calculează ca diferenţa dintre mediile a două eşantioane în unităţi
ale erorii standard σ și are formula:
12
12
XX
tXX


.
Testul ANOVA compară mediile pe mai multe eșantioane în același timp.
Așadar, avem ipotezile:
Ipoteza H0 când mediile sunt egale
Ipoteza H1 când cel puțin două medii diferă semnificativ.
Aplicarea acestiu test se produce ca rezultat al respingerii ipotezei H0 și anume
egalitatea mediilor, deci se acceptă ipoteza H1, dar nu se precizează care grupuri au
mediile diferite.
Testul ANOVA se aplică în condițiile când:
- datele sunt independente între ele,
- datele fiecărui grup urmează o istribuție normală,
- deviația standard are aceeași valoare pentru toate grupurile.
Testul Fisher este un test de comparare a mediilor normale când dispersiile a
două variabile independente repartizate normal sunt egale. Acest test se calculează
folosind formula
2
2
ˆ
11ˆ
Fnk
k





,
unde
- n reprezintă numărul valorilor observate;
- k reprezintă numărul parametrilor estimaţi ai modelului de regresie;
- ˆ reprezintă estimatorul raportului de corelaţie.
2.4.2. Corelația
O metodă statistică de determinare a relațiilor dintre două sau mai multe
variabile, fie între variabilele cantitative, fie între variabilele calitative, fie între
ambele tipuri de variabile, este corelația. Tipuri de corelații:
corelații parametrice
corelații neparametrice
Coeficientul de corelaţie , notat cu , măsoară intensitatea legăturii dintre
cele două sau mai multe variabile și are o valoare cantitativă. Valoarea coeficientului
de corelaţie este cuprinsă între -1 şi +1, mai simplu scris:
11.
În funcţie de valoarea coeficientului de corelaţie avem următoarele tipuri de
corelații:
29
Corelația perfectă inversă-negativă, când 1,0, așadar între variabile există
o legătură perfectă negativă și inversă. Variabile corelate variază în sens contrar.
Corelația nulă inexistentă, când0 , așadar între variabile nu există o legătură,
așadar variabilele sunt necorelate.
Corelația perfectă inversă-negativă, când0,1, așadar între variabile există o
legătură perfectă pozitivă și directă. Dacă 1, atunci avem o legătură puternică.
Variabile corelate variază în același sens.
Figura 2.4.1. Evoluția corelației7
Interpretarea coeficientului de corelație:
Dacă 0 , atunci nu avem corelație.
Dacă (0,0.2] , atunci avem o corelație foarte slabă.
Dacă (0.2,0.5] , atunci avem o corelație slabă.
Dacă (0.5,0.75], atunci avem o corelație rezonabilă sau de intensitate medie.
Dacă (0.75,0.95], atunci avem o corelație înaltă sau puternică.
Dacă (0.95,1], atunci avem o corelație foarte înaltă sau deterministă.
Testarea coeficientului de corelaţie se face în scopul de a verifica dacă
variabila sau variabilele independente influenţează semnificativ variaţia variabilei
dependente. Testarea acestui coeficientul se realizează cu ajutorul testului Student “t”.
Raportul de corelaţie este un parametru care exprimă intensitatea legăturii
dintre două sau mai multecvariabile a modelului de regresie sau mai exact măsoară
ponderea variaţiei explicată prin linia de regresie în variaţia totală8, se notează cu 
(în aplicația SPSS cu R). Valoarea raportului de corelaţie este un număr cuprins în
intervalul 0 şi +1, mai simplu scris:
0 1.
Testarea raportului de corelație se realizează cu ajutorul testului Fisher.
Raportul de determinaţie este valoarea la pătrat a raportului de corelaţie, se
notează cu 2 (în aplicația SPSS cu R2) şi arată ponderea influenţei factorului sau
factorilor independenți asupra variaţiei variabilei dependente.
7 http://www.umfcv.ro/files/b/i/Biostatistica%20MG%20-%20Cursul%205%20-%20Corelatii.pdf
8 Jaba, E., Jemma, D. - Econometrie, Editura Sedcom Libris, Iaşi, 2006;
30
Unitatea de învăţare III.
Modelul unifactorial de regresie
În acest capitol, este prezentat cel mai simplu model econometric şi anume
modelul de regresie simplă. Acest model conţin o variabilă dependentă şi o variabilă
independentă. Între aceste două variabile poate exista o legătură de tip liniar sau una
neliniară.
3.1. Modelul de regresie simplă liniară
3.1.1. Prezentarea problemei şi ipotezele modelului
Modelul de regresie liniară simplă este cel mai simplu model econometric şi
conţine două variabile între care există o legătură de dependenţă. Forma generală a
unui model de regresie liniară simplă este:
Y X , (3.1.1.1)
unde
Y este variabila dependentă, aleatoare, de forma 1 2 ( , , , ) n Y y y y ,
X este variabila independentă, nonaleatoare, de forma
1 2 ( , , , ) n X x x x ,

este variabila aleatoare eroare sau reziduu sau variația de


perturbație,
,sunt parametrii modelului de regresie,
Variabila aleatoare eroare reprezintă efectul tuturor factorilor, în afara
factorului X, care îl afecteazăpe Y și care sunt considerați neobservabili. Variabila
captează erorile de măsurar a valorilor variabilelir și caracterul aleator al
comportamentul uman. Termenul eroare reprezint acea parte din valoarea variabilei Y
care nu poate fi măsurată printr-o relație sistematică cu variabil X.9
Relaţia (3.1.1.1) se numeşte ecuaţie de regresie.
Parametrii ecuaţiei de regresie sunt:
- ordonata la origine a dreptei de regresie şi arată valoarea medie a
variabilei Y când variabila X este 0. Acest parametru este o constantă.
9 www/academa.edu/11507942/3._MODELE DE REGRESIE CLASIE 3.1. Modelul unifactorial de
regresie liniara Analiza de Regresie, pag. 3.
31
- panta dreptei, este numit şi coeficient de regresie şi arată variaţia absolută
medie a variabilei X la o variaţie absolută cu o unitate a variabilei Y.
X
Y




În ecuaţia de regresie (3.1.1.1) parametrii şi sunt necunoscuţi. Semnul
parametrului de regresie indică direcţia legăturii între variabile şi anume:
> 0 legătură directă (pozitivă), adică dacă variabila X creşte cu o unitate,
atunci şi variabila Y creşte în medie cu unităţi,
= 0 nu există legătură de tip liniar ;
< 0 legătură inversă (negativă), adică dacă variabila X creşte cu o unitate,
atunci şi variabila Y scade în medie cu unităţi.
Dacă considerăm un eşantion de volum n, atunci avem:
yi xi i , i 1,n (3.1.1.2)
Modelarea econometrică impune anumite ipoteze cu privire la variabilele
reziduale şi independente.
Cele mai importante ipoteze asupra variabilei reziduale sunt:
eroarea medie este nulă : ( ) 0 i M ,
normalitatea erorilor: (0, 2 ) i N , adică variabila reziduală urmează o lege de
repartiţie normală de medie zero şi varianţă 2 ,
homoscedasticitate: ( ) ( 2 ) 2 i i V M , adică varianţa erorii este constantă la
nivelul distribuţiilor condiţionate de tipul i i Y X x ,
necorelarea erorilor: cov( , ) 0 i j , adică erorile sunt independente, nu se
influenţează reciproc;
lipsa corelaţiei dintre variabila independentă şi variabila eroare: cov( , ) 0 i i x .
Variabila independentă este:
observabilă,
deterministă.
Prezentăm câteva exemple din economie pentru modele de regresie liniară
simplă:
1) Funcţia de consum - cererea sau consumul populaţiei pentru o anumită categoric
de mărfuri este o funcţie de venit i i i C V , unde parametrul arată de câte
ori creşte consumul unui anumit produs ( i C ) la o creştere cu o unitate a venitului şi
este de regulă pozitiv.
2) Legea cererii - cererea populaţiei pentru o anumită categorie de mărfuri este o
funcţie de preţul acestor produse i i i C P , unde parametrul este de regulă
negativ şi arată cu cât scade cererea la o creştere a preţului cu o unitate.
3.1.2. Estimarea parametrilor modelului
Parametrii modelului de regresie oferă informaţii despre modificarea variabilei
dependentă. În practică, pentru determinarea parametrilor se consideră datele de
32
nivelul unui eşantion de volum n, din totalul N - nivelul populaţiei totale. În aceste
condiţii se determină estimarea parametrilor modelului de regresie.
Fie modelul de regresie liniară simplă:
yi xi i .
La nivelul unui eşantion valoarea parametrilor de regresie se estimează pe
baza estimatorilor ˆ , ˆşi modelul de regresie se poate scrie pe baza acestor
estimatori astfel:
ˆ ˆ i i y x .
Proprietăţile estimatorilor parametrilor modelului de regresie sunt:
nedeplasarea
convergenţa,
eficienţa.
Estimatorii parametrilor modelului de regresie se poate face prin:
punctual,
intervale de încredere.
Pentru modelul de regresie liniară simplă, estimarea punctuală se pot
determina punctual cu ajutorul metodei celor mai mici pătrate.
Aplicând metoda celor mai mici pătrate, avem:
2
1111
2
2
11
111
2
2
11
ˆ
ˆ
nnnn
iiiii
iiii
nn
ii
ii
nnn
iiii
iii
nn
ii
ii
yxxxy
nxx
nxyxy
nxx





















Estimatorii parametrilor modelului de regresie se pot determina şi estima prin
intervale de încredere. În acest caz, estimatorii parametrilor modelului de regresie
urmează o lege de distribuţie normală astfel:
2
ˆ ˆ N( , ) ; ˆ ( ) M ; 2

ˆ V( ˆ) ;
2
212
ˆ
2
1
()
n
i
i
n
i
i
x
nxX






2
ˆ ˆ N( , ) 

; ˆ ( ) M ; 2
ˆ V( ˆ) 

;
2

( )2 i
i
xX





Varianţa are următoarele estimaţii pentru:
eroare: 2
:
22
211
(ˆˆ)
22
nn
iii
ii
yx
nn






33
estimatorului ˆ :
2
212
ˆ
2
1
()
n
i
i
n
i
i
x
nxX






estimatorului ˆ:
2

2
1
()
n
i
i
xX







Cu ajutorul estimaţiilor pentru un eşantion de volum n, se determină
intervalele de încredere astfel:
pentru coeficientul de regresie intervalul de încredere este definit de
relaţia:
/2 ˆ
ˆ
p t
.
pentru coeficientul de regresie intervalul de încredere este definit de
relaţia:
/2 ˆ ˆ p t .

3.1.3. Testarea parametrilor modelului


Testarea parametrilor modelului de regresie liniară se realizează cu ajutorul
testului Student sau testului t.
Etapele testării semnificaţiei coeficientului de regresie sunt:
definirea ipotezelori:
H0 : 0
H1 : 0
alegerea pragului de semnificaţie . Dacă respingem ipoteza H0, cu un prag de
semnificaţie ales, atunci legătura dintre cele două variabile X şi Y este
semnificativă. În practica economică se consideră, de regulă, un p 0,05, adică se
consideră un risc de 5% de a respinge pe ipoteza H0, atunci când aceasta ar fi
adevărată.
alegerea statisticii test. Se foloseşte statistica Student definită de raportul:
ˆ
ˆ
ˆ
t




,
unde
2
ˆ2
(ˆˆ)
ˆ
( 2) ( )
ii
i
i
i
yx
n x x








determinarea valorii calculate a testului. În ipoteza H0, statistica Student devine
ˆ2
2
ˆˆ
( 2)
ˆ(ˆˆ)
( 2) ( )
calc
ii
i
i
i
ttn
yx
nxx








34
citirea valorii teoretice a testului. Pentru un prag de semnificaţie p, se citeşte din
tabelul Student o valoare teoretică a testului p/2;n 2 t . Se alege p / 2 deoarece
distribuţia Student este simetrică.
decizia:
1. Dacă calc p/2;n 2 t t sau calc p/2;n 2 t t , atunci se respinge ipoteza H0,
adică se acceptă H1 : 0 , cu probabilitatea de (1p) . Aşadar,
factorul X influenţează semnificativ variabila Y.
2. Dacă /2; 2 /2; 2 , calc p n p n t t t , atunci acceptă ipoteza H0, cu
probabilitatea de (1p) . Aşadar, factorul X nu influenţează
semnificativ variabila Y.
3.1.4. Evaluarea calităţii modelului de regresie
Coeficientul de corelaţie măsoară intensitatea legăturii dintre cele două
variabile a modelului de regresie liniară simplă, se notează cu (X,Y) şi este definit
de relaţia:
1
( )( )
( , ) cov( , )
n
ixiy
i
xyxy
xy
XYXY
N








, i 1,n ,
unde:
- cov(X,Y) este covarianţa,
- , i i x y sunt valorile variabilelor corelate,
- , x y sunt nivelul mediu al variabilelor corelate,
- n este numărul perechilor de valori,
- , x y sunt abaterea medie pătratică pentru X, respectiv Y.
Comparând relaţia de determinare a coeficientului de regresie cu cea a
coeficientului de corelaţie se constată că între aceşti indicatori există următoarea
legătură:
(,)x
y

XY



din care rezultă că semnul coeficientului de corelaţie coincide cu semnul
coeficientului de regresie, deoarece x , 0 y .10
Valoarea coeficientului de corelaţie este cuprinsă între -1 şi +1, mai simplu
scris:
11.
În funcţie de valoarea coeficientului de corelaţie avem următoarele concluzii:
Dacă 0,1, atunci între cele două variabile există o legătură perfectă pozitivă,
și anume creșterea variabilei independente X duce la o creștere a variabilei dependente
Y. Dacă 1, atunci avem o legătură puternică.
10 Jaba, E., Jemma, D. - Econometrie, Editura Sedcom Libris, Iaşi, 2006;
35
Dacă 1,0, atunci între cele două variabile există o legătură perfectă
negativă, și anume creșterea variabilei independente X duce la o scădere a variabilei
dependente Y.
Dacă 0 , atunci între cele două variabile nu există o legătură, așadar
variabilele X și Y sunt necorelate.
Coeficientul de corelaţie este estimat. Estimarea coeficientului de corelaţie
se notează cu ˆ şi este definit de relaţia:
ˆ( , ) ˆ
ˆ
x
y

XY


.
Coeficientul de corelaţie empiric a lui K. Pearson la nivelul unui eşantion n
este definit de relaţia:
1
( )( )
cov( , )
x
n
ii
i
y
xyxy
xXyY
XY
n






sau

x
2222

iiii
y
iiii
nxyxy
nxxnyy







, i 1,n .
Testarea coeficientului de corelaţie se face în scopul de a verifica dacă
variabila factorială considerată (X) influenţează semnificativ variaţia variabilei
rezultative (Y).11
Etapele testării coeficientului de corelaţie când avem două variabile , una
independentă și cealaltă dependentă, sunt:
definirea ipotezelor:
H0 : 0 (între X și Y nu există o relație de dependență și anume
ambele sunt independente și anume necorelate)
H1 : 0 (între X și Y există o relație de dependență)
pragului de semnificaţie p: p 0.05. Se presupune acceptată ipoteza H0 .
alegerea statisticii test. Se foloseşte statistica Student cu ( n – 2 ) grade de
libertate şi este definită de raportul:
2
ˆ
ˆˆ2
ˆ1ˆ
tn






,
unde: ˆ ˆeste estimatorul abaterii medii pătratice a lui ˆ .
determinarea valorii calculate a testului calc t .
citirea valorii teoretice a testului p/2;n 2 t 
decizia:
1. Dacă calc p/2;n 2 t t sau calc p/2;n 2 t t , atunci se respinge ipoteza H0,
adică se acceptă H1 : 0 , cu probabilitatea de (1p) . Aşadar, cele
două variabile sunt corelate semnificativ Coeficientul de corelaţie este
semnificativ statistic.
11 Jaba, E., Jemma, D. - Econometrie, Editura Sedcom Libris, Iaşi, 2006;
36
2. Dacă /tcalc tp 2;n2 ,tp/2;n2 , atunci acceptă ipoteza H0, cu
probabilitatea de (1p) . Aşadar, între cele două variabile nu există o
legătură semnificativă.
Raportul de corelaţie este un parametru care exprimă intensitatea legăturii
dintre cele două variabile a modelului de regresie sau mai exact măsoară ponderea
variaţiei explicată prin linia de regresie în variaţia totală12, se notează cu (în
aplicația SPSS cu R) şi este definit de relaţia:
2
2
yx
y




sau
2
/
2 1 y yx
y




.
unde:

2
2 ()i
y
yY
n

, este varianta generală, respectiv varianţa variabilei Y în
raport cu media tuturor valorilor;

2
2 ()i
x
xY
y
y
n



, este varianţa valorilor teoretice faţă de media lor
(varianţa sub influenţa factorilor esenţiali);

2
2
/
( )i
x
ix
yy
yy
n

, varianţa valorilor reale faţă de valorile teoretice ale
variabilei (varianta reziduală).
Varianta generală este egală cu suma celorlalte două varianţe componente:
222

y y y / y .


x x

Valoarea raportului de corelaţie este un număr cuprins în intervalul 0 şi +1,


mai simplu scris:
0 1.
Raportul de corelaţie se poate estima. Estimarea raportul de corelaţie se
notează cu yx şi este definit de relaţia:
2
111
2
2
11
ˆˆ1
1x
nnn
iiii
iii
ynn
ii
ii
yxyy
n
yy
n











.
Într-un sondaj statistic, la nivelul unui eşantion observat, se poate determina
raportul de corelaţie pe baza valorilor empiricefolosind formula anterioară.
Etapele testării raportul de corelaţie sunt:
definirea ipotezelor:
H0 : 0
H1 : 0
pragului de semnificaţie p. Se presupune acceptată ipoteza H0 .
12 Jaba, E., Jemma, D. - Econometrie, Editura Sedcom Libris, Iaşi, 2006;
37
alegerea statisticii test. Se foloseşte statistica Fisher cu 1 şi n – 2 grade de
libertate şi este definită astfel:
2
2
ˆ
( 2)

Fn



.
determinarea valorii calculate a testului, calc F .
citirea valorii teoretice a testului p;1;n 2 F din tabela lui Fisher
decizia: Dacă calc p;1;n 2 F F , atunci se respinge ipoteza H0, adică se acceptă H1 :
0 , cu probabilitatea de (1p) . Aşadar, cele două variabile sunt corelate
semnificativ. Raportul de corelaţie este semnificativ statistic.
Raportul de determinaţie este valoarea la pătrat a raportului de corelaţie, se
notează cu 2 (în aplicația SPSS cu R2) şi este definit de relaţia:
2
2
2
yx
y





şi arată ponderea influenţei factorului X asupra variaţiei variabilei Y13.
Studiu de caz
După introducerea datelor în SPSS ne dorim să le modelăm. Considerăm
datele:
Evoluţia variabilelor
În analiza noastră am considerat două variabile X – variabila independentă și
Y – variabila dependentă.
Pentru a determina parametrii modelului de regresie liniară simplă parcurgem
următorii pași: meniul Analyze comanda Regression opțiunea Linear și se
deschide fereastra de dialog Linear Regression, unde selectăm variabilele și le mutăm
13 Jaba, E., Jemma, D. - Econometrie, Editura Sedcom Libris, Iaşi, 2006;
38
în zonele de lucru considerate, după care activăm butoanele Statistics, Plots... și Save,
iar ultima etapă este activarea butonului OK.
Dacă activăm butonul de comandă Statistics atunci bifăm ce ne interesează
pentru analiza statistică, după care activăm butonul Continue:
Activând butonul de comandă Plots selectăm și mutăm în zona Y – SRESID și
în zona X – ZPRED și bifăm Histograma și Normal probability plot, după care
activăm butonul Continue:
Activând butonul de comandă Save bifăm Unstandardized în zonele Predicted
Values și Residual și Mean din zona Prediction Intervals, după care activăm butonul
Continue:
39
Prin activarea butonului OK se determină valorile estimate în Data Editor și
output-ul în fereastra de rezultate. În foaia Data View din fișierul Data Editor
aplicația SPSS complectează pe coloane valorile estimate pentru variabila dependentă
(coloana 3) , valorile reziduale (coloana 4) și limitele inferiare și superioare ale
intervalului de încredere (coloanele 5 și 6)
40
Fereastra de rezultate conține: Descriptive Statistics, Correlations, Variables
Entered/Removed, Model Summary, ANOVA, Coefficients, Residuals Statistics,
Histogram, Normal P-P Plot of Regression Standardized Residual, Scateerplot.
Variabilele modelului de regresie sunt prezentate în tabelul Variables
Entered/Removed: X este variabila independentă şi Y este variabila dependentă.
În tabelul Model Summary avem determinați: coeficientul determinație
(coloana 2), raporul de determinație (coloana 3), valoarea ajustată a lui R (coloana 4),
eroarea standard a estimației (coloana 5) și coeficientul Durbin-Watson (coloana 6).
41
Valoarea coeficientului de corelație, R = 0.721, arată dacă există sau nu o
corelație între variabilele analizate pe baza modelului liniar. Pentru a interpreta
modelul folosim raportul de determinație R2 = 0.520, așadar pentru modelul folosit,
regresia simplă liniară, variația variabilei independentă explică 52% din variația
variabilei dependente.
Tabelul ANOVA prezintă estimaţiile celor două componente ale variaţiei,
gradele de libertate corespunzătoare, estimaţiile varianţelor explicată şi reziduală,
valoarea calculată a raportului Fischer şi semnificaţia testului.
Din tabelul ANOVA, componentele variaţiei sunt prezentate pe coloana a
doua altfel:
- Regression Sum of Squares reprezintă variaţia explicată estimată şi are o valoare
de 3.547E+10;
- Residual Sum of Squares reprezintă variaţia reziduală estimată şi are o valoare de
3.273E+10;
- Total Sum of Squares reprezintă variaţia totală estimată şi are o valoare de
6.820E+10.
Pentru eşantionul analizat ( N 26 ) avem gradele de libertate corespunzătoare
în tabel pe coloana 3:
11
24
1 25
k
Nk
N



Valoarea coeficientul Fisher este F 26.016 . Din tabelul ANOVA, valoarea
Sig. pentru testul F este mai mică decât 0.05, adică modelul construit explică
dependenţa dintre variabile printr-o legătură liniară, care este considerată
semnificativă.
Parametrii modelului de regresie simplă lineară sunt determinați în tabelui
Coefficients pe coloana 2:
42
Ecuaţia estimată este:
y 30602.14128.812 x (3.2.3)
Deoarece Sig. asociat testului z pentru testarea ordonatei la origine este mai
mică decât riscul asumat de 0.05 se respinge ipoteza H0. Aşadar, ordonata la
origine este semnificativ diferită de zero. La o creştere cu o unitate a lui x, y creşte în
medie cu 28.812 unități. Din tabelul Coefficients avem 5.101 x t (coloana 5), iar
valoarea Sig. (coloana 6) pentru testul t este mai mică decât 0.05, așadar se respinge
ipoteza H0, și se acceptă ipoteza H1 adică coeficientul de regresie este considerat
semnificativ diferit de 0. Conform tabelului Coefficients, cu o probabilitate de 0.95
parametrul şi respectiv al modelului nostru este acoperit de intervalul
(5848.985,55355.297) şi respectiv 17.154,40.471) (coloanele 7 și 8).
Tabelul Residuals Statistics ne prezintă informații despre rezidu, iar valorile
minine și maxime ale rezidului sunt cele mai importante. Valoarea cea mai mică a
rezidului, -41976.2969, iar valoarea cea mai mare este 112822.5859.
Histograma este un echivalent cu graficul tabelului de frecvență și trebuie să
urmeze o distribuție normală.
43
Diagrama P-P Plot vizualizează diferențele dintre o distribuție empirică și
anume evoluția reziduală și distribuție teoretică specifică reprezentând dreapta lui
Henry. Această diagramă ne arată că sunt respectate ipotezele analizei efectuate
Pentru a determina graficul modelului de regresie simplă liniară parcurgem
următorii pași: meniul Analyze comanda Regression opțiunea Curve
Estination... și se deschide fereastra de dialog Curve Estination, unde selectăm
variabilele și le mutăm în zonele de lucru considerate, după care activăm butonul
Linear, iar ultima etapă este activarea butonului OK.
44
Astfel avem graficul regresiei liniare:
45
3.2. Modele de regresie neliniare simple
În practica economică există şi modele de regresie neliniare, dintre care
amintim:
Modelul reciproc sau hipebolic sau invers sau curba lui Philips;
Modele polinomiale;
Modelul logarithmic;
Modele semi-logaritmice.
3.2.1 Modelul reciproc
Modelul reciproc sau hiperbolic sau invers sau curba lui Philips este un model
econometric de regresie neliniară şi exprimă legătura dintre variabila dependentă şi
cea independentă printr-o funcţie hiperbolică şi este folosit în special pentru a descrie
relaţia dintre inflaţie şi şomaj.
Acest model are ecuaţia de forma:
Y
X

,
unde:
- Y reprezintă variabila dependentă, de forma 1 2 ( , , , ) n Y y y y ;
- X reprezintă variabila independentă, de forma 1 2 ( , , , ) n X x x x ;
- reprezintă valoarea limită pe care o atinge variabila dependentă Y, atunci când
valoarea variabilei independente cresc la infinit;
- reprezintă variaţia medie a variabilei dependente Y când variabila independentă
1
X
creştere cu o unitate.
dacă >0, atunci o creştere a lui X determină o descreştere a lui Y, aşadar
avem o dependenţă descrescătoare;
dacă <0, atunci o creştere a lui X determină o creştere a lui Y, aşadar avem o
dependenţă crescătoare .
Dacă considerăm un eşantion de volum n, atunci avem:
1
ii
i
y
x , i 1,n
La nivelul unui eşantion valoarea parametrilor de regresie se estimează pe
baza estimatorilor ˆ , ˆşi modelul de regresie se poate scrie pe baza acestor
estimatori astfel:
ˆˆ1i
i
y
x , i 1,n .
Pentru modelul de regresie reciproc, estimarea punctuală se pot determina
punctual cu ajutorul metodei celor mai mici pătrate. Aplicând metoda celor mai mici
pătrate, determinăm estimaţiile parametrilor modelului reciproc astfel:
46
2
1111
2
2
11
111
2
2
11
111
ˆ
11
11
ˆ
11
nnnn
ii
iiiiiii
nn
iiii
nnn
ii
iiiii
nn
iiii
yy
xxx
n
xx
nyy
xx
n
xx























Studiu de caz
Considerăm aceleași valori a variabilelor de la primul Studiu de caz
În analiza noastră am considerat două variabile X – variabila independentă și Y
– variabila dependentă.
Pentru a determina parametrii modelului de regresie simplă reciprocă
parcurgem următorii pași: meniul Analyze comanda Regression opțiunea
Curve Estination... și se deschide fereastra de dialog Curve Estination, unde selectăm
variabilele și le mutăm în zonele de lucru considerate, după care activăm butoanele
Inverse, Display ANOVA table și Save, iar ultima etapă este activarea butonului OK.
Dacă activăm butonul de comandă Save atunci bifăm ce ne interesează pentru
analiza statistică, după care activăm butonul Continue:
Prin activarea butonului OK se determină valorile estimate în Data Editor și
output-ul în fereastra de rezultate. În foaia Data View din fișierul Data Editor
aplicația SPSS complectează pe coloane valorile estimate pentru variabila dependentă
47
(coloana 3Fit for Y with X from CURVEFIT, MOD_1 INVERSE) , valorile reziduale
(coloana 4) și limitele inferiare și superioare ale intervalului de încredere (coloanele 5
și 6)
Fereastra de rezultate conține: Descriptive Statistics, Correlations, Variables
Entered/Removed, Model Summary, ANOVA, Coefficients, Residuals Statistics,
Histogram, Normal P-P Plot of Regression Standardized Residual, Scateerplot.
Descrierea modelului, mărimea eșationului și variabilele sunt prezentate în
tabelele de mai jos:
48
Variabilele modelului de regresie sunt prezentate în tabelul Variables
Entered/Removed: X este variabila independentă şi Y este variabila dependentă.
În tabelul Model Summary avem determinați: coeficientul determinație
(coloana 1), raporul de determinație (coloana 2), valoarea ajustată a lui R (coloana 3),
eroarea standard a estimației (coloana 4) și coeficientul Durbin-Watson (coloana 5).
Valoarea coeficientului de corelație, R = 0.573, arată dacă există sau nu o
corelație între variabilele analizate pe baza modelului invers. Se observă că valoarea
acestuia este mai mică decât 0.750, așadar intersitatea legăturii între cele variabile nu
este mare dacă folosim modelul invers. Pentru a interpreta modelul folosim raportul
de determinație R2 = 0.328, așadar pentru modelul folosit, regresia simplă inversă,
variația variabilei independentă explică 32.8% din variația variabilei dependente.
Tabelul ANOVA prezintă estimaţiile celor două componente ale variaţiei,
gradele de libertate corespunzătoare, estimaţiile varianţelor explicată şi reziduală,
valoarea calculată a raportului Fischer şi semnificaţia testului.
Din tabelul ANOVA, componentele variaţiei sunt prezentate pe coloana a
doua altfel:
- Regression Sum of Squares reprezintă variaţia explicată estimată şi are o valoare
de 2.238E+10;
- Residual Sum of Squares reprezintă variaţia reziduală estimată şi are o valoare de
4.582E+10;
- Total Sum of Squares reprezintă variaţia totală estimată şi are o valoare de
6.820E+10.
Pentru eşantionul analizat ( N 26 ) avem gradele de libertate corespunzătoare
în tabel pe coloana 3:
49
11
24
1 25
k
Nk
N



Valoarea coeficientul Fisher este F 11.724 . Din tabelul ANOVA, valoarea
Sig. pentru testul F este mai mică decât 0.05, adică modelul construit explică
dependenţa dintre variabile printr-o legătură liniară, care este considerată
semnificativă.
Parametrii modelului de regresie simplă lineară sunt determinați în tabelui
Coefficients pe coloana 2:
Ecuaţia estimată este:
y 106815.560 19480562.8 1
x 
Deoarece Sig. asociat testului z pentru testarea ordonatei la origine este mai
mică decât riscul asumat de p 0.05 se respinge ipoteza H0. Aşadar, ordonata la
origine este semnificativ diferită de zero. La o creştere cu o unitate a lui 1
x
, y scădea
în medie cu 19480562.8 unități. Din tabelul Coefficients avem 1/ 3.424 x t 
(coloana 5), iar valoarea Sig. (coloana 6) pentru testul t este mai mică decât 0.05,
așadar se respinge ipoteza H0, și se acceptă ipoteza H1 adică coeficientul de regresie
este considerat semnificativ diferit de 0.
Graficul regresiei neliniare inverse este:
50
Pentru a determina histograma parcurgem următorii pași: meniul Transform
comanda Compute Variable... și se deschide fereastra de dialog Compute
Variable unde definim o nouă variabilă invx, unde invx 1
x , iar ultima etapă este
activarea butonului OK.
Astfel, în foaia Data View din fișierul Data Editor aplicația SPSS
complectează pe coloane nouă valoare invx(coloana 3) , iar în Variable View apare
această nouă variabilă pe liniar 3.
51
Parcurgând aceste etape se tranformă regresia neliniară într-o regresie liniară
și parcurgem etapele de la regresia liniară având ca variabilă independentă invx 1
x
Obținem Histograma:
52
Diagrama P-P Plot vizualizează diferențele dintre o distribuție empirică și
anume evoluția reziduală și distribuție teoretică specifică reprezentând dreapta lui
Henry. Această diagramă ne arată că sunt respectate ipotezele analizei efectuate
3.2.2 Modele polinomiale
Modelele de regresie neliniare care exprimă legătura dintre variabila
dependentă şi cea independentă printr-o funcţie polinomială de grad mai mare sau
egal cu doi se numesc modelele polinomiale. În practica econometrică întâlnim două
tipuri de modele:
Modelul parabolic sau quadratic;
Modelul cubic.
53
3.2.2.1 Modelul parabolic sau quadratic
Modelul parabolic sau Quadratic este cel mai simplu model econometric de
regresie neliniară de tip polinomial şi exprimă legătura dintre variabila dependentă şi
cea independentă printr-o funcţie de gradul al doilea şi este folosit în special în
economie pentru explica relaţiei dintre costul unitar şi producţia realizată: costul
unitar scade concomitent cu creşterea producţiei până la un nivel optim al producţiei,
după care, dacă producţia continuă să crească, începe să crească şi costul unitar.
Acest model are ecuaţia de forma:
Y X X 2 .
unde:
- Y reprezintă variabila dependentă, de forma 1 2 ( , , , ) n Y y y y ;
- X reprezintă variabila independentă, , de forma 1 2 ( , , , ) n X x x x ;
- reprezintă valoarea limită pe care o atinge variabila dependentă Y, atunci când
valoareala variabilei independente este 0;
- şi reprezintă coeficienţi de regresie.
Dacă >0, atunci o creştere a lui X determină o descreştere a lui Y;
Dacă <0, atunci o creştere a lui X determină o creştere a lui Y.
Dacă 0, atunci parabola are un punct de minim.
Dacă 0 , atunci parabola are un punct de maxim.
Dacă considerăm un eşantion de volum n, atunci avem:
2

iiii y x x , i 1,n


La nivelul unui eşantion valoarea parametrilor de regresie se estimează pe
baza estimatorilor ˆ , ˆşi modelul de regresie se poate scrie pe baza acestor
estimatori astfel:
ˆ ˆ ˆ 2 i i i y x x , i 1,n .
Pentru calculul estimaţiilor parametrilor modelului parabolic la nivelul unui
eşantion n, aplicând metoda celor mai mici pătrate, se rezolvă sistemul:
2
111
23
1111
2342
1111
nnn
iii
iii
nnnn
iiiii
iiii
nnnn
iiiii
iiii
nxxy
xxxxy
xxxxy


















ˆ
ˆ
ˆ








3.2.2.2 Modelul cubic
Modelul cubic este un model econometric de regresie neliniară de tip
polinomial şi exprimă legătura dintre variabila dependentă şi cea independentă printro
funcţie de gradul al treilea şi este folosit pentru descrierea relaţiei dintre costul total
şi valoarea producţiei. Aceste model are ecuaţia:
Y X X 2 X 3 .
54
unde:
- Y reprezintă variabila dependentă, de forma Y ( y1, y2 , , yn ) ;
- X reprezintă variabila independentă, de forma 1 2 ( , , , ) n X x x x ;
- reprezintă valoarea limită pe care o atinge variabila dependentă y , atunci când
valoarea variabilei independente este 0;
- ,şi reprezintă coeficienţi de regresie
Prin derivarea funcţiei cubice (1) obţinem funcţia cuadrică de forma:
Dacă considerăm un eşantion de volum n, atunci avem:
23

iiiii y x x x , i 1,n


La nivelul unui eşantion valoarea parametrilor de regresie se estimează pe
baza estimatorilor ˆ , ˆşi modelul de regresie se poate scrie pe baza acestor
estimatori astfel:
ˆ ˆ ˆ 2 ˆ 3 i i i i y x x x , i 1,n .
Pentru calculul estimaţiilor parametrilor la nivelul unui eşantion n, aplicând
metoda celor mai mici pătrate, se rezolvă sistemul:
23
1111
234
11111
23452
11111
34563
11111
nnnn
iiii
iiii
nnnnn
iiiiii
iiiii
nnnnn
iiiiii
iiiii
nnnnn
iiiiii
iiiii
nxxxy
xxxxxy
xxxxxy
xxxxxy
























ˆ
ˆ
ˆ
ˆ










3.2.3 Modelul logarithmic
Modelul logarithmic este modelul econometric de regresie neliniar în care
variabila independentă este logaritmată. Aceste model are ecuaţia:
Y ln X , x 0
unde:
- Y reprezintă variabila dependentă, de forma 1 2 ( , , , ) n Y y y y ;
- X reprezintă variabila independentă, de forma 1 2 ( , , , ) n X x x x ;
- reprezintă valoarea medie a variabilei dependentă Y, când valoarea variabilei
independente este 1;
- reprezintă valoarea medie absolută a variabilei dependentă Y la o variaţie
procentuală a variabilei independente X.
Graficul modelului compound este o curbă, astfel reprezentată:
Dacă 0 , atunci avem o curbă crescătoare
55
Dacă 0 , atunci avem o curbă descrescătoare
Dacă considerăm un eşantion de volum n, atunci avem:
ln i i i y x , i 1,n
La nivelul unui eşantion valoarea parametrilor de regresie se estimează pe
baza estimatorilor ˆ , ˆşi modelul de regresie se poate scrie pe baza acestor
estimatori astfel:
ˆ ˆ ln i i y x , i 1,n .
Aplicând metoda celor mai mici pătrate, pentru un eşantion n observat se
obţine sistemul:
11
2
111
ln
ln (ln ) (ln )
nn
ii
ii
nnn
iiii
iii
nxy
xxxy












Pentru modelul de regresie logarithmic, estimarea punctuală se pot determina
punctual cu ajutorul metodei celor mai mici pătrate. Aplicând metoda celor mai mici
pătrate, determinăm estimaţiile parametrilor modelului logarithmic astfel:
2
1111
2
2
11
111
2
2
11
(ln ) ln (ln )
ˆ
(ln ) ln
(ln ) ln
ˆ
(ln ) ln
nnnn
iiiii
iiii
nn
ii
ii
nnn
iiii
iii
nn
ii
ii
yxxxy
nxx
nxyxy
nxx





















56
3.2.3. Modele semi-logaritmice
Modele semi-logaritmice sunt modelele econometrice de regresie neliniară
care aduse la forma liniarizată conțin variabile logaritmate. Aceste modele estimează
variaţia relativă sau absolută a variabilei dependente X la o variaţie absolută sau
relativă cu o unitate a variabilei independente Y. În practica econometrică avem
următoarele tipuri de modele:
Modelul power;
Modelul compound (compus);
Modelul exponential;
Modelul Growth;
Modelul exponenţial decay;
Modelul logistic.
3.2.3.1. Modelul Power
Modelul Power (putere) are ecuaţia:
Y X 
unde:
- Y reprezintă variabila dependentă, de forma 1 2 ( , , , ) n Y y y y ;
- X reprezintă variabila independentă , de forma 1 2 ( , , , ) n X x x x ;
- reprezintă valoarea medie a variabilei dependentă Y, când valoarea variabilei
independente este 1;
- reprezintă coeficientul de regresie.
Dacă considerăm un eşantion de volum n, atunci avem:
i i y x, i 1,n
La nivelul unui eşantion valoarea parametrilor de regresie se estimează pe
baza estimatorilor ˆ , ˆşi modelul de regresie se poate scrie pe baza acestor
estimatori astfel:
ln ln ˆ ˆ ln i i y x , i 1,n .
Pentru calculul estimaţiilor parametrilor la nivelul unui eşantion n, aplicând
metoda celor mai mici pătrate, se rezolvă sistemul:
11
2
111
ln ln ln
ln ln (ln ) ln ln
nn
ii
ii
nnn
iiii
iii
nxy
xxxy












11
111
2
2
11
ln 1 ln 1 ln ln
ln ln ln ln
(ln ) ln
nn
ii
ii
nnn
iiii
iii
nn
ii
ii
yx
nn
nxyxy
nxx

















57
3.2.3.2. Modelul Compound
Modelul Compound (Compus) are ecuaţia:
Y X , Y, , 0 ,
unde:
- Y reprezintă variabila dependentă care este o caracteristică rezultativă, de forma
1 2 ( , , , ) n Y y y y ;

- x reprezintă variabila independentă , de forma 1 2 ( , , , ) n X x x x ;


- reprezintă valoarea medie a variabilei dependentă Y, când valoarea variabilei
independente este 0;
- reprezintă coeficientul de regresie.
Graficul modelului compound este o curbă, astfel reprezentată:
Dacă 0 și 0 1 , atunci avem o curbă descrescătoare
Dacă 0 și 0 1 , atunci avem o curbă crescătoare
Dacă considerăm un eşantion de volum n, atunci avem:
xi

i y , i 1,n
La nivelul unui eşantion valoarea parametrilor de regresie se estimează pe
baza estimatorilor ˆ , ˆşi modelul de regresie se poate scrie pe baza acestor
estimatori astfel:
ln ln ˆ ln ˆ i i y x , i 1,n .
Aplicând metoda celor mai mici pătrate, pentru un eşantion observat se obţine
sistemul:
58
11
2
111
ln ln ln
ln ln ln
nn
ii
ii
nnn
iiii
iii
nxy
xxxy












11
111
2
2
11
ln 1 ln 1 ln ln
ln ln
ln ln
nn
ii
ii
nnn
iiii
iii
nn
ii
ii
yx
nn
nxyxy
nxx

















3.2.3.3. Modelul exponențial
Modelul exponențial are ecuaţia:
Y eX , y,0
unde :
- Y reprezintă variabila dependentă, de forma 1 2 ( , , , ) n Y y y y ;
- X reprezintă variabila independentă, de forma 1 2 ( , , , ) n X x x x ;
- reprezintă valoarea medie a variabilei dependentă Y, când valoarea variabilei
independente este 0;
- reprezintă coeficientul de regresie.
Modelul exponențial se folosește când se studiază creșterea populației ,
dezintegrarea radioactivă.
Graficul modelului exponenția este o curbă, astfel reprezentată:
Dacă 0 și0 , atunci avem o curbă crescătoare
Dacă 0 și 0 , atunci avem o curbă descrescătoare.
Dacă considerăm un eşantion de volum n, atunci avem:
59
xi

iy e, i 1,n
La nivelul unui eşantion valoarea parametrilor de regresie se estimează pe
baza estimatorilor ˆ , ˆşi modelul de regresie se poate scrie pe baza acestor
estimatori astfel:
ln ln ˆ ˆ i i y x , i 1,n .
Aplicând metoda celor mai mici pătrate, pentru un eşantion n observat se
obţine sistemul:
11
2
111
ln ln
ln ln
nn
ii
ii
nnn
iiii
iii
nxy
xxxy












ln 2 ln
22
ln ln
iii
ii
i
xyxyx
xn
iiii
ii
e sau e
xynxy
xnx













3.2.3.4. Modelul Growth
Modelul Growth (de Creştere) are ecuaţia:
Y eX 
unde:
- Y reprezintă variabila dependentă, de forma 1 2 ( , , , ) n Y y y y ;
- X reprezintă variabila independentă, de forma 1 2 ( , , , ) n X x x x ;
- ereprezintă valoarea medie a variabilei dependentă Y, când valoarea variabilei
independente este 0;
Rezumat
Noţiuni importante: modelul liniar simplu, modelul de regresie liniar simplu,
parametrii ecuaţiei de regresie, coeficientul de corelaţie, coeficientul de determinaţie,
raportul de corelaţie, modelul neliniar simplu, model liniarizabil.
Formule importante: ecuaţia de regresie, estimarea punctuală a parametrilor de
regresie, estimarea prin interval de încredere, testarea parametrilor modelului,
determinarea intervalului de încredere, estimarea coeficientului de corelaţie, testarea
coeficientului de corelaţie, test t, coeficientul de determinaţie, estimarea raportului de
corelaţie, testarea raportului de corelaţie, ecuaţia estimată a modelului de regresie de
tip hiperbolic, ecuaţia estimată a modelului de regresie de tip exponenţial, ecuaţia
estimată a modelului de regresie de tip putere, ecuaţia estimată a modelului de
regresie de tip parabolic.
60
Referat nr.1
Elaborați un referat utilizând o situație concretă din economie, analizând astfel
fenomene economice reale folosind regresia simplă. (Se utilizează date concrete de pe
diferite site-uri.) Identificați fenomenele economice, culegeți date, modelați și
analizați particularitățile fiecărui fenomen folosind SPSS.
Exemplu:
Într-o economie de piaţă, investitorii financiari sunt permanent interesaţi de
evoluţia acţiunilor, obligațiunilor sau alte instrumente financiare la bursa de valori.
Valorile (sau bunurile) tranzacționate pe o bursă de valori includ acțiuni emise de
firmele cotate la bursă, instrumente financiare derivate, obligațiuni, precum și produse
financiare agregate de la mai mulți investitori. Bursele de valori funcționează ca o
"licitație continuă", în care cumpărătorii și vânzătorii efectuează tranzacții într-o
locație central și ele trebuiesc mai întâi listate pe acea bursă. În trecut exista o locație
centrală în care se ținea evidența valorilor, dar în bursele moderne evidența se ține în
mod electronic, ceea ce oferă avantaje precum viteză sporită și cost redus de
tranzacții. Schimbul comercial la bursă este permis numai brokerilor, care sunt
membri ai bursei. Recent, o parte din tranzacțiile de pe bursele tradiționale s-a mutat
către diverse alte medii precum rețele de comunicații electronice, burse private
(denumite și "dark pools" datorită lipsei transparenței) sau sisteme alternative de
tranzacționare. Bursa de valori este de multe ori cea mai importantă componentă a
pieței de valori. Cererea și oferta pe piețele bursiere sunt determinate de diverși factori
care, la fel ca în toate piețele libere, afectează prețul acțiunilor.
În România, fiind o perioadă de recesiune economică, valoarea cursului de
tranzacţionare a acţiunilor sau obligațiunilor la bursă a avut variaţii haotice.
Consultând datele oferite de Bursa de Valori Bucureşti, alegeți o firmă cotată la bursa
de valori, obsevați variaţia cursului acţiunilor sau obligațiunilor și previzionați
evoluția acestora.
61
Unitatea de învăţare IV.
Modelul multifactorial de regresie
În acest capitol, este prezentat modelul de regresie multiplă ca o generalizare a
modelului de regresie simplă. Acesta conţine o variabilă dependentă şi mai multe
variabile independente. Între variabila dependent şi variabilele independente poate
exista o legătură de tip liniar sau una neliniară.
4.1. Modelul de regresie liniară multiplă
4.1.1. Prezentarea problemei şi ipotezele modelului
Modelul de regresie liniar multiplu conţin o variabilă dependentă şi mai multe
variabile independente, între care exista o legătură de tip liniar. Forma generală a unui
model de regresie liniară multiplă este:
Y 1 X1 2 X2 ...k Xk (4.1.1.1)
unde:
Y este variabila dependentă, de forma 1 2 ( , , , ) n Y y y y ;
, 1, j X j k sunt variabile independente, de forma 1 2 , ,..., j j j jn X x x x ;
este variabila aleatoare eroare (reziduu);
, , 1, j j k sunt coeficienţii sau parametri de regresie.
Modelarea unui model de regresie liniar multiplu se realizează în următoarele
ipoteze:
normalitatea erorilor,
homoscedasticitate,
necorelarea erorilor,
lipsa corelaţiei dintre variabilele independente şi variabila eroare;
lipsa coliniarităţii sau a unei legături liniare între variabilele
independente.
4.1.2. Estimarea parametrilor modelului de regresie liniar
multiplu
Parametrii modelului de regresie oferă informaţii despre modificarea variabilei
dependentă. În practică, pentru determinarea parametrilor se consideră datele de
nivelul unui eşantion de volum n. În aceste condiţii pentru modelul de regresie liniară
62
multiplă (4.1.1.1) se determină estimarea parametrilor modelului de regresie. Fie
ecuaţia estimată a modelului de regresie liniară multiplă:
1 2... 1122

ˆ ˆ ˆ ˆ ... ˆ X X k k Y X X X


unde:
1 2 , ,..., n Y y y y
1 2 , ,..., j j j jn X x x x , j 1, k
1 2 , ,..., n
Pentru modelul de regresie liniară multiplă, estimarea punctuală se pot
determina punctual cu ajutorul metodei celor mai mici pătrate rezolvând sistemul:
11
2
11111
2
11
ˆ ˆ ... ˆ
ˆ ˆ ... ˆ
........................................................................
ˆ ˆ ... ˆ
i k ki i
ii
i i k i ki i i
iiii
ki i ki k ki ki i
iiii
nxxy
xxxxxy
xxxxxy















Dacă considerăm cazul particular, un model de regresie liniară multiplă cu
două variabile independente, de forma:
1 1 2 2 Y X X , (4.1.2.1)

unde:
1 2 , ,..., n Y y y y
1 11 12 1 , ,..., n X x x x
2 21 22 2 , ,..., n X x x x
1 2 , ,..., n
cu ecuaţia estimată de forma:
1122

Yˆ ˆ ˆ X ˆ X ,


atunci pentru un eşantion de volum n, avem
1122

ˆ ˆ ˆ ˆ i i i y x x , i 1,n .


Pentru modelul de regresie liniară multiplă cu două variabile independente,
estimările punctuale se pot determina punctual cu ajutorul metodei celor mai mici
pătrate, rezolvând sistemul:
1122
2
1112121
2
2112222
ˆˆˆ
ˆˆˆ
ˆˆˆ
iii
ii
iiiiii
iiii
iiiiii
iiii
nxxy
xxxxxy
xxxxxy













63
4.1.2. Testarea parametrilor şi a modelului
Fie modelul de regresie liniară multiplă de forma (4.1.2.1). Testarea
parametrilor modelului de regresie liniară multiplă se realizează cu ajutorul testului
Student.
Etapele testării semnificaţiei coeficientului de regresie sunt:
definirea ipotezelor:
H0 : j 0 , j 1,2
H1 : 0 j , j 1,2
alegerea pragului de semnificaţie p.
alegerea statisticii test. Se foloseşte statistica Student definită de raportul:
ˆ
ˆ
(0,1)
j
jj
j tN




, j 1,2 ,
unde pentru ˆ
j , estimatorul varianţei este:
12
2

22
ˆˆ
j ( ) (1 )
ji j x x
i
xx







determinarea valorii calculate a testului. În ipoteza H0, statistica Student devine
j,
ˆ
ˆ
( 3)
j
j
calc ttn



, j 1,2 .
citirea valorii teoretice a testului. Pentru un prag de semnificaţie p, se citeşte din
tabelul Student o valoare teoretică a testului p/2;n 3 t .
decizia:
1. Dacă j,calc p/2;n 3 t t sau j,calc p/2;n 3 t t , atunci se respinge ipoteza H0,
adică se acceptă H1 : 0 j , j 1,2 , cu probabilitatea de (1p) .
Aşadar, variabila j X , j 1,2 influenţează semnificativ variabila Y.
2. Dacă j, /2; 3 /2; 3 , calc n n t t t , atunci acceptă ipoteza H0, cu
probabilitatea de (1p) . Aşadar, variabila j X , j 1,2 nu
influenţează semnificativ variabila Y.
4.1.4. Evaluarea calităţii modelului de regresie
Coeficientul de corelaţie multiplă măsoară intensitatea legăturii dintre
variabila dependentă Y şi variabilele independente j X , j 1,2 a modelului de
regresie liniară multiplă, se notează cu y x1x2 şi la nivelul unui eşantion este definit de
relaţia:
64
121212
12
12
22
2
2
1
yxyxyxyxxx
yxx
xx







unde:

1
11
2222
11
yx
nxyxy
nxxnyy








2
22
2222
22
yx
nxyxy
nxxnyy








12
1212
2222
1122
xx
nxxxx
nxxnxx







Dacă 1 2 0 x x , atunci 1 2 1 2
22

y x x y x y x .


sau de relaţia:
121 yx
yxx
y
y



unde:
12
21

1
1
xx
xx
y


;
12
112
221

1
1
1
yxyx
yxxyxx
xyxx
y




Coeficientul de corelaţie parţială sau bivalentă măsoară dependenţa dintre
variabile prin excluderea succesivă a influenţei celorlalţi factori (considerând
influenţa lor constantă) menţinând numai influenţa factorului măsurat14 şi se definesc
astfel:
Dacă variabila independentă 1 X este constantă, atunci coeficientul de corelaţie
dintre Y şi 2 X este:

2112
21
112

1 21 2
yxyxxx
yxx
yxxx

r





.
Dacă variabila independentă 2 X este constantă, atunci coeficientul de
corelaţie dintre Y şi 1 X este:

1212
12
212

1 21 2
yxyxxx
yxx
yxxx







;
Dacă variabila dependentă Y este constantă, atunci coeficientul de corelaţie
dintre 1 X şi 2 X este:
14 Jaba, E., Jemma, D. - Econometrie, Editura Sedcom Libris, Iaşi, 2006;
65

1212
12
12

1 21 2
xxyxyx
xxy
yxyx







.
Raportul de corelaţie multiplă este un parametru care exprimă intensitatea
legăturii dintre variabilele a modelului de regresie multiplă , se notează cu y x x şi
1 2

este definit de relaţia:


12
12
2
2
yxx
yxx
y





sau


1212
12
2
2
/
22 1 1 yyxxixx
yxx
yi
yy
yy








sau


12
2
1122
22
ˆˆˆ1
yxx1
yxyxyy
n
yy
n







Valoarea raportului de corelaţie multiplă este un număr cuprins în intervalul 0
şi +1, mai simplu scris:
1 2 ... 0 1 y x x .

Raportul de determinaţie multiplă sau coeficientul de determinaţie măsoară


influenţa simultană a variabilelor independente asupra variabilei dependente, se
notează cu 1 2
2

y x x ... şi este definit de relaţiile:


121212
12
12
22
2
2
2
1
yxyxyxyxxx
yxx
xx









12
12
2
2 ...
... 2 1 ixx
yxx
i
yy
yy






sau


12
2
11
2
... 2 2
... 1
1
n n nn n
yxx
aybxybxyy
n
yy
n






Raportul determinaţiei multiplă este un număr cuprins în intervalul 0 şi +1,
mai simplu scris:
12
2

0 1 y x x .
...

Raportul de determinaţie parţială măsoară influenţa separată a variabilelor


independente j X , j 1,2 asupra variabilei dependente.
66
Studiu de caz
După introducerea datelor în SPSS ne dorim să le modelăm. Considerăm
datele:
Evoluţia variabilelor
În analiza noastră am considerat patru variabile X1, X2, X3 – variabilele
independente și Y – variabila dependentă.
Pentru a determina parametrii modelului de regresie liniară simplă parcurgem
următorii pași: meniul Analyze comanda Regression opțiunea Linear și se
deschide fereastra de dialog Linear Regression, unde selectăm variabilele și le mutăm
în zonele de lucru considerate, după care activăm butoanele Statistics, Plots... și Save,
iar ultima etapă este activarea butonului OK.
Dacă activăm butonul de comandă Statistics atunci bifăm ce ne interesează
pentru analiza statistică, după care activăm butonul Continue:
67
Activând butonul de comandă Plots selectăm și mutăm în zona Y – SRESID și
în zona X – ZPRED și bifăm Histograma și Normal probability plot, după care
activăm butonul Continue:
Activând butonul de comandă Save bifăm Unstandardized în zonele Predicted
Values și Residual și Mean din zona Prediction Intervals, după care activăm butonul
Continue:
68
Prin activarea butonului OK se determină valorile estimate în Data Editor și
output-ul în fereastra de rezultate. În foaia Data View din fișierul Data Editor
aplicația SPSS complectează pe coloane valorile estimate pentru variabila dependentă
(coloana 3) , valorile reziduale (coloana 4) și limitele inferiare și superioare ale
intervalului de încredere (coloanele 5 și 6)
Fereastra de rezultate conține: Descriptive Statistics, Correlations, Variables
Entered/Removed, Model Summary, ANOVA, Coefficients, Residuals Statistics,
Histogram, Normal P-P Plot of Regression Standardized Residual, Scateerplot.
69
Variabilele modelului de regresie sunt prezentate în tabelul Variables
Entered/Removed: X1, X2, X3 sunt variabilele independente şi Y este variabila
dependentă.
În tabelul Model Summary avem determinați: coeficientul determinație
(coloana 2), raporul de determinație (coloana 3), valoarea ajustată a lui R (coloana 4),
eroarea standard a estimației (coloana 5) și coeficientul Durbin-Watson (coloana 6).
Valoarea coeficientului de corelație, R = 0.773, arată dacă există sau nu o
corelație între variabilele analizate pe baza modelului liniar. Pentru a interpreta
70
modelul folosim raportul de determinație R2 = 0.597, așadar pentru modelul folosit,
regresia simplă liniară, variația variabilei independentă explică 59,7% din variația
variabilei dependente.
Tabelul ANOVA prezintă estimaţiile celor două componente ale variaţiei,
gradele de libertate corespunzătoare, estimaţiile varianţelor explicată şi reziduală,
valoarea calculată a raportului Fischer şi semnificaţia testului.
Din tabelul ANOVA, componentele variaţiei sunt prezentate pe coloana a
doua altfel:
- Regression Sum of Squares reprezintă variaţia explicată estimată şi are o valoare
de 4.073E+10;
- Residual Sum of Squares reprezintă variaţia reziduală estimată şi are o valoare de
2.747E+10;
- Total Sum of Squares reprezintă variaţia totală estimată şi are o valoare de
6.820E+10.
Pentru eşantionul analizat ( N 26 ) avem gradele de libertate corespunzătoare
în tabel pe coloana 3:
13
22
1 25
k
Nk
N



Valoarea coeficientul Fisher este F 10.872 . Din tabelul ANOVA, valoarea
Sig. pentru testul F este mai mică decât 0.05, adică modelul construit explică
dependenţa dintre variabile printr-o legătură liniară, care este considerată
semnificativă.
Parametrii modelului de regresie simplă lineară sunt determinați în tabelui
Coefficients pe coloana 2:
Ecuaţia estimată este:
71
1 2 3 145498.923 y 21.323 x 0.160 x 19.351x (2.2.3)
Ordonatele la origine este semnificativ diferită de zero. Conorm ecuației
estimate a modelului de regresie multiplă putem concluziona:
Dacă x1 creşte cu o unitate, iar celelalte variabile rămân constante, atunci y
creşte în medie cu 28.812 unități.
Dacă x2 creşte cu o unitate, iar celelalte variabile rămân constante, atunci y
scade în medie cu 0.160 unități.
Dacă x3 creşte cu o unitate, iar celelalte variabile rămân constante, atunci y
scade în medie cu 19.351 unități.
Din tabelul Coefficients avem 1 3.268 x t (coloana 5), iar valoarea Sig. (coloana 6)
pentru testul t este mai mică decât 0.05, așadar se respinge ipoteza H0, și se acceptă
ipoteza H1 adică coeficientul de regresie este considerat semnificativ diferit de 0.
Așadar x1 influențează cel mai mult variabila dependentă y. Tot din coloana 5 avem
2 0.250 x t și 3 2.051 x t . Conform tabelului Coefficients, cu o probabilitate de

0.95 parametrii , 1 , 2 şi respectiv 3 ai modelului nostru sunt acoperiți de


intervalele (25160.905, 265836.941) , (7.793, 34.853), (-1.486, 1.166) şi respectiv
(38.921, 0.219) (coloanele 7 și 8).
Tabelul Residuals Statistics ne prezintă informații despre rezidu, iar valorile
minine și maxime ale rezidului sunt cele mai importante. Valoarea cea mai mică a
rezidului, -49036.2539, iar valoarea cea mai mare este 99794.49219.
Histograma este un echivalent cu graficul tabelului de frecvență și trebuie să
urmeze o distribuție normală.
72
Diagrama P-P Plot vizualizează diferențele dintre o distribuție empirică și
anume evoluția reziduală și distribuție teoretică specifică reprezentând dreapta lui
Henry. Această diagramă ne arată că sunt respectate ipotezele analizei efectuate
73
4.2. Modele de regresie neliniare multiple
În practica economică datorită complexităţii fenomenelor s-au elaborat modele
mult mai complicate cum ar fi modele neliniare multiple, dintre care amintim:
Modelul reciproc multiplu;
Modele polinomiale multiple;
Modelul logarithmic
Modele semi-logaritmice.
4.2.1 Modelul reciproc multiplu
Modelul reciproc multiplu este un model econometric de regresie neliniară
multiplă şi exprimă legătura dintre variabila dependentă şi mai multe variabilele
independente printr-o funcție inversă.
Ecuaţia de regresie pentru acest model este:
12
12
k
k
Ye
XXX

,
unde:
- Y reprezintă variabila dependentă, de forma 1 2 ( , , , ) n Y y y y ;
- j X , j 1, k reprezintă variabilele independente, de forma 1 2 , ,..., j j j jn X x x x ;
- reprezintă valoarea limită pe care o atinge variabila dependentă Y, atunci când
valoarea variabilelor independente cresc la infinit 1 0, 1, j
j
Xjk
X



- j , j 1, k reprezintă variaţia medie a variabilei dependente Y când variabila
independentă 1
jX

, j 1, k creştere cu o unitate.


dacă 0 j , atunci o creştere a lui j X determină o descreştere a lui Y, când
celelalte variabile independente j X , j1, k , j jrămân constante, aşadar
avem o dependenţă descrescătoare;
dacă 0 j , atunci o creştere a lui j X determină o creştere a lui Y, când
celelalte variabile independente j X , j1, k , j jrămân constante, aşadar
avem o dependenţă crescătoare .
4.2.2 Modele polinomiale multiple
Modelele polinomiale multiple sunt modelele de regresie neliniare și exprimă
legătura dintre variabila dependentă şi variabilele independente printr-o funcţie
polinomială multiplă de grad mai mare sau egal cu doi. În practica econometrică
întâlnim două tipuri de modele:
Modelul polinomial multiplu de gradul doi;
Modelul polinomial multiplu de gradul trei.
74
4.2.2.1 Modelul polinomial multiplu de gradul doi
Modelul polinomial multiplu de gradul doi exprimă legătura dintre variabila
dependentă şi variabilele independente printr-o funcţie multiplă de gradul al doilea.
Acest model are ecuaţia de forma:
222

1122kk1122kk Y X X X X X X .


unde:
- Y reprezintă variabila dependentă, de forma 1 2 ( , , , ) n Y y y y ;
- j X , j 1, k reprezintă variabilele independente, de forma 1 2 , ,..., j j j jn X x x x ;
- reprezintă valoarea limită pe care o atinge variabila dependentă Y, atunci când
valorile variabilelor independente este egale cu 0;
- j şi j , j 1, k reprezintă coeficienţi de regresie.
Dacă regresia are două variabile independente j X , j 1,2 , atunci graficul
este o paraboloid eliptic sau hyperbolic:
Dacă 0 j , j 1, k , atunci graficul regresiei are un punct de minim.
Dacă 0 j , j 1, k , atunci graficul regresiei are un punct de maxim.
4.2.2.2. Modelul polinomial multiplu de gradul trei
Modelul polinomial multiplu de gradul trei este un model econometric de
regresie neliniară multiplă de tip polinomial şi exprimă legătura dintre variabila
dependentă şi variabilele independente printr-o funcţie de gradul al treilea. Aceste
model are ecuaţia:
222
11221122
333
1122
kkkk
kk
YXXXXXX
XXX




.
unde:
- Y reprezintă variabila dependentă, de forma 1 2 ( , , , ) n Y y y y ;
- j X , j 1, k reprezintă variabilele independente, de forma 1 2 , ,..., j j j jn X x x x ;
- reprezintă valoarea limită pe care o atinge variabila dependentă Y, atunci când
valorile variabilelor independente sunt egale cu 0;
75
- j , j şi j , j 1, k reprezintă coeficienţi de regresie
Graficul pentru nu model de regresie polinomial multiplu de gradul trei cu
două variabile independente are forma neregulată ca în figurile:
4.2.3 Modelul logarithmic multiplu
Modelul logarithmic multiplu este modelul econometric de regresie neliniar
în care variabilele independente sunt logaritmate. Aceste model are ecuaţia:
1 1 2 2 ln lnX lnX k k Y X 

unde:
- Y reprezintă variabila dependentă, de forma 1 2 ( , , , ) n Y y y y ;
- j X , j 1, k reprezintă variabilele independente, de forma 1 2 , ,..., j j j jn X x x x ;
- reprezintă valoarea medie a variabilei dependentă Y, când valorile variabilelor
independente sunt egale cu 1;
- j , j 1, k reprezintă valoarea medie absolută a variabilei dependentă Y la o
variaţie procentuală a variabilei independente i x , când celelalte variabile
independente rămân constante.
76
4.2.4 Modele semi-logaritmice multiple
Modele semi-logaritmice multiple sunt modelele econometrice de regresie
neliniară multiple care aduse la forma liniarizată conțin variabile logaritmate. Aceste
modele estimează variaţia relativă sau absolută a variabilelor dependente X1, X2, ... ,
Xk la o variaţie absolută sau relativă cu o unitate a variabilei independente Y. Tipurile
de modele semi-logaritmice multiple sunt:
Modelul power multiplu;
Modelul compound (compus) multiplu;
Modelul exponential multiplu;
Modelul Growth multiplu;
Modelul exponenţial decay multiplu;
Modelul logistic multiplu.
Modelul Power multiplu (putere) are ecuaţia:
12
12
k

kY X X X 


unde:
- Y reprezintă variabila dependentă, de forma 1 2 ( , , , ) n Y y y y ;
- j X , j 1, k reprezintă variabilele independente, de forma 1 2 , ,..., j j j jn X x x x ;
- reprezintă valoarea medie a variabilei dependentă y , când valoarea variabilelor
independente este 1;
- j , j 1, k reprezintă coeficienți de regresie;
Expresia poate fi liniarizată prin logaritmare și astfel avem:
1 1 2 2 ln ln ln ln ... lnX k k Y X X 
Modelul Compound (Compus) multiplu are ecuaţia:
12
12
X X Xk

kY .
unde:
- Y reprezintă variabila dependentă, de forma 1 2 ( , , , ) n Y y y y ;
- j X , j 1, k reprezintă variabilele independente, de forma 1 2 , ,..., j j j jn X x x x ;
- reprezintă valoarea medie a variabilei dependentă Y, când valorile variabillor
independente sunt 0;
- j , j 1, k reprezintă coeficienții de regresie;
Expresia poate fi liniarizată prin logaritmare:
1 1 2 2 ln ln ln ln ... ln k k Y X X X 

Modelul exponential multiplu are ecuaţia:


Y e1 X1 2 X2 k Xk , y,0
unde:
- Y reprezintă variabila dependentă de forma 1 2 ( , , , ) n Y y y y ;
- j X , j 1, k reprezintă variabile independente, de forma 1 2 , ,..., j j j jn X x x x ;
77
- reprezintă valoarea medie a variabilei dependentă Y, când valoarea variabilei
independente este 0;
- j , j 1, k reprezintă coeficienții de regresie.
Expresia poate fi liniarizată prin logaritmare:
1 1 2 2 ln ln k k Y X X X

Modelul Growth (de Creştere) multiplu are ecuaţia:


Y e1 X12 X2 k Xk 
unde:
- Y reprezintă variabila dependentă, de forma 1 2 ( , , , ) n Y y y y ;
- j X , j 1, k reprezintă variabile independente, de forma 1 2 , ,..., j j j jn X x x x ;
- ereprezintă valoarea medie a variabilei dependentă Y, când valoarea variabilelor
independente este 0;
Expresia poate fi liniarizată prin logaritmare:
1 1 2 2 ln k k Y X X X

Rezumat
Noţiuni importante: model de regresie multiplă, coeficientul de corelaţie multiplă,
coeficientul de determinaţie multiplă, corelaţia parţială, modele neliniare multiple,
model putere, model polinomial.
Formule importante: estimarea parametrilor modelului de regresie multiplă, testarea
parametrilor şi modelului de regresie multiplă, coeficientul de corelaţie multiplă,
coeficientul de determinaţie multiplă, raportul de corelaţie multiplă, coeficientul de
corelaţie parţială, raportul determinaţiei totale, raportul determinaţiei parţiale.
Referat nr.2
Elaborați un referat utilizând o situație concretă din economie, analizând astfel
fenomene economice reale folosind regresia multiplă. (Se utilizează date concrete de
pe diferite site-uri.) Identificați fenomenele economice, culegeți date, modelați și
analizați particularitățile fiecărui fenomen folosind SPSS.
78
Bibliografie
[1] Andrei., T. – Statistică şi econometrie, Editura Economică , Bucureşti, 2004;
Andrei., T., Bourbonnais, R. – Econometrie, Editura Economică, Bucureşti, 2008;
[2] Fărcaş, P., Moleriu, R. – Elemente de probabilităţi şi teoria proceselor stochastice
cu aplicaţii în matematica financiară, Editura Albastră, Cluj-Napoca, 2006;
[3] Iacob, A. I., Tănăsoiu, O. – Modele econometrice, Volumul I, Editura ASE,
Bucureşti, 2005;
[4] Jaba, E., Statistica, Ediţia a treia, Editura Economică, Bucureşti, 2002;
[5] Jaba, E., Grama, A. - Analiza statistica cu SPSS sub Windows, Polirom, Iaşi, 2004;
[6] Jaba, E., Jemma, D. – Econometrie aplicată, Editura Sedcom Libris, Iaşi, 2006;
[7] Jaba, E. (coord.) - Econometrie, Editura Universităţii Alexandru Ioan Cuza, Iaşi,
2008;
[8] Jemma, D. V. - Econometrie, Editura Universităţii „Alexandru Ioan Cuza”, Iaşi,
2007;
[8] Lazăr, D. – Econometrie Financiară, Editura Casa cărţii de Ştiinţă, Cluj-Napoca,
2011;
[9] Macovei, A. G. , Colomeischi, T. - Econometric analysis of the company on stock
exchange – Analele Universităţii din Oradea, Stiinţe economice, TOM XVIII, 2009,
Volume II, Economz, Business administration and economic statistics, ISSN 1582-
5450, pg. 671-676;
[10] Macovei, A. G., Balan, I. – Econometric analysis on the influence of different
factor over the share of turnover in tourism - The Annals of the „Ştefan cel Mare”
University Suceava, Fascicle of the Faculty of Economics and Public Administration,
Volume 9, Nr. 1(9), 2009, Editura Universităţii Suceava, ISSN 1582-6554, pag. 297-
306;
[11] Mihoc, G., Craiu, V. – Tratat de statistică matematică, volumul I, Editura
Academiei R.S.R., Bucureşti, 1976;
[12] Mureşan, A.S., Filip, D.A., … – Analiză matematică şi Teoria probabilităţilor
aplicate în economie, Editura Todescu, Cluj-Napoca, 2005;
[13] Nenciu, E. - Teoria probabilităţilor şi statistică matematică, Editura Universităţii
"Al. I. Cuza" Iaşi, 1984;
[14] Niculescu-Aron, I.G., Mazurencu-Marinescu, M. - Metode econometrice pentru
afaceri, Editura ASE, Bucureşti, 2007;
[15] Pintilescu, C. – Analiză statistică multivariată, Editura Universităţii Alexandru
Ioan Cuza, Iaşi, 2007;
[16] Spătaru, S. - Modele şi Metode Econometrice, Editura ASE, Bucureşti, 2007;
[17] Taşnadi, A. - Econometrie, Editura ASE, Bucureşti, 2005.
[18] Vlada , M. – modele neliniare. Teorie şi aplicaţii,
www.icvi.eu/2012/disc/cniv/documente/pdf/sectiuneaA/sectiuneaA_lucrar
ea4.pdf