Sunteți pe pagina 1din 135

TIPOLOGIA MODELELOR ECONOMETRICE

1. dup numrul factorilor luai n considerare


modele unifactoriale: se fundamenteaz pe ipoteza c n rndul factorilor de
influen ai variabilei rezultative y exist un factor determinant x, ceilali
factori cu excepia acestuia avnd o influen ntmpltoare (exprimat prin
intermediul variabilei reziduale u) sau fiind invariabili n perioada analizat
y = f(x)+u
modele multifactoriale: elimin deficiena modelului unifactorial, ns trebuie
ca numrul factorilor luai n considerare s nu fie foarte mare pentru a nu fi
mult prea complex, dificil de estimat etc.
y = f(x
1
,x
2
,...,x
p
)+u
2. dup forma legturii dintre variabila rezultativ i variabilele cauz
modele liniare: dac legtura este liniar
modele neliniare: dac legtura este neliniar


TIPOLOGIA MODELELOR ECONOMETRICE
3. dup includerea factorului timp n model
modele statice: dependena variabilei endogene y fa de valorile variabilei
exogene x
j
se realizeaz n aceeai perioad de timp:
y = f(x
1t
,...,x
jt
,...,x
kt
) + u
t

modele dinamice:
introducerea variabilei timp ca o variabil explicativ
y = f(x
t
,t) + u
t

autoregresive : variabila rezultativ cu valori decalate este una din variabilele
explicative
y = f(x
t
,y
t-k
) + u
t

model cu decalaj: variabila explicativ x i exercit influena asupra variaiei
variabilei rezultative pe mai multe perioade de timp:
y = f(x
t
,x
t-1
,... x
t-k
) + u
t


TIPOLOGIA MODELELOR ECONOMETRICE
4. Numrul de ecuaii din model
modele cu o singur ecuaie: toate modelele prezentate anterior
modele cu ecuaii multiple: sunt formate dintr-un sistem de ecuaii

Forma structural a unui model cu ecuaii multiple este:






variabile rezultative sau endogene
variabile explicative sau exogene

= + + + + + + +
= + + + + + + +
= + + + + + + +
n m nm n n n n n
m m n n
m m n n
U X c X c X c Y Y b Y b
U X c X c X c Y b Y Y b
U X c X c X c Y b Y b Y
... ...
... ...
... ...
2 2 1 1 2 2 1 1
2 2 2 22 1 21 2 2 1 21
1 1 2 12 1 11 1 2 12 1


n i Y
i
, 1 , =
m j X
j
, 1 , =
VARIABILE SI DATE STATISTICE
Variabilele economice determin structura modelului econometric:
endogene: variabile determinate n cadrul sistemului;
exogene: variabile determinate n afara sistemului, despre care modelul econometric nu are
nimic de spus.
Tipuri de date: modalitatea de observare a fenomenelor i proceselor
date de tip profil
"tieturi informaionale" efectuate ntr-o populaie la un moment dat, "tieturi" care
sunt de tip transversal, n raport cu axa timpului.
starea pe care o au la un moment dat unitile populaiei statistice.
date de tip serii de timp (serii cronologice)
reprezint "seciuni informaionale" de-a lungul axei timpului, de-a lungul evoluiei;
adic sunt seciuni longitudinale n raport cu axa timpului.
date de tip panel
sunt combinaii, mixturi, ale datelor de tip profil i datelor de tipul seriilor de timp.
"tieturi informaionale mixte" transversale i logitudinale, n raport cu axa timpului.
Caracteristica esenial a acestor date este simultaneitatea.

Testarea ipotezelor statistice


Concepte
Ipotez statistic = se intelege presupunerea care se face cu
privire la parametrul unei repartitii sau a legii de repartitie pe care
o urmeaza anumite variabile aleatoare.
Ipotez nul (H
0
) = este ipoteza care urmeaza a fi testata. Aceasta
presupune ca nu exista deosebiri esentiale sau ca eventualele
deosebiri au un caracter intamplator; const ntotdeauna n
admiterea caracterului ntmpltor al deosebirilor.
Ipotez alternativ (H
1
) = reprezinta negarea ipotezei nule. Ea va
fi acceptat doar cnd exist suficiente dovezi, evidene, pentru a
se stabili c este adevrat.


Concepte
Testul statistic (criteriu de semnificatie) este procedeul de
verificare a unei ipoteze statistice, utilizat drept criteriu de
acceptare sau de respingere a ipotezei nule.
Regiunea critic, Rc = valorile numerice ale testului statistic
pentru care ipoteza nul va fi respins. In testul bilateral, regiunea
de respingere a ipotezi H
0
corespunde unui interval, divizat in
doua subintervale, delimitate la un capat de o valoare critica (prag
critic) iar la celalalt capat de infinit:
(-; valoarea critica inferioara] si [valoarea critica superioara;+)

este astfel aleas nct probabilitatea ca ea s conin testul statistic, cnd
ipoteza nul este adevrat s fie , cu mic (=0.01 etc).






Concepte
dac punctul definit de vectorul de sondaj
x
1
,x
2
,,x
n
cade n regiunea critic Rc, ipoteza H
0
se
respinge, iar dac punctul cade n afara regiunii
critice Rc, ipoteza H
0
se accept.
regiunea critic este delimitat de valoarea critic,
C punctul de tietur n stabilirea acesteia.

Concepte
Eroare de genul nti = eroarea pe care o facem eliminnd o
ipotez nul, dei este adevrat.
Riscul de genul nti () = probabilitatea comiterii unei erori de
genul nti. In practica este cunoscut ca risc al vanzatorului.
se numete nivel sau prag de semnificaie.
Nivelul de ncredere al unui test statistic este (1-) iar n
expresie procentual, (1-)100 reprezint probabilitatea de
garantare a rezultatelor.
Eroare de genul al doilea = eroarea pe cere o facem acceptnd
o ipotez nul, dei este fals
Probabilitatea (riscul) comiterii unei erori de genul al doilea este .
Riscul este cunoscut ca risc al cumparatorului.
Puterea testului statistic este (1-).
Concepte

Tabelul de mai jos ilustreaza relatia dintre decizia luata referitoare la
ipoteza nula si adevarul sau falsitatea acestei ipoteze.






= P(respingere H
0
H
0
este corect)=P(eroare de gen I)
= P(acceptare H
0
H
0
este fals)=P(eroare de gen II)



Decizia de Ipoteza adevrat
acceptare H
0
H
1

H
0
Decizie corect
(probabilitate 1-)
Eroare de gen II
(risc )
H
1
Eroare de gen I
(risc )
Decizie corect
(probabilitate 1-)
Concepte



Legtura dintre probabilitile i

In testarea ipotezelor statistice se
disting doua tipuri de teste:
Testele parametrice
presupun cunoasterea distributiei populatiei (legii de distributie)
considerate. Cel mai cunoscut este testul Student (testul t). De
asemenea, acesta este utilizat pentru testarea valorii unui
coeficient de regresie, precum si a valorii coeficientului de
corelatie.
In testarea ipotezelor statistice se
disting doua tipuri de teste:
Testele neparametrice presupun testarea ipotezelor statistice
fara a cere specificarea formei parametrice a distributiei
populatiilor comparate:
- testul Wilcoxon (utilizat pentru a verifica, pe baza de sondaj,
daca exista diferente semnificative intre doua populatii),
- testul Mann-Whitney (utilizat pentru verificarea existentei
egalitatii dintre doua populatii),
- testul Kolmogorov-Smirnov (testeaza identitatea a doua functii
de repartitie), etc.

Concepte
Se fac presupuneri despre populaia sau populaiile ce sunt
eantionate (normalitate etc.).
Se calculeaz apoi testul statistic i se determin valoarea sa
numeric, pe baza datelor din eantion.
Se desprind concluziile: ipoteza nul este fie acceptat, fie
respins, astfel:
dac valoarea numeric a testului statistic cade n regiunea critic (Rc),
respingem ipoteza nul i concluzionm c ipoteza alternativ este
adevrat. Aceast decizie este incorect doar n 100 % din cazuri;
dac valoarea numeric a testului nu cade n regiunea critic (Rc), se
accept ipoteza nul H
0
.





Concepte
Ipoteza alternativ poate avea una din trei forme (pe care le vom
exemplifica pentru testarea egalitii parametrului media
colectivitii generale, cu valoarea
0
)
test bilateral:
H
0
: =
0
H
1
:
0
( <
0
sau >
0
)
test unilateral dreapta:
H
0
: =
0
H
1
: >
0
test unilateral stnga:
H
0
: =
0
H
1
: <
0

Concepte

a) b) c)
Regiunea critic pentru a) test bilateral; b) test unilateral stnga; c) test unilateral dreapta
Testarea ipotezei privind media
populaiei generale () pentru
eantioane de volum mare
Utilizarea eantioanelor de volum mare (n > 30) face posibil
aplicarea teoremei limit central.
n cazul testului bilateral, ipotezele sunt:
H
0
: =
0
( -
0
=
0
)
H1:
0
( -
0
0) (adic <
0
sau >
0
);


Rc: z< - z
/2
sau z> z
/2
Regula de decizie este, deci:
Respingem H
0
dac

sau
n s
x
n
x x
z
x
0
x
0
x
0

o

o

~

=
2 /
0
o
o

z
n
x
x
<

2 /
0
o
o

z
n
x
x
>

Testarea ipotezei privind media


populaiei generale () pentru
eantioane de volum mare
Pentru testul unilateral dreapta, ipotezele sunt:
H
0
: =
0
( -
0
=0)
H
1
: >
0
( -
0
>0);
Testul statistic calculat este:


Regiunea critic este dat de:
Rc: z > z

Regula de decizie este:
Respingem ipoteza H
0
dac


n s
x
n
x x
z
0 0
x
0

o

o

~

=
o
o

z
n
x
0
>

Testarea ipotezei privind media


populaiei generale () pentru
eantioane de volum mare
Pentru testul unilateral stnga, ipotezele sunt:
H
0
: =
0
( -
0
=0)
H
1
: <
0
( -
0
<0);
Testul statistic calculat este:


Regiunea critic este dat de:
Rc: z < z

Regula de decizie este:
Respingem ipoteza H
0
dac
n s
x
n
x x
z
0 0
x
0

o

o

~

=
o
o

z
n
x
0
<

Testarea ipotezelor statistice (II)




TESTAREA IPOTEZEI PRIVIND MEDIA
POPULAIEI GENERALE () PENTRU
EANTIOANE DE VOLUM REDUS
Forma distribuiei de eantionare a mediei depinde, de forma
populaiei generale din care a fost extras eantionul.
Distribuia de eantionare a lui va fi normal (sau aproximativ
normal), n cazul eantioanelor de volum redus, doar dac
colectivitatea general este distribuit normal (sau aproximativ
normal).
dispersia eantionului ( ), poate s nu ofere o aproximare foarte
bun a lui (n cazul eantioanelor mici).
n locul statisticii z care necesit cunoaterea (sau o bun
aproximare) a lui , vom folosi statistica:


unde:
2
x
s
2
x
o
x
x
x
o
n s
x
s
x
t
x
0
x
0

=

=
( )
1 n
x x
s
2
i 2
x

=

TESTAREA IPOTEZEI PRIVIND MEDIA
POPULAIEI GENERALE () PENTRU
EANTIOANE DE VOLUM REDUS
Ipotezele sunt:
pentru test bilateral;
H
0
: =
0
,
H
1
:
0
( <
0
sau >
0
);
pentru test unilateral dreapta;
H
0
: =
0
,
H
1
: >
0
,
pentru test unilateral stnga;
H0: = 0,
H1: < 0.
Testul statistic utilizat:






n s
x
s
x
t
x
0
x
0

=

=
TESTAREA IPOTEZEI PRIVIND MEDIA
POPULAIEI GENERALE () PENTRU
EANTIOANE DE VOLUM REDUS
Presupunerea special ce trebuie fcut este aceea c
populaia general este normal sau aproximativ normal
distribuit.

Regiunea critic este dat de:
t > t
/2,n-1
sau t < - t
/2,n-1


t > t
,n-1


t < - t
,n-1

Exemplu
Conducerea unei companii apeleaz la 5 experi pentru
a previziona profitul companiei n anul curent. Valorile
previzionate sunt 2,6; 3,32; 1,80; 3,43; 2,00 (miliarde lei).
tiind c profitul n anul anterior profitul a fost de 2,01 miliarde
lei, se poate concluziona cu o probabilitate de 95% c media
previziunilor experilor este semnificativ mai mare dect cifra
anului anterior ?
Rezolvare:
E1: H
0
: =
0


H
1
: >
0

E2: Se alege nivelul de ncredere al testului statistic


E3:se stabilete testul statistic utilizat drept criteriu de
acceptate sau respingere a ipotezei nule ( ), n funcie de
volumul eantionului i obiectivul urmrit
volum mic ( ) -> testul t
H1:>0 - testul unilateral dreapta
30 < n
0
H
05 . 0 % 95 ) 1 ( = = o o
E4: se calculeaz valoarea numeric a testului
statistic pe baza datelor din eantion







63 , 2
5
2 43 , 3 8 , 1 32 , 3 6 , 2
=
+ + + +
= x
74 , 0 5507 , 0
4
203 , 2
1
) (
2
2
2
= = = =

=

x x
i
x
S S
n
x x
S
n s
x
s
x
t
x x
0 0

=

=
874 , 1
5 74 , 0
01 , 2 63 , 2
=

=
E5Se determin astfel:


Se caut n tabelul cu valorile repartiiei Student n funcie de
probabilitate i numrul gradelor de libertate (f=n-
1)


Nivel de semnificaie pentru testul bilateral
n 0,50 0,20 0,10 0,05 0,02 ...
1 1,000 3,078 6,314 12,706 31,821 ...
... ... ... ... ... ... ...
4 0,741 1,533 2,132 2,776 3,747 ...
... ... ... ... ... ... ...
n 0,25 0,10 0,05 0,25 0,01 ...
Nivel de semnificaie pentru testul unilateral
) (
o
t t P s
1 ,
:

>
n c
t t R
o
132 , 2
4 ; 05 , 0 1 ,
= =

t t
n o
o
o
E6:Se verific dac valoarea testului cade n regiunea critic
i se ia decizia
Cum
acceptm ipoteza nul i respingem

Rezult c nu se poate trage concluzia c media profitului
previzionat pentru anul curent va fi semnificativ mai mare
dect profitul anului trecut (2,01 milioane lei)
1
H
0
H
132 , 2 874 , 1
4 ; 05 , 0
= < = t t
TESTAREA IPOTEZEI PRIVIND
PROPORIA POPULAIEI PENTRU
EANTIOANE MARI
Pentru variabile alternative, media n eantion era notat
cu f (proporia succeselor), dispersia f(1-f), iar abaterea
medie ptratic .
proporia eantionului (f) este aproximativ normal
distribuit, de medie p i eroare standard , pentru
n mare ( i ):
i

Pentru testarea ipotezelor statistice privind proporia este
necesar s lucrm cu eantioane mari (n>100).
Cum proporia f este aproximativ normal distribuit, rezult
c variabila standardizat este aproximativ
normal standardizat distribuit.


) 1 ( f f
n p p / ) 1 (
5 > np
5 ) 1 ( > p n
p
f
=
n
f f
n
p p
s
f
) 1 ( ) 1 (
~

=
n f f
p f
z
/ ) 1 (

=
TESTAREA IPOTEZEI PRIVIND
PROPORIA POPULAIEI PENTRU
EANTIOANE MARI
Ipoteza nul indic faptul c p este egal cu o valoare
specificat:
n timp ce ipoteza alternativ rspunde la una dintre cele
trei ntrebri:
dac proporia este diferit de valoarea specificat (test bilateral):
;
dac proporia este mai mare dect valoarea specificat (test
unilateral dreapta): ;
dac proporia este mai mic dect valoarea specificat (test
unilateral stnga): .

0 0
: p p H =
0 1
: p p H =
0 1
: p p H >
0 1
: p p H <
TESTAREA IPOTEZEI PRIVIND
PROPORIA POPULAIEI PENTRU
EANTIOANE MARI
Testul statistic pentru proporia p este:


Regiunea critic (Rc) este dat de:

sau pentru testul bilateral;
pentru testul unilateral dreapta;
pentru testul unilateral stnga.

n / ) f 1 ( f
p f
) n / p 1 ( p
p f
z
0 0

=
2 / o
z z <
2 / o
z z >
o
z z >
o
z z <
TESTAREA IPOTEZEI PRIVIND
PROPORIA POPULAIEI PENTRU
EANTIOANE MARI
Exemplu:
Managerul unui lna de magazine consider n urma unei analize financiare c - pentru un
nou produs - comercializarea este profitabil, dac procentul cumprtorilor care ar dori s
achiziioneze produsul este mai mare de 12%. El selecteaz 400 de cumprtori poteniali
i afl c 52 dintre acetia vor achiziiona produsul. Pentru o probabilitate de 99% sunt
suficiente dovezi care s conving managerul s comercializeze produsul?
Ipotezele sunt:

test unilateral dreapta).
Testul statistic este:


Cum i ,rezult c nu ne aflm n regiunea critic (Rc), nu avem
suficiente dovezi s respingem ipoteza nul, deci procentul nu este mai mare de 12%.

12 , 0 p : H
0
=
12 , 0 p : H
1
>
15 , 1
017 , 0
02 , 0
400 / 86 , 0 14 , 0
12 , 0 14 , 0
n / ) f 1 ( f
12 , 0 f
z = =

=
33 , 2 z z
01 . 0
= =
o
c
z z <
TESTAREA IPOTEZEI PRIVIND
DIFERENA DINTRE DOU MEDII
PENTRU EANTIOANE DE VOLUM REDUS
Se fac presupunerile:
ambele colectiviti generale din care s-au extras eantioanele sunt
normal sau aproximativ normal distribuite;
eantioanele aleatoare sunt selectate independent unul de cellalt.
n condiiile n care presupunem c cele dou colectiviti
generale au dispersii egale ( = = ), un estimator al
dispersiei (variabilitii) totale din cele dou populaii
combinate este:


sau

2
1 x
o
2
2 x
o
2
x
o
( ) ( )
2
2 1
1
2
2
1
2
1
2
2 1
+
+
=

= =
n n
x x x x
s
n
i
i
n
i
i
c
( ) ( )
( ) ( )
( ) ( )
2 n n
s 1 n s 1 n
1 n 1 n
s 1 n s 1 n
s
2 1
2
2 x 2
2
1 x 1
2 1
2
2 x 2
2
1 x 1 2
c
+
+
=
+
+
=
TESTAREA IPOTEZEI PRIVIND
DIFERENA DINTRE DOU MEDII
PENTRU EANTIOANE DE VOLUM REDUS
Dac dispersiile nu sunt egale (
x1

x2
), atunci testul sta-
tistic are forma:



cu gradele de libertate:





2
2
2
1
2
1
2 1
n
s
n
s
D ) x x (
t
+

=
( )
1 n
) /n (s
1 n
) /n (s
/n s /n s
2
2
2
2
2
1
2
1
2
1
2
2
2
2 1
2
1

+
TESTAREA IPOTEZEI PRIVIND
DIFERENA DINTRE DOU MEDII
PENTRU EANTIOANE DE VOLUM REDUS
Ipotezele statistice vor fi, n aceste condiii:
pentru test bilateral;
H
0
:
1
=
2
(
1
-
2
= D),
H
1
:
1

2
(
1
-
2
D),
pentru test unilateral dreapta;
H
0
:
1
=
2
(
1
-
2
= D),
H
1
:
1
>
2
(
1
-
2
> D),
pentru test unilateral stnga;
H
0
:
1
=
2
(
1
-
2
= D),
H
1
:
1
<
2
(
1
-
2
< D).

TESTAREA IPOTEZEI PRIVIND
DIFERENA DINTRE DOU MEDII
PENTRU EANTIOANE DE VOLUM REDUS
Testul statistic t va avea forma:


Regiunea critic este dat de:

pentru test bilateral: sau ;

pentru test bilateral dreapta: ;

pentru test bilateral stnga: .
( ) ( )
( ) ( )
( )
2 1
2 1 2 1
2
2
2 x 1
2
1 x
2
2 1
2
c
2
n n
2 n n n n
1 n s 1 n s
D x x
n
1
n
1
s
D x x
t
1 1
+
+

+

=
|
|
.
|

\
|
+

=
2 , 2 /
2 1
+
<
n n
t t
o 2 , 2 /
2 1
+
>
n n
t t
o
2 ,
2 1
+
>
n n
t t
o
2 ,
2 1
+
<
n n
t t
o
TESTAREA IPOTEZEI PRIVIND
DIFERENA DINTRE DOU MEDII
PENTRU EANTIOANE DE VOLUM REDUS
Exemplu
Presupunem c dorim s testm ipoteza conform creia ntre dou mrci de autoturisme
nu exist diferene semni-ficative privind cheltuielile de funcionare. Pentru aceasta 20 de
posesori de autoturisme (8 posesori ai primei mrci i 12 posesori ai celei de-a doua) sunt
rugai s in, cu acuratee, evidena cheltuielilor de funcionare pe o perioad de un an de
zile. Pentru =0,1 (probabilitate de garantare a rezultatelor (1-)100 = 90%) s se testeze
aceast ipotez, dac rezultatele prelucrrii datelor n eantioane sunt:
Marca 1 Marca 2
n
1
=8 n
2
=12
mil. lei mil. lei
sx
1
=0,485 mil. lei sx
2
=0,635 mil. Lei


Ipotezele statistice sunt:
H
0
:
1
=
2
(
1
-
2
= 0),
H
1
:
1

2
(
1
-
2
0) [
1
>
2
sau
1
<
2
].
696 , 5 1 = x 273 , 5 2 = x
( ) ( )
3379 , 0
2 12 8
635 , 0 1 12 485 , 0 1 8
s
2 2
2
c
=
+
+
=
TESTAREA IPOTEZEI PRIVIND
DIFERENA DINTRE DOU MEDII
PENTRU EANTIOANE DE VOLUM REDUS
Exemplu
Testul statistic este:





Cum t
/2,n1+n2-2
= t
0,05;18
= 1,734, se observ c t <
t/2,n1+n2-2
, aadar nu ne aflm n
regiunea critic.
Rezult, deci, c nu exist suficiente dovezi pentru a concluziona c sunt diferene
semnificative ntre cheltuielile de funcionare ale celor dou mrci de autoturisme.

( )
5943 , 1
2653 , 0
423 , 0
12
1
8
1
3379 , 0
0 273 , 5 696 , 5
t = =
|
.
|

\
|
+

=
ELEMENTE DE ANALIZ
DISPERSIONAL (ANOVA)


ELEMENTE DE ANALIZ
DISPERSIONAL (ANOVA)
Analiza dispersional (analiz de varian) (ANOVA), a fost introdus de
statisticianul Irving Fisher.

Modelul de analiz dispersional i propune ca pentru fiecare nivel al
factorului/factorilor cauzali s analizeze populaia distinct asociat i
eventualele diferene ce apar ntre populaii: s studieze efectul
variabilei/variabilelor independente asupra celei dependente.

Analiza dispersional se poate face dup un model unifactorial, dup
modele bi sau multifactoriale.
Analiz dispersional unifactorial
n modelul de analiz dispersional unifactorial se testeaz ipoteza nul:
H
0
:
y1
=
y2
= ... =
yr
,
cu ipoteza alternativ cel puin dou medii din populaie nu sunt egale:
H
1
:
yi
=
yj
, (i = j)
Dac rezultatul testului indic faptul c mediile sunt semnificativ diferite,
se concluzioneaz c factorul X are un impact asupra variabilei Y.
Setul de date pentru analiza dispersional unifactorial const n valorile
variabilei Y pentru cele r grupe independente.
Volumele grupelor pot fi diferite n
1
= n
2
= ... = n
r
Analiz dispersional unifactorial
Sistematizarea datelor pentru ANOVA


y
11
y
21
y
r1

y
12
y
22
y
r2

. .
. .
1
n 1
y

2
n 2
y
. . . . .
r
rn
y
1
y
2
y
. . . . .
r
y
Grupe dup factorul cauz
Gr. 1 Gr. 2 . . . . Gr.r
Media
Vol. grup

n
1
n
2
. . . .. n
r

Analiz dispersional unifactorial
Presupunerile sub care se aplic testul F n analiza dispersional
unifactorial:
cele r grupe din eantion sunt extrase aleator i independent din cele r grupe
ale colectivitii generale;
fiecare grup din colectivitatea general are o distribuie normal, iar abaterile
medii ptratice sunt egale s
1
= s
2
= ..... = s
r
.
Testul statistic F pentru analiza dispersional unifactorial este raportul
indicatorilor de variabilitate pentru cele dou surse de variaie:
variabilitatea dintre grupe
variabilitatea din interiorul grupelor.
Dac ipoteza nul este adevrat, mediile celor r populaii ar trebui s fie,
toate, egale. Ne ateptm atunci ca mediile celor r eantioane s fie
aproximativ egale.
Dac ipoteza alternativ este adevrat, exist diferene mari ntre unele
medii ale eantioanelor.
Analiz dispersional
unifactorial








a) b)
a) medii de grup egale; b) mediile de grup inegale
Analiz dispersional unifactorial
pe baza datelor din eantion calculm:
r 1, i ,
1
= =

=
i
n
j
ij
i
n
y
y
i
n
n y
n
y
y
r
i
i i
r
i
n
j
ij
i

=
= =
= =
1
1 1

=
=
r
i
i
n n
1
Analiz dispersional unifactorial
Variana dintre grupe, dat de influena factorului cauzal, numit i
variana factorial, este suma ptratelor abaterilor mediilor de grup de
la media general:


Dac
atunci: S
1
= 0.
variana din interiorul grupelor (variana rezidual), este suma
ptratelor abaterilor valorilor individuale de la mediile de grup:


mprtierea total a valorilor individuale fa de media general
(variana total):

( )

=
=
r
1 i
i
2
i 1
n y y S
r 2 1
y ... y y = = =
( )

= =
=
r
1 i
n
1 j
2
i ij 2
i
y y S
( )

= =
=
r
1 i
n
1 j
2
ij
i
y y S
Analiz dispersional unifactorial
Raionamentul analizei dispersionale se bazeaz pe partiionarea sumei
ptratelor abaterilor:


Pentru a face comparabile aceste msuri ale variabilitii, le vom pe
fiecare la gradele de libertate, => media ptratele raporta abaterilor.
Pentru variana factorial S
1
, numrul gradelor de libertate este r-1;
msurm variabilitatea a r medii, se pierde un grad de libertate, deoarece
media total a fost estimat.
Pentru variana rezidual (din interiorul grupelor) S
2
, numrul gradelor de
libertate este nr; msurm variabilitatea tuturor celor n valori, dar
pierdem r grade de libertate.







( ) ( ) ( )

= = = = =
+ =
r
1 i
ni
1 j
2
i ij i
r
1 i
2
i
r
1 i
ni
1 j
2
ij
y y n y y y y
Analiz dispersional unifactorial
Obinem astfel:
dispersia factorial corectat:




dispersia corectat rezidual:


( )
1 r
n y y
1 r
S
s
r
1 i
i
2
i
1 2
1

=

=
( )
r n
y y
r n
S
s
r
1 i
ni
1 j
2
i ij
2 2
2

=

= =
Analiz dispersional unifactorial
Statistica F pentru analiza dispersional unifactorial are forma:



cu gradele de libertate (r 1) la numrtor i (n r) la numitor.
Regiunea critic este dat de :

F> F(r- 1),(n- r),o,

acest lucru indic diferene mai mari ntre mediile grupelor dect cele
datorate ntmplrii.








grupelor interiorul din atea variabilit
grupe dintre a iabilitate var
s
s
F
2
2
2
1
= =
Analiz dispersional unifactorial
dac valoarea F este mai mic dect valoarea critic F, atunci :
acceptm ipoteza nul, H
0
;
nu acceptm ipoteza alternativ H
1
;
mediile grupelor nu sunt semnificativ diferite una fa de alta;
diferenele observate ntre mediile grupelor pot fi datorate doar ntmplrii;
rezultatul nu este semnificativ statistic.
Dac valoarea F este mai mare dect valoarea critic F, atunci:
acceptm ipoteza alternativ, H
1
;
respingem ipoteza nul, H
0
;
mediile grupelor sunt semnificativ diferite una fa de alta;
diferenele observate ntre mediile grupelor nu sunt datorate doar ntmplrii;
rezultatul este semnificativ statistic.
Analiz dispersional unifactorial
Calculul statisticii F
pentru analiza dispersional unifactorial
2
1
s
2
2
s
2
2
2
1
s
s
F =
s
2
=
2
2
2
1
s s +
Sursa
variaiei
Gradele de
libertate
Variana
(suma ptratelor)
Dispersia corectat
(media ptratelor)
Statistica
F
0 1 2 3 4
Factorul X

Rezidual
r 1

n r
S
1


S
2

Total n 1 S = S
1
+ S
2

Modelul de analiz dispersional
bifactorial
se identific doi factori de influen, iar variabilitatea caracteristicii
rezultative poate s fie pus:
pe seama influenei primului factor (cu I niveluri);
pe seama influenei celui de-al doilea factor (cu J niveluri);
pe seama interaciunii celor doi factori;
pe seama ntmplrii (factorului rezidual).

O valoare nregistrat pentru variabila efect Y, la grupa i ( ) a
primului factor i grupa j ( ) a celui de-al doilea factor este y
ijk
, (cu
k = numrul de observaii din fiecare celul considerat pentru
nivelul i al primului factor i nivelul j al celui de-al doilea factor).
I , 1 i =
J , 1 j =
K , 1
Modelul de analiz dispersional
bifactorial
Analiza dispersional bifactorial

Sursa variaiei
Grade de
libertate
Variana
(suma ptratelor)
Dispersia
corectat (media
ptratelor)
Statisica
F
0 1 2 3 4
Primul factor I 1
Al doilea factor J 1
Interaciunea
celor doi factori
(I-1)(J-1)
Rezidual
IJ(K-1)
Total IJK1
( )

=
=
I
1 i
2
. . i
1
x x JK S
( )

=
=
J
1 j
2
. j .
2
x x IK S
( )

= =
+ =
I
1 i
J
1 j
2
. j . . . i
. ij 3
x x x x K S
( )

= = =
=
I
1 i
J
1 j
K
1 k
2
. ij
ijk 4
x x S
( )

= = =
=
I
1 i
J
1 j
K
1 k
2
ijk
x x S
1 I
S
s
1 2
1

=
1 J
S
s
2 2
2

=
( )( ) 1 J 1 I
S
s
3 2
3

=
( ) 1 K IJ
S
s
4 2
4

=
2
4
2
1
s
s
F =
2
4
2
2
s
s
F =
2
4
2
3
s
s
F =
Modelul de analiz dispersional
bifactorial
media celulei este:


media grupei i ( ) pentru primul factor este:


media grupei j ( ) pentru al doilea factor este:


media total este:


K
x
x
K
1 k
ijk
. ij

=
=
I , 1 i =
JK
x
x
J
1 j
K
1 k
ijk
. . i

= =
=
J , 1 j =
IK
x
x
I
1 i
K
1 k
ijk
. j .

= =
=
J
x
I
x
IJK
x
x
J
1 j
. j .
I
1 i
. . i
I
1 i
J
1 j
K
1 k
ijk

=
=
= = =
= = =
Concluzii
modelele de analiz dispersional nu explic relaia dintre variabile
verific doar msura n care valorile reale ale unei caracteristici se abat
de la valorile teoretice, precum i msura n care aceste variaii sunt sau
nu dependente de factorul/factorii de grupare.
metoda analizei dispersionale poate fi utilizat att naintea, ct i dup
aplicarea metodelor corelaiei i regresiei statistice.
Testul F se poate utiliza i pentru testarea validitii modelului de
regresie.
n general, n analiza dispersional, nivelurile x
1
, x
2
, ..., x
r
sunt niveluri ale
unei variabile categoriale (numite i tratamente), dar, cum ceea ce este
valabil pentru o scal inferioar (nominal) este valabil i pentru orice
alt scal superioar (ordinal, de intervale, de rapoarte), analiza se
poate extinde.
Exemplu
Pentru regiunile Romniei s-au cules i sistematizat date privind rata ocuprii (%). Folosind
analiza dispersional s se stabileasc dac exist diferene semnificative ntre regiuni.

i x
2
i
s
) 1 (
2
2
=
i i
n s S
Regiunea Nr.
judee
(n
i
)
Rata medie a ocuprii


(%)
Abaterea
medie
ptratic (s
i
)
Dispersia
NE 6 47.77 4.89 23.91 119.55
SE 6 41.24 5.68 32.26 161.3
S 7 40.68 6.57 43.16 258.96
SV 5 41.9 3.31 10.96 43.84
V 4 42.71 6.18 38.19 114.57
NV 6 46.32 5.84 34.11 170.55
C 6 42.08 2.32 5.38 26.9
Buc 2 41.59 5.62 31.58 31.58
Total 42 43.16 5.41 = s 29.27 = s
2
927.25

=
Exemplu
07 . 1200 41 * 27 . 29
82 . 272
25 . 927
1
2
= =
=
=
S
S
S
27 . 29
1 42
07 . 1200
97 . 38
1 8
82 . 272
27 . 27
8 42
25 . 927
2
2
1
2
2
=

=
=

=
=

=
s
s
s
0 34 ; 7 ; 05 . 0
34 ; 7 ; 05 . 0
40 . 2
42 . 1
27 . 27
97 . 38
H F F
F
F
<
=
= =
Modelul de regresie
clasic


Specificarea unui model de
regresie
Un studiu econometric ncepe cu o serie de presupuneri
teoretice despre anumite aspecte ale economiei.
Investigaiile empirice furnizeaz estimatori pentru
parametri necunoscui ai modelului.
Keynes: C=f(x)
Suma cheltuit pentru consum depinde de:
mrimea venitului pe de o parte
alte obiective n funcie de circumstane (de exemplu investiiile)
alte nevoi subiective


Specificarea unui model de
regresie
Legea psihologic fundamental: o persoan este dispus
de regul i n medie s i creasc consumul pe msura
creterii venitului dar nu n aceeai msur


Un nivel absolut mai mare al venitului va tinde de regul s
mreasc diferena ntre venit i consum:


Presupunerea cea mai simpl: C=o+|X, 0<|<1 este o
relaie determinist neadecvat.
1 0 < <
dX
dC
0
) / (
<
dX
X C d
Specificarea unui model de
regresie
n model trebuie inclus i factorul aleator:
C=f(X,c)
Modelul cel mai simplu:
C=o+|X+c
Modelul general ce trebuie estimat are forma:
y
i
=o + |x
i
+ c
i
, i=1,n
unde:
x
i
este nestochastic (situaie experimental)
Analistul alege valorile regresiei x
i
i apoi observ y
i
Specificarea unui model de
regresie
Valoarea parametrului | arat modificarea proporional a
variabilei efect (Y) la modificarea cu o unitate a variabilei
cauz (X).
Valoarea parametrului o arat punctul n care linia
intercepteaz (taie) axa OY
c
i
reprezint componenta rezidual (eroarea aleatoare)
pentru fiecare unitate, adic partea din valoarea variabilei Y
care nu poate fi msurat prin relaia sistematic existent
cu variabila X.
Specificarea unui model de
regresie









Modelul liniar unifactorial y=1+0,5x
Specificarea unui model de
regresie
Modelul probabilistic conine:
componenta deterministic, adic partea din valoarea lui Yi care poate
fi determinat cunoscnd valoarea Xi (o + |Xi = Yi')
componenta rezidual care nu poate fi determinat cunoscnd valoarea
individual Xi (ci)
Atunci,
Y
i
= o + |X
i
+ c
i


Y
i
= componenta predictibil (detrministic) + eroarea aleatoare

Y
i
= Y
i
' + c
i

Specificarea unui model de
regresie
Dac datele disponibile provin dintr-un eantion avem la
dispoziie n perechi de observaii (x
1
, y
1
), (x
2
,y
2
), ... (x
n
, y
n
),
pe care le vom folosi pentru estimarea parametrilor ecuaiei
de regresie liniar simpl, o i |.
Modelul de regresie liniar n eantion este:
y
i
= a + bx
i
+ e
i

cu componenta predictibil:

a i b sunt estimatorii punctului de intercepie (o) i pantei liniei
drepte (|), obinui pe eantion
e
i
este valoarea rezidual (pentru unitatea i) n eantion:
e
i
= y
i
(a + bx
i
)
i i
bx a y

+ =
Ipotezele modelului de regresie
liniar
Pentru a obine proprietile dorite ale estimatorilor regresiei, se
fac, de obicei, cinci presupuneri (ipoteze) standard pentru modelul
din populaia general:

Ipotezele ce trebuie verificate:

Forma funcional: y
i
=o + |x
i
+ c
i
, i=1,n
Normalitatea erorilor: c
i
~N(0, )
Media zero a erorilor: (c
i
)=0 i
Homoscedasticitatea:
2
(c
i
)= constant i
Non autocorelarea erorilor: Cov(c
i
,c
j
)=0 i=j
Necorelarea ntre regresor i erori: Cov(x
i
,c
j
)=0 i i j


2
c
o
2
c
o
Ipoteza 1: Forma funcional
y=a+bx
y=a+bz, z=e
x
y=a+br, r=1/x
y=a+bq, q=ln(x)

Sau
y=Ax
|
ln(y)=o+|ln(x)
Forma general:
f(y
i
)= o+|g(x
i
)+c
i
Contra exemplu:

nu poate fi transformat n model liniar.
-400
-200
0
200
400
600
800
1000
-1 0. 003 0. 008 0. 013 0. 018 0. 023 0. 028 0. 033 0. 038 0. 043 0. 048 0. 053 0. 058 0. 063 0. 068
X
Y
|
.
|

\
|
+
x
b a
1
x
be a +
bx a +
( ) x b a ln +
Modele ce pot fi linearizate
x
y
+
+ =
|
o
1
Erorile
Ipoteza de linearitate a modelului include i aditivitatea
erorilor.
Forma modelului:
y = o + |x + c,
De exemplu modelul se transform prin
logaritmare n modelul liniar: ln(y)=ln(A)+|ln(x)+c .
ns modelul nu mai poate fi transformat n
model liniar.
Dac ipoteza de linearitate este verificat, variabila
dependent observat este suma a dou elemente:
un termen nestochastic: o+|x
o variabil aleatoare
c |
e Ax y =
c
|
+ = Ax y
Ipoteza 2: normalitatea erorilor
Se presupune c variabila aleatoare c
i
este normal
distribuit :
Distribuia de probabilitate pentru c
i

Ipoteza 3: media erorilor este
zero: (c
i
)=0 i
Este natural atta timp ct c este vzut ca suma efectelor
individuale, cu semne diferite.
Dac media erorilor este diferit de zero, ea poate fi
considerat ca o parte sistematic a regresiei:
(c)= o + |x + c = (o+) + |x + (c-)
Media erorilor este acum nul.
Aceast presupunere indic faptul c media valorilor Y,
condiionat de X, (Y/X = X
i
) = o + |X
i
, adic nu exist
variabile omise asociate cu regresia n populaie.
Ipoteza 4 (de homoscedasticitate):
Var(c
i
)= constant i
Dispersia reziduurilor n populaie este constant peste toate
valorile X
i
2
c
o
Functia de consum
0
200
400
600
800
1000
1200
200 300 400 500 600 700 800 900 1000
venit
c
o
n
s
u
m
Ipoteza 4 (de homoscedasticitate):
Var(c
i
)= constant i
2
c
o
a) b)
Dispersia reziduurilor a) constant; b) variabil
Discuie:
Profiturile firmelor mari vor varia mult mai mult ca profiturile firmelor
mici.
Variaia cheltuielilor gospodriilor n funcie de venit sau de mrimea
lor poate fi
Ipoteza 5: Non autocorelarea
erorilor: (c
i
c
j
)=0 i=j
Aceast ipotez nu implic faptul c y
i
i y
j
sunt necorelate,
ci faptul c deviaiile observaiilor de la valorile lor ateptate
sunt necorelate.
Variabilele aleatoare c
i
sunt statistic independente una de
alta, adic = 0, pentru i = j.
Acest lucru nseamn c eroarea asociat cu o valoare a
variabilei Y nu are nici un efect asupra erorilor asociate cu
alte valori ale lui Y;
Nu exist deci corelaie ntre reziduuri;
OBSERVAIE: Este convenabil a considera c erorile sunt
independente i normal distribuite cu medie zero i
variaie constant pentru obinerea de rezultate statistice
exacte.
j i
c c

Estimarea parametrilor
modelului de regresie clasic
Parametrii necunoscui ai reaciei stochastice sunt cei ce trebuie estimai:
y
i
=o + |x
i
+ c
i
, i=1,n
Modelul estimat va fi scris:

Eroarea asociat unui punct i este:
c
i
= y
i
- o - |x
i

Pentru orice valori estimate a i b, erorile estimate vor fi:
e
i
= y
i
- a - bx
i

Pentru estimarea parametrilor o i | pe baza datelor observate, un
criteriu natural este cel de maximizare a potrivirii modelului cu datele
observate, deci de minimizare a erorilor observate:

n i bx a y
i
i
, 1 , = + =
.

=
i
i i
i
i
bx a y e
2 2
) ( min min
Estimarea parametrilor
modelului de regresie clasic
Condiiile de ordin 1 de minimizare a funciei sunt:


=
c
c
=
c
c

0
) (
0
) (
2
2
b
e
a
e
i
i
i
i

+ =
+ =


b x a x y x
b x na y
i
i
i
i
i
i i
i
i
i
i
) ( ) (
) (
2

= =
=



2
2
2
x n x
y x n y x
x x
x n
y x x
y n
b
x b y a
i
i
i
i i
i
i
i
i
i
i
i
i
i
i
i
i
i
Estimarea parametrilor
modelului de regresie clasic
Rmne de verificat dac este verificat condiia de ordin 2, adic soluia gsit
este un punct de minim. Matricea derivatelor pariale de ordin doi trebuie s fie
pozitiv definit:









Deci matricea este pozitiv definit.
(
(
(

=
(
(
(
(
(
(

c
c
c c
c
c c
c
c
c



i
i
i
i
i
i
i
i
i
i
i
i
i
i
x x
x n
b
e
a b
e
b a
e
a
e
2
2 2
2 2 2 2
2 2
2 2
2 2
2 2
2 2
) ( ) (
) ( ) (

> =
>
>

0 ) ( 4 ) ( 4 4
0 2
0 2
2 2 2
2
i
i
i
i
i
i
i
i
x x n x x n
x
n
Modele cu variabile dummy


Noiuni
Variabila dummy este o variabil categorial care
poate lua dou valori. Acestor dou valori li se
acord, de regul, dou coduri: codul 1 (pentru
unitile statistice care posed caracteristica
urmrit n studiu) i codul 0 (pentru celelalte
uniti statistice).

Exemplu:
- sexul persoanei: 1 -masculin i 0 - feminin.


Modele ANOVA (modele de
analiz a variaiei)
Sunt modelele n care variabilele independente sunt
variabile dummy.
a. Modele cu o variabil dummy
Forma general a modelului ANOVA cu variabile
dummy este:

Y=
0
+
1
D
i
+

unde: D
i
este variabila dummy: D
1
=1 (de exemplu, n
cazul persoanelor de sex masculin) sau D
2
=0
(n cazul persoanelor de sex feminin);

0
este nivelul mediu al variabilei Y pentru
categoria D
i
=0

1
arat cu ct este mai mare valoarea medie a
variabilei Y pe cele dou categorii (diferena dintre
nivelul mediu al variabilei Y pentru categoria 1 i
nivelul mediu al variabilei Y pentru categoria 0).

0
+
1
arat nivelul mediu al variabilei Y pentru
categoria D
i
=1.

Exemplu: Pentru un eantion format din 10 persoane,
se nregistreaz salariul lunar obinut (mil.lei/lun)
pe sexe (1- masculin; 0 - feminin).

Salariu (mil.lei) Sexul persoanei
15 1
10 0
9 0
17 1
11 0
18 1
17 1
12 0
11 0
19 1
n urma prelucrrii datelor s-au
obinut urmtoarele rezultate:









Coefficients
a
10,600 ,592 17,917 ,000
6,600 ,837 ,941 7,889 ,000
(Constant)
sexul
Model
1
B Std. Error
Unstandardized
Coef f icients
Beta
Standardized
Coef f icients
t Sig.
Dependent Variable: salariu
a.
Model Summary
,941
a
,886 ,872 1,32288
Model
1
R R Square
Adjusted
R Square
Std. Error of
the Estimate
Predictors: (Constant), sexul
a.
ANOVA
b
108,900 1 108,900 62,229 ,000
a
14,000 8 1,750
122,900 9
Regression
Residual
Total
Model
1
Sum of
Squares df Mean Square F Sig.
Predictors: (Constant), sexul
a.
Dependent Variable: salariu
b.
Interpretare:

a) Ecuaia estimat a legturii dintre variabile:
Y=10,6+6,6D


b) Interpretarea parametrilor modelului:

b
o
=10,6 mil.lei/lun arat c nivelul mediu al salariului
persoanelor de sex feminin este de 10,6 mil.lei/lun.


b
0
+b
1
=17,2 mil. lei/lun reprezint nivelul mediu al
salariului persoanelor de sex masculin.


b
1
=6,6 mil.lei/lun arat diferena dintre salariul
mediu al persoanelor de sex masculin i salariul
mediu al persoanelor de sex feminin.


b. Modele cu dou variabile dummy

Forma general a modelului ANOVA cu variabile
dummy este:

Y=
0
+
1
D
1
+
2
D
2
+


Exemplu: Pentru un eantion format din 20 persoane,
se nregistreaz salariul lunar obinut (mil.lei/lun)
pe nivele de pregtire (gimnazial; liceal, superior).

D
1
=1, pt. gimnazial i D
1
=0 n rest

D
2
=1, pt. liceal i D
2
=0 n rest

b
1
= 8,453 este estimaia diferenei dintre salariul
mediu al angajailor cu studii gimnaziale i al celor
cu studii superioare.

b
2
= 4,612 este estimaia diferenei dintre salariul mediu
al angajailor cu studii liceale i al celor cu studii superioare
Coefficients
a
15,187 1,020 14,884 ,000
-8,453 1,285 -,907 -6,580 ,000
-4,612 1,395 -,456 -3,307 ,004
(Constant)
D1
D2
Model
1
B Std. Error
Unstandardized
Coef f icients
Beta
Standardized
Coef f icients
t Sig.
Dependent Variable: salariu
a.

b
0
=15,187 mil.lei reprezint nivelul mediu al salariului
persoanelor cu studii superioare.

b
0
+b
1
=15,187 8,453 = 6,734 reprezint nivelul mediu al
salariului persoanelor cu studii gimnaziale.

b
0
+b
2
=15,187 4,612 = 10,575 reprezint nivelul mediu
al salariului persoanelor cu studii liceale.

2
c
o
Modele ANCOVA (modele de
analiz a covarianei)

Sunt modele de regresie n care variabila
dependent este numeric iar variabilele
independente sunt numerice i categoriale
(dummy).

a. Modelul ANCOVA cu o variabil dummy i o
variabil numeric




Forma general a modelului:

Y=
0
+
1
D
i
+
2
X+


unde:
Y este variabila dependent numeric;
D
i
variabila independent dummy;
X este variabila independent numeric;

0
valoarea lui Y cnd D
i
=0 i X=0.





1


arat diferena dintre valoarea medie a variabilei
Y pe cele dou categorii (categoria 1 i categoria 0).


2
arat cu ct variaz, n medie, nivelul variabilei Y la
o cretere cu o unitate a lui X (pentru ambele
categorii).

Exemplu: Pentru un eantion de persoane se
nregistreaz salariul lunar obinut (Y, mil.lei), sexul
persoanei (1-masculin, 0- feminin) i numrul de ani
de coal.
n urma prelucrrii datelor s-au
obinut urmtoarele rezultate:

Coefficients
a
3,109 2,592 1,199 ,276
5,757 ,689 ,778 8,351 ,000
,480 ,165 ,272 2,914 ,027
(Constant)
sexul
ani_scoala
Model
1
B Std. Error
Unstandardized
Coef f icients
Beta
Standardized
Coef f icients
t Sig.
Dependent Variable: salariu
a.

b
0
= 3,109 mil.lei/lun reprezint nivelul mediu al
salariului persoanelor de sex feminin, n condiiile
n care nivelul studiilor este X=0.

b
1
= 5,757 mil.lei/lun reprezint diferena dintre
nivelul mediu al salariului persoanelor de sex
masculin i nivelul mediu al salariului persoanelor
de sex feminin.



b
0
+b
1
= 8,866 mil. lei reprezint nivelul mediu al
salariului persoanelor de sex masculin n condiiile
n care X=0.
b
2
= 0,48 mil.lei/lun arat c la o cretere cu un
an a numrului de ani de coal, nivelul salariului
pentru ambele categorii crete, n medie, cu 0,48
mil.lei/lun.

Observaie:
dac valoarea parametrului
1
este semnificativ
diferit de zero, atunci exist diferene ntre
nivelurile medii ale variabilei Y pe categorii.

b. Modelul ANCOVA cu dou variabile dummy i o
variabil numeric

Forma modelului:
Y=
0
+
1
D
i1
+
2
D
i2
+
3
X+


Interpretare:

Dac valoarea coeficientului
1
este semnificativ
diferit de zero, atunci se poate considera c
variabila D
1
influeneaz variaia variabilei Y. Idem

2.

Dac ambii coeficieni sunt semnificativi statistic,
atunci ambele variabile influeneaz variaia
variabilei Y.
Coeficientul
3
arat cu ct crete sau scade, n
medie, nivelul variabilei Y la o cretere cu o unitate
a nivelului variabilei X.

Exemplu:
n studiul legturii dintre venitul lunar realizat, sexul
persoanei (1-masculin; 0-feminin), mediul de
reziden (1-urban, 0-rural) i vrsta persoanei, s-
au obinut urmtoarele rezultate:

Y= 2,5 + 1,2D
1
+ 3,6D
2
+ 0,9X

(t
calc
=5,8) (t
calc
=4,3) (t
calc
=-3,7) (t
calc
=1,79)

S se interpreteze rezultatele obinute (n=100
persoane).

b
0
= 2,5 mil. lei reprezint salariul mediu al
persoanelor de sex feminin din mediul rural, cnd
X=0.
b
0
+b
1
= 3,7 mil. lei reprezint salariul mediu al
persoanelor de sex masculin din mediul rural, dac
X=0.
b
1
= 1,2 mil. lei arat diferena dintre salariul
mediu al persoanelor de sex masculin i feminin,
dac X=0.
b
2
= 3,6 mil. lei arat diferena dintre salariul
mediu al persoanelor din mediul urban i rural,
dac X=0.

REGRESIE MULTIFACTORIAL






Concepte generale privind definirea, specificarea
i identificarea modelului multifactorial

Sub form general, un model multifactorial se
definete prin urmtoarea relaie:
y = f(x
j
)+u
unde:
y = variabila endogen, efect sau rezultativ;
x
j
= variabilele exogene sau factoriale sau cauzale;
, k = numrul variabilelor exogene;
u = variabila rezidual, aleatoare sau eroare;


Concepte generale privind definirea, specificarea
i identificarea modelului multifactorial

f(x
j
) = funcia de regresie cu ajutorul creia vor fi
estimate (aproximate) valorile variabilei y,
determinate numai de influena factorilor x
j
,
considerai eseniali, principali, hotrtori,
exceptnd influena celorlali factori ai fenomenului
y, care sunt considerai factori neeseniali,
nesemnificativi de explicare a apariiei i a evoluiei
n timp i n spaiu a fenomenului y, acetia fiind
tratai separat cu ajutorul variabilei reziduale u.

Specificarea unui model
econometric

se face pe baza teoriei economice. Fenomenul economic y
se precizeaz pe baza conceptelor, definiiilor i a relaiilor
cauz-efect elaborate de ctre aceasta i se accept
fenomenul x
j
ca factor esenial, sau se respinge i se trece
n categoria factorilor ntmpltori prin intermediul variabilei
aleatoare u.
dimensiunea pachetului de variabile explicative x
j
depinde
ns i de banca de date statistice a variabilelor respective,
de cantitatea i de calitatea acestora.

Exemplu

n economie, modelele multifactoriale au o arie vast de
aplicare, acestea putnd fi utilizate n mai multe situaii i
sub diverse forme, ca, de exemplu:
1) Modelarea consumului
C = f (V, P, N) + u
unde:
C = consumul unui produs sau grupe de produse;
V = venitul pe familie;
P = preul produsului sau indicele preurilor grupei de
produse;
N = numrul membrilor unei familii.

Exemplu


2) Funcia de producie Cobb-Douglas

Q = f (K, L) + u

unde:
Q = volumul (valoarea) produciei;
K = capitalul;
L = fora de munc.

Exemplu

3) Modelarea evoluiei preurilor

I
p
= f (I
v
, I
cv
, I
m
) + u

unde:
I
p
= indicele preurilor;
I
v
= indicele veniturilor (salariilor) consumatorilor;
I
cv
= indicele cursului valutar;
I
m
= indicele masei monetare.

Estimarea parametrilor modelului
se face n urma etapei de identificare a acestuia.
deoarece marea majoritate a modelelor econometrice pot
fi liniarizate, un model multifactorial, n form general, se
prezint astfel:

y
t
= b
0
x
0t
+ b
1
x
1t
+ b
2
x
2t
+ + b
j
x
jt
+ + b
k
x
kt
+ u
t


unde:
n = numrul termenilor seriilor statistice;
k = numrul variabilelor exogene,

108



MODELAREA ECONOMETRIC
A SERIILOR CRONOLOGICE
Componentele unei serii cronologice
Estimarea componentei trend (METODA MEDIILOR
MOBILE)
Estimarea componentei sezoniere
Previzionarea fenomenelor afectate de
sezonalitate
109
Componentele unei serii cronologice
Dac datele statistice sunt transversale (dinamice), adic dac
variabila este msurat n timp, n ordine secvenial, atunci, n urma
sistematizrii, se obine o serie cronologic de tipul:
=
)
`

n t
y y y y
n t
... ...
... ... 2 1
2 1
n 1, t ,
y
t
t
=
)
`


unde:
n , 1 t =
reprezint unitile de timp (perioade sau momente)
y
t
reprezint nivelurile variabilei studiate, Y.
O serie cronologic poate fi format din patru componente:
1. Componenta de lung durat trend (Y
T
);
2. Componenta sezonier (Y
S
);
3. Componenta ciclic (Y
C
);
4. Componenta rezidual (Y
R
).

110
Componentele unei serii cronologice pot fi prezentate, sintetic, astfel:
Denumire
Componenta
de lung
durat
Componenta
sezonier
Componenta
ciclic
Componenta
rezidual
Tip Sistematic Sistematic Sistematic Nesistematic
Definiie
Tendina de
modificare pe
termen lung
Fluctuaii
regulate ce
apar n
interiorul unei
perioade de
12 luni i se
repet an de
an
Fluctuaii
aproximativ
regulate ce
apar la
intervale de
timp mai mari
de 1 an de
zile
Fluctuaii
reziduale
(ntmpltoar
e), care
rmn dup
evidenierea
celorlalte
componente



Factori de
influen
Schimbri n
populaie,
tehnologie,
educaie,
nivel de trai
etc.
Condiii
climaterice,
obiceiuri
religioase,
sociale etc.
Interaciunea
unor factori
ce
influeneaz
economia
Evenimente
neprevzute
(greve,
inundaii,
rzboaie etc.)
sau variaii
aleatoare ale
datelor
Durat
Un numr
mare de
termeni
Mai mic sau
egal cu 12
luni
De obicei 2-
10 ani
Durat scurt
i care nu se
repet

111
Modelul general al unei serii cronologice poate fi exprimat ca:

un model aditiv

Rt Ct St Tt t
y y y y y + + + =
,
Modelul aditiv se utilizeaz atunci cnd fluctuaiile rmn
constante n amplitudine fa de trend

ca un model multiplicativ
Rt Ct St Tt t
y y y y y =
.
Modelul multiplicativ se utilizeaz atunci cnd fluctuaiile
(regulate i neregulate) se amplific ori se diminueaz fa de
trend

112
Estimarea componentei trend
Caracterizarea i descrierea tendinei de lung durat se poate face folosind:
- metode statistice mecanice (simple)
- metode analitice.

n alegerea metodei un rol important l joac graficul statistic (cronograma)

Metode mecanice:
1. metoda modificrii medii absolute
2. metoda indicelui mediu de modificare
3. metoda mediilor mobile.

Metodele analitice presupun utilizarea unei funcii analitice de
tendin.

Tehnicile de netezire (sau ajustare) a seriei cronologice urmresc eliminarea
sau atenuarea oscilaiilor (fluctuaiilor) sistematice i nesistematice.
113
Estimarea componentei trend prin metoda mediilor mobile
(MMM)
MMM este utilizat cnd seria cronologic prezint fluctuaii regulate
(sezoniere sau ciclice), pentru a netezi evoluia fenomenului.
Trendul se determin sub form unor medii, calculate din atia
termeni (m), la ci se manifest o oscilaie complet.
Mediile se numesc mobile, glisante, deoarece n calculul unei astfel
de medii, se las n afar primul termen al mediei anterioare i se
introduce urmtorul termen.
Dac mediile mobile sunt calculate, de exemplu, din 5 termeni,
fiecare valoare ajustat va cuprinde termenul din perioada respectiv,
cei 2 termeni anteriori i cei 2 termeni urmtori.
2 , 3 ,
5
2 1 1 2
=
+ + + +
=
+ +
n t
y y y y y
y
t t t t t
tTMM
.
114
Dac mediile sunt calculate din m termeni si:
m este numr impar se vor pierde, prin calculul mediilor (m-1)
termeni i fiecare valoare ajustat va fi situat n dreptul unei valori
nregistrate.
m este numr par, atunci valorile medii se situeaz ntre termenii
reali i vom centra nivelurile, astfel ajustate, prin calculul unor medii de
medii (medii pariale). Spre exemplu, dac o oscilaie complet are loc la
6 termeni, atunci calculm medii mobile centrate:
3 , 4 ,
6
2 2
3
2 1 1 2
3
=
+ + + + + +
=
+
+ +

n t
y
y y y y y
y
y
t
t t t t t
t
tTMM
.
n acest caz se vor pierde, prin calculul mediilor centrate, m termeni.

Prin calculul mediilor mobile, abaterile sezoniere se compenseaz.
115
Exemplu
S considerm seria cronologic privind sosirile trimestriale de turiti, n
hotelul CREASTA dintr-o zon montan:
Trimestre
Anii
I II III IV
2003
2004
2005
2006
940 650 1934 1360
952 706 2072 1406
992 734 2088 1478
1026 740 2190 1492


Pentru calcularea tendinei pe termen lung, folosind metoda mediilor
mobile din 4 termeni (la ci se manifest o oscilaie complet), putem
sistematiza datele astfel:

116
Anul Trimestrul Perioada (t)
y
t
y
tT(MM)
0 1 2 3 4
2003
I
II
III
IV
1
2
3
4
940
650
1934
1360


1222
1231
2004
I
II
III
IV
5
6
7
8
952
706
2072
1406
1255
1278
1289
1297
2005
I
II
III
IV
9
10
11
12
992
734
2088
1478
1303
1314
1327
1332
2006
I
II
III
IV
13
14
15
16
1026
740
2190
1492
1346
1360




117
Prima medie mobil centrat este:
4
2 2
5
4 3 2
1
3
y
y y y
y
y
TMM
+ + + +
=

1222
4
2
952
1360 1934 650
2
940
3
~
+ + + +
=
TMM
y
persoane.
Cea de-a doua medie mobil centrat este:
1231
4
2
706
952 1360 1934
2
650
4
=
+ + + +
=
TMM
y
persoane
.a.m.d.

118
Reprezentarea grafic ilustreaz modul n care
mediile mobile permit determinarea tendinei de lung
durat, prin eliminarea oscilaiilor sezoniere.

0
500
1000
1500
2000
2500
Tr. I
'03
Tr. II
'03
Tr.
III
'03
Tr.
IV
'03
Tr. I
'04
Tr. II
'04
Tr.
III
'04
Tr.
IV
'04
Tr. I
'05
Tr. II
'05
Tr.
III
'05
Tr.
IV
'05
Tr. I
'06
Tr. II
'06
Tr.
III
'06
Tr.
IV
'06
p
e
r
s
o
a
n
e
Valori observate Medii mobile

119
Estimarea componentei sezoniere
Variaiile sezoniere pot s apar n interiorul unui an sau
chiar al unui interval mai scurt de timp, cum ar fi luna,
sptmna sau ziua.
Deci, pentru studiul statistic al componentei sezoniere
este necesar s avem la dispoziie date sistematizate pe
intervale de timp mai mici de un an de zile.
Pentru a msura efectul sezonier putem determina
devieri sezoniere sau indici de sezonalitate.
Devierile sezoniere msoar, n medie, abaterile
fiecrui sezon de la trend, iau valori pozitive i negative,
astfel nct suma devierilor sezoniere, pentru toate
sezoanele, este egal cu zero.
Indicii de sezonalitate msoar, n medie, de cte ori
se abate variabila, n fiecare sezon, de la trend, iau valori
supraunitare sau subunitare, astfel nct produsul lor
este egal cu 1.
120
Determinarea devierilor sezoniere
Pentru determinarea devierilor sezoniere se parcurg urmtorii pai:
1. Se nltur din valorile seriei cronologice (y
t
) componenta de
trend (y
tT
). Atunci:
y
t
-y
tT
=y
tS
+y
tR
.
2. Pentru fiecare sezon n parte, calculm media rezultatelor
obinute la pasul 1. Astfel, prin calculul mediei se nltur cea mai mare
parte din variaiile reziduale. Aceste medii, calculate pentru m sezoane,
msoar diferenele, fa de linia de tendin, date de componenta
sezonier.
3. Devierile sezoniere se vor calcula din valorile obinute la pasul 2,
ajustate astfel nct suma lor s fie egal cu zero.
|
.
|

\
|
=

=
m
k
Sk
y
1
0

121
Exemplu
Folosind datele din exemplul anterior, vom determina devierile
sezoniere ale variabilei, sosiri de turiti.
Pentru aceasta, vom nltura mai nti componenta de trend (col. 3
col. 4, tabelul anterior), iar rezultatele (y
tS
+y
tR
) le vom sistematiza n
tabelul de mai jos:
Trimestrul
Anii
I II III IV
Suma
0 1 2 3 4 5
2003
2004
2005
2006
712 129
-303 -572 783 109
-311 -580 761 746
-320 -620




Media -311,3 -590,7 752 128 -22
Deviere sezonier -306 -585 758 133 0



Exemplu
122
Pentru fiecare sezon vom determina media abaterilor:
pentru trimestrul I:
3 , 311
3
) 320 ( ) 311 ( 303
=
+ +
;
pentru trimestru II:
7 , 590
3
) 620 ( ) 580 ( 572
=
+ +
;
pentru trimestrul III:
752
3
761 783 712
=
+ +
;
pentru trimestrul IV:
128
3
146 109 129
=
+ +
.

123
Cum suma acestor medii ale abaterilor este diferit de zero:

=
= + + + =
4
1
22 128 752 ) 7 , 590 ( ) 3 , 311 (
k
Sk
y
,
vom ajusta mediile calculate cu valoarea
5 , 5
4
22
=

, obinnd
devieri sezoniere, astfel:
306 8 , 305 ) 5 , 5 ( 3 , 311
1
~ = =
S
y
persoane
585 2 , 585 ) 5 , 5 ( 7 , 590
2
~ = =
S
y
persoane
758 5 , 757 ) 5 , 5 ( 752
3
~ = =
S
y
persoane
134 5 , 133 ) 5 , 5 ( 128
4
~ = =
S
y
persoane
124
Devierile sezoniere n trimestrele I i II sunt
negative (niveluri sub trend), iar trimestrele III
i IV sunt pozitive (vrfuri de activitate)

Rezultatele ne arat c factorul sezonier deviaz
numrul sosirilor de turiti n trimestrul I cu 306
persoane sub linia de trend, n trimestrul II cu
585 persoane sub trend, iar n trimestrele III i
IV cu 758, respectiv, cu 133 persoane peste
tendina de lung durat.
125
Determinarea indicilor sezonieri
Pentru determinarea indicilor de sezonalitate, metodologia
este similar, parcurgndu-se paii:
1. Se nltur componenta de trend:
tR tS
tT
t
y y
y
y
=
.
2. Se calculeaz, pentru fiecare sezon, media rezultatelor
obinute la punctul 1, eliminnd astfel variaiile reziduale.
3. Indicii de sezonalitate se determin din mediile obinute la
pasul 2, ajustate astfel nct indicele mediu s fie egal cu 1.
Cele mai exacte rezultate se obin dac vom folosi n calcule
media geometric. Cu toate acestea, pentru uurina calculelor,
deseori se folosete media aritmetic.
126
Exemplu
Pe baza datelor din exemplul dat (slide 9), vom nltura
componenta de trend y
t
:y
tT
(col. 3:col. 4) i vom obine
y
tS
y
tR
, valori sistematizate n tabelul urmator.

Trimestrul
Anii
I II III IV
Produsul
0

1

2

3

4

5

2003
2004
2005
2006
1,583 1,105
0,759 0,552 1,607 1,084
0,761 0,559 1,573 1,112
0,762 0,554




Media 0,761 0,555 1,588 1,099 0,737
Indice de
sezonalitate
0,821 0,599 1,714 1,186 1,000

127
Pentru fiecare sezon determinm media valorilor astfel obinute:
pentru trimestrul I:
761 , 0 762 , 0 761 , 0 759 , 0
3
=
;
pentru trimestru II:
555 , 0 554 , 0 559 , 0 552 , 0
3
=
;
pentru trimestrul III:
588 , 1 573 , 1 607 , 1 583 , 1
3
=
;
pentru trimestrul IV:
099 , 1 110 , 1 084 , 1 105 , 1
3
=
.

128
Cum produsul acestor medii (geometrice) este diferit de 1:
737 , 0 099 , 1 588 , 1 555 , 0 761 , 0
4
1
= =
[
= k
Sk
y
, vom ajusta mediile calculate cu media
indicilor sezonieri, obinnd indici de sezonalitate, astfel:
Media indicilor sezonieri este calculat ca o medie geometric:

9265 , 0 = =
4
S4 S3 S2 S1 S
y y y y y
.
Indicii de sezonalitate vor fi subunitari n trimestrele I i II i
supraunitari n trimestrele III i IV.
y
S1
=0,761:0,9265=0,821
y
S2
=0,555:0,9265=0,599
y
S3
=1,588:0,9265=1,714
y
S4
=1,099:0,9265=1,186
Acum
1
4
1
=
[
= k
Sk
y
.

129
Indicii de sezonalitate arat c, n medie, sosirile de turiti:
- n trimestrele III i IV se afl peste tendina de lung durat cu
71,4%, respectiv cu 18,6%
- n trimestrele I i II, sosirile de turiti se situeaz sub linia de trend
cu 17,9%, respectiv cu 40,1%.
n previzionarea sosirilor de turiti va trebui s inem cont, pentru
fiecare trimestru, de influena factorului sezonier, influen
determinat sub forma devierilor sezoniere sau a indicilor de
sezonalitate.
Dup ce am determinat devierile sezoniere ori indicii de
sezonalitate, vom desezonaliza seria cronologic ((yt-ySk)
pentru devieri i yt/ySk pentru indici).
Rezultatele astfel obinute vor conine doar componenta trend (ytT)
i componenta rezidual (ytR).
Putem acum s determinm tendina de lung durat,
aplicnd o metod mecanic ori analitic.
Trebuie subliniat c in etapa de previzionare, va trebui s inem
cont i de devierile sezoniere sau de indicii de sezonalitate.
130
Previzionarea fenomenelor afectate de sezonalitate
n cazul fenomenelor afectate de sezonalitate, nivelurile
previzionate, pentru tendina pe termen lung pe sezoane, vor trebui
corectate cu factorul sezonier.
Astfel, n cazul n care am determinat devieri sezoniere, paii
pentru previzionare sunt:
1. Pentru seria desezonalizat ( tR tT Sk t
y y y y + =
) se determin trendul
( tT
y
), folosind o metod mecanic sau analitic.
2. Pentru perioada viitoare, se previzioneaz componenta de trend
T p n
y
) ( + .
3. Se adun valorile previzionate pe sezoane cu devierile sezoniere
( Sk
y
) pentru a obine previziunea final:
Sk T p n p n
y y y + =
+ + ) ( ) (


131
Exemplu
Pe baza datelor trimestriale, din perioada 2003-2006 (
1,16 t =
)
privind sosirile de turiti, n hotelul CREASTA, s-a determinat
tendina de lung durat (pentru seria desezonalizata) folosind
metoda modificrii medii absolute:
53 , 7 ) 1 ( 1246 + = t y
tT ,
n t , 1 =
,
16 = n


1246
1
=
T
y
; nT T
y y = = 1359
16
i devierile sezoniere (trimestriale), Sk
y
:
306
1
=
S
y
,
585
2
=
S
y
,
758
3
=
S
y
,
133
4
=
S
y
.

Pentru previzionarea sosirilor trimestriale de turiti, pentru anii
2007 i 2008 se determin rezultatele din tabelul urmator:

Exemplu
132
Previzionarea sosirilor trimestriale de turiti

Anul Trimestrul p
A + T p n
y
) (

Sk
y Previziune
) ( p n
y
+

2007



2008



I
II
III
IV
I
II
III
IV
1
2
3
4
5
6
7
8
1359+7,53=1367
1359+27,53=1374
1359+37,53=1382
1359+47,53=1389
1359+57,53=1397
1359+67,53=1404
1359+77,53=1412
1359+87,53=1419
-306
-585
758
133
-306
-585
758
133
1061
789
2140
1522
1091
819
2170
1552


133
n cazul n care factorul sezonier a fost msurat prin indici de
sezonalitate, atunci, pentru previzionare parcurgem paii:
1. Pentru seria desezonalizat (
tR tT Sk t
y y y / y + =
) se determin trendul
(
tT
y
), folosind o metod mecanic sau analitic.
2. Pentru perioada viitoare, se previzioneaz componenta de
trend T np
y
) ( .
3. Se corecteaz (prin nmulire) valorile previzionate pe
sezoane, cu indicii de sezonalitate ( Sk
y
) pentru a obine previziunea
final:
( ) ( ) Sk T p n p n
y y y =
+ +
.
134
Exemplu
Pe baza datelor trimestriale, din perioada 2003-2006 (
1,16 t =
) privind
sosirile de turiti, n hotelul CREASTA, s-a determinat tendina de
lung durat folosind metoda modificrii medii absolute:
53 , 7 ) 1 ( 1246 + = t y
tT ,
n t , 1 =
,
16 = n

1246
1
=
T
y
; nT T
y y = = 1359
16
i indicii de sezonalitate (pe trimestre), Sk
y
:
821 , 0
1
=
S
y
,
599 , 0
2
=
S
y
,
714 , 1
3
=
S
y
,
186 , 1
4
=
S
y


135
Previzionarea sosirilor trimestriale de turiti


Anul Trimestrul p
A + T p n
y
) (

Sk
y Previziune
) ( p n
y
+

2007



2008



I
II
III
IV
I
II
III
IV
1
2
3
4
5
6
7
8
1359+7,53=1367
1359+27,53=1374
1359+37,53=1382
1359+47,53=1389
1359+57,53=1397
1359+67,53=1404
1359+77,53=1412
1359+87,53=1419
0,821
0,599
1,714
1,186
0,821
0,599
1,714
1,186
1122
823
2369
1647
1147
840
2420
1683

S-ar putea să vă placă și