Documente Academic
Documente Profesional
Documente Cultură
Econometrie Curs
Econometrie Curs
e
ct
u (1.3.1)
unde:
Q = volumul fizic al produciei;
K = capitalul;
L = fora de munc;
e = numrul natural;
t = timpul;
u = variabil aleatoare;
A, , i c = parametrii funciei,
c estemsura econometric a influenei progresului tehnic asupra volumului produciei.
12
Sursa de date - Variabilele economice se introduc ntr-un model econometric cu
valorile lor reale sau empirice (yi = y1, y
2
, ,y
n;
xi = x1, x
2
,..., x
n
; n = numrul unitilor
observate). Aceste valori ale variabilelor unui model se pot obine pe dou ci: fie pe baza
sistemului informaional statistic (banca de date), fie prin efectuarea de observri statistice
special organizate - de tipul anchetelor statistice.
O problem fundamental care se ridic n aceast etap o reprezint calitatea datelor
statistice, respectiv autenticitatea i veridicitatea acestora. Dac un model economic se
construiete cu date false sau afectate de erori de msur, el va cpta aceste deficiene, fiind
compromis sub aspect operaional.
Deoarece problema autenticitii datelor economice ine de domeniul statisticii economice,
ne vom rezuma numai a aminti c datele statistice care privesc variabilele economice specificate n
model trebuie s fie culese fr erori sistematice de observare i de prelucrare, ndeplinind
condiiile de omogenitate. Omogenitatea datelor presupune:
- colectarea lor de la uniti statistice omogene;
- reprezentarea acelorai definiii i metodologii de calcul cu privire la sfera de
cuprindere ale acestora n timp sau n spaiu;
- descrierea evoluiei fenomenelor ntr-un interval de timp n care nu s-au produs
modificri fundamentale privind condiiile de desfurare a procesului analizat;
- exprimarea variabilelor n aceleai uniti de msur, condiie care se refer, n mod
special, la evaluarea indicatorilor economici n preuri comparabile sau preuri reale.
Materia prim" pentru calcule economice o constituie seriile cronologice (serii de timp
sau serii dinamice), mai rar seriile teritoriale, ale variabilelor economice respective, preluate sau
construite pe baza bncii de date statistice existente.
O serie cronologic se construiete prin observarea variabilelor Y i X pe perioade egale
de timp (t = 1,2,.., T, t reprezentnd luni, trimestre, ani) la aceeai unitate economic:
t 1 2 ... T
xt x1 x2 ... xT
yt y1 y2 ... yT
n comparaie cu aceasta, o serie de spaiu rezult prin observarea variabilelor Y i X
ntr-o anumit perioad de timp - lun, trimestru, semestru, an - la un anumit numr de
13
uniti socio-economice omogene, i = 1,n, unde n = numrul unitilor de acelai profil, ce
aparin aceluiai sector economic etc. O astfel de serie se prezint, de regul, sub urmtoarea
form:
xi x1 x2 ... xn
yi y1 y2 ... yn
ntr-un model econometric, un fenomen economic X={xi},i = 1,n poate fi introdus cu
urmtoarele valori:
1) Valori reale sau empirice, x
i
= (x
1
, x
2
,.., xn), valori exprimate n uniti de msur
specifice naturii fenomenului X, ele fiind mrimi concrete i pozitive, deci aparin sistemului
numerelor raionale. Vectorul valorilor lui X, x
i
= (x1, x2,.., xn), poate fi definit prin doi parametri:
- media aritmetic a variabilei X
= =
n
i
i x x
n
x M
1
1
) ( (1.3.2)
- abaterea medie patratica a variabilei X
=
= = =
n
i
i x x x x x
n
M
1
2 2
2
(
1
) (
) o o
(1.3.3)
) (
2 2
x
M
x
=
o
fiind dispersia variabilei.
De obicei, se considera ca variabila X urmeaza o distributie normala de medie x si de
abatere medie patratica x : L(x) = N( x , x).
2) Valorile centrate :
x x x i i
=
*
Aceste valori sunt tot mrimi concrete, dar ele aparin sistemului numerelor reale avnd
att valori pozitive ct i negative.
14
Se poate demonstra uor c aceste valori centrate au media egal cu zero, iar dispersia lor
este egal cu dispersia valorilor reale:
0 ) (
1
) (
*
= =
x x x i
n
M (1.3.4)
) ( ) (
1
) (
1
] ) [(
2
2 2
*
2
*
x x x x x
M
n n
M
i
= = =
(1.3.5)
3) Valori centrate i normate sau abateri standard:
ox
i
i
x x
x
=
* *
Media si dispersia acestor valori este:
0
1
) (
* *
=
=
ox
i x x
x
n
M (1.3.6)
1
1
] ) [(
2
2
2
2
* *
= =
|
|
|
.
|
\
|
=
o
o
o
x
x
x
i x x
x
n
M (1.3.7)
n plus fa de aceste dou proprieti L(x**) = N(0;1)
2
, abaterile standard sunt mrimi
abstracte (adimensionale). Aceste caliti conduc, att la diminuarea calculelor statistice cu
aceste valori, ct i la efectuarea de comparaii ntre distribuiile mai multor fenomene
economice de naturi diferite.
Un model econometric poate fi format dintr-o singur relaie sau dintr-un sistem de
relaii statistice. Aceste relaii pot fi: relaii de identitate sau deterministe, relaii de
comportament, relaii tehnologice i relaii instituionale.
2
Relaia L(x**) = N(0;1) se citete: variabila ( ) x
i
x
x x
=
o
1
* *
urmeaz legea de probabilitate
normal avnd media egal cu zero iar abaterea medie ptratic este egal cu unu (legea normal, centrat i
redus).
15
Relaiile de identitate sunt de tipul ecuaiilor de balan folosite n Sistemul de balane
ale economiei naionale"
Relaiile de comportament sunt acele ecuaii stochastice care reflect i modeleaz
un proces de luare a deciziei, care ncearc s descrie rspunsul variabilei endogene Y, sub forma
deciziei, la un set de valori ale variabilelor exogene. De exemplu, ntr-un model
macroeconomic, relaiile de comportament se refer la dependene privind consumul,
investiiile, importul i exportul, sistemul de preuri, cererea monetar, etc.
Relaiile tehnologice descriu att imperativele de ordin tehnologic privind producia ct
i relaiile tehnico-economice existente n producie, fora de munc i fondurile de producie ale
unei uniti, ale unei ramuri sau ale economiei naionale. Aceste relaii tehnologice sunt
reprezentate de cunoscutele funcii de producie de diferite tipuri.
Relaiile instituionale sunt folosite pentru a explica n mod determinist sau stochastic
fenomenele care sunt determinate fie de lege, fie de tradiie sau fie de obiceiuri. Din rndul
acestora fac parte, de exemplu, ecuaiile care explic stabilirea impozitelor sau a cotizaiilor n
funcie de venit.
Tipologia modelelor econometrice este extrem de vast. Totui, un model econometric
poate fi construit prin intermediul unei singure ecuaii de comportament, tehnologice sau
instituionale, sau cu ajutorul unui sistem de ecuaii de genul celor patru relaii, menionate mai
sus, denumite modele cu ecuaii multiple.
Testele statistice
3
sunt instrumente de lucru indispensabile investigaiei
econometrice. Necesitatea utilizrii acestora este determinat de faptul c demersul
econometric const ntr-o niruire logic de ipoteze privind semnificaia variabilelor exogene, a
calitii estimaiilor obinute, a gradului de performan a modelelor construite.
Acceptarea sau respiungerea ipotezelor formulate n econometrie se poate face cu ajutorul mai
multor teste, cele mai uzuale fiind: testul
2
, testul t, testul F etc.
Pe lng aceste teste statistice, n practica curent, n diverse domenii, se folosete
frecvent un test denumit testul erorii". n general, aplicarea acestui test presupune compararea a
dou valori:
0 = valoarea observat sau estimat;
T = valoarea teoretic, ateptat sau prognozat.
3
Vezi- ipotez statistic, test, eroare de gradul 1 i gradul 2, preg de semnificaie, nivel de semnificaie- Dicionar
statistic economic, D.C.S., Bucureti, 1969
16
Pe baza celor dou valori se definesc:
- eroarea absolut, T
ea
= 0 ;
- eroarea relativ, 100 *
0
T
T
er
=
Se construiesc cele dou ipoteze:
H0: 0 T ;
H1: 0 T.
Stabilindu-se arbitrar o valoare absoluta (Ea) sau relativa (Er)
4
de echivalare a celor doua
valori, (0) si (T), regula de (alegere) decizie a celor doua ipoteze este urmatoarea:
este acceptat ipoteza H0 dac Ea e
a
sau Er e
r
. cele dou valori, (0) i (T), sunt
echivalente, adic diferenele dintre ele sunt ntmplatoare i nu sistematice;
este acceptat ipoteza H1 dac Ea > e
a
sau Er > e
r
. cele doua valori, (0) si (T), difer
semnificativ si nu pot fi considerate ca echivalente, respectiv extrase din aceeai urn sau dintr-o
colectivitate omogen.
Acest test al erorii este utilizat n mod curent n domeniul analizei statistico-economice a
variatiei n timp i/sau n spaiu a unui fenomen economic, dar poate fi aplicat i n domeniul
econometriei, dar cu discernamnt i nu n mod excesiv.
4
Un astfel de test i criteriu de decizie se utilizeaz n comerul cu produse mbuteliate sau ambalate pentru care, de
regul, criteriul de decizie este de 5% din volumul sau greutatea , T, a ambalajului
17
1.3. ntrebri
1. Care este definiia istoric a econometriei formulat de catre R. Frisch?
2. Care este definiia extins a econometriei promovat de economitii din
rile anglo-saxone?
3. Definii modelul economic.
4. Definii variabilele economice.
5. Definii variabilele aleatoare.
6. Care sunt cele dou motive pentru care se recurge la variabila timp?
7. Ce presupune omogenitatea datelor?
8. Care sunt relaiile statistice ce formeaz un model econometric?
Definii-le.
9. Cu ce valori poate fi introdus un fenomen economic ntr-un model
econometric?
10. Ce presupune testul erorii?
18
1.4. Probleme rezolvate
A. Caz privind asocierea a dou variabile alternative (binare)
O societate comercial se aprovizioneaz de la 2 furnizori A i B. Dup primirea
ultimelor dou loturi de piese se tie c:
- furnizorul A a trimis 400 de piese din care 60 au fost rebuturi;
- furnizorul B a trimis 600 de piese din care 70 au fost rebuturi.
Conducerea societii ar dori s renune la furnizorul A pe motivul unei caliti
inferioare a produselor sale n raport cu cele ale furnizorului B. Este corect aceast decizie?
Rezolvare:
Fundamentarea statistic a deciziilor corecte se poate realiza prin sistematizarea
datelor ntr-un tabel de forma:
Tabelul 1.
Denumirea
furnizorului
(x
i
)
Calitatea pieselor (y
j
) Total
(N
i
)
Rebuturi bune
A 60 340 400
B 70 530 (n
ij
) 600
Total ( N
j
) 130 870 1000 (N)
unde:
X = { x
i
}, i = k , 1 variabila independent,
x
1
= furnizorul A,
x
2
= furnizorul B,
Y = {y
j
} , j = m , 1 variabila dependent,
y
1
= piese rebut,
y
2
= piese bune,
19
n
ij
= frecvenele condiionate ale variabilei Y, de exemplu:
n
11
= piesele rebut trimise de furnizorul A,
n
22
= piesele bune trimise de furnizorul B.
n urma acestei sistematizri a rezultat o serie statistic bidimensional, cu dou
variabile binare X i Y, rezultnd dou distribuii marginale:
i dou distribuii condiionate ale variabilei Y (calitatea pieselor) n funcie de furnizori:
N
. i
= frecvenele marginale ale variabilei X,
N
j .
= frecvenele marginale ale variabilei Y,
N =
i
N
. i
=
j
N
j .
=
i
j
n
ij
= numrul total al observaiilor.
n cazul unei distribuii bidimensionale, n funcie de modul de distribuire al
frecvenelor n
ij
, se poate constata:
a) independen total ntre cele dou variabile dac
n
ij
=
k
N
i.
= ct sau n
ij
=
m
N
j .
=ct ;
b) o dependen strict ntre cele dou variabile dac frecvenele condiionate n
ij
se
distribuie numai pe diagonala principal a tabelului (corelare pozitiv, x
1
cu y
1
i x
2
cu y
2
) sau
numai pe diagonala secundar a tabelului (corelare negativ, x
1
cu y
2
i x
2
cu y
1
), pentru
celelalte rubrici ale tabelului aceste frecvene fiind egale cu zero;
|
|
.
|
\
| = =
600 400
0 1
:
2 1
x x
X
|
|
.
|
\
| = =
340 60
0 1
:
2 1
y y
y
A
|
|
.
|
\
| = =
530 70
0 1
:
2 1
y y
y
B
|
|
.
|
\
| = =
870 130
0 1
:
2 1
y y
Y
20
c) o dependen statistic dac frecvenele condiionate n
ij
se distribuie ntr-un mod
diferit de cele dou cazuri a) i b); n aceast situaie, analiza static va conduce fie la acceptarea
cazului a) (independen), fie la acceptarea cazului c) (dependen slab, medie, puternic etc).
Analiznd datele din tabelul 1.1.1. se observ c distribuia frecvenelor
condiionate n
ij
se ncadreaz n cazul c). Deci, n cadrul acestei probleme, decizia corect
poate fi luat pe baza a cel puin trei procedee statistice.
a) Testul diferenei dou medii
Se tie c dac:
t
c
=
1 1
2
2
1
2
2 1
2 1
n n
x x
x x
o o
> t
o
,
cele dou medii
1
x i
2
x sunt semnificativ diferite de zero i, invers,
1
x =
2
x dac:
t
c
=
1 1
2
2
1
2
2 1
2 1
n n
x x
x x
o o
< t
o
unde:
t
a
= argumentul distribuiei normale, dac n >3 0 , sau argumentul distribuiei
Student, dac n < 30;
o = pragul de semnificaie (riscul) cu ajutorul cruia se alege decizia corect; de
regul, n economie se lucreaz cu un prag de semnificaie de 0,05 (5%) sau, cel mult, de 0,01
(1%).
n cazul de fa, aplicarea acestui test const n efectuarea urmtoarelor calcule:
- calculul procentului mediu al rebuturilor pe fiecare furnizor:
21
f
A
=
. 1
11
N
n
=
400
60
= 0,15 sau 15% f
B
=
. 2
21
N
n
=
600
70
= 0,1167 sau 11,67%
- calculul dispersiilor:
2
A
o = f
A
(1 - f
A
) = 0,15- 0,85 = 0,1275
2
B
o = f
B
(1 - f
B
) = 0,1167 - 0,8833 = 0,1031
- alegerea pragului de semnificaie o i preluarea valorii acestuia din tabelul
distribuiei respective; pentru o = 0,05,din tabela distribuiei normale se preia valoarea t
05 , 0
=
1,96 .
- compararea valorii empirice a variabilei t
c
cu valoarea sa teoretic t
05 , 0
:
t
c
=
599
1031 , 0
399
1275 , 0
1167 , 0 15 , 0
+
1 1
2
2
1
2
N N
f f
B A
B A
o o
=1, 5
- interpretarea testului:
Deoarece t
c
= 1,5 < t
05 , 0
= 1,96 rezult c ntre calitatea pieselor livrate de cei doi
furnizori, cu o probabilitate de 0,95 (95%), nu se poate accepta o diferen semnificativ i, ca
atare, nu este corect decizia de a se renuna la furnizorul A pe motivul unei mai slabe caliti a
pieselor.
b) Testul
2
_
Aplicarea testului
2
_ const n compararea unei valori empirice
cu o valoare
teoretic
2
;v a
_ , unde:
o = pragul de semnificaie;
v= (k-1)(m - 1) = numrul gradelor de libertate, m fiind numrul de grupe n funcie
de variabila Y (y
j
,
,j = m , 1 ), iar k este numrul de grupe n funcie de variabila X (x
i
,i
= k , 1 ), preluat din tabela distribuiei
2
_ n funcie de un prag de semnificaie o i de
numrul gradelor de libertate v . n acest caz, pentru o = 0,05 i v = (2 - 1)(2 - 1) =1, din
tabel rezult
2
1 ; 05 , 0
_ =3,84,iar pentru o = 0,01 rezult
2
1 ; 01 , 0
_
=
6,63 .
2
c
_
22
Valoarea empiric a variabilei aleatoare
2
c
_
se calculeaz cu relaia:
2
c
_ =
i
j
( )
2
-
-
ij
ij ij
n
n n
unde:
n
ij
= frecvenele reale, i = 1,2
,
j =1,2;
n* = frecvenele teoretice n cazul independenei totale a celor dou variabile x
i
i y
j
;
n
-
ij
=
N
N N
j i . .
- calculul acestor frecvene teoretice rezult din urmtoarele relaii:
n
-
11
=
N
N N
1 . . 1
= 52
1000
130 400
=
-
n
-
12
=
N
N N
2 . . 1
= 348
1000
870 400
=
-
n
-
21
= 78
1000
130 600
1 . 2
=
-
=
N
N N
n
-
22
= 522
1000
870 600 .
2 . 2
=
-
=
N
N N
-calculul valorii empirice:
2
c
_ =
( )
2
2
1
2
1
-
-
= =
ij
ij ij
j i
n
n n
2
c
_ =
( ) ( ) ( ) ( )
36 , 2 35779 , 2
522
522 530
78
78 70
348
348 340
52
52 60
2 2 2 2
~ =
Utilizarea testului
2
_ se bazeaz pe urmtoarele reguli de decizie:
- dac
2
c
_
<
2
;v a
_ , rezult c cele dou variabile X i Y sunt independente;
- dac
2
c
_ >
2
;v a
_ , rezult c cele dou variabile X i Y nu sunt independente.
23
Deoarece
2
c
_ =
2,36 <
2
1 ; 05 , 0
_ =3,84, rezult c cele dou variabile sunt independente, deci
calitatea pieselor nu depinde de tipul furnizorilor i, ca atare, nici decizia de a rezilia contractul
cu furnizorul A nu este justificat.
c) n cazul unei grupri combinate de 2x2, adic 2 variabile care au 2 variante,
analiza statistic a legturii dintre acestea se poate face i cu ajutorul coeficientului de
asociere al lui Yulle, definit prin relaia:
=
c
u
cu abaterea medie ptratic:
Acest coeficient este definit n intervalul | | 1 ; 1 e u , avnd semnificaia:
u = -1 corelaie strict negativ ntre variabile;
u = 0 independen ntre variabile;
u = 1 corelaie strict pozitiv ntre variabile.
Pentru cazul analizat, valorile acestor indicatori sunt:
tiind c variabila u este o variabil aleatoare ce urmeaz o distribuie normal
N(0,
u
o ), valoarea empiric
c
u se accept c este semnificativ diferit de zero daca,
rezulta ca intre cele doua variabilesemnificativ diferit de zero dac
21 12 22 11
21 12 22 11
n n n n
n n n n
+
22 21 12 11
2
0
1 1 1 1
2
1
n n n n
+ + +
=
u
o
1437 , 0
23800 31800
23800 31800
70 340 530 60
70 340 530 60
=
+
=
- + -
- -
=
c
u
0926 , 0
70
1
530
1
60
1
340
1
2
0207 , 0 1
= + + +
=
u
o
o
u
o
u
t
c
>
24
rezult c ntre cele doua variabile exist o legtur, iar dac
u
o
u
c
<
o
t rezult c
valoarea lui
c
u nu este semnificativ diferit de zero, ceea ce presupune c cele dou variabile
sunt independente.
tiind c t
05 , 0
= 1,96 iar valoarea
u
o
u
c
=
0926 , 0
1439 , 0
=1,55< t
05 , 0
=1,96 ,
rezult c cele dou variabile sunt independente, situaie care conduce la aceeai concluzie ca
i n cazul punctelor a) i b): rezilierea contractului cu furnizorul A nu poate fi justificat de
aprecierea unei caliti mai slabe a produselor acestuia.
B. Caz privind asocierea a dou variabile calitative nealternative
n urma efecturii unui sondaj statistic s-au obinut urmtoarele date privind distribuia pe
ramuri ale economiei naionale a omerilor, grupai pe trepte de calificare:
Tabelul 1
Ramuri
ale
economiei
( )
i
x
Trepte de calificare a omerilor ( )
j
y Total
persoane
( )
. i
N
necalificai
calificare
medie i
profesional
calificare
superioar
Industrie
400
500
257
200
143
100
800
Construcii
100
100
64
50
36
50
200
Alte
ramuri
200
100
129
200
71
100
( )
ij
n
400
Total
persoane
( )
j
N
.
700 450 250 1400 (N)
Analizai datele din tabel i precizai dac se poate admite o asociere ntre profilul
ramurilor economice i calificarea omerilor.
25
Rezolvare:
Datele problemei se refer la dependena dintre dou variabile nominale
k i x X
i
, 1 , ( = - ramurile economiei naionale) i m j y Y
j
, 1 , ( = - trepte de calificare ale
omerilor) ale cror variante sunt n numr mai mare de dou (k=3>2, m= 3>2)- cazul unui tabel
de k m rubrici. Deoarece frecvenele condiionate
ij
n nu sunt nici constante pe liniile tabelului
i nici distribuite numai pe rubricile diagonalei principale sau secundare, distribuia acestora arat
c poate fi acceptat ipoteza unei dependene statistice ntre cele dou variabile. n acest caz,
acceptarea sau respingerea ipotezei de dependen statistic dintre cele dou variabile se poate
face cu ajutorul testului
2
_ . Utilizarea acestui test presupune urmtoarele operaii:
- preluarea valorii teoretice a variabilei
2
_ din tabel n funcie de un prag de
semnificaie o i de numrul gradelor de libertate ), 1 )( 1 ( = m k v respectiv pentru o =
0,05 i v = (3-1)(3-1)=4 din tabel rezultnd 94 , 9
2
4 ; 05 , 0
= _ , iar pentru o = 0,01, 3 , 13
2
4 ; 01 , 0
= _ .
- calculul valorii empirice a variabilei aleatoare
2
c
_
cu ajutorul relaiei:
2
c
_
=
( )
2
-
-
ij
ij ij
j i
n
n n
unde: n
ij
= frecvenele reale, i = , 3 , 1 j= ; 3 , 1
-
ij
n = frecvenele teoretice n cazul independenei totale a celor dou variabile X i Y;
Pe baza datelor din tabel, aceste frecvene teoretice sunt egale cu:
400
1400
700 800 .
1 . 1
11
=
= =
-
N
N N
n 257
1400
450 800
2 . . 1
12
=
= =
-
N
N N
n
143
1400
250 800
3 . . 1
13
=
= =
-
N
N N
n 100
1400
700 200
1 . . 2
21
=
= =
-
N
N N
n
N
N N
n
j i
ij
. .
=
-
26
64
1400
450 200
2 . . 2
22
=
= =
-
N
N N
n 36
1400
250 200
3 . . 2
23
= =
-
N
N N
n
200
1400
700 400
1 . . 3
31
=
= =
-
N
N N
n 129
1400
450 400
2 . . 3
32
=
= =
-
N
N N
n
71
1400
250 400
3 . . 3
33
=
= =
-
N
N N
n
( ) ( ) ( ) ( )
+
=
2 2 2 2
2
100
100 100
143
143 100
257
257 200
400
400 500
c
_
( ) ( ) ( ) ( )
+
+
2 2 2 2
129
129 200
200
200 200
36
36 50
64
64 50 ( )
160
2
71
71 100
=
-compararea valorii empirice
2
c
_ cu valoarea sa teoretic:
Deoarece
2
c
_ = 160 > 94 , 9
2
4 ; 05 , 0
= _ rezult c ipoteza de independen dintre
variabile nu poate fi acceptat i, deci, distribuia omerilor pe trepte de calificare este
influenat de structura pe ramuri ale economiei naionale. Cu alte cuvinte, trecerea n omaj a
salariailor nu s-a fcut ntmpltor, predominnd omerii necalificai, urmnd cei cu pregtire
medie i, pe ultimul loc, omerii cu pregtire superioar
C. Caz privind asocierea dintre o variabil calitativ independent i o
variabil numeric dependent
O ntreprindere de automobile poate s-i echipeze vehiculele cu dou tipuri de
pneuri A i B. n urma ncercrii a dou loturi de 100 de pneuri din fiecare tip au rezultat
urmtoarele date:
Tabelul.3.
27
Tipuri de
pneuri
( ) k i x
i
, 1 , =
Rezistena la uzur (1000 km parcuri)
( ) m j y
j
, 1 , =
Total
( )
. i
N sub 25 25-30 30-35 35-40 40-45 peste 45
A 2 8 20 40 20 10 100
B 17 13 40 20 8
( )
ij
n
2 100
Total ( )
j
N
.
19 21 60 60 28 12 200 (N)
Recomandai ntreprinderii ce tip de pneu va trebui s foloseasc, tiind c preul de
vnzare a celor dou tipuri de pneuri este acelai.
Rezolvare:
Aceast problem abordeaz cazul dependenei dintre dou variabile de natur diferit.
Variabila cauzal X - tipurile de pneuri, este o caracteristic nominal, n timp ce variabila
efect Y - rezistena la uzur, este o variabil numeric.
Rezolvarea acestei probleme presupune parcurgerea a dou etape:
- prima etap se refer la acceptarea sau respingerea ipotezei de dependen dintre
cele dou variabile;
- a doua etap urmeaz numai n cazul acceptrii ipotezei de dependen ntre
variabile i necesit alegerea tipului de pneu cu cea mai mare rezisten la uzur; se deduce
uor c n cazul independenei dintre cele dou variabile, rezistena la uzur nu depinde
de tipul pneului, ntreprinderea putnd utiliza oricare dintre ele.
O astfel de problem poate fi rezolvat cu ajutorul mai multor procedee statistice -
testul
2
_ , testul diferenei dintre dou medii i metoda analizei variaiei.
Deoarece primele dou procedee au fost deja expuse (vezi problemele A i B) i, n
plus, acestea necesit calcule suplimentare, pentru etapa a doua recomandm abordarea unor
probleme de acest tip cu ajutorul metodei analizei variaiei.
Metoda analizei variaiei se fundamenteaz pe discuia urmtoarelor distribuii:
- distribuia marginal a variabilei ; , 1 , :
.
m j
N
y
Y
j
j
=
|
|
.
|
\
|
- distribuiile condiionate ale variabilei Y n funcie de variantele variabilei factoriale
. , 1 , , 1 , : : m j k i
n
y
Y X
ij
j
x
i
= =
|
|
.
|
\
|
28
Pe baza acestor distribuii se calculeaz trei mrimi:
- variana total
2
0
V (sau dispersia total ) calculat pe baza distribuiei
marginale a lui Y cu ajutorul relaiei:
( ) ( )
j j
j
ij j
m
j
k
i
N y y n y y V
.
2
0
2
0
1 1
2
0
= =
= =
unde:
N
N y
N
N y
n
n y
y
i
i
i
j
j j
j
ij
i
j
ij j
i
.
.
0
= = =
reprezint media distribuiei marginale,iar
i
x i
y y = sunt mediile condoionate ale variabilei Y in
funcie de variantele variabilei factoriale X.
. i
j
ij j
j
ij
ij
j
j
i
N
n y
n
n y
y
= =
Aceast mrime,
2
0
V , msoar variaia total a variabilei Y generat de influena ntregului
complex de factori ce o determin.
- variana dintre grupe
2
x
V este msura variaiei variabilei Y generat de variaia
caracteristicii factoriale X. Aceast mrime se calculeaz cu relaia:
- variana rezidual
2
u
V este o mrime care exprim variaia caracteristicii Y generat
de factorii considerai aleatori, exceptnd influena factorului X. Relaia de calcul a acestei mrimi
este:
( )
ij
j
i i
i
u
n y y V
2
2
=
Se poate demonstra c ntre cele trei mrimi exist relaia:
2
0
V =
2
x
V +
2
u
V
N
V
2
0 2
0
= o
( ) ( )
.
2
0
2
0
2
i
i
i ij
j
i
i
x
N y y n y y V
= =
29
+
|
=
dependente strict variabile 1
puternic corelatie
0,5
slab corelatie
te independen variabile 0
R Dac
Raportnd relaia de mai sus la
2
0
V se obine contribuia relativ a factorului esenial
|
|
.
|
\
|
%
2
0
2
V
V
X
x
i a factorilor ntmpltori
|
|
.
|
\
|
%
2
0
2
V
V
u
u
la explicarea variaiei totale.
100= 100 100
2
0
2
2
0
2
+
V
V
V
V
u x
Indicatorul
2
0
2
2
0
2
1
V
V
V
V
R
u x
= = poart numele de raport de corelaie empiric i
exprim intensitatea legturii dintre cele dou variabile. Se deduce uor c acest indicator
este definit n intervalul | |. 1 , 0
Interpretarea valorilor raportului de corelaie empiric se face pe baza urmtoarelor reguli:
Dac datele provin dintr-o cercetare selectiv, nainte de a explica variaia lui Y i a
interpreta valoarea raportului de corelaie empiric va trebui s se verifice semnificaia
rezultatelor. Testarea semnificaiei rezultatelor se face cu ajutorul testului
- testul Fisher-
Snedecor.
Rezultatele se consider semnificative (R este semnificativ diferit de zero) dac exist
inegalitatea:
2 1
; ; v v c
F F
o
>
30
unde:
k N
V
k
V
F
u
x
c
=
2
2
1
, reprezint valoarea empiric a variabilei Fisher-Snedecor;
2 1
; ; v v
F
o
, k N k = =
2 1
, 1v v este valoarea teoretic preluat din tabela distribuiei Fisher-
Snedecor n funcie de un prag de semnificaie o i de numrul gradelor de libertate
1
v i
2
v .
Pe baza datelor din tabelul 4 se vor calcula indicatorii necesari aplicrii metodei analizei
variaiei:
- calculul rezistenei medii la uzur ( )
A
y i a dispersiei ( )
2
A
o pentru pneurile de tip A.
Fie: k = mrimea intervalului de grupare, k=5;
a= mrimea centrului de interval cu frecvena maxim, a=37,5.
k = 5, a = 37,5 Tabelul. 4
Rezistena la uzur
(1000 km parcuri)
j
y
j
n
1
k
a y
j
j
j
n
k
a y
1
|
|
.
|
\
|
j
j
n
k
a y
1
2
|
|
.
|
\
|
20-25 22,5 2 -3 -6 18
25-30 27,5 8 -2 -16 32
30-35 32,5 20 -1 -20 20
35-40 37,5 40 0 0 0
40-45 42,5 20 1 20 20
45-50 47,5 10 2 20 40
Total - 100 - -2 130
31
4 , 37 5 , 37 5
100
2
1
1
= +
= +
|
|
.
|
\
|
=
a k
n
n
k
a y
y
j
j
j
A
( ) ( )
2
2
2
1
1
2
2
5 , 37 4 , 37 25
100
130
=
|
|
.
|
\
|
=
a y k
n
n
k
a y
A
j
j
j
A
o
49 , 32 01 , 0 5 , 32
2
= =
A
o
- calculul rezistenei medii la uzur ( )
B
y i al dispersiei ( )
2
B
o ) pentru pneurile de tip B.
k = 5, a= 32,5 Tabelul 5
Rezistena la
uzur (1000 km
parcuri)
j
y
j
n
2
k
a y
j
j
j
n
k
a y
2
|
|
.
|
\
|
j
j
n
k
a y
2
2
|
|
.
|
\
|
20-25 22,5 17 -2 -34 68
25-30 27,5 13 -1 -13 13
30-35 32,5 40 0 0 0
35-40 37,5 20 1 20 20
40-45 42,5 8 2 16 32
45-50 47,5 2 3 6 18
Total - 100 - -5 151
- calculul rezistenei medii la uzur ) (
0
y i al dispersiei ( )
2
0
o pe ansamblul celor dou tipuri
de pneuri (distribuia marginal a variabilei Y).
Tabelul 6
25 , 32 5 , 32 5
100
5
= +
=
B
y
( ) 69 , 37 06 , 0 75 , 37 5 , 32 25 , 32 25
100
151
2 2
= = =
B
o
32
Rezistena la
uzur
(1000 km parcuri)
j
y
j
N
.
k
a y
j
j
j
N
k
a y
.
|
|
.
|
\
|
j
j
N
k
a y
.
2
|
|
.
|
\
|
20-25 22,5 19 -2 -38 76
25-30 27,5 21 -1 -21 21
30-35 32,5 60 0 0 0
35-40 37,5 60 1 60 60
40-45 42,5 28 2 56 112
45-50 47,5 12 3 36 108
Total - 200 - 93 377
- calculul varianelor:
- Variana total
( ) ( )
= = =
j j
j j ij j
i
N N y y n y y V
2
0 .
2
0
2
0
2
0
o
8 , 8343 719 , 41 200
2
0
= = V
- Variana dintre grupe:
( ) ( ) ( )
= + = =
i
i i x
N y y V 13 , 1326 100 825 , 34 25 , 32 100 825 , 34 4 , 37
2 2
.
2
0
2
- Variana rezidual:
825 , 34 5 , 32 5
200
93
.
.
.
.
0
= + = +
|
|
.
|
\
|
= =
a k
N
N
k
a y
N
N y
y
j
j
j
j
j j
( )
( )
2
0
2
.
.
2
.
2
0 2
0
a y k
N
N
k
a y
N
N y y
j
j
j
j j
|
|
.
|
\
|
=
o
( ) 719 , 41 406 , 5 125 , 47
2
5 , 32 825 , 34 25
200
377
2
0
= = = o
33
( ) 7018 100 69 , 37 100 49 , 32
2
1 1
2
2
2
= + = = =
= j
i i ij i j
i
u
N n y y V o
- interpretarea rezultatelor se realizeaz utiliznd tabelul analizei variaiei:
Tabelul 7
Sursa de
variaie
Msura
variaiei
Nr.
grade de
libertate
Dispersia
corectat
Valoarea testului F
c
F
2 ; 1
; ; v v
F
o
Variana
dintre
grupe
( )
13 , 1326
.
2
0
2
=
=
i x
N y y V
i
k-1=1
13 , 1326
1
2
2
/
=
=
k
V
s
x
x y
F
0,05;1;198
=3,89
F
0,01;1;198
=6,76
Variana
rezidual
( )
7018
2
2
=
=
j
ij i j
i
u
n y y V
N-k=198
44 , 35
2
2
=
=
k N
V
s
u
u
-
-
Variana
total
( )
8 , 8343
2
0
2
0
=
=
i j
ij j
n y y V
N-1=199
-
-
-
Deoarece testul Fisher-Snedecor arat c rezultatele obinute nu sunt ntmpltoare, cu
un prag de semnificaie de 1%
, 76 , 6 42 , 37
198 ; 1 ; 01 , 0
= > = F F
C
ci sistematice, se vor calcula contribuia relativ a factorului
X - marca pneurilor, la explicarea variaiei variabilei Y
|
|
.
|
\
|
%
2
0
2
V
V
x
i raportul de corelaie
empirica (R):
% 89 , 15 100
8 , 8343
13 , 1326
100
2
0
2
= =
V
V
x
399 , 0
8 , 8343
13 , 1326
2
0
2
= = =
V
V
R
x
ntruct marca pneurilor explic n mic msur variaia total a uzurii pneurilor,
respectiv numai 15,89%, iar raportul de corelaie are o valoare de asemenea mic, 0,399,
42 , 37
2
2
/
=
=
u
x y
c
s
s
F
34
rezult faptul c tipul de pneuri nu reprezint un factor important al uzurii i, prin urmare,
ierarhizarea pneurilor nu se poate face n funcie de acest factor. Din acest punct de vedere,
ntreprinderea de automobile i poate echipa vehiculele cu orice tip de pneu, eventual alegerea
putndu-se realiza dup ali factori: faciliti de aprovizionare, renumele mrcii etc.
D Caz privind corelaia dintre dou variabile numerice
n urma unui studiu statistic efectuat asupra unui eantion de 110 societi comerciale
cu acelai profil a rezultat urmtoarea distribuie a acestora n funcie de capitalul social i de
profitul brut realizat:
Tabelul 8
Grupe de societi
dup mrimea
capitalului (mii. lei)
( )
i
x
Grupe de societi dup profitul brut (mii.lei)
( )
j
y
Total
( )
. i
N
sub 30 30-
50
50-
70
70-
90
90-
110
110-
130
130-
150
peste
150
sub 50 7 2 1 - - - - - 10
50 - 100 2 10 9 4 - - - - 25
100 - 150 1 4 15 10 6 4 - - 40
150 - 200 - - - 5 9 4 2 - 20
peste 200 - - - ) (
ij
n
- 3 7 5 15
Total ( )
j
N
.
10 16 25 19 15 11 9 5 110 (N)
Pe baza acestor rezultate se poate considera c mrimea profitului brut depinde n mod
hotrtor de capitalul social al societilor de acest profil?
Rezolvare:
Tabelul 8 poart numele de tabel de corelaie deoarece n cadrul acestuia, a fost
sistematizat distribuia celor 110 societi n funcie de dou variabile numerice:
X - capitalul social al societilor comerciale - variabil factorial;
Y - profitul brut al societilor comerciale - variabil rezultativ.
Un astfel de tabel se folosete n scopul acceptrii sau respingerii ipotezei de lucru,
respectiv din ansamblul factorilor de influen ai variabilei Y, factorul X este factorul hotrtor,
determinant al variabilei Y.
Fiind o serie bidimensional analiza acesteia se efectueaz dup aceleai principii
prezentate n aplicaia A. Deoarece frecvenele
ij
n se distribuie cu cele mai mari valori de-a
35
lungul diagonalei principale, dar nregistrnd valori i la stnga i la dreapta fa de aceast
diagonal, rezult c ntre cele dou variabile se manifest o legtur statistic n sens direct.
n acest caz, discuia legturii statistice se poate face cu ajutorul mai multor procedee cum
ar fi:
a) metoda analizei variaiei ;
b) i metoda regresiei.
ntruct metoda regresiei necesit precizri suplimentare, care vor fi fcute n capitolul
urmtor, caracterizarea statistic a dependenei dintre capitalul social i profitul brut al
societilor se va face numai cu ajutorul metodei analizei variaiei. Utilizarea sa n acest scop va
decurge n mod analog cu aplicarea sa din problema precedent:
- calculul mediilor pariale , 5 , 1 , ( = i y
i
5 - numrul grupelor de societi dup mrimea
capitalului) i al dispersiilor pariale ( ): 5 , 1 ,
2
= i
i
o
- profitul mediu brut ( )
1
y i dispersia ( )
2
1
o societilor comerciale al cror capital
este mai mic de 50 mii lei (a=20; K=20).
Tabelul 9
Profitul brut
(mii. lei)
j
n
1
j
y
k
a y
j
j
j
n
k
a y
1
|
|
.
|
\
|
j
j
n
k
a y
1
2
|
|
.
|
\
|
10-30 7 20 0 0 0
30-50 2 40 1 2 2
50-70 1 60 2 2 4
Total 10 - - 4 6
c s lei mii a k
j
j
n
j
j
n
k
a
j
y
y . / . 28 20 20
20
4
1
1
1
= + = +
|
|
.
|
\
|
=
\
|
=
a y k
n
n
k
a y
j
j
j
j
o
36
- pentru celelalte grupe de societi comerciale n funcie de capital, profiturile medii
brute i dispersiile corespunztoare s-au calculat pe baza distribuiilor condiionate
respective, rezultnd urmtoarele valori:
( )
52
2 199 50
= =
i
i i
x
N y y
V
- variana rezidual:
( ) ( )
= - = = =
i j j
j j ij j
N N y y n y y V 159588 8 , 1450 110
2
0 .
2
0
2
0
2
0
o
37
- interpretarea rezultatelor se realizeaz utiliznd tabelul analizei variaiei:
Tabelul 10
Sursa de
variaie
Msura variaiei
Nr.
grade
de
libertate
Dispersia
corectat
Valoarea testului F
c
F
2 1
; ; v v
F
o
Variana
dintre
grupe
( )
27 , 117540
.
2
0
2
=
=
i
i i x
N y y V
k-1=1
27 , 117540
1
2
2
/
=
=
k
V
s
x
X Y
01 , 302
2
2
/
=
=
u
X Y
c
s
s
F
92 , 3
198 ; 1 ; 05 , 0
= F
84 , 6
198 ; 1 ; 01 , 0
= F
Variana
rezidual
( )
42033
2
2
=
=
i j
ij i j u
n y y V
N-k=108
-
-
Variana
total
N-
1=109
-
-
-
Deoarece testul Fisher-Snedecor indic faptul c rezultatele sunt semnificative cu un prag
de semnificaie de 1% ( ) 84 , 6 01 , 302
108 ; 1 ; 01 , 0
= > = F F
c
, se vor calcula contribuia relativ a
factorului X - capitalul social, la explicarea variaiei variabilei Y
|
|
.
|
\
|
%
2
0
2
V
V
x
i raportul de corelaie
empiric (R):
% 65 , 73 100
159588
27 , 117540
100
2
0
2
= = -
V
V
x
858 , 0
159588
27 , 117540
2
0
2
= =
V
V
R
x
( )
42033 15 2 , 206
20 331 40 584 25 288 10 176
.
2
2
2
= +
+ + + + = = =
i
i i
i j
ij i j u
N n y y V o
( )
159588
2
0
2
0
=
=
i j
ij i
n y y V
19 , 389
2
2
=
=
k N
V
s
u
u
38
Deoarece mrimea capitalului social al societilor comerciale explic 73,65% din
variaia profitului brut al acestora, iar raportul de corelaie are o valoare de 0,858 (apropiat de
limita maxim 1) rezult c acest factor determin n mare msur profitul brut al societilor de
acest profil.
39
1.5. Probleme propuse
A. ntr-o secie de prelucrare a unei ntreprinderi exist dou prese (A i B), pe fiecare
din ele prelucrndu-se cte un lot de piese de acelai tip.
Datorit diminurii cererii acestui produs ntreprinderea trebuie s renune la una din
prese. S se menioneze la care pres trebuie s se renune cunoscnd urmtoarele rezultate
obinute n urma unei selecii:
- dintr-un lot de 1000 de piese executate la presa A, 2,5% au fost rebuturi;
- dintr-un lot de 800 de piese executate la presa B, 4,5% au fost rebuturi.
B. O fabric de frigidere primete motoare de la trei furnizori diferii. n ultimii 5 ani s-
au efectuat o serie de nregistrri referitoare la gravitatea problemelor constatate la motoarele
returnate de clieni pentru service n timpul perioadei de garanie. Aceste defeciuni au fost
clasificate n trei categorii: minore, majore i "nlocuit".
n tabelul urmtor sunt prezentate datele culese aleator referitoare la tipurile de defeciuni
constatate la motoarele returnate, grupate pe furnizori:
Furnizori
Tipul defeciunii: Total motoare
defecte
minor major nlocuit
A 15 25 18 58
B 8 16 10 34
C 18 26 20 64
Apreciai dac se poate admite c exist o diferen calitativ semnificativ ntre
motoarele livrate de cei trei furnizori.
C. n urma prelucrrii datelor unui sondaj statistic s-au obinut urmtoarele
rezultate:
Dimensiunea
societilor
comerciale
Rata profitului (%) Numrul
societilor
comerciale
observate
sub 5 5-10 10-15 15-20 peste
20
mici - 13 17 40 15 85
mijlocii 4 16 30 20 15 65
mari 2 8 15 12 8 45
40
Pe baza acestor date, se poate accepta ipoteza c rentabilitatea societilor
comerciale este invers proporional cu mrimea lor?
D Rezultatele obinute n urma unui sondaj efectuat n vederea stabilirii dac ntre
vrsta unui ofer i numrul abaterilor de circulaie efectuate de ctre acesta exist vreo
legtur sunt ilustrate n tabelul urmtor:
Vrsta
(ani)
Numrul de abateri
0 1-2 3-4 5 i peste
18-25 6 24 20 10
26-50 12 18 6 4
51-75 4 16 8 3
Poate fi considerat ca semnificativ vrsta persoanelor n explicarea numrului de
abateri de circulaie efectuate?
E. O societate comercial care desface zilnic un produs (lapte) trebuie s ncheie
un contract cu furnizorul privind aprovizionarea zilnic. La fiecare litru vndut n ziua
respectiv firma ctig 2000 lei i pierde 500 lei dac nu-l desface n ziua respectiv.
O statistic a desfacerilor din anul trecut se prezint astfel:
Cerere (litri
vndui)
Numr
de zile
90 80
100 120
130 60
150 50
160 30
200 20
Total 360
Acceptnd c distribuia cererii pe zilele anului este relativ stabil, recomandai cantitatea
cu care trebuie s se aprovizioneze zilnic firma pentru a obine profit maxim.
41
BIBLIOGRAFIE
1. Andrei, T. - Statistic i econometrie Editura Economic,
Bucureti, 2004.
2. Bourbonnais R , Econometrie, Ed. Dunod , Paris , 1998
3. Dormont B , Introduction a leconometrie , Ed. Montchrestien
, Paris , 1999
4. Florea I.(coordonator), Culegere de modele econometrice, Ed.
Muntele Sion,2000.
5. Iacob, A.I., Tnsoiu, O. Econometrie, Studii de caz, Ed. ASE,
Bucureti, 2005.
42
Capitolul 2
Testarea ipotezelor statistice
2.1.OBIECTIVE: introducerea studenilor n sfera i noiunile specifice testrii
ipotezelor statistice
2.2.PREZENTARE SINTETIC:
2.2.1. Concepte i erori n testarea ipotezelor statistice
n statistic, ipotezele apar ntotdeauna n perechi: ipoteza nul i ipoteza alternativ.
Ipoteza statistic ce urmeaz a fi testat se numete ipotez nul i este notat, uzual, H
0
. Ea
const ntotdeauna n admiterea caracterului ntmpltor al deosebirilor, adic n presupunerea c
nu exist deosebiri eseniale. Respingerea ipotezei nule care este testat implic acceptarea unei
alte ipoteze. Aceast alt ipotez este numit ipotez alternativ, notat H
1
. Cele dou ipoteze
reprezint teorii, mutual exclusive i exhaustive, asupra valorii parametrului populaiei sau legii
de repartiie. Spunem c ele sunt mutual exclusive deoarece este imposibil ca ambele ipoteze s
fie adevrate. Spunem c ele sunt exhaustive, deoarece acoper toate posibilitile, adic ori
ipoteza nul, ori ipoteza alternativ trebuie s fie adevrat.
Procedeul de verificare a unei ipoteze statistice se numete test sau criteriu de
semnificaie. O secven general de pai se aplic la toate situaiile de testare a ipotezelor
statistice. Ipotezele se vor schimba, tehnicile statistice aplicate se vor schimba, dar procesul
rmne acelai i anume:
1). Se identific ipoteza statistic special despre parametrul populaiei sau legea de
repartiie (H
0
). Ipoteza statistic numit i ipotez nul reprezint status quo-ul, ceea ce este
acceptat pn se dovedete a fi fals.
43
2). ntotdeauna ipoteza nul este nsoit de ipoteza alternativ (de cercetat), H
1
, ce
reprezint o teorie care contrazice ipoteza nul. Ea va fi acceptat doar cnd exist suficiente
dovezi, evidene, pentru a se stabili c este adevrat.
Dup natura posibilitilor de construire a ipotezelor nule i alternative, deosebim ipoteze
alternative simple sau compuse. Astfel, dac ipoteza nul const n afirmaia c parametrul al
unei distribuii este egal cu o anumit valoare
0
, iar ipoteza alternativ const n afirmaia c
parametrul este egal cu
1
, avem o ipotez alternativ simpl, iar dac ipoteza alternativ const
n afirmaia c parametrul ia una din mai multe valori, } ,..., , {
2 1 k
u u u u e , atunci avem o
ipotez alternativ compus.
3). Se calculeaz indicatorii statistici n eantion, utilizai pentru a accepta sau a respinge
ipoteza nul i se stabilete testul statistic ce va fi utilizat drept criteriu de acceptare sau de
respingere a ipotezei nule.
4). Se stabilete regiunea critic, R
c
. Regiunea critic reprezint valorile numerice ale
testului statistic pentru care ipoteza nul va fi respins. Regiunea critic este astfel aleas nct
probabilitatea ca ea s conin testul statistic, cnd ipoteza nul este adevrat s fie , cu mic
(=0.01 etc). Verificarea ipotezei nule se face pe baza unui eantion de volum n, extras din
populaia X, care este o variabil aleatoare. Dac punctul definit de vectorul de sondaj x
1
,x
2,,
x
n
cade n regiunea critic R
c
, ipoteza H
0
se respinge, iar dac punctul cade n afara regiunii critice
R
c
, ipoteza H
0
se accept. Regiunea critic este delimitat de valoarea critic, C punctul de
tietur n stabilirea acesteia.
n baza legii numerelor mari, numai ntr-un numr foarte mic de cazuri punctul rezultat din
sondaj va cdea n R
c
, majoritatea vor cdea n afara regiunii critice. Nu este ns exclus ca
punctul din sondaj s cad n regiunea critic, cu toate c ipoteza nul despre parametrul
populaiei este adevrat. Cu alte cuvinte, atunci cnd respingem ipoteza nul, trebuie s ne
gndim de dou ori, deoarece exist dou posibiliti: ea este fals ntr-adevr i ea este totui
adevrat, dei pe baza datelor din sondaj o respingem.
La fel i pentru situaia n care acceptm ipoteza nul H
0
. Cnd ipoteza nul nu poate fi
respins (nu exist suficiente dovezi pentru a fi respins), sunt dou posibiliti: ipoteza nul este
adevrat i ipoteza nul este totui fals, greit dei nu am respins-o. De aceea, este mai corect
44
s spunem c pe baza datelor din eantionul studiat, nu putem respinge ipoteza nul, dect
s spunem c ipoteza nul este adevrat.
Eroarea pe care o facem eliminnd o ipotez nul, dei este adevrat, se numete eroare
de genul nti. Probabilitatea comiterii unei astfel de erori reprezint riscul de genul nti () i
se numete nivel sau prag de semnificaie.
Nivelul de ncredere al unui test statistic este (1-) iar n expresie procentual, (1-)100
reprezint probabilitatea de garantare a rezultatelor.
Eroarea pe cere o facem acceptnd o ipotez nul, dei este fals, se numete eroare de
genul al doilea, iar probabilitatea (riscul) comiterii unei astfel de erori se noteaz cu . Puterea
testului statistic este (1-).
Tabelul de mai jos ilustreaz legtura dintre decizia pe care o lum referitor la ipoteza nul
i adevrul sau falsitatea acestei ipoteze.
Erorile n testarea ipotezelor statistice
Decizia de
acceptare
Ipoteza adevrat
H
0
H
1
0 1 2
H
0
Decizie corect
(probabilitate 1-)
Eroare de gen II
(risc )
H
1
Eroare de gen I
(risc )
Decizie corect
(probabilitate 1-)
Cu ct probabilitile comiterii erorilor de genul nti i de genul al doilea sunt mai mici, cu
att testul este mai bun. Acest lucru se poate realiza prin mrirea volumului eantionului, n.
Nivelurile riscurilor se stabilesc n funcie de considerente economice i de natura testului.
Am vzut c:
= P(respingere H
0
H
0
este corect)=P(eroare de gen I)
= P(acceptare H
0
H
0
este fals)=P(eroare de gen II)
Alegerea nivelului (pragului) de semnificaie depinde i de costurile asociate cu
producerea unei erori de genul I.
45
Spre exemplu, pragul de semnificaie ales de o firm ce fabric ngheat, interesat n
greutatea medie a cutiilor de ngheat va putea fi diferit de pragul de semnificaie ales de o
companie farmaceutic, interesat de cantitatea medie a unui ingredient activ dintr-un tip de
medicament. Evident, costul n prima situaie prezentat este mult mai mic, comparativ cu costul
asociat n cazul producerii unei erori de genul I pentru compania farmaceutic: o cantitate prea
mic de ingredient activ poate face medicamentul ineficient; o cantitate prea mare de ingredient
activ poate cauza efecte secundare, duntoare sau poate avea, chiar, efecte letale.
Similar, exist costuri asociate cu producerea unei erori de genul al II-lea. ntre eroarea de
genul I i eroarea de genul al II-lea exist o legtur, o condiionare. O modalitate de a vizualiza
aceast legtur este s presupunem c exist doar dou distribuii care ne intereseaz. O
distribuie corespunde ipotezei nule H
0
, iar cealalt corespunde ipotezei alternativei H
1
. n acest
caz, presupunem c i ipoteza nul i cea alternativ sunt ipoteze simple. ntr-o manier uor de
neles, s considerm c ipoteza nul este de forma H
0
: =
0
, iar ipoteza alternativ este de forma
H
1
:=
1
(vezi fig):
Legtura dintre probabilitile i
Pe grafic se observ c cele dou distribuii se suprapun i, din procesul de testare a
ipotezei nule, pot rezulta dou tipuri de erori.
Eroarea de genul I apare atunci cnd respingem ipoteza nul H
0
, n situaia n care, de fapt,
aceasta este adevrat. Adic, dei distribuia lui x este cea corespunztoare ipotezei H
0
,
respingem H
0
, deoarece media de sondaj este mai mare dect valoarea critic, C i se situeaz n
regiunea critic. Probabilitatea comiterii unei astfel de erori (o) este aria de sub curba de dis-
tribuie H
0
care se situeaz la dreapta valorii critice C.
Eroarea de genul al doilea apare atunci cnd nu respingem (adic acceptm) H
0
, dei H
1
n
loc de H
0
este corect. n acest caz, dei distribuia lui x este cea corespunztoare ipotezei H
1
,
46
acceptm H
0
deoarece media de sondaj este mai mic dect valoarea critic, C (nu se afl n
regiunea critic). Probabilitatea comiterii unei astfel de erori () este aria de sub curba de
distribuie H
1
care se situeaz la stnga valorii critice, C.
Dac alegem un prag de semnificaie, , mai mic (adic reducem riscul comiterii unei erori
de genul nti), va crete ( riscul comiterii unei erori de genul al doilea). Cu toate acestea, prin
creterea volumului n al eantionului, este posibil s reducem riscul , fr a crete riscul .
Cum
n
s
s
x
x
= , o dat cu creterea volumului n al eantionului, abaterile medii ptratice
ale distribuiilor pentru H
0
i H
1
devin mai mici i, evident, att , ct i descresc (vezi fig.).
i cnd volumul eantionului n' > n
5) Dup ce am stabilit pragul de semnificaie i regiunea critic, trecem la pasul urmtor, n
care vom face principalele presupuneri despre populaia sau populaiile ce sunt eantionate
(normalitate etc.).
6) Se calculeaz apoi testul statistic i se determin valoarea sa numeric, pe baza datelor
din eantion.
7) La ultimul pas, se desprind concluziile: ipoteza nul este fie acceptat, fie respins,
astfel:
a) dac valoarea numeric a testului statistic cade n regiunea critic (Rc),
respingem ipoteza nul i concluzionm c ipoteza alternativ este adevrat.
Vom ti c aceast decizie este incorect doar n 100 % din cazuri;
47
b) dac valoarea numeric a testului nu cade n regiunea critic (Rc), se
accept ipoteza nul H
0
.
Ipoteza alternativ poate avea una din trei forme (pe care le vom exemplifica pentru
testarea egalitii parametrului media colectivitii generale, cu valoarea
0
):
i) s testm dac parametrul din colectivitatea general (media ) este egal cu o anumit
valoare (inclusiv zero,
0
), cu alternativa media diferit de valoarea
0
. Atunci:
H
0
: =
0
H
1
:
0
( <
0
sau >
0
);
i acest test este un test bilateral;
ii) s testm ipoteza nul =
0
, cu alternativa media este mai mare dect
0.
H
0
: =
0
H
1
: >
0
care este un test unilateral dreapta;
iii) s testm ipoteza nul =
0
, cu alternativa media este mai mic dect
0.
H
0
: =
0
H
1
: <
0
care este un test unilateral stnga.
Regiunea critic pentru testul bilateral difer de cea pentru testul unilateral. Cnd ncercm
s detectm o diferen fa de ipoteza nul, n ambele direcii, trebuie s stabilim o regiune
critic Rc n ambele cozi ale distribuiei de eantionare pentru testul statistic. Cnd efectum un
test unilateral, vom stabili o regiune critic ntr-o singur parte a distribuiei de eantionare, astfel
(vezi fig.):
a) b) c)
Regiunea critic pentru a) test bilateral; b) test unilateral stnga; c) test unilateral dreapta
48
2.2.2. Testarea ipotezei privind media populaiei generale ()
pentru eantioane de volum mare
Utilizarea eantioanelor de volum mare (n > 30) face posibil aplicarea teoremei limit
central. Putem ntlni teste unilaterale sau bilaterale, astfel:
i) n cazul testului bilateral, ipotezele sunt:
H
0
: =
0
( -
0
=0)
H
1
:
0
( -
0
0) (adic <
0
sau >
0
);
Testarea se face pe baza mediei eantionului x i, pentru a o efectua, este nevoie s
construim un test cu un nivel de semnificaie prestabilit. Utiliznd teorema limit central am
vzut c dac volumul eantionului este mare, media eantionului x este aproximativ normal
distribuit. De aceea, variabila aleatoare z urmeaz o distribuie normal standard.
n s
x
n
x x
z
x
0
x
0
x
0
o
o
~
=
Dac pragul de semnificaie () este stabilit, putem determina valoarea z
/2
, pentru care
P(z> z
/2
)= /2. Aceasta nseamn c regiunea critic Rc este dat de:
Rc: z< - z
/2
sau z> z
/2
Regula de decizie este, deci:
Respingem H
0
dac
2 /
0
o
o
z
n
x
x
<
sau
2 /
0
o
o
z
n
x
x
>
ii) pentru testul unilateral dreapta, ipotezele sunt:
49
H
0
: =
0
( -
0
=0)
H
1
: >
0
( -
0
>0);
Testul statistic calculat este:
n s
x
n
x x
z
0 0
x
0
o
o
~
=
Regiunea critic este dat de:
Rc: z > z
Regula de decizie este:
Respingem ipoteza H
0
dac
o
o
z
n
x
0
>
iii) Pentru testul unilateral stnga, ipotezele sunt:
H
0
: =
0
( -
0
=0)
H
1
: <
0
( -
0
<0);
Testul statistic calculat este:
n s
x
n
x x
z
0 0
x
0
o
o
~
=
Regiunea critic este dat de:
Rc: z < z
Regula de decizie este:
Respingem ipoteza H
0
dac :
o
o
z
n
x
0
<
S remarcm c n nici una dintre aceste situaii nu trebuie fcut o presupunere
special, deoarece teorema limit central ne asigur c testul statistic va fi aproximativ normal
distribuit, indiferent de forma distribuiei din colectivitate.
50
2.2.3.Testarea ipotezei privind diferena dintre dou medii
pentru eantioane de volum mare
Multe cazuri de analiz statistic implic o comparaie ntre mediile a dou colectiviti
generale. Spre exemplu, un patron al unui restaurant dorete s vad dac exist diferene ntre
vnzrile realizate nainte i dup o campanie de publicitate, un grup de consumatori dorete s
vad dac exist o diferen semnificativ ntre consumul electric pentru dou tipuri de cuptoare
cu microunde etc.
n aceste situaii, un estimator al diferenei (
1
-
2
) este diferena dintre mediile
eantioanelor ( 2 1 x x ).
Proprietile distribuiei de eantionare a diferenei ( 2 1 x x ) sunt:
a) distribuia de eantionare pentru ( 2 1 x x ) este aproximativ normal pentru
eantioane de volum mare (n
1
> 30 i n
2
> 30);
b) media distribuiei de eantionare a lui ( 2 1 x x ) este (
1
2
);
c) dac cele dou eantioane sunt independente, abaterea medie ptratic a distribuiei
de eantionare este:
( )
2
2
2
1
2
1
x x
n n
2 1
o o
o + =
unde
2
1
o i
2
2
o sunt dispersiile celor dou populaii eantionate, iar n
1
i n
2
sunt
volumele eantioanelor respective.
Mrimea lui
( )
2 1
x x
o indic variabilitatea n valorile 2 1 x x , ateptat n distribuia de
eantionare, datorit ntmplrii.
n cazul n care dispersiile celor dou populaii eantionate sunt egale,
2
1
o =
2
2
o =
2
o ,
abaterea medie ptratic a distribuiei de eantionare va avea forma:
51
( )
2 1
x x
n
1
n
1
2 1
+ =
o o
n aceste condiii, ipotezele statistice ce urmeaz a fi testate vor fi:
i) test bilateral
H
0
: (
1
-
2
) = D
H
1
: (
1
-
2
) D
[(
1
-
2
)>D sau (
1
-
2
)<D]
ii) test unilateral dreapta
H
0
: (
1
-
2
) = D
H
1
: (
1
-
2
) > D
iii) test unilateral stnga
H
0
: (
1
-
2
) = D
H
1
: (
1
-
2
) < D
unde D reprezint diferena ipotetic dintre mediile populaiilor, deseori egal cu 0.
Testul statistic utilizat are forma:
( )
( )
2
1
1
x x
2 D x x
z
=
o
Regiunea critic este dat de:
i) z< - z
/2
sau z> z
/2
ii) z> z
iii) z< - z
52
2.2.4.Testarea ipotezei privind media populaiei generale ()
pentru eantioane de volum redus
n afaceri, multe decizii trebuie luate pe baza unor in-formaii foarte limitate, adic pe baza
datelor provenite din eantioane mici (de volum redus, n30). n aceste situaii, efectul imediat
este acela c forma distribuiei de eantionare a mediei x depinde, acum, de forma populaiei
generale din care a fost extras eantionul. n cazul eantionului de volum redus se utilizeaz testul
statistic t. Distribuia de eantionare a lui x va fi normal (sau aproximativ normal), n cazul
eantioanelor de volum redus, doar dac colectivitatea general este distribuit normal (sau
aproximativ normal).
Pe de alt parte, dac nu se cunoate dispersia din colectivitatea general (
2
x
o ), atunci dispersia
eantionului (
2
x
s ), poate s nu ofere o aproximare foarte bun a lui
2
x
o (n cazul eantioanelor mici).
Ca atare, n locul statisticii z care necesit cunoaterea (sau o bun aproximare) a lui
x
o , vom folosi
statistica:
n s
x
s
x
t
x
0
x
0
=
= ,
unde:
( )
1 n
x x
s
2
i 2
x
.
Elementele procesului de testare a ipotezelor statistice privind media colectivitii generale
() pe baza datelor din eantioane de volum redus, devin atunci:
- pentru test bilateral;
H
0
: =
0
,
H
1
:
0
( <
0
sau >
0
);
- pentru test unilateral dreapta;
H
0
: =
0
,
H
1
: >
0
,
- pentru test unilateral stnga;
H
0
: =
0
,
53
H
1
: <
0
.
Testul statistic utilizat:
n s
x
s
x
t
x
0
x
0
=
= .
Presupunerea special ce trebuie fcut este aceea c po-pulaia general este normal sau
aproximativ normal distribuit.
Regiunea critic este dat de:
i) t > t
/2,n-1
sau t < - t
/2,n-1
,
ii) t > t
,n-1
,
iii) t < - t
,n-1
.
2.2.5.Testarea ipotezei privind proporia populaiei
pentru eantioane mari
Ne amintim c, pentru variabile alternative, media n eantion era notat cu f (proporia
succeselor), dispersia f(1-f), iar abaterea medie ptratic ) 1 ( f f . De asemenea, despre
distribuia de eantionare a proporiei tim c proporia ean-tionului (f) este aproximativ normal
distribuit, de medie p i eroare standard n p p / ) 1 ( , pentru n mare ( 5 > np i 5 ) 1 ( > p n ):
p
f
= i
n
f f
n
p p
s
f
) 1 ( ) 1 (
~
= .
Pentru testarea ipotezelor statistice privind proporia este necesar s lucrm cu eantioane
mari(n>100).
Cum proporia f este aproximativ normal distribuit, rezult c variabila standardizat
n f f
p f
z
/ ) 1 (
= .
Regiunea critic (R
c
) este dat de:
2 / o
z z < sau
2 / o
z z > pentru testul bilateral;
o
z z > pentru testul unilateral dreapta;
o
z z < pentru testul unilateral stnga.
Aadar, regula de decizie este: se respinge ipoteza nul i se accept ipoteza alternativ, dac
z se situeaz n regiunea critic (R
c
)
stabilit n funcie de probabilitatea dorit de garantare a
rezultatelor )% 1 ( 100 o .
2.2.6. Testarea ipotezei privind diferena dintre dou medii
pentru eantioane de volum redus
n cazul n care dorim s testm semnificaia diferenei dintre mediile a dou eantioane de
volum redus, va trebui s construim, ca i n cazul anterior, o statistic t, Student. Pentru aceasta
vom presupune c:
55
- ambele colectiviti generale din care s-au extras ean-tioanele sunt normal sau aproximativ
normal distribuite;
- dispersiile n cele dou colectiviti generale sunt egale;
- eantioanele aleatoare sunt selectate independent unul de cellalt.
n condiiile n care presupunem c cele dou colectiviti generale au dispersii egale (
2
1 x
o =
2
2 x
o =
2
x
o ), un estimator al dispersiei (variabilitii) totale din cele dou populaii combinate este:
( ) ( )
2
2 1
1
2
2
1
2
1
2
2 1
+
+
=
= =
n n
x x x x
s
n
i
i
n
i
i
c
sau
( ) ( )
( ) ( )
( ) ( )
2 n n
s 1 n s 1 n
1 n 1 n
s 1 n s 1 n
s
2 1
2
2 x 2
2
1 x 1
2 1
2
2 x 2
2
1 x 1 2
c
+
+
=
+
+
= .
Aadar, dispersia combinat
2
c
s este media aritmetic pon-derat a dispersiilor celor dou
eantioane,
2
1 x
s i
2
2 x
s .
Dac dispersiile nu sunt egale (
2
x1
2
x2
), atunci testul statistic are forma:
2
2
2
1
2
1
2 1
n
s
n
s
D ) x x (
t
+
=
cu gradele de libertate:
( )
1 n
) /n (s
1 n
) /n (s
/n s /n s
2
2
2
2
2
1
2
1
2
1
2
2
2
2 1
2
1
+
Ipotezele statistice vor fi, n aceste condiii:
- pentru test bilateral;
H
0
:
1
=
2
(
1
-
2
= D),
H
1
:
1
2
(
1
-
2
D),
- pentru test unilateral dreapta;
H
0
:
1
=
2
(
1
-
2
= D),
56
H
1
:
1
>
2
(
1
-
2
> D),
- pentru test unilateral stnga;
H
0
:
1
=
2
(
1
-
2
= D),
H
1
:
1
<
2
(
1
-
2
< D).
Testul statistic t va avea forma:
( ) ( )
( ) ( )
( )
2 1
2 1 2 1
2
2
2 x 1
2
1 x
2
2 1
2
c
2
n n
2 n n n n
1 n s 1 n s
D x x
n
1
n
1
s
D x x
t
1 1
+
+
+
=
|
|
.
|
\
|
+
= .
Regiunea critic este dat de:
- pentru test bilateral: t< t
2 n n , 2 /
2 1
+ o
sau t> t
2 n n , 2 /
2 1
+ o
;
- pentru test bilateral dreapta: t> t
2 n n ,
2 1
+ o
;
- pentru test bilateral stnga: t< t
2 n n ,
2 1
+ o
.
Trebuie s facem o remarc asupra presupunerilor privind normalitatea distribuiei n
colectivitatea general: teoria statistic a dezvoltat teste pentru verificarea normalitii
distribuiilor, teste prin care se verific ipoteza nul conform creia legea de repartiie este cea
normal N(,
2
), cu i
2
o parametrii necunoscui ce urmeaz a fi estimai pe baza datelor
eantionului considerat. Cele mai cunoscute teste pentru verificarea normalitii sunt testul
2
de
concordan cu legea normal, testul Kolmogorov - Smirnov, testul de normalitate al lui Lilliefors
(vezi Trebici, V. (coord.) Mic enciclopedie de statistic, Editura tiinific i Enciclopedic,
Bucureti, 1985).
Dac ipoteza nul nu este acceptat, vom putea apela la teste statistice neparametrice, n
cadrul crora nu se fac presu-puneri speciale asupra formei distribuiei.
2.2.7. Testarea ipotezei privind dispersia unei populaii
Aa cum am vzut n capitolul anterior, suma ptratelor diferenelor
2
) ( x x
i
(care este, de
fapt, egal cu
2
s n sau
2
) 1 ( s n pentru eantioane mici), mprit la dispersia colectivitii
generale, are o distribuie hi-ptrat (
2
_ ) (dac populaia eantionat este normal distribuit).
57
Aadar, testul statistic utilizat n testarea ipotezei privind
2
o este:
2
2
2
) 1 (
o
_
s n
= ,
care are o distribuie
2
_ cu (n-1) grade de libertate, cnd populaia eantionat este normal
distribuit, cu dispersia
2
o .
Valoarea lui
2
_ pentru care aria de sub curb (situat la dreapta ei) este egal cu , se
noteaza
2
o
_ . Nu putem folosi notaia
2
o
_ pentru a reprezenta punctul la care aria din stnga este
, deoarece statistica
2
_ este ntotdeauna mai mare dect zero. Dar
o
_
2
1
reprezint punctul
pentru care aria de sub curb situat la stnga lui este .
Spre exemplu:
92 , 16
2
9 ; 05 , 0
= _
33 , 3
2
9 ; 95 , 0
= _
Ipoteza nul este:
2
0
2
0
: o o = H
cu ipoteze alternative:
- pentru test bilateral
2
0
2
0
: o o = H ,
- pentru test unilateral drept
2
0
2
0
: o o > H ,
- pentru test unilateral stng
2
0
2
0
: o o < H .
Regiunea critic este dat de:
2
1 , 2 / 1
2
<
n o
_ _ sau
2
1 , 2 /
2
>
n o
_ _ pentru test bilateral,
2
1 ,
2
>
n o
_ _ pentru test unilateral dreapta,
2
1 , 1
2
<
n o
_ _ pentru test unilateral stnga.
Factorii ce identific testul
2
_ privind dispersia unei populaii:
- Obiectiv: caracterizarea unei colectiviti;
- Aspectul vital: variabilitatea;
- Tipul datelor: cantitative.
58
2.2.8.Testarea ipotezei privind raportul dintre dou dispersii
Am vzut c testarea ipotezei privind dispersia poate fi utilizat pentru a trage concluzii
privitoare la consistena unor procese economice ori privitoare la riscurile asociate. n acest
subcapitol vom compara dou dispersii, ceea ce ne va permite s comparm consistena a dou
procese sau riscurile a dou portofolii de investiii etc.
Statisticienii testeaz, adesea, egalitatea dintre dou dispersii nainte de a decide ce procedeu
s foloseasc n verificarea ipotezei privind diferena dintre dou medii.
Vom compara dispersiile a dou populaii, determinnd raportul dintre ele. n consecin,
parametrul ce ne intereseaz este
2
2
2
1
/o o . Dac dispersia eantionului este (aa cum am vzut) un
estimator nedeplasat i consistent al dispersiei colectivitii generale, s notm c raportul
2
2
2
1
s / s
este estimator punctual al raportului de dispersii
2
2
2
1
/ o o .
Distribuia de eantionare a raportului
2
2
2
1
s / s este o distribuie F, dac eantioanele au fost
extrase independent din populaii normal distribuite.
Valoarea lui F pentru care aria de sub curb (situat la dreapta ei) este , se noteaz cu F
(cu
gradele de libertate gl1 i gl2).
Din matematic tim c raportul dintre dou variabile hi-ptrat independente mprite la gradele
lor de libertate are o distribuie F. Gradele de libertate ale distribuiei F sunt identice cu gradele de
libertate ale celor dou distribuii hi-ptrat. Atunci:
2
2
2
2
2
1
2
1
2
2
2
2
2 2
1
2
1
2
1 1
/
/
) 1 (
/ ) 1 (
:
) 1 (
/ ) 1 (
o
o o o
s
s
n
s n
n
s n
F =
= ,
cu ) 1 (
1
n i ) 1 (
2
n grade de libertate.
n cele ce urmeaz, ipoteza nul este ntotdeauna specificat ca egalitatea ntre dou
dispersii, adic sub forma egalitii raportului cu unitatea.
1 / :
2
2
2
1 0
= o o H .
59
Ipoteza alternativ poate fi construit astfel: fie c raportul este diferit de 1, fie mai mare, fie
mai mic dect 1.
Tehnic, testul statistic este
2
2
2
2
2
1
2
1
/
/
o
o
s
s
F = , dar n condiiile ipotezei nule, adic 1 /
2
2
2
1
= o o , testul
statistic devine:
2
2
2
1
s
s
F = , care urmeaz o distribuie F cu ) 1 (
1
n i ) 1 (
2
n grade de libertate.
Regiunea critic este dat de:
1 , 1 , 2 /
2 1
>
n n
F F
o
sau
1 , 1 , 2 / 1
2 1
<
n n
F F
o
pentru test bilateral,
1 , 1 ,
2 1
>
n n
F F
o
pentru test unilateral dreapta,
1 , 1 , 1
2 1
<
n n
F F
o
pentru test unilateral stnga.
gl2 gl1, ,
gl2 gl1, , 1
F
1
F =
gl1 = n1 1
gl2 = n2 1
60
2.3. ntrebri
1. Cum apar n statistic ipotezele?
2. Cum se stabilete regiunea critic, R
c
pentru testul bilateral?
3. Cum se stabilete regiunea critic, R
c
pentru testul unilateral ?
4. n testarea ipotezei privind media populaiei generale ()
pentru eantioane de volum mare , n cazul testului bilateral, care sunt
ipotezele ?
5. n testarea ipotezei privind diferena dintre dou medii pentru
eantioane de volum mare, care sunt proprietile distribuiei de
eantionare a diferenei ( 2 1 x x ) ?
61
2.4.Probleme rezolvate
Exemplu 1 - Testarea ipotezei privind media populaiei generale () pentru eantioane de
volum mare
Presupunem c un fabricant de materiale de construcii comercializeaz ciment n pungi,
care trebuie s conin 12 kg/pung. Pentru a detecta eventuale abateri n ambele sensuri de la
aceast cantitate, selecteaz 100 de pungi, pentru care calculeaz 85 , 11 = x kg, s
x
= 0,5 kg. Pentru
= 0,01 (grad de ncredere (1- )100=99%) s se determine dac se accept ipoteza nul, aceea
c greutatea pungilor este n medie de 12 kg.
H
0
: = 12
H
1
: 12 ( < 12 sau > 12);
z
/2
=z
0,005
=2,575
0 , 3
10 5 , 0
12 85 , 11
n s
12 x
n
12 x 12 x
z
x
=
=
o
o
Regiunea critic: z< - z
/2
sau z> z
/2
Cum z = - 3,0 < - 2,575 rezult c sunt suficiente evidene pentru a respinge ipoteza nul
H
0
i a accepta ipoteza alternativ, aceea c greutatea pungilor difer, n medie, de 12 kg.
Exemplu 2 : Testarea ipotezei privind diferena dintre dou medii pentru eantioane de
volum mare
Managerul unui restaurant dorete s determine dac o campanie de publicitate a dus la
creterea veniturilor medii zilnice. Au fost nregistrate veniturile pentru 50 de zile nainte de
desfurarea campaniei. Dup desfurarea campaniei i trecerea unei perioade de 20 de zile
pentru ca aceast campanie s i fac efectul, se nregistreaz veniturile pentru 30 de zile. Aceste
dou eantioane vor permite testarea ipotezei privind efectul campaniei asupra veniturilor. Din
prelucrarea datelor pentru cele dou eantioane, rezult:
62
nainte de campanie Dup campanie
n
1
=50 n
2
=30
55 , 12 x1 = mil. lei 30 , 13 x2 = mil. lei
s
1
=2,15 mil. lei s
2
=2,38 mil. lei
Dorim s vedem dac veniturile au crescut (
2
>
1
), aadar, vom efectua un test unilateral
stnga:
H
0
:
1
=
2
(
1
-
2
= 0)
H
1
:
1
<
2
(
1
-
2
< 0)
Pentru un prag de semnificaie = 0,05 (probabilitate de garantare a rezultatelor (1-
)100=95%, z
=z
0,05
=1,645. S notm c regiunile critice, pentru cele mai comune valori ale lui
sunt date de (vezi tab.):
Regiumile critice pentru diferite valori o
Test
unilateral stnga
Test
unilateral dreapta
Test bilateral
0 1 2 3
0,10 z < - 1,28 z > 1,28 z < - 1,645 sau z > 1,645
0,05 z < - 1,645 z > 1,645 z < - 1,96 sau z > 1,96
0,01 z < - 2,33 z > 2,33 z < - 2,575 sau z > 2,575
Presupunnd c cele dou eantioane (nainte i dup campanie) sunt independente, vom
calcula testul z:
( )
( )
41 , 1
5305 , 0
75 , 0
n
s
n
s
x x
n n
x x 0 x x
z
2
2
2
1
2
1
2 1
2
2
2
1
2
1
2 1
x x
2 1
2 1
=
=
+
~
+
=
=
o o
o
Cum valoarea calculat nu este mai mic dect z
0,05
= 1,645, rezult c nu ne aflm n
regiunea critic. Eantioanele nu ofer aadar, suficiente dovezi (la = 0,05) pentru ca managerul
restaurantului s concluzioneze c veniturile au crescut n urma campaniei de publicitate.
63
Exemplu 3 - testarea ipotezei privind media populaiei generale () pentru eantioane de
volum redus
Conducerea unei companii apeleaz la 5 experi pentru a previziona profitul companiei n anul
curent. Valorile previzionate sunt: 2,60; 3,32; 1,80; 3,43; 2,00 (miliarde lei, preurile anului anterior).
tiind c profitul companiei n anul anterior a fost de 2,01 mld. lei, sunt suficiente dovezi
pentru a concluziona c media previziunilor experilor este semnificativ mai mare dect cifra
anului anterior (pentru = 0,05)?
Media previziunilor experilor este 63 , 2 x = mld. lei, cu dispersia:
( )
5507 , 0
4
203 , 2
1 n
x x
s
2
i 2
x
= =
i abaterea medie ptratic:
74 , 0 s s
2
x x
= = mld. lei.
Elementele procesului de testare a ipotezei statistice sunt:
H
0
: = 2,01,
H
1
: > 2,01 (test unilateral dreapta).
874 , 1
5 / 74 , 0
01 , 2 63 , 2
n s
x
s
x
t
x x
=
=
.
n scopul folosirii statisticii t, vom face presupunerea c populaia general din care s-a extras
eantionul este normal distribuit.
Cum t
,n-1
=
t
0,05;4
=
2,132, regiunea critic este dat de t>t
,n-1
. Cum t=1,874< t
0,05;4
=2,132, nu
putem trage concluzia c media profitului previzionat de cei 5 experi pentru anul curent este
semnificativ mai mare dect profitul anului trecut, de 2,01 mld. lei.
64
Exemplu 4 : testarea ipotezei privind proporia populaiei pentru eantioane mari
Managerul unui la de magazine consider n urma unei analize financiare c - pentru un nou
produs - comercializarea este profitabil, dac procentul cumprtorilor care ar dori s
achiziioneze produsul este mai mare de 12%. El selecteaz 400 de cumprtori poteniali i afl
c 52 dintre acetia vor achiziiona produsul. Pentru o probabilitate de 99% sunt suficiente dovezi
care s conving managerul s comercializeze produsul?
Ipotezele sunt:
12 , 0 p : H
0
= ,
12 , 0 p : H
1
> (test unilateral dreapta).
Testul statistic este:
15 , 1
017 , 0
02 , 0
400 / 86 , 0 14 , 0
12 , 0 14 , 0
n / ) f 1 ( f
12 , 0 f
z = =
= .
Cum 33 , 2 z z
01 . 0
= =
o
i
c
z z < , rezult c nu ne aflm n regiunea critic (R
c
), nu avem
suficiente dovezi s respingem ipoteza nul, deci procentul nu este mai mare de 12%.
Exemplu 5 : testarea ipotezei privind diferena dintre dou medii pentru eantioane de
volum redus
Presupunem c dorim s testm ipoteza conform creia ntre dou mrci de autoturisme nu
exist diferene semni-ficative privind cheltuielile de funcionare. Pentru aceasta 20 de posesori
de autoturisme (8 posesori ai primei mrci i 12 po-sesori ai celei de-a doua) sunt rugai s in,
cu acuratee, evidena cheltuielilor de funcionare pe o perioad de un an de zile. Pentru =0,1
(probabilitate de garantare a rezultatelor (1-)100 = 90%) s se testeze aceast ipotez, dac
rezultatele prelucrrii datelor n eantioane sunt:
Marca 1 Marca 2
n
1
=8 n
2
=12
696 , 5 1 = x mil. lei 273 , 5 2 = x mil. lei
s
x1
=0,485 mil. lei s
x2
=0,635 mil. lei
65
( ) ( )
3379 , 0
2 12 8
635 , 0 1 12 485 , 0 1 8
s
2 2
2
c
=
+
+
=
Ipotezele statistice sunt:
H
0
:
1
=
2
(
1
-
2
= 0),
H
1
:
1
2
(
1
-
2
0) [
1
>
2
sau
1
<
2
].
Testul statistic este:
( )
5943 , 1
2653 , 0
423 , 0
12
1
8
1
3379 , 0
0 273 , 5 696 , 5
t = =
|
.
|
\
|
+
=
Cum t
/2,n1+n2-2
= t
0,05;18
= 1,734, se observ c t < t
/2,n1+n2-2
, aadar nu ne aflm n regiunea
critic.
Rezult, deci, c nu exist suficiente dovezi pentru a concluziona c sunt diferene
semnificative ntre cheltuielile de funcionare ale celor dou mrci de autoturisme.
Exemplu 6 : testarea ipotezei privind dispersia unei populaii
Pentru urmtoarele date privind cererea unui produs (selectate dintr-o colectivitate normal
distribuit), s se testeze (pentru o probabilitate de 95%), ipotezele:
100 :
2
0
= o H ,
100 :
2
1
> o H .
Datele sunt: 85, 59, 66, 81, 35, 57, 55, 63, 63, 66.
n eantion: 85 , 13 = s , 8 , 191
2
= s .
8 , 191
9
1726
1
) (
2
2
= =
=
n
x x
s
i
.
Testul statistic este:
26 , 17
100
1726 ) 1 (
2
2
2
= =
=
o
_
s n
.
Cum 92 , 16
2
9 , 05 . 0
2
1 ,
= =
_ _
o n
, i
2
1 ,
2
>
n o
_ _ vom respinge ipoteza nul i vom accepta ipoteza
alternativ, 100
2
> o .
66
Exemplu 7 : testarea ipotezei privind raportul dintre dou dispersii
Un analist dorete s compare mprtierea veniturilor pe familie, pentru colectivitatea turitilor
ce prefer turismul litoral, cu mprtierea veniturilor, pentru colectivitatea turitilor ce prefer
turismul balnear. Presupunnd c distribuiile veniturilor (mil. lei), n cele dou colectiviti sunt
aproximativ normale au fost selectate dou eantioane, de volum 60 i 50 de persoane, iar abaterile
medii ptratice (mil. lei) sunt: 84 , 2
1
= s i 86 , 1
2
= s . Se utilizeaz o probabilitate de garantare a
rezultatelor de 95%.
Ipotezele statistice sunt:
1 / :
2
2
2
1 0
= o o H ,
1 / :
2
2
2
1 1
> o o H .
Testul statistic are valoarea:
3314 , 2
4596 , 3
0686 , 8
86 , 1
84 , 2
2
2
2
2
2
1
= = = =
s
s
F .
Regiunea critic (pentru 05 , 0 = o ) este dat de:
64 , 1
49 ; 59 ; 05 . 0
~ > F F .
Cum
49 ; 59 ; 05 . 0
F F > ipoteza nul se respinge (aceea c raportul dintre dispersii este 1) i se
accept ipoteza alternativ. Acest lucru nseamn c se accept ipoteza conform creia
mprtierea veniturilor pentru turitii din zona litoral este semnificativ mai mare dect cea a
turitilor din zona balnear.
n general - dac la numrtor se trece dispersia cea mai mare - testul F este un test unilateral
dreapta.
67
2.5. BIBLIOGRAFIE
1. Andrei, T. - Statistic i econometrie Editura
Economic, Bucureti, 2004.
2. Bourbonnais R , Econometrie, Ed. Dunod , Paris , 1998
3. Dormont B , Introduction a leconometrie , Ed.
Montchrestien , Paris , 1999
4. Florea I.(coordonator), Culegere de modele
econometrice, Ed. Muntele Sion,2000.
5. Iacob, A.I., Tnsoiu, O. Econometrie, Studii de caz,
Ed. ASE, Bucureti, 2005.
6. Pecican, E.... Econometrie pentru economiti, Ed.
Economic, Bucureti, 2004.
68
Capitolul 3
3.1.OBIECTIVE: introducerea studenilor n sfera i noiunile specifice
modelului de regresie,
3.2.PREZENTARE SINTETIC:
3.2.1 Specificarea unui model de regresie
Un studiu econometric ncepe cu o serie de presupuneri teoretice despre anumite aspecte
ale economiei.
Investigaiile empirice furnizeaz estimatori pentru parametri necunoscui ai modelului.
Keynes: C=f(x)
Suma cheltuit pentru consum depinde de:
- mrimea venitului pe de o parte
- alte obiective n funcie de circumstane (de exemplu investiiile)
- alte nevoi subiective
Legea psihologic fundamental: o persoan este dispus de regul i n medie s i
creasc consumul pe msura creterii venitului dar nu n aceeai msur
1 0 < <
dX
dC
un nivel absolut mai mare al venitului va tinde de regul s mreasc diferena ntre venit
i consum:
0
) / (
<
dX
X C d
Presupunerea cea mai simpl: C=o+|X, 0<|<1 este o relaie determinist neadecvat.
n model trebuie inclus i factorul aleator:
C=f(X,c)
Modelul cel mai simplu:
C=o+|X+c
Modelul general ce trebuie estimat are forma:
y
i
=o + |x
i
+ c
i
, i=1,n
69
unde: - x
i
este nestochastic (situaie experimental)
- analistul alege valorile regresiei x
i
i apoi observ y
i
Valoarea parametrului | arat modificarea proporional a variabilei efect (Y) la
modificarea cu o unitate a variabilei cauz (X).
Valoarea parametrului o arat punctul n care linia intercepteaz (taie) axa OY
c
i
reprezint componenta rezidual (eroarea aleatoare) pentru fiecare unitate, adic partea
din valoarea variabilei Y care nu poate fi msurat prin relaia sistematic existent cu variabila
X.
Modelul liniar unifactorial y=1+0,5x
Modelul probabilistic conine:
a) componenta deterministic, adic partea din valoarea lui Y
i
care poate fi determinat
cunoscnd valoarea X
i
(o + |X
i
= Y
i
')
b) componenta rezidual care nu poate fi determinat cunoscnd valoarea individual Xi (ci)
Atunci,
Y
i
= o + |X
i
+ c
i
Y
i
= componenta predictibil (detrministic) + eroarea aleatoare
Y
i
= Y
i
' + c
i
Dac datele disponibile provin dintr-un eantion avem la dispoziie n perechi de observaii (x
1
,
y
1
), (x
2
,y
2
), ... (x
n
, y
n
), pe care le vom folosi pentru estimarea parametrilor ecuaiei de regresie
liniar simpl, o i |.
Modelul de regresie liniar n eantion este y
i
= a + bx
i
+ e
i
70
cu componenta predictibil:
i i
bx a y + =
a i b sunt estimatorii punctului de intercepie (o) i pantei liniei drepte (|), obinui pe eantion
e
i
este valoarea rezidual (pentru unitatea i) n eantion:
e
i
= y
i
(a + bx
i
)
Abaterea e
i
de la linia de regresie
Ipotezele modelului de regresie liniar
Pentru a obine proprietile dorite ale estimatorilor regresiei, se fac, de obicei, cinci
presupuneri (ipoteze) standard pentru modelul din populaia general:
Ipotezele ce trebuie verificate:
1. Forma funcional: y
i
=o + |x
i
+ c
i
, i=1,n
2. Normalitatea erorilor: c
i
~N(0,o
2
)
3. Media zero a erorilor: (c
i
)=0 i
4. Homoscedasticitatea:
2
c
i
)=o
2
constant i
5. Non autocorelarea erorilor: Cov(c
i
,c
j
)=0 i=j
6. Necorelarea ntre regresor i erori: Cov(x
i
,c
j
)=0 i i j
Ipoteza 1: Forma funcional
a. y=a+bx
a. y=a+bz, z=e
x
b. y=a+br, r=1/x
c. y=a+bq, q=ln(x)
71
-400
-200
0
200
400
600
800
1000
-1 0. 003 0. 008 0. 013 0. 018 0. 023 0. 028 0. 033 0. 038 0. 043 0. 048 0. 053 0. 058 0. 063 0. 068
X
Y
|
.
|
\
|
+
x
b a
1
x
be a +
bx a +
( ) x b a ln +
Fig. - Modele ce pot fi linearizate
Sau y=Ax
|
ln(y)=o+|ln(x)
Forma general: f(y
i
)= o+|g(x
i
)+c
i
Contra exemplu:
x
y
+
+ =
|
o
1
nu poate fi transformat n model liniar.
Erorile
Ipoteza de linearitate a modelului include i aditivitatea erorilor.
Forma modelului:
y = o + |x
+ c,
De exemplu modelul
c |
e Ax y = se transform prin logaritmare n modelul liniar:
ln(y)=ln(A)+|ln(x)+c .
ns modelul c
|
+ = Ax y nu mai poate fi transformat n model liniar.
Dac ipoteza de linearitate este verificat, variabila dependent observat este suma a
dou elemente:
- un termen nestochastic: o+|x
- o variabil aleatoare
Ipoteza 2: normalitatea erorilor
Se presupune c variabila aleatoare c
i
este normal distribuit :
72
Distribuia de probabilitate pentru c
i
Ipoteza 3: media erorilor este zero: (c
i
)=0 i
Este natural atta timp ct c este vzut ca suma efectelor individuale, cu semne diferite.
Dac media erorilor este diferit de zero, ea poate fi considerat ca o parte sistematic a
regresiei:
(c)= o + |x
+ c = (o+) + |x
+ (c-)
media erorilor este acum nul.
Aceast presupunere indic faptul c media valorilor Y, condiionat de X, (Y/X = X
i
) =
o + |X
i
, adic nu exist variabile omise asociate cu regresia n populaie.
Ipoteza 4 (de homoscedasticitate): Var(c
i
)=o
2
constant i
Dispersia reziduurilor n populaie este constant peste toate valorile X
i
Functia de consum
0
200
400
600
800
1000
1200
200 300 400 500 600 700 800 900 1000
venit
c
o
n
s
u
m
73
a) constant b) constant
Dispersia reziduurilor a) constant; b) constant
Discuie:
Profiturile firmelor mari vor varia mult mai mult ca profiturile firmelor mici.
variaia cheltuielilor gospodriilor n funcie de venit sau de mrimea lor poate fi diferit.
Ipoteza 5: Non autocorelarea erorilor: (c
i
c
j
)=0 i=j
Aceast ipotez nu implic faptul c y
i
i y
j
sunt necorelate, ci faptul c deviaiile
observaiilor de la valorile lor ateptate sunt necorelate.
Variabilele aleatoare c
i
sunt statistic independente una de alta, adic
j i
c c
= 0, pentru i = j.
Acest lucru nseamn c eroarea asociat cu o valoare a variabilei Y nu are nici un efect asupra
erorilor asociate cu alte valori ale lui Y;
nu exist deci corelaie ntre reziduuri;
OBSERVAIE: De asemenea este convenabil a considera c erorile sunt independente
i normal distribuite cu medie zero i variaie constant pentru obinerea de rezultate statistice
exacte.
Estimarea parametrilor modelului de regresie clasic
Parametrii necunoscui ai reaciei stochastice sunt cei ce trebuie estimai:
y
i
=o + |x
i
+ c
i
, i=1,n
Modelul estimat va fi scris:
n i bx a y
i i
, 1 , = + =
.
Eroarea asociat unui punct i este:
c
i
= y
i
- o - |x
i
Pentru orice valori estimate a i b, erorile estimate vor fi:
74
e
i
= y
i
- a - bx
i
Pentru estimarea parametrilor o i | pe baza datelor observate, un criteriu natural
este cel de maximizare a potrivirii modelului cu datele observate, deci de minimizare a
erorilor observate:
=
i
i i
i
i
bx a y e
2 2
) ( min min
Condiiile de ordin 1 de minimizare a funciei sunt:
=
c
c
=
c
c
0
) (
0
) (
2
2
b
e
a
e
i
i
i
i
+ =
+ =
b x a x y x
b x na y
i
i
i
i
i
i i
i
i
i
i
) ( ) (
) (
2
= =
=
2
2
2
x n x
y x n y x
x x
x n
y x x
y n
b
x b y a
i
i
i
i i
i
i
i
i
i
i
i
i
i
i
i
i
i
Rmne de verificat dac este verificat condiia de ordin 2, adic soluia gsit este un
punct de minim. Matricea derivatelor pariale de ordin doi trebuie s fie pozitiv definit:
(
(
(
=
(
(
(
(
(
(
c
c
c c
c
c c
c
c
c
i
i
i
i
i
i
i
i
i
i
i
i
i
i
x x
x n
b
e
a b
e
b a
e
a
e
2
2 2
2 2 2 2
2 2
2 2
2 2
2 2
2 2
) ( ) (
) ( ) (
75
> =
>
>
0 ) ( 4 ) ( 4 4
0 2
0 2
2 2 2
2
i
i
i
i
i
i
i
i
x x n x x n
x
n
Deci matricea este pozitiv definit.
3.2.2 Modelul de regresie clasic
Evaluarea validitii modelului de regresie clasic
Estimatorii a (intercepia) i b (panta) ai parametrilor o i | sunt dai de :
2
n
1 i
i
n
1 i
2
i
n
1 i
i i
n
1 i
i
n
1 i
2
i
n
1 i
i
x x n
y x x x y
a
|
.
|
\
|
|
.
|
\
|
|
.
|
\
|
=
= =
= = = =
=
|
.
|
\
|
|
.
|
\
|
|
.
|
\
|
=
=
=
= =
= = =
n
1 i
2 2
i
n
1 i
i i
n
1 i
2
n
1 i
i
2
i
n
1 i
i
n
1 i
i
n
1 i
i i
x n x
y x n y x
x x n
y x y x n
b
Se observ c obinem din ecuaia: = +
= =
n
1 i
i
n
1 i
i
y x b na
mprind prin n :
n
x b y
x b y a
n
1 i
i
n
1 i
i
|
.
|
\
|
= =
= =
i, nlocuind n ecuaia : = +
= = =
n
1 i
i i
n
1 i
2
i
n
1 i
i
y x x b x a
pe x
i
cu deviaia ( ) x x
i
obinem: ( ) ( ) ( )
i
n
1 i
i
n
1 i
2
i
n
1 i
i
y x x x x b x x a = +
= = =
Cum primul termen situat n partea stng a ecuaiei este egal cu zero, rezult:
76
( )
( )
( ) ( )
( )
( )( )
( )
=
=
=
=
=
=
=
=
=
n
1 i
2
i
n
1 i
i i
n
1 i
2
i
n
1 i
i i i
n
1 i
2
i
n
1 i
i i
x x
y y x x
x x
x x y y x x
x x
y x x
b
i n final:
( )( )
( )
2
x
xy
n
1 i
2
i
i
n
1 i
i
s
s
n
x x
n
y y x x
b =
=
=
=
Estimatorul a (intercepia) poate lua valori negative sau pozitive.
Estimatorul b (panta liniei drepte) numit i coeficient de regresie are ntotdeauna semnul
indicatorului s
xy
,
s
xy
este covariana ntre x i y.
Linii de regresie cu a) pant pozitiv b) pant negativ c) pant egal cu zero
=
= =
n
1 i
i
n
1 i
i
y y
n evaluarea validitii modelului se verific dac variaia lui x este un bun predictor pentru
variaia lui y.
Doi indicatori alternativi pot fi utilizai pentru a msura calitatea ajustrii pentru regresia
statistic :
Abaterea medie ptratic (eroarea standard) a reziduurilor (msur absolut a calitii
ajustrii pe baza regresiei n eantion)
Coeficientul de determinaie (indicator relativ).
Este necesar s analizm componentele indicatorilor de variaie a lui y.
n aplicarea metodei regresiei, sunt asociate variabilei dependente y dou medii:
77
media total ( y ) i
media condiionat (
i i
bx a y + = ).
variaia (abaterea) total ( y y
i
) poate fi mprit n :
abaterea neexplicat de model (
i i
y y ) i
abaterea explicat ( y y
i
), astfel:
) y y ( ) y y ( y y
i i i i
+ =
Abaterea (
i i
y y ) nu poate fi explicat de linia de regresie, deoarece atunci cnd x
i
se
modific, ambele valori y
i
i
i
y se modific;
abaterea ( y y
i
) poate fi explicat, deoarece cnd x
i
se schimb, y rmne constant
Abaterea valorilor individuale y
i
de la medie
Prin ridicarea la ptrat a fiecrei abateri i nsumarea pentru toate observaiile, obinem:
+ =
= = =
n
1 i
n
1 i
2
i
2
i i
n
1 i
2
i
) y y ( ) y y ( ) y y (
Putem nota:
A =
=
n
1 i
2
y
2
i
) y y ( = variana total, suma ptratelor abaterilor totale.
A =
=
n
1 i
2
e
2
i i
) y y ( = variana neexplicat, suma ptratelor erorilor.
A =
=
n
1 i
2
x / y
2
i
) y y ( = variana explicat, suma ptratelor abaterilor datorate regresiei.
Vom avea, atunci:
2
e
2
x / y
2
y
A + A = A
78
se mai noteaz:
Variaia variabilei dependente y este definit n termeni de deviaie de la valoarea ei medie:
=
i
i
y y SST
2
) (
+ + = + + = + =
.
i i i i i i i
e bx x b y e bx a e y y
+ =
i i i
e x x b y y ) (
+ + =
i
i i
i
i
i
i
i
i
x x e b e x x b y y ) ( 2 ) ( ) (
2 2 2 2
Deci: SST = SSR + SSE
Variaia total = Variaia de regresie + Variaia rezidual
Putem calcula i discuta cei doi indicatori ai calitii ajustrii astfel :
tabelul ANOVA este pentru testarea calitii ajustrii
Tabelul ANOVA
Sursa variaiei
Suma ptratelor Grade de libertate Media ptratelor
(dispersia corectat)
0 1 2 3
Datorat regresiei
Rezidual
( ) = A
=
n
1 i
2
i
2
x / y
y y
( ) = A
=
n
1 i
2
i i
2
e
y y
k
n k 1
k
s
2
x / y
2
x / y
A
=
1 k n
s
2
e 2
e
A
=
Total
( ) = A
=
n
1 i
2
i
2
y
y y
n 1
1 n
s
2
y
2
y
A
=
Unde:
k reprezint numrul variabilelor independente luate n consideraie (pentru regresia
liniar simpl, k = 1).
Dac se mpart varianele la (n 1), avem:
( ) ( ) ( )
1 n
y y
1 n
y y
1 n
y y
n
1 i
2
i
n
1 i
2
i
n
1 i
2
i
= = =
relaie care poate fi scris ca
( ) ( )
( )
1 1
1
2
2 1
2
1
2
= =
n
x x
b
n
y y
n
y y
i
n
i
i i
n
i
i
deoarece:
( ) ( ) ( )
= = =
= + =
n
i
n
i
i i
n
i
i
x x b x b a bx a y y
1 1
2
2
2
1
2
79
abaterea medie ptratic a erorilor n eantion este:
( )
2 n
y y
2 n
s
n
1 i
2
i i
2
e
e
A
=
=
unde
2
e
s este un estimator nedeplasat al dispersiei reziduurilor
2
c
o . o mrime relativ a
calitii ajustrii, prin exprimarea ponderilor dispersiilor (explicat i rezidual) n dispersia total
este:
2
y
2
e
2
y
2
x / y
2
y
2
y
00 , 1
A
A
+
A
A
= =
A
A
Coeficientul de determinaie este:
( )
( )
=
A
A
=
A
A
=
=
=
n
1 i
2
i
n
1 i
2
i
2
y
2
e
2
y
2
x / y
2
y y
y y
1 R
Raportul
2
y
2
x / y
/ A A reprezint proporia variaiei total care este explicat de linia de
regresie.
Sau se poate scrie
Coeficientul de determinare ca proporia variaiei explicat de modelul de regresie n variaia
total:
| | 1 , 0
2
e =
SST
SSR
R
R
2
= 0 dac b=0, y y =
.
, deci dac ecuaia de regresie este o dreapt orizontal. n acest caz
variabila x nu are putere explicativ.
R
2
= 1 dac punctele determinate de observaiile fcute asupra variabilelor x i y se afl toate pe o
dreapt, caz n care erorile vor fi zero.
n cazul n care toate valorile lui y se afl pe o dreapt vertical, R
2
nu are nici o semnificaie i nu
poate fi calculat.
Aadar, R
2
reprezint msura n care variabila independent, X, explic variaia variabilei
rezultative Y.
Coeficientul de determinaie nu este ajustat cu gradele de libertate. Dac utilizm estimatorii
nedeplasai
2
y
s i
2
e
s , obinem valoarea ajustat a coeficientului de determinaie |
.
|
\
|
2
R .
80
1 n /
1 k n /
1 R
2
y
2
e
2
A
A
=
Valoarea lui
2
R este ntotdeauna mai mic dect valoarea lui R
2
.
Observaii:
1. R
2
poate fi interpretat ca procentul variaiei lui y explicat de variaia veriabilei x doar pentru
cazul n care metoda celor mai mici ptrate este aplicat modelului liniar de regresie.
2. Pentru orice model coeficientul R
2
poate fi calculat ca:
yy
i
i
S
e
R
=
2
2
1 unde
=
i
i yy
y y S
2
) (
81
3.3. Probleme rezolvate
Exemplu : Modelul de regresie clasic
I. Estimarea parametrilor
Ecuaiile normale pentru exemplul din primul paragraf privind consumul i veniturile
sunt:
=
=
+ =
+ =
979267 , 0
5806 , 67
22 , 7797822 4 , 8792 27 , 7041953
4 , 8792 10 3 , 7934
b
a
b a
b a
Deci:
C = -67,58 + 0,98 V
Interpretare:
1. La o variaie a venitului cu o unitate monetar, consumul va varia n aceeai direcie cu
0,98 uniti monetare.
2. Termenul liber se interpreteaz n general ca nivelul variabilei dependente pentru cazul
n care variabila independent este zero. n cazul exemplificat, valoarea termenului liber este
negativ, iar consumul nu poate fi negativ, deci singura interpretare ce poate fi dat este c va
avea loc a consumul de la un nivel al venitului de: 67,58/0,98=69.
II. Determinarea coeficientului de determinare
Pentru exemplul anterior se mai cunosc:
24 , 879 x ; 43 , 793 = = C
S
cc
=64972,12; S
xx
=67192,44; S
xc
=65799,34
SST = S
cc
= 64972,12
SSR = b
2
S
xx
= 0,979267*67192,44 = 64435,12
SSE = SST-SSR = 64972,12 - 64435,12 = 537
Deci: R
2
= SSR/SST = 64435,13/64972,12 = 0,99173
Interpretare:
1. 99,17% din variaia consumului este datorat variaiei venitului.
82
2. 99,17% din variaia consumului este explicat de modelul de regresie.
III. Testarea coeficientului de determinare
Tabelul ANOVA
Sursa variaiei Msura variaiei Numrul gradelor
de libertate
Suma ptratelor
Variaia de
regresie
64435,12 1 64435,12
Variaia rezidual 537 8 67,124
Variaia total 64972,12 9 7219,12
F
calc
= 64435,12/67,124 = 959,94
F
0,95;1,8
= 5,32
F
calc
> F
0,95;1,8
deci R
2
este reprezentativ.
83
Bibliografie general
1. Andrei, T. - Statistic i econometrie Editura Economic,
Bucureti, 2004.
2. Bourbonnais R , Econometrie, Ed. Dunod , Paris , 1998
3. Dormont B , Introduction a leconometrie , Ed. Montchrestien
, Paris , 1999
4. Florea I.(coordonator), Culegere de modele econometrice, Ed.
Muntele Sion,2000.
5. Green W H , Econometric Analysis , Ed. Pretince Hall ,
Londra , 1997
6. Giraud R , Chaix N , Econometrie, Ed. P.U.F. , Paris , 1989
7. Gourieroux C , Monfort J , Statistique et modeles
econometriques , Ed. Economica , Paris , 1989
8. Iacob, A.I., Tnsoiu, O. - Modele econometrice Volumul I,
Ed. II rev., Ed. ASE, Bucureti, 2005.
9. Iacob, A.I., Tnsoiu, O. Econometrie, Studii de caz, Ed.
ASE, Bucureti, 2005.
10. Pecican E., Econometrie, Ed. Intercredo, Deva, 1997.
11. Pecican, E.... Econometrie pentru economiti, Ed. Economic,
Bucureti, 2004.