Sunteți pe pagina 1din 87

CUPRINS

Cap. 1 Analiza statistica a variabilitatii fata de tendinta centrala


1.1.Indicatorii simpli si sintetici ai variatiei
1.2.Aplicatie (rezolvata)
1.3Intrebari de autoevaluare
1.4.Cuvinte cheie
Cap. 2 Indicatorii variatiei intr-o serie de repartitie bidimensionala
2.1 Regula de adunare a dispersiilor;
2.2.Aplicatie (rezolvata)
2.3.Intrebari de autoevaluare
2.4.cuvinte cheie
Cap. 3 Verificarea ipotezelor statistice
3.1 Verificarea normalitatii repartitiilor empirice
3 .2 Aplicatie. Testul 2
3.3 Intrebari de autoevaluare
3.4 Cuvinte cheie
Cap. 4. Sondajul statistic i modalitati de utilizare in activitatea de
audit financiar
4.1 Notiuni fundamentale privind procedeele de esantionare si de
reprezentativitate a esantioanelor;
4.2 Aplicaii(rezolvate)
Selecia ntmpltoare simpl repetat si nerepetata;
Selectia tipica stratificata-caracteristica alternativa si
nealternativa;
4.3 Intrebari de autoevaluare
4.4 Cuvinte cheie
Cap. 5 Modele economice de analiza a regresiei si corelatiei liniare simple
si multiple
5.1 Modelul regresiei si corelatiei liniare simple
5.2 Aplicaie
5.3 Modelul regresiei si corelatiei liniare multiple
5.4 Aplicaie
5.5 Intrebari de autoevaluare
5.6 Cuvinte cheie
Cap.6 Metode econometrice de trend si prognoza cu ajutorul seriilor
de timp
6.1 Indicatorii absoluti si relativi ai seriilor de timp (cronologice)
6.2. Ajustarea seriilor de timp
6.3 Aplicaie (rezolvata)
6.4 Intrebari de autoevaluare
6.5 Cuvinte cheie
Cap.7. Msurarea oscilaiilor sezoniere ntr-o serie cronologic
7.1 Metode de masurare a sezonalitatii
7.2 Aplicatie (rezolvata)
7.3 Intrebari de autoevaluare
7.4 Cuvinte cheie

Cap. 1. Analiza statistica a variabilitatii fata de tendinta centrala


1.1 Indicatorii simpli si sintetici ai variatiei
Gradul de complexitate a unui fenomen este dat de gama factorilor de influen i
variabilitatea termenilor unei serii de repartiie. Aceasta nseamn c analiza tendinei
centrale cu ajutorul indicatorilor medii necesit operaii de verificare a
reprezentativitii lor n raport cu valorile individuale ale caracteristicilor nregistrate,
adic este necesar calcularea indicatorilor statistici ai variaiei ntlnii n literatura
de specialitate i sub denumirea de indicatori ai mprtierii sau ai dispersiei.
Dispersia exprim gradul de mprtiere a valorilor individuale ale unei distribuii n
jurul
valorii
centrale
i
este
datorat
influenei
factorilor aleatori.
Aceti indicatori ai variaiei sau mprtierii stau la baza calculului altor
indicatori prin care se caracterizeaz asimetria, excesul, interdependena dintre
factorii de influen etc.
Indicatorii de variaie aduc un plus de cunoatere i informare asupra:
verificrii reprezentativitii mediei ca valoare tipic a unei serii
de repartiie;
verificrii gradului de omogenitate a seriei;
comparrii n timp sau spaiu a mai multor serii de repartiie dup caracteristici
independente sau interdependente;
cunoaterii gradului de influen a cauzelor dup care s-a fcut gruparea
unitilor statistice nregistrate i separrii cauzelor eseniale de cauzele
ntmpltoare.
Dup gradul de generalitate se disting:
indicatori simpli ai variaiei;
indicatori sintetici ai variaiei;
Dup metodologia de calcul i forma de exprimare deosebim:
indicatori ai variaiei calculai ca mrimi absolute;
indicatori ai variaiei calculai ca mrimi relative n raport cu valoarea unui
indicator al tendinei centrale, n mod deosebit cu media.
Dup modul de sistematizare a datelor deosebim:
indicatori ai variaiei ntr-o serie de repartiie unidimensional;
indicatori ai variaiei calculai pentru serii de distribuie multidimensionale.
Indicatorii simpli ai dispersiei msoar cmpul de mprtiere al caracteristicii,
precum i mprtierea fiecrui nivel individual al caracteristicii fa de nivelul lor
mediu.
Indicatorii simpli caracterizeaz variaia unei singure variante a caracteristicii n
comparaie cu alt variant sau cu nivelul mediu al acestei caracteristici. Aceti
indicatori se pot exprima n uniti absolute, ct i relative (%) calculate n raport cu
media.
Amplitudinea absolut a variantei (A) se obine ca diferen ntre valoarea
maxim (x max) i valoarea minim (xmin) a seriei i are rolul de a msura intervalul de
mprtiere n interiorul cruia se distribuie unitile colectivitii:
A = Xmax Xmin
n cazul unei distribuii de frecvene pe intervale amplitudinea absolut a
variaiei se determin prin diferena dintre limita superioar a ultimului interval i
limita inferioar a primului interval.
Dac este o serie cu intervale deschise, se va proceda la nchiderea intervalelor.

Amplitudinea relativ a variaiei (A%) se exprim n coeficient sau n


procente i se calculeaz, de obicei, ca raport ntre amplitudinea absolut a variaiei
(A) i valoarea medie a caracteristicii.
A
A% 100
x
Acest indicator, amplitudinea variaiei, n ambele forme, nu este suficient de
semnificativ pentru analiza mprtierii valorilor individuale, deoarece ine seama
numai de valorile extreme ale caracteristicii.
Amplitudinea variaiei se folosete n mod practic la alegerea numrului de grupe
i a mrimii intervalului de grupare.
Abaterile individuale absolute (di) se calculeaz ca diferen ntre fiecare
variant nregistrat i media aritmetic a acesteia.
di x i x

n funcie de scopul cercetrii, n locul mediei se poate lua mediana sau modulul.
Abaterile individuale relative (di%) se calculeaz ca raport ntre abaterile
individuale absolute i nivelul mediu al caracteristicii.
d
x x
d i % i 100 i
100 pentru i 1, n
x
x
Indicatorii simpli ai variaiei permit o caracterizare parial i aproximativ a
variaiei, deoarece se calculeaz pe baza relaiilor dintre doi termeni ai seriei sau prin
comparaia dintre fiecare termen i media lor.
Aprecierea coninutului real al mediei calculate se face prin utilizarea abaterilor
variantelor extreme:
abaterea maxim superioar: d s x max x
abaterea maxim inferioar: d i x min x
1.2 Aplicatie (rezolvata)
Frauda medie a unui lot de 10 firme controlate se prezint astfel(date ipotetice):
numrul de ordine: 1
al firmelor (n):
frauda medie (xi) 1,2
(mild u.m.):

0,9

1,1

0,8 1,5

6
1,6

0,8 0,8

10

1,3

0,9

Amplitudinea absolut a variaiei:


A = x max -x min = 1,6-0,8 = 0,8 mil. lei
Amplitudinea relativ a variaiei:

A%

x max x min
x

unde:
n

x
i 1

1,2 0,9 1,1 0,8 1,5 1,6 0,8 0,8 1,3 0,9

10

= 1,09 milioane lei


Abaterile individuale absolute se calculeaz pentru fiecare termen: d i x i x
de unde pentru: primul termen va fi: 1,21,09 = 0,11 mil
al doilea termen: 0,91,09 = 0,19 mil
Abaterile individuale relative:

di %

di
1,2 1,09
100
100 10,09% pentru primul termen
1,09
x

0,9 1,09
100 17,4% pentru al doilea termen
1,09

Abaterea maxim superioar:


d s x max x 1,6 1,09 0,51 mild u.m.

Abaterea maxim inferioar:


d i x min x 0,8 1,09 0,29 mild u.m.

n concluzie: variaia ntre frauda maxima (1,6 mild u.m.) i frauda minima (0,8
mild u.m.) este de 0,8 mild u.m. iar abaterea maxim fa de medie este 0,51 mild
u.m., iar cea minim de 0,29 mild u.m. Nu este lipsit de importan, pentru
caracterizarea fraudei intregului lot verificat, nici frecvena valorilor maxime (1), ct
i a celor minime (3).
Indicatorii sintetici ai variaiei caracterizeaz gradul de variaie, lund n
consideraie toi termenii seriei. Acetia caracterizeaz ntr-o singur expresie
numeric ntreaga variaie a unei caracteristici din colectivitatea analizat.
n funcie de metodologia de calcul, de ncrctura informaional, n statistic se
calculeaz urmtorii indicatori sintetici ai mprtierii:
abaterea medie liniara;
abaterea medie ptratic (deviaia standard);
dispersia (variana);
coeficientul de variaie.
Indicatorii sintetici pot fi calculai ca mrimi medii, cu sfer de aplicabilitate
numai la variabile comparabile i ca mrimi relative, de coeficieni, cu sfer larg de
comparabilitate.
Abaterea medie liniar (d) se calculeaz ca medie aritmetic simpl sau
ponderat, n funcie de felul seriei, a abaterilor termenilor seriei de la media lor luate
n valoare absolut adic:
x i x pentru o serie simpl;
dx
n
x

i x n i pentru o serie de frecven;


dx
ni

x n *i

pentru o serie de frecvene relative


100
Acest indicator poate fi concludent numai dac seria prezint un grad mare de
omogenitate.
Observaii privind coninutul i metodologia de calcul ale abaterii medii
(Al. Isaic- Maniu i colab., 1994)
abaterea medie se exprim n unitatea de msur a caracteristicii;
n cazul seriilor de distribuie de frecvene pe intervale n locul variabilelor x i
dx

se vor lua n calcul centrele de interval;


n calculul abaterii medii ne putem limita numai la valorile individuale ale
caracteristicii superioare valorii medii, deoarece ntr-o serie de distribuie suma
algebric a abaterilor pozitive este egal cu suma abaterilor negative absolute;


regul, dect abaterea medie calculat n raport cu mediana d

abaterea medie calculat n raport cu media aritmetic d s este mai mare, de


Me

abaterile mari n valoare absolut influeneaz n msur mai mare gradul de


variaie al unei caracteristici, n comparaie cu abaterile mai mici.
Dispersia (s2) se calculeaz ca o medie aritmetic simpl sau ponderat a
ptratelor abaterilor termenilor seriei de la media lor. Astfel:

2
x

2
x

pentru o serie simpl;

x x

n
x x

ni

pentru o serie de frecven;

n *i

pentru o serie de frecvene relative; unde i 1, m


100
Abaterea medie ptratic sau abaterea standard () se calculeaz ca o medie
ptratic simpl sau ponderat a abaterilor valorilor seriei fa de media lor, respectiv
rdcina ptrat din dispersie:

2
x

Abaterea medie ptratic reflect ntr-o mai mare msur influena factorilor
aleatori comparativ cu abaterea medie liniar. Abaterile extreme prin ridicarea la
ptrat au o influen mai mare dect abaterile intermediare, mai apropiate de medie.
Abaterea medie ptratic este mai mare dect abaterea medie liniar d .
Coeficientul de variaie (v) se calculeaz ca raport procentual ntre abaterea
medie liniar sau abaterea medie ptratic i media aritmetic:

100; 100
x
x

Coeficientul de variaie arat cte uniti din abaterea medie liniar sau din cea
ptratic revin la 100 de uniti de medie.
Coeficientul de variaie, comparativ cu ceilali indicatori ai dispersiei calculai n
mrimi medii d, , mrete sfera de comparabilitate a acestuia, deoarece poate fi
exprimat n uniti de msur diferite.
Coeficientul de variaie poate lua valori cuprinse ntre 0-100%
(0 < v < 100%).
Cnd coeficientul de variaie tinde spre zero, se consider o variaie slab, o
colectivitate omogen i o medie cu un grad ridicat de reprezentativitate.
Cnd coeficientul de variaie tinde spre 100%, variaia este intens, colectivitatea
eterogen, iar media are un grad de reprezentativitate redus.
Ca test de semnificaie a reprezentativitii mediei se pot stabili urmtoarele
praguri de semnificaie:
0 < v < 17% media este strict reprezentativ;
17% < v < 35% media este moderat reprezentativ;
35% < v < 50% media este reprezentativ n sens larg;
v > 50% medie nereprezentativ.
Mrimea coeficientului de variaie, ca i a abaterii medii ptratice, este direct
proporional cu variaia caracteristicii.
Aceti doi indicatori reprezint un mijloc de verificare a exactitii caracterizrii
care se face colectivitii prin media calculat
1.2. Aplicatie(rezolvata)

Dintr-un numar de 700 de firme s-a format un esantion alcatuit din 70 de firme
la care s-a realizat un control fiscal pentru a se estima gradul de evaziune fiscala la
nivelul intregii colectivitati (de 700 firme) Tabelul 1.1
Indicatorii simpli ai variaiei
amplitudinea absolut a variaiei (Ax)
Ax = xsup xinf = 208 110 = 96 u m
amplitudinea relativ a variaiei (Ax%)
Ax %

x sup x inf
x

100

208 110
100 63,5
151,2

x a 151,2

Tabelul 1.1
Algoritmul de calcul al indicatorilor sintetici ai variatiei
Grupe de
firme dupa
evaziunea
fiscala(1
(mil u.m.)
110 - 124
124 - 138
138 - 152
152 - 166
166 - 180
180 - 194
194 - 208
Total

Numar de
firme
(ni)

Centrul de
interval
(xi)

xini

(xi- x )

(xi- x )ni

(xi- x )2

(xi- x )2ni

6
15
23
10
7
2
7
ni=70

117
131
145
159
173
187
201
-

702
1965
3335
1590
1211
374
1407
xini=
10584

-34,2
-20,2
-6,2
7,8
21,8
35,8
49,8
-

-205,2
303,0
-142,6
78,0
152,6
71,6
348,6
(xi- x )ni=0

1169,64
408,04
38,44
60,84
475,24
1281,64
2480,04
-

7017,84
6120,60
884,12
608,40
3326,68
2563,28
17360,28
(xi- x )2ni=
37881,11

xi- x
ni=1301,6

1)Date ipotetice

x=

xn
n

i i
i

10584
151, 2 mil u.m. evaziune fiscala
70

abaterile individuale absolute (di)


di xi x

d1 = 117 151,2 = -34,2


d2 = 131 151,2 = -20,2
d3 = 145 151,2 = -6,2

d4 = 159 151,2 = 7,8


d5 = 173 151,2 = 21,8
d6 = 187 151,2 = 35,8
d7 = 201 151,2 = 49,8

d1 (-34,2) = abaterea minim (dmin)


d7 (49,8) = abaterea maxim (dmax)
abaterile individuale relative
d
49,8
d max % max 100
100 32,9%
151,2
x
d
34,2
d min % min x 100
100 22,6%
151,2
x
Indicatorii sintetici ai variaiei (Tabelul 1.1)
Caracterizeaz gradul de variaie lunar lund n consideraie toi termenii seriei
. Acetia sunt:
- abaterea medie liniar d ;
- dispersia (2);
- abaterea medie ptratic sau abaterea standard sau abaterea tip ();
- coeficientul de variaie (Vx).

Abaterea medie liniar d x


dx

x i x n i 1301,6

18,59 u. m.
70
ni

Abaterea medie liniar arat n medie cu ct se abat termenii seriei de la media


lor. Prezint dezavantajul c nu ine seama de semnul algebric i acord aceeai
importan att abaterilor mici, ct i abaterilor mari. Acest indicator este un indicator
concludent numai dac seria prezint un grad mare de omogenitate.
n exemplul dat, salariile nete ale persoanelor din eantion se abat n medie cu
18,59 u. m, n plus sau n minus fa de media eantionului (151,2 u.m).
2
Dispersia x este un indicator care nltur neajunsurile abaterii medii
liniare, este un indicator abstract, nu are form concret de exprimare i arat modul
n care valorile caracteristicii graviteaz n jurul mediei. Dispersia msoar variaia
total a caracteristicii studiate datorit cauzelor eseniale i ntmpltoare.

x i x n i 37881,11 541,16

70
ni
2

2
x

Acest indicator se folosete n verificarea ipotezelor statistice i n calculul altor


indicatori.
Abaterea medie ptratic numit i abaterea standard sau aba-terea tip x ,
este un indicator care acord fiecrei abateri importana cuvenit, prin ridicarea la

ptrat a abaterilor. Abaterea medie ptratic este mai mare dect abaterea medie
liniar

n .

Abaterea medie ptratic sau abaterea tip se folosete:


- n calculele de corelaie;
- la estimarea erorilor de sondaj;
- la verificarea semnificaiei anumitor indicatori statistici;
- la verificarea empiric a normalitii repartiiei fenomenului analizat. Astfel:
4 / 5 d x x atunci seria este normal normal.
4/5 d x x seria de distribuie se abate de la repartiia normal.
Dezavantajele abaterii medii ptratice sunt:
- se exprim n aceeai unitate de msur ca i variantele caracteristice (n acest
caz n uniti monetare);
- nu permite compararea variaiei a dou colectiviti n care caracteristica se
exprim n uniti de msur diferite.
Formula de calcul a abaterilor medii ptratice sau abaterii standard sau abaterii
tip este:
x 2x
x

541,16 23,26 u m

4
4
d x 18,59 u m 14,872 u m
5
5

14,872 23,26

4
din abaterea medie liniar este diferit ca valoare
5
de abaterea medie ptratic, adic seria de distribuie privind evaziunea fiscala medie
se abate de la forma unei distribuii normale.
Coeficientul de variaie (Vx) propus de Perason se calculeaz:
dx
100 (media
- ca raport ntre abaterea medie liniar i nivelul mediu: Vx
x
calculat);

- ca raport ntre abaterea medie ptratic i media calculat: Vx x 100 .


x
Coeficientul de variaie nltur toate neajunsurile celorlali indicatori de
variaie.
Acest indicator arat cte uniti din abaterea medie liniar sau ptratic revin la
100 de uniti de medie.
n cazul exemplului dat,

Totdeauna:

x
dx
100
100
x
x

Coeficientul de variaie ia valori de la 0 100%.


0 Vx 100%.
Dac: Vx = 0, nseamn lips de variaie, valorile sunt egale ntre ele i egale cu
media lor;
Vx 0 variaia caracteristicii este mic;
Vx 100% variaia caracteristicii este mare.
Intervalul de valori al coeficientului de variaie (Vx) se poate interpreta astfel:

0 < Vx 35%

- variaie mic;
- media este semnificativ;

- colectivitatea este omogen;


- gruparea este bine realizat.
35% < Vx 50% - variaie relativ mare;
- media calculat i gruparea realizat
sunt discutabile.
50% < Vx 100% - variaie foarte mare;
- media calculat nu este semnificativ;
- colectivitatea cercetat este eterogen;
- se impune refacerea gruprii.
Coeficientul de variaie poate fi folosit ca test de semnificaie a
reprezentativitii mediei astfel:
0 < Vx 17%
17% < Vx 35%
35% < Vx 50%
Vx > 50%

- media este strict reprezentativ;


- media este moderat semnificativ;
- media este relativ reprezentativ;
- media nu este reprezentativ.

n exemplul dat coeficientul de variaie este:


dx
18,59
Vx
100
100 12,29%
151,2
x

23,26
Vx x 100
100 15,38%
151
,2
x
x
dx
100
100; 15,38% 12,29%
x
x
Valorile coeficientului de variaie se situeaz sub 17% i se pot concluziona:
media calculat este strict reprezentativ;
colectivitatea este omogen;
gruparea este bine realizat.
In concluzie, esantionul format este reprezentativ pantry cele 700 de firme.
Se poate estima ca nivelul evaziunii fiscale la nivelul intregii colectivitati
este de circa 105840 mil u.m.
1.3 .INTREBARI DE AUTOEVALUARE
1)Ce este dispersia?
2)Ce plus de cunoastere aduc indicatorii de variatie?
3)Ce caracterizeaza indicatorii simpli ai variatiei?
4)Ce caracterizeaza indicatorii sintetici ai variatiei?
5)Cum se calculeaza coeficientul de variatie?
6)Care este intervalul de valori a coeficientului de variatie?
7)ce reprezinta abaterea medie liniara?
8)Unde se foloseste abaterea medie patratica?
9)Unde mai poate fi folosit coeficientul de de variatie in afara de masurarea
variatiei?
1.4. CUVINTE CHEIE

10

Indicatori ai variatiei, ai imprastierii,ai omogenitatii; dispersie; repartitie


unidimensionala; repartitie multidimensionala; amplitudinea variatiei; abaterea medie
liniara; abaterea standard; coeficientul de variatie; test de semnificatie;
reprezentativitatea mediei.
Cap.2. Indicatorii
bidimensionala

variatiei

intr-o

serie

de

repartitie

2.1. Regula de adunare a dispersiilor

Variabilitatea unitilor la nivelul unei colectiviti mprite n grupe


tipice (cazul seriilor bidimensionale) este influenat att de aciunea factorilor
eseniali (de grupare) ct i aciunea unor factori ntmpltori. Msurarea
influenelor factorilor asupra variaiei colectivitii se realizeaz cu ajutorul
sistemului indicatorilor factoriali ai variaiei: dispersia de grup sau dispersia
2
parial i2 , media dispersiilor de grup , dispersia dintre grupe (d),

2
dispersia total sau general 0 .
Dispersia de grup sau variana condiionat msoar influena
factorilor ntmpltori, factori care determin variaia n cadrul unei grupe
yi y j .

Dispersia de grup sau dispersia parial i2 se calculeaz ca o medie


aritmetic ponderat a ptratelor abaterilor variantelor caracteristicii de la
media grupei, dup relaia:

y y

n
j

2
i

n ij

ij

Media dispersiilor de grup se calculeaz ca o medie aritmetic


simpl sau ponderat a dispersiilor pariale astfel:
i2
2

pentru grupe cu un numr egal de uniti;



r
2n
2
i i pentru grupe cu un numr diferit de uniti.
ni
Acest indicator msoar variaia ntmpltoare a caracteristicii studiate pe
ntreaga colectivitate.
Dispersia dintre grupe (d2) se calculeaz ca o medie aritmetic ponderat
a ptratelor abaterilor mediilor de grup fa de media colectivitii generale.
y y0 n i
2 i
ni
Acest indicator reflect variaia caracteristicii dependente datorat aciunii
cauzelor eseniale pe ntreaga colectivitate.
2
Dispersia total sau general 0 se calculeaz ca o medie aritmetic
ponderat a abaterilor termenilor fa de media total.

11

02

yj y n
n
0

Acest indicator msoar variaia total a caracteristicii dependente (yj),


variaie datorat aciunii cumulate a cauzelor eseniale i ntmpltoare care se
ntlnesc la nivelul ntregii colectiviti.
n colectivitile eterogene n care acioneaz un numr mai mare de
factori, valoarea dispersiei generale este mai mare.
2
Regula de adunare a dispersiior 02 i 2 arat relaia dintre
dispersia total i cele dou dispersii factoriale i este o relaie important n
statistic. Pe baza acestei relaii se pot calcula i ali indicatori folosii n
analiza seriilor statistice de distribuie multidimensionale cum sunt:
coeficientul de determinaie (R2) i coeficientul de nedeterminaie (1-R2).
Coeficientul de determinaie (R2) stabilete ct la sut din variaia total
este determinat de factorul de grupare sau cauz. Cu ct valoarea lui se
apropie de sut, cu att factorul de grupare este mai pertinent.

Relaia de calcul este:

2
100
02
Coeficientul de nedeterminaie (K2 = 1-R2) se calculeaz dup
urmtoarea formul:
R2

i
K 2 100
0
2

ntre cei doi coeficieni exist urmtoarea relaie:


R2 + K 2 = 1
2
2
Dac R >1-R , nseamn c factorul de grupare acioneaz n mod
hotrtor asupra variaiei caracteristicii yj, iar dac R2<1-R2 variaia variabilei
Yj se datoreaz influenei exercitate de alte cauze.
2.2.Aplicatie (rezolvata)
Pentru a cuantifica variaia caracteristicii frauda medie constatata n funcie de
profilul mediu al firmelor, se vor calcula mai multi indicatori: abateri, dispersii,
coeficieni de variaie.
Se vor calcula:
mediile pe fiecare grup, dar i pe total eantion;
dispersiile pe fiecare grup i pe total eantion;
dispersia dintre grupe;
regula de adunare a dispersiilor;
coeficientul de determinaie;
coeficientul de nedeterminaie.

Tabelul nr. 2.1

12

Gruparea combinat a firmelor n funcie de frauda constatata si de profitul net

Grupe de
firme dupa
frauda medie
constatata
mil u.m.
I. 18-25
II. 26-40
III. 41-65

Grupe de firme dupa profitul net realizat(mil u.m.)


110-130 131-150 151-170 171-190 191-206
Total
7
5
17

7
6
26

0
7
11

0
7
9

0
5
7

14
30
70

Tabelul nr. 2.2


Algoritm de calcul al mediei i dispersiei pentru Grupa I
Grupe de
Numr Centrul de
firme dupa
de
interval
xin1
x i x 1 2 n1
profitul net
firme
(xi)
realizat
(n1)
(mil u.m.)
110-130
7
120,0
840,0
735,44
131-150
7
140,5
983,5
735,44
151-170
0
160,5
0
0
171-190
0
180,5
0
0
191-206
0
198,5
0
0
2
n

14
1823
,
5

x
n
,88 x i x1 n1
Total
1
i 1470
1
(120 130,25)2 7
(140,5 130,25)2 7
Profitul mediu al firmelor care produc o frauda de 18 ~ 25 mil u.m.
x i n 1 1823,5 130,25 u.m.
x1
14
n1
Dispersia grupei I

2
1

x x

n
i

n1

1470,88
105,06
14

13

Tabelul nr. 2.3


Algoritm de calcul al mediei i dispersiei pentru Grupa a II-a
Grupe de
firme dupa
profitul net
realizat
(mil u.m.)
110-130
131-150
151-170
171-190
191-206
Total

Numr de
firme (n2)

Centrul
de
interval
(xi)

5
6
7
7
5

120,0
140,5
160,5
180,5
198,5
-

n 2 30

xin2

xi x2 2 n2

600
8302,8
843
2460,4
1123,5
0,4
1263,5
2730,4
992,5
7125,3
2
x i n 2 4822,5
x 2 x 2 n 2 20619,3
(120 160,75) 5

Media profitului net din grupa a II-a de frauda constatata (26 ~ 40 mil.u.m.)

x2

xin2
n2

4822,5
160,75 u.m.
30

Dispersia firmelor din grupa a II-a de frauda n funcie de profitul net

22

2
x i x 2 n 2 20619,3 687,31
30
n2

Tabelul nr. 2.4


Algoritm de calcul al mediei i dispersiei pentru Grupa a III-a
Grupe de
Numr
Centrul
firme dupa de firme
de
xin3
xi x3 2 n3
profitul net
(n3)
interval
realizat
(xi)
(mil u.m.)
110-130
5
120,0
600
3691,0
131-150
13
140,5
1826,5
578,4
151-170
4
160,5
642,0
710,7
171-190
2
180,5
361,0
2221,7
191-206
2
198,5
397,0
5263,5
Total
n 3 26 x i n 3 3826,5 x i x 3 2 n 3 12471,3
Media profitului net din grupa a III-a de frauda constatata (41 ~ 65 mil u.m.)

x3

xin3
n3

3826,5
147,17 u.m.
26

Dispersia firmelor din grupa a III-a de frauda n funcie de profitul net

14

2
3

x x

n
i

n3

12471,3
479,66
26

Tabelul nr. 2.5


Total eantion
Grupe de
firme dupa
profitul net
realizat
(mil u.m.)
110-130
131-150
151-170
171-190
191-206
Total

Numr
de firme
(ni)

Centrul
de
interval
(xi)

17
26
11
9
7
n i 70

120,0
140,5
160,5
180,5
198,5
-

xi xi 2 ni

xini

2040,0
3653,0
1765,5
1624,5
1389,5
5 xi
x i n i 10472,

14894,72
2153,06
1306,91
8593,25
16738,47

x i n i 43686,41
2

Media eantionului

x0

xini
ni

10472,5
149,60 u.m.
70

Dispersia total a eantionului


2

x i x n i 43686,41

624,10
70
ni
2
0

Media dispersiilor de grup 2


Se calculeaz media ponderat a celor 3 dispersii pe grupe.

105,66 14 687,31 30 479,66 26


70

493,74

Dispersia dintre grupe ( 2)

15

x 0 ni
2

130,25 149,6 2 14 160,75 149,6 2 30 147,17 149,6 2 26


70

9125,0

130,36
70
x i x 0 2 ni

ni

130,25 149,6 2 14 160,75 149,6 2 30 147,17 149,6 2 26

9125,0
130,36
70

70

Regula de adunare a dispersiilor


02 2 2
624,1 = 493,74 + 130,36
Coeficientul de determinaie (R2) i nedeterminaie (1 R2)
Coeficientul de determinaie
2
130,36
R 2 2 100
100 20,9%
624,1
0
Coeficientul de nedeterminaie (1 R2)
2
493,74
1 R 2 2 100
100 79,1%
0
624,1
20,9% + 79,1% = 100%
Se constat c R2 1 R2, deci coeficientul de determinaie este mai mic dect
coeficientul de nederminaie, prin urmare frauda firmelor nu este in functie de profitul
net, frauda fiind influentata in mare masura de alte cauze (factori).
2.3.INTREBARI DE AUTOEVALUARE
1)Ce este dispersia de grupa sau varianta conditionata?
2)Ce arata regula de adunare a dispersiilor?
3)Ce stabileste coeficientul de determinatie?
4)Ce reflecta dispersia dintre grupe?
5)Ce masoara dispersia totala sau generala?
2.4.CUVINTE CHEIE
dispersia de grupa; media dispersiilor de grupa; dispersia totala; regula de
adunare a dispersiilor; coeficientul de determinatie; coeficientul de nederminatie.
Cap.3. Verificarea ipotezelor statistice

16

3.1. Verificarea normalitatii repartitiilor empirice


Ipoteza statistic este presupunerea care se face cu privire la parametrii unei
repartiii sau la legea de repartiie pe care o urmeaz anumite variabile aleatoare.
Ipoteza nul (H0) este ipoteza care urmeaz s fie verificat. Ea const
ntotdeauna n admiterea caracterului ntmpltor al deosebirilor, adic n presupunerea
c nu exist deosebiri eseniale.
Testul sau criteriul de semnificaie este procedeul de verificare a unei ipoteze
statistice.
Eroarea de genul nti este procedeul de verificare a unei ipoteze statistice.
Riscul de genul nti este posibilitatea comiterii erorii de genul nti. Se mai numete
i nivel (prag) de semnificaie sau nivel (prag) de ncredere.
Eroarea de genul al doilea este eroarea pe care o facem acceptnd o ipotez fals.
Riscul de genul al doilea este posibilitatea comiterii erorii de genul al doilea.
Testul de normalitate 2 ( hi patrat)
Pentru verificarea corespondenei dintre distribuiile teoretice i cele empirice se
folosete testul 2 .
Se parcurg urmtoarele etape:
a) se procedeaz la mprirea n grupe a colectivitii cercetate dup variabila xi n aa
fel nct numrul unitilor din fiecare grup s fie 5;
b) se determin media x i abaterea medie ptratic ( x);
c) se determin abaterile normale normate z i

xi x
;
x

d) se stabilesc valorile funciei F(z) care se gsesc n anexa cu distribuia normal

F z

1
2

z2
2

dz ;

e) se calculeaz valorile lui 2;


f) se compar valoarea lui 2 obinut prin calcul cu valoarea
riscului de genul I, q1. Ipoteza se accept dac
2

2
q1

q2 corespunztoare
1

i se respinge n caz contrar. Valorile

se caut n tabelele ntocmite pentru distribuia variabilei 2 n funcie de riscul q1 i de


2
q1

numrul gradelor de libertate (r l 1);


r = numrul grupelor (intervalelor formate);
l = numrul parametrilor repartiiei analizate.
3 .2 Aplicatie. Testul 2 (citeste hi patrat)
Se va folosi acelai exemplu, dar n loc de 7 grupe se vor lua numai 6, deoarece se vor
cumula (numai n acest caz) ultimele dou grupe, deoarece, procedeul presupune ca frecvena pe
fiecare grup (ni 5) s fie mai mare sau egal cu 5 (tabelul nr. 4.17.).
Pentru uurina calculului vom prelua valorile x i x din calculele anterioare ( x
= 151,2 u.m. i x = 23,26 u.m.).
Din algoritmul de calcul pentru verificarea normalitii distribuiei s-a obinut:
2 = 15,2175

17

Alegnd pentru riscul de genul I valoarea q 1 = 0,0001 i innd seama c numrul


gradelor de libertate este egal cu 3 (r l 1 = 6 2 1) n tabelul cu valorile variabilei 2
se gsete corespunztor probabilitii F( 2) = 0,999 i f = 3;
Deoarece
2

2
q1

q2 16,3 (anexa nr. 2).


1

15,275 16,3 se poate concluziona c ipoteza cu privire la

normalitatea distribuiei firmelor dup valoarea vnzrilor este real.

18

Tabelul nr. 3.1


Algoritmul pentru verificarea normalitatii distributiei firmelor dupa profitul net
Grupe
de firme
dupa
profitul
net
mil u.m.
110-124
124-138
138-152
152-166
166-180
180-208
Total
Explicatii

Numar de
firme
(ni)

6
15
23
10
7
9
n=ni=70

Centrul
de
interval
(xi)
117
131
145
159
170
194
-

xi xa
Zi
x
-1,470
-0,868
-0,266
0,335
0,808
1,840
(117-151,2):23,26=
-1,470
(131-151,2):23,26=
-0,868
(145-151, 2):23,26=
-0,266

3.3.INTREBARI DE AUTOEVALUARE
1)Ce presupune ipoteza statistica?
2)Ce presupune ipoteza nula?
3)Ce este eroarea de genul intai?
4)Ce este riscul de genul intai?
5)Ce este eroarea de genul al doilea?
6)ce este riscul de genul al doilea?
7)Ce este testul sau criteriul de semnificatie?

Anexa cu distributia normala

F Z
0,07078
0,1947
0,3974
0,6295
0,7881
0,96712
-

1
2

Z2
2

Probabilitatea
pi

npi
(n=ni=70)

ni npi

(ni npi ) 2
2
npi

0,07078
0,12392
0,2027
0,2321
0,1586
0,17902
0,19470,07078=0,12392
0,39740,1947=0,2027
0,62950,3974=0,2321
0,78810,6295=0,1586

4,9546
8,6744
14,1890
16,2470
11,1020
12,5314
0,0707870
0,1239270
0,202770
0,232170
0,158570
0,1790270

1,0454
6,3256
8,811
-6,247
-4,102
-3,5314
6-4,9546=1,0454
15-8,6744=6,3256
23-14,1890=8,811
10-16,2470=-6,247
7-11,1020=-4,102
9-12,5314=3,5314

0,226
4,4714
5,4714
2,4019
1,5156
0,9952
15,5175
(1,0454)2:4,9546=0,2206
(6,3256)2:8,6744=4,6128
(8,811)2:14,189=5,4714
(-6,247)2:16,2470=2,4019
(-4,102)2:11,1020=1,5156
(-3,5314)2:12,5314=0,9952

dZ

3.4.CUVINTE CHEIE
Verificarea normalitatii;repartitie empirica; ipoteza nula; lege de repartitie;
ipoteza statistica; test de semnificatie; eroare de genul intai; ricul de
genulintai; prag de semnificatie;test de normalitate.

19

Cap. 4. Sondajul statistic i modalitati de utilizare in activitatea de audit


financiar
Necesitatea obinerii de informaii, cu o maxim operativitate i cu un cost ct
mai mic, a fcut din sondajul statistic cea mai utilizat form de observare parial.
Obiectivul fundamental al sondajului statistic l reprezint investigarea unei pri
(eantion) din colectivitatea sau populaia statistic general n vederea extinderii
rezultatelor prelucrrii datelor de selecie la nivelul colectivitii generale.
ntruct din aceeai colectivitate pot fi formate mai multe eantioane, de volume
diferite sau de acelai volum, dar cu structuri diferite, informaiile obinute n urma
prelucrrii datelor de selecie nu sunt informaii certe i au un caracter incert datorit
erorilor obiective de reprezentativitate.
Aceasta nseamn c formularea concluziilor n urma prelucrrii datelor de
selecie se face n termeni probabilistici.
4.1. Noiuni fundamentale privind procedeele de esantionare si de reprezentativitate a
esantionului.
Cercetarea selectiv, selecie sau sondaj este o noiune ampl, care cuprinde
culegerea, prelucrarea, analiza i extinderea rezultatelor asupra ntregii colectiviti.
Pentru aceasta se parcurg dou etape distincte:
descrierea statistic, ce presupune culegerea i prelucrarea informaiilor
referitoare la eantion i calculul indicatorilor care-l definesc: media, dispersia etc.;
inferena statistic sau extinderea datelor obinute asupra
ntregii colectiviti.
Cercetarea prin sondaj presupune confruntarea a dou tipuri de colectiviti:
colectivitatea total pe care vrem s o cunoatem i eantionul pe care-l nregistrm. Prin urmare, ca s
le putem compara trebuie s cunoatem o serie de termeni perechi, care au acelai coninut
metodologic, dar difer din punctul de vedere al informaiei, astfel:
colectivitatea general colectivitatea de selecie;
media colectivitii generale media colectivitii de selecie;
dispersia colectivitii generale dispersia colectivitii de selecie.
Orice cercetare prin sondaj presupune o pregtire prealabil pe baza unui plan
numit i dosarul unui sondaj, care necesit parcurgerea unor etape:
precizarea obiectivelor sondajului, care vizeaz estimarea unor caracteristici
ale unei distribuii statistice (media, dispersia) sau verificarea unor ipoteze privind
forma distribuiilor statistice, legturile dintre fenomene, evoluia fenomenelor etc.;
eantionarea, care presupune alegerea bazei de sondaj, adic populaia
asupra creia se extind rezultatele obinute prin sondaj, delimitarea populaiei i
verificarea gradului de omogenitate, precum i probleme privind eantionul: alegerea
unitilor folosite n eantionare i alegerea tipului de sondaj i a procedeelor de
eantionare;
elaborarea planului de culegere a datelor i de prelucrare a informaiilor cu
precizarea indicatorilor statistici care vor rspunde cel mai bine scopului de
cunoatere;
n prezent, cercetarea prin sondaj i extinde aria de investigare, datorit
multiplelor avantaje pe care le prezint i care constau n:
este mai operativ i mai puin costisitoare;

20

permite un program mai vast de observare, deoarece se efectueaz pe o


populaie mai mic;
se poate folosi n studiul unor fenomene social-economice complexe pentru
care observarea total ar necesita cheltuieli bneti ridicate;
erorile de nregistrare sunt mai puine i mai uor de corectat;
se poate folosi n testarea calitii produselor fr s duc la distrugerea
ntregului lot;
se poate folosi ca mijloc de control, de testare, n cazul organizrii unei
observri totale, n vederea corectrii eventualelor necorelri sau carene n
organizare.
Rezultatele unui sondaj statistic depind de reprezentativitatea eantionului. Un
eantion este reprezentativ dac reuete s reproduc n mod asemntor colectivitatea general. O
reprezentativitate perfect nu se poate realiza dect cu totul ntmpltor; de aceea se
admite c reprezentativitatea este bun dac greutile specifice ale fiecrei grupe nu
difer cu mai mult de 5%, n raport cu structura colectivitii generale.
Asigurarea reprezentativitii eantionului presupune respectarea urmtoarelor
condiii:
alegerea unitilor care formeaz eantionul s se fac pe principiul hazardului
i cu o posibilitate calculat anticipat diferit de zero;
volumul eantionului s fie suficient de mare pentru a reda trsturile eseniale
ale colectivitii generale;
includerea unei uniti n eantion s se fac independent de alte uniti.
Reprezentativitatea eantionului depinde de procedeul i tipul de selecie folosit
i, bineneles, de profesionalismul persoanelor implicate n pregtirea planului de
sondaj.
Verificarea reprezentativitii eantionului se face prin compararea structurii pe
grupe a colectivitii de selecie cu cea a colectivitii generale, numit i structur
programat, folosind urmtoarea relaie:
ns n p
kd
n
unde kd = coeficientul de realizare a structurii programate;
ns = frecvena absolut a sondajului efectuat;
np = frecvena absolut a eantionului teoretic;
n = frecvena total a eantionului.
Testarea reprezentativitii se mai poate face i prin calcularea abaterilor de
structur a eantionului efectuat fa de structura programat astfel:
f Fi
kf i
n
n care: kf = coeficientul de abatere de la structura programat
fi = frecvena relativ a distribuiei eantionului efectuat;
Fi = frecvena relativ a distribuiei populaiei totale.
Testarea se mai poate realiza i prin compararea mediei de sondaj cu cea
calculat pentru ntreaga populaie prin relaia:

dx

x x0
100
x0

21

4.2Aplicatie(rezovata)
n exemplul urmtor ne propunem s verificm gradul de reprezentativitate a
unui eantion de 10% din 500 de firme, care au fost verificate in timpul unui control
efectuat

Tabelul nr. 4.1.


Algoritm de calcul pentru verificarea reprezentativitii esantionului
Grupe de
firme dup
valoarea
fraudei
constatate
mii u.m.
80-84
84-88
88-92
92-96
Total

Colectivitatea
general
cifre
cifre
absolut relative
e
(ni*)
(ni)
85
17
210
42
130
26
75
15
500
100

Selecia teoretic
(10%)
cifre
cifre
absolut relativ
e
e
(nt)
(nt*)
8
16
21
42
13
26
8
16
50
100

Selecia efectiv
(10%)
cifre
cifre
absolute relative
(n1)
(n1*)
10
24
12
4
50

20
48
24
8
100

u.m. = uniti monetare


Tabelul nr. 4.2.
Calculul mediilor de selecie si a colectivitii generale
Centrul de interval
(xi)
82
86
90
94
Total

xini

xint

xin1

6970
18060
11700
7050
xini = 43780

456
1806
1170
752
xint = 4384

820
2064
1080
376
xin1= 4340

Selecia teoretic sau programat reprezint un eantion ideal care s-ar fi realizat
dac se extrgeau din fiecare grup 10% din unitile componente.
43780
87,56 mii u.m.
Media colectivitii generale x 0
500
4384
87,68 mii u.m.
Media seleciei teoretice x t
50
4340
86,80 mii u.m.
Media seleciei efectuate x1
50
Media seleciei teoretice este mai aproape de media colectivitii generale, cum
era i normal, dar i media seleciei realizate este foarte apropiat de media
colectiviii generale, ceea ce conduce la concluzia c eantionul este reprezentativ.
Vom verifica n continuare reprezentativitatea eantionului i prin alte mijloace
de testare (tabelul 4.3.)
Tabelul nr. 4.3.

22

Algoritm de calcul pentru verificarea reprezentativitii eantionului pe baza


coeficientului de abatere de la structura programat
Grupe de
firme dup
valoarea
fraudei
constatate
mii u.m.
80-84
84-88
88-92
92-96
Total

Selecia teoretic
Numrul de
Cifre
firme
relative
(nt)
8
21
13
8
50

Selecia efectuat
Numrul de
Abateri (df)
firme
(nt-n1)
(n1)

16
42
26
16
100

10
24
12
4
50

-2
-3
1
4

10

Coeficientul de abatere de la structura programat k d f

k df

100

n
n
Coeficientul de reprezentativitate d x

n1

10
100 20%
50

x1 x 0
86,80 87,56
100
100 0,86%

dx
x0
87
,
56
d x 100
x0
x t x 0 100 87,68 87,56 100 0,14%
x 0
87,56

Eantionul realizat este reprezentativ, deoarece se ncadreaz n limita admis de


5%.
4.3. Principii i procedee de eantionare
Alegerea unitilor care vor constitui eantionul se face fie dup principiul
seleciei aleatoare, fie dup principiul alegerii raionale.
Principiul alegerii aleatoare sau probabilistice presupune extragerea unitilor
din colectivitatea general dup jocul hazardului, fiecare unitate component avnd
anse egale de a fi aleas n eantion. Acest tip de extragere se aplic de obicei cnd
nu se cunoate structura colectivitii totale.
Principiul alegerii raionale are la baz un criteriu prestabilit i se aplic atunci
cnd colectivitile sunt grupate n grupe tipice, deci cu o structur cunoscut.
n practica sondajului se folosesc mai multe procedee de constituire a
eantionului:
al bilei revenite i nerevenite care se realizeaz prin extragerea n mod
ntmpltor a unui cartona (sau bile) pe care n prealabil a fost nscris numrul unei
uniti a colectivitii totale. Odat extras, acest cartona, sau bil, este repus sau nu
n urn n funcie de varianta adaptat (revenit sau nerevenit);
mecanic care necesit ordonarea unitilor dup o caracteristic i stabilirea
unui pas de numrare determinat n raport de mrimea colectivitii generale i de cea
a eantionului;
tabelul cu numere ntmpltoare care const n nscrierea la ntmplare
ntr-un tabel a numerelor care au fost mai nti amestecate. Tot la ntmplare se face i
alegerea din tabel a numerelor care vor forma eantionul.

23

selecii dirijate i mixte care au un obiectiv special i sunt mai rar folosite n
practica curent.
n practica statistic se folosesc mai multe tipuri de selecie care sunt dictate de
anumite particulariti:
gradul i forma de variaie a caracteristicii studiate;
modul de organizare a colectivitii totale;
modul de repartiie teritorial a unitilor;
procedeul de formare a eantionului.
Se disting urmtoarele tipuri de selecie:
selecie ntmpltoare simpl;
selecie mecanic;
selecie tipic (stratificat);
selecie de serii;
selecie n mai multe trepte;
selecie secvenial (n cazul controlului calitii produselor);
selecie subiectiv organizat (dirijat).
Fiecare tip de selecie presupune calcularea urmtorilor indicatori:
eroarea medie de reprezentativitate x ;
eroarea limit ();
volumul eantionului (n);
Calculul acestor indicatori pentru toate tipurile de sondaj se face dup modelul
seleciei ntmpltoare simple, cu mici modificri, n funcie de particularitile
fiecrui tip de sondaj.
Selecia ntmpltoare simpl
Cnd colectivitatea este format din uniti simple i prezint un anumit grad de
omogenitate se recomand acest tip de sondaj. Pentru formarea eantionului se
procedeaz la extragerea unitilor n mod repetat sau nerepetat dintr-o urn sau de pe
o list dinainte stabilit.
Erorile de reprezentativitate sunt mai mari n raport cu alte tipuri de selecie.
Sondajul tipic stratificat
Sondajul tipic stratificat este una din formele cele mai frecvent utilizate n
practic, deoarece se efectueaz pe colectiviti care au fost n prealabil desprite n
grupe omogene, dup o caracteristic esenial.
Fiecare grup va fi prezentat n eantion, fapt care va reduce eroarea de
reprezentativitate.
Variaia mediilor de selecie va fi n funcie de variaia fiecrei grupe, msurat
prin dispersiile de grup.
Selecia tipic poate fi: simpl, proporional i optim.
Selecia tipic simpl presupune extragerea unitilor din fiecare grup, fr a
ine seama de ponderea unitilor din fiecare grup a colectivitii generale.
Selecia tipic proporional are n vedere formarea unor subeantioane n
raport cu ponderea pe care o are fiecare grup n colectivitatea general.
Selecia tipic optim ia n consideraie ponderea pe care o au grupele n
colectivitatea general a eantionului format.
Selecia tipic d cele mai mici erori, dar este greu de aplicat.
Estimarea mediei privind volumul cheltuielilor totale se poate realiza pe baza
indicatorului privind eroarea maxim admis, care se calculeaz astfel:

24

x z x z

1
N

Selecia de serii
Acest tip de sondaj se efectueaz n condiiile n care colectivitatea cercetat este
organizat permanent pe uniti complexe (echipe, secii, brigzi, ateliere etc.)
De exemplu, dac echipa managerial a unei uzine care produce corpuri de
iluminat dorete s afle cauza procentului ridicat de rebuturi, atunci va organiza un sondaj privind
calitatea produselor obinute pe fiecare secie n parte. Secia este format din uniti (persoane)
eterogene din punct de vedere al pregtirii, vrstei, calificrii, vechimii; prin urmare, rezultatul muncii
lor este un rezultat de echip i nu de persoane luate independent. Felul cum toi aceti factori eseniali
i neeseniali (din cadrul echipei) acioneaz, mpreun sau separat, dicteaz rezultatele de producie i
calitatea produselor. Prin urmare, gradul de variaie a calitii produselor depinde, n primul
rnd, de dispersiile care exist ntre seriile colectivitii.
Pentru fiecare serie extras se nregistreaz nivelurile individuale, se face media
lor, iar eroarea de sondaj se stabilete ca diferen ntre media seriilor care au intrat n
eantion i media colectivitii generale, sintetizate prin dispersia dintre grupe (d)
n cazul acestui tip de sondaj, erorile de reprezentativitate vor fi mai mici sau
egale cu rezultatele sondajului simplu.
Relaiile de calcul ale celor trei indicatori sunt prezentate n tabelul nr. 4.4.
Tabelul nr. 4.4.
Indicatorii de calcul n cazul seleciei de serii

Indicatorul
de selecie

Eroarea
medie de
reprezentati
vitate
Eroarea
limit
Volumul
eantionului
(n)

Caracteristic
a
nealternativ
Selecia
repetat

Selecia
nerepetat

Selecia
Selecia
repetat
nerepetat
2
2
2
2
p
2p R r
x 0 R r
w
x 0
2x

w
w
r R 1
r
r
r R 1
r
r x

x z x

z2 x
r 2
x

2x R r

r R 1
x z x

w z w

R z 2 2x
z 2 2w
r
r
R 1 2x z 22x 2w

2w R r

r R 1
w z w

R z 2 2w
r
R 1 2w z 22w

Erorile cercetrii selective


Erorile provenite din sondaj pot fi de dou feluri: de nregistrare i de
reprezentativitate i reprezint diferena dintre valoarea indicatorilor obinui n urma

25

prelucrrii datelor din eantion i valoarea acelorai indicatori obinui n urma


observrii totale.
Erorile ntmpltoare sunt de obicei puine i uor de corectat, deoarece
unitile cuprinse n sondaj sunt puine. Aceste erori nu afecteaz calitatea
informaiilor culese.
Erorile de reprezentativitate, dup sursa provenienei lor, pot fi: erori
sistematice i erori ntmpltoare.
Erorile sistematice de reprezentativitate se produc ntr-un singur sens i sunt
consecina influenei subiective a celui care efectueaz selecia prin nerespectarea
principiului teoriei seleciei, de a acorda fiecrei uniti ansa de a fi selectat n
eantion.
Erorile ntmpltoare de reprezentativitate se produc n ambele sensuri i sunt
urmarea aciunii unei multitudini de factori care au caracter aleator.
Erorile ntmpltoare de reprezentativitate se produc n orice tip de sondaj,
eliminarea lor complet fiind practic imposibil. Este posibil ns determinarea cu
exactitate a mrimii lor probabile i apoi se stabilesc limitele de ncredere pentru
estimaiile parametrilor colectivitii totale.
Determinarea mrimii erorilor de reprezentativitate se poate face, n principal, cu
ajutorul urmtorilor indicatori:
eroarea efectiv;
eroarea medie de selecie;
eroarea limit.
Indicatorii folosii pentru msurarea erorilor de reprezentativitate fiind mrimi ale variaiei,
nseamn c mrimea lor depinde de omogenitatea colectivitii din punctul de vedere al variabilei
cercetate.
Mrimea erorilor de reprezentativitate este influenat de mrimea eantionului.
Cu ct volumul eantionului crete, cu att valorile statistice obinute din eantion se
vor apropia mai mult de parametrii colectivitii generale.
Conform principiilor legii numerelor mari, n teoria seleciei se afirm c dac
volumul eantionului este suficient de mare, media de selecie se distribuie dup curba normal a lui
Gauss-Laplace (fig. 1.).

Fig. 1. Distribuia normal a erorilor de reprezentare


Interpretarea mediilor i a erorilor de selecie se face pe baza distribuiei normale
potrivit creia trebuie stabilite intervalul de ncredere, nivelurile de siguran i
pragurile de semnificaie (tabelul nr. 4. 5.).

26

Tabelul nr. 4. 5.
Intervalul de ncredere, nivelul de semnificaie i pragul de semnificaie a unei
distribuii normale
Intervalul de ncredere
x x 0 x
1,96 x x 0 1,96 x
2,00 x x 0 2,00 x
2,58 x x 0 2,58 x
3,00 x x 0 3,00 x
3,29 x x 0 3,29 x

Nivelul de siguran
(%)
68,26
95,00
95,44
99,00
99,73
99,90

Pragul de semnificaie
(%)
31,74
5,00
4,56
1,00
0,27
0,10

Intervalul de ncredere desemneaz zona probabil n interiorul creia se va


plasa media colectivitii generale. Se pornete de la media de sondaj corectat cu
nivelul erorii limit maxim admise.
Lungimea intervalului de ncredere este direct proporional cu mrimea
mprtierii valorilor, msurat prin abaterea medie ptratic (s), i invers
proporional cu nivelul pragului de semnificaie.
Valoarea complementar a nivelului de ncredere este pragul de siguran i se
fixeaz prin programul de cercetare. Cele mai utilizate valori ale probabilitii de
ncredere sunt: 90%, 95%, 99%, 99,9%, crora le corespund niveluri de semnificaie
de 10%, 5%, 1%, 0,1%.
Indicatorii statistici calculai pentru eantionul selectat servesc
n final la estimarea parametrilor colectivitii generale cu o precizie aprioric stabilit.
Se folosesc n acest sens dou procedee:
procedeul coeficientului de corecie;
procedeul extinderii directe.
Procedeul coeficientului de corecie se folosete de obicei la verificarea
autenticitii datelor culese dintr-o observare total.
Procedeul coeficientului de corectie: se procedeaza la efectuarea unei noi
inregistrari asupra unei parti de 5%, 10% din colectivitatea generala. Se raporteaza
numarul de unitati selectate la numarul total si se obtine un coeficient k.
Procedeul extinderii directe const n estimarea parametrilor colectivitii
generale pe baza rezultatelor seleciei statistice, cnd nu se dispune de informaii
privind observarea total. Potrivit inegalitatii lui Cebsev, probabilitatea se situiaza
intr-un interval de incredere dat de media de selectie la care se adauga sau se scade
eroarea limita: x n x0 x n
4.2.Aplicatie (rezolvata)
Dintr-un numar de 700 de firme ce trebuie verificate s-a realizat un esantion de 70 de
firme formandu-se 7 grupe de firme in functie de frauda constatata. Se cere sa se
stabileasca frauda medie si frauda totala ce se estimeaza la nivelul celor 700 de firme.
Metodele de esantionare folosite au fost de mai multe feluri. In functie de
metodele de esantionare s-au calculat si indicatorii de selectie adecvati metodei de
selectie

27

Pentru fiecare tip de sondaj s-a calculat i care ar fi trebuit s fie mrimea
eantionului pentru ca rezultatele sondajului s fie ct mai corecte.

Tabelul nr. 4.6.

Algoritmul necesar pentru determinarea indicatorilor de selecie

Grupe de
firme dupa
frauda
constatata
(mii u.m.)
110 - 124
124 - 138
138 152
152 166
166 180
180 194
194 - 208
Total

Numr
de firme
(ni)
6
15
23
10
7
2
7
ni = 70

Cen-trul de
interval
(xi)
117
131
145
159
173
187
201

xi ni
702
1965
3335
1590
1211
374
1407
xini = 10584

x i x 2 ni
7017,84
6120,60
884,12
608,40
3326,68
2563,28
17360,28
2
x i x n i 37881,11

Pentru a se trece la determinarea indicatorilor de selecie este necesar s se


calculeze mai nti media aritmetic, abaterea medie ptratic i coeficientul de
variaie pentru a se vedea dac media este reprezentativ.
Media aritmetic:

Dispersia:

x i x n i 37881,11 541,16

70
ni
2

Abaterea medie ptratic:


Coeficientul de variaie:
Vx

23,26

0,1538 15,38%
x 151,2

Deoarece coeficientul de variaie se situeaz sub 17%, se poate spune c media


eantionului este strict reprezentativ.

. Selecia ntmpltoare simpl cu revenire


sau repetat caracteristica nealternativ
1. Eroarea medie de reprezentativitate x

2 dispersia
n mrimea eantionului
2. Eroarea maxim admis x sau eroarea limitat.
Produsul x z x se numete eroare limitat.

28

Coeficientul z este argumentul funciei Gauss Laplace, care se gsete n


tabele statistice (anexa nr.4). Pe msur ce crete valoarea funciei, crete i valoarea
argumentului, adic pe msur se crete probabilitatea, crete i intervalul de ncredere
al mediei i scade exactitatea cu care se estimeaz media colectivitii generale.
Coeficientul de probabilitate z este direct proporional cu eroarea limit i invers
proporional cu eroarea medie de reprezentativitate:

z x
x
Funcia de probabilitate z este direct proporional cu mrimea coeficientului
z, ea se apropie de 1 (ctre certitudine) proporional cu creterea coeficientului z.
Creterea probabilitii se manifest prin mrirea intervalului de ncredere, ceea ce duce
la o precizie mai sczut a rezultatelor. Pe msur ce crete probabilitatea, precizia
scade.
n condiii date de probabilitate, creterea preciziei rezultatelor se obine prin
mrirea volumului de selecie, adic a eantionului.
Se presupune c se dorete o eroare limit admis de 1,96 (z = 1,96) fa de
eroarea maxim admis care poate fi 5
Z = 1,96 (pentru = 0,95; x 2,78
3. Estimarea intervalului de ncredere a fraudei medii.
n acest caz, pentru extinderea rezultatelor la nivelul ntregii colectiviti se
folosete procedeul extinderii directe. Acest procedeu const n estimarea
parametrilor colectivitii generale pe baza rezultatelor seleciei statistice. Indicatorii
obinui prin sondaj se abat de la cei reali datorit erorilor de reprezentativitate. Aceti
indicatori se situeaz ntr-un interval de ncredere dat de media de selecie la care se
adaug sau se scade eroarea limit, astfel:
x x x0 x x

unde: x 0 = media colectivitii totale (de 700 de firme)


x = media eantionului (de 70 de persoane)
x = eroarea maxim admis calculat anterior
x 151,2 u m; x 5,4488 u m
151,2 - 5,4488 x 0 151,2 5,4488

145,75 x 0 156,65
Frauda medie pe ntreaga colectivitate de 700 de firme se va situa ntre 145,75
i 156,65 u.m. Eroarea maxim de estimare a fraudei medii va fi de 5,4488 mii u.m.
Dac se dorete micorarea erorii maxime cu 50%, deci n loc de 5,4488 u.m. s

fie permis o eroare x de numai 2,7244 mii u.m., atunci este necesar mrirea
eantionului. n calculul de mai sus eantionul a fost de 70 de firme.
4. Volumul noului eantion (n) se calculeaz cu urmtoarea formul.
'

5,4488
2,7244
2
2
2 = 541,16 (dispersia calculat)
'x 2 = (2,7244)2.

unde: z = 1,96; ' x

. Selecia ntmpltoare simpl nerepetat


caracteristica nealternativ

29

1. Eroarea medie de reprezentativitate x


x

unde: 2 = dispersia (2 = 541,16)


n = mrimea eantionului (70)
N = colectivitatea total (700 firme)

2. Eroarea maxim admis sau eroarea limit x

Se observ c, n cazul seleciei ntmpltoare simple nerepetate, valorile


indicatorilor de selecie sunt mai mici, deci rezultatele sunt mai precise dect n cazul
seleciei ntmpltoare simple repetate.
3. Estimarea intervalului de ncredere x 0
x x x0 x x

151,2 5,1548 x 0 151,2 5,1548

146,05 x 0 156,35
Frauda medie se va situa ntre 146,05 i 156,35 mii u.m. la nivelul ntregii
colectiviti de 700 firme.
4. Volumul noului eantion (n)
Formula de calcul a volumului eantionului n cazul seleciei simple nerepetate
este:
z 22
n
z 22
2x
N
Se va folosi i o eroare limit mai mic cu 50%.
z = 1,96
5,1548
2,574
' x
2
2 = 541,16; N = 700 pers

n cazul seleciei nerepetate, volumul eantionului este mai mic cu 63 de firme


(280 217).

. Selecia repetat caracteristica alternativ


n cazul seleciei cu caracteristic alternativ sunt acceptate dou variante de
rspuns.
S presupunem c ne intereseaz numrul firmelor care vor avea o frauda mai
mare sau egala cu 180 mii u.m. i, implicit, firmele care vor avea o frauda mai mica
de 180 mii u.m..
Din gruparea realizata, se observ c numrul firmelor care au o frauda mai
mare de 180 mii u.m. este de 9 (frecvena ultimelor dou grupe)

30

m
9

0,129 12,9%
n 70
unde: m = numrul firmelor cu o frauda mai mare de 180 mii u.m.
dispersia: w (1 w) = 0,129 (1 0,129) = 0,112
vom avea: media: w

1. Eroarea medie probabil de reprezentativitate este:


w 1 w
0,112
w

0,04 4%
n
70
2. Eroarea limit admis (tot pentru z = 1,96)
w = zw = 1,96 0,04 = 0,078 (7,84%)
3. Limitele ntre care se va situa numrul firmelor cu o frauda de 180 mii u.m
i peste 180 mii u.m (p)
w w p W + w
0,112 0,0784 p 0,112 + 0,0784
0,0336 p 0,1904
3,36% p 19,04%

w = 0,112
w = 0,0784

4. Estimarea numrului de firme care vor avea o frauda de 180 mii u.m sau mai
mare de 180 u.m (M)
N (W w) M N(W + w)
0,0336

0,1904 (din calculele


anterioare)
700 0,0336 M 700 0,1904
24 M 133 firme
5. Volumul noului eantion (n)
S presupunem c se dorete ca eroarea limit (w) s fie redus la jumtate:

. Selecia nerepetat caracteristica alternativ


m
9

0,129 , deci 12,9% este numrul firmelor care au n cadrul


n 70
eantionului o frauda mai mare de 180 de mii de uniti monetare.
1. Eroarea medie de reprezentativitate (w)
w = 0,129
w1 w
n
w
1
n = 70 firme
n
N

N = 700 firme
w

31

0,1291 0,129
70
1

70
700

0,0379 3,79%

0,0016 0,9

2. Eroarea maxim admis (pentru z = 1,96)


z = 1,96; w = 0,0379
w = z w = 1,96 0,0379 = 0,0743 (7,43%)
3. Limitele ntre care se va situa ponderea numrului de firme cu o frauda egala
sau mai mare de 180 mii u.m.
w w p w + w
0,129 0,0743 p 0,129 + 0,0743
0,0547 p 0,2033
5,47% p % 20,33%
4. Estimarea numrului de firme care vor avea o frauda egala sau mai mare de
180 mii u.m.
N (w w) M N (w + w)
w w = 0,0547
w - w = 0,2033
700 0,0547 M 0,129 + 0,2033
38 M 142 firme
5. Volumul noului eantion (n)

n'

z 2 w 1 w
;
2
z 2 w 1 .w
'
w
N

z = 1,96; w = 0,0743

' w

w 0,0743

0,0372
2
2

w = 0,129; N = 700

i n cazul unei caracteristici alternative, volumul eantionului este mai mic


dac se folosete procedeul seleciei nerepetate (214 firme fa de 287 n cazul
seleciei repetate).

Selecia tipic stratificat caracteristica alternativ


Acest tip de sondaj d cele mai mici erori n activitatea practic. Selecia tipic
se aplic cel mai frecvent n studiul fenomenelor social-economice care n prealabil
au fost mprite n grupe omogene (straturi sau tipuri de uniti) dup o
caracteristic esenial notate cu N 1, N2, , Nr i reprezentate n sondaj prin
volumul subean-tioanelor n1, n2, , nr.
Dac grupele n care a fost mprit colectivitatea sunt omogene, mediile de
grupare x i au valori apropiate de valorile indi-viduale din care s-au calculat,
abaterile ntr-un sens sau altul sunt mici, iar gradul de variaie este mic.
Cnd caracteristica ce a stat la baza separrii unitilor n grupe calitativ
omogene joac un rol important n variaia caracteristicii cercetate, mediile de grup
sau pariale x i se vor abate de la media colectivitii generale. Aceasta nseamn c

32

influena cauzelor ntmpltoare va fi mai redus n raport cu cea a cauzelor eseniale.


Selecia tipic poate fi: simpl, proporional, optim.
Selecia tipic simpl se caracterizeaz prin faptul c extragerea unitilor din
fiecare grup se face la ntmplare fr s se in seama de ponderea unitilor din
fiecare grup a colectivitii generale.
Selecia tipic proporional este acea selecie la care volumul subeantioanelor
difer n raport cu ponderea pe care o are fiecare grup n colectivitatea general i
n
respect proporia de selecie
.
N
Selecia tipic optim presupune ca la formarea eantionului s se ia n
consideraie ponderea pe care o au grupele n colectivitatea general i mrimea
variaiei din interiorul grupelor msurat prin abaterea medie ptratic. Volumul
subeantioanelor pe grupe (ni) se va calcula dup relaia:

ni n

i N i
i N i

unde: Ni = numrul unitilor pe grupe;


2 = abaterea medie ptratic.
Indicatorii de selecie se vor calcula folosind media dispersiilor pariale.
Calculul indicatorilor de selecie pentru sondajul tipic se realizeaz dup
urmtoarele formule (tabelul nr. 4.7.).

Tabelul nr. 4.7.


Indicatorii de
selecie
Eroarea medie
de
reprezentativit
ate
Eroarea limit
Volumul
eantionului
Indicatorii de
selecie
Eroarea medie
de
reprezentativit
ate
Eroarea limit
Volumul
eantionului

Caracteristic nealternativ
Selecia repetat
Selecia nerepetat
i2
n

x z x

z i
2

i2
n
1
n
N

x z x

z 2 i

x 2

2
2
x 2 z

N
Caracteristic alternativ
Selecia repetat
Selecia nerepetat
w

w 1 w
n

w 1 w
n
1
n
N

w z w

w z w

z 2 w 1 w
2w

z 2 W (1 W )
z 2 W 1 W
2w
N

S-a realizat urmtoarea grupare combinat pe baza esantionului realizat


(tabelul nr. 4.8.)

33

Tabelul nr. 4.8.


Grupe de
firme dupa
tipul de
activitate
I. Farmacii
II. Baruri +
cazinouri
III. Servicii
Total

Grupe de firme dupa frauda constatata (mii u.m.)


110 -130
131-150 151-170 171-190 191-206

Total

7
5

7
6

0
7

0
7

0
5

14
30

5
17

13
26

4
11

2
9

2
7

26
70

Se procedeaz la calcularea mediei i dispersiei pe fiecare grup, dar i pe total


eantion.
Se intocmeste un tabel pe baza metodologiei de calcul privind regula de adunare a
dispersiilor (4.8).

Tabelul nr. 4.9.


Tabelul sintetic pentru determinarea mediilor i dispersiilor de grup

- Media dispersiilor de grup i2

34

i2

i2 n i
ni

105,06 14 687,31 30 479,66 26 493,74


70

- Media de selecie x - frauda medie la nivelul intregului esantion.

4.5.6. Selecia tipic stratificat caracteristica


nealternativ
Eroarea medie de reprezentativitate (sau de selecie)
- pentru selecia repetat

- pentru selecia nerepetat se introduce coeficientul de corecie 1


N

Eroarea medie limit (x)


- pentru selecia repetat pentru z = 1,96
- pentru selecia nerepetat
Limitele fraudei medii estimate
x x x 0 x x
- pentru selecia repetat

- pentru selecia nerepetat

Limitele pentru frauda totala estimata


- n cazul seleciei repetate
700 144,4 < F < 700 154,82
101080 < F < 108374 u.m.
- n cazul seleciei nerepetate
700 144,67 < F < 700 154,55 u.m.
101269 < F < 108185 u.m.
Volumul noului eantion
- n cazul seleciei repetate prin micorarea erorii cu 50%
z = 1,96; 2 4937,74

' x =5,21 u.m.

35

' x = x 5,21 2,61


2

'
- n cazul seleciei nerepetate, tot n cazul unui z = 1,96 i x

x
2

Cele 215 firme se vor repartiza pe grupe tipice, proporional cu numrul


firmelor care formeaz eantionul. Eantionul este format din 70 de firme repartizate
pe grupe astfel: 20% n grupa I, 43% n grupa a II-a i 37% n grupa a III-a. Noul
eantion va fi:

Farmacii
Baruri + cazinouri
Servicii diverse
Total

0,20 215 = 43
0,43 215 = 92
0,37 215 = 80
215

Selecia tipic repetat i nerepetat


n cazul caracteristicii alternative
Se determin numrul de firme plasate peste media fraudei pe fiecare grup i
n funcie de aceste firme se determin greutatea specific (w i) a firmelor plasate
2
peste medie i dispersiile de grup w (tabelul nr.4.9.):
Tabelul nr. 4.9.

Grupe de Nufirme
mr
Frauda
dupa
de
medie pe
tipul de firme
grup
activitate (ni)
Grupa I
Farmacii 14
130,25
u.m.
Grupa II
Baruri + 30
160,75
cazinour
u.m.
i
Grupa III
Servicii
70
147,17
diverse
u.m.
Total
70
149,604
u.m.

Nr. firme
plasate
peste
frauda
medie
constatata

Greutatea
specific
m
w
n

Dispersii de grup
2w w i 1 w i

0,5 (7 : 0,25
14)

14

0,47 (14 : 0,2491


30)

0,34 (9 : 0,2244
26)
0,43 (30 : 0,2419
70)

30

36

w1

7
14
9
0,5; w 2
0,47; w 3
0,34
14
30
26

i2 w i 1 w i ; 12 0,51 0,5 0,25; 22 0,471 0,47 0,2491;


32 0,341 0,34 0,2244

2
Media dispersiilor de grup w

w i 1 w i n i 0,25 7 0,2491 14 0,2244 9 0,2419


30
ni

w2

w i 1 w i 0,2419

Eroarea medie de reprezentativitate

w 1 w

0,2419
0,05878 (pentru selecia repetat)
70

0,2419
70
1

70
700
0,9

0,05878 0,9486 0,055758

w 1 w
n
1
n
N

0,003455 0,9

(pentru selecia nerepetat)


Eroarea limit admis (w) pentru z = 1,96
w = z w = 1,96 0,05878 = 0,1152 pentru selecia repetat;
w = z w = 1,96 0,055758 = 0,10928 pentru selecia nerepetat.
S-a pstrat n toate cazurile un coeficient z = 1,96, deci aceeai probabilitate z
= 0,95 i s-a micorat eroarea limit cu 50% pentru a se putea face o comparaie ntre
rezultatele obinute n diferite tipuri de sondaj. Rezultatele au fost apropiate.
n realitate, valorile coeficientului z pot varia ntre 0,1 i 5, iar micorarea erorii
limit se poate face n orice proporie. Volumul eantionului este n funcie de costul
pe care i-l pot permite cei care doresc un sondaj. Un eantion mai mare, dei mai
precis n privina rezultatelor obinute, este totui mai costisitor.
4.3.INTREBARI DE AUTOEVALUARE
1)Ce cuprinde cercetarea selectiva?
2)Ce etape presupune cercetarea selectiva?
3)Care sunt cele doua colectivitati pe care le presupune cercetrea prin sondaj?
4)Ce etape cuprinde dosarul unui sondaj?
5)Care sunt avantajele cercetarii prin sondaj?
6)Ce inseamna un esantion reprezentativ?
7)De cine depinde reprezentativitatea unui esantion?
8)Ce presupune principiul alegerii aleatoare?
9)Care sunt procedeele de constituire a esantionului folosite inpractica sondajului?
10)ce este sondajul stratificat?
11)Ce este intervalul de incredere?
4.4.CUVINTE CHEIE

37

cercetare selectiva; inferenta statistica; esantion; reprezentativitatea esantionului;


principiul bilei revenite si al bilei nerevenite; selectie dirijata; sondaj tipic stratificat;
selectie intamplatoare simpla; interval de incredere; argumentul functiei Gauss
Laplace; eroare maxima admisa; nivel de semnificatie.
Cap. 5 Modele econometrice de analiza a regresiei si corelatiei liniare
simple si multiple
Metodele de studiere a dependenelor dintre dou sau mai multe variabile sunt
multiple. Dintre acestea cele mai reprezentative sunt cele cuprinse n analiza de
regresie i corelaie. n cadrul acestor metode se studiaz dependena dintre o
variabil (caracteristic) rezultativ (y) i una sau mai multe variabile (caracteristici
cauzale) independente (x). Caracteristica rezultativ se mai numete caracteristic
dependent, endogen sau efect, iar caracteristica independent se mai numete
caracteristic factorial, exogen sau cauz.
Metoda regresiei este cea prin care se poate explica forma legturii (liniar,
curbilinie ...) i se poate previziona nivelul unui factor n funcie de valorile altor
factori.
Corelaia arat ct de puternic este legtura dintre variabile.
Variabilele statistice se pot afla unele fa de altele n una din urmtoarele
situaii:
legtura univoc, adic variabila independent x determin evoluia
variabilei dependente y fr a exista ns i o influen a variabilei y asupra variabilei
x;
legtura biunivoc, caz n care ntre cele dou variabile exist o
intercondiionare reciproc;
evoluie paralel, adic cele dou variabile au o evoluie similar,
determinat nu de dependena dintre ele, ci de o ter variabil, cu influen simultan
asupra celor dou variabile;
simpla coinciden, adic ntre cele dou variabile exist numai o potrivire
numeric, neexistnd vreo dependen real.
Legturile dintre fenomene se pot clasifica dup mai multe criterii:
1) dup numrul caracteristicilor independente luate n studiu se disting:
legturi simple, cnd se studiaz dependena dintre o variabil cauzal x i o
variabil y, unde y = f(x).
legturi multiple cnd se studiaz dependena dintre o caracteristic dependent y i dou sau mai multe caracteristici independente, unde y = f(x 1, x2 ... xn)
2) dup direcia legturii, acestea pot fi: directe sau inverse.
legturile directe exist n cazul n care caracteristica dependent se modific
n acelai sens cu caracteristica independent: crete x, crete i y sau dac scade x,
scade i y.
legturile inverse exist n cazul n care cele dou caracteristici se modific
n sens invers: una crete i cealalt scade sau invers.
3) dup timpul n care se realizeaz, legturile statistice pot fi: concomitente
(sincrone) sau cu decalaj (asincrone).
legturile sincrone sunt cele care-i manifest efectele n aceeai perioad de
timp.
legturi asincrone (cu decalaj) sunt cele n care efectele aciunii unor factori
se percep dup trecerea unei perioade de timp.
4) dup forma funciei (expresia analitic a legturii) se disting:

38

legturi liniare adic acele dependene care pot fi exprimate cu ajutorul


funciei liniare;
legturi neliniare (curbilinii) care se exprim cu ajutorul funciilor neliniare
(parabol, hiperbol, funcia exponenial etc.).
Aplicarea metodelor de analiz a corelaiilor statistice presupune
parcurgerea unor etape i clasificarea urmtoarelor probleme:
identificarea i ierarhizarea factorilor care determin n mod obiectiv
variaia caracteristicii rezultative;
sistematizarea datelor observate, astfel nct s nu se modifice gradul
i forma de variaie a caracteristicilor la care se aplic metoda corelaiei;
verificarea existenei i formei legturii dintre caracteristici, n vederea
alegerii corecte a procedeelor statistice-matematice de msurare a dependenei
statistice;
calcularea indicatorilor de corelaie n funcie de forma de legtur i
de natura informaiei de care se dispune;
aplicarea testelor de semnificaie.
5.1. Modelul regresiei si corelatiei liniare simple
Metoda regresiei analizeaz cu ajutorul unor expresii analitice denumite funcii
de regresie, modul n care variabila dependent y evolueaz n raport cu modificarea
uneia sau a mai multor variabile independente x.
Forma generic a funciei de regresiei este:

Yx f X1 , X 2 , , X k e

n care e este variabila aleatoare perturbatoare sau eroarea, care reprezint efectul
tuturor factorilor nespecificai, care sunt greu de cuantificat sau sunt nesemnificativi.
Principalele tipuri de modele de regresie sunt:
regresia unifactorial sau simpl (cu o singur variabil factorial);
regresia i corelaia curbilinie simpl (parabola de gradul II, hiperbola,
funcie exponenial);
regresia i corelaia multipl care poate fi exprimat printr-o funcie liniar
sau o funcie curbilinie.
Regresia liniar simpl este un model de regresie n care variabila dependent
(y) se modific liniar sub influena semnificativ a unei singure variabile
independente (x).
Reprezentarea grafic a perechilor de valori obinute n timpul observrii indic
prin forma norului de puncte o tendin liniar, iar modelul de analiz i predicie
folosit va fi cel al regresiei unifactoriale liniare:

Yx i = a + bxi + ei
unde a i b sunt parametrii necunoscui ai funciei ce urmeaz a fi estimai.
Parametrul a reprezint ordonat la origine i exprim valoarea lui y cnd x
= 0. Acest parametru nu are semnificaie economic.
Parametrul b reprezint panta dreptei de regresie i poart denumirea de
coeficient de regresie.

Acesta arat cu cte uniti se modific variabila rezultativ (y) la


modificarea cu o unitate a variabilei factoriale (x).

39

Semnul coeficientului de regresie arat direcia legturii dintre cele dou


variabile. Astfel:
dac b > 0 legtura dintre variabile este direct;
dac b < 0 legtura dintre variabile este invers;
dac b = 0 nu exist legtur ntre variabile.
. Regresia liniara simpla si validarea modelului de regresie
Estimarea parametrilor a i b ai ecuaiei liniare de regresie se realizeaz
prin metoda celor mai mici ptrate. Aceast metod se bazeaz pe criteriul
minimizrii sumei ptratelor erorilor, adic minimizarea sumei ptratelor abaterilor
valorilor observate (y i) de la valorile teoretice (Y x):
n

S yi Yx min
i 1

Sistemul de ecuaii normale devine:

na b x i yi
i 1

i 1

i 1

a x i b x i2 x i yi
i 1

i 1

Prin rezolvarea sistemului de ecuaii se obin parametrii a i b, astfel:

y
x x x y
a
n x x
i

2
i

2
i

a y bx

n x i yi x i yi
n x i2 x i

Dup estimarea parametrilor a i b se scrie funcia de regresie pe baza creia se


determin valorile teoretice Yx i prin nlocuirea succesiv a valorilor xi.
Calitatea funciei de regresie se poate aprecia prin urmtorii indicatori:
1) Eroarea standard ( Sy i Yx ) care se calculeaz ca o abatere ptratic a valorii
reale (yi) fa de cele teoretice (Yx).

Sy i

Yx

Yx i

2) Coeficientul de eroare (e) este cel care cuantific intensitatea


variaiei n jurul funciei de regresie exprimat procentual.
e

Sy i

Yx
100
y
Cu ct valoarea celor doi indicatori este mai sczut, cu att funcia aleas este
mai reprezentativ pentru a reda tipul de legtur dintre variabilele cercetate.

40

3) Coeficientul de determinaie (D) arat proporia n care variabila


independent (X) explic variaia caracteristicii dependente (Y), aceasta fiind o alt
modalitate de apreciere calitativ a funciei de regresie.

yi Yx i
D 1
2

yi y

100

Variaia total a lui y fa de media sa y are dou componente:


y y y Yx Yx y

Variaia
total

Variaia
neexplicat
de
regresie

Variaia
explicat
de
regresie

Aceste abateri permit calcularea urmtoarelor dispersii:


dispersia total a lui y:

2
y

y y

, exprim influena tuturor factorilor asupra variabilei y;

dispersia explicat de regresie:

2y x

, exprim influena factorului asupra variaiei lui y;

dispersia neexplicat de regresie (rezidual):

2
y r

y Y

, exprim influena celorlali factori, factori reziduali,

asupra variaiei lui y.


Validarea modelului de regresie se realizeaz aplicnd testul Fisher-Snedecor
(testul F) i presupune verificarea modului n care valorile teoretice Y x reconstituie
valorile empirice (nregistrate).
Testul F se calculeaz pe baza relaiei:

Fcalc

xi

K 1

: y Y
2

xi

nK

unde K = numrul parametrilor modelului;


n = numrul de perechi de valori.
Valoarea calculat a testului (Fcalc) se compar cu valoarea teoretic care se
obine din tabelele statistice F1 , K 1, n K , pentru un rag de semnificaie i K 1,
n K grade de libertate. Pentru validarea modelului de regresie este necesar ca:
Fcalc > F , K 1, n K
Ajustarea seriei statistice presupune nlocuirea termenilor empirici (termeni
reali obinui prin observare) cu termeni teoretici, calculai pe baza unui model
matematic, care arat tendina de variaie a caracteristicii rezultative y, dac ar fi
depins numai de variaia factorului x.
Pentru verificarea calcului parametrilor funciei de regresie se folosete relaia:
y i Yx i , ceea ce arat c prin ajustare nu se face altceva dect o redistribuire a

41

influenei factorilor, astfel nct factorul nregistrat s influeneze sistematic n toate


cazurile supuse observrii statistice.
Funcia de regresie este numai o ipotez statistic care exprim tendina medie
de manifestare a legturii dintre cele dou caracteristici i reprezint doar un prim pas
pentru msurarea corelaiei dintre fenomene.
Analiza corelaiei reprezint un instrument de caracterizare a intensitii
legturii dintre variabile i este strns legat de analiza regresiei.
Corelaia poate fi pozitiv sau negativ, n funcie de natura legturii dintre cele
dou variabile (legtura direct sau invers).
Covariaia ncearc s surprind existena i direcia legturii dintre o variabil
dependent (y) i o variabil independent (x) lund n calcul abaterea fiecrui termen
de la media seriei care se cerceteaz.

x
n

Cov X, Y

i 1

x yi y

unde n = numrul de perechi de date nregistrate.

Semnul covarianei arat direcia legturii dintre variabile, adic


valoarea pozitiv denot o legtur direct, iar cea negativ o legtur invers.
Valoarea zero a covarianei indic o lips de legtur.
Coeficientul de corelaie liniar (ry/x) este un indicator sintetic care
msoar intensitatea legturii dintre dou variabile xi i yi i ia valori ntre 1
i +1.
Cea mai utilizat formul de calcul este:
n x i yi x i yi
ry x
2
2 , unde 1 ry/x +1.
n x i2 x i n yi2 yi

Valoarea pozitiv a coeficientului de corelaie (r > 0) indic o corelaie pozitiv,


direct ntre variabile X i Y. Cu ct valoarea coeficientului este mai apropiat de 1,
cu att legtura dintre cele dou variabile este mai puternic.

Valoarea negativ a coeficientului de corelaie (r < 0) indic o


legtur invers i cu ct valoarea este mai apropiat de 1, corelaia este mai
puternic, dar n sens invers. Valoarea nul (r = 0) sau apropiat de zero a
coeficientului de corelaie arat o legtur slab sau lipsit de legtur.
n practic sunt folosite urmtoarele aprecieri ale intensitii legturii dintre
variabilele X i Y pentru diferite intervale de valori ale coeficientului de corelaie.
ry/x (0; 0,2) legtura lipsete sau este nesemnificativ;
ry/x (0,2; 0,5) legtura slab;
ry/x (0,5; 0,75) legtur de intensitate medie;
ry/x (0,75; 0,95) legtura este puternic;
ry/x (0,95; 1) legtur puternic, aproape determinist.
Dac ry/x 1 corelaia este puternic, iar valorile y i se grupeaz n jurul
dreptei de regresie.
Dac legtura este liniar ry/x = Ry/x (raportul de corelaie).
Dac ry/x Ry/x atunci legtura este neliniar i se va calcula numai R y/x.

42

Raportul de corelaie (Ry/x) se utilizeaz pentru a caracteriza intensitatea


legturii dintre variabile indiferent de forma legturii sau numrul de variabile
cuprinse n cercetare.

y Y 1 dispersia rezidual
1
dispersia total
y y
Y y 1 dispersia explicat
dispersia total
y y
2

xi

xi

Raportul de corelaie ia valori ntre 0 i 1. Cu ct valoarea se apropie mai mult


de 1, cu att legtura dintre cele dou variabile analizate este mai puternic.

n cazul corelaiei liniare, raportul de corelaie este egal cu


coeficientul de corelaie liniar, considerat n modul (raportul de corelaie).
Semnul raportului de corelaie se determin dup semnul parametrului b din
ecuaia de regresie.
Testarea semnificaiei coeficientului de corelaie(testul t)

Se impune testarea coeficientului de corelaie deoarece este foarte probabil ca


orice pereche de variabile luat n analiz (chiar i ntre cele ntre care nu exist o
legtur logic) s prezinte un coeficient de corelaie nenul. Pentru a vedea dac
valoarea coeficientului de corelaie este semnificativ, se calculeaz:
ry x
t
n2
2
1 ry x

unde n = numrul de perechi de valori observate.


Valoarea calculat se compar cu valoarea din tabele t , n-2 pentru un prag de
semnificaie (de regul = 0,05) i n 2 grade de libertate (dreapta are doi
parametri).
Dac tcalculat > tteoretic coeficientul de corelaie este semnificativ i legtura
dintre X i Y nu este ntmpltoare.
5.2 Aplicaie (rezolvata)
(Regresia si corelatia simpla)
S se determine pe baza informaiilor din tabelul nr. 6.3:
1)
modelul de regresie (corelograma);
2)
ecuaia de regresie i parametrii acesteia (a i b);
3)
testarea i validarea ecuaiei de regresie;
4)
indicatorii de corelaie (covariana, coeficientul de regresie,
coeficientul de corelaie, raportul de corelaie);
5)
testarea semnificaiei coeficientului de corelaie.
Tabelul nr. 5.1
Veniturile totale i ctigurile salariale medii lunare din Romnia, pe regiuni de dezvoltare
n anul 2002
Regiune de
Ctigul salarial nomimal net lunar
Veniturile totale
dezvoltare
milioane lei/salariat
milioane lei lunar/persoan
(xi)
(yi)

43

Nord-Est
3,41
Sud-Est
3,73
Sud
3,70
Sud-Vest
4,01
Vest
3,68
Nord-Vest
3,39
Centru
3,44
Bucureti
4,76
Total ar
3,79
Sursa: Anuarul statistic al Romniei 2003.

2,0
2,2
2,07
2,17
2,38
2,38
2,41
3,01
2,29

44

Venit total
mil. lei/pers/lun

3,1
3
2,9
2,8
2,7
2,6
2,5
2,4
2,3
2,2

(4,76; 3,01)

(3,68; 2,38)
(4,01; 2,17)

2,1
2
3

3,1

3,2

3,3

3,4

3,5

3,6 3,7

3,8

3,9

5
Ctig salarial
mil. lei/salariul

Graficul nr. 5.1. Corelograma. Distribuia pe regiuni de dezvoltare a veniturilor


totale n funcie de ctigul salarial mediu net n anul 2002.

45

46

Din reprezentarea grafic (corelograma) graficul nr. 5.1. a rezultat o


distribuie oarecum liniar a perechilor de valori ale variabilelor Xi i Yi, prin
urmare ecuaia de regresie va urma modelul liniar:
y = a + bx
Se calculeaz algoritmul necesar pentru determinarea ecuaiei de
regresie de tip liniar i a indicatorilor de corelaie liniar (tabelul nr. 5.2.).
Parametrii ecuaiei de regresie a i b

y
x x x y
a
n x x
2
i

n x i2 x i

18,62 114,83 70,84 30,12


0,39
8 114,83 30,122

8 70,84 30,12 18,62


0,515
8 114,83 30,12 2

n x i yi x i yi

2
i

Dup aflarea valorilor parametrilor a i b se trece la ajustarea seriei, astfel:


y1 = 0,39 + 0,515 3,41 = 2,15 (pentru x1 = 3,41)
-------------------------------------y8 = 0,39 + 0,515 4,76 = 2,84 (pentru x8 = 4,76)
Se constat c

y Y
i

xi

18,62 ceea ce confirm legtura de tip liniar.

Validarea ecuaiei de regresie


Eroarea standard:

Sy i

Yx

Yx i

0,3253
0,2016
8

Coeficientul de eroare (e):


e

0,2016
100 8,65% (cam mare gradul de eroare)
2,33

Coeficientul de determinaie (D):

yi Yx i
D 1
2

yi y

100 1 0,3253 100 53,6%

0,701

Coeficientul de determinaie arat c ecuaia de regresie surprinde numai 53,6%


din influene care se datoreaz factorului x, restul de 46,4% revenind altor factori.
Testul F

Fcalc

xi

K 1

: y Y
2

xi

nK

K = 2 (dou variabile)
n = 8 (perechi de valori)
0,701 0,3253
Fcalc
:
0,701 : 0,0542 12,93 .
2 1 8 2

47

Din anexa cu valorile raportului dispersiilor F corespunztoare nivelului de


semnificaie 5% (P = 95) se gsete valoarea teoretic pentru F x; K-1; n K, adic F0,05; 1; 6
= 5,99.
Prin urmare Fcalc > Ftabelar (12,93 > 5,99) pentru = 5%; K 1 = 1 i n K = 6
grade de libertate
Pentru o probabilitate de 95% se poate valida ecuaia de regresie calculat.
Coeficientul de regresie (by/x)
x x yi y
0,7275
by x i

0,51
2
1
,
435
x

x
i

Valoarea pozitiv a coeficientului de regresie arat legtura direct ntre ctigul


salarial nominal net i veniturile totale.

Creterea cu o unitate monetar a ctigului salarial net (x) conduce


la creterea veniturilor totale cu 0,51 uniti monetare (y).
Covariana Cov (x,y)

x
n

Cov X, Y

i 1

x yi y

.
0,7275
0,09
8

Valoare pozitiv confirma legtura direct dintre cele dou variabile x i y.


Coeficientul de corelaie (ry/x)

ry x

x x y y
x x y y
i

0,7275
0,73
1,435 0,701

Coeficientul de corelaie se mai poate calcula astfel:

ry x

n x i yi x i yi

2
2
x i n y i2 y i
8 70,84 30,12 18,64
073
8 114,83 30,12 2 8 44,02 18,62 2

n x

2
i

Valoare pozitiv a coeficientului de corelaie, confirm legtura direct ntre


cele dou variabile (ctigul salarial net i veniturile totale), iar valoarea mai
apropiat de +1, arat o legtur de intensitate medie.
Raportul de corelaie (Ry/x)
Ry x

y Y
1
y y
x

0,3253
0,73 .
0,701

Valoarea raportului de corelaie egal cu valoarea coeficientului de corelaie


confirm legtura direct dintre cele dou variabile.
Verificarea semnificaiei coeficientului de corelaie se calculeaz n funcie de
repartiia Student:
ry x
0,73
0,73
1,79
t calc
n2
82
2,45
3,83
2
2
0
,
467
0
,467
1 0,73
1 r
y x

48

ry/x = 0,73; n = 8 (perechi de valori empirice)

ttabelar = t0,05; 8-2 = t0,05;6 = 2,447.


Coeficientul de corelaie (ry/x) este semnificativ dac:
tcalculat > ttabelar

3,83 > 2,447 pentru un nivel de semnificaie de 0,05 i 6 grade de


libertate.
Se poate spune c este semnificativ coeficientul de corelaie calculat
i exist o legtur real de intensitate medie ntre ctigul salarial nominal net
lunar i veniturile totale ale salariailor din Romnia.
5.3. Modelul regresiei si corelatiei liniare multiple

Regresia multipl poate fi exprimat printr-o funcie liniar sau o


funcie curbilinie.
n cazul regresiei liniare multiple, ecuaia este de forma:

y x 1 x n a 0 a 1x 1 a n x n

i presupune existena unei variabile dependente (Y) exprimat n funcie de dou sau
mai multe variabile independente (x1, x2, , xn).
Coeficienii de regresie a0, a1, , an se obin cu ajutorul metodei celor mai mici
ptrate.

Parametrii ecuaiei au urmtoarea semnificaie:


a0 = are caracter de medie i exprim influena factorilor nenregistrai,
considerai cu aciune constant;
a1, a2, ., an = numii i coeficieni pariali de regresie, arat cu ct se modific
variabila Y, cnd variabilele factoriale x1, x2, , xn se modific cu o unitate.

Intensitatea de legtur se calculeaz cu ajutorul coeficientului i a


raportului de corelaie.
Coeficientul de corelaie ( R y

x1 , x 2

) se determin cu ajutorul coeficienilor de

corelaie simpl dintre variabilele perechi ry

x1

; ry x 2 ; rx 1

x2

5.4. Aplicaie (rezolvata).


(Regresia si corelatie liniara multipla)
Pe baza informaiilor de care se dispune (tabelul nr. 5.3.) s se determine:
a) existena i forma legturii prin metoda grafic;
b) algoritmul de calcul pentru determinarea indicatorilor de corelaie i
a ecuaiei de regresie;
c) indicatorii de corelaie: coeficientul de corelaie i raportul de
corelaie.

Tabelul 5.3.
Nr.
crt.

Economia subterana
constatata (x1)

Numr de firme (x2)

Profitul (y)
(miliarde uniti

49

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.

(miliarde uniti monetare)


2,2
1,5
1,7
2,5
3,1
2,7
3,3
1,1
1,8
2,5

monetare)
15
10
10
15
20
18
25
8
12
14

15
14
12
14
18
17
20
10
12
15

a) Determinarea existenei i formei legturii (graficul nr. 5.2 i graficul nr. 5.3.):
Profit
(mild. u.m.)
30

(20;25)

20
(15;15)
10

(12; 10)
5

10

15

20

Numr firme

Graficul nr. 5.2. Legtura dintre numrul de firme si profitul obtinut

Profit
(mild. u.m.)
30
(3,3;25)
20
(2,2;15)
10

(1,5; 10)
1

3
Capital fix (miliarde u.m.)

Graficul nr. 5.3. Legtura dintre economia subterana si profit

Prezentrile grafice arat c legturile simple sunt sub form liniar, deci
funcia de regresie multipl este:
y a 0 a 1x1 a 2 x 2
Sistemul de ecuaii normale pentru estimarea parametrilor acestei funcii
presupune rezolvarea urmtorului sistem:

50

na 0 a1 x1 a 2 x 2 y

2
a 0 x 1 a 1 x1 a 2 x 1 x 2 x 1 y
2
a
0 x 2 a 1 x 1x 2 a 2 x 2 x 2 y
Pentru determinarea parametrilor a0, a1, a2 ai funciei se calculeaz algoritmul
din tabelul nr. 5.4.
Tabelul nr. 5.4.

Algoritm de calcul pentru determinarea indicatorilor de corelaie


Nr
crt

Profit
(mild
u.m.)
yi

Num
r firme
x2

15

Economia
subterana
(miliarde
u.m.)
x1
2,2

15

2
3
4
5
6
7
8
9
10
Total

10
10
15
20
18
25
8
12
14
147

1,5
1,7
2,5
3,1
2,7
3,3
1,1
1,8
2,5
22,4

14
12
14
18
17
20
10
12
15
147

x1y

x2y

x1x2

2
x1

2
x2

225

33,0

225

33,0

4,84

225

100
100
225
400
324
625
64
144
196
2403

15,0
17,0
37,5
62,0
48,6
82,5
8,8
21,6
35,0
361,0

140
120
210
360
306
500
80
144
210
2295

21,0
20,4
35,0
55,8
45,9
66,0
11,0
21,6
37,5
347,2

2,25
2,89
6,25
9,61
7,29
10,89
1,21
3,24
6,25
54,72

196
144
196
324
289
400
100
144
225
2243

2
yi

y x1x 2 5,559
3,873x 1i 0,788x i2
y12 5,559
3,873 2,2 0,788 15
=14,78

y 2=11,28
10,48
15,16
20,53
18,29
22,98
6,58
10,48
15,99
147,0

Sistemul anterior devine:

10a 0 22,4a1 147a 2 147

22,4a 0 54,72a1 347,2a 2 361


147a 347,2a 2 243a 2 295
0
1
2

a0

22,4a1 147a 2 147


10

22,4a1 147a 2 147


54,72a1 347,2a 2 361
22,4
10

22,4a1 147a 2 147


147
347,2a1 2 243a 2 2 295
10

501,76a1 3 292,8a 2 3 292,8 547,2a1 3 472a 2 3 610

3 292,8a1 21 609a 2 21 609 3 472a1 22 430a 2 22 950

51

45,44a1 179,2a 2 317,2

179,2a1 821a 2 1 341


179,2a 2 317,2
45,44
179,2a 2 317,2
179,2
821a 2 1 341
45,44
32 112,64 a2 + 56 842,24 + 37 306,24 a2= 60 935,04
5 193 a2 = 4 092,8
a1

a2

4 092,8
0,788
5 193,6

a1

179,2a 2 317,2 179,2 0,788 317,2

45,44
45,44

a1

175,99
3,873
45,44

a0

22,4a 2 147a 2 147 22,4 3,873 147 0,788 147

10
10

86,7552 115,836 147 202,5912 147 55,5912

5,559
10
10
10
Parametrii ecuaiei de regresie au urmtoarele valori:
a0 = -5,559; a1 = 3,873; a2 = 0,788.

Valorile teoretice ale ecuaiei se obin prin nlocuirea valorilor factorilor x 1 i x2


n funcia de regresie, astfel:
y = a0 + a1x1 + a2x2
y1 = -5,559 + 3,873 x1 + 0,788 x2
y1 = -5,559 + 3,873 2,2 + 0,788 15 = 14,78
y2 = -5,559 + 3,873 1,5 + 0,788 14 = 11,28

y10 = -5,559 + 3,873 2,5 + 0,788 15 = 15,94


Indicatorii de corelaie

Intensitatea corelaiei dintre capitalul fix (x 1) i profitul (y) se determin cu


ajutorul coeficientului de corelaie:

ry x 1
ry

x1

n x

n x1 y x1 y

2
1

x1 n y 2 y
2

10 361 22,4 147

10 54,72 22,4 10 2 403 147 =


2

3610 3 292,8
317,2
317,2

0,956
547,2 501,76 24 030 21 609
110 010,24 331,68
Valoarea pozitiv i apropiat de 1 a coeficientului de corelaie arat o legtur
direct i de mare intensitate ntre volumul economiei subterane i volumul profitului
obinut.

52

Intensitatea corelaiei dintre numrul de firme i profit este:

ry x 2

n x

2
2

x 2 n y2 y
2

10 2 295 147 147

ry x 1

n x2y x2 y

10 2 243 147 10 2 403 147 =


2

22 950 21 609

22 430 21 609 24 030 21 609

1 341
1 341

0,951
821 2 421 1 409,83

Valoarea pozitiv i apropiat de 1 a coeficientului de corelaie arat


o legtur direct i de mare intensitate ntre numrul de firme i profitul
obinut.
Intensitatea corelaiei dintre economia subterana (x 1) i numrul de firme (x2)
se determin astfel:

rx1

x2

rx 1

x2

n x 1 x 2 x1 x 2

n x

2
1

x1 n x 22 x 2
2

10 347,2 22,4 147

10 54,72 22,4 10 2 243 147 =


2

3 472 3 292,8
179,2

0,927
547,2 501,76 22 430 21 609 193,148

Coeficientul de corelaie calculat arat c ntre economia subterana i numrul


de firme se nregistreaz o legtur direct de intensitate medie.

Coeficientul de corelaie liniar multipl

ry x1 , x 2
ry

x1 , x 2

2
y x1

ry2 x1 2ry x1 ry x 2 rx1

x2

1 r

2
x1 x 2

0,956 2 0,9512 2 0,956 0,951 0,927


1 0,927

0,914 0,904 1,686

1 0,859

0,132
0,93617 0,967 .
0,141

Tabelul nr. 5.5.

53

Tabel cu valori ajuttoare


Nr.
crt.

Valorile
ajustate ale
ecuaiei (yi)

yi y x1 x 2

yi

yi y

Yx1 x 2

y
2

y x1x 2
1
2
3
4
5
6
7
8
9
10

14,78
11,28
10,48
15,16
20,63
18,29
22,98
6,58
10,87
15,94
147,00

15
10
10
15
20
18
25
8
12
14
147,00

0,22
-1,28
-0,48
-0,16
-0,63
-0,29
2,52
1,42
1,13
-1,94
-

0,3
-4,7
-4,7
0,3
5,3
3,3
10,3
-6,7
-2,7
-0,7
-

0,0484
1,6384
0,2304
0,0256
0,3969
0,0841
6,2558
2,0164
1,2769
3,7636
15,7365

0,09
22,09
22,09
0,09
28,09
10,89
106,09
44,89
7,29
0,49
242,1

147
14,7 mild uniti monetare
n
10
yi Yx1x 2 =147.
Y

Raportul de corelaie multipl R y

R y x1 , x 2

y Y
1
y Y
i

x1x 2
2

x1 , x 2

15,7365
0,967 .
242,1

Valorile necesare calculrii raportului de corelaie au fost determinate cu


ajutorul tabelului cu valori ajuttoare (tabelul nr. 6.10.).
Deoarece coeficientul de corelaie multipl ry x 1 , x 2 i ale raportului de
corelaie R y x 1 , x 2 multipl au aceeai valoare (0,967) dovedete c tipul de legtur
dintre cei trei factori este de tip liniar, iar valoarea apropiat de +1 arat o legtur
direct i foarte puternic.
5.3.INTREBARI DE AUTOEVALUARE
1)Ce este metoda regresiei?
2)Ce este corelatia?
3)Ce sunt legaturile multiple?
4)Ce inseamna legatura directa? Dar inversa?
5)Ce etape presupune aplicarea metodelor de analiza a corelatiei?
6)ce este regresia liniara simpla?
7)Ce arata coeficientul b, numit si coeficient de regresie?
8)Ce arata coeficientul de determinatie?
9)Prin ce procedeu se valideaza modelul de regresie?
10)Ce presupune ajustarea seriei statistice?
11)Care este intervalul de valori?
12)Prin ce procedeu se testeaza semnificatia coeficientului de corelatie?

5.4.CUVINTE CHEIE

54

caracteristica rezultativa; metoda regresiei; corelatie simpla; corelatie multipla;


coeficientul de regresie; eroarea standard; coeficientul de eroare reziduala; testul
Fisher- Snedecor; validarea modelului de regresie; ajustarea seriei; covarianta;
testul t;testul F; corelograma.
Cap. 6. Metode econometrice de trend si prognoza cu ajutorul seriilor de
timp
6.1. Indicatorii absoluti si relativi ai seriilor de timp (cronologice)
Alegerea bazei de comparare (y1) este o problem deosebit de important
pentru calculul indicatorilor unei serii de timp, deoarece acest nivel de referin
(baz de raportare) trebuie s fie tipic procesului studiat, neafectat de perturbaii
majore sau de conjunctur anormal pentru fenomenul respectiv. Este indicat ca
alegerea nivelului de referin s se refere la o unitate de timp care poate fi:
nceput sau sfrit de etap;
unitatea de timp anterioar perioadei pentru care se calculeaz indicatorul;
o perioad asemntoare din punct de vedere al condiiilor de desfurare,
dar dintr-un interval de timp anterior.
Indicatorii seriilor cronologice care se obin prin raportare se determin folosind:
baza fix, adic un nivel de referin neschimbat pentru ntreaga perioad
analizat;
baza n lan, ceea ce presupune c nivelul de referin s fie mobil, adic baza
de comparare n cazul unui astfel de indicator s fie nivelul din perioada imediat
anterioar.
Exprimarea indicatorilor se face n:
mrimi absolute, adic n uniti fizice (lei, tone, buci etc.) sau valorice;
mrimi relative (procente, coeficieni).
Sistemul de indicatori utilizai n prelucrarea datelor unei serii cronologice
cuprinde:
indicatori absolui:
- indicatori de nivel;
- modificrile (sporuri sau scderi) absolute ().
indicatori relativi:
- indicatori ai evoluiei n timp (I);
- ritmuri de modificare de cretere sau scdere (R);
- valoarea absolut a unui procent de modificare (A).
indicatori medii:
- nivelul mediu al seriei Y ;
- modificarea absolut medie ;
- indicele mediu de cretere sau scdere I ;
- ritmul mediu R numit i rat medie de cretere sau scdere.
Fiecare termen al seriei reprezint un indicator de nivel, care arat volumul,
mrimea absolut a caracteristicii n perioada de baz (de referin).
Indicatorii absolui
Modificarea absolut exprim creterea sau scderea nivelului caracteristicii,
i poate fi calculat n dou feluri:
modificarea absolut cu baz fix se obine fcnd diferena dintre nivelul
fiecrei perioade i nivelul din perioada de referin: t 1 y t y1
modificarea absolut cu baz mobil (glisant) se obine fcnd diferena
dintre nivelul specific fiecrei perioade i nivelul perioadei imediat urmtoare:
t

t 1

y t y t 1

55

ntre modificarea absolut cu baz fix i cu baz n lan exist urmtoarele


relaii:
suma modificrilor absolute cu baza n lan este egal cu modificarea
absolut a indicatorului din ultimul an fa de cel din primul an
y t t 1 y1 0 y 2 1 y t t 1 y t 0
Indicatori relativi
Indicatorii relativi arat de cte ori a crescut nivelul caracteristicii cercetate
de-a lungul timpului.
n cursul unei scderi, indicele arat ct reprezint noul nivel fa de nivelul
din perioada de baz.
Indicii pot fi:
Indicele cu baz fix, care se obine raportnd termenii seriei la un termen
ales ca baz fix de comparaie

I ty 0

yt
100
y0

Indicele cu baz mobil presupune raportarea fiecrui termen al seriei la


termenul precedent I t

t 1

yt
100
y t 1

Indicii de dinamic care au nivelul supraunitar arat creteri ale fenomenului,


iar cei subunitari semnaleaz scderi ale fenomenului studiat.
ntre indicii cu baza fix i cei cu baza mobil exist anumite relaii:
prin nmulirea indicilor cu baz n lan pn la momentul t se obin indici cu
baz fix

I1y 0 I 2y 1 I ty t 1

y1 y 2
y
t I1y 0
y 0 y1
y t 1

prin raportarea succesiv a indicilor cu baz fix se obin indicii cu baz


mobil

I1y 0 : I ty t 1

y1 y t 1
y
:
t I1y 0
y0 y0
y t 1

Ritmul de cretere (descretere) exprim cu cte procente depete nivelul din


perioada curent nivelul atins n perioada de baz.
Ritmul de modificare se poate calcula:
cu baz fix: R t 1 I t 1 1 100

cu baz n lan: R t

t 1

I t t 1 1 100

Modificarea medie absolut( ) reflect creterea sau descreterea medie


nregistrat de un fenomen ntr-o perioad de timp

y n y1
,
n 1

unde: yn = nivelul absolut al ultimului an


y1 = nivelul absolut al primului an
n = numrul de termeni din ir
Aceast medie este semnificativ numai dac modificrile absolute cu baz n
lan sunt aproximativ egale ntre ele.
Indicele mediu al dinamicii ( I ) de cretere sau scdere arat de cte ori s-a
modificat n medie fenomenul analizat: I

n 1

yn
.
y1

56

Dac:
I < 100% indicele semnaleaz o scdere sau o reducere a fenomenului analizat;
I = 100% fenomenul analizat staioneaz;
I >100% indicele mediu evideniaz creterea fenomenului.
Avantajele folosirii indicelui mediu al dinamicii:
- este recomandat pentru fenomene cu evoluie uniform, aproximate prin
funcii exponeniale;
- se folosete pentru serii dinamice cu un numr redus de termeni.
Ritmul mediu de cretere sau scdere ( R ) evideniaz cu cte procente se
modific n medie fenomenul analizat pe toat perioada de calcul: R I 100 .
Cele trei metode mecanice de calcul: modificarea medie absolut, indicele
mediu al dinamicii i ritmul mediu al dinamicii prezint unele limite care se
datoreaz faptului c depind de calitatea termenilor extremi (primul i ultimul), fr
a avea n vedere i variaia din interiorul seriei.
ntre termenii unei serii cronologice de lungime suficient de mare, datorit aciunii
anumitor categorii de factori de influen, se manifest o anumit variaie ciclic sau o
anumit variaie sezonier i o variaie aleatoare (rezidual).
Printre problemele principale ale analizei seriei cronologice se afl i separarea
componentelor i evaluarea lor statistic.
Principalele componente ale seriei cronologice sunt:
trendul sau tendina general (T)
sezonalitatea (S)
ciclicitatea (C)
variaia rezidual (R)
Trendul sau tendina general, central este componenta principal a evoluiei i
totodat consecina aciunii cauzelor eseniale cu aciune de lung durat (progresul
tehnic, creterea populaiei), deci este o component sistemic.
Sezonalitatea este reprezentat de fluctuaiile (oscilaiile) n funcie de anotimpuri,
de factori climatici, de factori sociali care-i pun amprenta asupra desfurrii unui
fenomen sau proces pe o anumit perioad de timp. Aceste observaii se repet cu o
relativ regularitate de la o perioad la alta.
Ciclicitatea este determinat de factori de natur divers care acioneaz asupra
fenomenului analizat.
Sezonalitatea, ct i ciclicitatea nu sunt ntotdeauna prezente ntr-o serie
cronologic.
Variaia rezidual este reprezentat de acea parte din variaia unei serii de timp
care nu poate fi explicat prin trend, ciclicitate sau sezonalitate. Componenta aceasta
este generat de factori accidentali, neprevzui, reziduali i se manifest sub forma unor
abateri de la ceea ce este sistematic n evoluia fenomenului analizat.
Analiza seriilor cronologice este utilizat pentru a realiza prognoze. Pentru
aceasta este nevoie nu numai de extrapolarea trendului ci i de evaluarea nivelului
celorlalte componente din serie.

57

6.2. Ajustarea seriilor de timp


Ajustarea seriilor cronologice presupune determinarea trendului, adic a tendinei
generale n evoluia unui fenomen prin eliminarea oscilaiilor sezoniere, ciclice,
accidentale.
Metodele de ajustare sunt diverse, de la unele metode simple pn la metode
analitice care presupun mai mult rigoare i precizie. Cele mai cunoscute metode sunt:
metoda grafic;
metoda mecanic;
metoda mediilor mobile;
metoda analitic.
Ajustarea grafic se realizeaz prin trasarea liber a unei drepte sau curbe asupra
graficului unei serii cronologice empirice. Aceast metod de ajustare ofer informaii
utile pentru alegerea unui algoritm de calcul pentru estimarea tendinei de evoluie a
fenomenului sau procesului supus cercetrii.
Pentru exemplificare se vor folosi datele din tabelul nr. 6.1.
Tabelul nr.6.1.
Evoluia profitului net la societate comercial
n perioada 1995-2004
Anii
Profitul
net

199
5
200

199
6
260

199
7
286

199
8

199
9
188

230

200
0
280

200
1
310

200
2
256

200
3
220

200
4
317

Profitul net
mil u.m.
350
310

317

300
286
250
220
200
180
150
100

2004

2003

2002

2001

2000

1999

1998

1997

1996

1995

50
Anii

Graficul nr. 6.1. Ajustarea grafic


Evoluia numrului de turiti n perioada 1995-2004

Din graficul nr.6.1. se poate vedea o evoluie ascendent a profitului net, care
s-ar putea nscrie ntr-un model liniar sau exponenial.
Ajustarea mecanic se calculeaz prin dou metode:
metoda sporului mediu
metoda indicelui mediu I

58

Ajustarea mecanic se recomand a fi aplicat la serii cronologice relativ scurte


(5-10 termeni anuali) deoarece mediul de afaceri este n general foarte dinamic.
Ajustarea prin metoda sporului mediu se folosete atunci cnd se obin sporuri
cu baz n lan relativ apropiate ca valoare. Ajustarea se bazeaz pe relaia care
exist ntre primul termen, modificrile absolute cu baz n lan i ultimul termen:
y n y1 n 1 , unde n = numrul de termeni
Relund exemplul din tabelul nr.6.1. se constat o cretere medie anual a
profitului cu 13 mil u.m..

y n y1 317 200 117

13 mil u.m.
n 1
10 1
9

Valorile ajustate ale ntregii serii sunt prezentate n aplicaia din tabelul
nr. 6.4. n care valorile (n-1) au fost nlocuite cu valorile timpului (t i) avnd ca an de
referin anul 1995 cruia i revine un ti = 0.
Pentru anul 2010, ti = 15 (adic se continu numrarea).
Seria ajustat va fi:

Yt y1 t i

1995

200 013 200

Y1996
200 113 213

-------------------------------

Y2004
200 13 9 317

Y2010
200 1513 395 (prognoz)

Ajustarea prin metoda indicelui mediu se folosete atunci cnd termenii seriei
au tendina unei progresii geometrice, n care creterea sau scderea poate fi
exprimat prin indicele mediu. Se va folosi exemplul din tabelul nr. 6.1.
Relaia de calcul este:
n 1
t
sau y n y1 I
y n y1 I
i

y n 10 1 317

1,052 sau 105,2%


y1
200
Creterea anual este de 5,2%.
Seria ajustat este prezentat n tabelul nr. 6.3 i s-a calculat astfel:
t
YtI y1 I
I n 1

I
Y1995
200 1,052 0 200
I
Y1996
200 1,0521 211

------------------------------I
Y2004
200 1,052 9 317
I
Y2010
200 1,05215 428 persoane

Se poate observa c prin ambele metode la nivelul anului 2004 s-a obinut
acelai rezultat (317 mil u.m.) adic nivelul termenului prezentat de seria iniial
pentru anul 2004.
La nivelul anului 2010, prognoza oferit de cele dou metode este diferit. Se va
prezenta ntr-un alt subcapitol modul de alegere a celei mai bune metode de trend.
Metodele mecanice se folosesc pentru prognoze care s nu se duc prea
departe n timp. Se pot face predicii credibile pentru perioade care reprezint cel
mult jumtate plus unu fa de numrul termenilor seriei iniiale.

59

Ajustarea pe baza mediilor mobile (glisante sau alunectoare) se folosete, n


mod deosebit, cnd termenii seriei prezint variaii de la un an la altul (tip ,,dinte de
fierstru). A se vedea graficul nr.6.1.
Mediile mobile sunt medii pariale, calculate dintr-un numr prestabilit de
termeni, n care se nlocuiete pe rnd primul termen cu termenul care urmeaz.
n practic se calculeaz medii mobile dintr-un numr de 3-5 termeni.
Se va prezenta o aplicaie prin care se vor calcula medii mobile din 3 termeni
(tabelul nr. 6.2.)
Tabelul nr. 6.2.
Profitul
net
mil.u.m.
200
286

Medii mobile trienale

(200 + 260 + 286) : 3 =


249
(200 + 260 + 230) : 3 =
259
(200 + 260 + 188) : 3 =
235
(200 + 260 + 286) : 3 =
233
(200 + 260 + 286) : 3 =
259
(200 + 260 + 286) : 3 =
282
(200 + 260 + 286) : 3 =
262
= 264

230
260
188
280
310
256
220
317

Anul
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004

Se poate observa din datele tabelului nr. 6.2 i din graficul nr. 7.2. c mediile
obinute sunt mai atenuate, iar concluzia care se desprinde, este o uoar tendin de
cretere a profitului net.
Profitul net
mil u.m.
350
282
300

259

262
259

250

249
235

200

232

150
100

2004

2003

2002

2001

2000

1999

1998

1997

1996

1995

50
Anii

Graficul nr. 7.2. Ajustarea grafic pe baza mediilor mobile

60

Metoda mediilor mobile nu se bazeaz pe o expresie analitic care s poat fi


extrapolat. Pe baza acestei metode se poate face doar o percepere a trendului unui
fenomen.
Ajustarea analitic ine seama de toi termenii seriei cronologice, eliminnd
deficienele metodelor mecanice care au n vedere doar termenii extremi.
Metodele analitice au la baz un model matematic, n care tendina central a
evoluiei se exprim ca o funcie de timp.
Alegerea tipului n ecuatie, in functie de care se alege trendul se face pe baza
urmtoarelor criterii aplicabile opional:
criteriul reprezentrii grafice presupune, n primul rnd, construirea cronogramei:
- dac graficul prezint o tendin de cretere absolut constant se poate
aprecia c fenomenul crete liniar i ecuaia funciei va fi: Y = a + bt n care a i b
sunt parametrii funciei, iar t este timpul, care este variabil;
- dac graficul are o tendin de cretere relativ constant, atunci se poate
aprecia c fenomenul crete de forma unei funcii exponeniale: Y = ab t;
- cnd pe grafic se obine o curb care are fie un punct de maxim, fie un punct
de minim, atunci se apreciaz c fenomenul studiat se modific n timp sub forma
unei parabole de gradul doi: Y = a + bt + ct2.
criteriul diferenelor, care const n calculul diferenelor absolute (n modul)
cu baz n lan, astfel:
- dac diferenele absolute cu baza n lan de ordinul nti sunt constante, se
apreciaz c, seria cronologic respectiv, are o tendin liniar
t

t 1

y t y t 1

- dac diferenele absolute cu baz n lan de ordinul doi calculate din


diferenele de ordinul nti sunt aproximativ constante, se apreciaz c seria
cronologic are o tendin de forma parabolei de gradul doi
t

t 1

t t 1

- dac indicii cu baza n lan sunt constani, atunci seria cronologic prezint o
tendin exponenial.
Pentru estimarea parametrilor funciei alese se folosete metoda celor mai mici
ptrate. Aceast metod are ca funcie obiectiv minimizarea sumei ptratelor
abaterilor valorilor reale de la cele ajustate:
min y t Yt

unde t = 1, 2, , n

Deoarece timpul este o mrime care se msoar cu ajutorul scalei de interval


al crei specific este c punctul de origine (punctul 0) al scalei i unitatea de msur
a variabilei (t) se alege convenabil, n mod arbitrar la rezolvarea sistemului de
ecuaii normale se face o simplificare: ti = 0
- dac seria este format dintr-un numr impar de termeni, se alege ca origine
t = 0 termenul median, astfel:
ti

200
0
-2

200
1
-1

200
2
0

200
3
1

200
4
2

- dac seria este format dintr-un numr par de termeni, termenii centrali se
noteaz cu (-1; +1). O alt notaie posibil utilizat uneori se face prin atribuirea
termenilor centrali a valorilor (-0,5; +0,5), astfel:
valori atribuite variabilei
t
Varianta I
Varianta II

199
9
-5
-2,5

200
0
-3
-1,5

200
1
-1
-0,5

200
2
+1
+0,5

200
3
3
1,5

200
4
5
2,5

61

Trendul liniar
n scopul determinrii celor doi parametri ,,a i ,,b se scrie sistemul de
ecuaii normale astfel:

na b t y i

2
a t i b t i t i y i

Pentru ti = 0, sistemul de ecuaii normale devine:

na y i

b t t i y i
2
i

de unde

n
t i yi

2
i

Trendul exponenial
n cazul alegerii unui trend exponenial va fi necesar s se rezolve sistemul de
ecuaii:

t lg a t lg b lg y i

t lg a t

2
i

lg b t i lg y i

lg a

unde

lg b

lg y

n
t i lg yi

2
i

Exemplificarea celor dou metode de trend se va face ntr-o aplicaie ulterioar.


Criterii de alegere a procedeelor de ajustare
n teoria statistic se cunosc mai multe criterii de alegere a celui mai potrivit
procedeu de ajustare, astfel:
compararea sumei valorilor empirice (yi), cu suma valorilor ajustate (Yt),
sume care trebuie s fie ct mai apropiate. Suma abaterilor termenilor ajustai fa
de termenii reali trebuie s fie nul;
suma ptratelor abaterilor valorilor empirice (reale) yi de la cele teoretice
(Yt) s fie minim
2
min y t Yt ;
compararea coeficienilor de variaie (V) calculai pe baza abaterii medii
ptratice () fa de medie y .
Cea mai bun metod de trend este aceea n care coeficientul de variaie este
minim (V = min).
6.3. Aplicaie (rezolvata)
Ajustarea seriilor de timp cu ajutorul metodelor mecanice si econometrice
(trendul liniar si trendul exponential)
Pe baza informaiilor din tabelul nr, 6.1 s se calculeze:
1) Modificarea absolut cu baza fix i cu baza n lan ();
2) Indicele de dinamic cu baza fix i cu baza n lan (I):
3) Ritmul de cretere cu baza fix i cu baza n lan (R):
4) Valoarea absolut a unui procent din ritmul de cretere;
5) Sporul mediu de cretere (scdere) - ;
6) Indicele mediu de cretere - I ;
7) Ajustarea seriei pe baza:
- trendului sporului mediu Y ;
- trendului indicelui mediu

62

- trendului liniar Y lin ;


- trendului exponenial Y exp ;
8) Alegerea celei mai bune funcii de trend;
9) Prognoza profitului net la nivelul anului 2010 folosind cea mai bun metod
de trend.
Se va proceda la folosirea unui algoritm complex.
n tabelul nr. 6.3. sunt rezolvate punctele 1, 2, 3, 4.
n tabelul nr. 6.4. se gsesc rezolvrile la punctele 5, 6, 7 i o parte din 8.
n tabelul nr. 6.5. sunt rezolvrile pentru punctele 7 i o parte din 8.
n tabelul nr. 6.6. este rezolvat punctul 8.
Trendul liniar

2 547

a n 10 254,7

Ylin= a + b ti unde

t i yi

2
ti

358
45

7,95

1
Ylin 254,7 7,95 3 231

--------------------------------------10
Ylin 254,7 7,95 3 279

Trendul exponenial
Yexp a b
10

ti
n

, unde: lg a

lg y i
n

2, 4

24
10

2, 4

a 251, 2

251, 2

t i lg y i
0, 4
lg b

0,009
2
45
ti
10

0,009

1,02

b 1,02

1
3
Yexp 251, 2 1,02
237

-------------------------------10
3
Yexp 251, 2 1,02 267

63

64

65

66

Tabelul nr. 6.6.


Alegerea celei mai bune funcii de trend
(V = min)
Abaterea medie ptratic
Metoda

Sporului mediu
Indicelui mediu
Trendului liniar
Trendului
exponenial

y
n

y y
i

Coeficientul de variaie
2
V
100
y

19 516
44,17
10

44,17
100 17,34%
254,7

19 144
43,75
10

VI

43,75
100 17,17%
254,7

14 244
37,74
10

Vlin

37,74
100 14,81%
254,7

14 944
38,65
10

Vexp

38,65
100 15,17%
254,7

2.547
254,7 persoane
10

Cea mai bun metod de prognoz a rezultat a fi trendul liniar.


lin
Y2010
254,7 7,95 6 302,4 302 mil u.m. profit net

6.3.INTREBARI DE AUTOEVALUARE
1)Ce este baza de comparare?
2)Ce este indicele cu baza fixa? dar cu baza in lant?
3)Ce relatie exista intre indicii cu baza fixa si cu baza in lant:
4) Ce arata modificarea medie absoluta?
5)Ce arata ritmul de crestere?
7)Ce evidentiaza ritmul mediu de crestere?
8)Care sunt principalele componete ale seriei cronologice?
9)Ce este trendul?
10)Ce presupune ajustarea unei serii cronologice?
11)Cand se foloseste metoda mediilor mobile?
6.4.CUVINTE CHEIE
serie cronologica; nivel de referinta;indice cu baza fixa; indice cu baza
mobila; modificarea medie absoluta; indice mediu de dinamica;
ritm mediu; trend; variatie reziduala; metoda sporului mediu; metoda
indicelui mediu; trend liniar; trend exponential; metoda mediei mobile.

Cap.7. Msurarea oscilaiilor sezoniere ntr-o serie cronologic

67

Sezonalitatea este o component a seriilor cronologice, care se manifest sub


forma unor oscilaii sistemice, repetate de la un an la altul sau la intervale mai
mici de un an calendaristic.
Unele variaii sezoniere apar ca urmare a succesiunii anotimpurilor (oscilaiile
produciei agricole) altele apar ca urmare a tradiiilor (srbtori) sau datorit
interveniei omului (concedii, plata salariilor).
Pentru a msura influena valului sezonier este necesar s se cunoasc
periodicitatea producerii variaiei.
Msurarea oscilaiilor sezoniere este important deoarece:
permite obinerea de informaii cu privire la evoluia previzibil a
fenomenului cercetat;
creterea acurateei trendului prin eliminarea sezonalitii din calculul de
prognoz;
7.1 Metode de masurare a sezonalitatii
n practica statistic, pentru msurarea sezonalitii se determin indicele
(coeficientul) de sezonalitate care poate fi calculat prin mai multe metode:
procedeul mediei aritmetice;
procedeul mediei mobile;
metoda celor mai mici ptrate.
Metoda mediilor aritmetice

Pentru msurarea sezonalitii este necesar s se calculeze un raport


ntre datele care sunt influenate de valul sezonier i media anual.
Etapele de calcul vor fi:
- determinarea mediilor trimestriale;
- determinarea mediei trimestriale pe ntreaga perioad studiat;
- calculul sezonalitii n mrimi absolute:
- stabilirea indicilor de sezonalitate.
Metoda mediilor mobile
n cazul mediilor mobile se ine seama de periodicitatea termenilor pentru a nu
modifica tendina fenomenului.
Etapele de calcul sunt:
- determinarea mediilor pariale din patru termeni:
- stabilirea mediilor mobile definitive;
- stabilirea raportului ntre valorile iniiale (yi);
- determinarea indicilor de sezonalitate
Indicele de sezonalitate (Is) se determin ca raport ntre media trimestrial i
media anual.
7.2 Aplicatie (rezolvata)
Metoda mediilor aritmetice (tabelul 7.1)
Metoda mediei mobile (tabelul 7.2)
Metoda celor mai mici patrate (tabelul 7.4)

68

69

Tabelul nr. 7.1.

Tabelul nr. 7.2.

Calculul variaiei sezoniere cu ajutorul mediilor mobile


Anii

Trimestre

Medii pri
ale din 4
termeni

Economia
subterana
mild u.m.
(yi)
2

II

3,5

III

Medii mobile
definite

:Y

2002

3,625

5 : 3,625 = 1,379

3,875

3: 3,875 = 0,774

4,125

3 : 4,125 = 0,727

4,375

5 : 4,375 = 1,143

3,75
IV

3
4,0

3
4,25

II

2003

4,5
III

4,5

6 : 4,5 = 1,333

4,5
IV

4,625

4 : 4,625 = 0,865

4,875

3 : 4,875 = 0,615

4,75
I

3
5,0

II

5,0

2004
III

5,0
-

IV

6 : 5 = 1,2

Tabelul nr. 7.3.

Determinarea indicilor de sezonalitate cu ajutorul mediilor mobile


Trimestre
2002
I
II
III
IV
Total

1,379
0,774
-

Anii
2003
yi : y
0,727
1,143
1,333
0,865
-

Medii trimestriale
yt

2004
0,615
1,2
-

(0,724 + 0,615) : 2 = 0,669


(1,143 + 1,2) : 2 = 1,171
(1,379 + 1,333) : 2 = 1,356
(0,774 + 0,865) : 2 = 0,819

y
4

y 0 1003

Indicii de
sezonalitate

: y 0 Is
0,666
1,167
1,351
0,816
=4

Metoda celor mai mici ptrate

70

Aceast metod ncepe printr-o reprezentare grafic, pe baza creia se stabilete modelul matematic care surprinde cel mai bine desfurarea fenomenului.
Cele mai multe procese economice au o evoluie liniar.
Pentru a stabili tipul de evoluie a economiei subterane din exemplul precedent
se procedeaz la o reprezentare grafic (graficul nr. 7.1.)
mil u.m.

2002

2003

10 11 12 Trimestre
Ani
2004

Graficul nr. 7.1.


Evoluia economiei subterane (mil u.m.) n perioada 2002 2004 (Date ipotetice)
Se va alege ecuaia liniar pe baza creia se va ajusta seria privind economia
subterana in dinamica pe 3 ani.
Pentru aflarea parametrilor se va construi un algoritm de calcul (tabelul
nr.7.11.).
Parametrii a i b din ecuaia: Yt = a + bt se calculeaz astfel:

y
n

;b

t y
t
i

2
i

Tabelul nr. 7.4.

71

Variaia sezonier pe baza trendului liniar


Economia
subterana
(mild u.m.)
(yi)
2
4
5
3
3
5
6
4
3
6
7
4
Total 52

ti

-11
-9
-7
-5
-3
-1
1
3
5
7
9
11
0

y
n

t i2

121
81
49
25
9
1
1
9
25
49
81
121
572

tiyi

Yt = a + bti
Yt = 4,33 + 0,105ti

-22
-36
-35
-15
-9
-5
6
12
15
42
63
44
60

52
4,33; b
12

yi
Yt

4,33 + (0,105)(-11) = 3,175


4,33 + (0,105)(-9) = 3,385
4,33 + (0,105)(-7) = 3,595
4,33 + (0,105)(-5) = 3,805
4,33 + (0,105)(-3) = 4,015
4,33 + (0,105)(-1) = 4,225
4,33 + (0,105) 1 = 4,435
4,33 + (0,105) 3 = 4,645
4,33 + (0,105) 5 = 4,855
4,33 + (0,105) 7 = 5,065
4,33 + (0,105) 9 = 5,275
4,33 + (0,105) 11 = 5,485
Yt = 52

t y
t
i

2
i

0,629
1,181
1,390
0,788
0,747
1,183
1,352
0,861
0,617
1,184
1,327
0,729

60
0,105 .
572

Prin raportarea valorilor iniiale (yi) la valorile ajustate (teoretice) se obin


coeficienii de sezonalitate pe fiecare trimestru din cei trei ani studiai (tabelul
nr.7.12).
Prin raportarea mediilor trimestriale la media anual se obin indicii de
sezonalitate.

Tabelul nr. 7.5.

Indicii de sezonalitate calculai prin ajustare liniar


Trimestre

2002

2003

2004

I
II
III
IV
Total

0,629
1,181
1,390
0,788
-

0,747
1,183
1,352
0,861
-

0,617
1,184
1,327
0,729
-

Media
trimestrial
0,664
1,182
1,356
0,798
1,00

Indicii de
sezonalitate
0,664
1,182
1,356
0,798
4,00

72

n tabelul nr.7.6 se face o comparaie a indicilor de sezonalitate obinui prin


cele trei metode diferite de calcul i se constat rezultate destul de apropiate, fapt care
recomand (pentru acest exemplu) ca fiind potrivit oricare din metodele de
determinare a oscilaiilor sezoniere prezentate.
Indicii de sezonalitate
Trimestre
I
II
III
IV
Total

din termeni
neajustai
0,614
1,155
1,386
0,845
4,00

Tabelul nr. 7.6.

Indicii de sezonalitate
prin metoda
prin trend
mediilor mobile
liniar
0,666
0,664
1,167
1,182
1,351
1,356
0,816
0,798
4,00
4,00

7.3.INTREBARI DE AUTOEVALUARE
1)Ce este sezonalitatea?
2)Care este importanta masurarii oscilatiilor sezoniere?
3)Prin ce metode se poate masura sezonalitatea?
4)Ce arata indicele de sezonalitate?
5)Care sunt etapele de calcul pentru determinarea mediei mobile?
7.4.CUVINTE CHEIE
sezonalitate; indice de sezonalitate; metoda celor mai mici patrate;
8.BIBLIOGRAFIE RECOMANDATA
1)Angela Popescu : Statistica, Editura Fundatiei Romania de Maine; Bucuresti
Gabriela Neacsu
2006.
George Goanta
2)Andreea Luiza Iacob: Econometrie-studii de caz, Editura ASE, Bucuresti,
Ovidiu Tanasescu
2005
3)Eugen Pecican; Modele econometrice; Editura ASE, Bucuresti, 2001.
Ovidiu Tanasoiu
Andreea Luiza Iacob

Masteranzii vor prezenta la examen ( pe baza unor serii de date ipotetice sau
reale) un proiect cu aplicatii din capitolele 4, 5,6.
Intrebarile teoretice vor urmari exact intrebarile de autoevaluare prezentate la
fiecare capitol.

73

ANEXE
Anexa 1

Distribuia normal. Funcia de distribuie F z

1
2

z
2

e dz
z

74

Anexa1 (continuare)

75

Anexa1 (continuare)

76

Anexa1 (continuare)

77

Anexa1 (continuare)

78

Anexa 2

Distribuia 2. Valorile lui 2 n funcie de probabilitile P = P( 2 2)


i numrul gradelor de libertate

79

Anexa 2 (continuare)

80

Anexa2 (continuare)

81

Anexa 2 (continuare)

82

Anexa 3

Valorile raportului dispersiilor F corespunztoare


diferitelor nivele de semnificaie
A. Nivel de semnificaie 5% (P = 0,95)

83

B. Nivel de semnificaie 1% (P = 0,99)

84

C. Nivel de semnificaie 0,1% (P = 0,999)

ntotdeauna v1 corespunde celei mai mari dispersii.

85

Anexa 4

Tabel cu valorile funciei Gauss-Laplace t

1
2

2
1 1
2

e dt t

86

Anexa 5

Tabel cu valorile repartiiei Student n funcie de probabilitatea P (t ta)


i numrul f al gradelor de libertate

87

S-ar putea să vă placă și