Documente Academic
Documente Profesional
Documente Cultură
n funcie de scopul cercetrii, n locul mediei se poate lua mediana sau modulul.
Abaterile individuale relative (di%) se calculeaz ca raport ntre abaterile
individuale absolute i nivelul mediu al caracteristicii.
d
x x
d i % i 100 i
100 pentru i 1, n
x
x
Indicatorii simpli ai variaiei permit o caracterizare parial i aproximativ a
variaiei, deoarece se calculeaz pe baza relaiilor dintre doi termeni ai seriei sau prin
comparaia dintre fiecare termen i media lor.
Aprecierea coninutului real al mediei calculate se face prin utilizarea abaterilor
variantelor extreme:
abaterea maxim superioar: d s x max x
abaterea maxim inferioar: d i x min x
1.2 Aplicatie (rezolvata)
Frauda medie a unui lot de 10 firme controlate se prezint astfel(date ipotetice):
numrul de ordine: 1
al firmelor (n):
frauda medie (xi) 1,2
(mild u.m.):
0,9
1,1
0,8 1,5
6
1,6
0,8 0,8
10
1,3
0,9
A%
x max x min
x
unde:
n
x
i 1
1,2 0,9 1,1 0,8 1,5 1,6 0,8 0,8 1,3 0,9
10
di %
di
1,2 1,09
100
100 10,09% pentru primul termen
1,09
x
0,9 1,09
100 17,4% pentru al doilea termen
1,09
n concluzie: variaia ntre frauda maxima (1,6 mild u.m.) i frauda minima (0,8
mild u.m.) este de 0,8 mild u.m. iar abaterea maxim fa de medie este 0,51 mild
u.m., iar cea minim de 0,29 mild u.m. Nu este lipsit de importan, pentru
caracterizarea fraudei intregului lot verificat, nici frecvena valorilor maxime (1), ct
i a celor minime (3).
Indicatorii sintetici ai variaiei caracterizeaz gradul de variaie, lund n
consideraie toi termenii seriei. Acetia caracterizeaz ntr-o singur expresie
numeric ntreaga variaie a unei caracteristici din colectivitatea analizat.
n funcie de metodologia de calcul, de ncrctura informaional, n statistic se
calculeaz urmtorii indicatori sintetici ai mprtierii:
abaterea medie liniara;
abaterea medie ptratic (deviaia standard);
dispersia (variana);
coeficientul de variaie.
Indicatorii sintetici pot fi calculai ca mrimi medii, cu sfer de aplicabilitate
numai la variabile comparabile i ca mrimi relative, de coeficieni, cu sfer larg de
comparabilitate.
Abaterea medie liniar (d) se calculeaz ca medie aritmetic simpl sau
ponderat, n funcie de felul seriei, a abaterilor termenilor seriei de la media lor luate
n valoare absolut adic:
x i x pentru o serie simpl;
dx
n
x
x n *i
regul, dect abaterea medie calculat n raport cu mediana d
2
x
2
x
x x
n
x x
ni
n *i
2
x
Abaterea medie ptratic reflect ntr-o mai mare msur influena factorilor
aleatori comparativ cu abaterea medie liniar. Abaterile extreme prin ridicarea la
ptrat au o influen mai mare dect abaterile intermediare, mai apropiate de medie.
Abaterea medie ptratic este mai mare dect abaterea medie liniar d .
Coeficientul de variaie (v) se calculeaz ca raport procentual ntre abaterea
medie liniar sau abaterea medie ptratic i media aritmetic:
100; 100
x
x
Coeficientul de variaie arat cte uniti din abaterea medie liniar sau din cea
ptratic revin la 100 de uniti de medie.
Coeficientul de variaie, comparativ cu ceilali indicatori ai dispersiei calculai n
mrimi medii d, , mrete sfera de comparabilitate a acestuia, deoarece poate fi
exprimat n uniti de msur diferite.
Coeficientul de variaie poate lua valori cuprinse ntre 0-100%
(0 < v < 100%).
Cnd coeficientul de variaie tinde spre zero, se consider o variaie slab, o
colectivitate omogen i o medie cu un grad ridicat de reprezentativitate.
Cnd coeficientul de variaie tinde spre 100%, variaia este intens, colectivitatea
eterogen, iar media are un grad de reprezentativitate redus.
Ca test de semnificaie a reprezentativitii mediei se pot stabili urmtoarele
praguri de semnificaie:
0 < v < 17% media este strict reprezentativ;
17% < v < 35% media este moderat reprezentativ;
35% < v < 50% media este reprezentativ n sens larg;
v > 50% medie nereprezentativ.
Mrimea coeficientului de variaie, ca i a abaterii medii ptratice, este direct
proporional cu variaia caracteristicii.
Aceti doi indicatori reprezint un mijloc de verificare a exactitii caracterizrii
care se face colectivitii prin media calculat
1.2. Aplicatie(rezolvata)
Dintr-un numar de 700 de firme s-a format un esantion alcatuit din 70 de firme
la care s-a realizat un control fiscal pentru a se estima gradul de evaziune fiscala la
nivelul intregii colectivitati (de 700 firme) Tabelul 1.1
Indicatorii simpli ai variaiei
amplitudinea absolut a variaiei (Ax)
Ax = xsup xinf = 208 110 = 96 u m
amplitudinea relativ a variaiei (Ax%)
Ax %
x sup x inf
x
100
208 110
100 63,5
151,2
x a 151,2
Tabelul 1.1
Algoritmul de calcul al indicatorilor sintetici ai variatiei
Grupe de
firme dupa
evaziunea
fiscala(1
(mil u.m.)
110 - 124
124 - 138
138 - 152
152 - 166
166 - 180
180 - 194
194 - 208
Total
Numar de
firme
(ni)
Centrul de
interval
(xi)
xini
(xi- x )
(xi- x )ni
(xi- x )2
(xi- x )2ni
6
15
23
10
7
2
7
ni=70
117
131
145
159
173
187
201
-
702
1965
3335
1590
1211
374
1407
xini=
10584
-34,2
-20,2
-6,2
7,8
21,8
35,8
49,8
-
-205,2
303,0
-142,6
78,0
152,6
71,6
348,6
(xi- x )ni=0
1169,64
408,04
38,44
60,84
475,24
1281,64
2480,04
-
7017,84
6120,60
884,12
608,40
3326,68
2563,28
17360,28
(xi- x )2ni=
37881,11
xi- x
ni=1301,6
1)Date ipotetice
x=
xn
n
i i
i
10584
151, 2 mil u.m. evaziune fiscala
70
x i x n i 1301,6
18,59 u. m.
70
ni
x i x n i 37881,11 541,16
70
ni
2
2
x
ptrat a abaterilor. Abaterea medie ptratic este mai mare dect abaterea medie
liniar
n .
541,16 23,26 u m
4
4
d x 18,59 u m 14,872 u m
5
5
14,872 23,26
4
din abaterea medie liniar este diferit ca valoare
5
de abaterea medie ptratic, adic seria de distribuie privind evaziunea fiscala medie
se abate de la forma unei distribuii normale.
Coeficientul de variaie (Vx) propus de Perason se calculeaz:
dx
100 (media
- ca raport ntre abaterea medie liniar i nivelul mediu: Vx
x
calculat);
Totdeauna:
x
dx
100
100
x
x
0 < Vx 35%
- variaie mic;
- media este semnificativ;
23,26
Vx x 100
100 15,38%
151
,2
x
x
dx
100
100; 15,38% 12,29%
x
x
Valorile coeficientului de variaie se situeaz sub 17% i se pot concluziona:
media calculat este strict reprezentativ;
colectivitatea este omogen;
gruparea este bine realizat.
In concluzie, esantionul format este reprezentativ pantry cele 700 de firme.
Se poate estima ca nivelul evaziunii fiscale la nivelul intregii colectivitati
este de circa 105840 mil u.m.
1.3 .INTREBARI DE AUTOEVALUARE
1)Ce este dispersia?
2)Ce plus de cunoastere aduc indicatorii de variatie?
3)Ce caracterizeaza indicatorii simpli ai variatiei?
4)Ce caracterizeaza indicatorii sintetici ai variatiei?
5)Cum se calculeaza coeficientul de variatie?
6)Care este intervalul de valori a coeficientului de variatie?
7)ce reprezinta abaterea medie liniara?
8)Unde se foloseste abaterea medie patratica?
9)Unde mai poate fi folosit coeficientul de de variatie in afara de masurarea
variatiei?
1.4. CUVINTE CHEIE
10
variatiei
intr-o
serie
de
repartitie
2
dispersia total sau general 0 .
Dispersia de grup sau variana condiionat msoar influena
factorilor ntmpltori, factori care determin variaia n cadrul unei grupe
yi y j .
y y
n
j
2
i
n ij
ij
11
02
yj y n
n
0
2
100
02
Coeficientul de nedeterminaie (K2 = 1-R2) se calculeaz dup
urmtoarea formul:
R2
i
K 2 100
0
2
12
Grupe de
firme dupa
frauda medie
constatata
mil u.m.
I. 18-25
II. 26-40
III. 41-65
7
6
26
0
7
11
0
7
9
0
5
7
14
30
70
14
1823
,
5
x
n
,88 x i x1 n1
Total
1
i 1470
1
(120 130,25)2 7
(140,5 130,25)2 7
Profitul mediu al firmelor care produc o frauda de 18 ~ 25 mil u.m.
x i n 1 1823,5 130,25 u.m.
x1
14
n1
Dispersia grupei I
2
1
x x
n
i
n1
1470,88
105,06
14
13
Numr de
firme (n2)
Centrul
de
interval
(xi)
5
6
7
7
5
120,0
140,5
160,5
180,5
198,5
-
n 2 30
xin2
xi x2 2 n2
600
8302,8
843
2460,4
1123,5
0,4
1263,5
2730,4
992,5
7125,3
2
x i n 2 4822,5
x 2 x 2 n 2 20619,3
(120 160,75) 5
Media profitului net din grupa a II-a de frauda constatata (26 ~ 40 mil.u.m.)
x2
xin2
n2
4822,5
160,75 u.m.
30
22
2
x i x 2 n 2 20619,3 687,31
30
n2
x3
xin3
n3
3826,5
147,17 u.m.
26
14
2
3
x x
n
i
n3
12471,3
479,66
26
Numr
de firme
(ni)
Centrul
de
interval
(xi)
17
26
11
9
7
n i 70
120,0
140,5
160,5
180,5
198,5
-
xi xi 2 ni
xini
2040,0
3653,0
1765,5
1624,5
1389,5
5 xi
x i n i 10472,
14894,72
2153,06
1306,91
8593,25
16738,47
x i n i 43686,41
2
Media eantionului
x0
xini
ni
10472,5
149,60 u.m.
70
x i x n i 43686,41
624,10
70
ni
2
0
493,74
15
x 0 ni
2
9125,0
130,36
70
x i x 0 2 ni
ni
9125,0
130,36
70
70
16
xi x
;
x
F z
1
2
z2
2
dz ;
2
q1
q2 corespunztoare
1
17
2
q1
18
Numar de
firme
(ni)
6
15
23
10
7
9
n=ni=70
Centrul
de
interval
(xi)
117
131
145
159
170
194
-
xi xa
Zi
x
-1,470
-0,868
-0,266
0,335
0,808
1,840
(117-151,2):23,26=
-1,470
(131-151,2):23,26=
-0,868
(145-151, 2):23,26=
-0,266
3.3.INTREBARI DE AUTOEVALUARE
1)Ce presupune ipoteza statistica?
2)Ce presupune ipoteza nula?
3)Ce este eroarea de genul intai?
4)Ce este riscul de genul intai?
5)Ce este eroarea de genul al doilea?
6)ce este riscul de genul al doilea?
7)Ce este testul sau criteriul de semnificatie?
F Z
0,07078
0,1947
0,3974
0,6295
0,7881
0,96712
-
1
2
Z2
2
Probabilitatea
pi
npi
(n=ni=70)
ni npi
(ni npi ) 2
2
npi
0,07078
0,12392
0,2027
0,2321
0,1586
0,17902
0,19470,07078=0,12392
0,39740,1947=0,2027
0,62950,3974=0,2321
0,78810,6295=0,1586
4,9546
8,6744
14,1890
16,2470
11,1020
12,5314
0,0707870
0,1239270
0,202770
0,232170
0,158570
0,1790270
1,0454
6,3256
8,811
-6,247
-4,102
-3,5314
6-4,9546=1,0454
15-8,6744=6,3256
23-14,1890=8,811
10-16,2470=-6,247
7-11,1020=-4,102
9-12,5314=3,5314
0,226
4,4714
5,4714
2,4019
1,5156
0,9952
15,5175
(1,0454)2:4,9546=0,2206
(6,3256)2:8,6744=4,6128
(8,811)2:14,189=5,4714
(-6,247)2:16,2470=2,4019
(-4,102)2:11,1020=1,5156
(-3,5314)2:12,5314=0,9952
dZ
3.4.CUVINTE CHEIE
Verificarea normalitatii;repartitie empirica; ipoteza nula; lege de repartitie;
ipoteza statistica; test de semnificatie; eroare de genul intai; ricul de
genulintai; prag de semnificatie;test de normalitate.
19
20
dx
x x0
100
x0
21
4.2Aplicatie(rezovata)
n exemplul urmtor ne propunem s verificm gradul de reprezentativitate a
unui eantion de 10% din 500 de firme, care au fost verificate in timpul unui control
efectuat
Colectivitatea
general
cifre
cifre
absolut relative
e
(ni*)
(ni)
85
17
210
42
130
26
75
15
500
100
Selecia teoretic
(10%)
cifre
cifre
absolut relativ
e
e
(nt)
(nt*)
8
16
21
42
13
26
8
16
50
100
Selecia efectiv
(10%)
cifre
cifre
absolute relative
(n1)
(n1*)
10
24
12
4
50
20
48
24
8
100
xini
xint
xin1
6970
18060
11700
7050
xini = 43780
456
1806
1170
752
xint = 4384
820
2064
1080
376
xin1= 4340
Selecia teoretic sau programat reprezint un eantion ideal care s-ar fi realizat
dac se extrgeau din fiecare grup 10% din unitile componente.
43780
87,56 mii u.m.
Media colectivitii generale x 0
500
4384
87,68 mii u.m.
Media seleciei teoretice x t
50
4340
86,80 mii u.m.
Media seleciei efectuate x1
50
Media seleciei teoretice este mai aproape de media colectivitii generale, cum
era i normal, dar i media seleciei realizate este foarte apropiat de media
colectiviii generale, ceea ce conduce la concluzia c eantionul este reprezentativ.
Vom verifica n continuare reprezentativitatea eantionului i prin alte mijloace
de testare (tabelul 4.3.)
Tabelul nr. 4.3.
22
Selecia teoretic
Numrul de
Cifre
firme
relative
(nt)
8
21
13
8
50
Selecia efectuat
Numrul de
Abateri (df)
firme
(nt-n1)
(n1)
16
42
26
16
100
10
24
12
4
50
-2
-3
1
4
10
k df
100
n
n
Coeficientul de reprezentativitate d x
n1
10
100 20%
50
x1 x 0
86,80 87,56
100
100 0,86%
dx
x0
87
,
56
d x 100
x0
x t x 0 100 87,68 87,56 100 0,14%
x 0
87,56
23
selecii dirijate i mixte care au un obiectiv special i sunt mai rar folosite n
practica curent.
n practica statistic se folosesc mai multe tipuri de selecie care sunt dictate de
anumite particulariti:
gradul i forma de variaie a caracteristicii studiate;
modul de organizare a colectivitii totale;
modul de repartiie teritorial a unitilor;
procedeul de formare a eantionului.
Se disting urmtoarele tipuri de selecie:
selecie ntmpltoare simpl;
selecie mecanic;
selecie tipic (stratificat);
selecie de serii;
selecie n mai multe trepte;
selecie secvenial (n cazul controlului calitii produselor);
selecie subiectiv organizat (dirijat).
Fiecare tip de selecie presupune calcularea urmtorilor indicatori:
eroarea medie de reprezentativitate x ;
eroarea limit ();
volumul eantionului (n);
Calculul acestor indicatori pentru toate tipurile de sondaj se face dup modelul
seleciei ntmpltoare simple, cu mici modificri, n funcie de particularitile
fiecrui tip de sondaj.
Selecia ntmpltoare simpl
Cnd colectivitatea este format din uniti simple i prezint un anumit grad de
omogenitate se recomand acest tip de sondaj. Pentru formarea eantionului se
procedeaz la extragerea unitilor n mod repetat sau nerepetat dintr-o urn sau de pe
o list dinainte stabilit.
Erorile de reprezentativitate sunt mai mari n raport cu alte tipuri de selecie.
Sondajul tipic stratificat
Sondajul tipic stratificat este una din formele cele mai frecvent utilizate n
practic, deoarece se efectueaz pe colectiviti care au fost n prealabil desprite n
grupe omogene, dup o caracteristic esenial.
Fiecare grup va fi prezentat n eantion, fapt care va reduce eroarea de
reprezentativitate.
Variaia mediilor de selecie va fi n funcie de variaia fiecrei grupe, msurat
prin dispersiile de grup.
Selecia tipic poate fi: simpl, proporional i optim.
Selecia tipic simpl presupune extragerea unitilor din fiecare grup, fr a
ine seama de ponderea unitilor din fiecare grup a colectivitii generale.
Selecia tipic proporional are n vedere formarea unor subeantioane n
raport cu ponderea pe care o are fiecare grup n colectivitatea general.
Selecia tipic optim ia n consideraie ponderea pe care o au grupele n
colectivitatea general a eantionului format.
Selecia tipic d cele mai mici erori, dar este greu de aplicat.
Estimarea mediei privind volumul cheltuielilor totale se poate realiza pe baza
indicatorului privind eroarea maxim admis, care se calculeaz astfel:
24
x z x z
1
N
Selecia de serii
Acest tip de sondaj se efectueaz n condiiile n care colectivitatea cercetat este
organizat permanent pe uniti complexe (echipe, secii, brigzi, ateliere etc.)
De exemplu, dac echipa managerial a unei uzine care produce corpuri de
iluminat dorete s afle cauza procentului ridicat de rebuturi, atunci va organiza un sondaj privind
calitatea produselor obinute pe fiecare secie n parte. Secia este format din uniti (persoane)
eterogene din punct de vedere al pregtirii, vrstei, calificrii, vechimii; prin urmare, rezultatul muncii
lor este un rezultat de echip i nu de persoane luate independent. Felul cum toi aceti factori eseniali
i neeseniali (din cadrul echipei) acioneaz, mpreun sau separat, dicteaz rezultatele de producie i
calitatea produselor. Prin urmare, gradul de variaie a calitii produselor depinde, n primul
rnd, de dispersiile care exist ntre seriile colectivitii.
Pentru fiecare serie extras se nregistreaz nivelurile individuale, se face media
lor, iar eroarea de sondaj se stabilete ca diferen ntre media seriilor care au intrat n
eantion i media colectivitii generale, sintetizate prin dispersia dintre grupe (d)
n cazul acestui tip de sondaj, erorile de reprezentativitate vor fi mai mici sau
egale cu rezultatele sondajului simplu.
Relaiile de calcul ale celor trei indicatori sunt prezentate n tabelul nr. 4.4.
Tabelul nr. 4.4.
Indicatorii de calcul n cazul seleciei de serii
Indicatorul
de selecie
Eroarea
medie de
reprezentati
vitate
Eroarea
limit
Volumul
eantionului
(n)
Caracteristic
a
nealternativ
Selecia
repetat
Selecia
nerepetat
Selecia
Selecia
repetat
nerepetat
2
2
2
2
p
2p R r
x 0 R r
w
x 0
2x
w
w
r R 1
r
r
r R 1
r
r x
x z x
z2 x
r 2
x
2x R r
r R 1
x z x
w z w
R z 2 2x
z 2 2w
r
r
R 1 2x z 22x 2w
2w R r
r R 1
w z w
R z 2 2w
r
R 1 2w z 22w
25
26
Tabelul nr. 4. 5.
Intervalul de ncredere, nivelul de semnificaie i pragul de semnificaie a unei
distribuii normale
Intervalul de ncredere
x x 0 x
1,96 x x 0 1,96 x
2,00 x x 0 2,00 x
2,58 x x 0 2,58 x
3,00 x x 0 3,00 x
3,29 x x 0 3,29 x
Nivelul de siguran
(%)
68,26
95,00
95,44
99,00
99,73
99,90
Pragul de semnificaie
(%)
31,74
5,00
4,56
1,00
0,27
0,10
27
Pentru fiecare tip de sondaj s-a calculat i care ar fi trebuit s fie mrimea
eantionului pentru ca rezultatele sondajului s fie ct mai corecte.
Grupe de
firme dupa
frauda
constatata
(mii u.m.)
110 - 124
124 - 138
138 152
152 166
166 180
180 194
194 - 208
Total
Numr
de firme
(ni)
6
15
23
10
7
2
7
ni = 70
Cen-trul de
interval
(xi)
117
131
145
159
173
187
201
xi ni
702
1965
3335
1590
1211
374
1407
xini = 10584
x i x 2 ni
7017,84
6120,60
884,12
608,40
3326,68
2563,28
17360,28
2
x i x n i 37881,11
Dispersia:
x i x n i 37881,11 541,16
70
ni
2
23,26
0,1538 15,38%
x 151,2
2 dispersia
n mrimea eantionului
2. Eroarea maxim admis x sau eroarea limitat.
Produsul x z x se numete eroare limitat.
28
z x
x
Funcia de probabilitate z este direct proporional cu mrimea coeficientului
z, ea se apropie de 1 (ctre certitudine) proporional cu creterea coeficientului z.
Creterea probabilitii se manifest prin mrirea intervalului de ncredere, ceea ce duce
la o precizie mai sczut a rezultatelor. Pe msur ce crete probabilitatea, precizia
scade.
n condiii date de probabilitate, creterea preciziei rezultatelor se obine prin
mrirea volumului de selecie, adic a eantionului.
Se presupune c se dorete o eroare limit admis de 1,96 (z = 1,96) fa de
eroarea maxim admis care poate fi 5
Z = 1,96 (pentru = 0,95; x 2,78
3. Estimarea intervalului de ncredere a fraudei medii.
n acest caz, pentru extinderea rezultatelor la nivelul ntregii colectiviti se
folosete procedeul extinderii directe. Acest procedeu const n estimarea
parametrilor colectivitii generale pe baza rezultatelor seleciei statistice. Indicatorii
obinui prin sondaj se abat de la cei reali datorit erorilor de reprezentativitate. Aceti
indicatori se situeaz ntr-un interval de ncredere dat de media de selecie la care se
adaug sau se scade eroarea limit, astfel:
x x x0 x x
145,75 x 0 156,65
Frauda medie pe ntreaga colectivitate de 700 de firme se va situa ntre 145,75
i 156,65 u.m. Eroarea maxim de estimare a fraudei medii va fi de 5,4488 mii u.m.
Dac se dorete micorarea erorii maxime cu 50%, deci n loc de 5,4488 u.m. s
fie permis o eroare x de numai 2,7244 mii u.m., atunci este necesar mrirea
eantionului. n calculul de mai sus eantionul a fost de 70 de firme.
4. Volumul noului eantion (n) se calculeaz cu urmtoarea formul.
'
5,4488
2,7244
2
2
2 = 541,16 (dispersia calculat)
'x 2 = (2,7244)2.
29
146,05 x 0 156,35
Frauda medie se va situa ntre 146,05 i 156,35 mii u.m. la nivelul ntregii
colectiviti de 700 firme.
4. Volumul noului eantion (n)
Formula de calcul a volumului eantionului n cazul seleciei simple nerepetate
este:
z 22
n
z 22
2x
N
Se va folosi i o eroare limit mai mic cu 50%.
z = 1,96
5,1548
2,574
' x
2
2 = 541,16; N = 700 pers
30
m
9
0,129 12,9%
n 70
unde: m = numrul firmelor cu o frauda mai mare de 180 mii u.m.
dispersia: w (1 w) = 0,129 (1 0,129) = 0,112
vom avea: media: w
0,04 4%
n
70
2. Eroarea limit admis (tot pentru z = 1,96)
w = zw = 1,96 0,04 = 0,078 (7,84%)
3. Limitele ntre care se va situa numrul firmelor cu o frauda de 180 mii u.m
i peste 180 mii u.m (p)
w w p W + w
0,112 0,0784 p 0,112 + 0,0784
0,0336 p 0,1904
3,36% p 19,04%
w = 0,112
w = 0,0784
4. Estimarea numrului de firme care vor avea o frauda de 180 mii u.m sau mai
mare de 180 u.m (M)
N (W w) M N(W + w)
0,0336
N = 700 firme
w
31
0,1291 0,129
70
1
70
700
0,0379 3,79%
0,0016 0,9
n'
z 2 w 1 w
;
2
z 2 w 1 .w
'
w
N
z = 1,96; w = 0,0743
' w
w 0,0743
0,0372
2
2
w = 0,129; N = 700
32
ni n
i N i
i N i
Caracteristic nealternativ
Selecia repetat
Selecia nerepetat
i2
n
x z x
z i
2
i2
n
1
n
N
x z x
z 2 i
x 2
2
2
x 2 z
N
Caracteristic alternativ
Selecia repetat
Selecia nerepetat
w
w 1 w
n
w 1 w
n
1
n
N
w z w
w z w
z 2 w 1 w
2w
z 2 W (1 W )
z 2 W 1 W
2w
N
33
Total
7
5
7
6
0
7
0
7
0
5
14
30
5
17
13
26
4
11
2
9
2
7
26
70
34
i2
i2 n i
ni
35
'
- n cazul seleciei nerepetate, tot n cazul unui z = 1,96 i x
x
2
Farmacii
Baruri + cazinouri
Servicii diverse
Total
0,20 215 = 43
0,43 215 = 92
0,37 215 = 80
215
Grupe de Nufirme
mr
Frauda
dupa
de
medie pe
tipul de firme
grup
activitate (ni)
Grupa I
Farmacii 14
130,25
u.m.
Grupa II
Baruri + 30
160,75
cazinour
u.m.
i
Grupa III
Servicii
70
147,17
diverse
u.m.
Total
70
149,604
u.m.
Nr. firme
plasate
peste
frauda
medie
constatata
Greutatea
specific
m
w
n
Dispersii de grup
2w w i 1 w i
0,5 (7 : 0,25
14)
14
0,34 (9 : 0,2244
26)
0,43 (30 : 0,2419
70)
30
36
w1
7
14
9
0,5; w 2
0,47; w 3
0,34
14
30
26
2
Media dispersiilor de grup w
w2
w i 1 w i 0,2419
w 1 w
0,2419
0,05878 (pentru selecia repetat)
70
0,2419
70
1
70
700
0,9
w 1 w
n
1
n
N
0,003455 0,9
37
38
Yx f X1 , X 2 , , X k e
n care e este variabila aleatoare perturbatoare sau eroarea, care reprezint efectul
tuturor factorilor nespecificai, care sunt greu de cuantificat sau sunt nesemnificativi.
Principalele tipuri de modele de regresie sunt:
regresia unifactorial sau simpl (cu o singur variabil factorial);
regresia i corelaia curbilinie simpl (parabola de gradul II, hiperbola,
funcie exponenial);
regresia i corelaia multipl care poate fi exprimat printr-o funcie liniar
sau o funcie curbilinie.
Regresia liniar simpl este un model de regresie n care variabila dependent
(y) se modific liniar sub influena semnificativ a unei singure variabile
independente (x).
Reprezentarea grafic a perechilor de valori obinute n timpul observrii indic
prin forma norului de puncte o tendin liniar, iar modelul de analiz i predicie
folosit va fi cel al regresiei unifactoriale liniare:
Yx i = a + bxi + ei
unde a i b sunt parametrii necunoscui ai funciei ce urmeaz a fi estimai.
Parametrul a reprezint ordonat la origine i exprim valoarea lui y cnd x
= 0. Acest parametru nu are semnificaie economic.
Parametrul b reprezint panta dreptei de regresie i poart denumirea de
coeficient de regresie.
39
S yi Yx min
i 1
na b x i yi
i 1
i 1
i 1
a x i b x i2 x i yi
i 1
i 1
y
x x x y
a
n x x
i
2
i
2
i
a y bx
n x i yi x i yi
n x i2 x i
Sy i
Yx
Yx i
Sy i
Yx
100
y
Cu ct valoarea celor doi indicatori este mai sczut, cu att funcia aleas este
mai reprezentativ pentru a reda tipul de legtur dintre variabilele cercetate.
40
yi Yx i
D 1
2
yi y
100
Variaia
total
Variaia
neexplicat
de
regresie
Variaia
explicat
de
regresie
2
y
y y
2y x
2
y r
y Y
Fcalc
xi
K 1
: y Y
2
xi
nK
41
x
n
Cov X, Y
i 1
x yi y
42
y Y 1 dispersia rezidual
1
dispersia total
y y
Y y 1 dispersia explicat
dispersia total
y y
2
xi
xi
43
Nord-Est
3,41
Sud-Est
3,73
Sud
3,70
Sud-Vest
4,01
Vest
3,68
Nord-Vest
3,39
Centru
3,44
Bucureti
4,76
Total ar
3,79
Sursa: Anuarul statistic al Romniei 2003.
2,0
2,2
2,07
2,17
2,38
2,38
2,41
3,01
2,29
44
Venit total
mil. lei/pers/lun
3,1
3
2,9
2,8
2,7
2,6
2,5
2,4
2,3
2,2
(4,76; 3,01)
(3,68; 2,38)
(4,01; 2,17)
2,1
2
3
3,1
3,2
3,3
3,4
3,5
3,6 3,7
3,8
3,9
5
Ctig salarial
mil. lei/salariul
45
46
y
x x x y
a
n x x
2
i
n x i2 x i
n x i yi x i yi
2
i
y Y
i
xi
Sy i
Yx
Yx i
0,3253
0,2016
8
0,2016
100 8,65% (cam mare gradul de eroare)
2,33
yi Yx i
D 1
2
yi y
0,701
Fcalc
xi
K 1
: y Y
2
xi
nK
K = 2 (dou variabile)
n = 8 (perechi de valori)
0,701 0,3253
Fcalc
:
0,701 : 0,0542 12,93 .
2 1 8 2
47
0,51
2
1
,
435
x
x
i
x
n
Cov X, Y
i 1
x yi y
.
0,7275
0,09
8
ry x
x x y y
x x y y
i
0,7275
0,73
1,435 0,701
ry x
n x i yi x i yi
2
2
x i n y i2 y i
8 70,84 30,12 18,64
073
8 114,83 30,12 2 8 44,02 18,62 2
n x
2
i
y Y
1
y y
x
0,3253
0,73 .
0,701
48
y x 1 x n a 0 a 1x 1 a n x n
i presupune existena unei variabile dependente (Y) exprimat n funcie de dou sau
mai multe variabile independente (x1, x2, , xn).
Coeficienii de regresie a0, a1, , an se obin cu ajutorul metodei celor mai mici
ptrate.
x1 , x 2
x1
; ry x 2 ; rx 1
x2
Tabelul 5.3.
Nr.
crt.
Economia subterana
constatata (x1)
Profitul (y)
(miliarde uniti
49
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
monetare)
15
10
10
15
20
18
25
8
12
14
15
14
12
14
18
17
20
10
12
15
a) Determinarea existenei i formei legturii (graficul nr. 5.2 i graficul nr. 5.3.):
Profit
(mild. u.m.)
30
(20;25)
20
(15;15)
10
(12; 10)
5
10
15
20
Numr firme
Profit
(mild. u.m.)
30
(3,3;25)
20
(2,2;15)
10
(1,5; 10)
1
3
Capital fix (miliarde u.m.)
Prezentrile grafice arat c legturile simple sunt sub form liniar, deci
funcia de regresie multipl este:
y a 0 a 1x1 a 2 x 2
Sistemul de ecuaii normale pentru estimarea parametrilor acestei funcii
presupune rezolvarea urmtorului sistem:
50
na 0 a1 x1 a 2 x 2 y
2
a 0 x 1 a 1 x1 a 2 x 1 x 2 x 1 y
2
a
0 x 2 a 1 x 1x 2 a 2 x 2 x 2 y
Pentru determinarea parametrilor a0, a1, a2 ai funciei se calculeaz algoritmul
din tabelul nr. 5.4.
Tabelul nr. 5.4.
Profit
(mild
u.m.)
yi
Num
r firme
x2
15
Economia
subterana
(miliarde
u.m.)
x1
2,2
15
2
3
4
5
6
7
8
9
10
Total
10
10
15
20
18
25
8
12
14
147
1,5
1,7
2,5
3,1
2,7
3,3
1,1
1,8
2,5
22,4
14
12
14
18
17
20
10
12
15
147
x1y
x2y
x1x2
2
x1
2
x2
225
33,0
225
33,0
4,84
225
100
100
225
400
324
625
64
144
196
2403
15,0
17,0
37,5
62,0
48,6
82,5
8,8
21,6
35,0
361,0
140
120
210
360
306
500
80
144
210
2295
21,0
20,4
35,0
55,8
45,9
66,0
11,0
21,6
37,5
347,2
2,25
2,89
6,25
9,61
7,29
10,89
1,21
3,24
6,25
54,72
196
144
196
324
289
400
100
144
225
2243
2
yi
y x1x 2 5,559
3,873x 1i 0,788x i2
y12 5,559
3,873 2,2 0,788 15
=14,78
y 2=11,28
10,48
15,16
20,53
18,29
22,98
6,58
10,48
15,99
147,0
a0
51
a2
4 092,8
0,788
5 193,6
a1
45,44
45,44
a1
175,99
3,873
45,44
a0
10
10
5,559
10
10
10
Parametrii ecuaiei de regresie au urmtoarele valori:
a0 = -5,559; a1 = 3,873; a2 = 0,788.
ry x 1
ry
x1
n x
n x1 y x1 y
2
1
x1 n y 2 y
2
3610 3 292,8
317,2
317,2
0,956
547,2 501,76 24 030 21 609
110 010,24 331,68
Valoarea pozitiv i apropiat de 1 a coeficientului de corelaie arat o legtur
direct i de mare intensitate ntre volumul economiei subterane i volumul profitului
obinut.
52
ry x 2
n x
2
2
x 2 n y2 y
2
ry x 1
n x2y x2 y
22 950 21 609
1 341
1 341
0,951
821 2 421 1 409,83
rx1
x2
rx 1
x2
n x 1 x 2 x1 x 2
n x
2
1
x1 n x 22 x 2
2
3 472 3 292,8
179,2
0,927
547,2 501,76 22 430 21 609 193,148
ry x1 , x 2
ry
x1 , x 2
2
y x1
x2
1 r
2
x1 x 2
1 0,859
0,132
0,93617 0,967 .
0,141
53
Valorile
ajustate ale
ecuaiei (yi)
yi y x1 x 2
yi
yi y
Yx1 x 2
y
2
y x1x 2
1
2
3
4
5
6
7
8
9
10
14,78
11,28
10,48
15,16
20,63
18,29
22,98
6,58
10,87
15,94
147,00
15
10
10
15
20
18
25
8
12
14
147,00
0,22
-1,28
-0,48
-0,16
-0,63
-0,29
2,52
1,42
1,13
-1,94
-
0,3
-4,7
-4,7
0,3
5,3
3,3
10,3
-6,7
-2,7
-0,7
-
0,0484
1,6384
0,2304
0,0256
0,3969
0,0841
6,2558
2,0164
1,2769
3,7636
15,7365
0,09
22,09
22,09
0,09
28,09
10,89
106,09
44,89
7,29
0,49
242,1
147
14,7 mild uniti monetare
n
10
yi Yx1x 2 =147.
Y
R y x1 , x 2
y Y
1
y Y
i
x1x 2
2
x1 , x 2
15,7365
0,967 .
242,1
5.4.CUVINTE CHEIE
54
t 1
y t y t 1
55
I ty 0
yt
100
y0
t 1
yt
100
y t 1
I1y 0 I 2y 1 I ty t 1
y1 y 2
y
t I1y 0
y 0 y1
y t 1
I1y 0 : I ty t 1
y1 y t 1
y
:
t I1y 0
y0 y0
y t 1
cu baz n lan: R t
t 1
I t t 1 1 100
y n y1
,
n 1
n 1
yn
.
y1
56
Dac:
I < 100% indicele semnaleaz o scdere sau o reducere a fenomenului analizat;
I = 100% fenomenul analizat staioneaz;
I >100% indicele mediu evideniaz creterea fenomenului.
Avantajele folosirii indicelui mediu al dinamicii:
- este recomandat pentru fenomene cu evoluie uniform, aproximate prin
funcii exponeniale;
- se folosete pentru serii dinamice cu un numr redus de termeni.
Ritmul mediu de cretere sau scdere ( R ) evideniaz cu cte procente se
modific n medie fenomenul analizat pe toat perioada de calcul: R I 100 .
Cele trei metode mecanice de calcul: modificarea medie absolut, indicele
mediu al dinamicii i ritmul mediu al dinamicii prezint unele limite care se
datoreaz faptului c depind de calitatea termenilor extremi (primul i ultimul), fr
a avea n vedere i variaia din interiorul seriei.
ntre termenii unei serii cronologice de lungime suficient de mare, datorit aciunii
anumitor categorii de factori de influen, se manifest o anumit variaie ciclic sau o
anumit variaie sezonier i o variaie aleatoare (rezidual).
Printre problemele principale ale analizei seriei cronologice se afl i separarea
componentelor i evaluarea lor statistic.
Principalele componente ale seriei cronologice sunt:
trendul sau tendina general (T)
sezonalitatea (S)
ciclicitatea (C)
variaia rezidual (R)
Trendul sau tendina general, central este componenta principal a evoluiei i
totodat consecina aciunii cauzelor eseniale cu aciune de lung durat (progresul
tehnic, creterea populaiei), deci este o component sistemic.
Sezonalitatea este reprezentat de fluctuaiile (oscilaiile) n funcie de anotimpuri,
de factori climatici, de factori sociali care-i pun amprenta asupra desfurrii unui
fenomen sau proces pe o anumit perioad de timp. Aceste observaii se repet cu o
relativ regularitate de la o perioad la alta.
Ciclicitatea este determinat de factori de natur divers care acioneaz asupra
fenomenului analizat.
Sezonalitatea, ct i ciclicitatea nu sunt ntotdeauna prezente ntr-o serie
cronologic.
Variaia rezidual este reprezentat de acea parte din variaia unei serii de timp
care nu poate fi explicat prin trend, ciclicitate sau sezonalitate. Componenta aceasta
este generat de factori accidentali, neprevzui, reziduali i se manifest sub forma unor
abateri de la ceea ce este sistematic n evoluia fenomenului analizat.
Analiza seriilor cronologice este utilizat pentru a realiza prognoze. Pentru
aceasta este nevoie nu numai de extrapolarea trendului ci i de evaluarea nivelului
celorlalte componente din serie.
57
199
5
200
199
6
260
199
7
286
199
8
199
9
188
230
200
0
280
200
1
310
200
2
256
200
3
220
200
4
317
Profitul net
mil u.m.
350
310
317
300
286
250
220
200
180
150
100
2004
2003
2002
2001
2000
1999
1998
1997
1996
1995
50
Anii
Din graficul nr.6.1. se poate vedea o evoluie ascendent a profitului net, care
s-ar putea nscrie ntr-un model liniar sau exponenial.
Ajustarea mecanic se calculeaz prin dou metode:
metoda sporului mediu
metoda indicelui mediu I
58
13 mil u.m.
n 1
10 1
9
Valorile ajustate ale ntregii serii sunt prezentate n aplicaia din tabelul
nr. 6.4. n care valorile (n-1) au fost nlocuite cu valorile timpului (t i) avnd ca an de
referin anul 1995 cruia i revine un ti = 0.
Pentru anul 2010, ti = 15 (adic se continu numrarea).
Seria ajustat va fi:
Yt y1 t i
1995
Y1996
200 113 213
-------------------------------
Y2004
200 13 9 317
Y2010
200 1513 395 (prognoz)
Ajustarea prin metoda indicelui mediu se folosete atunci cnd termenii seriei
au tendina unei progresii geometrice, n care creterea sau scderea poate fi
exprimat prin indicele mediu. Se va folosi exemplul din tabelul nr. 6.1.
Relaia de calcul este:
n 1
t
sau y n y1 I
y n y1 I
i
y n 10 1 317
I
Y1995
200 1,052 0 200
I
Y1996
200 1,0521 211
------------------------------I
Y2004
200 1,052 9 317
I
Y2010
200 1,05215 428 persoane
Se poate observa c prin ambele metode la nivelul anului 2004 s-a obinut
acelai rezultat (317 mil u.m.) adic nivelul termenului prezentat de seria iniial
pentru anul 2004.
La nivelul anului 2010, prognoza oferit de cele dou metode este diferit. Se va
prezenta ntr-un alt subcapitol modul de alegere a celei mai bune metode de trend.
Metodele mecanice se folosesc pentru prognoze care s nu se duc prea
departe n timp. Se pot face predicii credibile pentru perioade care reprezint cel
mult jumtate plus unu fa de numrul termenilor seriei iniiale.
59
230
260
188
280
310
256
220
317
Anul
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
Se poate observa din datele tabelului nr. 6.2 i din graficul nr. 7.2. c mediile
obinute sunt mai atenuate, iar concluzia care se desprinde, este o uoar tendin de
cretere a profitului net.
Profitul net
mil u.m.
350
282
300
259
262
259
250
249
235
200
232
150
100
2004
2003
2002
2001
2000
1999
1998
1997
1996
1995
50
Anii
60
t 1
y t y t 1
t 1
t t 1
- dac indicii cu baza n lan sunt constani, atunci seria cronologic prezint o
tendin exponenial.
Pentru estimarea parametrilor funciei alese se folosete metoda celor mai mici
ptrate. Aceast metod are ca funcie obiectiv minimizarea sumei ptratelor
abaterilor valorilor reale de la cele ajustate:
min y t Yt
unde t = 1, 2, , n
200
0
-2
200
1
-1
200
2
0
200
3
1
200
4
2
- dac seria este format dintr-un numr par de termeni, termenii centrali se
noteaz cu (-1; +1). O alt notaie posibil utilizat uneori se face prin atribuirea
termenilor centrali a valorilor (-0,5; +0,5), astfel:
valori atribuite variabilei
t
Varianta I
Varianta II
199
9
-5
-2,5
200
0
-3
-1,5
200
1
-1
-0,5
200
2
+1
+0,5
200
3
3
1,5
200
4
5
2,5
61
Trendul liniar
n scopul determinrii celor doi parametri ,,a i ,,b se scrie sistemul de
ecuaii normale astfel:
na b t y i
2
a t i b t i t i y i
na y i
b t t i y i
2
i
de unde
n
t i yi
2
i
Trendul exponenial
n cazul alegerii unui trend exponenial va fi necesar s se rezolve sistemul de
ecuaii:
t lg a t lg b lg y i
t lg a t
2
i
lg b t i lg y i
lg a
unde
lg b
lg y
n
t i lg yi
2
i
62
2 547
a n 10 254,7
Ylin= a + b ti unde
t i yi
2
ti
358
45
7,95
1
Ylin 254,7 7,95 3 231
--------------------------------------10
Ylin 254,7 7,95 3 279
Trendul exponenial
Yexp a b
10
ti
n
, unde: lg a
lg y i
n
2, 4
24
10
2, 4
a 251, 2
251, 2
t i lg y i
0, 4
lg b
0,009
2
45
ti
10
0,009
1,02
b 1,02
1
3
Yexp 251, 2 1,02
237
-------------------------------10
3
Yexp 251, 2 1,02 267
63
64
65
66
Sporului mediu
Indicelui mediu
Trendului liniar
Trendului
exponenial
y
n
y y
i
Coeficientul de variaie
2
V
100
y
19 516
44,17
10
44,17
100 17,34%
254,7
19 144
43,75
10
VI
43,75
100 17,17%
254,7
14 244
37,74
10
Vlin
37,74
100 14,81%
254,7
14 944
38,65
10
Vexp
38,65
100 15,17%
254,7
2.547
254,7 persoane
10
6.3.INTREBARI DE AUTOEVALUARE
1)Ce este baza de comparare?
2)Ce este indicele cu baza fixa? dar cu baza in lant?
3)Ce relatie exista intre indicii cu baza fixa si cu baza in lant:
4) Ce arata modificarea medie absoluta?
5)Ce arata ritmul de crestere?
7)Ce evidentiaza ritmul mediu de crestere?
8)Care sunt principalele componete ale seriei cronologice?
9)Ce este trendul?
10)Ce presupune ajustarea unei serii cronologice?
11)Cand se foloseste metoda mediilor mobile?
6.4.CUVINTE CHEIE
serie cronologica; nivel de referinta;indice cu baza fixa; indice cu baza
mobila; modificarea medie absoluta; indice mediu de dinamica;
ritm mediu; trend; variatie reziduala; metoda sporului mediu; metoda
indicelui mediu; trend liniar; trend exponential; metoda mediei mobile.
67
68
69
Trimestre
Medii pri
ale din 4
termeni
Economia
subterana
mild u.m.
(yi)
2
II
3,5
III
Medii mobile
definite
:Y
2002
3,625
5 : 3,625 = 1,379
3,875
3: 3,875 = 0,774
4,125
3 : 4,125 = 0,727
4,375
5 : 4,375 = 1,143
3,75
IV
3
4,0
3
4,25
II
2003
4,5
III
4,5
6 : 4,5 = 1,333
4,5
IV
4,625
4 : 4,625 = 0,865
4,875
3 : 4,875 = 0,615
4,75
I
3
5,0
II
5,0
2004
III
5,0
-
IV
6 : 5 = 1,2
1,379
0,774
-
Anii
2003
yi : y
0,727
1,143
1,333
0,865
-
Medii trimestriale
yt
2004
0,615
1,2
-
y
4
y 0 1003
Indicii de
sezonalitate
: y 0 Is
0,666
1,167
1,351
0,816
=4
70
Aceast metod ncepe printr-o reprezentare grafic, pe baza creia se stabilete modelul matematic care surprinde cel mai bine desfurarea fenomenului.
Cele mai multe procese economice au o evoluie liniar.
Pentru a stabili tipul de evoluie a economiei subterane din exemplul precedent
se procedeaz la o reprezentare grafic (graficul nr. 7.1.)
mil u.m.
2002
2003
10 11 12 Trimestre
Ani
2004
y
n
;b
t y
t
i
2
i
71
ti
-11
-9
-7
-5
-3
-1
1
3
5
7
9
11
0
y
n
t i2
121
81
49
25
9
1
1
9
25
49
81
121
572
tiyi
Yt = a + bti
Yt = 4,33 + 0,105ti
-22
-36
-35
-15
-9
-5
6
12
15
42
63
44
60
52
4,33; b
12
yi
Yt
t y
t
i
2
i
0,629
1,181
1,390
0,788
0,747
1,183
1,352
0,861
0,617
1,184
1,327
0,729
60
0,105 .
572
2002
2003
2004
I
II
III
IV
Total
0,629
1,181
1,390
0,788
-
0,747
1,183
1,352
0,861
-
0,617
1,184
1,327
0,729
-
Media
trimestrial
0,664
1,182
1,356
0,798
1,00
Indicii de
sezonalitate
0,664
1,182
1,356
0,798
4,00
72
din termeni
neajustai
0,614
1,155
1,386
0,845
4,00
Indicii de sezonalitate
prin metoda
prin trend
mediilor mobile
liniar
0,666
0,664
1,167
1,182
1,351
1,356
0,816
0,798
4,00
4,00
7.3.INTREBARI DE AUTOEVALUARE
1)Ce este sezonalitatea?
2)Care este importanta masurarii oscilatiilor sezoniere?
3)Prin ce metode se poate masura sezonalitatea?
4)Ce arata indicele de sezonalitate?
5)Care sunt etapele de calcul pentru determinarea mediei mobile?
7.4.CUVINTE CHEIE
sezonalitate; indice de sezonalitate; metoda celor mai mici patrate;
8.BIBLIOGRAFIE RECOMANDATA
1)Angela Popescu : Statistica, Editura Fundatiei Romania de Maine; Bucuresti
Gabriela Neacsu
2006.
George Goanta
2)Andreea Luiza Iacob: Econometrie-studii de caz, Editura ASE, Bucuresti,
Ovidiu Tanasescu
2005
3)Eugen Pecican; Modele econometrice; Editura ASE, Bucuresti, 2001.
Ovidiu Tanasoiu
Andreea Luiza Iacob
Masteranzii vor prezenta la examen ( pe baza unor serii de date ipotetice sau
reale) un proiect cu aplicatii din capitolele 4, 5,6.
Intrebarile teoretice vor urmari exact intrebarile de autoevaluare prezentate la
fiecare capitol.
73
ANEXE
Anexa 1
1
2
z
2
e dz
z
74
Anexa1 (continuare)
75
Anexa1 (continuare)
76
Anexa1 (continuare)
77
Anexa1 (continuare)
78
Anexa 2
79
Anexa 2 (continuare)
80
Anexa2 (continuare)
81
Anexa 2 (continuare)
82
Anexa 3
83
84
85
Anexa 4
1
2
2
1 1
2
e dt t
86
Anexa 5
87