Documente Academic
Documente Profesional
Documente Cultură
STATISTIC
2009
Reprografia Universitii TRANSILVANIA din Braov
PREFA
CUPRINS
Pag .
Capitolul 1. Statistica - instrument de cunoatere a fenomenelor economice.
Observarea statistic ..................................................................................................
10
10
1. Obiectul i metoda statisticii; relaiile cu celelalte tiine .................................
2. Concepte de baz folosite n statistic ... 12
14
3. Rolul observrii n procesul de cercetare statistic ...
15
4. Proiectarea observrii statistice .
17
5. Metode de observare statistic ..
6. Organizarea sistemului informaional n Romnia 21
22
7. Erorile observrii statistice. Controlul datelor statistice ....................................
24
Rezumat .................................................................................................................
24
Termeni importani ................................................................................................
24
Teste de autocontrol ..............................................................................................
Capitolul 2. Sistematizarea i prezentarea datelor statistice ..................................
1. Tipuri de grupri ...............................................................................................
2. Grupare unidimensional .............................................................. ....................
3. Grupare bidimensional ....................................................................................
4. Prezentarea datelor statistice .............................................................................
4.1 Tabele statistice ...........................................................................................
4.2 Seriile statistice ............................................................................................
4.3 Reprezentri grafice .....................................................................................
Rezumat .................................................................................................................
Termeni importani .............................. ..................................................................
Teste de autocontrol ..............................................................................................
26
26
27
30
34
35
36
38
43
44
44
46
46
46
52
52
52
55
56
57
57
61
64
65
65
66
70
6
6. Asimetria ........................................................ ...................................................
Rezumat .................................................................................................................
Termeni importani ............................................................... .................................
Teste de autocontrol ..............................................................................................
Probleme propuse ........................................................................................ ..........
71
74
74
74
75
77
77
83
85
88
88
88
88
92
92
93
94
95
97
98
100
100
102
105
109
110
111
113
113
113
113
115
115
118
118
119
120
123
123
125
126
126
128
132
132
132
132
7
Capitolul 7. Metoda indicilor .....................................................................................
1. Noiunea de indice statistic. Probleme teoretice ale construirii indicilor .........
2. Indicii agregai. Sisteme de ponderare folosite la construirea indicilor de
grup .......................................................................................................................
3. Indicii de grup calculai ca medie a indicilor individuali ................................
4. Indicii calculai ca raport a dou medii ............................................................
Rezumat ............................................................................. ...................................
Termeni importani ...............................................................................................
Teste de autocontrol .................................................................................... .........
Probleme propuse .................................................................................................
136
136
Bibliografie ..................................................................................................................
153
137
144
146
150
150
150
151
Capitolul 1
Capitolul 1
Tema
Obiectivele
Mijloace
- citire/nvare
- ntrebri, probleme ce apar, explicaii
- definiii, explicaii ce trebuie reinute
- situaii economice concrete, supuse analizei, exemple (sub
lup)
Finalitatea
Evaluarea
Timp de lucru
necesar
10
Capitolul 1
11
12
Capitolul 1
13
14
15
Capitolul 1
observare (simple i complexe) trebuie s se fac pe baza unor elemente clare care s
permit nelegerea unitar a noiunii respective de ctre toate persoanele participante
la culegerea datelor;
datele obinute prin observarea statistic trebuie s ndeplineasc att condiia de
volum ct i de calitate. Dac datele sunt incomplete ca volum nu exist sigurana c
prin prelucrarea lor, orict de corect ar fi, se va ajunge la descoperirea legitilor
obiective dup care s-au produs fenomenele;
datele statistice trebuie s se prezinte ca un material informativ complet i unitar att
sub aspectul organizatoric ct i al coninutului.
Pentru ca activitatea de culegere a datelor s fie eficient se recomand stabilirea n
prealabil a unor etape de lucru, a unui program de aciune.
4. Proiectarea observrii statistice
16
17
Capitolul 1
n practic se folosesc dou tipuri de formulare: fia i lista. n fie se trec datele cu
privire la o singur unitate de observare, conform programului. Fia se folosete cnd
programul de observare este mai bogat i cnd unitile de nregistrare sunt mai rspndite n
spaiu. ntr-o list se nscriu rspunsurile la caracteristicile din program pentru mai multe
uniti de observare statistic concentrate n spaiu. n unele situaii se pot folosi i combinat
cele dou tipuri de formulare. De exemplu, la recensmintele de populaie se ntocmete cte
o fi pentru fiecare familie, iar persoanele care locuiesc n colectiviti numeroase (cmine,
armat, spitale) sunt nregistrate n liste.
Normele metodologice i tehnice privind completarea formularelor sunt imprimate
direct pe ele sau separat n brouri speciale.
Aceste instruciuni de completare a formularelor trebuie s fie ct mai scurte, dar
complete, asigurnd nelegerea uniform pentru toi observatorii statistici.
Formularele trebuie s fie ntocmite n aa fel nct s permit codificarea
rspunsurilor la ntrebri, n vederea prelucrrii ulterioare a datelor folosind o tehnic de
calcul adecvat.
Msurile organizatorice au drept scop asigurarea unor condiii ct mai bune pentru
desfurarea observrii statistice. Mai nti este necesar s se efectueze din timp o
documentaie ampl cu privire la experiena acumulat cu prilejul unor observri similare,
ntruct n ar sau pe plan mondial valorificarea acestei experiene are drept rezultat att
obinerea unui volum mare de date i de bun calitate ct i posibilitatea asigurrii
comparabilitii datelor n timp i n spaiu.
Cnd datele se culeg direct de la populaie este necesar s se fac popularizarea
aciunii prin pres, radio i televiziune pentru a informa populaia asupra coninutului i
scopului observrii respective.
Msurile organizatorice sunt foarte variate de la o observare la alta, n funcie de
natura specific a fenomenelor studiate, de sursele de informaie utilizate, de volumul de date
ce urmeaz s fie obinut, de felul i procedeul de nregistrare folosit. De aceea, planul unei
observri trebuie s se particularizeze pe fiecare cercetare n parte, n funcie de scopul
acesteia.
5. Metode de observare statistic
18
Capitolul 1
19
20
21
Capitolul 1
22
Capitolul 1
23
24
Rezumat
Acest capitol prezint noiunile de baz necesare organizrii unei cercetri statistice:
stabilirea obiectivului cercetrii, definirea colectivitii i a caracteristicilor necesare analizei,
culegerea datelor conform planului observrii.
Termeni importani: colectivitatea statistic, caracteristica statistic, unitatea
statistic, indicator statistic, observarea statistic, erorile statistice.
Teste de autocontrol:
1.
2.
3.
4.
5.
6.
Capitolul 2
25
Capitolul 2
Tema
Obiectivele
1. Tipuri de grupri
2. Grupare unidimensional
3. Grupare bidimensional
4. Prezentarea datelor statistice
4.1 Tabele statistice
4.2 Seriile statistice
4.3 Reprezentri grafice
Mijloace
- citire/nvare
- ntrebri, probleme ce apar, explicaii
- definiii, explicaii ce trebuie reinute
- situaii economice concrete, supuse analizei, exemple (sub
lup)
Evaluarea
Timp de lucru
necesar
Finalitatea
26
1. Tipuri de grupri
Capitolul 2
27
Nr
.
crt
.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
Cifra de
afaceri
Numr de
personal
-mii
RON-
50
66
185
117
98
125
89
148
77
203
Fondul
de salarii
Nr.
crt.
-mii RON-
5
5
21
12
9
8
10
18
8
24
22
31
90
50
47
33
40
64
29
106
Cifra de
afaceri
Tabelul nr. 1
Numr de
Fondul
personal
de salarii
-mii
RON-
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
76
181
122
137
140
59
91
133
101
172
-mii RON-
13
19
10
12
17
7
11
9
11
13
37
89
63
58
71
18
36
52
60
88
Se cere:
1. S se precizeze scopul, obiectul, unitatea i programul observrii;
2. S se grupeze unitile comerciale dup mrimea cifrei de afaceri pe intervale
egale i neegale;
28
A
r
Capitolul 2
29
x max x min
1 3,322 lg n
Tabelul nr.2
CIFRA DE AFACERI
VARIANTA I
VARIANTA II *
VARIANTA III *
50-80
-81
50-81
81-111
81-112
81-112
112-142
112-143
112-143
143-173
143-174
143-174
174-204
174 174-204
*limita superioar sau limita inferioar cuprins n interval
e) gruparea propriu-zis, presupune determinarea pentru fiecare grup a numrului
unitilor comerciale (frecvenele absolute) care aparin grupei respective, respectnd criteriul
de grupare.
Tabelul nr.3
Grupe de uniti dup
cifra de afaceri
-mii RON-
Nr.
uniti
xi
fi
50-80
80-112
112-143
143-174
174-204
TOTAL
5
4
6
2
3
20
Cifra de
afaceri
-mii RON-
Numrul de
personal
328
379
774
320
569
2370
38
41
68
31
64
242
Fondul de
salarii
-mii
RON138
183
327
152
285
1085
Grupe de uniti
dup cifra de
afaceri
-mii RON- xi
Frecvenele
absolute
50 - 80
80 - 112
5
4
5
9
20
15
30
112 - 143
143 - 174
174 - 204
TOTAL
6
2
3
20
15
17
20
-
11
5
3
-
Grupe de uniti
dup cifra de afaceri
-mii RON- xi
Sub 110
110 - 180
Peste180
TOTAL
Tabelul nr.5
Numr de
societi
comerciale
9
8
3
20
3. Grupare bidimensional
y1
n11
n21
Volumul grupelor
n1.
n2.
Capitolul 2
31
...
xi
...
xp
Total
...
ni1
...
np1
n.1
...
ni2
...
nij
...
npj
n.j
...
np2
n.2
...
niq
...
npq
n.q
...
ni.
...
np.
n
Frecvenele nij reprezint numrul unitilor statistice purttoare ale valorilor (X i,Yj).
1j
n1 . ;...
j 1
ij
n i . ;...
j 1
pj
n p. ;
j 1
i1
n.1 ;...
i 1
ij
i 1
n. j ;...
iq
n.q ;
i 1
Grupe de uniti
dup cifra de afaceri
-mii RON- xi
50 - 80
80 - 112
112 - 143
143 - 174
174 - 204
TOTAL
1
5
4
4
8
1
2
1
1
1
3
2
2
4
6
2
3
20
Total
Y1 sau Y
Y 2 sau Y
k11
k12
k1.
32
X 2 sau X
k 21
k 22
k 2.
Total
k.1
k .2
Y1 sau Y
Y 2 sau Y
X1 sau X
p11
p12
X 2 sau
p 21
p 22
p.1
p.2
Total
Total
k ij
k i.
pentru
i 1,2 i
j 1,2
ij
1 pentru
i 1,2
j 1
Tabelul nr. 10
Modalitile caracteristicii Y
Modalitile
caracteristicii X
Y1 sau Y
Y 2 sau Y
X 1 sau X
q11
q12
q1.
X 2 sau X
q 21
q 22
q 2.
Total
1
1
1
Interpretarea frecvenelor q ij se poate face astfel: q11 reprezint ponderea indivizilor
care posed modalitatea Y1 i modalitatea X1 n totalul indivizilor ce posed modalitatea Y1,
iar q12 reprezint ponderea indivizilor care posed modalitatea Y1 dar nu posed modalitatea
X1 n totalul indivizilor ce posed modalitatea Y 1.
Total
Capitolul 2
33
q ij
k ij
k.j
pentru
i 1, 2 i
j 1, 2
ij
1 pentru
j 1, 2
i 1
qi . k i . / n
Dup modul n care se grupeaz indivizii, se pot ivi situaiile:
asociere pozitiv concentrarea indivizilor pe diagonala principal format din
celulele (X 1, Y 1) i (X 2, Y 2);
asociere negativ - concentrarea indivizilor pe diagonala secundar format din
celulele (X 1, Y 2) i (X 2, Y 1);
asociere perfect toi indivizii se plaseaz pe una din diagonalele tabelului;
asociere maxim atunci cnd una din perechile (X,Y) are frecvena de apariie
zero.
Tabelul nr. 11
RECLAMA * CUMPARA Crosstabulation
Count
CUM PA RA
da
RECLAMA
Total
da
nu
nu
65
20
85
Total
15
50
65
80
70
150
Putem obine profilele linii, adic pentru fiecare modalitate a variabilei reclama,
ponderea celor care cumpr n totalul liniei:
34
Tabelul nr. 12
RECLAMA * CUMPARA Crosstabulation
CUMPARA
da
RECLAMA
da
Count
% within
RECLAMA
nu
Count
% within
RECLAMA
Total
Count
% within
RECLAMA
nu
Total
65
15
80
81,3%
18,8%
100,0%
20
50
70
28,6%
71,4%
100,0%
85
65
150
56,7%
43,3%
100,0%
Putem obine profilele coloane, adic pentru fiecare modalitate a variabilei cumpr,
ponderea celor care au vzut reclama n totalul coloanei:
Tabelul nr. 13
RECLAMA * CUMPARA Crosstabulation
CUMPA RA
da
RECLAMA
da
nu
Total
Count
% within
CUMPA RA
Count
% within
CUMPA RA
Count
% within
CUMPA RA
nu
Total
65
15
80
76,5%
23,1%
53,3%
20
50
70
23,5%
76,9%
46,7%
85
65
150
100,0%
100,0%
100,0%
Capitolul 2
35
36
Capitolul 2
37
Seriile statistice de stocuri sau de momente se obin pentru variabile statistice pentru
care este raional ca nsumarea s se fac la anumite momente, ca de exemplu: numrul de
muncitori, valoarea fondurilor fixe, numrul de tractoare, valoarea mijloacelor circulante,
stocurile de mrfuri etc. Caracteristic pentru seria dinamic de momente este faptul c
termenii ei nu se pot cumula deoarece pot exista nregistrri repetate i valoarea obinut n-ar
avea sens economic. Caracterizarea statistic pentru ntreaga perioad nu se poate face n
acest caz printr-un indicator totalizator, ci folosind indicatori derivai sub form de mrimi
relative sau medii.
Este necesar ca pentru fiecare serie dinamic s rezulte clar (din titlul ei) dac datele
prezentate se refer la momente sau la perioade de timp, pentru a putea stabili relaii corecte
ntre ele.
De exemplu: exportul i importul Romniei a avut urmtoarea evoluie n perioada
1997-2003 (serii de flux).
Tabelul nr. 14
Ani
Export FOB
Import FOB
mil.Euro
mil.Euro
1997
7469
9222
1998
7400
9718
1999
7977
9163
2000
11273
13140
2001
12722
16045
2002
14675
17427
2003
15614
19569
Sursa datelor: Anuarul Statistic al Romniei 2004
Seriile statistice teritoriale sunt cele n care centralizarea frecvenelor sau a valorilor
individuale ale caracteristicii studiate se face n funcie de variaia teritorial administrativ.
De regul, seriile teritoriale sunt folosite pentru sistematizarea informaiilor statistice
pe judeele rii, pe ri sau alte forme teritorial administrative. Pe baza seriilor teritoriale se
poate face o ierarhizare a unitilor teritoriale.
Pornind de la funciile de cunotere care trebuie realizate folosind datele statistice,
seriile teritoriale, de regul, se ntocmesc pentru mai multe iruri de date, privitor la variaia
caracteristicilor statistice ce se gsesc ntr-un raport obiectiv de interdependen. Aceste iruri
apar ca serii statistice interdependente, condiionate pe teritoriul la care se refer datele.
Tabelul nr. 15
ara
Export FOB
mil. dolari SUA
Romnia
17618
Polonia
53699
Bulgaria
7534
Slovacia
21960
Slovenia
12767
Ungaria
42532
Sursa datelor: Anuarul Statistic al Romniei 2004
38
Seriile statistice de distribuie sunt acelea n care se folosete pentru gruparea datelor
o caracteristic atributiv (calitativ sau numeric) iar centralizarea se face pentru frecvenele
la care se nregistreaz aceeai variant, sau pentru o alt caracteristic statistic.
Seria de distribuie format dup variaia unei caracteristici numerice se mai numete
i serie de variaie, iar, de regul, al doilea ir este format din frecvenele corespunztoare
grupelor. n acest caz, pot aprea serii de distribuii de frecvene direct pe variante sau pe
intervale de valori.
n cazul unei amplitudini mari a variaiei se folosesc serii statistice pe intervale de
grupare (egale sau neegale).
Tabelul nr. 16
Distribuia societilor dup CA
Grupe de uniti dup
cifra de afaceri
Nr.
-mii RONuniti
xi
50-80
80-110
110-140
140-170
peste 170
TOTAL
fi
5
4
6
2
3
20
Capitolul 2
39
se realizeaz diviziunea liniei. Liniuele scrii sunt numerele care corespund punctelor
extreme ale scrii. Lungimea scrii este ntreaga distan dintre punctele extreme ale scrii.
Alegerea unitii de lungime a scrii se face n funcie de spaiul destinat figurii
graficului i n aa fel, nct s se surprind forma real de variaie a indicatorilor de
reprezentat. Dac se prezint corelat mai multe caracteristici statistice, atunci scrile de
reprezentare trebuie s fie astfel stabilite, nct s poat cuprinde toate valorile indicatorilor i
s redea ntr-o form armonioas proporia real dintre ele.
Pe suportul scrii se trec numai valorile care marcheaz distanele proporionale cu
unitatea de msur a scrii de reprezentare.
Distana dintre dou puncte nvecinate de pe suportul scrii poart numele de interval
grafic iar diferena dintre valorile numerice ale acestor puncte reprezint intervalul numeric.
Notele explicative i legendele se folosesc pentru a putea interpreta corect graficul.
Notele explicative apar atunci cnd este necesar s se atrag atenia asupra aspectelor
metodologice ale calculrii indicatorilor reprezentai, sau asupra modului de prezentare a lor
n grafic.
Legendele reprezint explicarea concis a semnelor convenionale, haurilor i
culorilor folosite.
Sursa de informaie a datelor din grafic este obligatorie n toate cazurile, cnd se
folosesc date reale. Ea este trecut n afara graficului i trebuie s cuprind toate elementele
de identificare a izvorului informaiei respective. Cnd graficele sunt ncadrate ntr-un raport
de analiz sau ntr-o lucrare de cercetare tiinific, la fel ca i titlurile, sursele de informaie
pot s nu apar n mod expres dac din textul respectiv rezult aceste elemente.
Tipuri de grafice
Diagrama prin coloane - distribuia angajailor unei firme dup numrul de copii este
prezentat n tabelul urmtor (caracteristic cu variante):
Tabelul nr. 17
Grupe de angajai dup
nr.de copii
Numr angajai
17
31
20
11
total
89
40
35
30
nr. angajai
25
20
15
10
5
0
0
nr. copii
20000
18000
16000
14000
12000
10000
8000
6000
4000
2000
0
1997
1998
1999
2000
2001
2002
2003
11%
27%
Romnia
Polonia
Bulgaria
Slovacia
35%
8%
14%
5%
Slovenia
Ungaria
Capitolul 2
41
Diagramele prin benzi sunt foarte des folosite datorit expresivitii lor i uurinei n
executare. Se utilizeaz pentru seriile teritoriale. Pentru datele din tabelul 15 putem realiza un
top al rilor dup valorile exportului realizat n anul 2003.
Polonia
53699
42532
Ungaria
21960
Slovacia
17618
Romnia
12767
Slovenia
7534
Bulgaria
0
10000
20000
30000
40000
50000
60000
Frecvene
absolute
Frecvene
cumulate
cresctor
Frecvene
cumulate
descresctor
10
10
73
30 40
14
24
63
40 50
25
49
49
50 60
16
65
24
60 70
73
Total
73
42
30
25
Numr angajai
25
20
16
14
15
10
10
5
0
20 30 30 40 40 50 50 60 60 70
Vrsta (ani)
Numr angajai
70
73
65
63
60
50
49
49
24
24
40
30
20
10
10
0
20
30
40
50
60
70
Vrsta (ani)
Frecvene cumulate cresctor
Frecvene cumulate descresctor
Capitolul 2
43
Tabelul nr. 19 (date convenionale)
Trimestrul
II
III
IV
Media
trimestrial
343
487
406
364
400
Trim. II
Trim. I
Trim. III
Trim. IV
ian
15
dec
febr
10.2
10.3
10
10.1
noi
8.9
9.6
8.7
10.3
10.2
mar
9.5
oct
8.9
10.3 9.3
10.4
apr
9.1
10.4
9.4
sept
10.5
9.3
10.4
9.3
mai
10.5
10.5
aug
iun
iul
mii $ SUA
Rezumat
Acest capitol prezint noiunile de baz legate de : sistematizarea datelor sub form de
grupe omogene dup una sau mai multe caracteristici necesar calculului indicatorilor
statistici, prezentarea datelor sub form de tabele, serii, grafice.
44
Capitolul 3
45
Capitolul 3
Tema
Obiectivele
Mijloace
- citire/nvare
- ntrebri, probleme ce apar, explicaii
- definiii, explicaii ce trebuie reinute
- situaii economice concrete, supuse analizei, exemple (sub
lup)
Evaluarea
Timp de lucru
necesar
Finalitatea
46
n sensul cel mai larg, orice expresie numeric obinut ntr-un proces
concret de cercetare se numete indicator statistic.
Dup etapa n care apar n procesul de cunoatere statistic, indicatorii pot fi: primari
i derivai.
Indicatorii primari se obin n cadrul prelucrrii primare a datelor statistice ca urmare
a procesului de centralizare a datelor unei observri statistice. Ei au coninut concret i form
concret de exprimare. De exemplu, volumul produciei la nivelul unei ntreprinderi se
exprim fie n uniti naturale, natural-convenionale, de timp de munc sau valorice i
dimensioneasz din acest punct de vedere ntreprinderea pe o anumit perioad de timp. Din
aceast cauz indicatorii primari se mai numesc i indicatori absolui i constituie baza
informaional a cunoaterii statistice.
Indicatorii derivai se obin n faza de prelucrare statistic a mrimilor absolute prin
aplicarea variatelor metode i procedee de calcul statistic (comparaii, abstractizri,
generalizri).
Indicatorii derivai au menirea de a pune n lumin i de a face posibil analiza
aspectelor calitative ale fenomenelor i proceselor cercetate. n acest scop, ei exprim: relaii
cantitative dintre diferitele caracteristici statistice, dintre diferitele pri ale unei colectiviti
sau dintre fenomenele ce se gsesc ntr-un anumit grad de interdependen; valorile tipice care
se formeaz n mod obiectiv n cadrul aceleiai perioade de timp sau n dinamic; gradul i
forma de variaie a caracteristicilor cercetate; legturile de interdependen dintre fenomene;
tendina obiectiv de manifestare a fenomenelor; rolul i contribuia diferiilor factori la
formarea i modificarea mrimii unui fenomen complex etc.
2. Indicatori statistici calculai sub form de mrimi relative
Indicatorii relativi se obin prin aplicarea unui model de comparaie sub form
de raport. n statistica social economic, prin mrime relativ nelegem rezultatul raportrii a
doi indicatori statistici absolui. Indicatorul din numrtorul raportului se numete indicator
raportat, iar cel din numitor, indicator baz de raportare.
Capitolul 3
47
Alegerea formei de exprimare se face astfel nct mrimile relative s fie sugestive.
Putem folosi n acest scop: coeficieni, procente, promile, prodecimile, procentimile. Folosirea
coeficienilor se face atunci cnd ordinul de mrime al celor doi indicatori este apropiat i
numrtorul este mai mare dect numitorul. De exemplu, avem o unitate comercial cu dou
puncte de desfacere, A i B. Prin punctul A s-a defcut n luna iunie, 300 mii RON, iar prin
punctul B, 600 mii RON. Comparaia se poate face lund pe rnd ca baz fiecare din cele
dou puncte de desfacere i obinem doi coeficieni.
K
i
A/ B
B/ A
x
x
x
x
300
0,5
600
600
2
300
B
B
A
Evident c n acest caz cel de al doilea raport este mai sugestiv dect primul, adic n
punctul B s-a vndut de dou ori mai mult dect n punctul A. Dac vrem s facem mai
0,5 100
sugestiv primul raport l exprimm procentual:
50% .
100
n cazul n care indicatorul din numrtorul raportului este cu mult mai mic dect cel
din numitorul acestuia, mrimea relativ corespunztoare se exprim n promile, adic
rezultatul raportului se nmulete cu 103. n acest fel se exprim indicatorii cu care se
caracterizeaz micarea natural a populaiei. De pild,
natalitatea
numarul decedatilor
1000 x % o
numarul mediu al populatiei
Dac numrtorul este i mai mic comparativ cu numitorul, mrimea relativ se poate
exprima n prodecimile. De exemplu, numrul studenilor la 10.000 locuitori, numrul de
medici sau paturi de asisten medical la 10.000 locuitori etc. Aceast exprimare se poate
evita dac are sens s inversm raportul. De exemplu, putem spune, fie numrul de medici ce
revine la 10.000 locuitori, fie numrul de locuitori care revine la un medic. Sensul
interpretrii va fi i el inversat. Se apreciaz c populaia unei ri are un standard de via mai
ridicat dac are mai muli medici la 10000 de locuitori, respectiv dac are mai puini locuitori
la un medic.
Mai rar se ntlnesc exprimri n procentimile, cte uniti din indicatorul raportat
revin la 100.000 uniti din baza de raportare. Acest mod de exprimare este specific pentru:
reeaua colar, reeaua de circulaie a mrfurilor, reeaua sanitar din mediul rural.
n funcie de scopul analizei i de informaiile de care dispunem, n statistica social
economic se calculeaz urmtoarele tipuri de mrimi relative:
mrimi relative de structur;
mrimi relative de coordonare sau coresponden;
mrimi relative ale dinamicii;
mrimi relative ale intensitii.
mortalitatea
Mrimile relative de structur se pot calcula de fiecare dat cnd s-a aplicat metoda
gruprii prin urmare calculul lor este posibil atunci cnd colectivitatea este separat pe dou
sau mai multe grupe. De exemplu, presupunem, c o colectivitate este mprit n k grupe. n
acest caz se pot calcula mrimi relative de structur, cu sensul de greuti specifice sau
48
ponderi, raportnd indicatorii absolui calculai pe grupe la acelai indicator calculat pe total
colectivitate.
k
nivelul absolut
i 1
x ; g x
x
... g
x
x
x
*
i 1
g
i 1
i 1
i 1
respectiv:
k
g
i 1
*
i (%)
*
i
f
i 1
A/ B
x
x
A
B
si K
B/ A
x
x
B
A
Capitolul 3
49
k i/ 0
x
1
.100 .100;
x0
0
x
x
x
x
.100....
x
x
.100
b) mrimi relative ale dinamicii cu baz mobil (variabil sau n lan) pe baza relaiei:
x
1
.100 .100;
x0
i 1
x
x
k i / i 1
x
x
.100....
.100
k 1
x
x
n primul caz putem stabili, pe baza mrimilor relative ale dinamicii calculate,
cuantumul modificrilor fa de o baz de referin semnificativ, iar n cel de-al doilea caz
ritmicitatea cu care se modific fenomenul studiat.
n activitatea economico-social mrimea relativ de dinamic se numete indice.
Mrimile relative ale dinamicii se exprim sub form de coeficient i cel mai adesea
procentual.
Mrimile relative ale dinamicii se reprezint grafic prin cronograme (historiograme).
Mrimile relative de intensitate se calculeaz ca raport ntre doi indicatori absolui
de natur diferit ntre care exist o relaie de interdependen. Un exemplu de mrime
relativ de intensitate poate fi nivelul productivitii muncii (W), calculat ca raport ntre
nivelul produciei (q) i timpul de munc consumat pentru producerea acesteia W q .
y
z
Probleme rezolvate
De la trei magazine ale unei societi s-au cules date referitoare la salariul mediu pe
magazin i numrul angajailor, prezentate n tabelul de mai jos:
Tabelul nr.1
Magazine
M1
M2
Salar mediu
(RON/angajat)
aug. 2004
aug. 2005
530
570
620
620
Numr angajai
aug. 2004
aug. 2005
25
25
31
33
Fondul de salarii
(RON)
aug. 2004 aug. 2005
13250
14250
19220
20460
50
M3
TOTAL
580
560
24
80
20
78
13920
46390
11200
45910
Aug. 2005
25/78*100 = 32,05%
33/78*100 = 42,31%
20/78*100 = 25,64%
30.00%
31.25%
38.75%
M1
M2
M3
41.43%
30.01%
28.56%
M1
M2
M3
Capitolul 3
51
mrimi de coordonare
pentru caracteristica salar mediu se pot face comparaii ntre salariile medii ale
celor trei magazine:
530
620
K M1/ M 2
0,85
sau K M 2 / M 1
1,169
620
530
Salariul mediu a fost n august 2004 de 1,169 ori mai mare la magazinul M2
dect la magazinul M1.
numrul angajailor n august 2004 a fost de 1,24 ori mai mare (31/25 = 1,24)
la magazinul M2 fa de M1
fondul de salarii a fost de 1,45 ori mai mare (19220/13250 = 1,45) la
magazinul M2 fa de M1
mrimi de dinamic
salar2005
100
pentru caracteristica salar mediu I 2005 / 2004
salar2004
Tabelul nr.3
%
%
I 2005
/ 2004 100
M1
570/530*100 = 107,55
7,55%
M2
620/620*100 = 100,00
0%
M3
560/580*100 = 96,55
-3,45%
Tabelul nr.4
%
%
I 2005
/ 2004 100
M1
100
0%
M2
106,45
6,45%
M3
83,33
-16,67
Fond 2005
100
Fond 2004
Tabelul nr.5
%
%
I 2005
/ 2004 100
M1
107,55
7,55%
M2
106,45
6,45%
M3
80,46
-19,54
52
mrimi de intensitate
xa
i 1
unde:
n
xi - reprezint nivelurile individuale ale variabilei;
n
i 1
Capitolul 3
53
calcul toate valorile individuale trebuie s se in seama i de frecvena lor de apariie iar
media se va calcula ca o medie ponderat utiliznd formula:
k
x f
i i
i 1
k
i 1
nxc
xc
n
n
b) mrimea mediei aritmetice este ntotdeauna o valoare cuprins n intervalul de
variaie al variabilei:
xmin x xmax
n cazul seriilor de repartiie pe intervale de variaie
xl x x L unde:
xl - limita inferioar a primului interval
xL - limita superioar a ultimului interval.
Dac media se plaseaz n afara acestor limite, rezultatul este n mod sigur eronat.
c) n cazul unei serii de distribuie cu frecvene, media se ncadreaz ntre valorile
extreme ale variabilei oscilnd n jurul termenului cu frecvena cea mai mare.
d) suma abaterilor nivelurilor individuale ale variabilei aleatoare de la media lor este
egal cu zero:
x
i 1
n
n
(x
n
i
i 1
x ) x i nx x i n
i 1
i 1
i 1
(x
i 1
k
i
x ) f i xi f i x f i xi f i f i
i 1
i 1
i 1
i 1
fi
i 1
k
(pentru
seria
i 1
frecvene).
Proprietile de la punctele a-d permit verificarea exactitii calculelor.
de
54
6
7
8
9
TOTAL
15
25
15
5
65
90
175
120
45
455
Centrul intervalului
Xi
absolute
( fi )
2,5
7,5
12,5
17,5
22,5
27,5
32,5
37,5
k
i 1
xi f *i
xi fi
( f *i )
10
40
60
80
50
30
20
10
300
Produse de frecvene
relative
%
3,33
13,33
20,00
26,67
16,67
10,00
6,67
3,33
100
f
i 1
*
i
x
i 1
8,325
99,975
250,000
466,725
375,075
275,000
216,775
124,875
1816,75
k
25
300
750
1400
1125
825
650
375
5450
i
fi
f i*
i 1
xi fi
xi f *i
Capitolul 3
55
i 1 x i
k
f
xh
i 1
i 1 xi
Media armonic ponderat se folosete de exemplu la calculul indicelui mediu de grup
al preurilor (cnd lipsesc informaii privind volumul fizic al mrfurilor) la calculul salariului
mediu pe ntreprinderi cnd cunoatem salariul mediu i fondul de salarii la nivelul seciilor;
la calculul produciei medii la hectar la o cultur n cadrul unei asociaii agricole cnd se
cunosc recolta medie i recolta total pe parcelele acesteia.
k
Echipa
1
Salariul mediu
RON/ang.
xi
540
Tabelul nr.8
Fondul de salarii
RON
xifi
6480
56
2
558
11160
635
14605
600
9000
Total
41245
x
xh
fi
i 1
x
i 1
41245
589,21 RON/ang.
1
1
1
1
6480
11160
14605
9000
540
558
635
600
xi f i
x
xp
2
i
i 1
x
xp
2
i
fi
i 1
k
f
i 1
Capitolul 3
57
x g x g x g ... x g x i
i 1
n
x1 x 2 ... x n x i
i 1
x gn xi x g n
i 1
i 1
n cazul unei serii de distribuie de frecvene, fiecare termen trebuie s fie luat n
funcie de frecvena sa.
Deci vom avea:
k
f1
1
f2
2
x , x ..... x
fk
k
xi f i
i 1
k
f1
g
f2
g
x x ..... x
fk
g
xif i
i 1
Restrngnd obinem:
k
(xg )
fi
i1
x if i
i1
k
xg
i1
fi
x if i
i1
Media geometric se folosete cel mai frecvent n cazul seriilor dinamice, la calculul
mediilor din mrimile relative ale dinamicii, ntre care exist o relaie de produs. Se folosete
la calculul indicelui mediu de dinamic.
ntre mediile prezentate exist urmtoare relaie de ordine:
xh x g xa x p
3.2 Mediana
Mrimile medii dei reflect ceea ce este esenial i tipic n nivelul de dezvoltare a
fenomenului nu caracterizeaz modul de repartiie a frecvenelor n cadrul seriei.
De aceea, pentru completarea analizei seriilor de distribuie este necesar s se
calculeze i anumite valori medii de poziie sau medii de structur, printre care mediana i
modul sunt cele mai frecvent utilizate.
58
egale: 50% din numrul termenilor vor fi mai mici dect Me i 50% se vor plasa peste
valoarea ei.
Indiferent de tipul seriei (simpl = date negrupate sau cu frecvene = date grupate) la
calculul medianei se cer rezolvate dou aspecte:
aflarea locului medianei;
calculul valorii medianei.
a) Datele sunt cunoscute individual.
n 1
n cazul serilor simple locul medianei se afl dup relaia: locul Me
unde n
2
reprezint numrul termenilor seriei.
Determinarea medianei necesit ordonarea prealabil cresctoare sau descresctoare a
termenilor seriei.
Dac numrul termenilor este impar (n = 2p+1) mediana este termenul de rang p+1
(valoarea termenului central).
Fie de exemplu, o serie format din urmtorii nou termeni: 8, 8, 9, 9, 9, 10, 10, 13,
14. n acest caz mediana este a cincea valoare, adic Me = 9, adic valoarea termenului
indicat de locul medianei (9+1)/2 = 5.
Dac numrul termenilor este par, adic n = 2p, orice valoare cuprins ntre termenul
de rang p i termenul de rang p+1 poate fi considerat ca o median. n general, s-a convenit
s se ia ca valoare a Me centrul acestui interval, adic media aritmetic a termenilor de rang p
i p+1.
De exemplu, dac se consider o serie format din valorile: 8, 9, 9, 10, 12, 13, 13, 14,
15, 16 mediana este situat ntre termenul cinci i ase i este egal cu media aritmetic simpl
a valorii lor adic Me = (12+13)/2 = 12,5
b) Datele sunt grupate pe intervale de valori (clase) i n consecin i pierde
individualitatea.
n acest caz determinarea medianei se poate face numai dac recurgem la o ipotez
suplimentar: admitem c exist o distribuire uniform a datelor n intervalul fiecrei clase.
Astfel n prealabil se procedeaz la o interpolare liniar adic se mparte ntregul interval de
valori n intervale egale.
f
Locul medianei n cazul datelor grupate locul
Me
i 1
200 1
100,5 .
2
Mediana este situat ntre valorile 100 i 101. Coloana frecvenelor cumulate ne indic
structura acestor valori n intervalul 32 - 36. Cum n acest interval sunt situate 60 de uniti
este necesar s repartizm proporional aceste 60 de uniti n intervalul de variaie egal cu 4
i s identificm a 100 -a i 101-a valoare, care fac parte din grupa de 60. Cu alte cuvinte este
necesar s procedm n continuare la calculul valorii medianei.
Capitolul 3
59
Numrul
societilor
20
35
40
60
32
8
5
200
descresctor
200
180
145
105
45
13
5
i
2
i 1
Me x 0 h
fm
h - mrimea intervalului median;
Me 1
i 1
60
200
175
150
125
y 100
75
50
25
0
20
24
28
32
36
40
44
48
Me
250
200
150
100
50
0
20
24
28
32
36
40
44
48
Me
Capitolul 3
61
fi 8
7
6
5
4
3
2
1
0
0
Mo
Figura 3
xi
62
fi
8
7
6
5
4
3
2
1
0
0
In te r v a l m o d a l
xi
Figura 4
Dac seria prezint dou frecvene maxime identice alturate se definete un interval
modal (vezi fig. 4) fr a putea preciza v aloarea exact a modului.
Dac seria prezint dou sau mai multe frecvene maxime aparinnd unor valori
situate la distane inegale spunem c seria este bimodal, trimodal etc.
Pentru o serie de distribuie pe intervale egale valoarea modului trebuie calculat.
Intervalul modal se consider intervalul care are frecvena cea mai mare.
n seria prezentat pentru calculul medianei intervalul modal este cuprins ntre 32-36
mii RON profit, deoarece aici frecvena este maxim (60). Cu aceste precizri se poate
proceda la calculul algebric i grafic.
a) Calculul algebric al modului se bazeaz pe relaia:
1
n care:
Mo x 0 h
1 2
x0 - reprezint limita inferioar a intervalului modal;
h - mrimea intervalului modal;
1 - diferena dintre frecvena intervalului modal (f m) i a celui precedent (f m-1)
2 - diferena dintre frecvena intervalului modal (f m) i a celui urmtor (f m+1)
n seria prezentat:
Mo 32 4
(60 40)
33,67 mii RON
(60 40) (60 32)
Modul prezint o abatere fa de medie de 1,81 mii RON (31,86-33,67 = -1,81). Fiind
negativ aceast abatere arat c frecvenele termenilor mai mici sunt mai numeroase, n
comparaie cu frecvenele termenilor mai mari. Media s-a calculat utiliznd formula:
x i f i 6372 31,86 mii RON profit/societate
x
f i 200
b) Pe grafic, valoarea modal se determin folosind histograma prin dreptunghiuri:
Capitolul 3
63
64
Cuartilele sunt acele valori ale caracteristicii, care separ seria n patru
pri egale:
cuartila inferioar, notat cu Q 1, este mai mare dect 25% din termenii
seriei i mai mic dect 75% dintre ei;
cuartila a doua Q 2 coincide cu Me i separ seria n dou pri;
cuartila superioar Q 3 este mai mare dect 75% din numrul
termenilor i mai mic dect 25% din numrul lor.
Locul cuartilei
loc Q1
1
( f i 1)
4
Q2 Me
loc Q3
3
( f i 1)
4
3
(fi 1) fpQ3
Q3 x0 h 4
fQ31
n care:
fpQ1 si
l ocup Q1 i Q3
fQ1 si
fQ2
Capitolul 3
65
200 1
50,25 ; intervalul cuartilei este 24 28
4
50,25 20
Q1 24 4
27,45 mii RON
35
3 (200 1)
Locul Q3 este
150,75 ; intervalul cuartilei este 32 36
4
Locul Q1 este
Q3 32 4
150,75 95
35,71 mii RON
60
4. Indicatorii variaiei
66
x
d
i 1
n
pentru o serie de frecvene absolute:
Capitolul 3
67
k
x
d
x fi
i 1
k
i 1
x
d
x f *i %
i 1
100
pentru o serie cu frecvene relative, exprimate sub form de coeficieni:
k
d xi x f i *
i 1
(x
x)2
i 1
n
pentru o serie de frecvene absolute:
k
(x
x)2 fi
i 1
k
i 1
(x
x ) 2 fi%
i 1
100
pentru o serie cu frecvene relative, exprimate sub form de c oeficieni:
k
(x
x ) 2 f *i
i 1
68
100
x
Coeficientul de variaie se mai poate calcula i dup relaia:
d
v 100
x
Coeficientul de variaie se exprim de regul, n procente, ceea ce nseamn c el este
de fapt expresia relativ fie a lui d , fie a lui .
Semnficaie: cu ct nivelul lui v este mai apropiat de zero, cu att variaia este mai
slab, colectivitatea este mai omogen, media avnd un grad ridicat de reprezentativitate; cu
ct valoarea sa este mai departe de zero cu att variaia este mai intens, colectivitatea este
mai eterogen, iar media are un nivel de semnificaie mai sczut. Se apreciaz c, n cazul
unui coeficient de peste 35-40%, media nu mai este reprezentativ i datele trebuie s fie
separate n serii componente, pe grupe, n funcie de variaia unei alte caracteristici de
grupare. Se poate afirma c acest indicator (coeficientul de variaie) poate fi folosit ca un test
de verificare n aplicarea metodei gruprii.
Dei indicatorul - coeficientul de variaie - nltur dezavantajele prezentate de i
d i acest indicator are limitele lui. Astfel, acest coeficient este n mod evident neadecvat n
cazul n care media aritmetic este apropiat de zero.
Dei n literatura de specialitate coeficientul de variaie se calculeaz de cele mai
multe ori prin relaiile menionate (media fiind indicatorul care respect cele mai multe din
condiiile impuse de Yule), acest indicator se poate calcula i nlocuind media cu mediana sau
modul.
d
v
100; v
100; v
100; v
100;
Me
Me
Mo
Mo
Un alt indicator sintetic al variaiei, cu o larg utilizare n analiza statistic a
fenomenelor, este dispersia.
Dispersia unei caracteristici se noteaz cu ( 2 ) i se calculeaz ca o medie
aritmetic simpl sau ponderat a ptratelor abaterilor termenilor fa de media lor.
Formulele de calcul sunt:
pentru o serie simpl:
v
(x
x)2
i 1
n
pentru o serie de frecvene absolute:
k
(x
x)2 fi
i 1
k
i 1
Capitolul 3
69
k
(x
x ) 2 fi%
i 1
100
pentru o serie cu frecvene relative, exprimate sub form de coeficieni:
2 ( xi x ) 2 f * i
i 1
Nr.
intrep.
(fi)
Centrul de
interval
(x i)
20
35
40
60
32
8
5
200
xi x f i
22
26
30
34
38
42
46
197,20
205,10
74,40
128,40
196,48
81,12
40,40
953,40
xi x f i
( xi x ) 2 f i
1944,392
1201,886
138,384
274,776
1206,387
822,557
999,698
6588,080
x
x
fi
i 1
k
6372
31,86 mii RON/ntreprindere
200
i 1
x
d
x fi
i 1
f
i 1
Dispersia:
953,4
4,767 mii RON profit/ntreprindere
200
( xi x ) 2 f i
70
(x x)
f
i
fi
6588,08
32,94
200
i 1
(x
x)2 fi
i 1
i 1
Coeficientul de variaie:
v 100 18,01%
x
Pe baza rezultatelor obinute se poate afirma c media este reprezentativ pentru seria
din care s-a calculat, deoarece s-a obinut un coeficient de variaie (18,01%) iar cele mai
60
multe valori (
100 30%) se concentreaz n intervalul 32-36 mii RON.
200
5. Media i dispersia caracteristicii alternative
P
N (N M)
N
Se observ c media caracteristicii alternative reprezint tocmai frecvena relativ a
rspunsurilor afirmative.
Capitolul 3
71
Tabelul nr.12 Distribuia de frecvene a caracteristicii alternative
Valoarea
caracteristicii
Rspunsul
nregistrat
Frecvene absolute
Frecvene
relative
x1 = 1
DA
x2 = 0
NU
Total
M
N
NM
1 p
N
p+q = 1
2p
(1 p) 2 p (o p) 2 q
pq
2p
q 2 p p 2 q p q ( q p)
p q p (1 p)
pq
pq
deci
2p p q sau 2p p (1 p)
Dispersia caracteristicii alternative este egal cu produsul dintre cele dou frecvene
relative.
Abaterea medie ptratic se determin potrivit metodologiei clasice - ca rdcin
ptrat din dispersie:
pq
Aceti indicatori sunt folosii pe scar larg n cercetrile selective i mai ales n
controlul statistic al calitii produselor.
6. Asimetria
72
ntr-o distribuie simetric cei trei indicatori: mod, median i media artimetic se
confund ca n diagrama (a).
Mo
Mo Me x
(a)
Me
(b)
Me Mo
(c)
As x Mo
Se exprim n unitile de msur ale variabilei i nu poate fi folosit la comparaii
ntre serii.
De aceea, pentru a msura gradul de asimetrie, recurgem la indicatorii de asimetrie
relativi. Din acest grup reinem un anumit numr de coeficieni, adic numere fr
dimensiune, permind comparaiile.
Prezentm n continuare trei coeficieni de asimetrie ce poart numele autorilor lor,
Pearson i Yule.
Karl Pearson, statistician britanic propune la nceputul secolului pentru msurarea
asimetriei trei coeficieni:
Capitolul 3
73
Cas 0 simetrie
x Mo
c as
Cas 0 serie oblic la stnga
Acest
coeficient
poate
lua
valori
cuprinse
ntre
-1
i
+1; cu ct este mai mic n valoare absolut cu att asimetria este mai mic.
De reinut: acest coeficient este recomandabil a se folosi numai pentru distribuii uor
asimetrice.
n cazul cnd se cunoate mediana seriei, coeficientul de asimetrie (Cas ) se poate
calcula utiliznd relaia:
3( x Me)
Cas
Acest coeficient se folosete cnd ntre cei trei indicatori ai tendinei centrale se
verific relaia:
Modul = Media - 3(Media - Median)
Acest coeficient poate s ia valori cuprinse ntre -3 i +3 i va arta un grad mai mare
de simetrie cu ct se va apropia mai mult de 0.
Pearson mai propune i un alt coeficient pentru calculul gradului de asimetrie al unei
serii format dintr-un numr foarte mare de observaii:
( xi x ) 3 f i
2
3
fi
3
Cas 3 unde
2
( xi x ) 2 f i
2 dispersie
2
fi
Se observ c primii doi indicatori propui de Pearson (i cei mai utilizai) se bazeaz
pe relaia care exist ntre cele trei valori ale tendinei centrale. Dar, asupra asimetriei
influeneaz i celelalte valori medii de poziie. Pentru a ine seama i de influena cuartilelor
se folosete coeficientul propus de Yule, calculat dup formula:
(Q Me) ( Me Q1 )
As 3
(Q3 Me) ( Me Q1 )
74
Dac:
As 0 simetrie
Dac acest coeficient se apropie de 0,1 se apreciaz c seria este moderat asimetric,
iar peste 0,3 se consider c seria este pronunat asimetric.
Rezumat
n concluzie, indicatorii utilizai n statistic sunt extrem de numeroi i cu
metodologii variate de calcul sub form de mrimi relative, mrimi medii, indicatori ai
variaiei absolui, relativi i medii, indici, indicatori ce caracterizeaz corelaia etc. Fiecare
dintre aceti indicatori exprim anumite trsturi ale colectivitii i numai prin utilizarea
combinat a indicatorilor absolui i derivai se ajunge la cunoaterea multilateral a
fenomenelor studiate n continua lor dezvoltare.
Termeni importani: indicator statistic, forme de exprimare, mrime relativ, mrimi
de structur, mrimi de coordonare, mrimi de dinamic, mrimi de intensitate, media
aritmetic, media armonic, media ptratic, media geometric, mediana, modulul, cuartilele,
amplitudinea, abateri individuale, abaterea medie liniar, abaterea medie ptratic, dispersia,
coeficientul de variaie, coeficient de asimetrie
Teste de autocontrol:
1. Definii mrimile relative.
2. Ce forme de exprimare cunoatei ?
3. Ce sunt mrimile de structur ? Exemple.
4. Ce sunt mrimile de coordonare ? Exemple.
5. Definii indicii de evoluie.
6. Ce sunt mrimile de intensitate ? Exemple.
7. Ce sunt mrimile medii ?
8. Ce tipuri de medii cunoatei i cnd le aplicai ?
9. Care este rolul indicatorilor variaiei ?
10. Enumerai i definii indicatorii simpli.
11. Interpretai indicatorii sintetici.
12. Ce coeficieni de asimetrie cunoatei ?
Capitolul 3
75
Probleme propuse
1. La un hotel de patru stele s-au nregistrat datele:
Tip
camer
Dubl
Single
Garsonier
Apartament
Nr. nnoptri
Aprilie 2007
Aprilie 2008
250
237
110
115
15
15
7
5
Se cere:
a. S se calculeze valoarea tarifului la cursul zilei pentru moneda euro.
b. S se calculeze i s se interpreteze mrimile relative permise de date.
c. S se analizeze evoluia valorii ncasate.
Salariul mediu
n perioada curent (1)
(RON/pers.)
830
976
Nr. angajai
n perioada curent (1)
42
18
Dinamica fodului de
salarii (1/0)
%
105
90
Se cere:
a. Salariul mediu, pe total, n perioada curent.
b. S se reprezinte grafic structura fondului de salarii din perioada curent.
c. S se stabileasc ce alte tipuri de mrimi relative se pot calcula pe baza datelor
din enun.
3. 200 de turiti dintr-o staiune balnear au fost distribuii dup durata sejurului astfel:
Durata sejurului
(zile)
Sub 4
47
7 10
10 13
13 16
16 19
Total
Nr. turiti
15
30
45
60
30
20
200
76
Capitolul 4
Tema
Obiectivele
1. Analiza dispersional
2. Analiza ANOVA (testul Fisher - Snedecor)
3. Tesul 2
Mijloace
- citire/nvare
- ntrebri, probleme ce apar, explicaii
- definiii, explicaii ce trebuie reinute
- situaii economice concrete, supuse analizei, exemple (sub
lup)
Evaluarea
Timp de lucru
necesar
Finalitatea
Capitolul 4
77
1. Analiza dispersional
O colectivitate statistic poate fi distribuit dup dou variabile ce se afl ntro relaie de cauzalitate. Prin calculnd indicatorilor de variaie corespunztori putem preciza
dac factorul de grupare (X) este un factor hotrtor (determinant) pentru variaia factorului
Y.
n cazul n care s-a aplicat n prealabil metoda gruprii se pot calcula att medii ct i
indicatori de variaie (dispersii) pe grupe i pe total colectivitate. Media i dispersia pe
ntreaga colectivitate se pot calcula fie fcnd abstracie de faptul c ea este compus din mai
multe grupe, fie lund n calcul indicatorii corespunztori calculai la nivelul grupelor.
Aadar, ntre indicatorii de variaie calculai la nivelul fiecrei grupe i cei pe ntreaga
colectivitate exist anumite relaii bazate pe regula adunrii dispersiilor.
Presupunnd c s-au nregistrat datele pentru dou caracteristici x i i yi i unitile au
fost mprite n funcie de caracteristica x n r grupe, s-au obinut distribuiile condiionate de
factorul de grupare din tabelul 1.
Se observ c frecvenele pe fiecare grup se obin prin nsumarea frecvenelor din
interiorul grupelor, adic:
m
m
1j
n1 ;...
j 1
m
ij
ni ;...
j 1
rj
nr ;
j 1
Cele dou variabile prezentate n tabel se afl ntr-o relaie de cauzalitate i calculnd
indicatorii de variaie corespunztori putem preciza dac factorul de grupare (X) este un factor
hotrtor (determinant) pentru variaia factorului Y. De exemplu, putem analiza prin regula
de adunare a dispersiilor, n ce proporie numrul salariailor influeneaz variaia cifrei de
afaceri pentru un anumit numr de ageni economici sau n ce msur volumul desfacerilor
influeneaz salariul ncasat de un anumit numr de vnztori.
Concret, pe baza unor date prezentate n tabel se pot calcula urmtorii indicatori
statistici:
medii (pe fiecare grup i pe total);
dispersii (pe fiecare grup i pe total).
Mediile de grup se noteaz cu
i se calculeaz dup relaia:
m
y
yi
f ij
j 1
i 1, r
f
j 1
ij
78
x1
x2
...
xi
...
xr
Total
y1
y2
yj
ym
f11
f21
...
fi1
...
fr1
f1
f12
f22
...
fi2
...
fr2
f2..
f1j
f2j
...
fij
...
frj
fj
f1m
f2m
...
fim
...
frm
fm
n1
n2
...
ni
...
nr
r
( y1 )
( y2 )
...
( yi )
...
( yr )
m
n f
i
i 1
y
j
j 1
Numrul mediilor de grup este egal cu numrul grupelor n care s-a separat
colectivitatea (r grupe).
Media pe total (notat cu y 0 cnd datele provin dintr-o observare total sau y cnd
datele provin dintr-o observare parial) sintetizeaz att variaia valorilor individuale ale
colectivitii totale ct i valorile mediilor de grup (medii condiionate de factorul de
grupare). Prin urmare ea se poate calcula n funcie de datele de care dispunem dup una din
relaiile:
m
y
y
r
j
fj
j 1
j 1
sau y
yn
i 1
r
i 1
Capitolul 4
79
(y
i2
y i ) 2 f ij
j 1
ij
j 1
unde:
yj reprezint variantele caracteristicii dependente;
yi media de grup, calculat din aceste variante;
fij frecvenele corespunztoare fiecrei variante (interval de valori) din
cadrul grupei.
Dispersia de grup evideniaz variaia caracteristicii dependente (yj) determinat de
aciunea factorilor ntmpltori care acioneaz la nivelul grupei respective.
Numrul dispersiilor de grup este egal cu numrul grupelor ce formeaz
colectivitatea supus studiului.
Comparnd ntre ele dispersiile de grup putem preciza care grup este mai omogen.
Astfel, dispersia cu nivelul cel mai sczut evideniaz gradul nalt de omogenitate al grupei,
aciunea redus a factorilor nenregistrai (ntmpltori) i deci o variaie mai slab; dispersia
cu nivelul cel mai mare reflect o variaie pronunat sub aciunea intens a factorilor
ntmpltori.
Pentru a sintetiza aceast variaie ntr-un singur indicator calculat pe ntreaga
colectivitate se calculeaz media dispersiilor de grup.
dispersiilor pariale.
Dac grupele sunt egale ca volum se folosete media aritmetic simpl, dac volumul
difer de la o grup la alta se calculeaz ca o medie aritmetic ponderat utiliznd relaiile:
r
r
2
i2
i 1
sau
2
i i
i 1
r
i 1
unde:
i2 - dispersii de grup;
ni - volumul grupelor.
Dispersia dintre grupe
80
r
2y 2
(y
y ) 2 ni
i 1
r
i 1
(y
20 2y
y)2 f j
j 1
m
j 1
2y
R y2
x
2
0
2
y
x
100
2y
K y2
r
100
2
x
0
Acest coeficient arat cte procente din variaia factorului yj este rezultatul aciunii
tuturor factorilor ntmpltori (toi ceilali cu excepia factorului de grupare).
Menionm c n cazul seriilor statistice formate pe baza frecvenelor relative, n
formulele de calcul ale dispersiilor prezentate se vor nlocui frecvenele absolute cu
frecvenele relative corespunztoare. n acest caz este necesar s se cunoasc att structura
seriilor componente ct i structura pe grupe a colectivitii totale.
Capitolul 4
81
Repartiia agenilor economici din sectorul de activitate A
dup numrul mediu de salariai i profitul obinut
Tabelul nr. 2
Ageni
economici
dup
numrul
mediu
de
salariai
sub 10
10 - 50
50 i peste
Total
12 - 16
5
5
16 - 20
15
10
25
20 - 24
5
10
15
24 i peste
5
5
Total
25
20
5
50
f ij
j 1
yi
ij
j 1
14 5 18 15 22 5
18 mii RON /agent economic
25
18 10 22 10
y2
20 mii RON/agent economic
20
26 5
y3
26 mii RON/agent economic
5
media total:
y1
fj
j 1
14 5 18 25 22 15 26 5
19,6 mii RON /agent economic
50
j 1
sau :
r
yn
i
i 1
r
18 25 20 20 26 5
19,6 mii RON /agent economic
50
i 1
Dispersiile de grup:
82
2
i i
i 1
6,4 25 4 20 0 5
4,8
50
i 1
2y 22
x
(y
y ) 2 ni
i 1
i 1
5,44
Din comparaia celor dou tipuri de dispersii ( 2
si 2 ) rezult c la nivelul
2y
5,44
100 53,125% 50%
10,24
x
evideniaz c cea mai mare parte a variaiei cifrei de afaceri (53,125%) este rezultatul
creterii numrului mediu al salariailor, restul de 46,875% fiind rezultatul aciunii simultane
a factorilor neluai n calcul.
Coeficientul
de
determinaie
R y2
x
2
0
100
Capitolul 4
83
(x
x) 2
i 1
este un
n 1
estimator nedeplasat al dispersiei cu n-1 grade de libertate. Valorile x1, x2, , xn au intrat n
n
x
i 1
Indicatori
Formule de calcul
Variana
sistematic
S1 ( yi y0 ) 2 ni
Grade
de
liberta
te
r-1
i 1
Variana
rezidual
Variana
total
s12
S1
r 1
s22
S2
nr
Fcalc
s12
2
s2
S 2 ( y j y i ) 2 f ij
n-r
S S1 S 2
n-1
i 1 j 1
Valoarea Fcalc se compar cu valoarea teoretic Ft extras din tabel pentru nivelul de
semnificaie ales i (r-1) respectiv (n-r) grade de libertate. Regula de decizie este
urmtoarea:
84
P( Fcalc Ft )
H0
Ft
H1
Ageni
economici dup nr.
mediu de salariai
sub 10
10 - 50
peste 50
Total
Total
25
20
5
50
Tabelul nr. 4
Profitul mediu pe
grupe de ageni
economici
RON/ag.ec.
18
20
26
19,6
Estimarea dispersiilor:
s12
272
240
136 i s 22
5,10
3 1
50 3
Criteriul F:
Fcalc
136
26,633
5,10
Fcalc
Ft 2 ; 47 ; 0 , 05
este 3,23.
Capitolul 4
85
Coeficientul de determinaie
3. Tesul 2
Volumul
grupelor
X
y1
yj
yq
x1
n11
...
n1j ...
n1q
n1.
...
...
...
...
...
...
xi
ni1
...
nij ...
niq
ni.
...
...
...
...
...
...
xp
np1
np2
npj
npq
np.
Total
n.1
n.2
n.j
n.q
86
Frecvenele nij reprezint numrul unitilor statistice purttoare ale valorilor (X i,Yj).
Frecvenele ni. reprezint distribuia marginal pentru caracteristica x:
q
n1 . ;...
1j
j 1
ij
n i . ;...
j 1
pj
n p. ;
j 1
i1
n.1 ;...
ij
i 1
n. j ;...
i 1
iq
n.q ;
i 1
Cu ajutorul testului 2 se poate analiza dac dou variabile sunt dependente sau
independente, garantnd rezultatele cu o probabilitate dinainte stabilit. Pentru a verifica acest
lucru pornim de la ipotezele:
H0: variabile independente ipoteza nul, cu alternativa
H1: variabile dependente.
Dou variabile sunt independente dac sunt ndeplinite condiiile:
nij
n. j
ni .
n
sau
nij
ni .
n. j
n
ntij
2
calc
n. j ni.
n
Pentru a verifica dac cele dou variabile sunt independente se calculeaz mrimea
cu formula:
p
2
calc
i 1 j 1
Valoarea
2
calc
(nij ntij ) 2
ntij
se compar cu valoarea teoretic
t2 ,
( p 1) (q 1) grade de libertate.
2
Dac valoarea calc
t2 , atunci, se respinge ipoteza H 0 i se admite alternativa ei H1,
variabilele sunt dependente.
Capitolul 4
87
P( 2 calc 2 t )
t2
H0
H1
80
85 45,3
150
n12
80
65 34,7
150
n 21
70
85 39,7
150
n 22
70
65 30,3
150
2
calc
42,191
45,3
34,7
39,7
30,3
2
Valoarea calc
t2 , se respinge ipoteza H0 i se admite alternativa ei H1, variabilele
sunt dependente.
88
Rezumat
Probleme propuse
1. Angajaii unor uniti hoteliere au fost distribuii dup categoria hotelului i salar
astfel:
Grupe dup salarii
( RON)
Sub 550
550-570
570-590
590-610
610-630
630-650
650-670
670 i peste
Hotelul *
Hotelul **
10
12
25
28
15
10
100%
20
35
20
15
10
100%
Capitolul 4
89
mari
mijlocii
mici
25-35
35-45
45-55
10
5
7
9
-
9
6
-
Total
500 - 600
15%
90%
600 - 700
25%
50%
10%
peste 700
75%
35%
-
100%
100%
100%
Se cere:
a. Aplicnd regula de adunare a dispersiilor, s se analizeze aciunea factorilor
asupra salariilor.
b. Pentru caracteristica vechime n munc s se determine modulul i coeficientul
de asimetrie .
90
Ai vzut reclama la
produsul X ?
Da
Da
Nu
Total
Total
80
70
150
Frecvena de
vizitare a
Braovului
Prima oar
A doua oar
A treia oar
A patra oar i
peste
sub 25
26-35
7
5
8
6
8
7
8
7
Vrsta (ani)
36-45
46-55
6
6
9
8
7
6
10
9
56-65
peste 66
6
5
6
6
6
5
6
5
Grupe de vrst
sub 20 ani
20-35
36-50
peste 50
215
183
293
192
347
231
265
274
Capitolul 5
91
Capitolul 5
Tema
Regresie i corelaie
Obiectivele
Mijloace
- citire/nvare
- ntrebri, probleme ce apar, explicaii
- definiii, explicaii ce trebuie reinute
- situaii economice concrete, supuse analizei, exemple (sub
lup)
Finalitatea
Evaluarea
Timp de lucru
necesar
Regresie i corelaie
92
Regresie i corelaie
Capitolul 5
93
Regresie i corelaie
94
2.1 Calculul coeficienilor de regresie
Y x
Necunoscnd parametrii teoretici i , vom cuta estimaiile lor a i b. Dreapta de
regresie estimatoare este:
y a bx
Ecuaia de regresie y se noteaz, de obicei ca medie, deoarece mrimea sa exprim
tendina de realizare a corelaiei dintre cele dou variabile x i y. Dac, ntr-adevr, legtura
este liniar i factorul este determinant, atunci valorile ecuaiilor de regresie, calculate pentru
toate unitile observate pe baza valorii individuale ale variabilei x, trebuie s prezinte abateri
minime fa de valorile empirice. Pentru msurarea tendinei de realizare a legturii, n ecuaia
mediei de regresie liniar cei doi parametri au i ei coninut de valori medii i trebuie s fie
reprezentativi pentru cele mai multe din unitile observate.
Parametrul a are caracter de mrime medie, n sensul c valoarea sa arat la ce nivel
ar fi ajuns valoarea caracteristicii y dac toi factorii - mai puin cel nregistrat - ar fi avut o
aciune constant asupra formrii ei. n acest caz valorile individuale ale caracteristicii
rezultative ar fi fost egale ntre ele i, deci, egale cu media lor.
Parametrul b se mai numete i coeficient de regresie i exprim, n sens geometric,
panta liniei drepte. Coeficientul de regresie b arat care este gradul de influen a
caracteristicii aleas drept caracteristic factorial x i msoar cu ct se schimb n medie
variabila y n cazul n care variabila x crete cu o unitate. Coeficientul de regresie arat nu
numai gradul de influen a factorului x asupra variabilei y, ci i sensul n care se realizeaz
legtura.
n cazul n care :
- b > 0, atunci legtura de corelaie este direct, deoarece pe msur ce cresc
valorile lui x, cresc i valorile ecuaiei de regresie calculate.
- b < 0, legtura este de sens invers, adic pe msur ce crete valoarea
caracteristicii - factor, scade valoarea caracteristicii rezultative.
- b = 0, cele dou variabile sunt independente ntre ele i atunci y a .
Aceasta nseamn c variabila y nu este n funcie de variabila x, care s-a
considerat ca factor de influen, ci variaia ei depinde de ceilali factori,
care s-au considerat ca fiind cu aciune constant pentru toate unitile
colectivitii, dar n realitate avem o aciune determinant.
Pentru a determina ecuaia medie de regresie, i cu ajutorul ei, valorile ecuaiei
individuale de regresie corespunztoare tuturor valorilor variabilei x, este necesar s se
calculeze valorile celor doi parametri a i b.
Dac factorul x este determinant pentru variabila y, atunci valorile estimate prin
funcia de regresie trebuie s dea abateri minime fa de cele nregistrate pentru variabila
rezultativ. Cum aceste abateri se pot produce ntr-un sens sau altul, ele sunt ridicate la ptrat
i, din aceast cauz, metoda de verificare a acestei condiii se mai numete i metoda celor
mai mici ptrate.
Cu alte cuvinte, dac y depinde de x, atunci trebuie s se ndeplineasc condiia ca
suma ptratelor abaterilor valorilor empirice de la valorile ecuaiilor lor de regresie s fie
minim:
Capitolul 5
95
n
S ( y i y ) 2 minim
i 1
[ y
(a bxi )] 2 minim
i 1
Pentru aflarea celor doi parametri care definesc ecuaia liniei drepte se deriveaz
aceast sum n raport cu derivatele celor doi parametri:
n
s
a 2 [ yi (a bxi )](1)
i 1
n
s 2 [ y (a bx )]( x)
i
i
b
i 1
na
yi
i 1
i 1
n
n
n
a x b x 2 x y
i
i
i i
i 1
i 1
i 1
y x
x y x
n
x
x x
i
i
2
i
n
b
i
2
i
2
i
2
i
y x x y x
n x ( x )
y
x y
x
x
i
2
i
n xi yi xi yi
n xi2 ( xi ) 2
Regresie i corelaie
96
Coeficientul de corelaie
( x
x)( yi y)
i 1
n x y
n x i y i x i y i
i 1
i 1
i 1
[n x i2 ( x i ) 2 ] [n y i2 ( y i ) 2
i 1
i 1
i 1
i 1
Coeficientul de corelaie poate lua valori n intervalul 1 i +1, dup cum corelaia
este negativ, invers sau pozitiv, direct. Cu ct coeficientul de corelaie ia valori mai
apropiate de 1 sau 1 cu att legtura liniar este mai intens, apropiindu-se de legtura
funcional. Dac cele dou variabile sunt independente, atunci coeficientul de corelaie este
egal cu zero.
Raportul de corelaie liniar simpl
Raportul de corelaie liniar este indicatorul care permite msurarea gradului de
intensitate a realizrii legturii dintre caracteristica considerat factor de influen i
caracteristica rezultativ, dup ce s-a aplicat metoda regresiei. Calculul su se bazeaz pe
descompunerea dispersiei totale a caracteristicii y pe factori de influen.
Ry
( y
2
y
x
2
y
y)2
(y
y)2
( y
(y
y)2
y)2
n
sau:
Ry 1
x
(y
2
y
r
2
y
y i ) 2
(y
y)2
( y y )
1
( y y)
i
n
Raportul de corelaie poate lua valori de la 0 la +1. n ceea ce privete semnul
raportului de corelaie, acesta se va determina dup semnul b din ecuaia de regresie. Dac
b este pozitiv, Ry
Ry se va lua
x
Capitolul 5
97
Ry2
i se calculeaz dup
x
formula:
Ry2
2y
x
2
y
K y2
r
2
y
(y
S y y
y i )
i 1
Sa S y y
i 1
n2
n
2
i
n
i
x)
a y i b x i y i
i 1
i 1
n2
x2
(x
S y y
Sb
i 1
(x x)
i1
tc
a0
b0
i respectiv t c
Sa
Sb
a tq Sa a tq Sa
b tq Sb b tq Sb
Resa I., Petrescu t., Precupa M., Cra Al., Probleme de statistic rezolvate pe calculator, Ed. Facla, 1984
Regresie i corelaie
98
tc
r n2
1 r2
r tq Sr
unde
Sr
1 r2
n 1
r tq Sr
Capitolul 5
99
ei
. Se poate spune c observaia i
1 hi
nu este bine reconstituit de model dac valoarea ti este foarte mare n mrime
absolut.
*
ei
(i ) 1 hi
Nr.
crt.
Cheltuieli
publicitare
(sute mii lei)
Valoarea
ncasrilor
(mil. lei)
xi
yi
5
6
9
12
18
25
30
35
45
65
1
2
3
4
5
Total
xi 50
i 1
xi y i
y i2
y i 10 3 x
25
36
81
144
324
125
180
315
540
1170
625
900
1225
2025
4225
25
28
37
46
64
y i 200
i 1
x i2
xi2 610
i 1
xi y i 2330
i 1
2
i
9000
i 1
200
i 1
Se cere:
a) s se caracterizeze i s se msoare legtura dintre variabile;
b) s se testeze semnificaia coeficienilor pentru un nivel de semnificaie 0,05 .
Sistemul de ecuaii normale devine:
5a 50b 200
5 2330 50 200
2
0,995
17,23
S b 0,1741 t c
Sb
0,1741
Regresie i corelaie
100
Se observ c valoarea variabilei t calculat este mai mare dect valoarea teoretic
17,23 > 2,353 ceea ce ne ndreptete s tragem concluzia c acest coeficient de regresie este
semnificativ diferit de zero. Intervalul de ncredere pentru coeficientul este:
5,20
Sa
1,9228
Se observ c valoarea variabilei t calculat este mai mare dect valoarea teoretic
5,20 > 2,353 ceea ce ne ndreptete s tragem concluzia c termenul liber este semnificativ
diferit de zero. Intervalul de ncredere pentru coeficientul este:
S a 1,9228 t c
S r 0,005 t c
0,995
1 0,995 2
5 2 17,23
Aceste legturi neliniare se ntlnesc mai frecvent sub forma unei parabole de
gradul 2, a hiperbolei i a funciei exponeniale.
Dac pe grafic se apreciaz c legtura statistic este de forma unei parabole de gradul
2, atunci ecuaia medie de estimare este:
y a bx cx 2
Punnd aceeai condiie, ca suma ptratelor abaterilor termenilor seriei de la valorile
teoretice s fie minim, se obine:
n
(y
i 1
Capitolul 5
101
2
na b xi c xi yi
i 1
i 1
i 1
n
n
n
n
2
2
a
x
b
x
c
x
xi yi
i i
i
i 1
i 1
i 1
i1
n
n
n
n
2
3
4
2
a xi b xi c xi xi yi
i 1
i 1
i 1
i1
y a
1
b
x
na b x yi
i 1 i
i 1
n
n
n
a 1 b 1 1 y
i
2
i 1 xi
i 1 xi
i 1 xi
Apar i cazuri cnd legtura dintre cele dou variabile este de form exponenial ca
de exemplu:
y a b
Sistemul de ecuaii normale se determin folosind logaritmii celor doi parametri "a" i
"b":
i 1
i 1
n
n
n
log a x log b x 2
xi log yi
i
i
i 1
i 1
i 1
Operaia de ajustare n acest caz se va face dup ce se vor calcula logaritmii ecuaiilor
individuale de regresie. Ajustarea dup o funcie exponenial se face prin antilogaritmarea
ecuaiilor de regresie calculate n funcie de x i.
Regresie i corelaie
102
y y
1
y y
i
Ry
( a bx i cx i2 )
Ry
x
y
1
y y
1
y y
i
1
y i (a x b)
i
1
2
yi y
Ry
x
y y
1
y y
i
y ab
1
y y
xi 2
Valoarea vnzrilor
(mii RON)
x
5,1
5,5
6,0
6,5
6,7
7,0
7,0
8,5
11,0
13,0
Nivelul relativ al
cheltuielilor de circulaie
(%)
y
8
7,2
6,8
6,4
6
5,6
5
4,6
4,2
4,2
Capitolul 5
103
9
CHELT
4
4
10
12
14
VINZARI
Method.. LINEAR
,85395
Analysis of Variance:
DF
Regression
Residuals
F=
1
8
21,54502
Sum of Squares
Mean Square
11,259261
4,180739
11,259261
,522592
Signif F = ,0017
B
-,442581
9,176893
SE B
Beta
,095350
,762589
-,853948
-4,642
12,034
Method.. INVERSE
,95148
Analysis of Variance:
DF Sum of Squares
Mean Square
Sig T
,0017
,0000
Regresie i corelaie
104
Regression
Residuals
F=
1
8
13,978011
1,461989
76,48762
13,978011
,182749
Signif F = ,0000
SE B
Beta
33,109280 3,785769
1,102268 ,553896
,951479
Sig T
8,746 ,0000
1,990 ,0818
CHELT
9
5
Observed
4
Line ar
3
Inver se
4
10
12
14
VINZARI
1
, raportul de corelaie R este
x
0,9514, valoarea F = 76,48 pentru care nivelul de semnificaie este 0,0000. ei 2 1,46 . Din
aceste rezultate deducem c modelul hiperbolic estimeaz mai bine legtura dintre cele dou
variabile.
Capitolul 5
105
4. Regresia multipl
y x1 , x2 ,...,xn a0 a1 x1 a2 x2 ... ak xk
n care:
a0 - reprezint parametrul care exprim factorii nenregistrai, considerai cu aciune
constant, n afara celor considerai drept caracteristici factoriale;
a1,a2, ... ,a k - coeficienii de regresie care arat ct se modific variabila rezultativ
dac variabila factorial respectiv se modific cu o unitate;
x1,x2, ... ,x k - caracteristicile factoriale incluse n raportul de interdependen.
Spre exemlificare se va utiliza o corelaie multipl n care se vor lua numai dou
caracteristici factoriale i una rezultativ. Avnd dou caracteristici factoriale ecuaia funciei
de regresie liniar multipl va fi:
y x1 x2 a0 a1 x1 a2 x2
al crei sistem de ecuaii normale este:
na0 a1 x1 a2 x2 y
2
a0 x1 a1 x1 a2 x1 x2 x1 y
2
a0 x2 a1 x1 x2 a2 x2 x2 y
Cunoscnd cei trei parametri ai funciei de ajustare se calculeaz pentru fiecare unitate
ecuaia de regresie pe baza valorilor x 1,x2, iar pentru verificarea calculului se aplic relaia
y y
i
i x1 x 2
y = a0 x1a1 x a2 2 ...... x ak k
care prin logaritmare devine:
Regresie i corelaie
106
y y
1
y y
Ry
x1x2 ...xk
2
x1 , x2 ...xk
coeficientul de corelaie Ry ry .
x
R2y
R2y R2y
x1,x2
x1
x2
R2y
ry2 ry2
x1,x2
x1
x2
ry2 ry2
Ry
x1 ,x2
x1
x2
r y2 ry2 2r y r y rx1x2
Ry
x1 , x2
x1
x2
x1
x2
2
x1x2
1 r
Aceast formul de calcul se folosete, n special, atunci cnd au fost deja analizate
corelaiile simple, i pe baza lor, se trece la msurarea gradului de intensitate a corelaiei
multiple. De asemenea, se folosete i pentru verificarea liniaritii funciei de estimare.
Testarea modelului global se face cu statistica:
Fcalc
n k 1 R2
k
1 R2
Capitolul 5
107
Se cunosc datele:
Indicii veniturilor reale
ale populaiei
%
cu baza fix
X1
100
112
115
124
128
130
134
135
Se cere:
1. s se studieze legtura dintre vnzrile totale de detergeni i indicii veniturilor reale;
2. s se studieze legtura dintre vnzrile totale de detergeni i indicii nzestrrii
populaiei cu maini de splat;
3. Y n funcie de X1 i X2.
Rezolvare
1.
y = 12.3x - 707.19
1200
1000
800
600
400
200
0
0
20
40
60
80
100
venituri reale %
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.98
R Square
0.96
Standard Error
30.72
Observations
8
120
140
160
Regresie i corelaie
108
ANOVA
df
1
6
7
SS
158782.545
5663.454
164446
MS
158782.5
943.9
F
168.218
Significance F
1.29E-05
Coefficients
-707.19
12.3
Standard Error
116.44
0.948
t Stat
-6.07
12.96
P-value
0.000905
1.29E-05
Lower 95%
-992.12
9.97
Regression
Residual
Total
Intercept
X Variable 1
Upper 95%
-422.2
14.62
2.
y = 7.5319x - 189.24
1200
1000
800
600
400
200
0
0
50
100
150
200
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.99
R Square
0.97
Standard Error
27.82
Observations
8
ANOVA
df
Regression
Residual
Total
Intercept
X Variable 1
1
6
7
SS
159801.15
4644.85
164446
Coefficients
-189.24
7.53
Standard
Error
69.31
0.52
MS
159801.2
774.14
F
206.4238
Significance
F
7.1179E-06
t Stat
-2.73
14.37
P-value
0.03
0.00
Lower 95%
-358.84
6.25
Upper 95%
-19.64
8.81
Capitolul 5
109
3.
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.99
R Square
0.98
Standard Error
26.17
Observations
8
ANOVA
df
Regression
Residual
Total
Intercept
X Variable 1
X Variable 2
2
5
7
SS
161022.15
3423.85
164446
Coefficients
-422.17
5.29
4.37
Standard
Error
186.22
3.96
2.42
MS
80511.07
684.77
F
117.57
Significance
F
6.255E-05
t Stat
-2.27
1.34
1.81
P-value
0.07
0.24
0.13
Lower 95%
-900.85
-4.89
-1.84
Upper 95%
56.52
15.47
10.59
Regresie i corelaie
110
5.1 Tabelul de asociere i coeficientul de asociere
Una din metodele cele mai simple ale corelaiei neparametrice o costituie coeficientul
de asociere calculat pe baza tabelului de asociere, care permite - de altfel ca i celelalte
metode neparametrice - analiza nu numai a caracteristicilor exprimate numeric dar i a
caracteristicilor calitative. Aceast metod se utilizeaz n special, cnd unitile purttoare
ale caracteristicilor sunt separate n dou grupe sau sunt de forma unor caracteristici
alternative (de tipul "da - nu").
Tabelul de asociere este format din dou rnduri i dou coloane, de forma:
y
y1
y2
x1
x2
Total
a
c
a+c
b
d
b+d
Total
x
a+b
c+d
a+b+c+d
Capitolul 5
111
pot prezenta forme diferite de distribuie, dar pot fi transformate n variabile alternative, ca de
exemplu sub i peste nivelul mediu.
5.2 Coeficienii de corelaie a rangurilor
Dup cum s-a artat, coeficienii de corelaie a rangurilor prezint avantajul c ei pot fi
utilizai i n cazul unor distribuii asimetrice, n cazul unui numr restrns de uniti pentru
care nu se poate verifica reprezentativitatea datelor pariale sau n cazul distribuiilor unor
uniti complexe.
Analiza de corelaie, n acest caz, se bazeaz pe nlocuirea valorilor empirice cu
rangurile corespunztoare, ceea ce face posibil comparaia dintre variabilele supuse
interdependenei statistice.
Aceast metod neparametric mai prezint avantajul c poate cuprinde n analiza
raporturilor de dependen dintre fenomene i caracteristici calitative, care, prin natura lor nu
se pot exprima numeric, dar pot fi "ierarhizate" pe baza unui anumit rang.
Pornind de la ipoteza c ntre cele dou serii de ranguri exist concordan, seria a
doua care reprezint rangurile caracteristicii rezultative ar trebui s se ordoneze i ea tot
cresctor, dac legtura este direct, i descresctor n raport cu prima serie de ranguri, dac
legtura este invers. n cazul existenei legturii dintre cele dou caracteristici, la aceeai
unitate observat trebuie s corespund acelai numr de uniti care au rang mai mare sau
mai mic dect ele. n cazul lipsei de legtur ntre caracteristicile studiate, ordinea de
distribuie a rangurilor celor dou caracteristici este diferit.
n mod corespunztor se pot cuprinde n anliz i distribuiile paralele ale mai multor
caracteristici, cu care se pot realiza mai multe combinaii, stabilind coeficienii de corelaie a
rangurilor simpli, pariali i multipli, urmrind astfel att procesul complex de formare a
indicatorilor sintetici, ct i interaciunea dintre factori.
Cele mai frecvente formule de calcul ale coeficientului de corelaie a rangurilor sunt
cele ale lui Spearman i Kendall.
Coeficientul de corelaie a rangurilor a lui Spearman este o aplicaie a coeficientului
de corelaie liniar simpl la distribuiile celor dou iruri de ranguri.
n cazul corelaiei rangurilor, cele dou serii de valori variabile sunt nlocuite cu dou
iruri de ranguri de la 1 la n, ale cror medii i dispersii sunt legate ntre ele. innd seama de
faptul c cele dou iruri de ranguri formeaz cte o progresie aritmetic 1, 2, 3, ..., n,
nseamn c:
n1
xy
2
iar:
n2 1
2
2
12
nlocuind n formula coeficientului de corelaie liniar se obine formula de calcul a
coeficientului de corelaie a rangurilor lui Spearman:
6 di2
rs 1 3
n n
n care:
d - reprezint diferena de rang ntre caracteristicile corelate;
n - numrul de uniti cercetate.
Coeficientul de corelaie a rangurilor al lui Kendall se calculeaz dup formula:
Regresie i corelaie
112
rk
2S
n ( n 1)
n care S Pi Qi
i
Romnia
Bulgaria
Turcia
Ucraina
Georgia
Numr
locuri
275941
190040
418177
50414
19316
Rxi
Ranguri pentru
numr locuri
Rx
4
3
5
2
1
Ry i
1
2
3
4
5
2
1
4
3
5
Densitatea
turistic
5701
15278
22396
26
872
d i2 ( Rxi Ry i ) 2
1
1
1
1
0
2
di 4
i
Ranguri pentru
densitatea turistic
Ry
3
4
5
1
2
Pi
Qi
3
3
1
1
0
Pi 8
1
0
1
0
0
Qi 2
64
0,8
5 (5 2 1)
Valoarea coeficientului indic legtur direct i puternic ntre numrul locurilor din
unitile de cazare i densitatea turistic.
2 (8 2)
Coeficientul Kendall
0,6
5 (5 1)
Coeficientul Spearman 1
Capitolul 5
113
Rezumat
n analiza statistic a raporturilor de dependen dintre fenomene, problema care se
pune este aceea a msurrii relaiei care exist ntre dou sau mai multe caracteristici cuprinse
n programul unei cercetri concrete a fenomenelor social-economice de mas. Aceasta
presupune, n primul rnd, s se constate dac ntre caracteristica X - denumit caracteristica
factorial sau independent - i caracteristica Y - caracteristica rezultativ sau dependent exist sau nu un raport de dependen i n al doilea rnd, dac aceast relaie exist, s se
exprime printr-un indicator simplu sau sintetic de corelaie, msura n care caracteristica
factorial X contribuie la formarea caracteristicii rezultative Y sub aspectul naturii, direciei i
formei de legtur dintre ele.
Termeni importani: regresia liniara, coeficient de regresie, raport de corelaie,
coeficient de determinaie, regresia neliniar, regresia multipl
Teste de autocontrol:
1.
2.
3.
4.
5.
Probleme propuse
1. Vnzrile de mrfuri i suprafaa comercial pentru 10 uniti economice care aparin
aceleiai societi comerciale se caracterizeaz prin datele:
Nr. crt. al
unitii
Vnzri
de mrfuri
- mii RON -
1
2
3
4
5
6
7
52
60
74
20
25
34
49
Suprafaa
comercial
- m2 400
385
620
155
210
220
230
8
9
10
38
45
12
215
320
70
Regresie i corelaie
114
Nr.
crt
1
2
3
4
5
6
7
8
9
10
Cheltuieli cu
alimentaia
- RON 320
380
400
550
620
410
540
590
600
630
30
59
40
50
20
52
41
10
62
60
2,2
2,5
1,8
2,6
2,3
1,9
3,6
Se cere:
1. S se caracterizeze legtura dintre cele dou variabile utiliznd metoda grafic;
2. S se msoare intensitatea legturii dintre cele dou variabile, utiliznd metode
parametrice i neparametrice;
3. S se determine ce nivel ar atinge profitul dac valoarea vnzrilor ar fi de 45 mii
RON.
Capitolul 6
115
Capitolul 6
Tema
Obiectivele
1. Noiuni, particulariti
2. Indicatorii statistici utilizai n prelucrarea seriilor cronologice
2.1 Indicatori absolui
2.2 Indicatori relativi
2.3 Indicatori medii
3. Ajustarea seriilor cronologice
3.1 Ajustarea pe baza mediilor mobile
3.2 Ajustarea prin sporul mediu
3.3 Ajustarea pe baza indicelui mediu de dinamic
3.4 Ajustarea prin metoda celor mai mici ptrate
4. Analiza sezonalitii
Mijloace
- citire/nvare
- ntrebri, probleme ce apar, explicaii
- definiii, explicaii ce trebuie reinute
- situaii economice concrete, supuse analizei, exemple (sub
lup)
Finalitatea
Evaluarea
Timp de lucru
necesar
116
1. Noiuni, particulariti
Seria cronologic este format din dou iruri de date paralele, n care
primul ir arat variaia caracteristicii de timp, iar cel de-al doilea ir variaia
fenomenului sau caracteristicii cercetate, de la o unitate de timp la alta. Seriile
cronologice se mai numesc i serii de timp sau serii ale dinamicii.
Proprietile seriilor cronologice:
- variabilitatea termenilor unei serii cronologice provine din faptul c fiecare
termen se obine prin centralizarea unor date individuale diferite ca nivel de
dezvoltare.
- omogenitatea termenilor trebuie neleas n sensul c n aceeai serie nu pot fi
nscrise dect fenomene de acelai gen, care sunt rezultatul aciunii acelorai cauze
eseniale.
- periodicitatea termenilor din care este format seria, ceea ce nseamn de fapt
asigurarea continuitii datelor din punct de vedere a variabilei de timp i care
poate da posibilitatea interpretrii seriei cronologice ca o funcie analitic (y i=
f(ti)). Variabila de timp poate fi nregistrat cu periodiciti diferite. De aceea,
alegerea unitii de timp la care se refer datele unei serii cronologice trebuie
fcut n raport cu scopul cercetrii, al coninutului i posibilitilor de msurare a
fiecrui indicator.
- interdependena termenilor unei serii cronologice apare ca urmare a respectrii
principiului unitii de timp i spaiu i structurii organizatorice. Ca atare,
indicatorii prezeni sunt valori succesive ale acelorai fenomene nregistrate la
nivelul aceleiai uniti teritorial administrative sau orice unitate statistic
complex care poate fi nregistrat autonom. Aceasta face ca valoarea fiecrui
indicator s depind ntr-o oarecare msur de valoarea indicatorului precedent, ca
urmare a faptului c relaiile de cauzalitate se manifest n condiii asemntoare
de la o unitate de timp la alta.
Lund n considerare toate aceste particulariti, analiza statistic a seriilor cronologice
trebuie s se bazeze pe un sistem de indicatori, care s caracterizeze multiplele relaii
cantitative din interiorul seriei i pe toat perioada la care se refer datele. Ca atare,
problemele care se pun i trebuie rezolvate la analiza seriilor cronologice sunt:
- alegerea lungimii seriei i elaborarea ei astfel nct, pe ct posibil,
s ndeplineasc condiia legii numerelor mari, adic s aib un
Capitolul 6
117
118
t 1, n
cu baz fix:
t 1 yt y1
t 2, n
unde:
yt
cu baza n lan:
t 1
unde:
y t y t 1 t 2, n
Capitolul 6
119
n1
Proprietate:
t / t 1
y n y1
t2
Indicele de dinamic este mrimea relativ care arat de cte ori s-a
modificat un fenomen n timp.
cu baz fix:
I t1
yt
100
y1
t 2, n
cu baza n lan:
It
t 1
yt
100 t 2, n
y t 1
I n1 I t t 1
Proprietate:
cu baz fix:
R t 1 I t 1 (%) 100
t 2, n
cu baza n lan:
Rt
t 1
I t (%) 100
t 1
t 2, n
cu baz fix:
Va t 1
t1
R t1
cu baz n lan:
t 2, n
120
t
Va t
t 1
Rt
t 1
t 2, n
t 1
Yt
Y
t 1
Y CR
y1 y2 y2 y3
y yn
.... n 1
2
2
2
n 1
Y CR
y1 y2
y y3
y y
t1 2
t2 .... n 1 n tn 1
2
2
2
t1 t2 ... tn 1
unde:
t1, t2, tn-1reprezint lungimea n uniti de timp dintre dou momente
succesive.
Modificarea medie absolut
t 1
n 1
y n y1
n 1
I n 1 I t t 1 n 1
yn
y1
R I (%) 100
Capitolul 6
121
Seria analizat este format din n = 5 termeni. Mrimea lor constituie nsi
indicatorii de nivel ai seriei. nsumnd indicatorii de nivel obinem nivelul totalizat al
termenilor.
Tabelul nr. 2. Calculul indicatorilor absolui
Export
Anii
(mii perechi)
Modificri absolute +/- (mii perechi)
yt
2001
2002
2003
2004
2005
Total
265 (y1)
269 (y2)
275 (y3)
279 (y4)
282 (y5)
5
yt 1370
cu baza fix
t/1
4
10
14
17
-
t1
cu baza n lan
t/t-1
4
6
4
3
5
t / t 1
17
t 2
Anii
2001
2002
2003
2004
2005
Export
(mii
perechi)
yt
265
269
275
279
282
Indicii de dinamic
(%)
cu baz
fix
It/1
100,00
101,51
103,77
105,28
106,42
cu baz n
lan
It/t-1
101,51
102,23
101,45
101,08
Ritmul de cretere
(%)
cu baz
fix
Rt/1
1,51
3,77
5,28
6,42
cu baz n
lan
Rt/t-1
1,51
2,23
1,45
1,08
Valoarea absolut a
1% din cretere
cu baz
fix
Vat/1
2,65
2,65
2,65
2,65
cu baz n
lan
Vat/t-1
2,65
2,69
2,75
2,79
122
Indicatorii medii
Nivelul mediu. Dat fiind faptul c termenii unei serii cronologice de intervale de timp
se pot cumula determinndu-se nivelul totalizat al caracteristicii pe ntreaga perioad
n
yt
t 1
pentru calculul nivelului mediu vom folosi formula mediei aritmetice simple
y
y
t 1
1370
274 mii perechi /an
5
n perioada 2001 - 2005 exportul mediu anual reprezint 274 mii perechi cu o
variaie cuprins ntre 265 i 282 mii perechi.
Modificarea medie absolut anual
t 1
n1
4 6 4 3 17
Capitolul 6
123
124
y6
y7
y8
Y5
Y6
n acest caz fiecare medie mobil se va plasa n dreptul unui termen ce corespunde cu
poziia termenului central, numrul acestora fiind egal cu: n-(n-1)
unde:
n reprezint numrul termenilor seriei ce urmeaz a fi ajustat.
n - numrul termenilor din care se calculeaz media mobil.
n cazul considerat: n - (n - 1) = 8 - (3 - 1) = 6 medii mobile.
n cel de al doilea caz, cnd ajustarea se face pe baza mediilor mobile calculate dintrun numr par de termeni, mediile mobile se obin n dou trepte:
1) medii mobile provizorii yt care se plaseaz ntre termenii seriei;
2) medii mobile definitive sau centrate yt , care se plaseaz n dreptul termenilor
seriei i cu care se face ajustarea termenilor seriei iniiale.
Relund acelai exemplu pentru seria format din 8 termeni se pot calcula 5 medii
mobile provizorii:
y y2 y3 y4
y y5 y6 y7
Y1 1
;
Y4 4
;
4
3
y y3 y4 y5
y y6 y7 y8
Y2 2
;
Y5 5
;
4
4
y y4 y5 y6
Y3 3
;
4
Pe baza acestora , n etapa a doua se pot calcula medii mobile definitive ca o medie
aritmetic simpl a celor provizorii luate cte dou:
Y1
Y1 Y2
;
2
Y2
Y2 Y3
;
2
Y3
Y3 Y4
;
2
Y4
Y4 Y5
;
2
y1
y2
y3
y4
y6
y5
yt
Mediile
mobile
definitive
y
t
Y Y
1
Y
3
y7
Y
4
y8
Capitolul 6
125
trendul ajustat
y t y1 (t 1)
t 1, n
Ani
2001
2002
2003
2004
2005
mii perechi
280
275
270
265
260
255
2001
2002
Valori observate
2003
2004
2005
126
y t y1 I
( t 1)
t 1, n
Ani
2001
2002
2003
2004
2005
285
mii perechi
280
275
270
265
260
255
2001
2002
Valori observate
2003
2004
2005
Capitolul 6
127
t = 1, 2, ... ,n
(a bt ) min.
=0.
yi
a
na yi
n
de
unde
2
b ti ti yi
b ti yi
ti2
128
Ani
2001
2002
2003
2004
2005
Total
Export
yi
265
269
275
279
282
ti
-2
-1
0
1
2
ti 0
1370
ti yi
t i2
-530
-269
0
279
564
t i yi 44
4
1
0
1
4
2
t i 10
Yt 274 4,4 t
265.2
269.6
274
278.4
282.8
Yt 1370
yi 1370 274
a
n
5
b t i y i 44 4,4
t i2 10
285
280
275
270
265
260
255
-2
-1
4. Analiza sezonalitii
n manifestarea concret a fenomenelor economice, variaiile cele mai mari ale
acestora nu sunt ntotdeauna provocate de influena unor cauze ntmpltoare. Uneori aceste
variaii au un caracter de regularitate i pot fi rezultatul aciunii unor cauze obiective, legate
de modificarea anotimpurilor.
Capitolul 6
129
Model aditiv
1. Valorile empirice
2. Calculul valorilor Y ij
Model
multiplicativ
y iij Yij S ij ij
y ij Yij S ij ij
funcii analitice
3. Variaiile sezoniere
S ij y ij Yij
4. Coeficienii sezonieri
S ij
y ij
Yij
S
Sj
ij
i 1
j 1, n
5. Factor de corecie
Sj
j 1, n
m
n
S
dac
ij
i 1
6. Coeficienii sezonieri
corectai
funcii analitice
j 1
j 1
dac
130
S *j S j
7. Seria ajustat
*
j
y ija Yij S *j
8. Componentele aleatoare
Sj
y ija Yij S *j
ij y ij y ija
ij
y ij
y ija
I
36,6
36,3
37,8
II
54,7
54,4
58,7
Trimestre
III
IV
56,5 34,5
5 9,9 39,0
64,0 38,2
70
60
mii hl
50
40
30
20
10
0
I
II III IV
II III IV
II III IV
trimestre
Figura 6. Evoluia consumului de bere pe ani i trimestre
Din reprezentarea grafic se observ faptul c fenomenul are tendin de cretere peste
care se suprapun componentele sezoniere. Pentru analiza trendului se folosete modelul aditiv.
Capitolul 6
131
Trim.
I
II
III
IV
I
II
III
IV
I
II
III
IV
Total
Tabelul nr. 9
ti
ti2
tiyi
Yi=a+bti s
-5.5
30.25 -195.8
44.4
-8.8
-4.5
20.25 -246.15
45.0
9.7
-3.5
12.25 -197.75
45.5
11.0
-2.5
6.25 -86.25
46.1
-11.6
-1.5
2.25 -54.45
46.6
-10.3
-0.5
0.25
-27.2
47.2
7.2
0.5
0.25
29.95
47.7
12.2
1.5
2.25
58.5
48.3
-9.3
2.5
6.25
94.5
48.8
-11.0
3.5
12.25 205.45
49.4
9.3
4.5
20.25
288
49.9
14.1
5.5
30.25
210.1
50.5
-12.3
0
143
78.9
yi
35.6
54.7
56.5
34.5
36.3
54.4
59.9
39
37.8
58.7
64
38.2
569.6
12
y
a
12
i 1
12
47,467
ti
i 1
12
0,5517
2
i
i 1
Ani
2003
2004
2005
Sj
Tabelul nr. 10
Componente sezoniere pe trimestre
I
II
III
IV
-8,8
9,7
11
-11,6
-10,3
7,2
12,2
-9,3
-11
9,3
14,1
-12,3
-10,03
8,73
12,43
-11,07
III
IV
6.5
7.5
8.5
9.5
Ypj a b tpj
51.1
51.6
52.2
52.7
yp j Yp j S j
41.0
60.3
64.6
41.6
132
unde:
tpj timpul de prognoz
Ypj componentele de trend prognozate
ypj valorile finale prognozate.
Rezumat
Probleme propuse
1. Despre evoluia cifrei de afaceri a unei societi comerciale se cunosc datele:
ANI
2002
2003
2004
2005
% modificrii relative a cifrei de
afaceri fa de anul precedent
+3
+4
+2
+4
tiind c cifra de afaceri din 2004 a fost de 80 mii RON, modificarea medie anual
absolut n perioada 2002-2005 a fost de :
a. 1,2 mii RON/an;
b. 1,2 %/an;
c. 2,5 mii RON/an;
d. 210%/an;
e. 3 mii RON/an.
2. Pe baza unei serii cronologice format din 11 ani, termeni consecutivi, s-a ajuns
la concluzia c tendina de evoluie a unei variabile este exprimat prin func ia Yt 400 60 t
(n codiiile n care t 0 ). Valorile estimate ale variabilei analizate pentru urmtorii trei ani
sunt:
a. 1300; 1480; 1600;
b. 1120; 1180; 1240;
c. 340; 280; 220;
d. 460; 520; 580;
e. 760; 820; 880.
Capitolul 6
133
Autoturisme
- mii buc 19
14
15
18
21
Anii
2003
2004
2005
2006
2007
2008
tiind c n 2008 numrul de turiti a fost cu 5% mai mare dect n 2003, se cere:
a)
S se reconstituie seria care exprim numrul de turiti pentru fiecare an;
b)
S se calculeze indicatorii relativi i medii;
c)
S se determine trendul, folosind:
- metoda sporului mediu;
- metode analitice (modelul liniar);
d)
S se previzioneze numrul de turiti pentru anul 2009.
134
Anii
2006
2007
2008
Se cere:
1. Reprezentai grafic datele din tabel;
2. Efectuai analiza sezonalitii;
3. Prognozai valorile pentru trimestrele anului urmtor.
Capitolul 7
135
Capitolul 7
Tema
Metoda indicilor
Obiectivele
Mijloace
- citire/nvare
- ntrebri, probleme ce apar, explicaii
- definiii, explicaii ce trebuie reinute
- situaii economice concrete, supuse analizei, exemple (sub
lup)
Finalitatea
Evaluarea
Timp de lucru
necesar
Metoda indicilor
136
Metoda indicilor
Metoda indicilor face parte din metodele de analiz factorial, prin care se
msoar variaia n timp i n spaiu a unui fenomen complex n funcie de modificarea
factorilor de influen. Indicii se calculeaz sub forma unui raport, deci sunt mrimi relative
adimensionale ca urmare a faptului c att la numrtor ct i la numitor figureaz dou valori
ale aceluiai indicator. Aceasta nseamn c aplicarea indicilor presupune identificarea
factorilor care determin variaia fenomenului complex, nregistrarea nivelului acestora pentru
toate unitile ce compun colectivitatea i construirea relaiilor care s permit caracterizarea
modificrii relative att la nivelul ntregului ansamblu, ct i al elementelor sale componente.
Specific metodei indicilor este faptul c variaia fenomenului complex se descompune
integral pe factorii nregistrai, ceea ce nseamn c ntre nivelul ansamblului i variaia
factorilor de influen trebuie s existe o relaie de produs. La aplicarea acestei metode,
factorii luai n discuie se pot grupa dup natura lor n dou categorii:
Capitolul 7
137
perioad de timp, situat n dou uniti teritoriale, se concretizeaz n indici teritoriali sau de
spaiu.
Coninutul indicatorului comparat determin denumirea indicilor calculai, de exemplu
indicele preurilor, indicele salariului etc.
Mrimile relative ale dinamicii, ale planului i de coordonare pot fi considerate drept
indicii individuali, notai cu i, dac exprim variaia relativ la nivelul unei singure uniti de
observare.
Indicii de grup, simbolizai cu I, se calculeaz la nivelul unei grupe sau pe ntregul
ansamblu i exprim variaia medie relativ a fenomenului studiat. Ca atare, indicele de grup
nu este o sum a indicilor individuali respectivi, ci o medie a acestora. Indicii individuali fiind
mrimi relative, media lor poate s fie aritmetic sau armonic.
Privitor la folosirea metodei indicilor, de menionat c ei se aplic, de regul, sub
form de sistem. De exemplu, sistemul indicilor valorii, ai volumului fizic i ai preurilor.
Fiecare sistem de indici poate fi privit ca un sistem independent sau ca un subsistem n cadrul
unui sistem mai cuprinztor, fie din punct de vedere organizatoric, fie din punct de vedere al
gradului de cuprindere a caracteristicilor ce se gsesc n relaii de interdependen.
Construirea i folosirea indicilor de grup n caracterizarea unui fenomen complex
presupune efectuarea unei analize calitative a indicatorului a crei variaie se studiaz, din
care trebuie s rezulte:
separarea factorilor, n cantitativi (extensivi) i calitativi (intensivi);
dac valorile factorilor sunt nsumabile direct sau nu;
ce baz de comparaie trebuie folosit;
sistemul de ponderare care trebuie utilizat;
ce relaie de calcul poate fi aplicat avnd n vedere datele de care se
dispune.
n funcie de aceste elemente, indicii de grup se pot construi sub form de indici
agregai, indici calculai ca medie a indicilor individuali i ca indici determinai ca raport a
dou medii. La rndul lor aceste forme de indici de grup se particularizeaz n funcie de baza
de comparaie (fix sau mobil) i de ponderile utilizate (constante sau variabile). Desigur c,
fiecare din aceste metode prezint avantaje i dezavantaje i, deci, nu poate fi substituit una
alteia.
2. Indicii agregai. Sisteme de ponderare folosite la construirea indicilor de grup
Metoda indicilor
138
Avnd trei variabile nregistrate la nivelul unitilor complexe care formeaz n mod
permanent colectivitatea supus observrii, nseamn c se pot calcula trei indici individuali i
trei indici de grup.
Indicii individuali se calculeaz ca indici simpli folosind datele nregistrate pentru
y
f
x
fiecare variabil la nivelul unitii de observare folosit i 1y 1 ; i 1f 1 ; i 1x 1 . n
0
0
f0
x0
0 y0
acest caz indicii de grup la nivelul ntregului ansamblu se calculeaz ca indici agregai. Pentru
prezentarea diferitelor sisteme de ponderare se presupune c variabila y i este nsumabil direct
i c se descompune la nivelul fiecrei uniti n produsul dintre variabila x i - cu caracter de
mrime statistic derivat - i variabila fi, cu caracter de variabil cantitativ nensumabil
direct. Aceasta nseamn c pentru indicii de grup ai celor dou variabile - factori se va folosi
tot un indice agregat n care succesiv factorul de indexat este variabil, iar cellalt are caracter
de pondere.
Rezult deci, c ntr-un sistem de indici - cel puin la nivelul ntregului ansamblu indicii factoriali trebuie s cuprind aceleai elemente ca i indicele variabilei complexe.
n cazul variabilei complexe yi = x i . fi, indicele de grup va fi:
k
y
1
0
y i1
i 1
k
i0
i 1
i1
f i1
i 1
k
i0
f i0
x
x
f1
f0
i 1
y( x )
Indicii factoriali derivai din acesta I 1
si I 1 trebuie s prezinte variaia
0
0
unui singur factor, iar cellalt s rmn constant, deci s joace rolul de pondere, i anum e:
y( f )
I1
0
xf
xf
y( x )
si I 1
x
x
La rndul lor, ponderile nu sunt elemente abstracte ci ele pot fi din perioada curent
sau din cea de baz (n cazul indicilor de dinamic).
Un prim sistem de ponderare este acela propus n 1864 de E. Laspeyres, la care
ponderile folosite sunt cele din perioada de baz. n acest caz, indicii factoriali se calculeaz
pe baza relaiilor:
I 1y ( f )
0
x0 f 0
I 1y ( x )
0
0 0
Capitolul 7
139
Adoptarea sau respingerea celor doi indici nu se poate face dect dup ce se analizeaz
coninutul lor i msura n care ei reflect nite proporii reale cu privire la dezvoltarea
fenomenelor la care se refer. Fiecare indice trebuie analizat separat corespunztor cu
coninutul indicatorilor absolui pe care-i conine i a relaiilor de interdependen dintre
fenomenul de indexat i ponderile folosite.
Un alt sistem de ponderare este cel propus n 1874 de H. Paasche, la care ponderile
utilizate sunt cele din perioada curent:
I 1y ( f )
0
y(x)
1
0
f0
x0 f1
x
x
f0
f0
x
x
f1
f1
I 1y ( f )
0
x
x
f1
f0
x
x
f1
f0
n practica statistic se aplic n mod curent fie sistemul propus de Laspeyres fie o variant care provine din
combinarea sistemului lui Laspeyres i al lui Paasche. Criteriul ce st la baza optrii pentru una din cele
dou variante este, de regul, existena datelor necesare calculrii indicilor.
Metoda indicilor
140
care ar trebui s reflecte numai modificarea pur a preurilor. Relaia de calcul ar trebui s fie
x1 f 0 , respectiv, I p p1q0 ), care ar corespunde
un indice de tip Laspeyres ( I 1x
1
0
0
x0 f 0
p0 q 0
ipotezei c au rmas neschimbate cantitile i s-au modificat numai preurile. Ori, eforturile
omenirii s-au concentrat totdeauna pentru obinerea unor cantiti tot mai mari de bunuri i
servicii. De aici, problema care se pune este n principal aceea dac preul poate fi izolat de
cantitate. Dac nu, atunci se nate a doua ntrebare, i anume: intereseaz variaia preurilor
cantitilor produse vndute, consumate etc. n perioada de baz sau din perioada curent?
Rspunsul nu poate fi altul dect c productorul, vnztorul sau cumprtorul resimt variaia
de preuri atunci cnd s-a produs, deci n perioada curent. Ca atare indicele preurilor ar
x1 f 1 , respectiv, I p p1q1 ).
trebui s fie calculat ca un indice de tip Paasche ( I 1x
1
0
0
p 0 q1
x0 f 1
Mai trebuie verificat dac aplicnd relaia de sistem, care presupune combinarea unui indice
Paasche cu un indice Laspeyres, este satisfcut n cazul indicelui volumului fizic prin analiza
direciei i coninutului acestuia. Cu alte cuvinte, pentru indicele volumului fizic, potrivit
x0 f 1 , respectiv,
relaiei de sistem, trebuie folosit un indice Laspeyres ( I 1f
0
x0 f 0
I 1q
0
pq
pq
0 1
0 0
v
v
q p
q p
1
q p q p
q p q p
1
v ( qp ) v ( q ) v ( p )
n care:
v ( qp )
q
q
q p ;
q p ;
q p
p1
v(q )
p0
v( p)
p1
Capitolul 7
141
Produse
U/M
a
A
B
C
Total
b
tone
buc.
buc.
Perioada
de baz
(q0)
1
50
200
500
-
Perioada
curent
(q1)
Perioada
de baz
(p0)
Perioada
curent
(p1)
Perioada
de baz
(q0p0)
Perioada
curent
(q1p1)
2
52
220
570
-
3
1000
60
100
-
4
1100
63
90
-
5
50000
12000
50000
112000
6
57200
13860
51300
122360
Perioada
curent la
preurile
perioadei
de baz
(q1p0)
7
52000
13200
57000
122200
1
,
04
A
50
q1 q 220
qB
q
i 1 I B
110
,
220 200 20 buc.
0
q0
200
q 570
,
I C 500 114
qC 570 500 70 buc
pA
1100 1000 100 RON
p 1100
,
i A 1000 110
p1 p 63
pB
p
i1
1,05
iB
63 60 3 RON
0
p0
60
p 90
pC 90 100 10 RON
iC 100 0,90
Metoda indicilor
142
vA
RON
7200
vB
v
i1
RON
1860
0
vC 1300
RON
v 57200
i A 50000 1,144
q1 p1 q 13860
1,155
I B
q 0 p0
12000
q 51300
I C 50000 1,026
I 1v
0
v
v
q p
q p
1
122360
1,0925 sau 109,25%
112000
RON
RON
sau,
v ( q )
(q
q p
q p
1
122360
1,001 sau 100,1%
122200
Capitolul 7
143
RON
Pornind de la relaia dintre cei trei indici, indicele valorii este egal cu produsul dintre
indicele volumului fizic i indicele preului respectiv:
i 1v i 1q i 1p i I 1v I 1q I 1p iar modificarea absolut a valorii produciei este egal
0
Produse
A
B
C
Total
v ( q )
v ( p )
+1200
+1860
+1300
+10360
+2000
+1200
+7000
+10200
+5200
+660
-570
+160
Tabelul nr. 2
Contribuia procentual
( v ( p ) / v ).100
72,2
35,5
438,5
1,5
100
27,8
64,5
538,5
98,5
satisfcut. Pentru a lrgi ct mai mult gama produselor comparabile, n practic se pune
problema s se calculeze un indice de preuri independent, iar indicele volumului fizic s se
obin ca un raport ntre indicele valorii i indicele preurilor.
Problema includerii produselor noi n calculul indicilor se pune i se rezolv
difereniat n cazul indicelui volumului fizic i al preurilor.
La determinarea indicelui volumului fizic cantitile din perioada curent i din
q1 p 0
,
perioada de baz sunt evaluate la aceleai preuri i anume din perioada de baz
q 0 p0
produsele noi ns nu au asemenea preuri. Necuprinderea lor, din acest motiv, n mrimea
Metoda indicilor
144
q
care variabila o reprezint indicele individual i 1q 1 q1 i 1q q 0 iar ponderea, valoarea
0
0 q0
q
1
0
p0
p0
i q p
q p
0
Din numrtorul raportului rezult c indicele volumului fizic se poate calcula sub
form de medie aritmetic, dac nu au aprut produse noi, deoarece, pentru acestea, nu se pot
calcula indici individuali.
n cazul indicelui preurilor, cunoscnd indicii individuali ai preurilor
0
ponderat:
Capitolul 7
I 1p
0
145
q p
q p
1
q p
1
i q p
1
p
1
0
n mod similar se calculeaz indicele mediu aritmetic sau armonic i al altor variabile
ca: salariul mediu, productivitatea muncii, recolta medie, costul mediu, eficiena fondurilor
fixe etc., dac se cunosc indicii individuali i nivelul totalizator din perioada de baz sau
curent, pe fiecare element sau grupe de elemente ale colectivitii. La alegerea formei mediei
este indicat s se aib n vedere datele disponibile i folosirea acelor ponderi care nu mai
necesit recalculri.
Relaiile generale de calcul a indicilor de grup ca medie a ind icilor individuali sunt:
y( f )
1
0
I 1y ( x )
0
f
1
i x f
x f
x f
1
i x
0
x
1
unde: i 1f
1
unde:
f1
f1
f0
i 1x
0
x1
x0
q p
1
i q p
1
p
1
0
122360
122360
1,001
1
1
1
122200
57200
13860
51300
1,10
1,05
0,90
Metoda indicilor
146
v ( p ) p1q1
i 1p
q
1
q
1
i q p
q p
0
I svx
x1
x0
x f :x f
f f
1
Din relaia de mai sus rezult c x0 x1 dac se modific fie valorile individuale ale
variabilei, fie frecvenele acesteia, fie i una i alta. Variabila de natur cantitativ (f) nu
influeneaz ns numai prin variaia sa individual ci i prin modificarea ponderii cu care
fi
f
apar valorile calitative
i , deci factorul cantitativ este, n acest caz, i factor
fi
Capitolul 7
147
x
I 1
x0
x
sv
x
x
*
1 1
*
0 0
x g
x g
f
1 1
f
0 0
n care: x1, x0 sunt valorile caracteristicii pentru care se calculeaz media, din cele
dou perioade;
x f :x f
f
f
1 1
0 1
x
x
f1
f1
x f
1
i x
1
f1
Dac indicele cu structur fix se calculeaz folosind ponderile din perioada de baz,
corespunde sistemului de ponderare propus de Laspeyres. n acest caz, formula de calcul va
fi:
x ( x)
I SF
x f :x f
f f
1 0
0
I 1y ( x )
0
x1 f 0
x
f0
x
1
i x f
x f
0
Folosirea uneia sau alteia din variantele pentru calculul indicelui cu structur fix se
face, n principal, n funcie de datele disponibile, de scopul analizei i de modul de
descompunere pe factori utilizat.
Indicele variaiei structurii, denumit i indicele modificrilor structurale, se calculeaz
pornind de la ipoteza c s-a schimbat numai distribuia factorului cantitativ, deci structura
colectivitii. n acest caz se pot construi, teoretic dou variante de calcul n funcie de
ponderile utilizate. n practica naional i internaional i-a gsit aplicabilitate formula de
calcul n care ponderea se face cu perioada de baz, deci indice de tip Laspeyres cu frecvene
absolute:
Metoda indicilor
148
I VSx( f )
x f :x f
f f
0 1
respectiv:
x( f *)
VS
f 1*
f 0*
Relaia de mai sus se verific numai n cazul n care cei doi indici factoriali se
construiesc pe baza considerrii sistemelor de ponderare Paasche i Laspeyres. Pornind de la
cele menionate mai sus indicele cu structur fix are la baz ponderi din perioada curent iar
indicele variaiei structurii, ponderi din perioada de baz. Se admite ipoteza succesiunii
modificrii factorilor: mai nti factorul cantitativ i urmat de cel calitativ.
Modificarea absolut a mediei sub influena unuia sau altuia din factori se calculeaz
ca diferen dintre numrtorul i numitorul indicelui factorial corespunztor. Relaiile de
calcul vor fi:
x ( x )
x f x f
f
f
1 1
0 1
x f
f
0
x ( f )
x f
f
0
x1 f 1* x0 f 1*
x 0 f 1* x 0 f 0*
i n acest caz, modificarea mediei este egal cu suma modificrilor datorate factorilor
de influen, respectiv:
x ( x. f ) x ( x ) x ( f )
x ( x. f
x(x ) x( f
Capitolul 7
149
Tabelul nr. 4
Salar mediu
(RON/pers)
S0
S1
640
700
720
830
Unitate
comercial
A
B
Total
Numarul angjailor
N0
N1
50
70
N0
45
75
N1
120
120
686.67 781.25
Fondul de salarii
(RON)
FS0
FS1
32000
31500
50400
62250
S 0 N 0 S1 N 1
82400
93750
S0N1
28800
54000
S 0 N1
82800
Se cere:
1. Dinamica salariului mediu pe fiecare unitate comercial.
2. Salariul mediu pe total n cele doua perioade.
3. Indicii de grup ai salariului mediu cu structur variabil, cu structur fix i cu
variaia structurii.
Rezolvare:
1. La unitatea comercial A
%
S
700
IS 1
100 109 ,38 % S 700 640 60 RON
S 0 640
Salariul mediu a crescut n perioada curent fa de perioada de baz la 109,38%, sau
cu 9,38%, ceea ce n mrime absolut a nsemnat o cretere n valoare de 60 RON/angajat.
La unitatea comercial B
%
S
830
IS 1
100 115 , 28 % S 830 720 110 RON
S 0 720
Salariul mediu a crescut n perioada curent fa de perioada de baz la 115,28%, sau
cu 15,28%, ceea ce n mrime absolut a nsemnat o cretere n valoare de 110 RON/angajat.
S N
N
0
686.67 RON/angajat
S N
N
1
781.25 RON/angajat
Metoda indicilor
150
3.
Indicele cu structur variabil
S
I SV
S N : S N
N N
1
Modificarea absolut
1,137
SSV
S N
N
1
S N
N
0
94,58
Salariul mediu pe total a crescut de 1,137 ori ceea ce nseamn n mrime absolut
94,58 RON/angajat.
Indicele cu structur fix
S
I SF
Modificarea absolut
S N :S N
N N
1
1,132
SSF
S N
N
1
S N
N
0
91,25
Salariul mediu pe total a crescut de 1,132 ori ceea ce nseamn n mrime absolut
91,25 RON/angajat ca urmare a modificrii salariilor medii pe fiecare unitate comercial.
Indicele cu modificarea structurii
S
I MS
S N : S N
N N
0
1,0048
SMS
S N : S N
N N
0
3,33
Salariul mediu pe total a crescut de 1,0048 ori ceea ce nseamn n mrime absolut
3,33 RON/angajat ca urmare a modificrii structurii angajailor pe fiecare unitate comercia l.
Rezumat
Metoda indicilor face parte din metodele de analiz factorial. Indicii se calculeaz sub
forma unui raport, sunt mrimi relative adimensionale ca urmare a faptului c att la
numrtor ct i la numitor figureaz dou valori ale aceluiai indicator. Aceasta nseamn c
aplicarea indicilor presupune identificarea factorilor care determin variaia fenomenului
complex, nregistrarea nivelului acestora pentru toate unitile ce compun colectivitatea i
construirea relaiilor care s permit caracterizarea modificrii relative att la nivelul
ntregului ansamblu, ct i al elementelor sale componente.
Termeni importani: Indici individuali, indici de grup, sisteme de ponderare
Teste de autocontrol:
1.
2.
3.
4.
Capitolul 7
151
Probleme propuse
Produsul
1
2
3
Total
Valoarea vnzrilor n
perioada curent
(RON)
13860
51300
57200
122360
Modificarea procentual a
preurilor
(%)
+5,0
-10,0
+10,0
-
Produse
A
B
Cantiti
- mii buc 2006
12.000
10.000
3.000
2007
9.000
8.000
5.000
Preuri
- RON / buc 2006
2007
500
480
220
210
600
630
Metoda indicilor
152
Se cere:
absolute
Secia
A
B
C
Valoarea produciei
mii RON Mai 2007
Mai 2008
800
940
1200
1800
1000
1100
Modificarea
volumului fizic -%-10
+5
-40
Se cere:
a) indicii individuali ai valorii, volumului fizic i preurilor;
b) indicii de grup ai valorii, volumului fizic i preurilor precum i modificrile absolute
corespunztoare.
5. Despre trei firme se cunosc urmtoarele date referitoare la numrul de salariai i salariul
nominal:
Firma
A
B
C
Nr. angajai
Mai 2005
400
200
100
Mai 2006
500
180
110
Se cere:
a) modificarea salariului, a numrului de salariai i a fondului de salarii pe fiecare firm;
b) salariul mediu i modificarea acestuia;
c) indicii cu structur fix i de variaie a structurii;
d) modificarea fondului de salarii pe total i influena factorilor.
6. La un hotel de patru stele s-au nregistrat datele:
Tip
camer
Dubl
Single
Garsonier
Apartament
Nr. nnoptri
Aprilie 2006
Aprilie 2007
250
237
110
115
15
15
7
5
Se cere:
a. S se calculeze valoarea tarifului la cursul zilei pentru moneda euro.
b. S se calculeze i s se interpreteze indicii individuali i de grup precum i
mrimile absolute corespunztoare.
c. S se analizeze evoluia valorii ncasate.
Bibliografie
153
BIBLIOGRAFIE
1. Andrei, T., Stancu, S., Statistic, teorie i aplicaii, Editura ALL, Bucureti 1995;
2. Baron, T., Biji, E., Tovissi, L., Wagner, P., Isaic Maniu, Al., Korka, M., Porojan, D.,
Statistic teoretic i economic, Editura Didactic i Pedagogic, Bucureti, 1996;
3. Biji E., Wagner P., Lilea E., Petcu N., Vtui M., Statistic, Editura Didactic i Pedagogic,
Bucureti ,1999.
4. Dugulean, L., Statistic economic i social, teorie i aplicaii, Editura Infomarket, Braov
1999;
5. Isaic Maniu, Al., Mitru, C., Voineagu, V., Statistica pentru managementul afacerilor,
Editura Economic 1995;
6. Mitru, C., Isaic Maniu, Al., Voineagu, V., Statistic economic, Editura Dacia Europa Nova,
Lugoj 2000;
7. Petcu, N., Statistic n turism 2005, teorie i aplicaii, Editura Albastr, Cluj-Napoca 2005;
8. Petcu, N., Statistic teorie i aplicaii n SPSS, Editura Infomarket, Braov, 2003.
9. Vasilescu, N., Statistic general, metodologie, lucrri practice, programe aplicative,
Editura Amon, Craiova 1996;
10. Vasilescu, N., Vancea, I., Radu, C., Statistica firmei industriale, metodologie, Editura Amon,
Craiova 1996;
11. Voineagu, V., Mitru, C., ian, E., Ghi, S., Statistic, Centrul de nvmnt economic
deschis la distan, Academia de Studii Economice, Bucureti 2000.
12. Voineagu V., Furtun F., Voineagu M., tefnescu C., Analiza factorial a fenomenelor
social-economice n profil regional, Bucureti, 2002.
xxx Anuarul Statistic al Romniei