Documente Academic
Documente Profesional
Documente Cultură
STATISTICII
Orice disciplină ştiinţifică îşi are metoda sa generală şi particulară, iar la rândul
său fiecare metodă este legată în mod specific de un anumit obiect al cercetării.
Obiectul constituie, în oricare din sistemele de ştiinţe particulare, un criteriu de
bază al clasificării ştiinţelor în sistemul dat.
În toate momentele dezvoltării sale, statistica s-a ocupat cu acele fenomene şi
procese care se produceau într-un număr mare de cazuri, prezentau în reproducerea lor
anumite regularităţi şi care pot fi denumite fenomene de masă sau fenomene de tip
colectiv.
Fenomenele de masă apar ca o mulţime de forme individuale diferite, cu existenţă
distinctă, dar care analizate comparativ se constată că au aceeaşi esenţă. Principala
proprietate a acestor fenomene este variabilitatea în timp şi spaţiu. Legea de apariţie a lor
se manifestă ca tendinţă ce nu poate fi cunoscută şi verificată decât la nivelul ansamblului
şi nu în fiecare caz în parte.
Fenomenelor de masă le sunt specifice legile statistice, legi care se manifestă sub
formă de tendinţă, faţă de care abaterile întâmplătoare, într-un sens sau altul, se
compensează reciproc.
Deci, statistica studiază fenomenele social-economice de masă în cadrul cărora
acţionează legile statistice şi care prezintă proprietatea de a fi variabile în timp şi spaţiu.
1
Statistica studiază aceste fenomene prin caracterizarea laturii cantitativ-numerice
a fenomenelor social-economice, stabilindu-le dimensiunea, dinamica, intensitatea,
structura.
Statistica este ştiinţa care studiază aspectele cantitative ale determinărilor
calitative ale fenomenelor de masă, fenomene care sunt supuse acţiunii legilor statistice.
Obiectul de studiu al statisticii îl constituie mişcările curente-continue ale
fenomenelor şi proceselor ce-şi au existenţa sub formă de colectivităţi.
În funcţie de specificitatea obiectului său de studiu - mişcările curente-continue,
în timp, în spaţiu şi din punct de vedere calitativ ale fenomenelor de tip colectiv -,
statistica şi-a dezvoltat o metodă particulară de investigare.
Totalitatea operaţiilor, tehnicilor, procedeelor şi metodelor de investigare
statistică a fenomenelor formează metodologia statistică .
Metoda statisticii se caracterizează prin următoarele principii metodologice:
1. Observarea faptică – este un proces complex care presupune obţinerea datelor
asupra colectivităţilor social-economice prin observarea, măsurarea şi
înregistrarea unităţilor componente.
2. Exprimarea numerică – este necesară datorită caracterului de masă al
fenomenelor observate de statistică.
Procedeele şi tehnicile, ca parte a metodei statistice, sunt sistematizate şi
organizate pe etape ale demersului statistic şi înlesnesc observarea şi prelucrarea datelor
statistice, precum şi testarea şi analiza informaţiilor statistice.
În mod practic, în orice cercetare statistică se pot diferenţia următoarele etape:
• Pregătirea cercetării – priveşte problematica, documentarea în problemă,
elaborarea metodologiei şi a instrumentelor cercetării.
• Recoltarea datelor statistice – priveşte atât datele vechi, cât şi pe cele noi.
• Prelucrarea datelor – se efectuează pentru obţinerea indicatorilor specifici,
necesari caracterizării sub diferite aspecte a fenomenelor studiate.
• Analiza indicatorilor statistici obţinuţi – pentru stabilirea şi măsurarea legăturilor
dintre fenomene.
2
1.2 Colectivităţile statistice
3
EX: populaţia dintr-un teritoriu, locuinţele oamenilor, mulţimea animalelor
domestice pe specii, mulţimea autovehicolelor etc.
Colectivităţile din această categorie se caracterizează prin esenţa lor materială.
Volumul acestor colectivităţi poate fi stabilit printr-o observaţie instantanee, adică
printr-o numărare sau măsurare la un moment dat.
b. colectivităţi de fapte sau evenimente, denumite şi colectivităţi de mişcări pentru
că exprimă esenţa mişcărilor în viaţa socială. Cuprind evenimente care se produc
în mod continuu în viaţa socială. Volumul lor nu poate fi stabilit prin numărare
sau măsurare la un moment dat, ci prin numărarea curentă a cazurilor care se
produc într-un interval de timp.
Colectivităţile de mişcări, la rândul lor, pot fi grupate după felul succesiunii în
timp astfel:
• colectivităţi cu caracter de continuitate care cuprind fapte sau evenimente
care se succed în mod continuu, fără întreruperi semnificative.
EX: fenomenele demografice: natalitatea, mortalitatea sau producţia curentă.
• colectivităţi cu caracter de discontinuitate sau excepţionale, în care
întreruperile intervin în mod caracteristic.
EX: epidemii, pagube după calamităţi etc.
În cadrul oricărei colectivităţi se pot diferenţia subcolectivităţi sau grupe
caracteristice care prezintă unele caractere distincte faţă de alte grupe componente ale
întregii colectivităţi. Acestea poartă denumirea de tipuri şi pot apărea sub forma unor
grupe mai mult sau mai puţin numeroase în cadrul unei colectivităţi.
Volumul unei colectivităţi cuprinde totalitatea unităţilor componente şi poate fi:
• volum de număr mare, de masă, caz obişnuit în viaţa socială.
EX: populaţia unei ţări
• volum de număr mic
EX: numărul teatrelor din România.
Volumul unei colectivităţi se exprimă sub formă numerică.
4
1.3 Unităţile statistice
5
Caracterul stochastic al unei variabile aleatoare este datorat acţiunii factorilor
întâmplători asupra unităţilor colectivităţii, variantele variabilei depinzând de un sistem
complex de evenimente întâmplătoare. Valorile variabilei aleatoare se obţin prin
observarea unei colectivităţi statistice la un moment dat sau într-un interval de timp.
Mulţimea valorilor posibile ale unei variabile X reprezintă câmpul, domeniul de
variaţie al variabilei, adică:
X : (x1, x2, ..., xn), unde xi reprezintă o variantă purtată de o unitate sau de un grup
de unităţi.
Într-un studiu statistic, pe diferite trepte ale cercetării, se pot întâlni trei tipuri de
variabile:
• Variabile empirice – sunt variabile care exprimă valori reale înregistrate la nivelul
unităţilor statistice.
• Variabile teoretice – sunt valori abstracte cărora le corespund distribuţii teoretice.
• Dacă observarea statistică se efectuează asupra unui eşantion extras dintr-o
colectivitate generală, care se constituie ca obiect al unui studiu statistic, atunci
valorile statistice calculate pe baza datelor obţinute prin sondaj sunt valori ale
unei variabile de selecţie. Variabila de selecţie are caracter de variabilă aleatoare.
Distribuţiile valorilor statistice obţinute prin sondaj sunt numite distribuţii de
selecţie.
Caracteristicile se pot clasifica în funcţie de următoarele criterii:
1. După importanţa lor, pot fi:
o Caracteristici esenţiale – exprimă natura internă a fenomenului şi sunt
purtate de toate unităţile colectivităţii. Prin ele colectivităţile se diferenţiază
unele de altele.
EX: sexul persoanelor
o Caracteristici neesenţiale – au caracter întâmplător şi pot fi purtate
numai de unele unităţi din colectivitate.
EX: vechimea, în calitate de membru al unui club.
2. După natura lor, pot fi:
o Caracteristici calitative – sunt acelea care prin natura lor nu se pot
măsura şi exprima numeric. Acestea se exprimă prin cuvinte.
6
EX: sexul, ocupaţia, starea civilă
o Caracteristici de timp – desemnează apartenenţa unităţilor la un
moment sau la un interval de timp.
o Caracteristici de spaţiu sau teritoriale – exprimă teritoriul în care
există şi se manifestă unităţile colectivităţii.
3. După modul de exprimare, se deosebesc:
o Caracteristici numerice sau cantitative – sunt măsurabile.
EX: vârsta, salariul
Valorile unei caracteristici numerice se stabilesc prin numărare, măsurare,
calcul şi pot fi reprezentate pe o scală interval sau o scală raport.
Domeniul lor de variaţie se numeşte amplitudinea de variaţie a variabilei.
Caracteristicile numerice pot fi cu variaţie continuă, numite variabile
continue sau cu variaţie discontinuă, numite variabile discrete.
Variabila continuă este o caracteristică ale cărei valori sunt divizibile la
infinit şi pot fi grupate pe intervale. Intervalele sau clasele de valori pot fi de
mărimi egale sau inegale, închise sau deschise.
Variabila discretă sau discontinuă ia valori exprimate numai în numere
întregi.
EX: nr. de copii pe o familie, producţia de autoturisme exprimată în bucăţi
o Caracteristici nenumerice sau atributive – sunt caracteristici ale căror
modalităţi de manifestare nu sunt măsurabile numeric. Modalităţile unei
caracteristici pot fi reprezentate pe o scală nominală (meseriile) sau pe o scală
ordinală (calificarea profesională).
4. După forma de manifestare la nivelul unităţilor simple ale unei colectivităţi, se
disting:
o Caracteristici alternative – nu pot lua decât două valori. Se mai numesc şi
caracteristici binomiale sau binare.
EX: un candidat poate fi admis sau respins la un examen, un produs poate fi
bun sau rău.
o Caracteristici nealternative – pot lua valori diferite pentru câte unităţi sau
grupe statistice sunt.
7
1.5 Indicatorii statistici
Indicatorii statistici reprezintă rezultate numerice ale unei numărări, ale unei
măsurări statistice a fenomenelor şi proceselor de masă sau al unor calcule asupra datelor
obţinute printr-o înregistrare statistică.
Indicatorii statistici se pot grupa după mai multe criterii:
• După modul de determinare sunt:
o Indicatori primari – sunt rezultatul unei măsurători statistice şi exprimă, în
mărime absolută, o dimensiune oarecare a unei colectivităţi sau a unui
element al acesteia.
o Indicatori derivaţi – se obţin prin prelucrarea indicatorilor elementari.
• După gradul de cuprindere, indicatorii statistici sunt:
o Indicatori statistici sintetici – sunt expresii numerice ale
categoriilor economice de sinteză.
o Indicatori statistici analitici – exprimă componenţa pe
grupe sau structura unei colectivităţi.
• După forma de exprimare, se pot obţine:
o Indicatori statistici sub formă de mărimi absolute
o Indicatori statistici sub formă de mărimi relative
o Indicatori statistici sub formă de mărimi medii.
Complexitatea realităţii impune folosirea unui sistem de indicatori. Numai sub
formă de sistem, indicatorii statistici îşi au importanţa lor în cadrul analizei şi
caracterizării statistice a stării şi dezvoltării fenomenelor şi proceselor social-economice.
8
CAPITOLUL II SISTEMATIZAREA ŞI PREZENTAREA
DATELOR STATISTICE
9
Se cunosc următoarele tipuri de grupări statistice:
• După numărul caracteristicilor de grupare pot fi:
o Grupări simple – pp. separarea unităţilor unei colectivităţi pe grupe
omogene după variaţia unei singure caracteristici cuprinse în programul observării
statistice.
o Gruparea combinată – pp. separarea unităţilor în grupe omogene după
variaţia simultană a două sau mai multe caracteristici de grupare.
Dintre caracteristicile de grupare se alege o caracteristică primară după variaţia
căreia se distribuie pe grupe unităţile colectivităţii, obţinându-se o primă grupare. Apoi,
fiecare grupă se separă în subgrupe după variaţia celei de-a doua caracteristici de grupare,
numită caracteristică secundară de grupare.
• După natura caracteristicii de grupare pot fi:
o Grupări după o caracteristică de timp
o Grupări după o caracteristică de spaţiu
Aceste două tipuri sunt utilizate când timpul şi spaţiul constituie caracteristici
determinante pentru datele care se grupează.
o Gruparea după o caracteristică calitativă – pp. separarea unităţilor unei
colectivităţi în grupări după o caracteristică calitativă exprimată atributiv (prin cuvinte) şi
după o caracteristică calitativă exprimată cifric.
1. Gruparea după o caracteristică calitativă exprimată atributiv este cunoscută
în statistica socială sub denumirea de clasificare. Clasificările statistice au caracter oficial
şi au ca obiect evidenţierea grupelor tipice care definesc d.p.d.v. structural colectivitatea
(ex: gruparea economiilor naţionale pe ramuri şi subramuri, gruparea populaţiei pe
ocupaţii).
Când variaţia caracteristicii de grupare exprimată atributiv prezintă un număr
mare de modalităţi, categorii, acestea sunt cuprinse în nomenclatoare.
2. Gruparea după o caracteristică calitativă exprimată cifric duce la
obţinerea unor şiruri de date sistematizate, pe baza cărora se calculează indicatori
statistici derivaţi. Această grupare poate fi grupare după o caracteristică cu variaţie
discretă (variantele exprimate în numere întregi) şi grupare după o caracteristică cu
variaţie continuă (variantele exprimate în numere divizibile la infinit).
10
Gruparea după o caracteristică calitativă exprimată cifric se poate efectua fie pe
variante, fie pe intervale de variaţie. Gruparea pe variante se practică în cazul variabilelor
discrete, când numărul variantelor caracteristicii de grupare este redus. Gruparea pe
intervale de variaţie se foloseşte în cazul unei caracteristici continue cu număr mare de
valori.
11
Termenii unei astfel de serii reprezintă volumul unei colectivităţi date, la
momente diferite. Caracteristic este la aceste serii proprietatea că termenii lor nu se
cumulează, acestă operaţie neavând un sens real.
EX: Evoluţia numărului studenţilor unei grupe în decursul a 5 ani se prezintă
astfel:
Anii Nr. studenţilor
1 30
2 32
3 28
4 35
5 35
2. Seriile de timp de intervale sau cumulative privesc variaţia în timp a
colectivităţilor de mişcări, datele lor rezultând din observaţia şi înregistrarea continuă a
faptelor şi evenimentelor, pe măsura apariţiei lor.
EX: Evoluţia producţiei unei firme, într-o perioadă de 5 ani:
Anii Prod. (mld. lei)
1 9
2 8,5
3 10
4 12
5 11
Termenii acestor serii se pot cumula între ei.
b) Serii de spaţiu sau teritoriale – sunt seriile în care criteriul după care se
diferenţiază termenii este teritoriul.
EX: Producţia de eenrgie electrică, pe ţări, în 2002:
Ţara Prod. (mld. lei)
SUA 3699
Federaţia Rusă 834
România 53,5
Germania 551,5
Ungaria 35,4
Sursa: ASR 2001, pg. 972
12
După modul în care se exprimă calitatea, seriile calitative sunt de 2 feluri:
• Serii calitative cu atribut calitativ – sunt seriile în care elementul după care se
diferenţiază termenii se exprimă prin cuvinte sau expresii.
EX: Transportul de mărfuri, pe moduri de transport, în anul 2002:
Categorii de transport Mii t. Marfă
-transport feroviar 76512
-transport rutier 313701
-transport fluvial 14856
-transport maritim 4540
-transport aerian 10
-transport prin conducte 12480
Sursa: ASR 2001, pg. 515
• Serii calitative cu atribut cantitativ – sunt acelea în care elementul după care se
diferenţiază termenii este exprimat numeric.
EX: Gruparea salariaţilor unei firme după producţia săptămânală (mii tone), se
prezintă astfel:
Grupe salariaţi după prod. Mii t. marfă
0-5 10
5-10 20
10-15 50
15-20 30
20-25 10
În orice serie statistică, fenomenul este privit sub 2 aspecte principale:
- variabila independentă – exprimată prin atributul sau clasa după care s-a făcut
gruparea (xi).
- variabila dependentă – reprezintă funcţia, respectiv numărul unităţilor care
compun grupele, exprimată prin frecvenţe (ni).
Pentru şirul frecvenţelor se poate folosi fie efectivul, reprezentând frecvenţele
absolute, fie ponderea corespunzătoare, reprezentând frecvenţa relativă, notată cu
ni
fi = ⋅ 100
∑ ni
Frevenţa se poate cumula, atât cea în formă absolută (Ni), cât şi cea în formă
relativă (Fi).
13
2.3 Tabelele statistice
14
Grupe sal. după Grupe sal. după prod.
-4 4-6 6-8 8-10 10- TOTAL
vechime (ani) (buc.)
-5 3 2 1 - - 6
5-10 2 5 6 - - 13
10-15 - 3 7 10 - 20
15-20 - - 6 10 20 36
20 şi peste - - - 5 30 35
TOTAL 5 10 20 25 50 110
15
de figură şi se construieşte reproducând la scară redusă elementele de construcţie
folosite în reprezentarea grafică.
Reprezentarea grafică a seriilor de timp
Se realizează prin:
-cronogramă
-diagrama polară.
Cronograma sau historiograma sau diagrama de succesiune se poate construi
prin benzi, coloane, figuri geometrice şi liniar. Cronograma se bazează pe sistemul de axe
rectangulare, în care, pe abscisă se reprezintă timpul, iar pe ordonată valorile
fenomenului.
Cronograma liniară se utilizează pt. reprezentarea seriilor de timp de intervale şi
se poate construi atât pe scară aritmetică, cât şi logaritmică.
EX. cronogramă liniară pe scară aritmetică pt. reprezentarea unei serii de timp
de intervale:
Evoluţia producţiei a 2 firme într-o perioada de 5 ani (mil. lei):
Anii Prod. firmei Prod. firmei B
A
1 350 500
2 450 600
3 400 400
4 600 800
5 550 700
900
800 800
700 700
550
500 500 Prod. f irmei A
450
400 400 Prod. f irmei B
350
300
200
100
0
1 2 3 4 5
Anii
16
Dacă cronogramele liniare relevă tendinţa de evoluţie a fenomenului, cele prin
coloane arată volumul fenomenului.
EX. cronogramă prin coloane pt. reprezentarea unei serii de timp de momente.
Pp. următoarea evoluţie a numărului de elevi dintr-o şcoală:
Anii Nr. elevi
1 509
2 582
3 568
4 250
5 378
700
600
500
400
Nr. elevi
Nr. elevi
300
200
100
0
1 2 3 4 5
Anii
Diagramele polare sau diagrame radiale sau diagrame în spirală, se utilizează pt.
reprezentarea seriilor de timp cu oscilaţii sezoniere ciclice. Se construiesc cu ajutorul
reţelelor radiale sau curbilinii. La aceste grafice circumferinţa cercului serveşte pt.
notarea timpului, având rolul de abscisă. Mărimea razei cercului corespunde nivelului
indicatorilor seriei.
Diagramele polare se construiesc sub 2 forme:
-diagramă polară prin sectoare de cerc;
- diagramă polară prin segmente de dreaptă.
EX. diagramă polară
Pp. următoarea evoluţie lunară a producţiei unei firme (mil. lei):
Luna I II III IV V VI VII VIII IX X XI XII
Prod. 25 31 32 35 35 49 78 754 73 81 81 730
0 0 0 5 5 7 7 2 1 1
17
I
900
XII II
700
730
500
XI III
811 300250 310
320
100
X -100 355 IV
811
355 Prod.
732
IX V
497
754
VIII VI
787
VII
18
16
14
12 (5-10)
Nr. muncitori
10 (10-15)
8 (15-20)
6 (20-25)
4 (25-30)
2
0
Nr. piese
70
60
20-30
50 30-50
ni/R
50-80
40
80-90
30 90-110
110-120
20
10
Xi
19
EX. Distribuţia după timpul de deplasare spre locul de muncă a unui eşantion
de 45 de persoane (minute):
Gruparea după timpul Nr. pers.
de deplasare ni
xi
0-20 5
20-40 8
40-60 10
60-80 12
80-100 7
100-120 3
TOTAL 45
14
12
10 0-20
20-40
8
40-60
ni
6 60-80
80-100
4 100-120
Xi
20
25
20
20-30
15 30-40
40-50
ni
10 50-60
60-70
5
Xi
21
Cartodiagrama prezintă distribuţia în spaţiu a structurii unui fenomen.
Construirea unei cartograme pp. efectuarea următoarelor operaţii:
-determinarea structurii fenomenului cercetat;
-construirea unei hărţi cu unităţile teritoriale bine delimitate;
-construirea pe supraf. fiecărei unităţi teritoriale a unei diagrame de structură.
22
CAPITOLUL III INDICATORII STATISTICI
23
• Funcţia de sinteză, este specifică fenomenului care se manifestă diferit de la o
unitate la alta. De regulă, se calculează indicatori sub formă de valori medii.
• Funcţia de estimare, este specifică metodei statistice şi poate să se folosească
pentru măsurarea tendinţei de dezvoltare a fenomenului în aceeaşi perioadă de
timp, variabilă ca spaţiu sau calitativ sau în aceleaşi condiţii de spaţiu şi calitativ,
dar variabile în timp.
• Funcţia de verificare a ipotezelor şi de testare a semnificaţiilor unor
indicatori, este aplicată în interpretarea statistică a fenomenelor economice şi
sociale.
Verificarea ipotezelor conduce la folosirea indicatorilor care nu au ataşate o
singură valoare, ci un interval de valori.
Funcţiile indicatorilor statistici stau la baza clasificării lor.
24
Ca o trăsătură caracteristică a acestor indicatori primari se remarcă faptul că
elementele lor constitutive se regăsesc la nivelul tuturor unităţilor folosite la culegerea
datelor.
• Indicatori derivaţi, se obţin în faza de prelucrare statistică a mărimilor
absolute prin aplicarea diferitelor metode şi procedee de calcul statistic.
Indicatorii derivaţi fac posibilă analiza aspectelor calitative ale
fenomenelor şi proceselor cercetate. Ei exprimă relaţii cantitative dintre
diferite caracteristici statistice, dintre diferitele părţi ale unei colectivităţi
sau dintre fenomenele ce se găsesc într-un anumit grad de
interdependenţă.
De regulă, indicatorii derivaţi se obţin prin aplicarea unui model de calcul statistic
de comparare sau de estimare.
Modelele de estimare sunt folosite în statistică pentru a putea măsura gradul de
influenţă a diferiţilor factori asupra fenomenului analizat.
Indicatorii derivaţi au un caracter abstract, chiar dacă uneori se exprimă în unităţi
specifice de măsură. Aceştia sunt extrem de numeroşi şi cu metdologii variate de calcul
sub formă de mărimi relative, mărimi medii, indicatori ai variaţiei, indici, indicatori ce
caracterizează corelaţia.
25
a) Indicatorii de nivel exprimă aspectul cantitativ al fenomenelor, volumul unui
ansamblu sau valoarea unei caracteristici. Indicatorii de nivel se determină ca:
- indicatori individuali – se obţin în urma unei înregistrări statistice şi exprimă
valoarea caracteristicii observate la nivelul fiecărei unităţi statistice.
- Indicatori sintetici – reprezintă rezultatul centralizării pe grupe sau pe ansamblul
colectivităţii.
Însumarea directă a elementelor considerate în calculul indicatorilor sintetici este
posibilă doar pentru elemente omogene.
b) Indicatorii variaţiei absolute se obţin prin compararea, sub formă de scădere, a 2
nivele ale aceluiaşi indicator.
Variaţia absolută, numită şi spor, se simbolizează ∆1 / 0 şi se calculează pentru
x
sau în general: ∆ i / 0 = xi − xo
x
26
Exprimarea sub formă de coeficienţi este folosită când indicatorii comparaţi dau
un rezultat exact sau sunt valori apropiate. Arată de câte ori se cuprinde indicatorul de
raportat în baza de raportare.
Exprimarea sun formă de procente (sau promile) este folosită când indicatorul de
raportat este mult prea mic faţă de bază pentru ca raportul să fie sugestiv.
În analiza statistică se utilizează diferite tipuri de mărimi relative:
1. mărimi relative de structură
2. mărimi relative de corespondenţă
3. mărimi relative de intensitate
4. mărimi relative de variaţie.
1. Mărimile relative de structură
Calculul acestor mărimi este impus de necesitatea cunoaşterii aprofundate a
compoziţiei acelor colectivităţi care au fost separate în grupe sau subgrupe după variaţia
uneia sau mai multor caracteristici de grupare. Ele exprimă raportul dintre parte şi întreg
şi arată ponderea părţii, grupei faţă de totalul colectivităţii.
Într-o serie statistică atributivă, într-o serie teritorială sau pentru o variabilă
statistică construită pe baza unor componente, ponderea sau greutatea specifică a unui
n
element (xi) în totalul colectivităţii ( ∑xi ) se obţine pe baza relaţiei:
i =1
xi
fi = n
⋅ 100, i = 1, n
∑x
i =1
i
27
Considerate caracteristici derivate, în statistică, mărimile relative de intensitate se
obţin prin raportarea a doi indicatori absoluţi de natură diferită care se află într-o relaţie
de interdependenţă.
Mărimile relative de intensitate sunt exprimate în unităţile concrete de măsură ale
celor două variabile. Aceste mărimi evidenţiază gradul, intensitatea de răspândire a
fenomenului în raport cu variabila la care se raportează. Sunt utilizate în diverse domenii:
demografic, economic etc.
În demografie se utilizează pentru caracterizarea mişcării populaţiei. De ex.,
pentru caracterizarea mişcării naturale a populaţiei se calculează raportul dintre numărul
naşterilor, al deceselor, sporul natural şi numărul populaţiei dintr-o zonă, la un moment
dat.
În economie se utilizează pentru caracterizarea gradului de dotare, de înzestrare
tehnică a muncii, pentru calculul productivităţii muncii şi, în general, pentru determinarea
indicatorilor de eficienţă economică.
În domeniul social-cultural se utilizează pentru caracterizarea nivelului de trai.
În cazul în care diferenţa dintre indicatorii raportaţi (ca mărime) este prea mare,
pentru a obţine un rezultat semnificativ, raportul se înmulţeşte fie cu 1000, fie cu 10000.
4. Mărimile relative de variaţie
Numite şi mărimi relative ale dinamicii, ritmuri sau indicii dinamicii, exprimă
variaţia relativă a unei variabile între două momente sau perioade considerate, perioada
curentă sau efectivă, notată cu 1 şi perioada de bază, notată cu zero.
În funcţie de complexitatea fenomenului studiat, se pot calcula:
- indici elementari – descriu variaţia relativă a unei singure valori.
- indici sintetici – permit descrierea unui ansamblu de valori.
28
Total 422099
Sursa: ASR, 2001, pg. 515
76512
- pt. transp. feroviar: f i = ⋅ 100 = 18,12% ,
422099
313701
- pt. transp. rutier: f i = ⋅ 100 = 74,31%
422099
14856
- pt. transp. fluvial: f i = ⋅ 100 = 3,51%
422099
4540
- pt. transp. maritim: f i = ⋅ 100 = 1,07%
422099
10
- pt. transp. aerian: f i = ⋅ 100 = 0,002%
422099
12480
- pt. transp. prin conducte: f i = ⋅ 100 = 2,988%
422099
Proprietatea: 18,12+74,31+3,51+1,07+0,002+2,988=100%
29
-născuţi-vii 127111
-decese 156433
-căsătorii 62391
-divorţuri 11283
-născuţi-morţi 800
-decese la vârstă sub 1 2961
an
Sursa: ASR 1999, pg. 74
Să se calculeze mărimile relative de intensitate posibile, ştiind că nr. populaţiei
era de 22.502.803 locuitori.
nr. nascuti vii 127111
- coef. de natalitate = ⋅1000 = ⋅1000 = 5,64 ‰
nr . locuitori 22502803
nr. decedati 156433
- coef. de mortalitate = ⋅1000 = ⋅1000 = 6,95 ‰
nr . locuitori 22502803
nr. casatorii 62391
- coef. de nupţialitate = ⋅1000 = ⋅1000 = 2,77 ‰
nr . locuitori 22502803
nr. divorturi 11283
- coef. de divorţurilor = ⋅1000 = ⋅1000 = 0,50 ‰
nr . locuitori 22502803
nr. nascuti mor' i 800
- coef. morţi-natalitate = ⋅1000 = ⋅1000 = 0,03 ‰
nr . locuitori 22502803
nr. decese sub 1 an 2961
- coef. mortalităţii infantile= ⋅1000 = ⋅1000 = 0,13
nr . locuitori 22502803
‰
30
CAPITOLUL IV MĂRIMILE MEDII
31
Media este o metodă de separare a influenţelor venite pe calea factorilor
întâmplători în dezvoltarea colectivităţilor.
Media este o categorie metodologică a statisticii având rolul de a caracteriza în
mod sintetic nivelurile individuale ale unei caracteristici definite într-o colectivitate
statistică, scoţând în evidenţă ceea ce este esenţial, legic în conţinutul acelei caracteristici.
În statistică contemporană se utilizează un număr mare de mărimi medii care
diferă între ele atât prin definiţia lor, prin modul de calcul, cât şi prin conţinutul şi rolul
lor specific pe care îl au în cercetarea statistică.
Astfel, se cunosc:media aritmetică, media cronologică, media pătratică, mediile
mobile, media armonic, media geometrică, mediana, modul, mediala etc.
• În funcţie de modul de determinare, mărimile medii sunt:
-mărimi medii de poziţie, ce cuprind: mediana, modul şi mediala şi se determină prin
identificarea termenului care cuprinde în serie grupa elementelor normale, reprezentative.
-mărimi medii de calcul, cuprind toate celelalte medii.
În calculul acestor medii se succed 2 operaţii matematice:
-acumularea tuturor nivelurilor individuale (realizată prin însumare sau produs),
-revenirea la un nivel reprezentativ pentru toţi termenii incluşi în calcul (realizată prin
împărţire sau extragere de radical).
• După locul pe care-l ocupă în practica statisticii, mărimile medii pot fi:
- mărimi medii fundamentale, cuprind media aritmetică, mediana, modul şi se utilizează
în mod curent în statistică,
- mărimi medii cu aplicaţie specială, cuprind media geometrică, pătratică, armonică,
mobilă, progresivă, medii care se utilizează în cazuri speciale.
• În funcţie de felul seriei pentru care se calculează, mărimile medii sunt:
- medii simple, se calculează în serii simple,
- medii ponderate, se calculează în serii cu frecvenţe.
Indiferent de natura lor, mărimile medii trebuie să satisfacă mai multe condiţii
generale, cunoscute în literatura de specialitate sub denumirea de condiţiile lui Yule, după
numele statisticianului englez care le-a formulat pentru prima dată.
Aceste condiţii sunt:
32
-mărimile medii trebuie definite în mod precis şi obiectiv, indiferent de aprecierea
subiectivă a fiecărui cercetător;
-mărimile medii trebuie să fie reprezentative, adică să reprezinte toţi termenii seriei;
-media trebuie să aibă o semnificaţie concretă, uşor de conceput şi observat chiar pentru
nespecialişti;
-media trebuie să fie simplu de calculat şi să se preteze la calcule algebrice ulterioare;
-media trebuie să fie cât mai puţin sensibilă la fluctuaţiile de selecţie. Adică, indiferent
prin ce eşantioane s-ar obţine datele asupra unei colectivităţi, media rezultată trebuie să
fie aproximativ aceeaşi.
În general, nu toate aceste condiţii pot fi satisfăcute de orice mărime medie.
Media aritmetică
Definiţie şi mod de calcul
Media aritmetică este cel mai des utilizată în practica statisticii, făcând parte din
categoria mediilor fundamentale şi de calcul.
Notată cu x , media se calculează atât pentru serii simple, cât şi pentru serii cu
frecvenţe.
Media aritmetică simplă se foloseşte pentru seriile în care fiecare nivel al
caracteristicii este purtat de o singură unitate statistică.
Calculul acestei medii presupune însumarea nivelurilor individuale ale
caracteristicii şi împărţirea la numărul lor.
Considerăm seria: x1, x2, x3,...,xn. Media aritmetică se va calcula astfel:
n
x + x 2 + x 3 + ... + x n
x= 1 sau ∑x i
, i =1, n , n=volumul colectivităţii
n x= i =1
33
n
∑x i
700 + 650 + 850 + 750 + 500 + 450 mil. lei.
x= i =1
= = 650
n 6
Media aritmetică ponderată se foloseşte în cazul seriilor cu frecvenţe. În acest
caz, se va ţine seama de mărimea frecvenţei corespunzătoare fiecărui nivel al
caracteristicii.
Dacă x1, x2, x3,...,xm sunt niveluri individuale ale ale caracteristicii, iar n1, n2,
n3,...,nm nivelurile corespunzătoare frecvenţelor, atunci media ponderată se va calcula
astfel:
n
x 1 n 1 + x 2 n 2 + x 3 n 3 + ... + x n n m
∑x n i i
x= sau x= i =1
n 1 + n 2 + ... + n m n
∑n
i =1
i
∑x n i i
1086
x= i =1
n
= = 15,5 buc.
70
∑n i =1
i
Când într-o serie calitativă cu atribut cantitativ, caracteristica este dată sub formă
de intervale, înainte de a aplica relaţia de calcul a mediei, se va proceda la înlocuirea
fiecărui interval prin câte o singură variantă a caracteristicii. Această variantă este dată de
centrul intervalului, determinat ca o medie aritmetică simplă a limitelor intervalelor.
Ex. Gruparea muncitorilor după timpul nefolosit productiv zilnic (minute):
Grupe muncit. Nr. muncit. xi xini
după timp ni
10-20 5 1 75
20-30 15 5 375
34
30-40 20 2 700
40-50 30 5 1350
50-60 10 3 550
60-70 5 5 325
70-80 7 4 525
80-90 3 5 255
5
5
6
5
7
5
8
5
Total 95 - 4155
Să se determine timpul nefolosit productiv zilnic în medie de un muncitor.
n
∑x n i i
4155
x= i =1
n
= = 43,7 minute.
95
∑n
i =1
i
b. Media aritmetică a unui şir de valori constante este egală cu acea constantă
Dacă în seria x1, x2, x3,..., xi,...,xm
n1, n2, n3,...,nm
considerăm că x1=x2= x3=...= xi=...=xm=k,
35
n n
∑ x n ∑ kn
i i i
atunci: x = = =k
i =1 i =1
n n
∑n
i =1
i ∑n
i =1
i
∑ (x i − a) ⋅ n i
-pt. serii ponderate: x= i =1
n
+a
∑n
i =1
i
36
Pentru obţinerea unor simplificări maxime a calculelor, valoarea constantei „k” se
alege egală cu cel mai mare divizor comun al variabilelor xi.
f. Dacă frecvenţele seriei se micşorează de un număr „c” de ori, atunci media
aritmetică rămâne neschimbată.
Această proprietate se aplică numai seriilor cu frecvenţe.
n
ni 1 n n
∑i=1 x i ⋅ c c ∑i=1 x i n i ∑x n i i
x= n = = i =1
=x
ni 1 n n
∑i=1 c ∑ ni
c i =1
∑n
i =1
i
Valoarea constantei „c” se consideră agelă cu cel mai mare divizor comun al
frecvenţelor, pentru a obţine o simplificare mai mare a calculelor.
g. Suma algebrică a abaterilor nivelurilor individuale ale caracteristicii de la
media lor este egală cu zero.
∑ (x i − x) = 0
∑x
∑ (x − x) = ∑ x i − ∑ x = ∑ x i − n ⋅ x = ∑ x i − n ⋅
i
i =0
n
Această proprietate ne arată că media caracteristicii este o valoare reprezentativă a
seriei.
Utilizând concomitent proprietăţile enunţate se obţin următoarele formule de
calcul simplificat al mediei aritmetice:
n
xi − a
-pt. serii simple: ∑ k
x= i =1
⋅k + a
n
n
xi − a ni
∑ k
⋅
c
-pt. serii ponderate: x= i =1
⋅k+ a
n
ni
∑i=1 c
Ex. Gruparea muncitorilor după nr. de piese realizate lunar se prezintă astfel:
Grupe muncit. Nr. muncit. xi xini a=290 k=10 c=5 xi − a ni
dupa prod. ni xi-a xi −a ni ⋅
k c
k c
245-255 5 25 1250 -40 -4 1 -4
255-265 10 0 2600 -30 -3 2 -6
37
265-275 20 26 5400 -20 -2 4 -8
275-285 30 0 8400 -10 -1 6 -6
285-295 50 27 1450 0 0 10 0
295-305 40 0 0 10 1 8 8
305-315 15 28 1200 20 2 3 6
315-325 5 0 0 30 3 1 3
325-335 5 29 4650 40 4 1 4
0 1600
30 1650
0
31
0
32
0
33
0
Total 180 5205 0 0 36 -3
0
Să se determine nr. mediu de piese realizate lunar de un muncitor cu ajutorul
calculului simplificat al mediei aritmetice.
n
∑x n i i
52050
-media aritmetică ponderată: x = = = 289 piese
i =1
n
180
∑n
i =1
i
n
xi − a ni
∑ k
⋅
c −3
-calcul simplificat: x= i =1
⋅k + a = ⋅ 10 + 290 = 289 piese.
n
ni 36
∑i=1 c
38
Dacă notăm cu „n” numărul total al unităţilor colectivităţii şi cu „n1” efectivul
acelor unităţi care au valoarea 1, atunci efectivul celor care nu poartă acea caracteristică
va fi (n-n1).
Media, în cazul caracteristicii alternative, este egală cu ponderea unităţilor care
poartă caracteristica în totalul unităţilor colectivităţii. Aceasta se notează cu „p” şi se
calculează astfel:
n1
p=
n
Media unităţilor care nu poartă acea caracteristică se notează cu „q” şi se
determină astfel:
n − n1
q=
n
Între p şi q se verifică relaţia:
p+q=1.
Ex. Dintr-un lot de 500 de piese supuse controlului de calitate s-au găsit 60 de
piese rebut. Să se determine media rebuturilor din lot şi media unităţilor care nu poartă
caracteristica de rebut.
n=500
n1=60
n1 60
p= = = 0,12 sau 12%
n 500
La fiecare 100 piese recepţionate pot să apară câte 12 rebuturi.
n − n 1 500 − 60
q= = = 0,88 sau 88%
n 500
p+q=0,12+0,88=1.
Modul
39
Modul este valoarea caracteristicii cel mai des observată într-o distribuţie,
respectiv valoarea ce corespunde frecvenţei dominante. Ca urmare, modul se determină
numai în cazul seriilor cu frecvenţe.
În cazul seriilor în care caracteristica se prezintă sub formă de variante, pentru
aflarea modului parcurgem etapele:
-se găseşte frecvenţa maximă a seriei;
-se identifică modul ca fiind valoarea caracteristicii corespunzătoare frecvenţei maxime.
Dacă seria este plurimodală, atunci modul este dat de valoarea caracteristicii care
se întâlneşte cel mai frecvent.
Ex. Gruparea muncitorilor după producţia lunară (metri) se prezintă astfel:
40
Grupe muncit.
Nr. muncit.
după prod.
ni
xi
100 10
120 30
150 50
170 60
200 20
220 10
Să se determine producţia medie lunară pe un muncitor cu ajutorul modului.
-frecvenţa maximă = 60
-modul = 170.
modal,
∆2 = diferenţa dintre frecvenţa intervalului modal şi frecvenţa intervalului următor celui
modal.
Pe cale grafică, modul se determină pe baza histogramei. Se reprezintă grafic seria
cu ajutorul hististogramei, urmând apoi determinarea punctului densităţii maxime a
frecvenţelor, în cadrul intervalului modal. Pentru aceasta, în coloana cea mai înaltă,
corespunzătoare intervalului modal, se trasează diagonalele care unesc colţurile bazei de
sus a acestuia cu colţurile coloanelor vecine. Din punctul lor de intersecţie se coboară
perpendiculară pe axa absciselor şi mărimea obţinută este modul.
41
Modul are avantajul de a fi determinat foarte rapid şi are semnificaţie directă,
simplă. Se utilizează pentru a obţine o primă estimare a valorii centrale a unei distribuţii.
Ex. Gruparea salariaţilor unui atelier după producţia zilnică (metri) se prezintă
astfel:
Grupe sal.
Nr. sal.
după prod.
2-6 4
6-10 6
10-14 7
14-18 15
18-22 10
22-26 3
Total 45
Să se determine producţia medie zilnică cu ajutorul modului, prin calcul şi grafic.
-frecvenţa maximă = 15,
-interv. Modal = (14-18),
∆1 8
- Mo = x 0 + d ⋅ = 14 + 4 ⋅ = 16,46 m
∆1 + ∆ 2 8+5
x o = 14 , d = 4, ∆1 = 15 − 7 = 8, ∆1 = 15 −10 = 5
16
14
12
10
8 s a l.
6
4
2
0
2 -6 6 -1 0 1 0 -1 4 1 4 -1 8 1 8 -2 2 2 2 -2 6
42
Mediana
n +1
rangul , după ce în prealabil seria a fost ordonată crescător, unde n = nr.
2
termenilor.
43
25, 28, 30, 32, 35, 40
30 + 32
- Me = = 31 mii t.
2
Pentru seriile cu frecvenţe, mediana se poate obţine prin calcul şi grafic. Şi aici
întâlnim 2 situaţii:
-când caracteristica se prezintă sub formă de variante, pentru obţinerea medianei prin
calcul, efectuăm operaţiile:
o determinăm şirul frecvenţelor cumulate Ni;
U Me =
∑n i
=
100
= 50
2 2
Me = 25 minute.
44
120
100 95
100
90
80
Ni
60
50
40
20 20
0 5
15 20 25 30 35 40
timp
-când caracteristica se prezintă sub formă de intervale de variaţie, mediana se obţine prin
calcul parcurgând următoarele etape:
o se determină şirul frecvenţelor cumulate Ni;
45
18-20 5 100
Total 100
Să se determine producţia medie zilnică cu ajutorul medianei, prin calcul şi grafic.
U Me =
∑n i
=
100
= 50
2 2
x 0 = 12 , d = 2, Na = 45, n Me = 30
U Me − Na 50 − 45
Me = x 0 + d ⋅ = 12 + 2 ⋅ = 12,33 buc.
n Me 30
Quantilele
Quantilele sunt mărimi medii de poziţie din sistemul medianei. Sunt valori ale
caracteristicii care împart seria într-un număr de grupe cu efective egale. Quantilele
folosite în mod obişnuit sunt cele care împart colectivitatea în patru, zece sau o sută de
părţi egale, numite quartile, decile, centile. Quantilele se folosesc în calculul unor
indicatori ai dispersiei.
Quartilele
Sunt în număr de trei şi împart efectivul colectivităţii în patru părţi egale. Se
determină astfel:
U Q1 − Na
Q1 = x 0 + d ⋅
n Q1
U Q 2 − Na
Q2 = x0 + d ⋅
n Q2
U Q 3 − Na
Q3 = x 0 + d ⋅
n Q3
46
UQ1, UQ2, UQ3 = unităţile quartilice;
Na = frecvenţa cumulată anterioară intervalului quartilic;
nQ1, nQ2, nQ3 = frecvenţele reale ale intervalului quartilic.
Pentru determinarea quartilelor se procedează astfel:
-se determină şirul frecvenţelor cumulate Ni;
-se calculează unităţile quartilice după relaţiile:
U Q1 =
∑n i
; U Q2 =
2∑ n i
=
∑n i
= U Me ; U Q3 =
3∑ n i
4 4 2 4
-se caută locul unităţilor quartilice pe şirul frecvenţelor cumulate;
-se identifică intervalele quartilice ca fiind intervalele corespunzătoare unităţilor
quartilice;
-se aplică formula.
Quartilele se pot obţine şi pe cale grafică cu ajutorul curbei frecvenţelor cumulate,
asemănător medianei.
Ex. Gruparea firelor după rezistenţa la rupere se prezintă astfel:
Grupe fire Nr. fire Ni↓
după ni
rezistenţă
-2 6 6
2-4 5 11
4-6 10 21
6-8 14 35
8-10 9 44
10-12 21 65
12-14 35
100
14-16 5
16-18 2 105
18-20 3 107
110
Total 110
Să se determine mărimile medii de poziţie din sistemul medianei, prin calcul şi
grafic.
U Q1 − Na
• Q1 = x 0 + d ⋅
n Q1
U Q1 =
∑n i
=
110
= 27,5
4 4
Intervalul quartilic 1 este (6-8).
x0 = 6; d = 2; UQ1= 27,5; Na = 21; nQ1 = 14.
47
27 ,5 − 21
Q1 = 6 + 2 = 6,92
14
U Q 2 − Na
• Q2 = x0 + d ⋅
n Q2
U Q2 =
∑n i
=
110
= 55
2 2
Intervalul quartilic 2 este (10-12).
x0 = 10; d = 2; UQ1= 55; Na = 44; nQ1 = 21.
55 − 44
Q 2 = 10 + 2 = 11,04
21
U Q 3 − Na
• Q3 = x 0 + d ⋅
n Q3
3∑ n i 3 ⋅ 110
U Q3 = = = 82,5
4 4
Intervalul quartilic 1 este (12-14).
x0 = 12; d = 2; UQ1= 82,5; Na = 65; nQ1 = 35.
82 ,5 − 65
Q 3 = 12 + 2 = 13
35
Decilele
Sunt în număr de 9 şi împart efectivul colectivităţii în 10 părţi egale. Se determină
în mod asemănător medianei şi quartilelor, după relaţiile:
U D1 − Na
D1 = x 0 + d ⋅
n D1
U D 2 − Na
D2 = x0 + d ⋅
n D2
D5 = Me = Q2
U D 9 − Na
D9 = x 0 + d ⋅
n D9
U D1 =
∑n i
10
48
2∑ n i ∑n i
U D2 = =
10 5
9∑ n i
U D9 = .
10
Centilele
Sunt în număr de 99 şi împart efectivul colectivităţii în 100 părţi egale. Se
determină asemănător celorlalte mărimi medii de poziţie din sistemul medianei.
Mediala
49
Ex. Distribuţia elevilor dintr-o şcoală după rezultatele obţinute la un test (nr.
puncte):
Grupe elevi
Nr. elevi
după nr. puncte xini Li↓
ni
xi
6 45 270 270
7 80 560 830
8 72 576 1406
9 75 675 2081
10 68 680 2761
Total 340 276
1
Să se determine numărul mediu de puncte obţinut de un elev, cu ajutorul medialei,
prin calcul şi grafic.
U Ml =
∑x n i i
=
2761
= 1380 ,5 ≥ 1406
2 2
Ml = 8 puncte.
În cazul seriilor cu frecvenţe şi caracteristica sub formă de intervale de variaţie,
mediala se determină tot prin calcul şi grafic.
Prin calcul se parcurg operaţiile:
-se determină produsele x i n i ;
-se calculează şirul produselor x i n i cumulate, notate cu Li;
50
Pe cale grafică, mediala se determină asemănător situaţiei precedente.
Ex. Distribuţia după timpul de deplasare a unui eşantion de persoane se
prezintă astfel:
Grupe pers. Nr. pers.
xi xini Li↓
după timp (min) ni
0-30 25 15 375 375
30-60 45 45 2250 2625
60-90 75 75 4500 7125
90-120 105 10 4725 11850
120-150 135 5 2025 13875
150- 165 13 825 14700
5
16
5
Total 340 1470
0
Să se determine timpul mediu de deplasare cu ajutorul medialei prin calcul şi grafic.
xi = mijlocul intervalelor.
U Ml =
∑x n i i
=
14700
= 7350
2 2
Interv. medial = 90-120.
x0 = 90; d = 30; UMl= 7350; La = 7125; x i n iMl = 4725.
U Ml − La 7350 − 7125
Ml = x 0 + d ⋅ = 90 + 30 = 91,42'
x i n i Ml 4725
51
Mărimi medii cu aplicaţii speciale
4.6.1 Media cronologică
4.6.2 Media armonică
4.6.3 Mediile mobile
4.6.4 Media progresivă
4.6.5 Media geometrică
4.6.6 Media pătratică
52
x1 x 700 650
+ x 2 + x 3 + x n −1 + n + 710 + 750 + 650 + 640 +
x cr = 2 2 = 2 2 = 685
n −1 6 −1
salariaţi.
Media cronologică ponderată se calculează atunci când intervalele de timp dintre
termenii seriilor de momente sunt inegale.
În acest caz, mediile parţiale, din care se calculează media întregii perioade, sunt
ponderate cu durata perioadelor parţiale dintre termenii seriei, notate cu ti.
x1 + x 2 x + x3 x + xn
t1 + 2 t 2 + + n −1 t n −1
x cr = 2 2 2
t 1 + t 2 + + t n −1
Ex. Numărul salariaţilor unei firme la diferite momente de timp:
Data 01.0 01.0 01.0 01.0 01.07
1 2 4 6
Nr. sal. 400 450 500 520 480
Să se determine nr. mediu lunar al salariaţilor.
t1 = 1 lună, t2 = 2 luni, t3 = 2 luni, t4 = 1 lună
x1 + x 2 x + x3 x + xn
t1 + 2 t 2 + + n −1 t n −1
x cr = 2 2 2 =
t 1 + t 2 + + t n −1
400 + 450 450 + 500 500 + 520 520 + 480
⋅1 + ⋅2+ ⋅2+ ⋅1
= 2 2 2 2 = 482 salariati
1+ 2 + 2 +1
xh =
∑n i
53
Media armonică este influenţată mai mult de valorile mici ale seriei, pe când
media aritmetică este influenţată de valorile mari.
În practică statisticii este utilizată, în special, în calculul indicelui mediu armonic
ponderat.
Ex. Salariul mediu orar şi fondul de salarii la 3 ateliere ale unei firme:
Atelier Salariu mediu Fond de salarii
xi ni
1 550.000 90.000.000
2 60.000 130.000.000
3 50.000 80.000.000
Total 300.000.000
Să se determine salariul mediu orar pe firmă.
xh =
∑n i
=
300.000.000
=
1 1 1 1
∑ x ⋅n i
55.000
⋅ 90.000.000 +
60.000
⋅ 130.000.000 +
50.000
⋅ 80.000.000
i
= 55.524 lei
4.6.3 Mediile mobile
x1 =
x1 + x 2 + x 3
, x2 =
x2 + x3 + x4
, , x n−2
=
x n − 2 + x n −1 + x n
.
3 3 3
-mediile mobile din câte 4 termeni:
x1 =
x1 + x 2 + x 3 + x 4 x + x3 + x4 + x5
, x2 = 2 , , x n −3
=
x n −3 + x n − 2 + x n −1 + x n
.
4 4 4
Mediile mobile se utilizează în ajustarea seriilor care caracterizează variaţia
sezonieră a fenomenelor economico-sociale. Pentru mediile mobile calculate dintr-un nr.
impar de termeni se stabileşte uşor termenul seriei înlocuit prin media mobilă. Nu acelaşi
54
lucru se întâmplă în cazul mediilor mobile calculate dintr-un nr. par de termeni. Pentru
aceştia se va proceda la centrarea mediilor mobile obţinute în prima etapă.
Centrarea constă în determinarea unor medii aritmetice din câte două medii
mobile consecutive.
Ex. Conflictele colective de muncă şi frecvenţa lor lunară au evoluat astfel:
Luna Nr. conflicte
I 13
II 17
III 5
IV 9
V 12
VI 16
VII 15
VIII 19
IX 15
X 12
XI 4
XII 4
Total 141
Să se determine numărul mediu al conflictelor de muncă cu ajutorul mediilor
mobile calculate din câte 5 şi 6 termeni.
Medii mobile din câte 5 termeni
x 1 + x 2 + x 3 + x 4 + x 5 13 + 17 + 5 + 9 + 12
x1 = = = 11,2
5 5
x 2 + x 3 + x 4 + x 5 + x 6 17 + 5 + 9 + 12 + 16
x2 = = = 11,8
5 5
x 3 + x 4 + x 5 + x 6 + x 7 5 + 9 + 12 + 16 + 15
x3 = = = 11,4
5 5
x 4 + x 5 + x 6 + x 7 + x 8 9 + 12 + 16 + 15 + 19
x4 = = = 14,2
5 5
x 5 + x 6 + x 7 + x 8 + x 9 12 + 16 + 15 + 19 + 15
x5 = = = 15,4
5 5
x 6 =15 ,4 x 7 =13 x 8 =10 ,8 .
55
x 3 =12 ,6 x 4 =14 ,3 x 5 =14 ,8 x 6 =13 ,5 x 7 =11 ,5 .
x 3 + x 4 12 ,6 + 14 ,3 x 4 + x 5 14 ,3 + 14 ,8
x III = = = 13,45 x IV = = = 14 ,55
2 2 2 2
Colectivităţile îşi au progresivitatea lor, fie că este privită în timp sau sub aspect
calitativ.
Media progresivă reprezintă o medie a tipurilor de nivel calitativ superior în
cadrul unei colectivităţi date. În mod practic, media progresivă se găseşte între media
aritmetică generală a seriei şi media termenilor calitativ superiori ai aceleiaşi serii.
x + xs
x progr = , unde:
2
x = media generală a seriei;
x s = media termenilor calitativ superiori mediei generale.
În cazul fenomenelor în care superioritatea se exprimă cantitativ printr-o regresie,
se ţine seama de acest specific al seriei. Ex.: costuri, cheltuieli, preţuri, consumuri. În
acest caz, x s se va calcula din termenii seriei mai mici decât media generală.
Ex. Evoluţia producţiei unor firme dintr-un sector de activitate (mld. lei):
Grupe
firme Nr. firme
după prod. ni
xi
40 5
60 10
80 30
110 8
120 2
Total 55
Să se determine producţia medie a unei firme cu ajutorul mediei progresive.
56
x + xs
x progr =
2
n
∑x n i i
40 ⋅ 5 + 60 ⋅ 10 + 80 ⋅ 30 + 110 ⋅ 8 + 120 ⋅ 2
x= i =1
n
= = 78,5 mld. lei
55
∑n
i =1
i
80 ⋅ 30 + 110 ⋅ 8 + 120 ⋅ 2
xs = = 88 mld. lei
55
78 ,5 + 88
x progr = = 83 ,25 mld. lei
2
Ex. Gruparea firmelor după cheltuielile materiale (mil. lei) se prezintă astfel:
Grupe
Nr. firme
firme xi xini
ni
după chelt.
100-150 3 12 375
150-200 10 5 1750
200-250 25 17 5625
250-300 30 5 8250
300-350 15 22 4875
350-400 8 5 3000
400-450 9 27 3825
5
32
5
37
5
42
5
Total 340 27700
Să se determine nivelul mediu al cheltuielilor materiale pe o firmă cu ajutorul
mediei progresive.
x + xs
x progr =
2
n
∑x n i i
27700
x= i =1
n
= = 277 mil lei
100
∑n
i =1
i
57
58
4.6.5 Media geometrică
x g = ∑ n x 1n ⋅ x n2 ⋅ ⋅ x nm
i 1 2 m
Creşterea medie anuală a cifrei de afaceri este de 1,145 ori sau cu 14,5%.
Este o mărime medie calculată prin extragerea rădăcinii pătrate din media
aritmetică a pătratelor termenilor seriei.
∑n i
59
după venit ni
100-140 3 12 1440 43200
140-180 10 0 0 256000
180-220 30 16 2560 1200000
220-260 20 0 0 1152000
260-300 12 20 4000 940800
0 0
24 5760
0 0
28 7840
0 0
Total 75 3592000
Să se determine veniturile medii săptămânale cu ajutorul mediei pătratice.
x patr =
∑x ⋅n
2
i i
=
3592000
= 218,8 mii lei.
∑n i 75
60
Modul, fiind valoarea cea mai des întâlnită, cea mai frecventă într-o serie, este
valoarea cea mai tipică sau cea mai probabilă, dar neţinând seama de toate valorile seriei
ca şi mediana, se găseşte sub semnul aproximării.
De asemenea, mediana şi modul, mai au dezavantajul de a nu fi utilizate în calcule
algebrice, dezavantaj compensat însă de faptul că sunt mărimi foarte uşor de obţinut.
61
CAPITOLUL V DISPERSIE ŞI ASIMETRIE
Noţiunea de dispersie
62
5.2 Indicatorii simpli şi sintetici ai dispersiei
Acest indicator nu ţine seama de toate valorile observate, ci doar de cele extreme
care, în cazul când sunt aberante, denaturează imaginea fenomenului de dispersie.
În mărime relativă, amplitudinea variaţiei se determină ca raport între amplitudinea
absolută şi nivelul mediu al caracteristicii:
x max − x min
Ax % = ⋅ 100 , unde:
x
x max , x min = nivelul maxim, respectiv minim al variabilei X;
63
xi − x
di% = ⋅ 100
x
n n
∑ d ⋅n ∑ x − x ⋅ n i i i i
-pentru serii cu frecvenţe: d= = i i
, când n1 ≠ n2 ≠ ... ≠ n n
∑ n ∑n i
i
i
i
∑d ∑(x ) 2
i
2
i −x
-pentru serii simple: σ2 = i
= i ,
n n
∑d ⋅n ∑ ( x − x)
2
i
2
i i ⋅ ni
-pentru serii cu frecvenţe: σ 2
= i
= i
.
∑n i
i ∑n i
i
∑d ∑ (x ) 2
2
i i −x
-pentru serii simple:
σ = i
= = i
= σ2
n n
2
Elisabeta Jaba, Statistica, Ed. Economică, Bucureşti, 2002, pg. 149
64
∑d ⋅n ∑ ( x − x)
2
i
2
i i ⋅ ni
-pentru serii cu frecvenţe: σ = i
= = i
= σ2
∑n i
i ∑n i
i
Abaterea medie pătratică, fiind calculată ca o medie pătratică, reflectă într-o măsură
mai mare influenţa factorilor aleatori comparativ cu abaterea medie liniară. Acest
indicator se utilizează, de regulă, pentru caracterizarea seriilor teoretice şi se exprimă în
unitatea de măsură a mediei seriei de date.
4. Intervalul mediu de variaţie – se poate calcula pe baza indicatorilor sintetici ai
dispersiei. Acesta este definit de următoarele limite:
x − d x − σ
x± d = , respectiv x± σ =
x + d x + σ
Într-o distribuţie normală standard, în intervalul mediu (x ±σ) apar 68,27% din
cazuri; 95,45% pentru ( x ± 2σ) , respectiv 99,97% din cazuri pentru (x ±3σ) .
5. Coeficientul mediu de variaţie – se utilizează atunci când unităţile de măsură folosite
pentru exprimarea indicatorilor sintetici trebuie aduse la aceeaşi bază de semnificaţie. Se
calculează ca raport procentual între abaterea medie liniară sau abaterea medie pătratică
şi media aritmetică astfel:
d σ
ν= ⋅100 , respectiv ν = ⋅100 .
x x
Coeficientul de variaţie poate lua valori cuprinse în intervalul (0;100%). Când ν
tinde spre zero, se consideră o variaţie slabă şi deci o colectivitate omogenă, iar media are
un grad de reprezentativitate ridicat. Cu cât nivelul coeficientului de variaţie tinde spre
100%, cu atât variaţia este mai intensă, colectivitatea mai eterogenă, iar media are un
nivel de reprezentativitate mai scăzut. Prin urmare, coeficientul de variaţie poate fi folosit
şi ca test de semnificaţie a reprezentativităţii mediei, considerându-se următoarele praguri
de semnificaţie:
65
0 < ν < 1 7% m e de isa tset r i rc et p r e zt ei vn at a
1 7 %< ν < 5 3 % m e de isa tme o d er re ap tr e zt ei vn at a
3 5 %< ν < 5 0 % m e de isa tree p r e zt ei vniatnsa e nl as r g
ν > 5 0 % m e de isa tne e r e p rt ea zt ievna .
Ex. Firma SC. Seromgal S.A. a vândut în anul 2004 produsul agroalimentar
„tomate” prin cele cinci ferme la preţuri diferite. Utilizând indicatorii simpli şi sintetici ai
dispersiei, vom determina preţul mediu de vânzare al produsului şi varianţa acestuia.
xi (x i −x ) xi − x
⋅100 xi − x (x i −x ) 2
x
6756 113 1,7 113 12769
6853 210 3,16 210 44100
6432 -211 -3,18 211 44521
6500 -143 -2,15 143 20449
6674 31 0,47 31 961
3321 0 - 708 122800
5
Media aritmetică:
∑x i
33215
x= i
= = 6643 mii lei.
n 5
Indicatorii simpli ai dispersiei:
Amplitudinea variaţiei
- în mărimi absolute:
Ax = x max − x min = 6853 − 6432 = 421 mii lei
- în mărimi relative:
x max − x min 421
Ax % = ⋅ 100 = ⋅ 100 = 6,34%
x 6643
Rezultatele obţinute ne arată că, câmpul de variaţie al preţului de vânzare al
tomatelor prin cele cinci ferme este de 421 mii lei, ceea ce reprezintă 6,34% din preţul de
vânzare al produsului.
Abaterea individuală
- în mărimi absolute:
(
d i = xi − x )
d1 = 113 ; d 2 = 210 ; d 3 = −211 ; d 4 = −143 ; d 5 = 31
66
- în mărimi relative:
xi − x
di = ⋅100
x
d 1 =1,7; d 2 = 3,16 ; d 3 = −3,18 ; d 4 = −2,15 ; d 5 = 0,47
∑x i −x
708
d= i
= = 141,6 mii lei
n 5
Preţul de vânzare prin cele cinci ferme se abate în medie cu 141,6 mii lei faţă de
preţul mediu, în ambele sensuri, intervalul mediu de variaţie stabilit cu ajutorul acestui
indicator având următoarele limite:
x − d = 6 6 4− 13 4,61= 6 5 ,04 1m li ie i
x± d =
x + d = 6 6 4+ 13 4,61= 6 7 8,6 4m li ei i
Varianţa:
∑( x ) 2
i −x
122800
σ2 = i
= = 24560 mii lei
n 5
Abaterea medie pătratică:
∑ (x ) 2
i −x
mii lei
σ = = i
= σ 2 = 24560 = 156,72
n
Intervalul mediu de variaţie:
67
extreme, prin ridicarea la pătrat, au o influenţă mai mare decât abaterile intermediare mai
apropiate de medie. Deci, abaterea medie pătratică caracterizează mai bine variaţia
fenomenelor.
Coeficientul de variaţie:
σ 156 ,72
ν= ⋅ 100 = ⋅ 100 = 2,36 % < 17% , relevă o colectivitate omogenă,
x 6643
∑ (x ) 2
− x ⋅ ni
∑ (x ∑x n ∑x n ∑n
2 2
i 2
i − 2x i x + x )n i 2
i i i i x i
σ =
2 i
= = − 2x ⋅ + =
∑n i
i ∑n i
i ∑n i ∑n i ∑n i
2 2 2
= x 2 − 2x + x = x 2 − x
• Dispersia unui şir de valori constante este egală cu zero, întrucât toate
variantele caracteristicii sunt egale între ele şi egale cu media lor
aritmetică.
• Dispersia calculată din abaterile variantelor caracteristicii faţă de constanta
„a” este mai mare decât dispersia calculată din aceleaşi variante faţă de
media lor cu pătratul diferenţei dintre medie şi constanta „a”.
∑(x − a)
2
i
-pentru serii simple: σ2 = i
− (x − a ) 2 ,
n
∑ ( x − a)
2
i ⋅ ni
-pentru serii cu frecvenţe: σ 2
= i
− (x − a ) 2 .
∑n i
i
68
• Dacă fiecare nivel al caracteristicii se micşorează de „k” ori, atunci dispersia se
micşorează de „k2” ori.
2
x −x
-pentru serii simple: ∑i i k ,
σ2 = ⋅ k2
n
2
x −x
∑i i k ⋅ n i
-pentru serii cu frecvenţe: σ2 = ⋅ k2 .
∑ in
i
• Dacă se împarte fiecare nivel al frecvenţelor printr-o constantă „c”, atunci dispersia
rămâne neschimbată.
∑ (x ) 2 ni
i −x ⋅
c
σ2 = i
ni
∑ i c
Aceste proprietăţi sunt folosite pentru calculul simplificat al dispersiei. Din
combinarea lor se ajunge la formulele care conduc la cea mai mare simplificare a
calculelor.
2
xi − a
-pentru serii simple: ∑
i k
,
σ =
2
⋅ k 2 − (x − a ) 2
n
2
xi − a ni
∑
i
⋅
k c 2
-pentru serii cu frecvenţe: σ =
2
⋅ k − (x − a ) 2 .
ni
∑i c
Ex. Gruparea salariaţilor unei unităţi comerciale după volumul vânzărilor
zilnice (mii lei):
Grupe sal. Nr. sal. xi xi −a xi − a ni xi − a xi −a 2 xi −a 2
după vanz ni ( ) ( )
k c k k k
ni ni
c c
1150-1250 5 120 -300 -3 1 -3 9 9
1250-1350 15 0 -200 -2 3 -6 4 12
1350-1450 20 130 -100 -1 4 -4 1 4
1450-1550 35 0 0 0 7 0 0 0
69
1550-1650 25 140 100 1 5 5 1 5
1650-1750 5 0 200 2 1 2 4 4
1750-1850 5 150 300 3 1 3 9 9
0
160
0
170
0
180
0
Total 110 22 -3 43
Să se determine numărul mediu al salariaţilor utilizând dispersia prin calcul
simplificat.
2
xi − a ni
∑
i
⋅
k c 2
-dispersia prin calcul simplificat: σ =
2
⋅ k − (x − a ) 2
ni
∑i c
n
xi − a ni
∑ k
⋅
c −3
x= i =1
⋅k+ a = ⋅ 100 + 1500 = 1486 mii lei
n
ni 22
∑i=1 c
a = 1500; k = 100; c = 5.
43
σ2 = ⋅ 100 2 − (1486 − 1500 ) 2 = 19349
22
-abaterea medie pătratică:
σ = σ 2 = 19349 = 139
x ± σ = x − σ = 1 4 −81 63= 19 3 m4 7l iei i
x + σ = 1 4 +81 63= 19 6 m2 5l iei i
5.4 Indicatori de asimetrie şi ai excesului
70
Forma unei distribuţii statistice poate fi apreciată cu ajutorul a două categorii de
valori tipice:
1) Indicatorii de asimetrie
2) Indicatorii de boltire sau ai excesului
1) Indicatorii de asimetrie dau informaţii asupra modului de repartizare a
frecvenţelor de o parte sau alta a valorii centrale a unei serii.
Asimetria reprezintă o deviaţie de la forma simetrică de distribuţie.
În literatura de specialitate s-au propus mai mulţi indicatori pentru măsurarea
gradului de asimetrie al distribuţiilor.
O primă imagine asupra gradului de asimetrie (As) al unei distribuţii o putem face
comparând media ei asimetrică cu modul.
As = x − Mo
As 0 , x Mo , asimetrie negativă, cu extinderea frecvenţelor spre stânga.
As 0 , x Mo , asimetrie pozitivă, cu extinderea frecvenţelor spre dreapta.
În mărimi relative se utilizează coeficientul de asimetrie a lui Pearson (kas).
x − Mo
k as =
σ
Dacă kas =0, x = Mo , distribuţie simetrică
Dacă kas >0, x Mo , distribuţie asimetrică spre dreapta
Dacă kas <0, x Mo , distribuţie asimetrică spre stânga.
Pentru seriile moderat asimetrice, coef. de asimetrie trebuie să ia valori cuprinse
în intervalul (-0,3 ; 0,3). Pentru valori în afara acestui interval se consideră că distribuţiile
respective sunt puternic asimetrice.
Informaţiile pe care le oferă coef. de asimetrie sunt foarte utile atât pentru
aprecierea tipului distribuţiilor, cât şi pentru aprecierea semnificaţiei indicatorilor
tendinţei centrale, mai ales pentru x .
Asupra asimetriei influenţează şi celelalte mărimi medii de poziţie. Pentru a ţine
seama şi de influenţa quartilelor, se foloseşte coeficientul de asimetrie Yule (Cay).
q 2 − q1
Cay = , unde: q2 = Q3 – Me
q 2 + q1
q1 = Me – Q1.
71
În cazul coef. Yule, se raportează diferenţa dintre abaterile celor două quartile
extreme de la mediană, la suma acestora.
Dacă valorile Cay se apropie de ±0,1 , atunci distribuţia este moderat asimetrică,
iar dcaă depăşesc ±0,1 , atunci distribuţia este pronunţat asimetrică.
Ex. Gruparea muncitorilor după producţia săptămânală (m):
Grupe muncit.
după prod.
Nr. muncit.
ni
xi xini (x i −x ) (x i −x ) 2
(x i − x) 2 ⋅ n i Ni
4-8 10 6 60 -9,37 87,79 877,9 10
8-12 20 10 200 -5,37 28,83 576,6 30
12-16 40 14 560 -1,37 1,87 74,8 70
16-20 60 18 108 2,63 6,91 414,6 130
20-24 4 22 0 6,63 43,95 175,8 134
24-28 4 26 88 10,63 112,99 451,96 138
28-32 2 30 104 14,63 214,03 428,06 140
60
Total 140 215 2999,72
2
Să se studieze gradul de asimetrie al distribuţiei.
x − Mo
Coef. de asimetrie Pearson: k as =
σ
n
∑x n i i
2152
x= i =1
n
= = 15,37
140
∑n
i =1
i
∆1 20
Mo = x 0 + d ⋅ = 16 + 4 ⋅ = 16,05
∆1 + ∆ 2 20 + 56
∑ (x ) 2
i − x ⋅ ni
2999,72
σ = σ2 = i
= = 21,42 = 4,628
∑n i
i 140
q 2 − q1
Coef. de asimetrie Yule: Cay = q2 = Q3 – Me
q 2 + q1
q1 = Me – Q1.
U Q1 − Na 35 − 30
Q1 = x 0 + d ⋅ = 12 + 4 = 12 ,5 m
n Q1 40
72
U Q1 =
∑n i
=
140
= 35
4 4
U Me − Na 70 − 30
Me = x 0 + d ⋅ = 12 + 4 ⋅ = 16 m
n Me 40
U Me =
∑n i
=
140
= 70
2 2
U Q 3 − Na 105 − 70
Q3 = x 0 + d ⋅ = 16 + 4 = 18,33 m
n Q3 60
3∑ n i 3 ⋅ 140
U Q3 = = = 105
4 4
q2 = Q3 – Me = 18,33-16=2,33
q1 = Me – Q1 = 16-12,5=3,5
q 2 − q 1 2,33 − 3,5
Cay = = = −0,20 asimetrie spre stânga.
q 2 + q 1 2,33 + 3,5
2) Indicatorii de boltire.
În caracterizarea distribuţiilor interesează şi determinarea gradului de concentrare,
de aglomerare a frecvenţelor în zona centrală a distribuţiei. Această însuşire este
cunoscută sub denumirea de exces, curtozis sau boltire.
Indicatorii boltirii arată dacă o distribuţie este mai boltită decât distribuţia
normală, perfect simetrică sau mai puţin boltită decât aceasta.
Dacă într-o distribuţie variantele unei variabile sunt concentrate în jurul nivelului
ei mediu mai mult decât în cazul unei distribuţii normale, atunci distribuţia considerată va
fi mai boltită decât distribuţia normală, iar graficul ei poartă denumirea de curbă
leptokurtică (leptos = subţire). Dacă curba este mai puţin boltită decât cea normală, ea
poartă denumirea de curbă platikurtică (platus = lat în greacă, iar curtosis = cocoaşă).
Curba normală este numită şi curbă mesokurtică.
În determinarea excesului se utilizează coef. de boltire Pearson ( β2 ) şi coef. de
boltire Fisher ( γ 2 ).
Coef. Pearson este raportul dintre momentul centrat de ordin 4 şi pătratul
momentului centrat de ordinul 2.
73
µ4
β2 = , unde: µ2 este dispersia.
µ 22
∑ (x ) 2
i − x ⋅ ni
µ2 = σ 2 = i
, iar µ4 se determină după relaţia:
∑n i
i
∑ (x ) 4
i − x ⋅ ni
µ4 = i
∑n i
i
(x − x ) (x )
Grupe sal. Nr. 4
74
∑ (x ) 2
i − x ⋅ ni
580
µ2 = σ 2 = i
= = 5,80
∑n i
i 100
∑x n ∑ (x ) 4
i i − x ⋅ ni
694 i
12880
x= i =1
= = 6,94 ≈ 7 mil lei µ4 = i
= = 128,8
∑n
n
100 100
∑n
i =1
i i
i
128 ,8
β2 = = 3,828
5,8 2
75
CAPITOLUL VI INDICII ŞI RITMUL VARIAŢIEI
FENOMENELOR ECONOMICO-SOCIALE
6.1 Noţiunea şi importanţa indicilor
6.2 Indicii simpli
6.3 Indicii de grup
6.4 Sistemul indicilor calculaţi din mărimi medii
6.5 Gruparea indicilor dinamicii după felul bazei
6.6 Ritmul variaţiei şi al sporului
76
Variaţia relativă ce se obţine în procesul determinării indicilor poate fi privită sub
două aspecte :
-relativitatea bazei, acesta fiind aleasă în funcţie de problemele puse în analiză;
-felul mărimilor ce rezultă din raportul a doi indicatori ai aceleiaşi serii.
Apariţia indicilor este strâns legată de necesitatea ce s-a simţit în economia
mijlocului secolului al XIX-lea de a măsura şi caracteriza variaţia curentă a preţului
mărfurilor şi a cursului valorilor mobiliare cotate la bursă.
Prin apariţia şi utilizarea a numeroşi indici s-a impus clasificarea lor după diverse
criterii :
• După sfera de cuprindere întâlnim:
- indici individuali, simpli sau elementari, măsoară variaţia relativă a unor
fenomene simple, singulare, în timp sau în spaţiu.
- indici de grup, compuşi sau sintetici, măsoară variaţia medie relativă a unor
fenomene colective în raport cu o anumită bază de comparaţie.
• După natura caracteristicii studiate, indicii sunt:
- indicii dinamicii, exprimă variaţia în timp,
- indicii teritoriali, exprimă variaţia în spaţiu,
- indicii calitativi, exprimă variaţia unei caracteristici calitative.
• După modul de alegere a bazei se cunosc:
- indicii cu bază fixă,
- indicii cu bază mobilă.
Indicii de grup, la rândul lor, se grupează după procedeul de calcul:
- indici agregaţi,
- indici calculaţi ca medii aritmetice ponderate a indicilor simpli,
- indici calculaţi ca medii armonice ponderate a indicilor simpli,
- indici calculaţi prin raportarea a două medii aritmetice ponderate,
- indici calculaţi sub formă de medie geometrică.
77
6.2. Indicii simpli
Exprimă variaţia unei colectivităţi simple sub aspectul unei caracteristici date.
Indicatorii comparaţi pot fi cantitativi sau valorici, în funcţie de scopul urmărit în
cercetare şi de datele disponibile.
În primul caz se obţine un indice simplu cantitativ, iar în al doilea caz un indice
simplu valoric.
Principalii indici simpli sunt:
• Indicele simplu al cantităţilor sau al volumului fizic care este determinat după relaţia:
q1
i1q/ 0 = ⋅ 100 ,
q0
v0=q0p0
q 1 p1
i1v/ 0 = ⋅ 100
q0 p0
q 1 p1 q 1 p1
= ⋅
q0p0 q0 p0
78
6.3 Indicii de grup
I1q/ 0 =
∑q 1
⋅ 100
∑q 0
I1q/ 0 =
∑q p 1 1
⋅ 100
∑q p 0 0
79
1) Sistemul de ponderare propus în 1864 de E. Laspeyres, la care ponderile folosite
sunt cele din perioada de bază. Se foloseşte pentru măsurarea variaţiei de grup a
volumului fizic al unor produse, cantităţile respective fiind ponderate cu un preţ
constant, astfel:
I1q/ 0 =
∑q p 1 0
⋅ 100
∑q p 0 0
I1p/ 0 =
∑p q 1 1
⋅100
∑p q 0 1
I1v/ 0 =
∑q p 1 1
⋅ 100
∑q p 0 0
În teoria indicilor se mai întâlnesc şi unele sisteme de ponderare care ţin seama de
ponderile din ambele perioade. Întâlnim astfel:
-indicele preţurilor calculat de Edgeworth, care se bazează pe acumularea cantităţilor din
perioada de bază cu cele din perioada curentă şi folosirea acestora ca pondere la
măsurarea variaţiei relative a preţurilor, după relaţia:
I1p/ 0 =
∑ p (q1 1 + q0 )
⋅ 100
∑ p (q0 1 + q0 )
-indicele ideal al lui Fisher. Este un indice de grup al preţurilor calculat ca o medie
geometrică a celor doi indici agregaţi, de tip Laspeyres şi Paasche, astfel:
I1p/ 0 =
∑q p ⋅ ∑ q p
1 0 1 1
∑q p ∑q p0 0 1 0
80
În practica ţărilor dezvoltate, statistica utilizează sistemul propus de Laspeyres.
Existenţa mai multor sisteme de ponderare provine din faptul că formulele de calcul
propuse nu satisfac integral teoria şi practica folosirii metodei indicilor.
Pe baza indicilor agregat se poate calcula influenţa variaţiei factorilor studiaţi în
mărimi absolute, sub forma diferenţei dintre numărătorul şi numitorul formulei indicelui
respectiv.
În cazul indicelui de grup al volumului fizic, modificarea absolută va fi:
∆q1 / 0 = ∑q 1 p 0 − ∑q 0 p 0
i i
81
73
i1q/(0tomate ) = ×100 = 9,08 %
804
850
i1q/(0castraveti )
= ×100 =151 ,79 %
560
52
i1q/(0salata ) = ×100 = 200 %
26
22
i1q/(0gulii ) = ×100 = 40 ,74 %
54
Pentru a calcula indicele de grup al volumului fizic al producţiei se foloseşte
indicele tip Laspeyres cu ponderea din perioada de bază.
∑q p 1 0
3114 ,60
Iq
= i
×100 I 1q/ 0 = ×100 = 66 ,88 %
∑q p
1/ 0
4656 ,87
0 0
i
ofertei în anul 2002 la preţul anului 1999 este de 3114,60 mil. lei ( ∑
i
q 1 p 0 ).
Pentru produsul “tomate”, volumul fizic scade în anul 2002 faţă de 1999 de
0,0908 ori. Exprimat în procente, volumul fizic a scăzut în perioada curentă faţă de
perioada de bază cu 90,92%, adică la fiecare 100 tone realizate pentru produsul “tomate”
în perioada de bază, se realizează 9,08 tone în perioada curentă.
Pentru produsul “castraveţi” volumul fizic creşte în 2002 faţă de 1999 de 1,5179
ori. Exprimat în procente, volumul fizic a crescut în perioada curentă faţă de perioada de
bază cu 51,79%, adică la fiecare 100 tone realizate pentru produsul “castraveţi” în 1999,
se realizează 151,79 tone în 2002.
Pentru produsul “salată” volumul fizic creşte în 2002 faţă de 1999 de 2 ori.
Exprimat în procente, volumul fizic a crescut în perioada curentă faţă de perioada de bază
cu 100,00%, adică la fiecare 100 tone realizate pentru produsul “salată” în 1999, se
realizează 200 tone în 2002.
82
Pentru produsul “gulii”, volumul fizic scade în anul 2002 faţă de 1999 de 0,4074
ori. Exprimat în procente, volumul fizic a scăzut în perioada curentă faţă de perioada de
bază cu 59,26%, adică la fiecare 100 tone realizate pentru produsul “gulii” în perioada de
bază, se realizează 40,74 tone în perioada curentă.
Pe total produse, volumul fizic al producţiei a scăzut cu 33,12%.
2. Indicii individuali ai preţurilor se calculează după relaţia:
p1
i1p/ 0 = × 100
p0
6730
i1q/(0tomate ) = ×100 = 207 ,14 %
3249
6725
i1q/(0castrave ţa) = ×100 = 219 ,13 %
3069
10341
i1q/(0salata ) = ×100 = 314 ,99 %
3283
5100
i1q/(0gulii ) = ×100 = 114 ,43 %
4457
Indicele agregat al preţurilor se determină ca un indice Paasche:
∑p q 1 1
6857,47
I p
= i
× 100 = × 100 = 220,17 %
∑p q
1/ 0
0 1 3114,6
i
83
491 ,29
i1q/(0tomate )
= ×100 =18 ,81 %
2612 ,20
5716 ,25
i1q/(0castraveti )
= ×100 = 332 ,60 %
1718 ,64
537 ,73
i1q/(0salata )
= ×100 = 629 ,98 %
85 ,36
112 ,20
i1q/(0gulii ) = ×100 = 46 ,62 %
240 ,68
∑q p 1 1
6857,47
I v
= i
× 100 = × 100 = 147,25 %
∑q p
1/ 0
0 0 4656,87
i
84
I v =I q ×I p
= 0,6688 × 2,2017 =1,4725 sau 147,25%
85
b. Indicel
e mediu aritmetic ponderat
∑i ⋅ q p q
1/ 0 0 0
I1q/ 0 = i
× 100
∑q p i
0 0
∑i ⋅ q pq
1/ 0 0 0
I q
= i
× 100
∑q p
1/ 0
0 0
i
c. Indicel
e mediu armonic ponderat
86
utilizează pentru studierea dinamicii preţurilor pe total produse, atunci când se cunosc
indicii individuali ai preţurilor şi valoarea producţiei din perioada curentă. Relaţia de
calcul:
∑p q 1 1
I p
1/ 0 = i
×100
1
∑i
i
q
p1 q 1
1/ 0
∑p q 1 1
I p
1/ 0 = i
×100
1
∑i
i
q
p1 q 1
1/ 0
87
B. indicele cu structură fixă;
C. indicele schimbării structurii.
A. indicele de variaţie bifactorială
Este un indice de grup care arată variaţia medie totală a unui fenomen produsă sub
influenţa directă a doi factori:
-variaţia nivelului caracteristicii în fiecare grupă, ca factor esenţial al variaţiei de
ansamblu;
-variaţia structurii sau ponderii grupelor în colectivitatea totală.
Denumit şi indice cu structură variabilă (Is.v), indicele de variaţie bifactorială este
un raport între două medii cu ponderi diferite.
I sx.v =
x1
=
∑x n 1 1
÷
∑x n 0 0
x0 ∑n 1 ∑n 0
I sx.f =
∑x n 1 1
÷
∑x n 0 1
∑n 1 ∑n 1
I sx.f =
∑x n
1 0
÷
∑x n 0 0
∑n 0 ∑n 0
88
Denumit şi indicele modificărilor structurale, se calculează pornind de la ipoteza
că s-a schimbat numai distribuţia factorului cantitativ, deci structura colectivităţii.
Formula generală a acetui indice este cea aplicată în practică în care ponderarea se
face cu datele perioadei de bază, de tip Laspeyres, astfel:
I xv.s. =
∑x n 0 1
÷
∑x n 0 0
∑n 1 ∑n 0
Ex. Presupunem următoarele date privind salariul mediu săptămânal (mii lei)
şi numărul de salariaţi din 3 secţii ale unei unităţi:
Sal. mediu săpt. Nr. sal. s1 n 1 s0n 0 s 0 n1
Secţia
so s1 n0 n1
I 1000 1200 800 800 960000 800000 800000
II 1200 1800 700 650 117000 840000 780000
0
III 1500 2500 900 910 227500 135000 1365000
0 0
Total 240 236 440500 299000 2945000
0 0 0 0
Să se determine dinamica salariului mediu pe total unitate.
I ss.v =
∑s n1 1
÷
∑s n 0 0
=
4405000 2990000
÷ = 1,4982 sau 149,82%.
∑n 1 ∑n 0 2360 2400
I ss.f =
∑s n1 1
÷
∑s n 0 1
=
4405000
÷
2945000
= 1,4958 sau 149,58%.
∑n 1 ∑n 1 2360 2360
Salariul mediu a crescut de 1,4982 ori sau cu 149,82% sub influenţa modificării
salariului mediu săptămânal pe fiecare secţie.
I sv.s. =
∑s n 0 1
÷
∑s n 0 0
=
2945000 2990000
÷ = 1,0016 sau 100,16%.
∑n 1 ∑n 0 2360 2400
Pe total secţii, salariul mediu a crescut 1,0016 ori sau cu 100,16% ca urmare a
modificării numărului de salariaţi.
Relaţii între indici:
I sx. v = I sx.f ⋅ I xv.s. , 1,4958 * 1,0016 =1,49819
89
6.5 Gruparea indicilor dinamicii după felul bazei
Orice indice se exprimă ca un raport între 2 indicatori, dintre care unul este
considerat ca bază de raportare, iar celălalt este mărimea raportată.
Baza de raportare se poate alege după criterii diferite. La seriile de timp, se
consideră, de regulă, primul termen al seriei. Se poate alege orice alt termen al seriei sau
un nivel exterior seriei dacă este semnificativ.
Indicii dinamicii, după felul bazei sunt:
a. Indici cu bază fixă – se obţin prin raportarea tuturor nivelurilor seriei la
termenul ales drept bază de raportare.
Pp. că în cazul volumului fizic avem seria: q0, q1,...,qn-1, qn, iar q0 este baza de
raportare. Indicii cu bază fixă sunt:
q1 q2 q n −1 qn
i 1q/ 0 = , i q2 / 0 = , .... , i qn −1 / 0 = , i qn / 0 =
q0 q0 q0 q0
-împărţind doi indici cu bază fixă obţinem indicele cu bază mobilă corespunzător:
q 2 q1 q 2
÷ =
q 0 q 0 q1
90
-indicii cu bază fixă prezintă avantajul comparabilităţii de conţinut, unitatea de măsură
rămânând aceeaşi. În cazul indicilor în lanţ, termenul de bază schimbându-se, se schimbă
şi valoarea unităţii care exprimă variaţia.
-indicii cu bază fixă nu sunt concludenţi dacă se raportează la o bază învechită. În acest
caz trebuie să se procedeze la actualizarea bazei pentru a permite analiza corectă a
fiecărei etape.
Prin modificarea bazei de raportare a indicilor cu bază fixă la anumite perioade,
aceşti indici se apropie, într-un fel sau altul, de metoda şi funcţia aplicativă a indicilor în
lanţ.
Ex. Producţia unei firme într-o perioadă de 7 ani a evoluat astfel:
Anii Prod. (mii buc.)
1 100
2 84
3 74
4 93
5 86
6 88
7 117
Să se studieze dinamica producţiei cu ajutorul indicilor grupaţi după felul bazei.
-indicii cu bază fixă:
qi
i iq/ 0 =
q0
84 74
i q2 / 1 = = 0,84 sau 84% ; i 3q / 1 = = 0,74 sau 74%
100 100
93 86
i q4 / 1 = = 0,93 sau 93% ; i 5q / 1 = = 0,86 sau 86%
100 100
88 117
i q6 / 1 = = 0,88 sau 88% ; i q7 / 1 = = 0,117 sau 117%
100 100
-indicii cu bază mobilă:
qi
i iq/ i −1 =
q i −1
84 74
i q2 / 1 = = 0,84 sau 84% ; i 3q / 2 = = 0,88 sau 88%
100 84
93 86
i q4 / 3 = = 1,2567 sau 125,67% ; i 5q / 4 = = 0,924 sau 92,4%
74 93
91
88 117
i q6 / 5 = = 1,0232 sau 102,32% ; i q7 / 1 = = 1,3295 sau 132,95%
86 88
Relaţii între aceşti indici:
-produsul indicilor cu bază mobilă dă indicele cu bază fixă corespunzător ultimului an:
84 74 93 86 88 117 117
⋅ ⋅ ⋅ ⋅ ⋅ =
100 84 74 93 86 88 100
-raportul a doi indici cu bază fixă dă indicele cu bază mobilă corespunzător:
74 84 74
÷ =
100 100 84
A. Indicatorii absoluţi
Cuprind sporul absolut, care, după modul de alegere a bazei, este:
spor absolut cu bază fixă ( ∆i / 0 ) – se obţine ca diferenţă între fiecare termen al sumei
x
•
şi termenul ales drept bază de raportare. Considerând seria: x0, x1, x2, ... , xn, sporul
absolut cu bază fixă se va calcula astfel:
∆x1 / 0 = x 1 − x 0 ; ∆x2 / 0 = x 2 − x 0 ; .....; ∆xn / 0 = x n − x 0 sau
generalizând: ∆xi / 0 = x i − x 0
spor absolut cu bază mobilă ( ∆i / i −1 ) – este diferenţa dintre fiecare termen al seriei şi
x
•
termenul anterior. În aceeaşi serie vom avea:
92
∆x1 / 0 = x 1 − x 0 ; ∆x2 / 1 = x 2 − x 1 ; .....; ∆xn / n −1 = x n − x n −1 sau
generalizând: ∆xi / i −1 = x i − x i −1
Între sporurile absolute cu baza fixă şi cele cu baza mobilă se verifică relaţiile:
-suma sporurilor cu baza mobilă este sporul cu bază fixă al ultimului an:
x 1 − x 0 + x 2 − x 1 + x 3 − x 2 + + x n − x n −1 = x n − x 0
-diferenţa dintre două sporuri absolute cu baza fixă consecutive este egală cu sporul cu
bază mobilă corespunzător:
(x 3 − x o ) − (x 2 − x 0 ) = x 3 − x 2
B. Indicatorii relativi
Indicatorii relativi de măsurare a variaţiei în timp cuprind:
.1 ritmul variaţiei
.2 ritmul sporului
1. Ritmul variaţiei (Rx) – exprimă viteză de variaţie exprimată în mărimi relative.
După modul de calcul, rimul variaţiei este de două feluri:
x
• Ritmul variaţiei cu bază fixă ( R i / 0 ) – arată de câte ori a crescut sau scăzut nivelul
unui fenomen în decursul unei perioade de timp şi se calculează astfel:
xi
R ix/ 0 = , i =1, n
x0
x
• Ritmul variaţiei cu bază mobilă ( R i / i −1 ) – arată de câte ori a crescut sau scăzut
nivelul unui fenomen într-un moment faţă de momentul anterior.
xi
R ix/ i −1 =
x i −1
Între ritmul variaţiei cu bază fixă şi cel cu bază mobilă se verifică relaţiile:
-produsul ritmurilor cu bază mobilă este ritmul cu bază fixă al întregii perioade:
x1 x 2 x 3 x x
⋅ ⋅ ⋅⋅ n = n
x 0 x1 x 2 x n −1 x 0
-raportul a două ritmuri ale variabilei cu bază fixă este egal cu ritmul cu bază mobilă
corespunzător:
93
x 2 x1 x 2
÷ =
x 0 x 0 x1
2 Ritmul sporului (rx) – exprimă mărimea creşterii sau scăderii în decursul unei
anumite perioade de timp faţă de perioada de bază a unui indicator. Se calculează:
• Ritmul sporului cu bază fixă ( rx i / 0 ) – se calculează ca raport între sporul cu bază fixă
şi nivelul fenomenului considerat din perioada de bază, astfel:
∆xi −0 x i − x 0
rx i / 0 = =
x0 x0
rx i / 0 = R ix/ 0 − 1
rx i / i −1 = R ix/ i −1 − 1
C. Indicatorii medii
Indicatorii medii ai creşterii seriilor dinamice sunt:
1. Sporul mediu ( ∆x ) – se calculează ca o medie aritmetică simplă a sporurilor absolute
cu bază mobilă. Cum suma sporurilor cu bază mobilă este sporul cu bază fixă a ultimei
perioade, atunci sporul mediu se va calcula astfel:
x xn − x0
∆ = , unde:
n −1
xn = ultimul termen al seriei,
x0 = primul termen al seriei,
n = nr. termenilor seriei.
2. Ritmul mediu al variaţiei ( R x ) – exprimă viteza medie relativă de creştere a unui
fenomen în decursul unei perioade de timp. Se determină prin diverse metode, cea mai
utilizată fiind metoda mediei geometrice, astfel:
94
x xn
R = n −1
xo
∆q2 / 1 = 716 − 580 = 136 mii t ; ∆q3 / 1 = 538 − 580 = −42 mii t ;
∆q4 / 1 = 348 − 580 = −232 mii t ; ∆q5 / 1 = 240 − 580 = −340 mii t
∆q2 / 1 = 716 − 580 = 136 mii t ; ∆q3 / 2 = 538 − 716 = −178 mii t ;
∆q4 / 3 = 348 − 538 = −190 mii t ; ∆q5 / 4 = 240 − 348 = −108 mii t
95
qi
Ritmul variaţiei cu bază fixă: R i / 0 =
q
q0
716 538
R q2 / 1 = = 1,234 sau 123,4% ; R 3q / 1 = = 0,92 sau 92% ;
580 580
348 240
R q4 / 1 = = 0,60 sau 60% ; R 5q / 1 = = 0,41 sau 41% .
580 580
qi
Ritmul variaţiei cu bază mobilă: R i / i −1 =
q
q i −1
716 538
R q2 / 1 = = 1,234 sau 123,4% ; R 3q / 2 = = 0,75 sau 75% ;
580 716
348 240
R q4 / 3 = = 0,64 sau 64% ; R 5q / 4 = = 0,68 sau 68% .
538 348
Relaţii între ritmurile variaţiei:
-produsul ritmurilor cu bază mobilă este ritmul cu bază fixă al ultimului an:
716 538 348 240 240
⋅ ⋅ ⋅ =
580 716 538 348 580
-raportul a două ritmuri ale variabilei cu bază fixă este egal cu ritmul cu bază mobilă
corespunzător:
538 716 538
÷ =
580 580 716
• Ritmul sporului:
qi − q0
Ritmul sporului cu bază fixă: ri / 0 =
q
q0
96
q q n − q 0 240 − 580
• Sporul mediu: ∆ = = = −85 mii t
n −1 5 −1
q q n 4 240 4
• Ritmul mediu al variaţiei: R = n −1 = = 0,4137 = 0,1426 ori
qo 580
•
x x x
Ritmul mediu al sporului: r = R −1 ; r =0,1426 −1 =−0,8574
97
CAPITOLUL VII REGRESIE ŞI CORELAŢIE
7.1 Noţiunea, importanţa şi felul legăturilor dintre
fenomene
7.2 Metode elementare de studiere a legăturilor dintre
fenomene
7.3 Metode analitice de studiere a legăturilor dintre
fenomene
7.4 Corelaţia neparametrică
98
- determinarea gradului de intensitate a legăturii.
Mulţimea legăturilor statistice se poate grupa după mai multe criterii:
• După numărul caracteristicilor corelate, legăturile dintre fenomene pot fi:
- legături simple – exprimă variaţia variabilei rezultative y în funcţie de o singură
variabilă factorială x.
- legături multiple - exprimă variaţia variabilei rezultative y în funcţie de variaţia
simultană a mai multor variabile factoriale x1, x2, ..., xn.
• După sensul sau direcţia legăturii, acestea pot fi:
- legături directe – exprimă modificarea lui y în acelaşi sens cu variabila x.
- legături inverse - exprimă modificarea lui y în sens contrar variabilei x.
• După forma legăturilor, întâlnim:
- legături rectilinii
- legături curbilinii.
Analiza legăturilor statistice vizează estimarea modelului de regresie şi măsurarea
intensităţii legăturii dintre variabile.
Pentru acesta se utilizează un ansamblu de metode elementare şi metode analitice.
Metodele elementare oferă informaţii asupra naturii şi caracteristicilor legăturii
cercetate, permiţând cunoaşterea formei şi direcţiei legăturii.
Metodele analitice sunt precise şi concrete, permiţând măsurarea şi caracterizarea
cifrică a gradului de legătură, a intensităţii acesteia.
Sunt următoarele:
A. metoda seriilor paralele interdependente
B. metoda grupărilor statistice
C. metoda grafică.
A. Metoda seriilor paralele interdependente
Constă în stabilirea legăturii dintre fenomene pe baza comparării indicatorilor
proveniţi din două serii paralele, din care una reprezintă variaţia variabilei factoriale x şi
99
cealaltă variabila rezultativă y. În comparaţie se cuprind serii care privesc variaţia
fenomenelor în timp, în teritoriu sau calitative.
Dacă se compară serii de timp, termenii acestora se ordonează cronologic, iar
dacă se compară serii teritoriale sau calitative, termenii lor se ordonează în ordine
crescătoare sau descrescătoare a variabilei factoriale x. În paralel se înscriu termenii
corespunzători ai variabilei rezultative y.
Prin compararea seriilor interdependente se poate evidenţia existenţa şi direcţia
legăturii.
Astfel, dacă ambele variabile comparate variază în acelaşi sens, există o legătură
directă. Dacă variaţia lor este de sens diferit, corelaţia este inversă.
Dacă cele două variabile variază în mod independent sau una variază şi cealaltă
rămâne constantă, nu există legătură.
Această metodă se aplică în cazul seriilor cu un nr. relativ mic de variante, când
există corespondenţă de la valoare la valoare (xi, yi).
100
spaţiul tabelului, atunci între variabile nu există nici un fel de legătură. Dacă frecvenţele
se concentrează în jurul unei drepte sau a unei curbe de un anumit tip, înseamnă că între
variabile există o legătură a cărei formă este dată de dreapta sau curba respectivă. Cu cât
concentrarea frecvenţelor în jurul dreptei sau curbei este mai mare, cu atât se poate
aprecia că intensitatea legăturii dintre variabile este mai mare, şi invers.
C. Metoda grafică
Permite prezentarea într-o formă geometrică, expresivă şi vizuală a legăturii
dintre două variabile. Se bazează pe sistemul de axe rectangulare, variabila factorială se
fixează pe abscisă, iar cea rezultativă pe ordonată. Perechile de valori corelate se
reprezintă prin câte un punct în cadrul graficului. Reprezentarea acestor puncte în grafic
oferă imaginea câmpului de corelaţie, asemănătoarea cu un nor de puncte.
După modul de distribuire a acestor puncte în spaţiul graficului, se poate aprecia
existenţa, forma, direcţia şi intensitatea legăturii dintre cele două variabile. Concentrarea
punctelor în jurul anumitor drepte sau curbe ne va indica faptul că între variabile există o
legătură, iar dreapta sau curba respectivă va indica forma legăturii.
Dacă punctele se dispersează uniform pe întreg spaţiul graficului sau se
concentrează în jurul unei drepte paralele cu una din axe, atunci între variabile nu există
101
legătură.
x x
Există legătură directă Există legătură inversă
y y
xx
Nu există legătură
102
Cercetarea concretă a legăturii dintre fenomene numai pe baza metodelor
elementare este insuficientă. Informaţiile obţinute pe baza lor se completează cu metodele
analitice.
Metodele analitice permit exprimarea matematică a formei legăturii şi măsurarea
numerică a intensităţii legăturii. Sunt cunoscute sub denumirea de metode de regresie şi
corelaţie.
Modelele de regresie au ca scop reprezentarea alurii distribuţiei a două variabile
corelate. Prin curbele de regresie se prezintă corespondenţa între perechile de valori
(xi,yi).
Cele mai utilizate modele de regresie în studiul fenomenelor şi proceselor social-
economice sunt:
A. regresie şi corelaţie liniară
B. regresie şi corelaţie curbilinie
C. regresie şi corelaţie multiplă
Stabilirea şi analiza modelului de regresie pp. efectuarea următorilor paşi:
-construirea corelogramei, respectiv a norului de puncte;
-aproximarea, pe baza ajustării corelogramei, a formei legăturii printr-un model teoretic
şi formularea ecuaţiei corespunzătoare modelului de regresie ales;
-estimarea parametrilor ecuaţiei de regresie şi interpretarea regresiei în funcţie de semnul
şi valoarea lor;
-testarea semnificaţiei parametrilor de regresie.
103
b = panta dreptei, se mai numeşte şi coeficient de regresie. Semnul parametrului b indică
direcţia legăturii dintre cele două variabile corelate, astfel:
-dacă b>0, indică o legătură directă
-dacă b=0, nu există legătură
-dacă b<0, indică o legătură inversă.
Valoarea acestui parametru arată gradul de dependenţă dintre variabile, respectiv
cu cât creşte sau scade y la o creştere sau la o scădere a variabilei x cu o unitate.
Determinarea parametrilor dreptei de regresie se poate face prin diverse metode,
cea mai utilizată fiind metoda celor mai mici pătrate.
Principiul de bază al acestei metode este ca suma pătratelor diferenţelor dintre
valorile reale ale lui y şi valorile teoretice date de ecuaţia de regresie să fie minimă.
∑( y − y
2
i ) =minim, respectiv
∑( y −a −bx )
2
=minim.
n a+ b∑ x i = ∑ y i
a ∑ x i + b∑ x i2 = ∑ x i y i
Prin rezolvarea sistemului de ecuaţii normale printr-una din metodele cunoscute
se obţin parametrii a şi b.
Prin metoda lui Cramer sau a determinanţilor, parametrii a şi b se determină astfel
(pentru seriile simple):
104
∑y ∑x
i i
∆ a ∑ xy ∑ x ∑ x ∑ y − ∑ x∑ xy
2 2
ii i i i i ii
a= = = 2 2
∆ n ∑ x i n ∑ x i − (∑ x i )
∑x ∑x
2
i i
105
n ∑ yi
∑x ∑x2
i i
În cazul când se studiază legătura dintre două variabile folosind date grupate într-
un tabel de corelaţie, deci serii cu frecvenţe, sistemul de ecuaţii normale devine:
a ∑ n i + b∑ x i n i = ∑ y i n i
a ∑ x i n i + b∑ x i2 n i = ∑ x i y i n i
Determinarea parametrilor a şi b prin aceeaşi metodă conduce la rezultatele:
106
∑ yn ∑ xn ii ii
∆ a ∑ xyn ∑ x n ∑ x n ∑ yn − ∑ x n ∑ xyn
2 2
iii i i i i ii ii iii
a= = = 2 2
∆ ∑ ni ∑ x nii ni∑∑ xini − (∑ x nii )
∑ xn ∑ x n
2
ii i i
107
∑ n ∑ yn
i ii
∑ xn ∑ xn2
ii i i
Pe baza parametrilor a şi b astfel determinaţi se obţine dreapta de regresie.
Aceasta oferă doar imaginea formei legăturii dintre două variabile.
Pentru a determina cât de intensă este legătura dintre variabilele corelate se
utilizează coeficientul de corelaţie şi raportul de corelaţie.
Coeficientul de corelaţie se foloseşte pentru măsurarea legăturii în cazul unei
regresii liniare simple. Formulat de statisticianul Pearson, coeficientul de corelaţie se
calculează ca o medie aritmetică simplă a produsului abaterilor celor două variabile faţă
de medie, astfel:
rx , y =
∑( x i − x ) ⋅ ( y i − y)
, unde:
nσ x σ y
xi = caracteristica factorială;
yi = caracteristica rezultativă;
x, y = mediile celor două caracteristici;
σx , σy = abaterea medie pătratică a celor două caracteristici.
108
Dacă în această relaţie înlocuim pe x, y , σx , σy cu expresiile lor dezvoltate şi
efectuăm simplificările posibile, se ajunge la formula:
n ∑x i y i − ∑x i ∑ y i
rx , y = -pt. serii simple
[ n ∑x i2 − (∑x i ) 2 ] ⋅ [ n ∑ y i2 − (∑ y i ) 2 ]
rx , y =
∑n ∑ x y n − ∑ x n ∑ y n
i i i i i i i i
-pt. serii cu frecvenţă
[ ∑n ∑ x n − ( ∑ x n ) ] ⋅ [∑ n ∑ y n − ( ∑ y n
i
2
i i i i
2
i
2
i i i i )2 ]
Valoarea coeficientului de corelaţie este cuprinsă între -1 şi +1. Cele două valori
extreme reprezintă o legătură liniară perfectă între cele două variabile, directă sau
inversă. Valoarea zero semnifică absenţa legăturii.
Raportul de corelaţie (η ) se bazează pe descompunerea dispersiei totale a
variabilei y pe factori de influenţă. Relaţia sa de calcul este:
σ y2
η= , unde:
σ yi2
(∑ y i ) 2
a ∑ y i + b∑ x i y i −
η= n
(∑ y i ) 2
∑y 2
i −
n
În cazul seriilor cu frecvenţe:
(∑ y i n i ) 2
a ∑ y i n i + b∑ x i y i n i −
η=
∑n i
(∑ y i n i ) 2
∑ y i2 n i −
∑n i
109
σ y2
η = 2
şi arată ponderea influenţei factorului x asupra variaţiei variabilei y.
σ yi2
8000
7000
6000
Preţuri medii
5000
4000
3000
2000
1000
0
0 2000 4000 6000 8000 10000 12000
Costuri medii
Figura 1 Legătura dintre costurile medii şi preţurilor medii ale tomatelor la S.C. Seromgal S.A.
Galaţi
110
Corelograma din figura 1 evidenţiază o legătură directă, liniară între costurile
medii ale tomatelor şi preţurile medii ale acestora. Prin urmare, estimarea preţurilor medii
în funcţie de costurile medii se efectuează cu ajutorul ecuaţiei de regresie liniară:
y xi i = a + bx i
n a+ b∑ xi = ∑ yi 1 a3 + 3 9 1b9= 43 4 3 9 5
⇔
a∑ xi + b∑ xi = ∑ xi y i 3 9 1a9+ 42 3 2 8 7b5= 1 94 86 5 4 7 1 2 6
2
a = 384,58
b = 0,75
Cu aceste valori ale parametrilor, ecuaţia estimată devine: y x i = 384 ,58 + 0,75 xi
i
. Estimaţia parametrului de regresie b, având o valoare pozitivă, arată că între cele două
variabile analizate există o legătură directă. De asemenea, scoate în evidenţă gradul de
dependenţă dintre variabile, şi anume: la o creştere cu o unitate a costului mediu, preţul
creşte cu 0,75 unităţi.
Alături de stabilirea liniei de regresie este necesar să se măsoare şi intensitatea
legăturii dintre variabile cu ajutorul coeficientului de corelaţie şi al raportului de
corelaţie.
Coeficientul de corelaţie se poate determina prin următoarea relaţie:
n∑ x i y i − ∑ x i ∑ yi
r=
[n ∑ x 2
i
2
][
− ( ∑ x i ) ⋅ n ∑ y i2 − ( ∑ y i )
2
]
13 ⋅ 189547126 − 39194 ⋅ 34395
r= = 0,97
[13 ⋅ 232875146 − ( 39194 ) ] ⋅ [13 ⋅158935227 − ( 34395 ) ]
2 2
111
(∑ y ) 2
a ∑ y i + b∑ x i y i −
i
η= n
(∑ y ) 2
∑y
i
2
i −
n
1
⋅ ( 34395)
2
384,58 ⋅ 34395 + 0,75 ⋅ 189547126 −
η= 13 = 0,97
1
⋅ ( 34395)
2
158935227 −
13
Se constată că cei doi indicatori ai intensităţii sunt egali, rezultând că legătura
dintre variabilele considerate este liniară, directă şi foarte strânsă.
1
n a+ b ∑ x = ∑ yi
i
a x + b 1 = 1 y
∑ i ∑ x2 ∑ x i
i i
112
1 1
n∑ yi − ∑ ∑ yi
xi xi
b=
1 1
n ∑ 2 − (∑ ) 2
xi xi
σ y2
η=
σ yi2
1 (∑ yi ) 2
a ∑ y i + b∑ y i −
xi n
η=
(∑ y ) 2
∑y
i
2
i −
n
Ex. În scopul cercetării legăturii dintre volumul producţiei (mii lei) şi costul
unitar de producţie (lei), se consideră următoarele date:
1 1 Ec. de regresie:
Prod. Cost 1 yi
xi x i2 xi y i2 436 ,26
xi yi x i2 y x i = 5,48 +
xi
0,06 2,33 122
15 35 225 0,0044 5 34,29
20 25 0,05 400 0,0025 1,25 625 27,29
25 25 0,04 625 0,0016 1 625 22,93
0,025 160 0,0006 0,375
40 15 0 2 225 16,38
0,02 250 0,3
50 15 0 0,0004 225 14,2
0,014 490 0,14
70 10 0 0,0002 100 11,7
0,012 640 0,0001 0,125
80 10 5 0 5 100 10,93
0,221 0,0098 5,52 312
300 135 5 7 5 137
Să se studieze forma şi intensitatea legăturii dintre cele două variabile.
b
- forma legăturii: hiperbola - y = a +
xi
1 1 1
∑y ∑ x
i 2
−∑
xi
∑x yi
135 ⋅ 0,00987 − 0,2215 ⋅ 5,52
a= i i
= = 5,48
1 1 7 ⋅ 0,00987 − 0,2215 2
n∑ 2
− (∑ ) 2
xi xi
113
1 1
n∑ yi − ∑ ∑ yi
xi xi 7 ⋅ 5,52 − 0,2215 ⋅ 135
b= = = 436,26
1 1 2 7 ⋅ 0,00987 − 0,2215 2
n ∑ 2 − (∑ )
xi xi
436 ,26
y = 5,48 +
xi
1 (∑ yi ) 2
1352
a ∑ y i + b∑ y i − 5,48 ⋅ 135 + 436,26 ⋅ 5,52 −
xi n 7 = 0,72
η= =
(∑ y ) 2
3125−
135 2
∑y
i
2
i − 7
n
η> 0 există legătură între cele două variabile.
b. Regresie şi corelaţie de tip parabolic
Pentru exprimarea acestui model se utilizaeză, de regulă, parabola de gradul doi,
de forma:
y = a+bx+cx2
Parametrii a, b, c se determină prin metoda celor mai mici pătrate, din sistemul:
n a+ b∑ x i + c∑ x i2 = ∑ y i
a ∑ x i + b∑ x i + c∑ x i = ∑ x i y i
2 3
a ∑ x i2 + b∑ x 3i + c∑ x i4 = ∑ x i2 y i
Intensitatea corelaţiei parabolice se măsoară cu ajutorul raportului de corelaţie:
(∑ y ) 2
a ∑ y i + b ∑ x i y i + c∑ x y i − 2 i
i
η= n
(∑ y ) 2
∑y
i
2
i −
n
Ex. Analizându-se o serie de probe de minereu de cupru pentru conţinutul în
arsen şi telur (miimi de procente ), s-au obţinut datele:
Conţ. în Conţ. x i2 xiyi x 3i x i2 y i x i4 y i2 y = −5,83 + 0,73 x − 0,0085 x 2
114
arsen în telur
xi yi
5 3 25 15 125 75 625 9 -2,3925
15 3 225 45 3375 675 50625 9 3,2075
25 4 625 100 15625 2500 390625 16 7,1075
35 6 1225 210 42875 7350 1500625 36 9,3075
45 7 2025 315 91125 14175 4100625 49 9,8075
55 7 3025 385 166375 21175 9150625 49 8,6075
274625 27462, 1785062
65 6,5 4225 422,5 5 5 42,25 5,7075
421875 33750 3164062
75 6 5625 450 5 36 1,1075
1700 1942, 101600 92987, 6468500 246,2
320 42,5 0 5 0 5 0 5 42,46
Să se studieze forma şi intensitatea legăturii dintre cele două variabile.
-forma legăturii: parabola: y = a+bx+cx2
n a+ b∑ x i + c∑ x i2 = ∑ y i
a ∑ x i + b∑ x i + c∑ x i = ∑ x i y i
2 3
a ∑ x i2 + b∑ x 3i + c∑ x i4 = ∑ x i2 y i
8a + 3 2 b0 + 1 7 0 0c =0 4 2,5
3 2 a01 7 0 0b +0 1 0 1 6 0c 0= 01 9 4,52 a = -5,83; b = 0,73; c = -0,0085
1 7 0 0a +0 1 0 1 6 0b0+ 06 4 6 8 5 c0 =0 90 2 9 8,57
b > 0 → legătură directă
-intensitatea legăturii:
115
(∑ y ) 2
a ∑ y i + b ∑ x i y i + c∑ x y i − 2 i
i
η= n =
(∑ y ) 2
∑y
i
2
i −
n
42,5 2
− 5,83 ⋅ 42,5 + 0,73 ⋅ 1942,5 − 0,0085 ⋅ 92987,5 −
= 8 = 0,74
2
42,5
246,25 −
8
→ există legătură strânsă.
116
Parametrii a1, a2, ..., ak se determină cu ajutorul metodei celor mai mici pătrate,
punând condiţia impusă de aceasta.
Măsurarea intensităţii corelaţiei multiple se poate efectua cu ajutorul raportului de
corelaţie multiplă, în cazul unei regresii neliniare sau cu ajutorul coeficientului de
corelaţie multiplă şi a raportului de corelaţie multiplă, în cazul unei regresii multiple
liniare.
Raportul de corelaţie multiplă are forma:
σ y2
ηy x1, x 2,..., xk = x 1, x 2 ,... xk
.
σ y2
117
-coeficient ponderat.
Coeficientul de concordanţă simplu – se defineşte prin relaţia:
c −d
k= , unde:
n
c = număr de concordanţe de semn ale abaterilor;
d = număr de disconcordanţe de semn ale abaterilor.
∆x i = x i − x sau ∆x i = x i − x i −1
∆y i = y i − y sau ∆y i = y i − y i −1
k=
∑ ∆x i ⋅ ∆y i
∑(∆x ) ⋅ ∑ (∆y )
i
2
i
2
118
Tota c=7 C=5137
105 2605 179 276930
l d=3 D=431
Să se stabilească intensitatea legăturii dintre cele două variabile cu ajutorul coef.
de concordanţă Fechner.
- Coeficientul simplu de concordanţă :
c −d 7 −3
k= = = 0,4 legătură directă slabă
n 10
x=
∑x i
=
105
≈ 10 y=
∑y i
=
2605
≈ 260
n 10 n 10
- Coeficientul de concordanţă ponderat:
C − D 5137 − 431
k= = = 0,84 legătură directă strânsă
C + D 5137 + 431
- Coeficientul pearsonian:
k=
∑ ∆x i ⋅ ∆y i
=
5137 − 431
= 0,66 legătură directă slabă.
∑ (∆x ) ⋅ ∑ (∆y )
i
2
i
2
179 ⋅ 276930
119
-se atribuie ranguri variabilelor xi şi yi, de la numărul 1 a celei mai mari valori, în
continuare;
-se calculează diferenţele- d- dintre rangurile variabilei xi şi yi;
-se calculează şirul d2 şi se însumează;
-se aplică formula.
Coef. de corelaţie Spearman are valori cuprinse între -1 şi +1.
b. Coeficientul Kendall se defineşte prin relaţia:
S
τ= , unde:
0,5n (n −1)
S = P −Q P = ∑p i Q = ∑q i .
pi = nr. rangurilor superioare ale variabilei yi ordonate după xi, care există după fiecare
rang;
qi = nr. rangurilor inferioare ale variabilei yi ordonate după xi, care există după fiecare
rang;
n = nr. unităţilor observate.
Acest coef. poate lua valori cuprinse între -1 şi +1, cu aceleaşi semnificaţii.
Ex. Legătura dintre producţia şi consumul de energie primară (în kg echivalent
cărbune), pe ţări, se prezintă astfel:
Ţara Prod Cons Rang d d2 Ordonare rang pi qi
xi yi x y x y
Africa de Sud 3597 2726 5 7 -2 4 1 2 8 1
Algeria 5552 1583 4 8 -4 1 2 3 7 1
Arabia Saudită 3694 5769 2 3 -1 6 3 1 7 0
Bahrein 1 1705 3 1 2 1 4 8 2 4
Brazilia 2155 8 1 1 0 4 5 7 2 3
Bulgaria 7 850 0 0 3 0 6 4 4 0
China 575 3257 8 5 0 9 7 6 2 1
Germania 1553 920 9 9 2 0 8 5 2 0
Norvegia 945 5475 6 4 -1 4 9 9 1 0
România 2465 7441 1 2 1 1 10 10 0 0
5586 2890 7 6 1
6
2160
Total 4 3 10
0 5
Să se stabilească intensitatea legăturii dintre cele două variabile cu ajutorul coef.
de corelaţie a rangurilor.
6∑ d 2 6 ⋅ 40
-coef. Spearman: θ =1− =1− = 0,75 legătură directă strânsă
n −n3
10 3 − 10
120
S 35 −10
-coef. Kendall: τ= = = 0,55 legătură directă
0,5n ( n −1) 0,5 ⋅10 ⋅ (10 −1)
S = P − Q = 35 −10 P = ∑p i = 35 Q = ∑q i = 10 .
.3 Coeficientul de asociere
Se notează cu Q şi a fost propus de Yule. Se foloseşte pentru stabilirea corelaţiei
între caracteristici alternative, reprezentând o măsură a gradului de asociere.
Determinarea coef. de asociere se bazează pe tabelul de asociere de forma:
x y y1 (da) y2 (nu) nx
x1 (da) a b a+b
x2 (nu) c d c+d
ny a+c b+d
Coef. de asociere este definit de formula:
ad − bc
Q=
ad + bc
Valoarea coef. de asociere are ca interval de variaţie (-1;+1) şi se interpretează ca
oricare coef. de corelaţie.
Ex. Să se stabilească legătura dintre distribuţia populaţiei unui judeţ pe medii
şi pe sexe, cu ajutorul coef. de asociere:
121