Sunteți pe pagina 1din 121

CAPITOLUL I NOŢIUNILE FUNDAMENTALE ALE

STATISTICII

1.1 Obiectul şi metoda statisticii


1.2 Colectivităţile statistice
1.3 Unităţile statistice
1.4 Caracteristicile statistice
1.5 Indicatorii statistici

1.1 Obiectul şi metoda statisticii

Orice disciplină ştiinţifică îşi are metoda sa generală şi particulară, iar la rândul
său fiecare metodă este legată în mod specific de un anumit obiect al cercetării.
Obiectul constituie, în oricare din sistemele de ştiinţe particulare, un criteriu de
bază al clasificării ştiinţelor în sistemul dat.
În toate momentele dezvoltării sale, statistica s-a ocupat cu acele fenomene şi
procese care se produceau într-un număr mare de cazuri, prezentau în reproducerea lor
anumite regularităţi şi care pot fi denumite fenomene de masă sau fenomene de tip
colectiv.
Fenomenele de masă apar ca o mulţime de forme individuale diferite, cu existenţă
distinctă, dar care analizate comparativ se constată că au aceeaşi esenţă. Principala
proprietate a acestor fenomene este variabilitatea în timp şi spaţiu. Legea de apariţie a lor
se manifestă ca tendinţă ce nu poate fi cunoscută şi verificată decât la nivelul ansamblului
şi nu în fiecare caz în parte.
Fenomenelor de masă le sunt specifice legile statistice, legi care se manifestă sub
formă de tendinţă, faţă de care abaterile întâmplătoare, într-un sens sau altul, se
compensează reciproc.
Deci, statistica studiază fenomenele social-economice de masă în cadrul cărora
acţionează legile statistice şi care prezintă proprietatea de a fi variabile în timp şi spaţiu.

1
Statistica studiază aceste fenomene prin caracterizarea laturii cantitativ-numerice
a fenomenelor social-economice, stabilindu-le dimensiunea, dinamica, intensitatea,
structura.
Statistica este ştiinţa care studiază aspectele cantitative ale determinărilor
calitative ale fenomenelor de masă, fenomene care sunt supuse acţiunii legilor statistice.
Obiectul de studiu al statisticii îl constituie mişcările curente-continue ale
fenomenelor şi proceselor ce-şi au existenţa sub formă de colectivităţi.
În funcţie de specificitatea obiectului său de studiu - mişcările curente-continue,
în timp, în spaţiu şi din punct de vedere calitativ ale fenomenelor de tip colectiv -,
statistica şi-a dezvoltat o metodă particulară de investigare.
Totalitatea operaţiilor, tehnicilor, procedeelor şi metodelor de investigare
statistică a fenomenelor formează metodologia statistică .
Metoda statisticii se caracterizează prin următoarele principii metodologice:
1. Observarea faptică – este un proces complex care presupune obţinerea datelor
asupra colectivităţilor social-economice prin observarea, măsurarea şi
înregistrarea unităţilor componente.
2. Exprimarea numerică – este necesară datorită caracterului de masă al
fenomenelor observate de statistică.
Procedeele şi tehnicile, ca parte a metodei statistice, sunt sistematizate şi
organizate pe etape ale demersului statistic şi înlesnesc observarea şi prelucrarea datelor
statistice, precum şi testarea şi analiza informaţiilor statistice.
În mod practic, în orice cercetare statistică se pot diferenţia următoarele etape:
• Pregătirea cercetării – priveşte problematica, documentarea în problemă,
elaborarea metodologiei şi a instrumentelor cercetării.
• Recoltarea datelor statistice – priveşte atât datele vechi, cât şi pe cele noi.
• Prelucrarea datelor – se efectuează pentru obţinerea indicatorilor specifici,
necesari caracterizării sub diferite aspecte a fenomenelor studiate.
• Analiza indicatorilor statistici obţinuţi – pentru stabilirea şi măsurarea legăturilor
dintre fenomene.

2
1.2 Colectivităţile statistice

În viaţa socială, lucrurile şi faptele nu apar sub formă de unităţi individuale,


izolate, ci sub formă de grupuri sau asociaţii de elemente de acelaşi fel.
Asociaţiile de lucruri, de fiinţe, precum şi grupurile de fapte sau mişcări reflectate
de acestea sau legate de ele se numesc în statistică colectivităţi, mulţimi, populaţii sau
fenomene de masă.
Caracteristic colectivităţilor este legătura dintre elementele care o compun prin cel
puţin o trăsătură esenţială comună.
Însuşirea de bază a colectivităţilor o reprezintă omogenitatea, respectiv însuşirea
lucrurilor sau faptelor de a fi esenţial de acelaşi gen. În viaţa socială, însă, acelaşi gen nu
înseamnă identitate.
EX: colectivitatea studenţilor unei facultăţi se caracterizează prin omogenitate,
dar nu prin identitate. Trăsătura comună a acestei colectivităţi este aceea de a fi student al
acelei facultăţi. Unităţile colectivităţii se deosebesc din punct de vedere al sexului,
vârstei, stării civile, domiciliului etc.
În statistică, omogenitatea colectivităţilor este privită sub trei aspecte:
• omogenitate calitativă – este însuşirea lucrurilor de a fi de acelaşi gen din punct
de vedere al caracteristicilor care le definesc esenţial, calitativ.
• omogenitate de timp – este însuşirea lucrurilor de a aparţine aceleiaşi perioade de
timp.
• omogenitate de spaţiu – este însuşirea lucrurilor de a purta anumite caractere
comune în legătură cu condiţiile de teritoriu în care se dezvoltă ele.
Colectivităţile, însă, se caracterizează prin esenţa lor materială, nematerială sau
faptică.
În funcţie de esenţa lor, colectivităţile se grupează în:
a. colectivităţi de lucruri sau de fiinţe, denumite şi colectivităţi de stări pentru că
exprimă starea lucrurilor, numărul şi structura lor la un moment dat. Aceste
colectivităţi cuprind mulţimi de lucruri sau de fiinţe cu caracter de elemente ale
vieţii social-economice.

3
EX: populaţia dintr-un teritoriu, locuinţele oamenilor, mulţimea animalelor
domestice pe specii, mulţimea autovehicolelor etc.
Colectivităţile din această categorie se caracterizează prin esenţa lor materială.
Volumul acestor colectivităţi poate fi stabilit printr-o observaţie instantanee, adică
printr-o numărare sau măsurare la un moment dat.
b. colectivităţi de fapte sau evenimente, denumite şi colectivităţi de mişcări pentru
că exprimă esenţa mişcărilor în viaţa socială. Cuprind evenimente care se produc
în mod continuu în viaţa socială. Volumul lor nu poate fi stabilit prin numărare
sau măsurare la un moment dat, ci prin numărarea curentă a cazurilor care se
produc într-un interval de timp.
Colectivităţile de mişcări, la rândul lor, pot fi grupate după felul succesiunii în
timp astfel:
• colectivităţi cu caracter de continuitate care cuprind fapte sau evenimente
care se succed în mod continuu, fără întreruperi semnificative.
EX: fenomenele demografice: natalitatea, mortalitatea sau producţia curentă.
• colectivităţi cu caracter de discontinuitate sau excepţionale, în care
întreruperile intervin în mod caracteristic.
EX: epidemii, pagube după calamităţi etc.
În cadrul oricărei colectivităţi se pot diferenţia subcolectivităţi sau grupe
caracteristice care prezintă unele caractere distincte faţă de alte grupe componente ale
întregii colectivităţi. Acestea poartă denumirea de tipuri şi pot apărea sub forma unor
grupe mai mult sau mai puţin numeroase în cadrul unei colectivităţi.
Volumul unei colectivităţi cuprinde totalitatea unităţilor componente şi poate fi:
• volum de număr mare, de masă, caz obişnuit în viaţa socială.
EX: populaţia unei ţări
• volum de număr mic
EX: numărul teatrelor din România.
Volumul unei colectivităţi se exprimă sub formă numerică.

4
1.3 Unităţile statistice

Elementele componente ale unei colectivităţi se numesc unităţi statistice.


1. După componenţa lor, se cunosc două feluri de unităţi statistice:
• unităţi statistice simple – formate dintr-un singur element, material sau
nematerial.
EX: o persoană, un caz de naştere ca element al fenomenului de natalitate.
• unităţi statistice complexe – formate din două sau mai multe unităţi
simple.
EX: familia, întreprinderea, clădirea.
2. După rolul lor în procesul înregistrării statistice, pot fi:
• unităţi statistice active – transmit direct date statistice asupra lor, cât şi
asupra unităţilor statistice pe care le reprezintă.
• unităţi statistice pasive – sunt unităţile despre care se transmit date.
Unităţile statistice sunt elemente de observare şi înregistrare, întrucât prin ele se
observă şi înregistrează o populaţie. Se impune definirea lor cu claritate.

1.4 Caracteristicile statistice

Fiecare colectivitate statistică se poate studia şi descrie sub aspectul a diferite


caracteristici pe care ea le poartă.
Caracteristicile statistice sau variabilele statistice reprezintă însuşiri, trăsături
esenţiale purtate de toate unităţile statistice ale unei colectivităţi. Acestea reprezintă
dimensiunile prin care se observă, se măsoară şi înregistrează fiecare unitate din
colectivitate.
Fiecare caracteristică are valori care diferă de la o unitate statistică la alta sau de
la un grup de unităţi statistice la altul.
Un anumit nivel al caracteristicii observate este numit variantă.
Variaţia nivelului unei caracteristici de la o unitate la alta dă caracteristicilor
statistice caracterul de variabilă aleatoare sau stochastică.

5
Caracterul stochastic al unei variabile aleatoare este datorat acţiunii factorilor
întâmplători asupra unităţilor colectivităţii, variantele variabilei depinzând de un sistem
complex de evenimente întâmplătoare. Valorile variabilei aleatoare se obţin prin
observarea unei colectivităţi statistice la un moment dat sau într-un interval de timp.
Mulţimea valorilor posibile ale unei variabile X reprezintă câmpul, domeniul de
variaţie al variabilei, adică:
X : (x1, x2, ..., xn), unde xi reprezintă o variantă purtată de o unitate sau de un grup
de unităţi.
Într-un studiu statistic, pe diferite trepte ale cercetării, se pot întâlni trei tipuri de
variabile:
• Variabile empirice – sunt variabile care exprimă valori reale înregistrate la nivelul
unităţilor statistice.
• Variabile teoretice – sunt valori abstracte cărora le corespund distribuţii teoretice.
• Dacă observarea statistică se efectuează asupra unui eşantion extras dintr-o
colectivitate generală, care se constituie ca obiect al unui studiu statistic, atunci
valorile statistice calculate pe baza datelor obţinute prin sondaj sunt valori ale
unei variabile de selecţie. Variabila de selecţie are caracter de variabilă aleatoare.
Distribuţiile valorilor statistice obţinute prin sondaj sunt numite distribuţii de
selecţie.
Caracteristicile se pot clasifica în funcţie de următoarele criterii:
1. După importanţa lor, pot fi:
o Caracteristici esenţiale – exprimă natura internă a fenomenului şi sunt
purtate de toate unităţile colectivităţii. Prin ele colectivităţile se diferenţiază
unele de altele.
EX: sexul persoanelor
o Caracteristici neesenţiale – au caracter întâmplător şi pot fi purtate
numai de unele unităţi din colectivitate.
EX: vechimea, în calitate de membru al unui club.
2. După natura lor, pot fi:
o Caracteristici calitative – sunt acelea care prin natura lor nu se pot
măsura şi exprima numeric. Acestea se exprimă prin cuvinte.

6
EX: sexul, ocupaţia, starea civilă
o Caracteristici de timp – desemnează apartenenţa unităţilor la un
moment sau la un interval de timp.
o Caracteristici de spaţiu sau teritoriale – exprimă teritoriul în care
există şi se manifestă unităţile colectivităţii.
3. După modul de exprimare, se deosebesc:
o Caracteristici numerice sau cantitative – sunt măsurabile.
EX: vârsta, salariul
Valorile unei caracteristici numerice se stabilesc prin numărare, măsurare,
calcul şi pot fi reprezentate pe o scală interval sau o scală raport.
Domeniul lor de variaţie se numeşte amplitudinea de variaţie a variabilei.
Caracteristicile numerice pot fi cu variaţie continuă, numite variabile
continue sau cu variaţie discontinuă, numite variabile discrete.
Variabila continuă este o caracteristică ale cărei valori sunt divizibile la
infinit şi pot fi grupate pe intervale. Intervalele sau clasele de valori pot fi de
mărimi egale sau inegale, închise sau deschise.
Variabila discretă sau discontinuă ia valori exprimate numai în numere
întregi.
EX: nr. de copii pe o familie, producţia de autoturisme exprimată în bucăţi
o Caracteristici nenumerice sau atributive – sunt caracteristici ale căror
modalităţi de manifestare nu sunt măsurabile numeric. Modalităţile unei
caracteristici pot fi reprezentate pe o scală nominală (meseriile) sau pe o scală
ordinală (calificarea profesională).
4. După forma de manifestare la nivelul unităţilor simple ale unei colectivităţi, se
disting:
o Caracteristici alternative – nu pot lua decât două valori. Se mai numesc şi
caracteristici binomiale sau binare.
EX: un candidat poate fi admis sau respins la un examen, un produs poate fi
bun sau rău.
o Caracteristici nealternative – pot lua valori diferite pentru câte unităţi sau
grupe statistice sunt.

7
1.5 Indicatorii statistici

Indicatorii statistici reprezintă rezultate numerice ale unei numărări, ale unei
măsurări statistice a fenomenelor şi proceselor de masă sau al unor calcule asupra datelor
obţinute printr-o înregistrare statistică.
Indicatorii statistici se pot grupa după mai multe criterii:
• După modul de determinare sunt:
o Indicatori primari – sunt rezultatul unei măsurători statistice şi exprimă, în
mărime absolută, o dimensiune oarecare a unei colectivităţi sau a unui
element al acesteia.
o Indicatori derivaţi – se obţin prin prelucrarea indicatorilor elementari.
• După gradul de cuprindere, indicatorii statistici sunt:
o Indicatori statistici sintetici – sunt expresii numerice ale
categoriilor economice de sinteză.
o Indicatori statistici analitici – exprimă componenţa pe
grupe sau structura unei colectivităţi.
• După forma de exprimare, se pot obţine:
o Indicatori statistici sub formă de mărimi absolute
o Indicatori statistici sub formă de mărimi relative
o Indicatori statistici sub formă de mărimi medii.
Complexitatea realităţii impune folosirea unui sistem de indicatori. Numai sub
formă de sistem, indicatorii statistici îşi au importanţa lor în cadrul analizei şi
caracterizării statistice a stării şi dezvoltării fenomenelor şi proceselor social-economice.

8
CAPITOLUL II SISTEMATIZAREA ŞI PREZENTAREA
DATELOR STATISTICE

Sistematizarea datelor statistice


Seriile statistice
Tabelele statistice
Reprezentarea grafică a seriilor statistice

2.1 Sistematizarea datelor statistice

Sistematizarea datelor reprezintă prima fază a prelucrării statistice şi vizează


obţinerea distribuţiilor statistice. Se realizează prin centralizarea şi gruparea statistică a
datelor.
Acest proces se desfăşoară ca un ansamblu de operaţii, vizând:
• Strângerea tuturor formularelor de înregistrare la locul de prelucrare şi
desprinderea din formulare a datelor individuale.
• Sortarea şi totalizarea datelor la nivelul întregii colectivităţi sau pe grupe
de unităţi omogene.
Centralizarea presupune totalizarea unităţilor statistice sau a valorilor unei
caracteristici la nivelul grupelor tipice sau al colectivităţii studiate.
Totalizarea valorilor unei caracteristici se face prin însumarea directă sau prin
mijlocirea unor coeficienţi de echivalenţă (preţuri, timp de muncă).
În urma centralizării se obţin indicatorii statistici de nivel.
Gruparea statistică, ca procedeu de sistematizare, este o centralizare pe grupe a
unităţilor unei colectivităţi şi se efectuează prin aplicarea metodei grupărilor statistice.
Presupune separarea unităţilor unei colectivităţi în grupe omogene după variaţia uneia sau
mai multor caracteristici de grupare.
În urma grupării statistice rezultă şiruri de date ordonate după variaţia, în sens
crescător sau descrescător, a caracteristicilor de grupare.

9
Se cunosc următoarele tipuri de grupări statistice:
• După numărul caracteristicilor de grupare pot fi:
o Grupări simple – pp. separarea unităţilor unei colectivităţi pe grupe
omogene după variaţia unei singure caracteristici cuprinse în programul observării
statistice.
o Gruparea combinată – pp. separarea unităţilor în grupe omogene după
variaţia simultană a două sau mai multe caracteristici de grupare.
Dintre caracteristicile de grupare se alege o caracteristică primară după variaţia
căreia se distribuie pe grupe unităţile colectivităţii, obţinându-se o primă grupare. Apoi,
fiecare grupă se separă în subgrupe după variaţia celei de-a doua caracteristici de grupare,
numită caracteristică secundară de grupare.
• După natura caracteristicii de grupare pot fi:
o Grupări după o caracteristică de timp
o Grupări după o caracteristică de spaţiu
Aceste două tipuri sunt utilizate când timpul şi spaţiul constituie caracteristici
determinante pentru datele care se grupează.
o Gruparea după o caracteristică calitativă – pp. separarea unităţilor unei
colectivităţi în grupări după o caracteristică calitativă exprimată atributiv (prin cuvinte) şi
după o caracteristică calitativă exprimată cifric.
1. Gruparea după o caracteristică calitativă exprimată atributiv este cunoscută
în statistica socială sub denumirea de clasificare. Clasificările statistice au caracter oficial
şi au ca obiect evidenţierea grupelor tipice care definesc d.p.d.v. structural colectivitatea
(ex: gruparea economiilor naţionale pe ramuri şi subramuri, gruparea populaţiei pe
ocupaţii).
Când variaţia caracteristicii de grupare exprimată atributiv prezintă un număr
mare de modalităţi, categorii, acestea sunt cuprinse în nomenclatoare.
2. Gruparea după o caracteristică calitativă exprimată cifric duce la
obţinerea unor şiruri de date sistematizate, pe baza cărora se calculează indicatori
statistici derivaţi. Această grupare poate fi grupare după o caracteristică cu variaţie
discretă (variantele exprimate în numere întregi) şi grupare după o caracteristică cu
variaţie continuă (variantele exprimate în numere divizibile la infinit).

10
Gruparea după o caracteristică calitativă exprimată cifric se poate efectua fie pe
variante, fie pe intervale de variaţie. Gruparea pe variante se practică în cazul variabilelor
discrete, când numărul variantelor caracteristicii de grupare este redus. Gruparea pe
intervale de variaţie se foloseşte în cazul unei caracteristici continue cu număr mare de
valori.

2.2 Seriile statistice

Ca rezultat al sistematizării datelor prin grupare se obţin seriile statistice sau


distribuţiile statistice.
Seriile statistice sunt şiruri de date grupate după unul din criteriile generale
cunoscute în statistică: gruparea în timp, în spaţiu şi calitativă. Ele se prezintă sub formă
de două şiruri de variabile paralele, dintre care un şir caracterizează variaţia colectivităţii
după caracteristica xi dată, iar celălalt reprezintă frecvenţa ni , adică numărul de unităţi.
Fiecare frecvenţă legată de varianta respectivă a caracteristicii reprezintă un
termen al seriei statistice.
Seriile statistice reprezintă forma de la care începe prelucrarea datelor statistice în
vederea studierii colectivităţii. Numai după formarea seriilor statistice se poate trece la
calcularea diferitelor mărimi specifice statisticii.
După natura caracteristicii de grupare, seriile statistice se împart în:
a) serii de timp;
b) serii de spaţiu;
c) serii calitative.
a) Serii de timp, numite şi serii dinamice sau cronologice – sunt acele serii în care
criteriul după care se diferenţiază termenii este timpul.
După natura colectivităţilor la care se referă, seriile de timp sunt de două feluri:
1. serii de timp de momente
2. serii de timp de intervale.
1. Seriile de timp de momente privesc variaţia în timp a colectivităţilor de
lucruri şi fiinţe.

11
Termenii unei astfel de serii reprezintă volumul unei colectivităţi date, la
momente diferite. Caracteristic este la aceste serii proprietatea că termenii lor nu se
cumulează, acestă operaţie neavând un sens real.
EX: Evoluţia numărului studenţilor unei grupe în decursul a 5 ani se prezintă
astfel:
Anii Nr. studenţilor
1 30
2 32
3 28
4 35
5 35
2. Seriile de timp de intervale sau cumulative privesc variaţia în timp a
colectivităţilor de mişcări, datele lor rezultând din observaţia şi înregistrarea continuă a
faptelor şi evenimentelor, pe măsura apariţiei lor.
EX: Evoluţia producţiei unei firme, într-o perioadă de 5 ani:
Anii Prod. (mld. lei)
1 9
2 8,5
3 10
4 12
5 11
Termenii acestor serii se pot cumula între ei.
b) Serii de spaţiu sau teritoriale – sunt seriile în care criteriul după care se
diferenţiază termenii este teritoriul.
EX: Producţia de eenrgie electrică, pe ţări, în 2002:
Ţara Prod. (mld. lei)
SUA 3699
Federaţia Rusă 834
România 53,5
Germania 551,5
Ungaria 35,4
Sursa: ASR 2001, pg. 972

c) Serii calitative – sunt seriile în care elementul ce diferenţiază termenii este o


caracteristică de esenţă calitativă.
În general, ele caracterizează structura pe grupe sau tipuri a unei colectivităţi.
Denumirea uzală a acestor serii în statistica teoretică este de serii de distribuţie
sau de repartiţie.

12
După modul în care se exprimă calitatea, seriile calitative sunt de 2 feluri:
• Serii calitative cu atribut calitativ – sunt seriile în care elementul după care se
diferenţiază termenii se exprimă prin cuvinte sau expresii.
EX: Transportul de mărfuri, pe moduri de transport, în anul 2002:
Categorii de transport Mii t. Marfă
-transport feroviar 76512
-transport rutier 313701
-transport fluvial 14856
-transport maritim 4540
-transport aerian 10
-transport prin conducte 12480
Sursa: ASR 2001, pg. 515

• Serii calitative cu atribut cantitativ – sunt acelea în care elementul după care se
diferenţiază termenii este exprimat numeric.
EX: Gruparea salariaţilor unei firme după producţia săptămânală (mii tone), se
prezintă astfel:
Grupe salariaţi după prod. Mii t. marfă
0-5 10
5-10 20
10-15 50
15-20 30
20-25 10
În orice serie statistică, fenomenul este privit sub 2 aspecte principale:
- variabila independentă – exprimată prin atributul sau clasa după care s-a făcut
gruparea (xi).
- variabila dependentă – reprezintă funcţia, respectiv numărul unităţilor care
compun grupele, exprimată prin frecvenţe (ni).
Pentru şirul frecvenţelor se poate folosi fie efectivul, reprezentând frecvenţele
absolute, fie ponderea corespunzătoare, reprezentând frecvenţa relativă, notată cu

ni
fi = ⋅ 100
∑ ni
Frevenţa se poate cumula, atât cea în formă absolută (Ni), cât şi cea în formă
relativă (Fi).

13
2.3 Tabelele statistice

În vederea ordonării operaţiilor impuse de prelucrare, seriile statistice sunt


prezentate în tabele statistice.
Elementele principale ale unui tabel statistic sunt:
-titlul general al tabelului care indică obiectul tabelului. Se notează deasupra tabelului şi
trebuie să fie compact, adică să precizeze caracteristica de distribuţie şi să definească
colectivitatea observată.
-titlurile interioare cuprind subiectul şi predicatul tabelului, adică colectivitatea
observată şi caracteristica de grupare. Sunt notate în capul liniilor tabelului şi trebuie să
fie exprimate concis şi precis.
-unitatea de măsură se foloseşte pentru exprimarea elementelor prezentate în tabel şi
este precizată în titlul general când este aceeaşi pentru toate elementele sau în titlurile
interioare, când în tabel sunt cuprinse elemente exprimate diferit.
-notele ajută la interpretarea datelor numerice. Se scriu sub tabel şi sunt indicate prin
asterisc.
-sursa datelor se indică foarte corect şi se scrie sub tabel.
-rubricile tabelului trebuie să fie obligatoriu completate cu date. Când acestea nu se
cunosc, rubricile se completează cu 3 puncte (...), iar când nu există date pentru
elementele cuprinse în tabel, rubricile se completează printr-o linie orizontală (-).
Tabelele statistice se pot grupa în:
-tabele simple
-tabele cu dublă intrare.
Tabelele simple se folosesc pt. prezentarea unei serii cu termenii grupaţi după o
singură caracteristică, aşa numita serie unidimensională.
Tabelele cu dublă intrare, numite şi tabele de corelaţie, realizează prezentarea
unei serii bidimensionale.
Ex. tabel cu dublă intrare:

14
Grupe sal. după Grupe sal. după prod.
-4 4-6 6-8 8-10 10- TOTAL
vechime (ani) (buc.)
-5 3 2 1 - - 6
5-10 2 5 6 - - 13
10-15 - 3 7 10 - 20
15-20 - - 6 10 20 36
20 şi peste - - - 5 30 35
TOTAL 5 10 20 25 50 110

2.4 Reprezentarea grafică a seriilor statistice

Reprezentarea grafică este transpunerea seriilor statistice într-o formă intuitivă, de


obicei geometrică sau figurativă, cu scopul de a înlesni analiza acestora.
Principiul de bază al reprezentării grafice a unei serii statistice îl constituie
proporţionalitatea.
Elementele specifice ale reprezentărilor grafice sunt:
• axele de coordonate. De regulă se folosesc axe în sistemul de coordonate
rectangulare. Se pot folosi şi coordonate polare sau radiale, în special pt.
reprezentarea seriilor de timp cu variaţie ciclică sezonieră.
În cazul axelor în sistemul de coordonate rectangulare, pe axa abscisei se înscriu
valorile variabilei independente X, iar pe axa ordonatei valorile variabilei dependente,
respectiv ale frecvenţelor.
• scara. Se pot folosi scări uniforme, respectiv scara aritmetică în care diviziunile
sunt echidistante sau scări neuniforme, respectiv scara logaritmică. Scara
logaritmică se foloseşte în special pt. reprezentarea grafică a seriilor de timp între
termenii cărora există diferenţe mari.
• reţeaua graficului. Se construieşte trasând linii paralele cu axele de coordonate
pentru fiecare valoare xi şi yi.
• legenda. Apare necesară când se cunosc 2 sau mai multe diagrame, respectiv se
reprezintă elemente diferite în acelaşi sistem de axe de coordonate. Legenda are
rolul de a explica elementele reprezentate grafic. De regulă, se amplasează alături

15
de figură şi se construieşte reproducând la scară redusă elementele de construcţie
folosite în reprezentarea grafică.
Reprezentarea grafică a seriilor de timp
Se realizează prin:
-cronogramă
-diagrama polară.
Cronograma sau historiograma sau diagrama de succesiune se poate construi
prin benzi, coloane, figuri geometrice şi liniar. Cronograma se bazează pe sistemul de axe
rectangulare, în care, pe abscisă se reprezintă timpul, iar pe ordonată valorile
fenomenului.
Cronograma liniară se utilizează pt. reprezentarea seriilor de timp de intervale şi
se poate construi atât pe scară aritmetică, cât şi logaritmică.
EX. cronogramă liniară pe scară aritmetică pt. reprezentarea unei serii de timp
de intervale:
Evoluţia producţiei a 2 firme într-o perioada de 5 ani (mil. lei):
Anii Prod. firmei Prod. firmei B
A
1 350 500
2 450 600
3 400 400
4 600 800
5 550 700
900

800 800
700 700

600 600 600


Prod. mil lei

550
500 500 Prod. f irmei A
450
400 400 Prod. f irmei B
350
300
200

100

0
1 2 3 4 5
Anii

Cronograma prin coloane se construieşte pt. reprezentarea grafică a seriilor de


timp de momente. În acest caz, din fiecare moment aflat pe axa absciselor se ridică câte o
coloană, cu baza pe această axă, a cărei înălţime corespunde mărimii indicatorilor seriei.

16
Dacă cronogramele liniare relevă tendinţa de evoluţie a fenomenului, cele prin
coloane arată volumul fenomenului.
EX. cronogramă prin coloane pt. reprezentarea unei serii de timp de momente.
Pp. următoarea evoluţie a numărului de elevi dintr-o şcoală:
Anii Nr. elevi
1 509
2 582
3 568
4 250
5 378
700

600

500

400
Nr. elevi

Nr. elevi
300

200

100

0
1 2 3 4 5
Anii

Diagramele polare sau diagrame radiale sau diagrame în spirală, se utilizează pt.
reprezentarea seriilor de timp cu oscilaţii sezoniere ciclice. Se construiesc cu ajutorul
reţelelor radiale sau curbilinii. La aceste grafice circumferinţa cercului serveşte pt.
notarea timpului, având rolul de abscisă. Mărimea razei cercului corespunde nivelului
indicatorilor seriei.
Diagramele polare se construiesc sub 2 forme:
-diagramă polară prin sectoare de cerc;
- diagramă polară prin segmente de dreaptă.
EX. diagramă polară
Pp. următoarea evoluţie lunară a producţiei unei firme (mil. lei):
Luna I II III IV V VI VII VIII IX X XI XII
Prod. 25 31 32 35 35 49 78 754 73 81 81 730
0 0 0 5 5 7 7 2 1 1

17
I
900
XII II
700
730
500
XI III
811 300250 310
320
100
X -100 355 IV
811

355 Prod.
732
IX V
497
754
VIII VI
787
VII

Reprezentarea grafică a seriilor calitative


Se realizează diferit în funcţie de modul de exprimare a caracteristicii şi de nr.
caracteristicilor de variaţie.
Seriile calitative cu atribut cantitativ se reprezintă grafic prin:
-histogramă;
-poligonul frecvenţelor;
-curba frecvenţelor.
Histograma este graficul specific pt. reprezentarea seriilor calitative cu
caracteristica numerică grupată pe intervale. Pe abscisă se reprezintă mărimea
intervalelor de variaţie a caracteristicii, iar pe ordonată se construieşte scara frecvenţelor.
La construirea histogramei se diferenţiază 2 posibilităţi:
-intervalele de variaţie a caracteristicii sunt egale;
- intervalele de variaţie a caracteristicii sunt neegale.
Histograma este o cronogramă prin coloane, dar cu coloanele lipite.
EX. histogramă pt. o serie distribuţie cu intervale egale:
Pp. că un grup de 40 muncitori se grupează după prod. zilnică (nr. piese) astfel:
Grupe de muncitori Nr. muncitori
după prod. zilnică
5-10 5
10-15 10
15-20 15
20-25 8
25-30 2
TOTAL 40

18
16
14
12 (5-10)

Nr. muncitori
10 (10-15)
8 (15-20)
6 (20-25)
4 (25-30)
2
0

Nr. piese

În cazul intervalelor de grupare a caracteristicii neegale, pt. reprezentarea


histogramei trebuiesc micşorate frecvenţele grupelor proporţional cu raportul dintre
mărimea intervalelor grupelor şi mărimea celui mai mic interval.
EX. Pp. următoarea grupare a muncitorilor unei secţii după producţia
săptămânală:
Grupe Frecvenţe
muncitori Nr. Interval redus reduse
Mărimea intervalelor marimea interval.
după prod. muncitori ni
caracteristicii R=
săpt. ni marimea interv.cel mai mic
xi R
20-30 10 10 1 10
30-50 30 20 2 15
50-80 60 30 3 20
80-90 70 10 1 70
90-110 60 20 2 30
110-120 20 10 1 20
TOTAL 250 - - 165
80

70

60
20-30
50 30-50
ni/R

50-80
40
80-90
30 90-110
110-120
20

10

Xi

Poligonul frecvenţelor poate fi considerat ca o variantă a histogramei. Se


construieşte unind cu o linie frântă punctele ce marchează mijlocul bazelor de sus a
coloanelor din histogramă.

19
EX. Distribuţia după timpul de deplasare spre locul de muncă a unui eşantion
de 45 de persoane (minute):
Gruparea după timpul Nr. pers.
de deplasare ni
xi
0-20 5
20-40 8
40-60 10
60-80 12
80-100 7
100-120 3
TOTAL 45

14

12

10 0-20
20-40
8
40-60
ni

6 60-80
80-100
4 100-120

Xi

Curba frecvenţelor este asemănătoare poligonului frecvenţelor. Punctele din plan


însă nu se mai unesc prin segmente de dreaptă, ci printr-o curbă continuă, obţinută prin
ajustarea punctelor. Astfel reprezentată, curba frecvenţelor aproximează mult mai bine
forma de distribuţie a colectivităţii după caracteristica cercetată.
EX. Gruparea unui eşantion de 50 muncitori după prod. zilnică (metri):
Grupe de muncitori Nr. muncitori
după prod. zilnică ni
xi
20-30 4
30-40 8
40-50 20
50-60 10
60-70 8
TOTAL 50

20
25

20

20-30
15 30-40
40-50
ni

10 50-60
60-70
5

Xi

Seriile calitative cu atribut calitativ se reprezintă grafic prin:


-diagrame de structură: dreptunghi, pătrat, cerc de strucutră.
Dreptunghiul de structură pp. construirea unui dreptunghi cu baza egală cu 1 şi
înălţimea egală cu 100%. În interiorul acestuia se construiesc dreptunghiuri mai mici,
suprapuse, cu suprafeţe proporţionale cu ponderea părţilor în colectivitate.
Pătratul de structură are o suprafaţă echivalată cu 100%. Suprafaţa pătratului se
împarte în 100 pătrate mici, fiecare având aria egală cu 1%. Se separă apoi, prin haşuri
diferite, un nr. de pătrate corespunzător ponderii fiecărei părţi din colectivitate.
Cercul de structură. Suptafaţa cercului se consideră proporţională cu volumul
colectivităţii. În cadrul cercului de structură se separă sectoare de cerc proporţionale cu
ponderea părţilor în colectivitate.
Reprezentarea grafică a seriilor de spaţiu
Seriile de spaţiu se reprezintă grafic prin cartograme şi cartodiagrame.
Cartograma prezintă distribuţia în spaţiu a intensităţii de manifestare a unui
fenomen. Construirea unei cartograme pp. efectuarea următoarelor operaţii:
-gruparea unităţilor teritoriale după o variabilă;
-construirea unei hărţi în care se delimitează unităţile teritoriale, de ex. fiecare judeţ în
cadrul unei hărţi administrative a ţării;
-haşurarea suprafeţelor unităţilor teritoriale în funcţie de intensitatea de manifestare a
fenomenului studiat.

21
Cartodiagrama prezintă distribuţia în spaţiu a structurii unui fenomen.
Construirea unei cartograme pp. efectuarea următoarelor operaţii:
-determinarea structurii fenomenului cercetat;
-construirea unei hărţi cu unităţile teritoriale bine delimitate;
-construirea pe supraf. fiecărei unităţi teritoriale a unei diagrame de structură.

22
CAPITOLUL III INDICATORII STATISTICI

3.1 Necesitatea folosirii indicatorilor statistici


3.2 Indicatori statistici primari şi derivaţi
3.3 Indicatori în mărimi absolute şi în mărimi relative

3.1 Necesitatea folosirii indicatorilor statistici


Obiectul de studiu al statisticii îl formează fenomenele şi procesele de masă, a
căror proprietate principală este variabilitatea formelor individuale de manifestare în
timp, în spaţiu şi sub raport organizatoric.
În sensul cel mai larg, indicatorul statistic este expresia numerică a unor
fenomene, procese activităţi sau categorii economice şi socilae, definite în timp, spaţiu şi
calitativ.
Obţinuţi în cadrul unor cerecetări statistice concrete, indicatorii statistici sunt
purtători de informaţii având conţinut real, obiectiv determinat.
Indicatorii statistici îndeplinesc în cerecetarea statistică o serie de funcţii, cum ar
fi:
• Funcţia de măsurare, care derivă din particularităţile statisticii, ca ştiinţă care
porneşte întotdeauna de la cunoaşterea empirică a fenomenelor, iar prin
generalizare, la cunoaşterea esenţei acestora. În urma acestei operaţii se obţin
indicatorii absoluţi care măsoară o colectivitate statistică.
• Funcţia de comparare, provine din faptul că statistica operează cu fenomene
variabile, ceea ce necesită cunoaşterea modificărilor intervenite ca nivel de
dezvoltare sau ca structură. Compararea se face fie ca diferenţă, fie sub formă de
raport. De aici rezultă indicatorii derivaţi.
• Funcţia de analiză, provine din faptul că statistica operează în mod frecvent cu
diferite variabile complexe care se pot descompune fie într-un produs de mai
mulţi factori, fie într-o sumă de mai multe elemente componente. În ambele cazuri
este necesar să se analizeze relaţiile care există între fiecare parte şi întreg, între
fiecare factor şi rezultat.

23
• Funcţia de sinteză, este specifică fenomenului care se manifestă diferit de la o
unitate la alta. De regulă, se calculează indicatori sub formă de valori medii.
• Funcţia de estimare, este specifică metodei statistice şi poate să se folosească
pentru măsurarea tendinţei de dezvoltare a fenomenului în aceeaşi perioadă de
timp, variabilă ca spaţiu sau calitativ sau în aceleaşi condiţii de spaţiu şi calitativ,
dar variabile în timp.
• Funcţia de verificare a ipotezelor şi de testare a semnificaţiilor unor
indicatori, este aplicată în interpretarea statistică a fenomenelor economice şi
sociale.
Verificarea ipotezelor conduce la folosirea indicatorilor care nu au ataşate o
singură valoare, ci un interval de valori.
Funcţiile indicatorilor statistici stau la baza clasificării lor.

Indicatori statistici primari şi derivaţi

După etapa în care apar în procesul de cunoaştere statistică, indicatorii statistici


sunt:
• Indicatori primari, se obţin în cadrul prelucrării primare a datelor statistice ca
urmare a procesului de centralizare a datelor unei observări statistice. Ei au
conţinut concret şi formă concretă de exprimare. Ei constituie baza informaţională
a cunoaşterii statistice. De regulă, aceşti indicatori sunt incluşi în analiza statistică
pe toate structurile organizatorice ale economiei naţionale.
În practică se pot întâlni mai multe categorii de indicatori primari:
- indicatori primari care se obţin de regulă la nivelul unităţilor complexe ca sumă a
unor componente;
- indicatori primari obţinuţi prin agregarea unor valori individuale cu acelaşi
conţinut calculat pe treptele ierarhice inferioare;
- indicatori primari obţinuţi direct din observare, atunci când se face un studiu
monografic a unei unităţi statistice.

24
Ca o trăsătură caracteristică a acestor indicatori primari se remarcă faptul că
elementele lor constitutive se regăsesc la nivelul tuturor unităţilor folosite la culegerea
datelor.
• Indicatori derivaţi, se obţin în faza de prelucrare statistică a mărimilor
absolute prin aplicarea diferitelor metode şi procedee de calcul statistic.
Indicatorii derivaţi fac posibilă analiza aspectelor calitative ale
fenomenelor şi proceselor cercetate. Ei exprimă relaţii cantitative dintre
diferite caracteristici statistice, dintre diferitele părţi ale unei colectivităţi
sau dintre fenomenele ce se găsesc într-un anumit grad de
interdependenţă.
De regulă, indicatorii derivaţi se obţin prin aplicarea unui model de calcul statistic
de comparare sau de estimare.
Modelele de estimare sunt folosite în statistică pentru a putea măsura gradul de
influenţă a diferiţilor factori asupra fenomenului analizat.
Indicatorii derivaţi au un caracter abstract, chiar dacă uneori se exprimă în unităţi
specifice de măsură. Aceştia sunt extrem de numeroşi şi cu metdologii variate de calcul
sub formă de mărimi relative, mărimi medii, indicatori ai variaţiei, indici, indicatori ce
caracterizează corelaţia.

Indicatori în mărimi absolute şi în mărimi relative


3.3.1 Indicatori în mărimi absolute

În urma sistematizării datelor, prin centralizare şi grupare, se obţin indicatori


primari. Pe baza lor, prin diferite procedee statistice de comparare, abstractizare şi
generalizare, se obţin indicatorii derivaţi.
Prin indicatorii primari se prezintă, sub formă de mărimi absolute, volumul unui
ansamblu de unităţi sau valoarea unei caracteristici, pe total sau pe grupe.
În statistică, mărimile absolute reprezintă valori definite prin ele însele,
independent de orice sistem de referinţă. Sunt folosite pentru exprimarea indicatorilor de
nivel şi ai variaţiei absolute.

25
a) Indicatorii de nivel exprimă aspectul cantitativ al fenomenelor, volumul unui
ansamblu sau valoarea unei caracteristici. Indicatorii de nivel se determină ca:
- indicatori individuali – se obţin în urma unei înregistrări statistice şi exprimă
valoarea caracteristicii observate la nivelul fiecărei unităţi statistice.
- Indicatori sintetici – reprezintă rezultatul centralizării pe grupe sau pe ansamblul
colectivităţii.
Însumarea directă a elementelor considerate în calculul indicatorilor sintetici este
posibilă doar pentru elemente omogene.
b) Indicatorii variaţiei absolute se obţin prin compararea, sub formă de scădere, a 2
nivele ale aceluiaşi indicator.
Variaţia absolută, numită şi spor, se simbolizează ∆1 / 0 şi se calculează pentru
x

variabila xi la momentele T0 şi T1, astfel:


∆x1 / 0 = x1 − xo ,

sau în general: ∆ i / 0 = xi − xo
x

Indicatorii exprimaţi în mărimi absolute, individuali sai sintetici, au o feră de


comparabilitate redusă.

Indicatori în mărimi relative

Mărimile relative exprimă rezultatul comparării, sub formă de raport, a doi


indicatori statistici şi arată câte unităţi din indicatorul de la numărător revin la o unitate a
indicatorului considerat ca bază de raportare.
Obţinerea mărimilor relative presupune rezolvarea a trei probleme principale:
- alegerea bazei de comparare – se face în funcţie de gradul de interdependenţă
dintre caracteristicile sau fenomenele comparate sau în funcţie de scopul
cercetării.
- asigurarea comparabilităţii datelor care formează raportul – cere ca indicatorii
comparaţi să fie mărimi comparabile.
- alegerea formei de exprimare a mărimilor relative – pp. exprimarea sub formă de
coeficienţi sau de procente.

26
Exprimarea sub formă de coeficienţi este folosită când indicatorii comparaţi dau
un rezultat exact sau sunt valori apropiate. Arată de câte ori se cuprinde indicatorul de
raportat în baza de raportare.
Exprimarea sun formă de procente (sau promile) este folosită când indicatorul de
raportat este mult prea mic faţă de bază pentru ca raportul să fie sugestiv.
În analiza statistică se utilizează diferite tipuri de mărimi relative:
1. mărimi relative de structură
2. mărimi relative de corespondenţă
3. mărimi relative de intensitate
4. mărimi relative de variaţie.
1. Mărimile relative de structură
Calculul acestor mărimi este impus de necesitatea cunoaşterii aprofundate a
compoziţiei acelor colectivităţi care au fost separate în grupe sau subgrupe după variaţia
uneia sau mai multor caracteristici de grupare. Ele exprimă raportul dintre parte şi întreg
şi arată ponderea părţii, grupei faţă de totalul colectivităţii.
Într-o serie statistică atributivă, într-o serie teritorială sau pentru o variabilă
statistică construită pe baza unor componente, ponderea sau greutatea specifică a unui

n
element (xi) în totalul colectivităţii ( ∑xi ) se obţine pe baza relaţiei:
i =1

xi
fi = n
⋅ 100, i = 1, n
∑x
i =1
i

2. Mărimile relative de corespondenţă


Denumite şi mărimi relative de coordonare, mărimile relative de corespondenţă
caracterizează raportul numeric în care se găsesc doi indicatori de acelaşi fel, aparţinând
unor grupe ale aceleiaşi colectivităţi statistice sau unor colectivităţi statistice de acelaşi
fel, dar situate în spaţii diferite.
Aceste mărimi exprimă câte unităţi din grupă revin la 100, respectiv 1000 de
unităţi din cealaltă grupă.
3. Mărimile relative de intensitate

27
Considerate caracteristici derivate, în statistică, mărimile relative de intensitate se
obţin prin raportarea a doi indicatori absoluţi de natură diferită care se află într-o relaţie
de interdependenţă.
Mărimile relative de intensitate sunt exprimate în unităţile concrete de măsură ale
celor două variabile. Aceste mărimi evidenţiază gradul, intensitatea de răspândire a
fenomenului în raport cu variabila la care se raportează. Sunt utilizate în diverse domenii:
demografic, economic etc.
În demografie se utilizează pentru caracterizarea mişcării populaţiei. De ex.,
pentru caracterizarea mişcării naturale a populaţiei se calculează raportul dintre numărul
naşterilor, al deceselor, sporul natural şi numărul populaţiei dintr-o zonă, la un moment
dat.
În economie se utilizează pentru caracterizarea gradului de dotare, de înzestrare
tehnică a muncii, pentru calculul productivităţii muncii şi, în general, pentru determinarea
indicatorilor de eficienţă economică.
În domeniul social-cultural se utilizează pentru caracterizarea nivelului de trai.
În cazul în care diferenţa dintre indicatorii raportaţi (ca mărime) este prea mare,
pentru a obţine un rezultat semnificativ, raportul se înmulţeşte fie cu 1000, fie cu 10000.
4. Mărimile relative de variaţie
Numite şi mărimi relative ale dinamicii, ritmuri sau indicii dinamicii, exprimă
variaţia relativă a unei variabile între două momente sau perioade considerate, perioada
curentă sau efectivă, notată cu 1 şi perioada de bază, notată cu zero.
În funcţie de complexitatea fenomenului studiat, se pot calcula:
- indici elementari – descriu variaţia relativă a unei singure valori.
- indici sintetici – permit descrierea unui ansamblu de valori.

Ex. Mărimi relative de structură


Transportul de mărfuri, pe moduri de transport, în anul 2002:
Categorii de transport Mii t marfa
-transp. feroviar 76512
-transp. rutier 313701
-transp. fluvial 14856
-transp. maritim 4540
-transp. aerian 10
-transp. prin conducte 12480

28
Total 422099
Sursa: ASR, 2001, pg. 515

Să se calculeze mărimile relative de structură.


ni
fi = n
⋅ 100,
∑n
i =1
i

76512
- pt. transp. feroviar: f i = ⋅ 100 = 18,12% ,
422099
313701
- pt. transp. rutier: f i = ⋅ 100 = 74,31%
422099
14856
- pt. transp. fluvial: f i = ⋅ 100 = 3,51%
422099
4540
- pt. transp. maritim: f i = ⋅ 100 = 1,07%
422099
10
- pt. transp. aerian: f i = ⋅ 100 = 0,002%
422099
12480
- pt. transp. prin conducte: f i = ⋅ 100 = 2,988%
422099
Proprietatea: 18,12+74,31+3,51+1,07+0,002+2,988=100%

Ex. Mărimi relative de corespondenţă


Gruparea salariaţilor unei firme, pe sexe:
Grupe de sal. pe sexe Nr. sal.
-femei 300
-bărbaţi 500

Să se calculeze mărimile relative de corespondenţă.


nr. femei 300
- pt. femei = ⋅1000 = ⋅1000 = 600 femei la 1000 bărbaţi
nr. barbati 500
nr. barbati 500
- pt. bărbaţi = ⋅1000 = ⋅1000 = 1666 barbati la 1000 femei.
nr. femei 300

Ex. Mărimi relative de intensitate


Mişcarea naturală a populaţiei în 1998 se caracterizează prin următoarele date:
Indicatori Număr

29
-născuţi-vii 127111
-decese 156433
-căsătorii 62391
-divorţuri 11283
-născuţi-morţi 800
-decese la vârstă sub 1 2961
an
Sursa: ASR 1999, pg. 74
Să se calculeze mărimile relative de intensitate posibile, ştiind că nr. populaţiei
era de 22.502.803 locuitori.
nr. nascuti vii 127111
- coef. de natalitate = ⋅1000 = ⋅1000 = 5,64 ‰
nr . locuitori 22502803
nr. decedati 156433
- coef. de mortalitate = ⋅1000 = ⋅1000 = 6,95 ‰
nr . locuitori 22502803
nr. casatorii 62391
- coef. de nupţialitate = ⋅1000 = ⋅1000 = 2,77 ‰
nr . locuitori 22502803
nr. divorturi 11283
- coef. de divorţurilor = ⋅1000 = ⋅1000 = 0,50 ‰
nr . locuitori 22502803
nr. nascuti mor' i 800
- coef. morţi-natalitate = ⋅1000 = ⋅1000 = 0,03 ‰
nr . locuitori 22502803
nr. decese sub 1 an 2961
- coef. mortalităţii infantile= ⋅1000 = ⋅1000 = 0,13
nr . locuitori 22502803

30
CAPITOLUL IV MĂRIMILE MEDII

4.1 Noţiuni teoretice privind mărimile medii


4.2 Media aritmetică
4.3 Modul
4.4 Mediana. Quantilele
4.5 Mediala
4.6 Mărimi medii cu aplicaţie specială
4.7 Relaţii între valorile mărimilor medii

Noţiuni teoretice privind mărimile medii

În centrul metodelor şi tehnicilor elaborate de statistică pentru reprezentarea


sintetică a colectivităţilor se situează mărimile medii.
În prima jumătate a secolului al XIX- lea, media devine în statistică o categorie
atât de însemnată, încât unii statisticieni legau de ea însuşi obiectul statisticii.
Statisticienii au fost preocupaţi de căutarea unor tehnici de calcul superioare, dar şi de
ideea de a justifica ştiinţific noţiunea de medie. S-a ajuns astfel ca media să reprezinte o
categorie metodologică specializată, cea mai cuprinzătoare şi specifică statisticii, cu
forme de calcul variate.
Statistica a elaborat o teorie a mediei, teorie bazată pe principiul compensării
reciproce a influenţei factorilor întâmplători, neesenţiali.
Reglarea influenţei factorilor întâmplători ce intervin în dezvoltarea
fenomenelor de masă se realizează conform aşa-numitei legi a numerelor mari. Enunţată
de Jakob Bernoulli încă din sec. 18, aprofundată de matematicianul Poisson (care îi dă şi
numele de lege a numerelor mari), această lege stabileşte în esenţă că în cercetarea unui
fenomen de masă, cu cât se cuprinde un nr. mai mare de cazuri, cu atât erorile
întâmplătoare îşi vor micşora mai mult influenţa asupra nivelurilor reprezentative ale
fenomenului.

31
Media este o metodă de separare a influenţelor venite pe calea factorilor
întâmplători în dezvoltarea colectivităţilor.
Media este o categorie metodologică a statisticii având rolul de a caracteriza în
mod sintetic nivelurile individuale ale unei caracteristici definite într-o colectivitate
statistică, scoţând în evidenţă ceea ce este esenţial, legic în conţinutul acelei caracteristici.
În statistică contemporană se utilizează un număr mare de mărimi medii care
diferă între ele atât prin definiţia lor, prin modul de calcul, cât şi prin conţinutul şi rolul
lor specific pe care îl au în cercetarea statistică.
Astfel, se cunosc:media aritmetică, media cronologică, media pătratică, mediile
mobile, media armonic, media geometrică, mediana, modul, mediala etc.
• În funcţie de modul de determinare, mărimile medii sunt:
-mărimi medii de poziţie, ce cuprind: mediana, modul şi mediala şi se determină prin
identificarea termenului care cuprinde în serie grupa elementelor normale, reprezentative.
-mărimi medii de calcul, cuprind toate celelalte medii.
În calculul acestor medii se succed 2 operaţii matematice:
-acumularea tuturor nivelurilor individuale (realizată prin însumare sau produs),
-revenirea la un nivel reprezentativ pentru toţi termenii incluşi în calcul (realizată prin
împărţire sau extragere de radical).
• După locul pe care-l ocupă în practica statisticii, mărimile medii pot fi:
- mărimi medii fundamentale, cuprind media aritmetică, mediana, modul şi se utilizează
în mod curent în statistică,
- mărimi medii cu aplicaţie specială, cuprind media geometrică, pătratică, armonică,
mobilă, progresivă, medii care se utilizează în cazuri speciale.
• În funcţie de felul seriei pentru care se calculează, mărimile medii sunt:
- medii simple, se calculează în serii simple,
- medii ponderate, se calculează în serii cu frecvenţe.
Indiferent de natura lor, mărimile medii trebuie să satisfacă mai multe condiţii
generale, cunoscute în literatura de specialitate sub denumirea de condiţiile lui Yule, după
numele statisticianului englez care le-a formulat pentru prima dată.
Aceste condiţii sunt:

32
-mărimile medii trebuie definite în mod precis şi obiectiv, indiferent de aprecierea
subiectivă a fiecărui cercetător;
-mărimile medii trebuie să fie reprezentative, adică să reprezinte toţi termenii seriei;
-media trebuie să aibă o semnificaţie concretă, uşor de conceput şi observat chiar pentru
nespecialişti;
-media trebuie să fie simplu de calculat şi să se preteze la calcule algebrice ulterioare;
-media trebuie să fie cât mai puţin sensibilă la fluctuaţiile de selecţie. Adică, indiferent
prin ce eşantioane s-ar obţine datele asupra unei colectivităţi, media rezultată trebuie să
fie aproximativ aceeaşi.
În general, nu toate aceste condiţii pot fi satisfăcute de orice mărime medie.

Media aritmetică
Definiţie şi mod de calcul

Media aritmetică este cel mai des utilizată în practica statisticii, făcând parte din
categoria mediilor fundamentale şi de calcul.
Notată cu x , media se calculează atât pentru serii simple, cât şi pentru serii cu
frecvenţe.
Media aritmetică simplă se foloseşte pentru seriile în care fiecare nivel al
caracteristicii este purtat de o singură unitate statistică.
Calculul acestei medii presupune însumarea nivelurilor individuale ale
caracteristicii şi împărţirea la numărul lor.
Considerăm seria: x1, x2, x3,...,xn. Media aritmetică se va calcula astfel:
n
x + x 2 + x 3 + ... + x n
x= 1 sau ∑x i
, i =1, n , n=volumul colectivităţii
n x= i =1

Ex. Valoarea vânzărilor realizate la nivelul unei firme în 6 zile se prezintă


astfel (mil. lei): 700, 650, 850, 750, 500, 450.
Să se calculeze valoarea medie zilnică a vânzărilor firmei.

33
n

∑x i
700 + 650 + 850 + 750 + 500 + 450 mil. lei.
x= i =1
= = 650
n 6
Media aritmetică ponderată se foloseşte în cazul seriilor cu frecvenţe. În acest
caz, se va ţine seama de mărimea frecvenţei corespunzătoare fiecărui nivel al
caracteristicii.
Dacă x1, x2, x3,...,xm sunt niveluri individuale ale ale caracteristicii, iar n1, n2,
n3,...,nm nivelurile corespunzătoare frecvenţelor, atunci media ponderată se va calcula
astfel:
n

x 1 n 1 + x 2 n 2 + x 3 n 3 + ... + x n n m
∑x n i i
x= sau x= i =1
n 1 + n 2 + ... + n m n

∑n
i =1
i

Ex. Gruparea salariaţilor după producţia orară (buc.):


Grupe sal. după producţie Nr. sal. xini
11 7 77
9 3 27
12 18 216
19 30 570
18 10 180
8 2 16
Total 70 1086
Să se determine producţia medie orară.
n

∑x n i i
1086
x= i =1
n
= = 15,5 buc.
70
∑n i =1
i

Când într-o serie calitativă cu atribut cantitativ, caracteristica este dată sub formă
de intervale, înainte de a aplica relaţia de calcul a mediei, se va proceda la înlocuirea
fiecărui interval prin câte o singură variantă a caracteristicii. Această variantă este dată de
centrul intervalului, determinat ca o medie aritmetică simplă a limitelor intervalelor.
Ex. Gruparea muncitorilor după timpul nefolosit productiv zilnic (minute):
Grupe muncit. Nr. muncit. xi xini
după timp ni
10-20 5 1 75
20-30 15 5 375

34
30-40 20 2 700
40-50 30 5 1350
50-60 10 3 550
60-70 5 5 325
70-80 7 4 525
80-90 3 5 255
5
5
6
5
7
5
8
5
Total 95 - 4155
Să se determine timpul nefolosit productiv zilnic în medie de un muncitor.
n

∑x n i i
4155
x= i =1
n
= = 43,7 minute.
95
∑n
i =1
i

Din definiţia mediei aritmetice rezultă că aceasta este sensibilă la prezenţa


valorilor aberante, adică dacă seria are o valoare cu mult diferită ca mărime faţă de
celelalte valori, atunci media nu mai exprimă seria. În astfel de cazuri se elimină valoarea
aberantă în vederea calculării unei medii reprezentative.

Proprietăţi ale mediei aritmetice

Media aritmetică are o serie de proprietăţi:


a. Media aritmetică este o valoare internă a unei serii
Această proprietate exprimă faptul că media aritmetică a unei variabile statistice
este cuprinsă între cea mai mică şi cea mai mare valoare a caracteristicii.
x min < x < x max

b. Media aritmetică a unui şir de valori constante este egală cu acea constantă
Dacă în seria x1, x2, x3,..., xi,...,xm
n1, n2, n3,...,nm
considerăm că x1=x2= x3=...= xi=...=xm=k,

35
n n

∑ x n ∑ kn
i i i

atunci: x = = =k
i =1 i =1
n n

∑n
i =1
i ∑n
i =1
i

c. Media aritmetică este asociativă


Dacă se înlocuiesc, în cadrul unei serii statistice, mai multe niveluri individuale
ale caracteristicii cu media lor, atunci media seriei nu se schimbă. În particular, dacă într-
o serie statistică se înlocuiesc toate nivelurile individuale ale caracteristicii cu media lor,
atunci valoarea totală a caracteristicii rămâne neschimbată.
d. Media aritmetică este translativă
Dacă se micşorează fiecare nivel individual al caracteristicii dintr-o serie cu o
cantitate constantă „a”, media se micşorează cu acea constantă.
Pe baza acestei proprietăţi, rezultă următoarele formule de calcul simplificat a
mediei aritmetice:
n

-pt. serii simple: ∑ (x i − a)


x= i =1
+a
n
n

∑ (x i − a) ⋅ n i
-pt. serii ponderate: x= i =1
n
+a
∑n
i =1
i

Pentru o simplificare maximă a calculelor, constanta „a” se alege egală cu un


nivel al caracteristicii din centrul şirului xi.
e. Dacă se micşorează fiecare variantă a caracteristicii de un anumit număr de
ori ”k”, atunci media seriei se micşorează de acelaşi număr de ori.
Se obţin următoarele relaţii:
n
xi
-pt. serii simple: ∑k
x= i =1
⋅k
n
n
xi
∑ k
⋅ ni
-pt. serii ponderate: x= i =1
n
⋅k
∑n
i =1
i

36
Pentru obţinerea unor simplificări maxime a calculelor, valoarea constantei „k” se
alege egală cu cel mai mare divizor comun al variabilelor xi.
f. Dacă frecvenţele seriei se micşorează de un număr „c” de ori, atunci media
aritmetică rămâne neschimbată.
Această proprietate se aplică numai seriilor cu frecvenţe.
n
ni 1 n n

∑i=1 x i ⋅ c c ∑i=1 x i n i ∑x n i i
x= n = = i =1
=x
ni 1 n n

∑i=1 c ∑ ni
c i =1
∑n
i =1
i

Valoarea constantei „c” se consideră agelă cu cel mai mare divizor comun al
frecvenţelor, pentru a obţine o simplificare mai mare a calculelor.
g. Suma algebrică a abaterilor nivelurilor individuale ale caracteristicii de la
media lor este egală cu zero.

∑ (x i − x) = 0
∑x
∑ (x − x) = ∑ x i − ∑ x = ∑ x i − n ⋅ x = ∑ x i − n ⋅
i
i =0
n
Această proprietate ne arată că media caracteristicii este o valoare reprezentativă a
seriei.
Utilizând concomitent proprietăţile enunţate se obţin următoarele formule de
calcul simplificat al mediei aritmetice:
n
xi − a
-pt. serii simple: ∑ k
x= i =1
⋅k + a
n
n
xi − a ni
∑ k

c
-pt. serii ponderate: x= i =1
⋅k+ a
n
ni
∑i=1 c

Ex. Gruparea muncitorilor după nr. de piese realizate lunar se prezintă astfel:
Grupe muncit. Nr. muncit. xi xini a=290 k=10 c=5 xi − a ni
dupa prod. ni xi-a xi −a ni ⋅
k c
k c
245-255 5 25 1250 -40 -4 1 -4
255-265 10 0 2600 -30 -3 2 -6

37
265-275 20 26 5400 -20 -2 4 -8
275-285 30 0 8400 -10 -1 6 -6
285-295 50 27 1450 0 0 10 0
295-305 40 0 0 10 1 8 8
305-315 15 28 1200 20 2 3 6
315-325 5 0 0 30 3 1 3
325-335 5 29 4650 40 4 1 4
0 1600
30 1650
0
31
0
32
0
33
0
Total 180 5205 0 0 36 -3
0
Să se determine nr. mediu de piese realizate lunar de un muncitor cu ajutorul
calculului simplificat al mediei aritmetice.
n

∑x n i i
52050
-media aritmetică ponderată: x = = = 289 piese
i =1
n
180
∑n
i =1
i

n
xi − a ni
∑ k

c −3
-calcul simplificat: x= i =1
⋅k + a = ⋅ 10 + 290 = 289 piese.
n
ni 36
∑i=1 c

Media unei caracteristici alternative

Caracteristicile alternative sunt acele caracteristici la care, pentru fiecare unitate,


apare fie forma sa de manifestare directă, fie opusul ei.
Unităţile colectivităţii se pot împărţi în două părţi:
-unele la care se înregistrează forma directă de manifestare a unei caracteristici;
-altele la care se înregistrează opusul ei.
Pentru a le exprima numeric se vor considera în mod convenţional variantele cu
răspuns afirmativ ca având valoarea 1, iar variantele cu răspuns negativ ca având valoarea
zero.

38
Dacă notăm cu „n” numărul total al unităţilor colectivităţii şi cu „n1” efectivul
acelor unităţi care au valoarea 1, atunci efectivul celor care nu poartă acea caracteristică
va fi (n-n1).
Media, în cazul caracteristicii alternative, este egală cu ponderea unităţilor care
poartă caracteristica în totalul unităţilor colectivităţii. Aceasta se notează cu „p” şi se
calculează astfel:
n1
p=
n
Media unităţilor care nu poartă acea caracteristică se notează cu „q” şi se
determină astfel:
n − n1
q=
n
Între p şi q se verifică relaţia:
p+q=1.
Ex. Dintr-un lot de 500 de piese supuse controlului de calitate s-au găsit 60 de
piese rebut. Să se determine media rebuturilor din lot şi media unităţilor care nu poartă
caracteristica de rebut.
n=500
n1=60
n1 60
p= = = 0,12 sau 12%
n 500
La fiecare 100 piese recepţionate pot să apară câte 12 rebuturi.
n − n 1 500 − 60
q= = = 0,88 sau 88%
n 500
p+q=0,12+0,88=1.

Modul

Denumit şi dominantă, modul face parte din mărimile fundamentale de poziţie.

39
Modul este valoarea caracteristicii cel mai des observată într-o distribuţie,
respectiv valoarea ce corespunde frecvenţei dominante. Ca urmare, modul se determină
numai în cazul seriilor cu frecvenţe.
În cazul seriilor în care caracteristica se prezintă sub formă de variante, pentru
aflarea modului parcurgem etapele:
-se găseşte frecvenţa maximă a seriei;
-se identifică modul ca fiind valoarea caracteristicii corespunzătoare frecvenţei maxime.
Dacă seria este plurimodală, atunci modul este dat de valoarea caracteristicii care
se întâlneşte cel mai frecvent.
Ex. Gruparea muncitorilor după producţia lunară (metri) se prezintă astfel:

40
Grupe muncit.
Nr. muncit.
după prod.
ni
xi
100 10
120 30
150 50
170 60
200 20
220 10
Să se determine producţia medie lunară pe un muncitor cu ajutorul modului.
-frecvenţa maximă = 60
-modul = 170.

Pentru seriile în care caracteristica se prezintă sub formă de intervale de variaţie,


determinarea modului se poate realiza prin calcul şi pe cale grafică.
Prin calcul se parcurg operaţiile:
-aflarea frecvenţei maxime;
-identificarea intervalului modal, ca interval al caracteristicii corespunzător frecvenţei
maxime;
-aplicarea relaţiei de calcul a modului:
∆1
Mo = x 0 + d ⋅ , unde:
∆1 + ∆ 2

x0 = limita inferioară a intervalului modal,


d = mărimea intervalului modal,
∆1 = diferenţa dintre frecvenţa intervalului modal şi frecvenţa intervalului anterior celui

modal,
∆2 = diferenţa dintre frecvenţa intervalului modal şi frecvenţa intervalului următor celui

modal.
Pe cale grafică, modul se determină pe baza histogramei. Se reprezintă grafic seria
cu ajutorul hististogramei, urmând apoi determinarea punctului densităţii maxime a
frecvenţelor, în cadrul intervalului modal. Pentru aceasta, în coloana cea mai înaltă,
corespunzătoare intervalului modal, se trasează diagonalele care unesc colţurile bazei de
sus a acestuia cu colţurile coloanelor vecine. Din punctul lor de intersecţie se coboară
perpendiculară pe axa absciselor şi mărimea obţinută este modul.

41
Modul are avantajul de a fi determinat foarte rapid şi are semnificaţie directă,
simplă. Se utilizează pentru a obţine o primă estimare a valorii centrale a unei distribuţii.
Ex. Gruparea salariaţilor unui atelier după producţia zilnică (metri) se prezintă
astfel:
Grupe sal.
Nr. sal.
după prod.
2-6 4
6-10 6
10-14 7
14-18 15
18-22 10
22-26 3
Total 45
Să se determine producţia medie zilnică cu ajutorul modului, prin calcul şi grafic.
-frecvenţa maximă = 15,
-interv. Modal = (14-18),
∆1 8
- Mo = x 0 + d ⋅ = 14 + 4 ⋅ = 16,46 m
∆1 + ∆ 2 8+5
x o = 14 , d = 4, ∆1 = 15 − 7 = 8, ∆1 = 15 −10 = 5

16
14
12
10
8 s a l.
6
4
2
0
2 -6 6 -1 0 1 0 -1 4 1 4 -1 8 1 8 -2 2 2 2 -2 6

42
Mediana

Mediana este valoarea centrală a unei colectivităţi, ea împărţind efectivul,


ordonat după mărimea caracteristicii, în două părţi egale.
Pentru a calcula mediana, se determină mai întâi unitatea mediană, ca unitate
care împarte în 2 părţi egale efectivul unei colectivităţi.
Mediana poate fi definită ca valoare a caracteristicii purtate de unitatea
mediană.
Metodologia de calcul a medianei este diferită după natura seriei luate în calcul.
Pentru serii simple se întâlnesc două situaţii:
-seria are un număr impar de termeni, când mediana este acea variantă a caracteristicii cu

n +1
rangul , după ce în prealabil seria a fost ordonată crescător, unde n = nr.
2
termenilor.

Ex. Pp. că 9 echipe de muncitori realizează zilnic următoarea producţie (nr.


piese): 30, 25, 10, 27, 18, 9, 20, 11, 22. Să se determine producţia medie zilnică cu
ajutorul medianei.
- ordonăm seria în sens crescător:
9, 10, 11, 18, 20, 22, 25, 27, 30.
n +1 9 +1
- calculăm rangul medianei = = =5
2 2
- Me va fi al 5-lea termen al seriei ordonate
Me = 20 piese.
-seria are un număr par de termeni, situaţie în care mediana este dată de semisuma
termenilor centrali ai seriei ordonate.

Ex. Să se determine producţia medie săptămânală a unei firme, cu ajutorul


medianei, pe baza datelor (mii tone):
30, 28, 35, 25, 40, 32
- ordonăm seria în sens crescător:

43
25, 28, 30, 32, 35, 40
30 + 32
- Me = = 31 mii t.
2
Pentru seriile cu frecvenţe, mediana se poate obţine prin calcul şi grafic. Şi aici
întâlnim 2 situaţii:
-când caracteristica se prezintă sub formă de variante, pentru obţinerea medianei prin
calcul, efectuăm operaţiile:
o determinăm şirul frecvenţelor cumulate Ni;

o calculăm unitatea mediană: U Me = ∑n i


;
2
o căutăm locul unităţii mediane în şirul frecvenţelor cumulate, alegând un
nivel egal sau mai mare decât aceasta;
o se identifică mediana ca fiind nivelul caracteristicii corespunzător unităţii
mediane.
Pe cale grafică, mediana se determină cu ajutorul curbei frecvenţelor cumulate –
ogiva. Pe axa ordonatelor se fixează şirul frecvenţelor cumulate şi locul unităţii mediane.
Din acest loc se duce o paralelă la axa absciselor până întâlneşte curba. Din acest loc se
coboară perpendiculara şi mărimea obţinută pe axa absciselor este Me.

Ex. Gruparea persoanelor după timpul de deplasare (minute):


Grupe pers. Nr. pers. Ni↓
după timp ni
xi
15 5 5
20 15 20
25 30 50
30 40 90
35 5 95
40 5 100
Total 100
Să se determine timpul mediu de deplasare prin intermediul medianei, prin calcul
şi grafic.

U Me =
∑n i
=
100
= 50
2 2
Me = 25 minute.

44
120
100 95
100
90
80
Ni

60
50
40
20 20
0 5

15 20 25 30 35 40
timp

-când caracteristica se prezintă sub formă de intervale de variaţie, mediana se obţine prin
calcul parcurgând următoarele etape:
o se determină şirul frecvenţelor cumulate Ni;

o se calculează unitatea mediană: U Me = ∑n i


;
2
o se identifică locul unităţii mediane pe şirul frecvenţelor cumulate, ca
fiind un nivel egal sau mai mare decât aceasta;
o se află intervalul median, ca interval corespunzător unităţii mediane
o se aplică formula de calcul a medianei:
U Me − Na
Me = x 0 + d ⋅ , unde:
n Me

x0 = limita inferioară a intervalului median;


d = mărimea intervalului median;
Na = frecvenţa cumulată anterioară intervalului median;
nMe = frecvenţa reală a intervalului median.
Pe cale grafică mediana se determină ca şi în situaţia precedentă cu ajutorul curbei
frecvenţelor cumulate.
Ex. Gruparea salariaţilor după producţia zilnică (buc.) se prezintă astfel:
Grupe sal. Nr. sal. Ni↓
după prod. ni
6-8 4 4
8-10 10 14
10-12 31 45
12-14 30 75
14-16 10 85
16-18 10 95

45
18-20 5 100
Total 100
Să se determine producţia medie zilnică cu ajutorul medianei, prin calcul şi grafic.

U Me =
∑n i
=
100
= 50
2 2
x 0 = 12 , d = 2, Na = 45, n Me = 30

U Me − Na 50 − 45
Me = x 0 + d ⋅ = 12 + 2 ⋅ = 12,33 buc.
n Me 30

Mediana reprezintă o mărime centrală a unei serii statistice, având un conţinut


esenţial comun cu cel al mediei aritmetice. Ea nu este însă o sinteză a tuturor elementelor
componente ale seriei aşa cum este media aritmetică. În determinarea sa se cuprinde
numai intervalul caracteristicii termenului median, celelalte fiind neglijate. Mediana
poartă caracterul de mărime medie aproximativă.

Quantilele

Quantilele sunt mărimi medii de poziţie din sistemul medianei. Sunt valori ale
caracteristicii care împart seria într-un număr de grupe cu efective egale. Quantilele
folosite în mod obişnuit sunt cele care împart colectivitatea în patru, zece sau o sută de
părţi egale, numite quartile, decile, centile. Quantilele se folosesc în calculul unor
indicatori ai dispersiei.
Quartilele
Sunt în număr de trei şi împart efectivul colectivităţii în patru părţi egale. Se
determină astfel:
U Q1 − Na
Q1 = x 0 + d ⋅
n Q1

U Q 2 − Na
Q2 = x0 + d ⋅
n Q2

U Q 3 − Na
Q3 = x 0 + d ⋅
n Q3

x0 = limita inferioară a intervalului quattilic;


d = mărimea intervalului quartilic;

46
UQ1, UQ2, UQ3 = unităţile quartilice;
Na = frecvenţa cumulată anterioară intervalului quartilic;
nQ1, nQ2, nQ3 = frecvenţele reale ale intervalului quartilic.
Pentru determinarea quartilelor se procedează astfel:
-se determină şirul frecvenţelor cumulate Ni;
-se calculează unităţile quartilice după relaţiile:

U Q1 =
∑n i
; U Q2 =
2∑ n i
=
∑n i
= U Me ; U Q3 =
3∑ n i
4 4 2 4
-se caută locul unităţilor quartilice pe şirul frecvenţelor cumulate;
-se identifică intervalele quartilice ca fiind intervalele corespunzătoare unităţilor
quartilice;
-se aplică formula.
Quartilele se pot obţine şi pe cale grafică cu ajutorul curbei frecvenţelor cumulate,
asemănător medianei.
Ex. Gruparea firelor după rezistenţa la rupere se prezintă astfel:
Grupe fire Nr. fire Ni↓
după ni
rezistenţă
-2 6 6
2-4 5 11
4-6 10 21
6-8 14 35
8-10 9 44
10-12 21 65
12-14 35
100
14-16 5
16-18 2 105
18-20 3 107
110
Total 110
Să se determine mărimile medii de poziţie din sistemul medianei, prin calcul şi
grafic.
U Q1 − Na
• Q1 = x 0 + d ⋅
n Q1

U Q1 =
∑n i
=
110
= 27,5
4 4
Intervalul quartilic 1 este (6-8).
x0 = 6; d = 2; UQ1= 27,5; Na = 21; nQ1 = 14.

47
27 ,5 − 21
Q1 = 6 + 2 = 6,92
14
U Q 2 − Na
• Q2 = x0 + d ⋅
n Q2

U Q2 =
∑n i
=
110
= 55
2 2
Intervalul quartilic 2 este (10-12).
x0 = 10; d = 2; UQ1= 55; Na = 44; nQ1 = 21.
55 − 44
Q 2 = 10 + 2 = 11,04
21
U Q 3 − Na
• Q3 = x 0 + d ⋅
n Q3

3∑ n i 3 ⋅ 110
U Q3 = = = 82,5
4 4
Intervalul quartilic 1 este (12-14).
x0 = 12; d = 2; UQ1= 82,5; Na = 65; nQ1 = 35.
82 ,5 − 65
Q 3 = 12 + 2 = 13
35

Decilele
Sunt în număr de 9 şi împart efectivul colectivităţii în 10 părţi egale. Se determină
în mod asemănător medianei şi quartilelor, după relaţiile:
U D1 − Na
D1 = x 0 + d ⋅
n D1

U D 2 − Na
D2 = x0 + d ⋅
n D2


D5 = Me = Q2

U D 9 − Na
D9 = x 0 + d ⋅
n D9

U D1 =
∑n i

10

48
2∑ n i ∑n i
U D2 = =
10 5

9∑ n i
U D9 = .
10
Centilele
Sunt în număr de 99 şi împart efectivul colectivităţii în 100 părţi egale. Se
determină asemănător celorlalte mărimi medii de poziţie din sistemul medianei.

Mediala

Reprezintă o altă medie de poziţie asemănătoare prin tehnica sa de calcul cu


mediana.
Mediala reprezintă nivelul caracteristicii care împarte volumul total al
colectivităţii în 2 părţi egale.
Dacă mediana împarte în 2 părţi egale efectivul unei serii ( ∑n i ), mediala

împarte în 2 părţi egale volumul total al colectivităţii ( ∑x i n i ).


Calculul medialei se face similar cu cel al medianei, numai că, în locul
frecvenţelor cumulate, se vor considera produsele x i n i cumulate.
În cazul seriilor cu frecvenţe în care caracteristica este dată pe variante, mediala
se calculează în următoarele etape:
-se determină produsele x i n i ;
-se calculează şirul produselor x i n i cumulate, notate cu Li;

-se determină unitatea medială conform relaţiei: U Ml = ∑x n i i


;
2
-se caută locul unităţii mediale pe şirul Li, alegând un nivel egal sau mai mare decât
acesta;
-se identifică mediala ca fiind nivelul caracteristicii corespunzător unităţii mediale.
Mediala se poate determina şi e cale grafică, asemănător medianei, numai că pe
axa ordonatelor se fixează şirul Li şi apoi se trasează curba frecvenţelor cumulate.

49
Ex. Distribuţia elevilor dintr-o şcoală după rezultatele obţinute la un test (nr.
puncte):
Grupe elevi
Nr. elevi
după nr. puncte xini Li↓
ni
xi
6 45 270 270
7 80 560 830
8 72 576 1406
9 75 675 2081
10 68 680 2761
Total 340 276
1
Să se determine numărul mediu de puncte obţinut de un elev, cu ajutorul medialei,
prin calcul şi grafic.

U Ml =
∑x n i i
=
2761
= 1380 ,5 ≥ 1406
2 2
Ml = 8 puncte.
În cazul seriilor cu frecvenţe şi caracteristica sub formă de intervale de variaţie,
mediala se determină tot prin calcul şi grafic.
Prin calcul se parcurg operaţiile:
-se determină produsele x i n i ;
-se calculează şirul produselor x i n i cumulate, notate cu Li;

-se determină unitatea medială conform relaţiei: U Ml = ∑x n i i


;
2
-se caută locul unităţii mediale pe şirul Li, alegând un nivel egal sau mai mare decât
acesta;
-se identifică intervalul medial, ca fiind intervalul caracteristicii corespunzător unităţii
mediale;
U Ml − La
-se aplică formula medialei: Ml = x 0 + d ⋅ , unde:
x i n i Ml
x0 = limita inferioară a intervalului medial;
d = mărimea intervalului medial;
UMl = unitatea medială;
La = produsul cumulat anterioar intervalului medial;
x i n iMl = produsul x i n i corespunzător intervalului medial.

50
Pe cale grafică, mediala se determină asemănător situaţiei precedente.
Ex. Distribuţia după timpul de deplasare a unui eşantion de persoane se
prezintă astfel:
Grupe pers. Nr. pers.
xi xini Li↓
după timp (min) ni
0-30 25 15 375 375
30-60 45 45 2250 2625
60-90 75 75 4500 7125
90-120 105 10 4725 11850
120-150 135 5 2025 13875
150- 165 13 825 14700
5
16
5
Total 340 1470
0
Să se determine timpul mediu de deplasare cu ajutorul medialei prin calcul şi grafic.
xi = mijlocul intervalelor.

U Ml =
∑x n i i
=
14700
= 7350
2 2
Interv. medial = 90-120.
x0 = 90; d = 30; UMl= 7350; La = 7125; x i n iMl = 4725.

U Ml − La 7350 − 7125
Ml = x 0 + d ⋅ = 90 + 30 = 91,42'
x i n i Ml 4725

51
Mărimi medii cu aplicaţii speciale
4.6.1 Media cronologică
4.6.2 Media armonică
4.6.3 Mediile mobile
4.6.4 Media progresivă
4.6.5 Media geometrică
4.6.6 Media pătratică

4.6.1 Media cronologică


Este o medie care are la bază principiul de calcul al mediei aritmetice, ea fiind
aplicată la determinarea nivelului mediu al seriilor cronologice de momente.
Formula mediei cronologice este o adaptare a formulei mediei aritmetice la
elementele seriilor cronologice.
Termenii seriei delimitează perioade de timp.
Dacă „n” este numărul termenilor seriei, atunci numărul perioadelor delimitate de
aceştia este „n-1”.
În funcţie de distanţa dintre momentele de timp ale seriei, se va calcula:
-media cronologică simplă,
- media cronologică ponderată.
Media cronologică simplă se calculează când momentele sunt egal distanţate între
ele.
x1 + x 2 x 2 + x 3 x + xn
+ +  + n −1
Pentru seria x 1 , x 2 ,  , x n -1 , x n , 2 2 2 .
x cr =
n −1
x1 x
+ x 2 + x 3  + x n −1 + n
Prin transformare, această relaţie devine: 2 .
x cr = 2
n −1
Ex. Numărul salariaţilor unei firme într-un semestru a evoluat astfel:
Data 01.0 01.0 01.0 01.0 01.0 01.07
2 3 4 5 6
Nr. sal. 700 710 750 650 640 650
Să se determine nr. mediu lunar al salariaţilor.

52
x1 x 700 650
+ x 2 + x 3  + x n −1 + n + 710 + 750 + 650 + 640 +
x cr = 2 2 = 2 2 = 685
n −1 6 −1
salariaţi.
Media cronologică ponderată se calculează atunci când intervalele de timp dintre
termenii seriilor de momente sunt inegale.
În acest caz, mediile parţiale, din care se calculează media întregii perioade, sunt
ponderate cu durata perioadelor parţiale dintre termenii seriei, notate cu ti.
x1 + x 2 x + x3 x + xn
t1 + 2 t 2 +  + n −1 t n −1
x cr = 2 2 2
t 1 + t 2 +  + t n −1
Ex. Numărul salariaţilor unei firme la diferite momente de timp:
Data 01.0 01.0 01.0 01.0 01.07
1 2 4 6
Nr. sal. 400 450 500 520 480
Să se determine nr. mediu lunar al salariaţilor.
t1 = 1 lună, t2 = 2 luni, t3 = 2 luni, t4 = 1 lună
x1 + x 2 x + x3 x + xn
t1 + 2 t 2 +  + n −1 t n −1
x cr = 2 2 2 =
t 1 + t 2 +  + t n −1
400 + 450 450 + 500 500 + 520 520 + 480
⋅1 + ⋅2+ ⋅2+ ⋅1
= 2 2 2 2 = 482 salariati
1+ 2 + 2 +1

4.6.2 Media armonică

Este definită ca o mărime inversă a mediei aritmetice, calculată din mărimile


inverse ale caracteristicii.
n
xh =
Media armonică simplă: 1
∑x
i

xh =
∑n i

Media armonică ponderată: 1


∑ x ⋅n i
i

53
Media armonică este influenţată mai mult de valorile mici ale seriei, pe când
media aritmetică este influenţată de valorile mari.
În practică statisticii este utilizată, în special, în calculul indicelui mediu armonic
ponderat.
Ex. Salariul mediu orar şi fondul de salarii la 3 ateliere ale unei firme:
Atelier Salariu mediu Fond de salarii
xi ni
1 550.000 90.000.000
2 60.000 130.000.000
3 50.000 80.000.000
Total 300.000.000
Să se determine salariul mediu orar pe firmă.

xh =
∑n i
=
300.000.000
=
1 1 1 1
∑ x ⋅n i
55.000
⋅ 90.000.000 +
60.000
⋅ 130.000.000 +
50.000
⋅ 80.000.000
i
= 55.524 lei
4.6.3 Mediile mobile

Se calculează ca un şir de medii aritmetice dintr-un număr determinat de termeni


ai unei serii dinamice, luat prin deplasare consecutivă cu o unitate pe scara de variaţie a
timpului.
Mediile mobile sunt medii aritmetice pe grupuri din termenii seriei. Se pot calcula
în 2 situaţii:
-dintr-un nr. impar de termeni ai seriei;
-dintr-un nr. par de termeni ai seriei.
Considerăm seria: x 1 , x 2 ,  , x n -1 , x n .
-mediile mobile din câte 3 termeni:

x1 =
x1 + x 2 + x 3
, x2 =
x2 + x3 + x4
, , x n−2
=
x n − 2 + x n −1 + x n
.
3 3 3
-mediile mobile din câte 4 termeni:

x1 =
x1 + x 2 + x 3 + x 4 x + x3 + x4 + x5
, x2 = 2 , , x n −3
=
x n −3 + x n − 2 + x n −1 + x n
.
4 4 4
Mediile mobile se utilizează în ajustarea seriilor care caracterizează variaţia
sezonieră a fenomenelor economico-sociale. Pentru mediile mobile calculate dintr-un nr.
impar de termeni se stabileşte uşor termenul seriei înlocuit prin media mobilă. Nu acelaşi

54
lucru se întâmplă în cazul mediilor mobile calculate dintr-un nr. par de termeni. Pentru
aceştia se va proceda la centrarea mediilor mobile obţinute în prima etapă.
Centrarea constă în determinarea unor medii aritmetice din câte două medii
mobile consecutive.
Ex. Conflictele colective de muncă şi frecvenţa lor lunară au evoluat astfel:
Luna Nr. conflicte
I 13
II 17
III 5
IV 9
V 12
VI 16
VII 15
VIII 19
IX 15
X 12
XI 4
XII 4
Total 141
Să se determine numărul mediu al conflictelor de muncă cu ajutorul mediilor
mobile calculate din câte 5 şi 6 termeni.
Medii mobile din câte 5 termeni
x 1 + x 2 + x 3 + x 4 + x 5 13 + 17 + 5 + 9 + 12
x1 = = = 11,2
5 5
x 2 + x 3 + x 4 + x 5 + x 6 17 + 5 + 9 + 12 + 16
x2 = = = 11,8
5 5
x 3 + x 4 + x 5 + x 6 + x 7 5 + 9 + 12 + 16 + 15
x3 = = = 11,4
5 5
x 4 + x 5 + x 6 + x 7 + x 8 9 + 12 + 16 + 15 + 19
x4 = = = 14,2
5 5
x 5 + x 6 + x 7 + x 8 + x 9 12 + 16 + 15 + 19 + 15
x5 = = = 15,4
5 5
x 6 =15 ,4 x 7 =13 x 8 =10 ,8 .

Medii mobile din câte 6 termeni


x 1 + x 2 + x 3 + x 4 + x 5 + x 6 13 + 17 + 5 + 9 + 12 + 16
x1 = = = 12
6 6
x 2 + x 3 + x 4 + x 5 + x 6 + x 7 17 + 5 + 9 + 12 + 16 + 15
x2 = = = 14,8
6 6

55
x 3 =12 ,6 x 4 =14 ,3 x 5 =14 ,8 x 6 =13 ,5 x 7 =11 ,5 .

Centrarea mediilor mobile calculate din câte 6 termeni:


x 1 + x 2 12 + 14 ,8 x 2 + x 3 14 ,8 + 12 ,6
xI = = = 13,4 x II = = = 13,7
2 2 2 2

x 3 + x 4 12 ,6 + 14 ,3 x 4 + x 5 14 ,3 + 14 ,8
x III = = = 13,45 x IV = = = 14 ,55
2 2 2 2

x 5 + x 6 14 ,8 + 13,5 x 6 + x 7 13,5 + 11,5


xV = = = 14 ,15 x VI = = = 12 ,5
2 2 2 2

4.6.4 Media progresivă

Colectivităţile îşi au progresivitatea lor, fie că este privită în timp sau sub aspect
calitativ.
Media progresivă reprezintă o medie a tipurilor de nivel calitativ superior în
cadrul unei colectivităţi date. În mod practic, media progresivă se găseşte între media
aritmetică generală a seriei şi media termenilor calitativ superiori ai aceleiaşi serii.
x + xs
x progr = , unde:
2
x = media generală a seriei;
x s = media termenilor calitativ superiori mediei generale.
În cazul fenomenelor în care superioritatea se exprimă cantitativ printr-o regresie,
se ţine seama de acest specific al seriei. Ex.: costuri, cheltuieli, preţuri, consumuri. În
acest caz, x s se va calcula din termenii seriei mai mici decât media generală.
Ex. Evoluţia producţiei unor firme dintr-un sector de activitate (mld. lei):
Grupe
firme Nr. firme
după prod. ni
xi
40 5
60 10
80 30
110 8
120 2
Total 55
Să se determine producţia medie a unei firme cu ajutorul mediei progresive.

56
x + xs
x progr =
2
n

∑x n i i
40 ⋅ 5 + 60 ⋅ 10 + 80 ⋅ 30 + 110 ⋅ 8 + 120 ⋅ 2
x= i =1
n
= = 78,5 mld. lei
55
∑n
i =1
i

80 ⋅ 30 + 110 ⋅ 8 + 120 ⋅ 2
xs = = 88 mld. lei
55
78 ,5 + 88
x progr = = 83 ,25 mld. lei
2
Ex. Gruparea firmelor după cheltuielile materiale (mil. lei) se prezintă astfel:
Grupe
Nr. firme
firme xi xini
ni
după chelt.
100-150 3 12 375
150-200 10 5 1750
200-250 25 17 5625
250-300 30 5 8250
300-350 15 22 4875
350-400 8 5 3000
400-450 9 27 3825
5
32
5
37
5
42
5
Total 340 27700
Să se determine nivelul mediu al cheltuielilor materiale pe o firmă cu ajutorul
mediei progresive.
x + xs
x progr =
2
n

∑x n i i
27700
x= i =1
n
= = 277 mil lei
100
∑n
i =1
i

375 + 1750 + 5625 + 8250 16000


xs = = = 235 ,2 mil lei
3 + 10 + 25 + 30 68
277 + 235 ,2
x progr = = 256 ,1 mil lei
2

57
58
4.6.5 Media geometrică

Este una din cele mai importante medii cu aplicaţii speciale.


Media geometrică este o medie calculată prin extragerea rădăcinii de un ordin
egal cu numărul termenilor seriei, din produsul acestor termeni.
Media geometrică simplă:
x g = n x1 ⋅ x 2 ⋅  ⋅ x n

Media geometrică ponderată:

x g = ∑ n x 1n ⋅ x n2 ⋅  ⋅ x nm
i 1 2 m

În practica statisticii se utilizează ca metodă de calcul a ritmului de variaţie în


timp a fenomenelor.
Ex. Cifra de afaceri a unei firme creşte cu 10% în primul an, cu 15% în
următorii 2 ani şi cu 18% în ultimul an al unei perioade de 4 ani observate.
Să se determine creşterea medie anuală cu ajutorul mediei geometrice.
Media geometrică simplă:
x g = 4 x 1 ⋅ x 2 ⋅ x 3 ⋅ x 4 = 4 1,10 ⋅1,15 ⋅1,15 ⋅1,18 = 4 1,716605 = 1,145

Creşterea medie anuală a cifrei de afaceri este de 1,145 ori sau cu 14,5%.

4.6.6 Media pătratică

Este o mărime medie calculată prin extragerea rădăcinii pătrate din media
aritmetică a pătratelor termenilor seriei.

Media pătratică simplă: x patr =


∑x 2
i

Media pătratică ponderată: x patr =


∑x ⋅n 2
i i

∑n i

Aplicaţiile acestei medii sunt legate de determinarea abaterii medii pătratice, o


categorie metodologică a statisticii din sistemul dispersiei.
Ex. Gruparea persoanelor după veniturile săptămânale (mii lei):
Grupe pers. Nr. pers. xi x i2 xini

59
după venit ni
100-140 3 12 1440 43200
140-180 10 0 0 256000
180-220 30 16 2560 1200000
220-260 20 0 0 1152000
260-300 12 20 4000 940800
0 0
24 5760
0 0
28 7840
0 0
Total 75 3592000
Să se determine veniturile medii săptămânale cu ajutorul mediei pătratice.

x patr =
∑x ⋅n
2
i i
=
3592000
= 218,8 mii lei.
∑n i 75

Relaţii între valorile mărimilor medii

Într-o serie „ideală”, caracterizată de o simetrie perfectă a distribuţiei unităţilor în


colectivitate, mediile fundamentale – media aritmetică, mediana, modul şi mediala –
coincid.
În cazul unei curbe moderat asimetrice, mediana se situează de obicei între media
aritmetică şi dominantă, la 1\3 din distanţa dintre medie şi dominantă, măsurată de la
medie. Aceasta se poate exprima prin relaţia:
Do = x −3( x −Me )

Alegerea celei mai potrivite şi semnificative valori centrale cere, pe de o parte un


examen atent al distribuţiei, iar pe de altă parte cere să se ţină seama de principalele
particularităţi ale valorilor centrale.
Media aritmetică, fiind o medie de calcul, este influenţată de fiecare valoare a
seriei, ca urmare este foarte sensibilă la valorile extreme. Media aritmetică poate fi
utilizată în calcule algebrice ulterioare.
Modul şi mediana, fiind mărimi medii de poziţie, sunt influenţate mai mult de
numărul decât de mărimea valorilor unor serii, prin urmare, nu sunt influenţate de
valorile aberante.
Mediana, ţinând seama doar de valorile ce ocupă o poziţie centrală, se poate
calcula chiar şi când nu se cunosc limitele seriei.

60
Modul, fiind valoarea cea mai des întâlnită, cea mai frecventă într-o serie, este
valoarea cea mai tipică sau cea mai probabilă, dar neţinând seama de toate valorile seriei
ca şi mediana, se găseşte sub semnul aproximării.
De asemenea, mediana şi modul, mai au dezavantajul de a nu fi utilizate în calcule
algebrice, dezavantaj compensat însă de faptul că sunt mărimi foarte uşor de obţinut.

61
CAPITOLUL V DISPERSIE ŞI ASIMETRIE

5.1 Noţiunea de dispersie


5.2 Indicatorii simpli şi sintetici ai dispersiei
5.3 Proprietăţi şi calculul simplificat al dispersiei
5.4 Indicatori de asimetrie şi ai excesului

Noţiunea de dispersie

După definirea mediei ca mărime care reprezintă în mod sintetic ansamblul


nivelurilor individuale ale unei caracteristici pentru o colectivitate, statistica studiază
împrăştierea acestor niveluri de la medie.
Fenomenul de împrăştiere, de abatere a valorilor individuale ale unei caracteristici
de la medie, în cadrul unei colectivităţi statistice, se numeşte dispersie.
Cercetarea dispersiei reprezintă o modalitate care completează posibilitatea
determinării caracterului reprezentativ al unei medii şi forma sa de distribuţie.
Pentru a verifica gradul de omogenitate al caracteristicilor pentru care se
determină media, se calculează indicatorii de variaţie, de asimetrie şi de exces. Aceşti
indicatori separă acţiunea factorilor esenţiali de acţiunea factorilor întâmplători. Această
funcţie de cunoaştere este folosită în special pentru acele fenomene la care, pe lângă
acţiunea separată a factorilor, se mai adaugă şi interacţiunea dintre factori.
Dispersia, adică studierea variaţiei unei caracteristici, permite următoarele
constatări:
-dacă colectivitatea statistică este sau nu omogenă;
-care este structura colectivităţii pentru care s-a calculat media;
-dacă media caracterizează sau nu just colectivitatea;
-cât de mare este variaţia caracteristicii;
-care este abaterea medie a valorilor individuale faţă de media lor.
În statistică se utilizează două categorii principale de măsurători şi indicatori
medii ai dispersiei, unii făcând parte din sistemul mediei aritmetice, iar alţii din sistemul
medianei.

62
5.2 Indicatorii simpli şi sintetici ai dispersiei

Gradul de variaţie a valorilor individuale în jurul mediei se măsoară cu ajutorul


unui sistem de indicatori simpli şi sintetici ai dispersiei, în cazul seriilor unidimensionale,
respectiv, al unui sistem de indicatori factoriali ai dispersiei în cazul seriilor bi- şi
multidimensionale1.
• Indicatorii simpli ai dispersiei
Indicatorii simpli ai dispersiei măsoară câmpul de împrăştiere al caracteristicii,
precum şi împrăştierea fiecărui nivel individual al caracteristicii faţă de nivelul lor mediu.
Indicatorii simpli ai dispersiei sunt: amplitudinea variaţiei şi abaterea individuală. Aceşti
indicatori se pot calcula atât în mărimi absolute, cât şi în mărimi relative.
1. Amplitudinea variaţiei – este un indicator ce caracterizează mărimea intervalului
de valori ale caracteristicii.
În mărime absolută, amplitudinea se calculează prin diferenţa dintre valorile
extreme ale seriei de distribuţiei, astfel:
Ax = x max − x min

Acest indicator nu ţine seama de toate valorile observate, ci doar de cele extreme
care, în cazul când sunt aberante, denaturează imaginea fenomenului de dispersie.
În mărime relativă, amplitudinea variaţiei se determină ca raport între amplitudinea
absolută şi nivelul mediu al caracteristicii:
x max − x min
Ax % = ⋅ 100 , unde:
x
x max , x min = nivelul maxim, respectiv minim al variabilei X;

x = nivelul mediu al variabilei X.


2. Abaterea individuală – oferă informaţii doar la nivelul fiecărei variante xi , pierzând
imaginea dispersiei pe ansamblul distribuţiei.
În mărime absolută, abaterea individuală se calculează conform relaţiei următoare:
d i = xi − x

În mărime relativă, abaterea individuală se determină ca raport între abaterea


absolută şi nivelul mediu al caracteristicii:
1
Elisabeta Jaba, Statistica, Ed. Economică, Bucureşti, 2002, pg. 148

63
xi − x
di% = ⋅ 100
x

• Indicatorii sintetici ai dispersiei


Indicatorii sintetici ai dispersiei exprimă împrăştierea tuturor nivelurilor individuale
ale unei caracteristici faţă de nivelul lor mediu. Pentru a caracteriza pe ansamblu o serie
de date, se utilizează următorii indicatori sintetici ai dispersiei: abaterea medie liniară,
varianţa (dispersia), abaterea medie pătratică (deviaţia standard) şi coeficientul de
variaţie2.
1. Abaterea medie liniară – se determină ca medie aritmetică a valorilor absolute ale
abaterilor individuale. Abaterea medie liniară arată variaţia medie, în plus şi în minus, de
la valoarea medie a distribuţiei şi este cu atât mai mică cu cât valorile sunt mai grupate în
jurul mediei.

-pentru serii simple:


∑d i ∑x i −x
, când n1 = n2 = ... = nn = k ,
d= i
= i

n n

∑ d ⋅n ∑ x − x ⋅ n i i i i
-pentru serii cu frecvenţe: d= = i i
, când n1 ≠ n2 ≠ ... ≠ n n
∑ n ∑n i
i
i
i

2. Varianţa (dispersia) – se calculează ca medie aritmetică a pătratelor valorilor


abaterilor individuale faţă de media lor, conform relaţiilor:

∑d ∑(x ) 2
i
2
i −x
-pentru serii simple: σ2 = i
= i ,
n n

∑d ⋅n ∑ ( x − x)
2
i
2
i i ⋅ ni
-pentru serii cu frecvenţe: σ 2
= i
= i
.
∑n i
i ∑n i
i

3. Abaterea medie pătratică (deviaţia standard) – se calculează ca o medie a abaterilor


individuale, după relaţia:

∑d ∑ (x ) 2
2
i i −x
-pentru serii simple:
σ = i
= = i
= σ2
n n

2
Elisabeta Jaba, Statistica, Ed. Economică, Bucureşti, 2002, pg. 149

64
∑d ⋅n ∑ ( x − x)
2
i
2
i i ⋅ ni
-pentru serii cu frecvenţe: σ = i
= = i
= σ2
∑n i
i ∑n i
i

Abaterea medie pătratică, fiind calculată ca o medie pătratică, reflectă într-o măsură
mai mare influenţa factorilor aleatori comparativ cu abaterea medie liniară. Acest
indicator se utilizează, de regulă, pentru caracterizarea seriilor teoretice şi se exprimă în
unitatea de măsură a mediei seriei de date.
4. Intervalul mediu de variaţie – se poate calcula pe baza indicatorilor sintetici ai
dispersiei. Acesta este definit de următoarele limite:

 x − d  x − σ
x± d =  , respectiv x± σ = 
 x + d  x + σ
Într-o distribuţie normală standard, în intervalul mediu (x ±σ) apar 68,27% din
cazuri; 95,45% pentru ( x ± 2σ) , respectiv 99,97% din cazuri pentru (x ±3σ) .
5. Coeficientul mediu de variaţie – se utilizează atunci când unităţile de măsură folosite
pentru exprimarea indicatorilor sintetici trebuie aduse la aceeaşi bază de semnificaţie. Se
calculează ca raport procentual între abaterea medie liniară sau abaterea medie pătratică
şi media aritmetică astfel:
d σ
ν= ⋅100 , respectiv ν = ⋅100 .
x x
Coeficientul de variaţie poate lua valori cuprinse în intervalul (0;100%). Când ν
tinde spre zero, se consideră o variaţie slabă şi deci o colectivitate omogenă, iar media are
un grad de reprezentativitate ridicat. Cu cât nivelul coeficientului de variaţie tinde spre
100%, cu atât variaţia este mai intensă, colectivitatea mai eterogenă, iar media are un
nivel de reprezentativitate mai scăzut. Prin urmare, coeficientul de variaţie poate fi folosit
şi ca test de semnificaţie a reprezentativităţii mediei, considerându-se următoarele praguri
de semnificaţie:

65
 0 < ν < 1 7% m e de isa tset r i rc et p r e zt ei vn at a
 1 7 %< ν < 5 3 % m e de isa tme o d er re ap tr e zt ei vn at a
 3 5 %< ν < 5 0 % m e de isa tree p r e zt ei vniatnsa e nl as r g
ν > 5 0 % m e de isa tne e r e p rt ea zt ievna .

Ex. Firma SC. Seromgal S.A. a vândut în anul 2004 produsul agroalimentar
„tomate” prin cele cinci ferme la preţuri diferite. Utilizând indicatorii simpli şi sintetici ai
dispersiei, vom determina preţul mediu de vânzare al produsului şi varianţa acestuia.
xi (x i −x ) xi − x
⋅100 xi − x (x i −x ) 2

x
6756 113 1,7 113 12769
6853 210 3,16 210 44100
6432 -211 -3,18 211 44521
6500 -143 -2,15 143 20449
6674 31 0,47 31 961
3321 0 - 708 122800
5
Media aritmetică:

∑x i
33215
x= i
= = 6643 mii lei.
n 5
Indicatorii simpli ai dispersiei:
Amplitudinea variaţiei
- în mărimi absolute:
Ax = x max − x min = 6853 − 6432 = 421 mii lei

- în mărimi relative:
x max − x min 421
Ax % = ⋅ 100 = ⋅ 100 = 6,34%
x 6643
Rezultatele obţinute ne arată că, câmpul de variaţie al preţului de vânzare al
tomatelor prin cele cinci ferme este de 421 mii lei, ceea ce reprezintă 6,34% din preţul de
vânzare al produsului.
Abaterea individuală
- în mărimi absolute:
(
d i = xi − x )
d1 = 113 ; d 2 = 210 ; d 3 = −211 ; d 4 = −143 ; d 5 = 31

66
- în mărimi relative:
xi − x
di = ⋅100
x
d 1 =1,7; d 2 = 3,16 ; d 3 = −3,18 ; d 4 = −2,15 ; d 5 = 0,47

Indicatorii sintetici ai dispersiei:


Abaterea medie liniară

∑x i −x
708
d= i
= = 141,6 mii lei
n 5
Preţul de vânzare prin cele cinci ferme se abate în medie cu 141,6 mii lei faţă de
preţul mediu, în ambele sensuri, intervalul mediu de variaţie stabilit cu ajutorul acestui
indicator având următoarele limite:

 x − d = 6 6 4− 13 4,61= 6 5 ,04 1m li ie i
x± d = 
 x + d = 6 6 4+ 13 4,61= 6 7 8,6 4m li ei i
Varianţa:

∑( x ) 2
i −x
122800
σ2 = i
= = 24560 mii lei
n 5
Abaterea medie pătratică:

∑ (x ) 2
i −x
mii lei
σ = = i
= σ 2 = 24560 = 156,72
n
Intervalul mediu de variaţie:

 x − σ = 6 6 4− 13 5,76 2= 6 4 8,2 68m li ei i


x± σ = 
 x + σ = 6 6 4+ 13 5,76 2= 6 7 9,7 92m li ei i
Aceasta înseamnă că 68% din unităţile colectivităţii practică un preţ cuprins între
6486,28 mii lei şi 6799,72 mii lei.
Comparând rezultatele, se observă că σ > d , fapt explicat prin aceea că σ , fiind
calculată ca o medie pătratică, reflectă într-o măsură mai mare influenţa factorilor
întâmplători, adică abaterile mai mari faţă de medie, comparativ cu d . Abaterile

67
extreme, prin ridicarea la pătrat, au o influenţă mai mare decât abaterile intermediare mai
apropiate de medie. Deci, abaterea medie pătratică caracterizează mai bine variaţia
fenomenelor.

Coeficientul de variaţie:
σ 156 ,72
ν= ⋅ 100 = ⋅ 100 = 2,36 % < 17% , relevă o colectivitate omogenă,
x 6643

ceea ce înseamnă că media este semnificativă pentru distribuţie.

5.3 Proprietăţi şi calculul simplificat al dispersiei

Proprietăţile dispersiei sunt:


• Dispersia unei distribuţii este egală cu diferenţa dintre media pătratelor
tuturor variantelor caracteristicii şi pătratul mediei.
σ 2 = x 2 − (x) 2

∑ (x ) 2
− x ⋅ ni
∑ (x ∑x n ∑x n ∑n
2 2
i 2
i − 2x i x + x )n i 2
i i i i x i
σ =
2 i
= = − 2x ⋅ + =
∑n i
i ∑n i
i ∑n i ∑n i ∑n i
2 2 2
= x 2 − 2x + x = x 2 − x
• Dispersia unui şir de valori constante este egală cu zero, întrucât toate
variantele caracteristicii sunt egale între ele şi egale cu media lor
aritmetică.
• Dispersia calculată din abaterile variantelor caracteristicii faţă de constanta
„a” este mai mare decât dispersia calculată din aceleaşi variante faţă de
media lor cu pătratul diferenţei dintre medie şi constanta „a”.

∑(x − a)
2
i
-pentru serii simple: σ2 = i
− (x − a ) 2 ,
n

∑ ( x − a)
2
i ⋅ ni
-pentru serii cu frecvenţe: σ 2
= i
− (x − a ) 2 .
∑n i
i

68
• Dacă fiecare nivel al caracteristicii se micşorează de „k” ori, atunci dispersia se
micşorează de „k2” ori.
2
x −x
-pentru serii simple: ∑i  i k  ,
σ2 =   ⋅ k2
n
2
x −x
∑i  i k  ⋅ n i
-pentru serii cu frecvenţe: σ2 =   ⋅ k2 .
∑ in
i

• Dacă se împarte fiecare nivel al frecvenţelor printr-o constantă „c”, atunci dispersia
rămâne neschimbată.

∑ (x ) 2 ni
i −x ⋅
c
σ2 = i
ni
∑ i c
Aceste proprietăţi sunt folosite pentru calculul simplificat al dispersiei. Din
combinarea lor se ajunge la formulele care conduc la cea mai mare simplificare a
calculelor.
2
 xi − a 
-pentru serii simple: ∑ 
i  k 

,
σ =
2
⋅ k 2 − (x − a ) 2
n
2
 xi − a  ni
∑ 
i 
 ⋅
k  c 2
-pentru serii cu frecvenţe: σ =
2
⋅ k − (x − a ) 2 .
ni
∑i c
Ex. Gruparea salariaţilor unei unităţi comerciale după volumul vânzărilor
zilnice (mii lei):
Grupe sal. Nr. sal. xi xi −a xi − a ni xi − a xi −a 2 xi −a 2
după vanz ni ( ) ( )
k c k k k
ni ni
c c
1150-1250 5 120 -300 -3 1 -3 9 9
1250-1350 15 0 -200 -2 3 -6 4 12
1350-1450 20 130 -100 -1 4 -4 1 4
1450-1550 35 0 0 0 7 0 0 0

69
1550-1650 25 140 100 1 5 5 1 5
1650-1750 5 0 200 2 1 2 4 4
1750-1850 5 150 300 3 1 3 9 9
0
160
0
170
0
180
0
Total 110 22 -3 43
Să se determine numărul mediu al salariaţilor utilizând dispersia prin calcul
simplificat.
2
 xi − a  ni
∑ 
i 
 ⋅
k  c 2
-dispersia prin calcul simplificat: σ =
2
⋅ k − (x − a ) 2
ni
∑i c
n
xi − a ni
∑ k

c −3
x= i =1
⋅k+ a = ⋅ 100 + 1500 = 1486 mii lei
n
ni 22
∑i=1 c
a = 1500; k = 100; c = 5.
43
σ2 = ⋅ 100 2 − (1486 − 1500 ) 2 = 19349
22
-abaterea medie pătratică:
σ = σ 2 = 19349 = 139

-intervalul mediu de variaţie are următoarele limite:


x ± σ =  x − σ = 1 4 −81 63= 19 3 m4 7l iei i
 x + σ = 1 4 +81 63= 19 6 m2 5l iei i
5.4 Indicatori de asimetrie şi ai excesului

În analiza seriilor de distribuţie unidimensionale şi unimodale, un interes deosebit


prezintă cunoaşterea formei distribuţiei.

70
Forma unei distribuţii statistice poate fi apreciată cu ajutorul a două categorii de
valori tipice:
1) Indicatorii de asimetrie
2) Indicatorii de boltire sau ai excesului
1) Indicatorii de asimetrie dau informaţii asupra modului de repartizare a
frecvenţelor de o parte sau alta a valorii centrale a unei serii.
Asimetria reprezintă o deviaţie de la forma simetrică de distribuţie.
În literatura de specialitate s-au propus mai mulţi indicatori pentru măsurarea
gradului de asimetrie al distribuţiilor.
O primă imagine asupra gradului de asimetrie (As) al unei distribuţii o putem face
comparând media ei asimetrică cu modul.
As = x − Mo
As 0 , x  Mo , asimetrie negativă, cu extinderea frecvenţelor spre stânga.
As  0 , x  Mo , asimetrie pozitivă, cu extinderea frecvenţelor spre dreapta.
În mărimi relative se utilizează coeficientul de asimetrie a lui Pearson (kas).
x − Mo
k as =
σ
Dacă kas =0, x = Mo , distribuţie simetrică
Dacă kas >0, x  Mo , distribuţie asimetrică spre dreapta
Dacă kas <0, x  Mo , distribuţie asimetrică spre stânga.
Pentru seriile moderat asimetrice, coef. de asimetrie trebuie să ia valori cuprinse
în intervalul (-0,3 ; 0,3). Pentru valori în afara acestui interval se consideră că distribuţiile
respective sunt puternic asimetrice.
Informaţiile pe care le oferă coef. de asimetrie sunt foarte utile atât pentru
aprecierea tipului distribuţiilor, cât şi pentru aprecierea semnificaţiei indicatorilor
tendinţei centrale, mai ales pentru x .
Asupra asimetriei influenţează şi celelalte mărimi medii de poziţie. Pentru a ţine
seama şi de influenţa quartilelor, se foloseşte coeficientul de asimetrie Yule (Cay).
q 2 − q1
Cay = , unde: q2 = Q3 – Me
q 2 + q1

q1 = Me – Q1.

71
În cazul coef. Yule, se raportează diferenţa dintre abaterile celor două quartile
extreme de la mediană, la suma acestora.
Dacă valorile Cay se apropie de ±0,1 , atunci distribuţia este moderat asimetrică,
iar dcaă depăşesc ±0,1 , atunci distribuţia este pronunţat asimetrică.
Ex. Gruparea muncitorilor după producţia săptămânală (m):
Grupe muncit.
după prod.
Nr. muncit.
ni
xi xini (x i −x ) (x i −x ) 2
(x i − x) 2 ⋅ n i Ni
4-8 10 6 60 -9,37 87,79 877,9 10
8-12 20 10 200 -5,37 28,83 576,6 30
12-16 40 14 560 -1,37 1,87 74,8 70
16-20 60 18 108 2,63 6,91 414,6 130
20-24 4 22 0 6,63 43,95 175,8 134
24-28 4 26 88 10,63 112,99 451,96 138
28-32 2 30 104 14,63 214,03 428,06 140
60
Total 140 215 2999,72
2
Să se studieze gradul de asimetrie al distribuţiei.
x − Mo
Coef. de asimetrie Pearson: k as =
σ
n

∑x n i i
2152
x= i =1
n
= = 15,37
140
∑n
i =1
i

∆1 20
Mo = x 0 + d ⋅ = 16 + 4 ⋅ = 16,05
∆1 + ∆ 2 20 + 56

∑ (x ) 2
i − x ⋅ ni
2999,72
σ = σ2 = i
= = 21,42 = 4,628
∑n i
i 140

15 ,37 −16 ,05


k as = = −0,14 , asimetrie moderată spre stânga.
4,628

q 2 − q1
Coef. de asimetrie Yule: Cay = q2 = Q3 – Me
q 2 + q1

q1 = Me – Q1.

U Q1 − Na 35 − 30
Q1 = x 0 + d ⋅ = 12 + 4 = 12 ,5 m
n Q1 40

72
U Q1 =
∑n i
=
140
= 35
4 4
U Me − Na 70 − 30
Me = x 0 + d ⋅ = 12 + 4 ⋅ = 16 m
n Me 40

U Me =
∑n i
=
140
= 70
2 2
U Q 3 − Na 105 − 70
Q3 = x 0 + d ⋅ = 16 + 4 = 18,33 m
n Q3 60

3∑ n i 3 ⋅ 140
U Q3 = = = 105
4 4
q2 = Q3 – Me = 18,33-16=2,33
q1 = Me – Q1 = 16-12,5=3,5
q 2 − q 1 2,33 − 3,5
Cay = = = −0,20 asimetrie spre stânga.
q 2 + q 1 2,33 + 3,5

2) Indicatorii de boltire.
În caracterizarea distribuţiilor interesează şi determinarea gradului de concentrare,
de aglomerare a frecvenţelor în zona centrală a distribuţiei. Această însuşire este
cunoscută sub denumirea de exces, curtozis sau boltire.
Indicatorii boltirii arată dacă o distribuţie este mai boltită decât distribuţia
normală, perfect simetrică sau mai puţin boltită decât aceasta.
Dacă într-o distribuţie variantele unei variabile sunt concentrate în jurul nivelului
ei mediu mai mult decât în cazul unei distribuţii normale, atunci distribuţia considerată va
fi mai boltită decât distribuţia normală, iar graficul ei poartă denumirea de curbă
leptokurtică (leptos = subţire). Dacă curba este mai puţin boltită decât cea normală, ea
poartă denumirea de curbă platikurtică (platus = lat în greacă, iar curtosis = cocoaşă).
Curba normală este numită şi curbă mesokurtică.
În determinarea excesului se utilizează coef. de boltire Pearson ( β2 ) şi coef. de
boltire Fisher ( γ 2 ).
Coef. Pearson este raportul dintre momentul centrat de ordin 4 şi pătratul
momentului centrat de ordinul 2.

73
µ4
β2 = , unde: µ2 este dispersia.
µ 22

∑ (x ) 2
i − x ⋅ ni
µ2 = σ 2 = i
, iar µ4 se determină după relaţia:
∑n i
i

∑ (x ) 4
i − x ⋅ ni
µ4 = i

∑n i
i

Pentru o distribuţie normală (curba Gauss-Laplace), coeficientul de boltire ia


valoarea 3. Dacă β 2  3 , atunci distribuţia este leptocurtică, iar dacă β 2  3 , atunci
distribuţia este platicurtică.
Coef. de boltire Fisher ( γ 2 ) măsoară excesul faţă de boltirea unei distribuţii
normale Gauss-Laplace. Ştiind că pentru o distribuţie normală β 2 = 3 , gradul de exces se
calculează după relaţia:
µ4
γ 2 = β2 − 3 = − 3 , cu interpretarea:
µ 22
dacă β2 = 3 , γ 2 = 0 , distribuţie normală;
β2  3 , γ 2  0 , distribuţie leptocurtică;
β2  3 , γ 2  0 , distribuţie platicurtică.
Ex. Gruparea salariaţilor după volumul vânzărilor (mil lei):

(x − x ) (x )
Grupe sal. Nr. 4

după sal. x i xini (x i −x ) (x i −x ) 2


(x i − x) ⋅ n i
2
i
4
i − x ni
vânzări ni
-2 2 1 2 -6 36 72 1296 2592
2-4 7 3 21 -4 16 112 256 1792
4-6 20 5 10 -2 4 80 16 320
6-8 50 7 0 0 0 0 0 0
8-10 10 9 35 2 4 40 16 160
10-12 6 11 0 4 16 96 256 1536
12-14 5 13 90 6 36 180 1296 6480
66
65
Total 100 69 580 12880
4
Să se studieze forma distribuţiei cu ajutorul coeficienţilor boltirii Fisher.
µ4
γ 2 = β2 − 3 = −3
µ 22

74
∑ (x ) 2
i − x ⋅ ni
580
µ2 = σ 2 = i
= = 5,80
∑n i
i 100

∑x n ∑ (x ) 4
i i − x ⋅ ni
694 i
12880
x= i =1
= = 6,94 ≈ 7 mil lei µ4 = i
= = 128,8
∑n
n
100 100
∑n
i =1
i i
i

128 ,8
β2 = = 3,828
5,8 2

γ 2 = β 2 − 3 = 3,828 − 3 = 0,828  0 distribuţie leptocurtică.

75
CAPITOLUL VI INDICII ŞI RITMUL VARIAŢIEI
FENOMENELOR ECONOMICO-SOCIALE
6.1 Noţiunea şi importanţa indicilor
6.2 Indicii simpli
6.3 Indicii de grup
6.4 Sistemul indicilor calculaţi din mărimi medii
6.5 Gruparea indicilor dinamicii după felul bazei
6.6 Ritmul variaţiei şi al sporului

6.1. Noţiunea şi importanţa indicilor

Indicii măsoară variaţia în timp şi în spaţiu a fenomenelor social economice în


funcţie de modificarea factorilor de influienţă.
Indicii reprezintă o categorie specială a indicatorilor statistici cu ajutorul cărora se
măsoară variaţia medie relativă a fenomenelor economice şi sociale.
Indicii se obţin prin raportarea a două niveluri absolute ale aceluiaşi fenomen sau
grup de fenomene, în două unităţi diferite de timp şi de spaţiu.
Variaţia în timp a fenomenelor şi proceselor colective este redată cu ajutorul
indicilor dinamicii.
Compararea nivelurilor atinse de o colectivitate dată în teritorii diferite se
realizează cu ajutorul indicilor teritoriali.
Indicii calitativi au rolul de a măsura şi caracteriza raportul dintre grupe calitative
diferite ale unei colectivităţi date.
Indiferent de categoria lor, indicii au o bază metodologică comună. Aceasta
constă în comparerea a două niveluri diferite ale unui indicator statistic dat.
În calculul indicilor se porneşte de la o serie statistică. Se stabileşte un termen al
seriei, de multe ori primul, sau din afara seriei având o semnificaţie în analiză, ca bază de
comparaţie şi apoi se raportează în mod succesiv ceilalţi termeni ai seriei la termenul de
bază.
Valoarea raportului este numărul indice căutat, el exprimând variaţia relativă a
termenului raportat. Forma obişnuită de exprimare a indicilor este cea procentuală.

76
Variaţia relativă ce se obţine în procesul determinării indicilor poate fi privită sub
două aspecte :
-relativitatea bazei, acesta fiind aleasă în funcţie de problemele puse în analiză;
-felul mărimilor ce rezultă din raportul a doi indicatori ai aceleiaşi serii.
Apariţia indicilor este strâns legată de necesitatea ce s-a simţit în economia
mijlocului secolului al XIX-lea de a măsura şi caracteriza variaţia curentă a preţului
mărfurilor şi a cursului valorilor mobiliare cotate la bursă.
Prin apariţia şi utilizarea a numeroşi indici s-a impus clasificarea lor după diverse
criterii :
• După sfera de cuprindere întâlnim:
- indici individuali, simpli sau elementari, măsoară variaţia relativă a unor
fenomene simple, singulare, în timp sau în spaţiu.
- indici de grup, compuşi sau sintetici, măsoară variaţia medie relativă a unor
fenomene colective în raport cu o anumită bază de comparaţie.
• După natura caracteristicii studiate, indicii sunt:
- indicii dinamicii, exprimă variaţia în timp,
- indicii teritoriali, exprimă variaţia în spaţiu,
- indicii calitativi, exprimă variaţia unei caracteristici calitative.
• După modul de alegere a bazei se cunosc:
- indicii cu bază fixă,
- indicii cu bază mobilă.
Indicii de grup, la rândul lor, se grupează după procedeul de calcul:
- indici agregaţi,
- indici calculaţi ca medii aritmetice ponderate a indicilor simpli,
- indici calculaţi ca medii armonice ponderate a indicilor simpli,
- indici calculaţi prin raportarea a două medii aritmetice ponderate,
- indici calculaţi sub formă de medie geometrică.

77
6.2. Indicii simpli

Exprimă variaţia unei colectivităţi simple sub aspectul unei caracteristici date.
Indicatorii comparaţi pot fi cantitativi sau valorici, în funcţie de scopul urmărit în
cercetare şi de datele disponibile.
În primul caz se obţine un indice simplu cantitativ, iar în al doilea caz un indice
simplu valoric.
Principalii indici simpli sunt:
• Indicele simplu al cantităţilor sau al volumului fizic care este determinat după relaţia:

q1
i1q/ 0 = ⋅ 100 ,
q0

q1 = volumul fizic în perioada curentă


q0 = volumul fizic în perioada de bază
• Indicele simplu al preţurilor stabilit astfel:
p1
i1p/ 0 = ⋅ 100
p0

p1 = preţul în perioada curentă


p0 = preţul în perioada de bază
• Indicele simplu valoric stabilit astfel:
v1
i1v/ 0 = ⋅ 100 , dar v1=q1p1
v0

v0=q0p0
q 1 p1
i1v/ 0 = ⋅ 100
q0 p0

Între aceşti indici se verifică relaţia:


i1v/ 0 = i1q/ 0 ⋅ i1p/ 0

q 1 p1 q 1 p1
= ⋅
q0p0 q0 p0

78
6.3 Indicii de grup

Sunt indici compuşi ce măsoară variaţia unor colectivităţi mai largi, în


componenţa cărora intră două sau mai multe colectivităţi simple.
Deoarece elementele colectivtăţilor simple care intră în studiul variaţiei de grup
nu pot fi însumate şi nu pot fi comparate direct din cauza naturii lor diferite, ele se
omogenizează sub un anumit aspect. Pentru aceasta se foloseşte un factor de
omogenizare, ca de ex. preţul în cazul bunurilor materiale.
În cadrul indicilor de grup această unitate de omogenizare are rolul de pondere.
După modul de calcul, indicii de grup sunt:
a. indicel
e agregat
b. indicel
e mediu aritmetic
c. indicel
e mediu armonic
.a Indicele agregat
Este forma generală a indicelui de grup. Se calculează ca raport între suma
mărimilor absolute ale colectivităţilor parţiale cuprinse în studiu, luate cu ponderi
constante sau variabile.
Indicele agregat simplu al producţiei se determină astfel:

I1q/ 0 =
∑q 1
⋅ 100
∑q 0

Pentru măsurarea variaţiei de grup a volumului fizic al unor produse se utilizează


indicele agregat ponderat, calculat astfel:

I1q/ 0 =
∑q p 1 1
⋅ 100
∑q p 0 0

La construirea indicelui agregat ponderat se pot utiliza diferite sisteme de


ponderare, şi anume:

79
1) Sistemul de ponderare propus în 1864 de E. Laspeyres, la care ponderile folosite
sunt cele din perioada de bază. Se foloseşte pentru măsurarea variaţiei de grup a
volumului fizic al unor produse, cantităţile respective fiind ponderate cu un preţ
constant, astfel:

I1q/ 0 =
∑q p 1 0
⋅ 100
∑q p 0 0

2) Sistemul de ponderare propus în 1874 de H. Paasche, la care ponderile folosite


sunt cele din perioada curentă. Se foloseşte pentru măsurarea dinamicii preţului
mediu pentru diferite produse, astfel:

I1p/ 0 =
∑p q 1 1
⋅100
∑p q 0 1

3) Pentru caracterizarea variaţiei valorice a unui grup de produse se utilizează relaţia


indicelui agregat la care variază, de la o perioadă la alta, ambii factori, astfel:

I1v/ 0 =
∑q p 1 1
⋅ 100
∑q p 0 0

Între aceşti indici se verifică relaţia:


I1v/ 0 = I1q/ 0 ⋅ I1p/ 0

În teoria indicilor se mai întâlnesc şi unele sisteme de ponderare care ţin seama de
ponderile din ambele perioade. Întâlnim astfel:
-indicele preţurilor calculat de Edgeworth, care se bazează pe acumularea cantităţilor din
perioada de bază cu cele din perioada curentă şi folosirea acestora ca pondere la
măsurarea variaţiei relative a preţurilor, după relaţia:

I1p/ 0 =
∑ p (q1 1 + q0 )
⋅ 100
∑ p (q0 1 + q0 )

-indicele ideal al lui Fisher. Este un indice de grup al preţurilor calculat ca o medie
geometrică a celor doi indici agregaţi, de tip Laspeyres şi Paasche, astfel:

I1p/ 0 =
∑q p ⋅ ∑ q p
1 0 1 1

∑q p ∑q p0 0 1 0

Acest indice se foloseşte în special în calculul indicilor teritoriali pe plan


internaţional.

80
În practica ţărilor dezvoltate, statistica utilizează sistemul propus de Laspeyres.
Existenţa mai multor sisteme de ponderare provine din faptul că formulele de calcul
propuse nu satisfac integral teoria şi practica folosirii metodei indicilor.
Pe baza indicilor agregat se poate calcula influenţa variaţiei factorilor studiaţi în
mărimi absolute, sub forma diferenţei dintre numărătorul şi numitorul formulei indicelui
respectiv.
În cazul indicelui de grup al volumului fizic, modificarea absolută va fi:
∆q1 / 0 = ∑q 1 p 0 − ∑q 0 p 0
i i

Pentru indicele de grup al preţurilor, modificarea absolută va fi:


∆p1 / 0 = ∑p1q 1 − ∑p 0 q 1
i i

În cazul indicelui de grup valoric, modificarea este:


∆v1 / 0 = ∑q 1 p1 − ∑q 0 p 0
i i

În cazul influenţei factorilor exprimată în mărimi absolute se verifică relaţia:


∆v1 / 0 = ∆q1 / 0 + ∆p1 / 0

Ex. Volumul producţiei şi preţurile unitare pentru 4 produse în 1999 şi 2002 la


firma „X”. S.A. sunt următoarele:
Tabelul 4 Elemente pentru determinarea indicilor agregaţi
Volumul Preţul
Valoarea producţiei
Produsul şi clasa producţiei -mii lei /
-mil lei-
de calitate -tone- tonă-
q0 q1 p0 p1 q0p0 q0p1 q1p0 q1p1
Tomate 804 73 3249 6730 2612,20 5410,92 237,18 491,29
Castraveţi 560 850 3069 6725 1718,64 3766,00 2608,65 5716,25
Salată 26 52 3283 10341 85,36 268,87 170,72 537,73
Gulii 54 22 4457 5100 240,68 275,40 98,05 112,20
TOTAL - - - - 4656,87 9721,19 3114,60 6857,47
∑q 0 p0 ∑q
i
0 p1 ∑q
i
1 p0 ∑q
i
1 p1
i

Să se calculeze indicii individuali şi indicii de grup ai volumului fizic, preţurilor şi


volumului valoric.
1. Indicii individuali ai volumului fizic se calculează după relaţia:
q1
i1q/ 0 = ×100
q0

81
73
i1q/(0tomate ) = ×100 = 9,08 %
804
850
i1q/(0castraveti )
= ×100 =151 ,79 %
560
52
i1q/(0salata ) = ×100 = 200 %
26
22
i1q/(0gulii ) = ×100 = 40 ,74 %
54
Pentru a calcula indicele de grup al volumului fizic al producţiei se foloseşte
indicele tip Laspeyres cu ponderea din perioada de bază.

∑q p 1 0
3114 ,60
Iq
= i
×100 I 1q/ 0 = ×100 = 66 ,88 %
∑q p
1/ 0
4656 ,87
0 0
i

Modificarea absolută a volumului fizic al producţiei se determină cu ajutorul


relaţiei:
∆q = ∑q 1 p 0 −∑q 0 p 0 ∆q = 3114 ,60 − 4656 ,87 = −1542 ,27 mil. lei
i i

Datele din tabelul prezentat sugerează o schimbare a structurii. Valoarea totală a

ofertei în anul 2002 la preţul anului 1999 este de 3114,60 mil. lei ( ∑
i
q 1 p 0 ).

Pentru produsul “tomate”, volumul fizic scade în anul 2002 faţă de 1999 de
0,0908 ori. Exprimat în procente, volumul fizic a scăzut în perioada curentă faţă de
perioada de bază cu 90,92%, adică la fiecare 100 tone realizate pentru produsul “tomate”
în perioada de bază, se realizează 9,08 tone în perioada curentă.
Pentru produsul “castraveţi” volumul fizic creşte în 2002 faţă de 1999 de 1,5179
ori. Exprimat în procente, volumul fizic a crescut în perioada curentă faţă de perioada de
bază cu 51,79%, adică la fiecare 100 tone realizate pentru produsul “castraveţi” în 1999,
se realizează 151,79 tone în 2002.
Pentru produsul “salată” volumul fizic creşte în 2002 faţă de 1999 de 2 ori.
Exprimat în procente, volumul fizic a crescut în perioada curentă faţă de perioada de bază
cu 100,00%, adică la fiecare 100 tone realizate pentru produsul “salată” în 1999, se
realizează 200 tone în 2002.

82
Pentru produsul “gulii”, volumul fizic scade în anul 2002 faţă de 1999 de 0,4074
ori. Exprimat în procente, volumul fizic a scăzut în perioada curentă faţă de perioada de
bază cu 59,26%, adică la fiecare 100 tone realizate pentru produsul “gulii” în perioada de
bază, se realizează 40,74 tone în perioada curentă.
Pe total produse, volumul fizic al producţiei a scăzut cu 33,12%.
2. Indicii individuali ai preţurilor se calculează după relaţia:
p1
i1p/ 0 = × 100
p0
6730
i1q/(0tomate ) = ×100 = 207 ,14 %
3249
6725
i1q/(0castrave ţa) = ×100 = 219 ,13 %
3069
10341
i1q/(0salata ) = ×100 = 314 ,99 %
3283
5100
i1q/(0gulii ) = ×100 = 114 ,43 %
4457
Indicele agregat al preţurilor se determină ca un indice Paasche:

∑p q 1 1
6857,47
I p
= i
× 100 = × 100 = 220,17 %
∑p q
1/ 0
0 1 3114,6
i

Indicii preţurilor arată că pentru produsul “tomate” preţul înregistrează o creştere


cu 107,14%, pentru produsul “castraveţi” preţul creşte cu 119,13%, pentru produsul
“salată” preţul creşte cu 214,99% şi pentru produsul “gulii” preţul înregistrează o
creştere cu 14,43%.
Pe total produse, preţul unitar creşte cu 120,17%.
Aportul acestei căi la creşterea globală este relevat prin calculul modificării
absolute a preţurilor pe total produse, după relaţia:
∆p1 / 0 = ∑p1q 1 − ∑p 0 q 1 = 6857 ,47 − 3114 ,6 = 3742 ,87 mil. lei
i i

3. Indicii individuali ai volumului valoric al producţiei se calculează după


relaţia:
q1 p1
i1v/ 0 = × 100
q0 p0

83
491 ,29
i1q/(0tomate )
= ×100 =18 ,81 %
2612 ,20

5716 ,25
i1q/(0castraveti )
= ×100 = 332 ,60 %
1718 ,64

537 ,73
i1q/(0salata )
= ×100 = 629 ,98 %
85 ,36

112 ,20
i1q/(0gulii ) = ×100 = 46 ,62 %
240 ,68

Indicile de grup (agregat) al volumului valoric se determină după relaţia:

∑q p 1 1
6857,47
I v
= i
× 100 = × 100 = 147,25 %
∑q p
1/ 0
0 0 4656,87
i

Indicii volumului valoric arată că pentru produsul “tomate” volumul valoric


înregistrează o scădere cu 81,19%, pentru produsul ”castraveţi” volumul valoric creşte
cu 232,60%, pentru produsul “salată” volumul valoric creşte cu 529,97%, iar pentru
produsul “gulii” volumul valoric înregistrează o scădere cu 53,38% . Pe total produse,
volumul valoric creşte cu 47,25%.
Modificarea absolută a volumului valoric al producţiei se determină după
relaţia:
∆q = ∑q 1 p 1 −∑q 0 p 0 = 6857 ,47 − 4656 ,87 = 2200 ,6 mil. lei
i i

I. Relaţiile dintre indici


Între indicele volumului fizic, cel al preţurilor şi cel al volumului valoric există
următoarea relaţie:
-pentru indici individuali: iv = iq × i p
-pentru produsul “tomate”:
i v ( tomate )
= i q ( tomate ) × i p ( tomate )
= 0,0908 × 2,0714 = 0,1881 sau 18,81%

-pentru produsul ”castraveţi”:


i v ( castraveti )
= i q ( castraveti )
× i p ( castraveti )
=1,5179 × 2,1913 = 3,3260 sau 332,6%

-pentru produsul “salată”:


i v ( salata )
= i q ( salata ) × i p ( salata ) = 2 × 3,1499 = 6,2998 sau 629,98%.

-pentru indici de grup:

84
I v =I q ×I p
= 0,6688 × 2,2017 =1,4725 sau 147,25%

85
b. Indicel
e mediu aritmetic ponderat

Este o formă transformată a indicelui agregat şi se calculează ca o medie


aritmetică a indicilor individuali ai fenomenului studiat, ponderaţi cu elementele de la
numitorul formulei indicelui agregat corespunzător.
Atunci când se cunosc indicii individuali ai volumului fizic pentru un grup de
produse şi valorile acestor produse din perioada de bază, dinamica volumului fizic al
producţiei pe total produse se poate calcula pe baza indicelui mediu aritmetic ponderat,
astfel:

∑i ⋅ q p q
1/ 0 0 0
I1q/ 0 = i
× 100
∑q p i
0 0

Ex. Într-o unitate valoarea producţiei în anul de bază şi variaţia volumului


fizic al producţiei, pe produse se prezintă astfel:
Valoarea prod în Indicii individuali ai
Produs per. de bază (mii lei) volumului fizic
q0p0 i 1q/ 0
A 3000 1,2
B 5000 1
C 2000 0,95
Să se determine creşterea volumului fizic al producţiei pe total produse.

∑i ⋅ q pq
1/ 0 0 0
I q
= i
× 100
∑q p
1/ 0
0 0
i

1,2 ⋅ 3000 + 1 ⋅ 5000 + 0,95 ⋅ 2000


I1q/ 0 = ×100 = 105 %.
3000 + 5000 + 2000

c. Indicel
e mediu armonic ponderat

Se calculează ca o medie armonică a indicilor individuali ai fenomenului studiat,


ponderaţi cu elementele de la numărătorul formulei indicelui agregat corespunzător. Se

86
utilizează pentru studierea dinamicii preţurilor pe total produse, atunci când se cunosc
indicii individuali ai preţurilor şi valoarea producţiei din perioada curentă. Relaţia de
calcul:

∑p q 1 1
I p
1/ 0 = i
×100
1
∑i
i
q
p1 q 1
1/ 0

Volumul valoric al prod Indicii individuali ai


în per. de curentă (mii preţurilor
Produs
lei)
i 1p/ 0
q1p1
A 32000 1,10
B 65000 0,95
C 50000 1,20
Să se calculeze dinamica preţurilor pe total produse.

∑p q 1 1
I p
1/ 0 = i
×100
1
∑i
i
q
p1 q 1
1/ 0

32000 + 65000 + 50000


I1p/ 0 = ×100 = 105 ,6
1 1 1 %
⋅ 32000 + ⋅ 65000 + ⋅ 50000
1,10 0,95 1,2

6.4 Sistemul indicilor calculaţi din mărimi medii

Indicii se calculează nu numai din mărimi absolute, ci şi din mărimi relative şi


medii. Atunci când în calculul indicilor de grup se compară mărimi medii, putem obţine,
în funcţie de modul în care sunt combinate elementele cuprinse în calcul trei categorii de
indici, având funcţii analitice diferite.
Prin sistemul acestor indici se efectuează analiza factorială a variaţiei
colectivităţilor sau fenomenelor social-economice.
Cu ajutorul lor se pot măsura influenţele globale sau izolate ale factorilor care au
intervenit direct în variaţia fenomenului social dat.
Completându-se reciproc în analiza statistică, acest grup de indici constituie un
sistem din care fac parte:
A. indicele de variaţie bifactorială;

87
B. indicele cu structură fixă;
C. indicele schimbării structurii.
A. indicele de variaţie bifactorială
Este un indice de grup care arată variaţia medie totală a unui fenomen produsă sub
influenţa directă a doi factori:
-variaţia nivelului caracteristicii în fiecare grupă, ca factor esenţial al variaţiei de
ansamblu;
-variaţia structurii sau ponderii grupelor în colectivitatea totală.
Denumit şi indice cu structură variabilă (Is.v), indicele de variaţie bifactorială este
un raport între două medii cu ponderi diferite.

Pornind de la formula mediei aritmetice ponderate: x =


∑x n
i i
şi aplicând
∑n i

regula de calcul a indicilor calculaţi de mărimi medii, obţinem:

I sx.v =
x1
=
∑x n 1 1
÷
∑x n 0 0

x0 ∑n 1 ∑n 0

Formula se poate particulariza la diferite fenomene analizate în mod curent de


statistică.
B. indicele cu structură fixă (Is.f)
Dacă în cazul indicilor calculaţi din mărimi medii, considerăm că ponderea
grupelor care compun colectivitatea totală rămâne neschimbată de la o perioadă la alta,
fie ea n1 sau n0, avem ceea ce se numeşte indice cu structură sau pondere fixă.
Dacă se aplică sistemul de ponderare propus de Paasche, indicele se construieşte
folosind ponderile din perioada curentă.

I sx.f =
∑x n 1 1
÷
∑x n 0 1

∑n 1 ∑n 1

Dacă indicele cu structură fixă se calculează folosind ponderile din perioada de


bază, corespunde sistemului de ponderare propus de Laspeyres şi formula devine:

I sx.f =
∑x n
1 0
÷
∑x n 0 0

∑n 0 ∑n 0

C. indicele variaţiei structurii (Iv.s.).

88
Denumit şi indicele modificărilor structurale, se calculează pornind de la ipoteza
că s-a schimbat numai distribuţia factorului cantitativ, deci structura colectivităţii.
Formula generală a acetui indice este cea aplicată în practică în care ponderarea se
face cu datele perioadei de bază, de tip Laspeyres, astfel:

I xv.s. =
∑x n 0 1
÷
∑x n 0 0

∑n 1 ∑n 0

Între aceste trei categorii de indici se stabileşte relaţia:


I sx. v = I sx.f ⋅ I xv.s.

Ex. Presupunem următoarele date privind salariul mediu săptămânal (mii lei)
şi numărul de salariaţi din 3 secţii ale unei unităţi:
Sal. mediu săpt. Nr. sal. s1 n 1 s0n 0 s 0 n1
Secţia
so s1 n0 n1
I 1000 1200 800 800 960000 800000 800000
II 1200 1800 700 650 117000 840000 780000
0
III 1500 2500 900 910 227500 135000 1365000
0 0
Total 240 236 440500 299000 2945000
0 0 0 0
Să se determine dinamica salariului mediu pe total unitate.

I ss.v =
∑s n1 1
÷
∑s n 0 0
=
4405000 2990000
÷ = 1,4982 sau 149,82%.
∑n 1 ∑n 0 2360 2400

Pe total secţii, salariul mediu a crescut în perioada curentă faţă de perioada de


bază de 1,4982 ori sau cu 149,82% sub influenţa ambilor factori ( s , n).

I ss.f =
∑s n1 1
÷
∑s n 0 1
=
4405000
÷
2945000
= 1,4958 sau 149,58%.
∑n 1 ∑n 1 2360 2360

Salariul mediu a crescut de 1,4982 ori sau cu 149,82% sub influenţa modificării
salariului mediu săptămânal pe fiecare secţie.

I sv.s. =
∑s n 0 1
÷
∑s n 0 0
=
2945000 2990000
÷ = 1,0016 sau 100,16%.
∑n 1 ∑n 0 2360 2400

Pe total secţii, salariul mediu a crescut 1,0016 ori sau cu 100,16% ca urmare a
modificării numărului de salariaţi.
Relaţii între indici:
I sx. v = I sx.f ⋅ I xv.s. , 1,4958 * 1,0016 =1,49819

89
6.5 Gruparea indicilor dinamicii după felul bazei

Orice indice se exprimă ca un raport între 2 indicatori, dintre care unul este
considerat ca bază de raportare, iar celălalt este mărimea raportată.
Baza de raportare se poate alege după criterii diferite. La seriile de timp, se
consideră, de regulă, primul termen al seriei. Se poate alege orice alt termen al seriei sau
un nivel exterior seriei dacă este semnificativ.
Indicii dinamicii, după felul bazei sunt:
a. Indici cu bază fixă – se obţin prin raportarea tuturor nivelurilor seriei la
termenul ales drept bază de raportare.
Pp. că în cazul volumului fizic avem seria: q0, q1,...,qn-1, qn, iar q0 este baza de
raportare. Indicii cu bază fixă sunt:
q1 q2 q n −1 qn
i 1q/ 0 = , i q2 / 0 = , .... , i qn −1 / 0 = , i qn / 0 =
q0 q0 q0 q0

b. Indici cu bază fixă – se obţin prin raportarea tuturor nivelurilor seriei la


termenul precedent. Considerând aceeaşi serie, indicii cu bază mobilă vor fi:
q1 q2 q n −1 qn
i 1q/ 0 = , i q2 / 1 = , .... , i qn −1 / n −2 = , i qn / n −1 =
q0 q1 q n −2 q n −1

Între aceste 2 categorii de indici se verifică relaţiile:


-produsul indicilor cu bază mobilă dă indicele cu bază fixă corespunzător
ultimului termen al seriei date:
q1 q 2 q 3 q q q
⋅ ⋅ ⋅  ⋅ n −1 ⋅ n = n
q 0 q1 q 2 q n − 2 q n −1 q 0

-împărţind doi indici cu bază fixă obţinem indicele cu bază mobilă corespunzător:
q 2 q1 q 2
÷ =
q 0 q 0 q1

Prin analiza comparativă a conţinutului indicilor cu bază fixă cu cel al indicilor cu


bază mobilă se pot face următoarele constatări:

90
-indicii cu bază fixă prezintă avantajul comparabilităţii de conţinut, unitatea de măsură
rămânând aceeaşi. În cazul indicilor în lanţ, termenul de bază schimbându-se, se schimbă
şi valoarea unităţii care exprimă variaţia.
-indicii cu bază fixă nu sunt concludenţi dacă se raportează la o bază învechită. În acest
caz trebuie să se procedeze la actualizarea bazei pentru a permite analiza corectă a
fiecărei etape.
Prin modificarea bazei de raportare a indicilor cu bază fixă la anumite perioade,
aceşti indici se apropie, într-un fel sau altul, de metoda şi funcţia aplicativă a indicilor în
lanţ.
Ex. Producţia unei firme într-o perioadă de 7 ani a evoluat astfel:
Anii Prod. (mii buc.)
1 100
2 84
3 74
4 93
5 86
6 88
7 117
Să se studieze dinamica producţiei cu ajutorul indicilor grupaţi după felul bazei.
-indicii cu bază fixă:
qi
i iq/ 0 =
q0

84 74
i q2 / 1 = = 0,84 sau 84% ; i 3q / 1 = = 0,74 sau 74%
100 100
93 86
i q4 / 1 = = 0,93 sau 93% ; i 5q / 1 = = 0,86 sau 86%
100 100
88 117
i q6 / 1 = = 0,88 sau 88% ; i q7 / 1 = = 0,117 sau 117%
100 100
-indicii cu bază mobilă:
qi
i iq/ i −1 =
q i −1

84 74
i q2 / 1 = = 0,84 sau 84% ; i 3q / 2 = = 0,88 sau 88%
100 84
93 86
i q4 / 3 = = 1,2567 sau 125,67% ; i 5q / 4 = = 0,924 sau 92,4%
74 93

91
88 117
i q6 / 5 = = 1,0232 sau 102,32% ; i q7 / 1 = = 1,3295 sau 132,95%
86 88
Relaţii între aceşti indici:
-produsul indicilor cu bază mobilă dă indicele cu bază fixă corespunzător ultimului an:

84 74 93 86 88 117 117
⋅ ⋅ ⋅ ⋅ ⋅ =
100 84 74 93 86 88 100
-raportul a doi indici cu bază fixă dă indicele cu bază mobilă corespunzător:
74 84 74
÷ =
100 100 84

6.6 Ritmul variaţiei şi al sporului

Analiza variaţiei în timp a fenomenelor sociale este completată cu metoda


ritmurilor. Ritmurile îşi au punctul de plecare în indicii dinamicii, conţinutul lor
confundându-se până la un punct cu al acestora. Metoda lor poate fi privită ca o
prelungire a indicilor dinamicii în direcţia cunoaşterii şi caracterizării fenomenelor
sociale în evoluţia lor timp.
Indicatorii care se pot utiliza în caracterizarea seriilor dinamice se grupează astfel:
A. indicatori absoluţi
B. indicatori relativi
C. indicatori medii.

A. Indicatorii absoluţi
Cuprind sporul absolut, care, după modul de alegere a bazei, este:
spor absolut cu bază fixă ( ∆i / 0 ) – se obţine ca diferenţă între fiecare termen al sumei
x

şi termenul ales drept bază de raportare. Considerând seria: x0, x1, x2, ... , xn, sporul
absolut cu bază fixă se va calcula astfel:
∆x1 / 0 = x 1 − x 0 ; ∆x2 / 0 = x 2 − x 0 ; .....; ∆xn / 0 = x n − x 0 sau

generalizând: ∆xi / 0 = x i − x 0

spor absolut cu bază mobilă ( ∆i / i −1 ) – este diferenţa dintre fiecare termen al seriei şi
x

termenul anterior. În aceeaşi serie vom avea:

92
∆x1 / 0 = x 1 − x 0 ; ∆x2 / 1 = x 2 − x 1 ; .....; ∆xn / n −1 = x n − x n −1 sau

generalizând: ∆xi / i −1 = x i − x i −1
Între sporurile absolute cu baza fixă şi cele cu baza mobilă se verifică relaţiile:
-suma sporurilor cu baza mobilă este sporul cu bază fixă al ultimului an:
x 1 − x 0 + x 2 − x 1 + x 3 − x 2 +  + x n − x n −1 = x n − x 0

-diferenţa dintre două sporuri absolute cu baza fixă consecutive este egală cu sporul cu
bază mobilă corespunzător:
(x 3 − x o ) − (x 2 − x 0 ) = x 3 − x 2

B. Indicatorii relativi
Indicatorii relativi de măsurare a variaţiei în timp cuprind:
.1 ritmul variaţiei
.2 ritmul sporului
1. Ritmul variaţiei (Rx) – exprimă viteză de variaţie exprimată în mărimi relative.
După modul de calcul, rimul variaţiei este de două feluri:
x
• Ritmul variaţiei cu bază fixă ( R i / 0 ) – arată de câte ori a crescut sau scăzut nivelul
unui fenomen în decursul unei perioade de timp şi se calculează astfel:
xi
R ix/ 0 = , i =1, n
x0
x
• Ritmul variaţiei cu bază mobilă ( R i / i −1 ) – arată de câte ori a crescut sau scăzut
nivelul unui fenomen într-un moment faţă de momentul anterior.
xi
R ix/ i −1 =
x i −1

Între ritmul variaţiei cu bază fixă şi cel cu bază mobilă se verifică relaţiile:
-produsul ritmurilor cu bază mobilă este ritmul cu bază fixă al întregii perioade:
x1 x 2 x 3 x x
⋅ ⋅ ⋅⋅ n = n
x 0 x1 x 2 x n −1 x 0

-raportul a două ritmuri ale variabilei cu bază fixă este egal cu ritmul cu bază mobilă
corespunzător:

93
x 2 x1 x 2
÷ =
x 0 x 0 x1

2 Ritmul sporului (rx) – exprimă mărimea creşterii sau scăderii în decursul unei
anumite perioade de timp faţă de perioada de bază a unui indicator. Se calculează:
• Ritmul sporului cu bază fixă ( rx i / 0 ) – se calculează ca raport între sporul cu bază fixă
şi nivelul fenomenului considerat din perioada de bază, astfel:
∆xi −0 x i − x 0
rx i / 0 = =
x0 x0

• Ritmul sporului cu bază mobilă ( rx i / i −1 ) – se calculează ca raport între sporul cu bază


mobilă şi nivelul fenomenului considerat din perioada anterioară, astfel:
∆xi / i −1 x i − x i −1
rx i / i −1 = =
x i −1 x i −1

Relaţii între aceste ritmuri:


-ritmul sporului este egal cu ritmul variaţiei minus 1 sau 100, în funcţie de modul de
exprimare a acestor ritmuri:

rx i / 0 = R ix/ 0 − 1

rx i / i −1 = R ix/ i −1 − 1
C. Indicatorii medii
Indicatorii medii ai creşterii seriilor dinamice sunt:
1. Sporul mediu ( ∆x ) – se calculează ca o medie aritmetică simplă a sporurilor absolute
cu bază mobilă. Cum suma sporurilor cu bază mobilă este sporul cu bază fixă a ultimei
perioade, atunci sporul mediu se va calcula astfel:
x xn − x0
∆ = , unde:
n −1
xn = ultimul termen al seriei,
x0 = primul termen al seriei,
n = nr. termenilor seriei.
2. Ritmul mediu al variaţiei ( R x ) – exprimă viteza medie relativă de creştere a unui
fenomen în decursul unei perioade de timp. Se determină prin diverse metode, cea mai
utilizată fiind metoda mediei geometrice, astfel:

94
x xn
R = n −1
xo

3. Ritmul mediu al sporului ( r x ) – se determină pe baza ritmurilor medii ale variaţiei


astfel:
x x x x
r = R −1 sau în procente: r = R −100

Ritmul mediu al sporului arată cu cât a crescut în medie în fiecare an al perioadei


luate în calcul nivelul unui anumit fenomen.

Ex. Presupunem următoarea evoluţie a producţiei unei firme:


Anii Prod. (mii t)
1 580
2 716
3 538
4 348
5 240
Să se calculeze indicatorii absoluţi, relativi şi medii ai dinamicii.
Indicatorii absoluţi:
• Sporul absolut:
 Sporul absolut cu bază fixă: ∆ i / 0 = q i − q 0
q

∆q2 / 1 = 716 − 580 = 136 mii t ; ∆q3 / 1 = 538 − 580 = −42 mii t ;

∆q4 / 1 = 348 − 580 = −232 mii t ; ∆q5 / 1 = 240 − 580 = −340 mii t

 Sporul absolut cu bază mobilă: ∆i / i −1 = q i − q i −1


q

∆q2 / 1 = 716 − 580 = 136 mii t ; ∆q3 / 2 = 538 − 716 = −178 mii t ;

∆q4 / 3 = 348 − 538 = −190 mii t ; ∆q5 / 4 = 240 − 348 = −108 mii t

Relaţiile dintre aceste sporuri:


-suma sporurilor cu baza mobilă este sporul cu bază fixă al ultimului an:
136 − 178 − 190 − 108 = −340 mii t
-diferenţa dintre două sporuri absolute cu baza fixă consecutive este egală cu sporul cu
bază mobilă corespunzător:
− 42 − 136 = −178 mii t
Indicatorii relativi:
• Ritmul variaţiei:

95
qi
Ritmul variaţiei cu bază fixă: R i / 0 =
q

q0

716 538
R q2 / 1 = = 1,234 sau 123,4% ; R 3q / 1 = = 0,92 sau 92% ;
580 580
348 240
R q4 / 1 = = 0,60 sau 60% ; R 5q / 1 = = 0,41 sau 41% .
580 580
qi
Ritmul variaţiei cu bază mobilă: R i / i −1 =
q

q i −1

716 538
R q2 / 1 = = 1,234 sau 123,4% ; R 3q / 2 = = 0,75 sau 75% ;
580 716
348 240
R q4 / 3 = = 0,64 sau 64% ; R 5q / 4 = = 0,68 sau 68% .
538 348
Relaţii între ritmurile variaţiei:
-produsul ritmurilor cu bază mobilă este ritmul cu bază fixă al ultimului an:
716 538 348 240 240
⋅ ⋅ ⋅ =
580 716 538 348 580
-raportul a două ritmuri ale variabilei cu bază fixă este egal cu ritmul cu bază mobilă
corespunzător:
538 716 538
÷ =
580 580 716
• Ritmul sporului:
qi − q0
Ritmul sporului cu bază fixă: ri / 0 =
q

q0

716 − 580 538 − 580


r2q/ 1 = = 0,23 sau 23% ; r3q/ 1 = = −0,07 sau - 7% ;
580 580
348 − 580 240 − 580
r4q/ 1 = = −0,4 sau - 40% ; r5q/ 1 = = −0,58 sau - 58% .
580 580
q i − q i −1
Ritmul sporului cu bază mobilă: ri / i −1 =
q

q i −1

716 − 580 538 − 716


r2q/ 1 = = 0,23 sau 23% ; r3q/ 2 = = −0,24 sau - 24% ;
580 716
348 − 538 240 − 348
r4q/ 3 = = −0,35 sau - 35% ; r5q/ 4 = = −0,31 sau - 31% .
538 348
Indicatorii medii:

96
q q n − q 0 240 − 580
• Sporul mediu: ∆ = = = −85 mii t
n −1 5 −1
q q n 4 240 4
• Ritmul mediu al variaţiei: R = n −1 = = 0,4137 = 0,1426 ori
qo 580


x x x
Ritmul mediu al sporului: r = R −1 ; r =0,1426 −1 =−0,8574

97
CAPITOLUL VII REGRESIE ŞI CORELAŢIE
7.1 Noţiunea, importanţa şi felul legăturilor dintre
fenomene
7.2 Metode elementare de studiere a legăturilor dintre
fenomene
7.3 Metode analitice de studiere a legăturilor dintre
fenomene
7.4 Corelaţia neparametrică

7.1 Noţiunea, importanţa şi felul legăturilor dintre fenomene

În statistică, legăturile care se stabilesc în mod necesar între diferite fenomene


colective sau între caracteristici diferite ale aceluiaşi fenomen colectiv se numesc
corelaţii.
În viaţa socială, corelaţia înseamnă o relaţie sau o legătură de forme diferite între
două sau mai multe variabile privind un fenomen sau diferite fenomene colective.
În noţiunea de corelaţie se includ legături de condiţionare reciprocă, de
cauzalitate, de subordonare, de influenţă reciprocă între diferite fenomene colective.
Procedeele de cercetare statistică a acestor legături se numesc tot corelaţie.
Legăturile în viaţa fenomenelor sociale se numesc legături stochastice sau
statistice. Aceste legături se caracterizează prin faptul că o caracteristică exercită o
anumită influenţă asupra altei caracteristici, îi determină într-o anumită măsură variaţia,
însă asupra acesteia mai acţionează şi alte caracteristici, care, din punct de vedere al
legăturii, se consideră întâmplătoare.
Legătura statistică dintre două sau mai multe caracteristici exprimate numeric
poartă denumirea de corelaţie.
Între două sau mai multe fenomene există corelaţie dacă între ele este o anumită
legătură logică.
Studiul corelaţiei este îndreptat spre:
- identificarea existenţei legăturii;
- stabilirea sensului şi formei legăturii;

98
- determinarea gradului de intensitate a legăturii.
Mulţimea legăturilor statistice se poate grupa după mai multe criterii:
• După numărul caracteristicilor corelate, legăturile dintre fenomene pot fi:
- legături simple – exprimă variaţia variabilei rezultative y în funcţie de o singură
variabilă factorială x.
- legături multiple - exprimă variaţia variabilei rezultative y în funcţie de variaţia
simultană a mai multor variabile factoriale x1, x2, ..., xn.
• După sensul sau direcţia legăturii, acestea pot fi:
- legături directe – exprimă modificarea lui y în acelaşi sens cu variabila x.
- legături inverse - exprimă modificarea lui y în sens contrar variabilei x.
• După forma legăturilor, întâlnim:
- legături rectilinii
- legături curbilinii.
Analiza legăturilor statistice vizează estimarea modelului de regresie şi măsurarea
intensităţii legăturii dintre variabile.
Pentru acesta se utilizează un ansamblu de metode elementare şi metode analitice.
Metodele elementare oferă informaţii asupra naturii şi caracteristicilor legăturii
cercetate, permiţând cunoaşterea formei şi direcţiei legăturii.
Metodele analitice sunt precise şi concrete, permiţând măsurarea şi caracterizarea
cifrică a gradului de legătură, a intensităţii acesteia.

7.2 Metode elementare de studiere a legăturilor dintre fenomene

Sunt următoarele:
A. metoda seriilor paralele interdependente
B. metoda grupărilor statistice
C. metoda grafică.
A. Metoda seriilor paralele interdependente
Constă în stabilirea legăturii dintre fenomene pe baza comparării indicatorilor
proveniţi din două serii paralele, din care una reprezintă variaţia variabilei factoriale x şi

99
cealaltă variabila rezultativă y. În comparaţie se cuprind serii care privesc variaţia
fenomenelor în timp, în teritoriu sau calitative.
Dacă se compară serii de timp, termenii acestora se ordonează cronologic, iar
dacă se compară serii teritoriale sau calitative, termenii lor se ordonează în ordine
crescătoare sau descrescătoare a variabilei factoriale x. În paralel se înscriu termenii
corespunzători ai variabilei rezultative y.
Prin compararea seriilor interdependente se poate evidenţia existenţa şi direcţia
legăturii.
Astfel, dacă ambele variabile comparate variază în acelaşi sens, există o legătură
directă. Dacă variaţia lor este de sens diferit, corelaţia este inversă.
Dacă cele două variabile variază în mod independent sau una variază şi cealaltă
rămâne constantă, nu există legătură.
Această metodă se aplică în cazul seriilor cu un nr. relativ mic de variante, când
există corespondenţă de la valoare la valoare (xi, yi).

B. Metoda grupărilor statistice


Se aplică în cazul când cele două variabile corelate prezintă un nr. mare de
variante.
Această metodă constă în împărţirea unităţilor statistice după variaţia variabilei
factoriale şi calcularea indicatorilor sintetici ai caracteristicii rezultative pentru fiecare
grupă în care a fost împărţită colectivitatea.
Metoda oferă posibilitatea aprecierii existenţei legăturii şi a sensului ei, dar nu
măsoară intensitatea legăturii.
În cazul legăturilor simple se utilizează grupări simple, iar în cazul legăturilor
multiple şi vor utiliza grupările combinate.
O formă mai dezvoltată a acestei metode este metoda tabelului de corelaţie care se
utilizează atunci când nr. perechilor de valori ale variabilelor corelate este foarte mare. În
cadrul tabelului de corelaţie gruparea se face concomitent după ambele variabile x şi y.
Se recomandă ca nr. intervalelor de variaţie să fie acelaşi pentru ambele variabile.
Cu ajutorul tabelului de corelaţie se poate stabili existenţa legăturii dintre
variabile, direcţia şi intensitatea ei. Dacă frecvenţele sunt dispersate uniform în întreg

100
spaţiul tabelului, atunci între variabile nu există nici un fel de legătură. Dacă frecvenţele
se concentrează în jurul unei drepte sau a unei curbe de un anumit tip, înseamnă că între
variabile există o legătură a cărei formă este dată de dreapta sau curba respectivă. Cu cât
concentrarea frecvenţelor în jurul dreptei sau curbei este mai mare, cu atât se poate
aprecia că intensitatea legăturii dintre variabile este mai mare, şi invers.

C. Metoda grafică
Permite prezentarea într-o formă geometrică, expresivă şi vizuală a legăturii
dintre două variabile. Se bazează pe sistemul de axe rectangulare, variabila factorială se
fixează pe abscisă, iar cea rezultativă pe ordonată. Perechile de valori corelate se
reprezintă prin câte un punct în cadrul graficului. Reprezentarea acestor puncte în grafic
oferă imaginea câmpului de corelaţie, asemănătoarea cu un nor de puncte.
După modul de distribuire a acestor puncte în spaţiul graficului, se poate aprecia
existenţa, forma, direcţia şi intensitatea legăturii dintre cele două variabile. Concentrarea
punctelor în jurul anumitor drepte sau curbe ne va indica faptul că între variabile există o
legătură, iar dreapta sau curba respectivă va indica forma legăturii.
Dacă punctele se dispersează uniform pe întreg spaţiul graficului sau se
concentrează în jurul unei drepte paralele cu una din axe, atunci între variabile nu există

101
legătură.

x x
Există legătură directă Există legătură inversă

y y

xx

Nu există legătură

7.3 Metode analitice de studiere a legăturilor dintre fenomene

102
Cercetarea concretă a legăturii dintre fenomene numai pe baza metodelor
elementare este insuficientă. Informaţiile obţinute pe baza lor se completează cu metodele
analitice.
Metodele analitice permit exprimarea matematică a formei legăturii şi măsurarea
numerică a intensităţii legăturii. Sunt cunoscute sub denumirea de metode de regresie şi
corelaţie.
Modelele de regresie au ca scop reprezentarea alurii distribuţiei a două variabile
corelate. Prin curbele de regresie se prezintă corespondenţa între perechile de valori
(xi,yi).
Cele mai utilizate modele de regresie în studiul fenomenelor şi proceselor social-
economice sunt:
A. regresie şi corelaţie liniară
B. regresie şi corelaţie curbilinie
C. regresie şi corelaţie multiplă
Stabilirea şi analiza modelului de regresie pp. efectuarea următorilor paşi:
-construirea corelogramei, respectiv a norului de puncte;
-aproximarea, pe baza ajustării corelogramei, a formei legăturii printr-un model teoretic
şi formularea ecuaţiei corespunzătoare modelului de regresie ales;
-estimarea parametrilor ecuaţiei de regresie şi interpretarea regresiei în funcţie de semnul
şi valoarea lor;
-testarea semnificaţiei parametrilor de regresie.

A. Regresie şi corelaţie liniară


Cazul cel mai simplu al legăturii dintre două variabile x şi y este cel al regresiei
liniare de forma:
y = a + bx
Această relaţie se numeşte ecuaţie de regresie şi se reprezintă grafic printr-o
dreaptă definită de parametrii de regresie, şi anume:
a = ordonata la origine şi arată valoarea variabilei y când x = 0. Poate lua atât valori
pozitive, cât şi negative.

103
b = panta dreptei, se mai numeşte şi coeficient de regresie. Semnul parametrului b indică
direcţia legăturii dintre cele două variabile corelate, astfel:
-dacă b>0, indică o legătură directă
-dacă b=0, nu există legătură
-dacă b<0, indică o legătură inversă.
Valoarea acestui parametru arată gradul de dependenţă dintre variabile, respectiv
cu cât creşte sau scade y la o creştere sau la o scădere a variabilei x cu o unitate.
Determinarea parametrilor dreptei de regresie se poate face prin diverse metode,
cea mai utilizată fiind metoda celor mai mici pătrate.
Principiul de bază al acestei metode este ca suma pătratelor diferenţelor dintre
valorile reale ale lui y şi valorile teoretice date de ecuaţia de regresie să fie minimă.
∑( y − y
2
i ) =minim, respectiv

∑( y −a −bx )
2
=minim.

Rezolvarea problemei de minim impune două condiţii:


- anularea derivatelor parţiale de ordinul I ale sumei în raport cu a şi b;
- matricea derivatelor parţiale de ordinul II să fie pozitiv definită.
Aplicând condiţia ca derivatele parţiale ale sumei în raport cu a şi b să fie nule,
obţinem sistemul de ecuaţii normale:

 n a+ b∑ x i = ∑ y i


 a ∑ x i + b∑ x i2 = ∑ x i y i
Prin rezolvarea sistemului de ecuaţii normale printr-una din metodele cunoscute
se obţin parametrii a şi b.
Prin metoda lui Cramer sau a determinanţilor, parametrii a şi b se determină astfel
(pentru seriile simple):

104
∑y ∑x
i i

∆ a ∑ xy ∑ x ∑ x ∑ y − ∑ x∑ xy
2 2
ii i i i i ii
a= = = 2 2
∆ n ∑ x i n ∑ x i − (∑ x i )

∑x ∑x
2
i i

105
n ∑ yi

∆ b ∑ xi ∑ x yii n∑ x yii − ∑ xi∑ yi


b= = = 2 2
∆ n ∑ x i n ∑ x i − (∑ x i )

∑x ∑x2
i i
În cazul când se studiază legătura dintre două variabile folosind date grupate într-
un tabel de corelaţie, deci serii cu frecvenţe, sistemul de ecuaţii normale devine:

 a ∑ n i + b∑ x i n i = ∑ y i n i


 a ∑ x i n i + b∑ x i2 n i = ∑ x i y i n i
Determinarea parametrilor a şi b prin aceeaşi metodă conduce la rezultatele:

106
∑ yn ∑ xn ii ii

∆ a ∑ xyn ∑ x n ∑ x n ∑ yn − ∑ x n ∑ xyn
2 2
iii i i i i ii ii iii
a= = = 2 2
∆ ∑ ni ∑ x nii ni∑∑ xini − (∑ x nii )

∑ xn ∑ x n
2
ii i i

107
∑ n ∑ yn
i ii

∆ b ∑ x nii ∑ x y niii ∑ ni∑ x y niii − ∑ x nii ∑ y nii


b= = = 2 2
∆ ∑ ni ∑ x nii ni∑∑ xini − (∑ x nii )

∑ xn ∑ xn2
ii i i
Pe baza parametrilor a şi b astfel determinaţi se obţine dreapta de regresie.
Aceasta oferă doar imaginea formei legăturii dintre două variabile.
Pentru a determina cât de intensă este legătura dintre variabilele corelate se
utilizează coeficientul de corelaţie şi raportul de corelaţie.
Coeficientul de corelaţie se foloseşte pentru măsurarea legăturii în cazul unei
regresii liniare simple. Formulat de statisticianul Pearson, coeficientul de corelaţie se
calculează ca o medie aritmetică simplă a produsului abaterilor celor două variabile faţă
de medie, astfel:

rx , y =
∑( x i − x ) ⋅ ( y i − y)
, unde:
nσ x σ y

xi = caracteristica factorială;
yi = caracteristica rezultativă;
x, y = mediile celor două caracteristici;
σx , σy = abaterea medie pătratică a celor două caracteristici.

108
Dacă în această relaţie înlocuim pe x, y , σx , σy cu expresiile lor dezvoltate şi
efectuăm simplificările posibile, se ajunge la formula:
n ∑x i y i − ∑x i ∑ y i
rx , y = -pt. serii simple
[ n ∑x i2 − (∑x i ) 2 ] ⋅ [ n ∑ y i2 − (∑ y i ) 2 ]

rx , y =
∑n ∑ x y n − ∑ x n ∑ y n
i i i i i i i i
-pt. serii cu frecvenţă
[ ∑n ∑ x n − ( ∑ x n ) ] ⋅ [∑ n ∑ y n − ( ∑ y n
i
2
i i i i
2
i
2
i i i i )2 ]

Valoarea coeficientului de corelaţie este cuprinsă între -1 şi +1. Cele două valori
extreme reprezintă o legătură liniară perfectă între cele două variabile, directă sau
inversă. Valoarea zero semnifică absenţa legăturii.
Raportul de corelaţie (η ) se bazează pe descompunerea dispersiei totale a
variabilei y pe factori de influenţă. Relaţia sa de calcul este:

σ y2
η= , unde:
σ yi2

σy2 = dispersia valorilor reale ale variabilei y;

σyi2 = dispersia valorilor teoretice ale variabilei y.

În cazul unei legături liniare simple, ecuaţia raportului de corelaţie devine:

(∑ y i ) 2
a ∑ y i + b∑ x i y i −
η= n
(∑ y i ) 2

∑y 2
i −
n
În cazul seriilor cu frecvenţe:

(∑ y i n i ) 2
a ∑ y i n i + b∑ x i y i n i −
η=
∑n i

(∑ y i n i ) 2

∑ y i2 n i −
∑n i

Raportul de corelaţie are valori cuprinse între 0 şi 1, cu următoarele semnificaţii:


-η = 1 arată că între variabile există legătură;
-η = 0 între variabile nu există legătură.
Valoarea la pătrat a raportului de corelaţie prezintă raportul de determinaţie:

109
σ y2
η = 2
şi arată ponderea influenţei factorului x asupra variaţiei variabilei y.
σ yi2

Ex. Considerăm următoarele date convenţionale privind legătura dintre costul


mediu al tomatelor şi preţul mediu al acestora:
Costul Preţul
mediu al mediu al y x i = 384 ,58 + 0,75 x i
Anii x i2 xiyi y i2
tomatelor tomatelor
xi yi
1990 12 15 15 144 180 225
1991 32 43 43 1024 1376 1849
1992 117 205 205 13689 23985 42025
1993 423 600 600 178929 253800 360000
1994 789 890 890 622521 702210 792100
1995 1191 1191 1190 1418481 1417290 1416100
1996 3056 3459 3459 9339136 10570704 11964681
1997 4758 3922 3922 22638564 18660876 15382084
1998 4219 3826 3826 17799961 16141894 14638276
1999 3617 3249 3249 13082689 11751633 10556001
2000 3618 3431 3431 13089924 12413358 11771761
2001 7272 6835 6835 52881984 49704120 46717225
10180810
2002
10090 6730 6730 0 67905700 45292900
23287514 18954712 15893522
TOTAL 39194 34395 34395
6 6 7
Să se studieze forma şi intensitatea legăturii dintre cele două variabile.

Pentru determinarea existenţei legăturii dintre cele două variabile se construieşte


graficul următor:

Legătura dintre costurile medii şi preţurile medii la tomate

8000
7000
6000
Preţuri medii

5000
4000
3000
2000
1000
0
0 2000 4000 6000 8000 10000 12000

Costuri medii

Figura 1 Legătura dintre costurile medii şi preţurilor medii ale tomatelor la S.C. Seromgal S.A.
Galaţi

110
Corelograma din figura 1 evidenţiază o legătură directă, liniară între costurile
medii ale tomatelor şi preţurile medii ale acestora. Prin urmare, estimarea preţurilor medii
în funcţie de costurile medii se efectuează cu ajutorul ecuaţiei de regresie liniară:
y xi i = a + bx i

Elementele de calcul necesare pentru determinarea parametrilor ecuaţiei de


regresie sunt sintetizate în tabel. Pentru determinarea parametrilor ecuaţiei de regresie se
rezolvă următorul sistem de ecuaţii:

 n a+ b∑ xi = ∑ yi  1 a3 + 3 9 1b9= 43 4 3 9 5
 ⇔ 
 a∑ xi + b∑ xi = ∑ xi y i  3 9 1a9+ 42 3 2 8 7b5= 1 94 86 5 4 7 1 2 6
2

a = 384,58
b = 0,75
Cu aceste valori ale parametrilor, ecuaţia estimată devine: y x i = 384 ,58 + 0,75 xi
i

. Estimaţia parametrului de regresie b, având o valoare pozitivă, arată că între cele două
variabile analizate există o legătură directă. De asemenea, scoate în evidenţă gradul de
dependenţă dintre variabile, şi anume: la o creştere cu o unitate a costului mediu, preţul
creşte cu 0,75 unităţi.
Alături de stabilirea liniei de regresie este necesar să se măsoare şi intensitatea
legăturii dintre variabile cu ajutorul coeficientului de corelaţie şi al raportului de
corelaţie.
Coeficientul de corelaţie se poate determina prin următoarea relaţie:
n∑ x i y i − ∑ x i ∑ yi
r=
[n ∑ x 2
i
2
][
− ( ∑ x i ) ⋅ n ∑ y i2 − ( ∑ y i )
2
]
13 ⋅ 189547126 − 39194 ⋅ 34395
r= = 0,97
[13 ⋅ 232875146 − ( 39194 ) ] ⋅ [13 ⋅158935227 − ( 34395 ) ]
2 2

Raportul de corelaţie se determină cu ajutorul relaţiei:

111
(∑ y ) 2

a ∑ y i + b∑ x i y i −
i

η= n
(∑ y ) 2

∑y
i
2
i −
n
1
⋅ ( 34395)
2
384,58 ⋅ 34395 + 0,75 ⋅ 189547126 −
η= 13 = 0,97
1
⋅ ( 34395)
2
158935227 −
13
Se constată că cei doi indicatori ai intensităţii sunt egali, rezultând că legătura
dintre variabilele considerate este liniară, directă şi foarte strânsă.

B. Regresie şi corelaţie curbilinie


O mare parte a legăturilor dintre variabilele din domeniul economic se încadrează
în modele de regresie curbilinie de tipul: hiperbolă, parabolă, curbă exponenţială.
a. Regresie şi corelaţie de tip hiperbolic
Legăturile de tip hiperbolic pot fi descrise de ecuaţia:
b
y =a+
xi

Parametrii modelului se estimează pe baza sistemului de ecuaţii:

 1
 n a+ b ∑ x = ∑ yi
 i

a x + b 1 = 1 y
 ∑ i ∑ x2 ∑ x i
 i i

Prin regula lui Cramer obţinem:


1 1 1
∑y ∑ x
i 2
−∑
xi
∑x yi
a= i i
1 1
n ∑ 2 − (∑ ) 2
xi xi

112
1 1
n∑ yi − ∑ ∑ yi
xi xi
b=
1 1
n ∑ 2 − (∑ ) 2
xi xi

Fiind vorba de o legătură curbilinie, intensitatea legăturii se determină numai cu


ajutorul raportului de corelaţie.

σ y2
η=
σ yi2

1 (∑ yi ) 2

a ∑ y i + b∑ y i −
xi n
η=
(∑ y ) 2

∑y
i
2
i −
n
Ex. În scopul cercetării legăturii dintre volumul producţiei (mii lei) şi costul
unitar de producţie (lei), se consideră următoarele date:
1 1 Ec. de regresie:
Prod. Cost 1 yi
xi x i2 xi y i2 436 ,26
xi yi x i2 y x i = 5,48 +
xi
0,06 2,33 122
15 35 225 0,0044 5 34,29
20 25 0,05 400 0,0025 1,25 625 27,29
25 25 0,04 625 0,0016 1 625 22,93
0,025 160 0,0006 0,375
40 15 0 2 225 16,38
0,02 250 0,3
50 15 0 0,0004 225 14,2
0,014 490 0,14
70 10 0 0,0002 100 11,7
0,012 640 0,0001 0,125
80 10 5 0 5 100 10,93
0,221 0,0098 5,52 312
300 135 5 7 5 137
Să se studieze forma şi intensitatea legăturii dintre cele două variabile.
b
- forma legăturii: hiperbola - y = a +
xi

1 1 1
∑y ∑ x
i 2
−∑
xi
∑x yi
135 ⋅ 0,00987 − 0,2215 ⋅ 5,52
a= i i
= = 5,48
1 1 7 ⋅ 0,00987 − 0,2215 2
n∑ 2
− (∑ ) 2
xi xi

113
1 1
n∑ yi − ∑ ∑ yi
xi xi 7 ⋅ 5,52 − 0,2215 ⋅ 135
b= = = 436,26
1 1 2 7 ⋅ 0,00987 − 0,2215 2
n ∑ 2 − (∑ )
xi xi
436 ,26
y = 5,48 +
xi

- intensitatea legăturii – raportul de corelaţie:

1 (∑ yi ) 2
1352
a ∑ y i + b∑ y i − 5,48 ⋅ 135 + 436,26 ⋅ 5,52 −
xi n 7 = 0,72
η= =
(∑ y ) 2
3125−
135 2

∑y
i
2
i − 7
n
η> 0 există legătură între cele două variabile.
b. Regresie şi corelaţie de tip parabolic
Pentru exprimarea acestui model se utilizaeză, de regulă, parabola de gradul doi,
de forma:
y = a+bx+cx2
Parametrii a, b, c se determină prin metoda celor mai mici pătrate, din sistemul:

 n a+ b∑ x i + c∑ x i2 = ∑ y i


 a ∑ x i + b∑ x i + c∑ x i = ∑ x i y i
2 3


 a ∑ x i2 + b∑ x 3i + c∑ x i4 = ∑ x i2 y i

Intensitatea corelaţiei parabolice se măsoară cu ajutorul raportului de corelaţie:

(∑ y ) 2

a ∑ y i + b ∑ x i y i + c∑ x y i − 2 i
i
η= n
(∑ y ) 2

∑y
i
2
i −
n
Ex. Analizându-se o serie de probe de minereu de cupru pentru conţinutul în
arsen şi telur (miimi de procente ), s-au obţinut datele:
Conţ. în Conţ. x i2 xiyi x 3i x i2 y i x i4 y i2 y = −5,83 + 0,73 x − 0,0085 x 2

114
arsen în telur
xi yi
5 3 25 15 125 75 625 9 -2,3925
15 3 225 45 3375 675 50625 9 3,2075
25 4 625 100 15625 2500 390625 16 7,1075
35 6 1225 210 42875 7350 1500625 36 9,3075
45 7 2025 315 91125 14175 4100625 49 9,8075
55 7 3025 385 166375 21175 9150625 49 8,6075
274625 27462, 1785062
65 6,5 4225 422,5 5 5 42,25 5,7075
421875 33750 3164062
75 6 5625 450 5 36 1,1075
1700 1942, 101600 92987, 6468500 246,2
320 42,5 0 5 0 5 0 5 42,46
Să se studieze forma şi intensitatea legăturii dintre cele două variabile.
-forma legăturii: parabola: y = a+bx+cx2

 n a+ b∑ x i + c∑ x i2 = ∑ y i


 a ∑ x i + b∑ x i + c∑ x i = ∑ x i y i
2 3


 a ∑ x i2 + b∑ x 3i + c∑ x i4 = ∑ x i2 y i

 8a + 3 2 b0 + 1 7 0 0c =0 4 2,5

 3 2 a01 7 0 0b +0 1 0 1 6 0c 0= 01 9 4,52 a = -5,83; b = 0,73; c = -0,0085

 1 7 0 0a +0 1 0 1 6 0b0+ 06 4 6 8 5 c0 =0 90 2 9 8,57
b > 0 → legătură directă
-intensitatea legăturii:

115
(∑ y ) 2

a ∑ y i + b ∑ x i y i + c∑ x y i − 2 i
i
η= n =
(∑ y ) 2

∑y
i
2
i −
n
42,5 2
− 5,83 ⋅ 42,5 + 0,73 ⋅ 1942,5 − 0,0085 ⋅ 92987,5 −
= 8 = 0,74
2
42,5
246,25 −
8
→ există legătură strânsă.

c. Regresie şi corelaţie multiplă


Cazul regresiei şi corelaţiei între două variabile este o situaţie particulară. În
practică, variaţia unei variabile y este dependentă de acţiunea complexă a unei
multitudini de factori.
În acest caz este vorba de legături multiple.
Legăturile multiple de corelaţie se stabilesc între două sau mai multe caracteristici
factoriale şi o caracteristică rezultativă. Astfel de legături se întâlnesc şi în cazul
fenomenelor economice complexe.
În cazul legăturilor multiple, variabilele factoriale au influenţe diferite asupra
variabilei rezultative. Factorii cauzali se ierarhizează în ordinea importanţei acţiunii lor
asupra fenomenului efect şi se iau în calcul cei care au o acţiune importantă.
Considerând o vaxriabilă dependentă y şi k variabile independente (x1, x2, ..., xk)
legate între ele printr-o funcţie, atunci în cazul unei legături liniare multiple va avea
forma:
y x1, x 2,..., xk = a 0 + a 1 x 1 + a 2 x 2 + + a i x i + + a k x k , unde:
a0 = parametrul care exprimă influenţa celorlalţi factori consideraţi cu acţiune constantă,
în afară de factorii cauzali luaţi în calcul;
ai = coeficienţi de regresie multiplă care arată cu cât variază variabila rezultativă, atunci
când variabila factorială xi se modifică cu o unitate.

116
Parametrii a1, a2, ..., ak se determină cu ajutorul metodei celor mai mici pătrate,
punând condiţia impusă de aceasta.
Măsurarea intensităţii corelaţiei multiple se poate efectua cu ajutorul raportului de
corelaţie multiplă, în cazul unei regresii neliniare sau cu ajutorul coeficientului de
corelaţie multiplă şi a raportului de corelaţie multiplă, în cazul unei regresii multiple
liniare.
Raportul de corelaţie multiplă are forma:

σ y2
ηy x1, x 2,..., xk = x 1, x 2 ,... xk
.
σ y2

7.4 Corelaţia neparametrică


Coeficienţii corelaţiei neparametrice se determină independent de forma legăturii.
Ei se stabilesc fie în funcţie de abaterile individuale ale variabilelor corelate faţă de media
lor, fie în funcţie de rangurile perechilor de valori ale variabilelor corelate.
Pentru aceasta, unităţile statistice se ordonează în sens crescător sau descrescător
a valorii variabilei factoriale şi apoi se atribuie câte un rang fiecărei variante. Deoarece
nu operează direct cu nivelurile caracteristicilor, aceste metode sunt aplicabile şi în cazul
corelaţiei dintre caracteristici calitative.
În cadrul metodelor neparametrice de studiere a corelaţiei, cele mai cunoscute
sunt:
1. coeficientul de concordanţă Fechner,
2. coeficienţii de corelaţie a rangurilor,
3. coeficientul de asociere.
.1 Coeficientul de concordanţă Fechner
Statisticianul german G. Fechner a stabilit la sfârşitul secolului 19 un indicator al
intensităţii corelaţiei calculat pe baza concordanţelor şi discordanţelor diferenţelor dintre
termenii consecutivi ai fiecărei dintre cele două variabile corelate sau cu ajutorul
concordanţelor şi respectiv discordanţelor abaterilor calculate faţă de mediile variabilelor
corelate. Se calculează sub două forme:
-coeficient simplu

117
-coeficient ponderat.
Coeficientul de concordanţă simplu – se defineşte prin relaţia:
c −d
k= , unde:
n
c = număr de concordanţe de semn ale abaterilor;
d = număr de disconcordanţe de semn ale abaterilor.
∆x i = x i − x sau ∆x i = x i − x i −1

∆y i = y i − y sau ∆y i = y i − y i −1

n = numărul perechilor de valori corelate.


Dacă unele diferenţe ∆x i sau ∆y i sunt nule, atunci nu se consideră nici
concordanţă, nici discordanţă, ci este exclusă din calcul.
Coeficientul de concordanţă ponderat – se determină prin relaţia:
C −D
k= , unde:
C +D
C = suma produselor ∆x i ∆y i pozitive,
D = valoarea absolută a sumei produselor ∆x i ∆y i negative.
O altă variantă a coeficientului ponderat de concordanţă Fechner se apropie de
coeficientul de corelaţie Pearson şi se determină astfel:

k=
∑ ∆x i ⋅ ∆y i

∑(∆x ) ⋅ ∑ (∆y )
i
2
i
2

Coeficientul Fechner poate varia între -1 şi +1, cu semnificaţia unei legături


directe sau inverse mai mult sau mai puţin intense.
Ex. Gruparea a 10 judeţe după nr. cinematografelor şi nr. spectatorilor:
Nr.
Nr. x =10 y =260
Jud spect
cinematogr. c,d ∆x i ⋅ ∆y i (∆x i ) 2 (∆y i ) 2
xi
. ∆x i = x i − x ∆y i = y i − y
yi
1 4 103 -6 -157 c 947 36 24649
2 16 345 6 86 c 516 36 7396
3 4 64 -6 -196 c 1176 36 38416
4 13 634 3 374 c 1122 9 139876
5 9 312 -1 52 d -52 1 2704
6 6 97 -4 -163 c 652 16 26559
7 14 322 4 62 c 248 16 3844
8 13 223 3 -37 d -111 9 1369
9 12 126 2 -134 d -268 4 17956
10 14 379 4 119 c 476 16 14161

118
Tota c=7 C=5137
105 2605 179 276930
l d=3 D=431
Să se stabilească intensitatea legăturii dintre cele două variabile cu ajutorul coef.
de concordanţă Fechner.
- Coeficientul simplu de concordanţă :
c −d 7 −3
k= = = 0,4 legătură directă slabă
n 10

x=
∑x i
=
105
≈ 10 y=
∑y i
=
2605
≈ 260
n 10 n 10
- Coeficientul de concordanţă ponderat:
C − D 5137 − 431
k= = = 0,84 legătură directă strânsă
C + D 5137 + 431
- Coeficientul pearsonian:

k=
∑ ∆x i ⋅ ∆y i
=
5137 − 431
= 0,66 legătură directă slabă.
∑ (∆x ) ⋅ ∑ (∆y )
i
2
i
2
179 ⋅ 276930

.2 Coeficienţii de corelaţie a rangurilor


Rangul este o anumită treaptă de ordine a variantelor variabilei într-o serie. Pentru
stabilirea rangurilor, valorile empirice ale variabilelor corelate sunt grupate după
mărimea lor în ordine crescătoare sau descrescătoare. De obicei, în funcţie de variabila
independentă se ordonează şi variabila dependentă.
Coeficienţii de corelaţie a rangurilor sunt:
a. coeficientul Spearman;
b. coeficientul Kendall
a. Coeficientul Spearman este o extensie a coeficientului de corelaţie Pearson, în care
valorile empirice ale variabilelor corelate sunt înlocuite cu rangurile lor corespunzătoare.
Coef. Spearman derivă din coeficientul de corelaţie clasic şi se calculează după relaţia:
6∑ d 2
θ =1− , unde:
n3 − n
d = diferenţele dintre rangurile celor două variabile;
n = nr. perechilor de valori xi, yi.
Pentru aplicarea acestui coeficient se procedează astfel:

119
-se atribuie ranguri variabilelor xi şi yi, de la numărul 1 a celei mai mari valori, în
continuare;
-se calculează diferenţele- d- dintre rangurile variabilei xi şi yi;
-se calculează şirul d2 şi se însumează;
-se aplică formula.
Coef. de corelaţie Spearman are valori cuprinse între -1 şi +1.
b. Coeficientul Kendall se defineşte prin relaţia:
S
τ= , unde:
0,5n (n −1)

S = P −Q P = ∑p i Q = ∑q i .

pi = nr. rangurilor superioare ale variabilei yi ordonate după xi, care există după fiecare
rang;
qi = nr. rangurilor inferioare ale variabilei yi ordonate după xi, care există după fiecare
rang;
n = nr. unităţilor observate.
Acest coef. poate lua valori cuprinse între -1 şi +1, cu aceleaşi semnificaţii.
Ex. Legătura dintre producţia şi consumul de energie primară (în kg echivalent
cărbune), pe ţări, se prezintă astfel:
Ţara Prod Cons Rang d d2 Ordonare rang pi qi
xi yi x y x y
Africa de Sud 3597 2726 5 7 -2 4 1 2 8 1
Algeria 5552 1583 4 8 -4 1 2 3 7 1
Arabia Saudită 3694 5769 2 3 -1 6 3 1 7 0
Bahrein 1 1705 3 1 2 1 4 8 2 4
Brazilia 2155 8 1 1 0 4 5 7 2 3
Bulgaria 7 850 0 0 3 0 6 4 4 0
China 575 3257 8 5 0 9 7 6 2 1
Germania 1553 920 9 9 2 0 8 5 2 0
Norvegia 945 5475 6 4 -1 4 9 9 1 0
România 2465 7441 1 2 1 1 10 10 0 0
5586 2890 7 6 1
6
2160
Total 4 3 10
0 5
Să se stabilească intensitatea legăturii dintre cele două variabile cu ajutorul coef.
de corelaţie a rangurilor.
6∑ d 2 6 ⋅ 40
-coef. Spearman: θ =1− =1− = 0,75 legătură directă strânsă
n −n3
10 3 − 10

120
S 35 −10
-coef. Kendall: τ= = = 0,55 legătură directă
0,5n ( n −1) 0,5 ⋅10 ⋅ (10 −1)

S = P − Q = 35 −10 P = ∑p i = 35 Q = ∑q i = 10 .

.3 Coeficientul de asociere
Se notează cu Q şi a fost propus de Yule. Se foloseşte pentru stabilirea corelaţiei
între caracteristici alternative, reprezentând o măsură a gradului de asociere.
Determinarea coef. de asociere se bazează pe tabelul de asociere de forma:

x y y1 (da) y2 (nu) nx
x1 (da) a b a+b
x2 (nu) c d c+d
ny a+c b+d
Coef. de asociere este definit de formula:
ad − bc
Q=
ad + bc
Valoarea coef. de asociere are ca interval de variaţie (-1;+1) şi se interpretează ca
oricare coef. de corelaţie.
Ex. Să se stabilească legătura dintre distribuţia populaţiei unui judeţ pe medii
şi pe sexe, cu ajutorul coef. de asociere:

Mediul Sexul Masculin Feminin Total


Urban 400.000 450.000 850.000
Rural 300.000 380.000 680.000
Total 700.000 830.000 1.530.000
ad − bc 400 .000 ⋅ 380 .000 − 450 .000 ⋅ 300 .000
Q= = = 0,059
ad + bc 400 .000 ⋅ 380 .000 + 450 .000 ⋅ 300 .000
Între distribuţia pe sexe şi distribuţia pe medii există o legătură directă slabă.

121

S-ar putea să vă placă și