Sunteți pe pagina 1din 111

MINISTERUL EDUCAŢIEI CERCETĂRII TINERETULUI ŞI SPORTULUI

Str. N. Iorga nr. 1, Tîrgu Mureş - 540088, ROMÂNIA

©Universitatea “Petru Maior” din Tîrgu Mureş 2010

Reproducerea conţinutului acestei publicaţii, integrală sau parţială, în forma originală sau
modificată, precum şi stocarea într-un sistem de regăsire sau transmitere sub orice formă şi prin
orice mijloace sunt interzise fără autorizarea scrisă a autorului şi a Universităţii „Petru Maior” din
Tîrgu Mureş.
Utilizarea conţinutului acestei publicaţii, cu titlu explicativ sau justificativ, în articole, studii, cărţi
este autorizată numai cu indicarea clară şi precisă a sursei.
CUPRINS

Capitolul I.
Statistica şi cunoaşterea realităţii social-economice 5
I.1. Scurt istoric al dezvoltării statisticii 5
I.1.1. Organizarea statisticii în România 8
I.2. Obiectul de studiu şi metoda statisticii. 9
I.3. Concepte de bază utilizate în statistică 10
I.4. Cercetarea statistică 13
I.5. Observarea statistică. Controlul datelor statistice 14

Capitolul II.
Sistematizarea şi prezentarea datelor statistice 21
II.1. Sistematizarea datelor prin centralizare şi grupare 21
II.2. Serii statistice 28
II.3. Vizualizarea datelor statistice cu ajutorul tabelelor şi a 30
reprezentărilor grafice
II.4. Indicatori statistici rezultaţi din prelucrarea primară a 36
datelor

Capitolul III.
Analiza statistică a seriilor de distribuţie cu frecvenţe 45
III.1. Necesitatea analizei seriilor de distribuţie cu 45
frecvenţe
III.2. Indicatorii de frecvenţe 47
III.3. Indicatorii tendinţei centrale 48
III.3.1. Mediile 48
III.3.1.1 Media aritmetică 49
III.3.1.2. Proprietăţile mediei aritmetice 51

3
III.3.1.3. Media armonică 56
III.3.1.4. Media pătratică 57
III.3.1.5. Media geometrică 58
III.3.1.6. Media cronologică 59
III.3.2. Indicatorii medii de poziţie 60
III.4. Indicatorii variaţiei 65
III.4.1. Proprietăţile dispersiei 70
III.5. Analiza asimetriei repartiţiilor empirice 74

Capitolul IV.
Indicatori şi metode statistice de analiză a legăturilor 78
dintre fenomenele economico-sociale
IV.1. Prezentarea şi clasificarea legăturilor dintre 78
caracteristicile social-economice
IV.2. Identificarea legăturilor. Exprimarea formei 81
legăturilor.
IV.3. Metoda regresiei 85
IV.3.1. Modelul regresiei simple 85
IV.3.1.1. Modelul liniar 85
IV.3.1.2. Regresia simplă neliniară 88
IV.3.2. Modelul regresiei multiple 90
IV.4. Măsurarea intensităţii legăturilor. Metoda corelaţiei 91

Capitolul V.
Sondajul statistic 98
V.1. Concepte de bază 98
V.2. Tipuri de sondaje şi procedee de alcătuire a 99
eşantioanelor
V.3. Estimarea mediei şi dispersiei. Eroarea medie de
reprezentativitate 101
V.4. Precizia estimaţiei. Eroarea limită 105
V.5. Determinarea volumului eşantionului 106
Bibliografie 110

4
CAPITOLUL I

STATISTICA ŞI CUNOAŞTEREA REALITĂŢII


SOCIAL – ECONOMICE

I.1. Scurt istoric al dezvoltării statisticii

Statistica s-a dezvoltat într-un proces istoric îndelungat,


parcurgând traseul de la practică la teorie şi a cunoscut mai multe
etape, dintre care cele mai importante sunt:
1). Statistica practică
2). Statistica descriptivă
3). Aritmetica politică
4).Statistica probabilistică sau calculul
probabilităţilor
5). Statistica modernă.

1). Statistica practică datează de peste 4000 ani şi cuprinde


primele forme de evidenţă, servind nevoilor practice ale cunoaşterii şi
conducerii vieţii social-economice. Statistica în antichitate a fost
utilizată pentru descrierea statelor din punct de vedere geografic,
economic, politic, cum ar fi:
- inventarierea aurului, pământului şi animalelor în China ,Egipt,
Grecia;
- înregistrări primitive ale populaţiei în statele sclavagiste: Egipt,
Babilon, Asiria, Sumer;
- înregistrări periodice cunoscute sub denumirea de “census” ale
numărului populaţiei într-o formă mai avansată, evidenţa
impozitelor şi întocmirea registrelor fiscale, cadastrale în Imperiul
Roman (600 –550 î.e.n);
- evidenţa pământului prin serviciul numit “tabularium” în Dacia
ocupată de romani.

5
În Evul Mediu dezvoltarea cunoaşterii statistice a vieţii
sociale, economice şi politice ia un avânt deosebit, mai ales ca urmare
a creşterii schimburilor economice dintre state, care necesită
informaţii cât mai complete despre partenerii comerciali efectivi şi
potenţiali.
Evidenţele din această perioadă au avut un caracter
demografic (ţinute de preoţi despre căsătorii, naşteri, decese), contabil
(inventarierea de bunuri ale feudelor, mănăstirilor) şi statistic (din
iniţiativa statului privind descrierea patrimoniilor, veniturilor,
pământului).
2). Statistica descriptivă reprezintă cea mai veche rădăcină
teoretică a statisticii care apare odată cu practica statistică în cadrul
universităţilor, în secolele XVI – XVIII, când descrierea cantitativă,
numerică, a statelor privind populaţia, armata, bogăţiile solului,
activitatea productivă şi comercială desfăşurată s-a amplificat,
atingând perfecţiunea.
Reprezentanţi ai acestei perioade sunt Francesco Sansovino
(1521 –1583) şi Giovani Botero (1533- 1517) care în lucrările lor au
luat în considerare la descrierea statelor: bogăţiile, populaţia,
comerţul, finanţele.
O contribuţia remarcabilă la dezvoltarea statisticii descriptive
aduce Dimitrie Cantemir (1673- 1723) prin lucrarea “Descrierea
Moldovei”, care poate fi considerată o monografie cu caracter
geografic, economic, politic, social şi cultural.
Statistica descriptivă s-a numit şi statistică universitară,
întrucât teoreticienii săi de bază erau profesori universitari dintre care
amintim:
- olandezul Hermann Conring (1606-1681), fondatorul şcolii
descriptive germane, de la Universitatea Helmstedt, care ţinea cursuri
universitare despre ştiinţa descriptivă a statului
-germanul Gottfried Achenwall (1719-1772) de la
Universitatea din Gottingen, care defineşte statistica1 drept “ştiinţa
derscriptivă folosită pentru prezentarea particularităţilor unui stat” şi
este cel care dă numele acestei discipline de “statistică” pornind de la

1
G. Anchenwall a promovat denumirea acestei discipline de “statistică”, pe
care a preluat-o de la profesorul său Martin Schmeitzel (1679-1747) de la
universitatea din Halle.

6
cuvântul de origine latină “status” care înseamnă stare şi de la
cuvântul italienesc “stato” care înseamnă stat.
Cu toate că școala germană a ridicat statistica la rang de
ştiinţă, ea încă nu avea drept scop esenţial descoperirea, cunoaşterea
legităţilor statistice, a legăturilor cauzale dintre fenomene.
3). Aritmetica politică s-a dezvoltat în Anglia în parale cu
şcoala descriptivă germană. Statistica apărută în Anglia este deosebită
şi reprezintă un nou mod de cercetare, specific ştiinţelor naturii, fizicii,
chimiei orientat spre descoperirea legilor care guvernează fenomenele
economico-sociale şi a legităţilor ce se manifestă în cadrul lor, care
permit formularea de concluzii şi chiar previziuni, depăşind faza de
descriere prin folosirea datelor şi procedeelor bazate pe experimente.
Denumirea acestui curent vine de la lucrarea lui William Petty (1623-
1687), “Aritmetica politică”, sugerând semnificaţia statisticii de
analiză a datelor de observaţie prin metode matematice. Alături de
William Petty, alţi reprezentanţi de seamă au fost John Graunt (1620-
1674), Edmund Halley (1656-1742). Ei au pus accentul pe studiul
fenomenelor demografice şi îşi fundamentează concluziile pe un
număr mare de cazuri individuale cu care, prin generalizare, se pot
interpreta tendinţele de producere a fenomenelor.
4). Statistica probabilistă sau a calculului probabilităţilor
corespunde secolului al XVIII-lea, odată cu creşterea rolului
metodelor netematico-statistice în cunoaşterea fenomenelor şi cu
apariţia calculului probabilităţilor. Jacob Bernoulli (1654-1705) a
formulat faimoasa “lege a numerelor mari” şi atrage atenţia asupra
posibilităţii utilizării calculului probabilităţilor în economie.
Dintre reprezentanţii importanţi ai acestei etape fac parte:
Pierre-Simon Laplace (1749-1829), Karl Friedrich Gauss (1777-1855)
care definesc legea normală de repartiţie, Simeon Denis Poisson
(1781-1840) care a stabilit ecuaţia cu derivate parţiale, Adolf
Quetelet 2 (1796-1874) a folosit în lucrările sale din domeniul
demografiei şi criminalităţii, calculul probabilităţii şi legea numerelor
mari.

2
Adolf Quetelet- statistician, matematician şi astronom belgian, fondator al
statisticii moderne, a organizat împreună cu demograful englez William Farr,
primul Congres Internaţional de statistică la Bruxelles, în anul 1853.

7
5). Statistica modernă corespunde apariţiei în secolul al
XIX-lea a birourilor sau oficiilor de statistică pe plan naţional şi
internaţional, odată cu organizarea congreselor internaţionale de
statistică şi cu apariţia revistelor de specialitate. S-au formulat
principiile teoriei selecţiei şi a extinderii rezultatelor acestora asupra
întregului, s-a fundamentat teoria corelaţiei statistice şi a analizei
factoriale.
La sfârşitul secolului al XIX-lea şi începutul secolului XX,
prin contribuţiile teoretice şi metodologice ale lui Karl Pearson (1857-
1936), Ronald Fisher (1890-1962), Francis Galton (1822-1911),
statistica face progrese remarcabile şi îşi cucereşte statutul actual de
disciplină ştiinţifică şi metodă de cercetare utilizată în multe
discipline.

I.1.1.Organizarea statisticii în România

Atât în plan teoretic cât şi instituţional, statistica românească s-a


încadrat în ansamblul curentelor statistice ale timpului.
În 1859 au luat fiinţă primele organisme de statistică din
Principatele Unite;
- la Bucureşti, Biroul de Statistică al Ţării Româneşti, sub
conducerea lui Dionisie Pop Marţian (1829-1865);
- la Iaşi, Direcţia de Statistică din Moldova, sub conducerea lui Ion
Ionescu de la Brad (1818 – 1891).
Sub conducerea lui D.P.Marţian apare în 1860 prima publicaţie
românească de statistică: revista “Anale statistice”.
În anul 1862 cele două organe de statistică se unesc şi formează
Oficiul Statistic al Principatelor Unite.
Statistica a figurat şi ca disciplină universitară la Facultatea
Juridică de la Academia Mihăileană din Iaşi susţinută de Alexandru
Papiu Ilarian.
Alţi reprezentanţi marcanţi ai statisticii româneşti au fost Octav
Onicescu (1892 – 1983), întemeietorul şcolii româneşti de teoria
probabilităţilor şi academicianul Gheorghe Mihoc (1906 – 1981).
În prezent, organul central al statisticii este Institutul Naţional de
Statistică şi Studii Economice (INSSE), organizaţie publică,
independentă, guvernamentală, care are drept scop producerea şi
difuzarea datelor statistice oficiale. Statistica oficială în România are

8
drept bază juridică Ordonanţa Guvernamentală 9/1992 şi Legea
nr.11/1994.
INSSE este organizat pe domenii de activitate şi în teritoriu, în
direcţii judeţene de statistică.
Rezultatele activităţii INSSE se regăsesc în Anuarul Statistic al
României, Anuarul Demografic, Buletin de Informare, Revista de
Statistică.
În vederea aderării la Uniunea Europeană, ţările candidate trebuie
să adopte modelul şi standardele statistice ale acesteia, astfel încât să
se folosească de către toate ţările membre şi asociate, măsurători
comparabile şi compatibile.

I.2. Obiectul de studiu şi metoda statisticii

Semnificaţiile actuale ale termenului “statistică” sunt:


1). Date numerice – cu privire la unul sau mai multe fenomene din
natură sau societate, culese, sistematizate şi uneori publicate în anuare,
culegeri, reviste;
2). Activitatea de culegere, prelucrare şi valorificare a informaţiilor
statistice, organizată de stat sau de către cercetători;
3). Totalitatea metodelor, procedeelor, tehnicilor statistice;
4). Ştiinţă de sine stătătoare.
Statistica este ştiinţa care studiază fenomene şi procese din
natură şi societate, relaţiile dintre fenomenele economice şi sociale,
laturile cantitative ale fenomenelor în dependenţă de cele calitative.
Statistica se ocupă de acele fenomene şi procese care se
produc într-un număr mare de cazuri individuale şi care pot fi
denumite fenomene de masă, de tip colectiv.
În societate, fenomenele pot fi: simple şi de masă.
Fenomenele simple apar ca rezultat al unei singure cauze şi
sunt considerate fenomene tipice, deterministe, adică are loc cauza se
produce şi efectul, dacă rămân neschimbate condiţiile.
Fenomenele de masă apar ca rezultat al mai multor cauze cu
grade diferite de influenţă şi ele sunt considerate atipice deoarece
forma lor de manifestare individuală este foarte diferită. Fenomenele
de masă sunt nedeterministe, stohastice, adică se produc întâmplător,
sunt legate de hazard, putând fi studiate prin teoria probabilităţilor şi
sub incidenţa legii numerelor mari. Potrivit legii numerelor mari,

9
variaţiile întâmplătoare de la tendinţa generală se compensează
reciproc dacă există un număr suficient de mare de cazuri individuale
luate în studiu.
Obiectul de cercetare al statisticii îl reprezintă studiul
cantitativ al fenomenelor economico-sociale de masă în scopul
cunoaşterii şi exprimării legităţilor manifestate la nivelul întregului
ansamblu.
Statistica utilizează metode şi modele matematice, dar
elaborează şi o serie de metode specifice. Totalitatea operaţiilor,
tehnicilor şi procedeelor de investigare a fenomenelor de masă cu care
operează statistica, formează metodologia ei. Statistica se preocupă de
elaborarea şi perfecţionarea unei metodologii ştiinţifice
corespunzătoare schimbărilor continue ce au loc în societate, a
proceselor informaticii şi a tehnicii de calcul.

I.3. Concepte de bază utilizate în statistică

Noţiunile de bază cu care operează statistica sunt:


1). Colectivitatea (populaţia) statistică;
2). Unitatea statistică;
3). Caracteristica statistică;
4). Date statistice;
5). Indicatorul statistic.
1). Colectivitatea statistică, denumită şi populaţie, reprezintă
totalitatea elementelor individuale de aceeaşi natură, cu trăsături
esenţiale comune, generate de aceleaşi cauze şi care sunt supuse
cercetării statistice. Colectivitatea statistică are un caracter obiectiv,
existând independent de voinţa cercetătorului şi finit, fiind un
ansamblu măsurabil cu un număr determinat de elemente.
Exemplu: Totalitatea studenţilor dintr-o grupă; totalitatea
băncilor comerciale din cadrul unui judeţ, personalul din cadrul
societăţii comerciale etc.
Colectivităţile statistice pot fi: statice şi dinamice.
Colectivităţile statice (de stoc) exprimă o stare şi au o anumită
întindere în spaţiu, formând un existent la un moment dat. Aceste
colectivităţi se caracterizează prin esenţa lor materială, concretă şi prin

10
faptul că volumul lor poate fi determinat prin măsurare sau numărare
la un moment dat.
Colectivităţile dinamice (de flux) exprimă un proces, o
devenire în timp, evoluţia lor desfăşurându-se pe o scară a timpului,
într-un anumit interval de timp. Ele reprezintă manifestări ale
colectivităţilor de fiinţe sau de lucruri şi se caracterizează prin esenţa
lor nematerială, faptică şi prin aceea că, volumul lor nu poate fi
determinat prin măsurare sau numărare la un moment dat, ci prin
înregistrarea curentă, continuă a evenimentelor ce se produc într-un
interval de timp şi într-un spaţiu determinat.
În cazul colectivităţilor statice timpul este constant, iar în cazul celor
dinamice spaţiul şi forma de manifestare sunt constante.

2). Unităţile statistice reprezintă elementele individuale ale


colectivităţii. Unităţile statistice au trăsături variabile în timp şi spaţiu,
ele sunt unităţi independente şi obiective ce pot fi studiate separat, pe
subcolectivităţi sau pe întreaga colectivitate.
Totalitatea unităţilor statistice care alcătuiesc o colectivitate
determină volumul colectivităţii.
În funcţie de scopul cercetării statistice, unităţile unei colectivităţi
pot fi:
- simple: sunt elemente constitutive ale colectivităţii şi reflectă
însăşi modul de existenţă al colectivităţii, fiind elemente indivizibile.
Exemplu: studentul dintr-o grupă, muncitorul din societatea comercială etc.
- complexe: ţin de forma de organizare economică şi socială a
colectivităţii şi pot fi împărţite în mai multe unităţi statistice simple.
Exemplu: unitatea bancară: poate fi divizată în sucursale, departamente,
locuri de muncă.

3). Caracteristica statistică ( variabila): reprezintă criteriul pe


baza căruia se caracterizează unităţile colectivităţii.
De exemplu: cifra de afaceri, număr de clienţi, note obţinute în sesiune, etc.
Caracteristica reprezintă însuşirea, trăsătura comună tuturor
unităţilor statistice ce compun o colectivitate şi care are proprietatea
de a înregistra variante sau valori diferite de la o unitate statistică la
alta.

11
I. După conţinutul lor, pot fi:
- caracteristici de timp: arată momentul sau perioada în care au
existat unităţile statistice;
De exemplu: data naşterii-pentru studenţi, anul înfiinţării pentru o societate
bancară;
- caracteristici de spaţiu: desemnează un teritoriu, un loc, un
spaţiu unde există unităţile statistice;
De exemplu: liceul absolvit, sediul băncii, secţia, atelierul etc.
- atributive cantitative (numerice), exprimate cu ajutorul cifrelor, a
numerelor
Exemple: numărul de credite acumulat în sesiune, număr de clienţi,
număr de angajaţi, cifra de afaceri, etc.
- atributive calitative, exprimate cu ajutorul cuvintelor, literal,
altele decât cele de spaţiu sau de timp.
Exemple: regimul de studii (bugetar sau cu taxă), profilul liceului
absolvit, specializarea universitară, tipuri de credite acordate, natura
capitalului social, etc.
II. După natura variaţiei, caracteristicile atributive cantitative pot
fi:
- cu variaţie continuă dacă valorile posibile sunt în număr infinit
sau sunt cunoscute ca făcând parte dinainte dintr-un şir de valori
posibile;
- discrete, cu variaţie discontinuă, dacă valorile sau variantele ei
posibile sunt valori izolate pe un anumit interval.
III. După numărul formelor de manifestare există următoarele
tipuri de caracteristici:
- caracteristici alternative, care pot avea doar două forme de
manifestare. Exemplu: genul – feminin sau masculin, mediul de
provenienţă – urban sau rural, starea civilă – căsătorit, necăsătorit .
- caracteristici nealternative, ce au o formă sau mai mult de două
forme de manifestare. De exemplu: natura capitalului social: public,
privat, mixt.
Formele concrete de manifestare ale caracteristicilor
corespunzătoare fiecărei unităţi statistice se numesc variante sau
valori.
Numărul de unităţi la care se înregistrează aceeaşi valoare sau
variantă poartă denumirea de frecvenţă sau pondere.

12
4). Datele statistice sunt caracterizări numerice ale unităţilor,
grupelor şi colectivităţilor obţinute prin observare şi prelucrare.
Mesajul datelor statistice îl reprezintă informaţia numerică.

5). Indicatorul statistic: reprezintă expresia numerică cu un conţinut


real concret şi o formă specifică de exprimare.
Un indicator statistic este alcătuit din trei părţi:
- expresia numerică;
- partea noţională ce explică conţinutul expresiei numerice;
- partea ce precizează timpul şi spaţiul pentru care este
valabilă expresia numerică.
Datele şi indicatorii nu se deosebesc întotdeauna. Indicatorii de
regulă se constituie din anumite date primare pe baza unor calcule.

I.4. Cercetarea statistică

Activitatea statistică depusă în cadrul unor organisme de


specialitate create în acest scop, se desfăşoară prin realizarea unui
număr mare de operaţii strict corelate, temeinic organizate, riguros
programate.
Cercetarea statistică cuprinde totalitatea operaţiilor de culegere şi
înregistrare sistematizare şi prelucrare, analiză şi interpretare a
informaţiilor necesare pentru cunoaşterea şi conducerea proceselor
economico-sociale de masă.
Cercetarea statistică trebuie privită ca un proces de cunoaştere ce
presupune parcurgerea în succesiune logică a trei etape principale:
1). Observarea statistică;
2). Prelucrarea statistică;
3). Analiza şi interpretarea statistică.
Aceste etape pot fi separate în timp şi, de regulă, se efectuează în
locuri diferite şi cu personal de diferite specialităţi. Deosebit de
importantă este asigurarea autenticităţii datelor statistice în toate
etapele cercetării.
Realizarea fiecărei etape impune o bună cunoaştere a fenomenelor
şi proceselor investigate, a modului de organizare a colectivităţii
supuse cercetării, a posibilităţilor concrete de folosire a surselor de
informaţii.

13
Schematic cele trei etape ale cercetării statistice şi operaţiile specifice
fiecăreia dintre ele pot fi prezentate ca în figura nr.1.1:

OBSERVAREA -culegerea şi înregistrarea


STATISTICĂ datelor individuale
-verificarea datelor primar

- sistematizarea datelor
individuale prin centralizare
şi grupare
PRELUCRAREA -calcularea sistemului de
STATISTICĂ indicatori statistici
-prezentarea rezultatelor
prelucrării sub formă de
tabele, grafice , serii

ANALIZA ŞI -confruntarea şi compararea


INTERPRETAREA rezultatelor prelucrării
STATISTICĂ -verificarea ipotezelor
-formularea
concluziilor finale
-fundamentarea calculelor
de prognoză

Fig. 1.1. Etapele şi operaţiile cercetării statistice

I.5. Observarea statistică. Controlul datelor statistice

Observarea statistică este prima etapă a cercetării statistice şi


constă în culegerea şi înregistrarea, pe baza unor criterii unitare, a
datelor individuale privind mărimea, valoarea, formele de manifestare
ale caracteristicilor pentru toate unităţile statistice ce alcătuiesc
colectivitatea supusă cercetării.
Observarea statistică trebuie să se realizeze pe baza unui plan,
riguros fundamentat din punct de vedere ştiinţific, plan ce vizează
două categorii de probleme:

14
- organizatorice;
- metodologice.
Problemele organizatorice se referă la:
- elaborarea şi tipizarea documentelor de înregistrare
(centralizatoare, chestionare, formulare) şi a instrucţiunilor;
- sectorizarea teritoriului;
- recrutarea şi instruirea personalului care va executa
observarea;
- popularizarea observării (dacă este cazul), prin mass-media,
despre scopul şi natura observării, în vederea obţinerii unor date
autentice.
Problemele metodologice se referă la:
a) stabilirea obiectului de investigaţie, prin delimitarea colectivităţii
supuse cercetării;
b) alegerea unităţii de observare, a elementului individual al
colectivităţii supuse cercetării, de la care se culeg datele statistice
individuale. În funcţie de scopul observării se va stabili tipul
unităţii statistice: simple sau complexe;
c) precizarea caracteristicilor utile cercetării, identificându-le
denumirea şi variantele formelor de manifestare. Ele se
formulează sub formă de întrebări clare, explicite.
d) timpul observării ce trebuie privit din două puncte de vedere:
timpul la care se referă datele înregistrate şi timpul în care se
înregistrează datele.
Timpul la care se referă datele poate fi un interval sau un moment.
În cazul anumitor fenomene, datele se pot referi la o perioadă de timp:
lună, trimestru, an, iar în alte cazuri se referă la un moment dat, numit
moment de referinţă sau moment critic. De exemplu, la recensământul
populaţiei României, organizat în luna martie 2002, ora 0 din data de
18 spre 19 martie, reprezintă momentul critic la care se referă toate
datele înregistrate.
Timpul în care se efectuează înregistrarea este întotdeauna o
perioadă mai mare de timp şi logic este ulterior producerii
fenomenului studiat.
e) locul observării coincide, de regulă, cu locul producerii
fenomenelor, însă diferă atunci când observarea se realizează prin
prelucrarea datelor din diferite surse de informaţii deja existente
(anuare, reviste, publicaţii, etc.)

15
f) purtătorii de informaţii, respectiv documentele de înregistrare pot
fi formulare statistice, benzi magnetice, dischete, CD-uri.
Formele tradiţionale de documente sunt fişele şi listele.
Fişele sunt formulare individuale, completate pentru o singură
unitate statistică şi se utilizează atunci când unităţile supuse cercetării
sunt dispersate în spaţiu.
Listele sunt formulare colective, completate pentru mai multe
unităţi statistice şi se utilizează atunci când unităţile statistice sunt
concentrate în spaţiu.
Formularele de observare sunt însoţite de norme metodologice şi
tehnice privind completarea lor.

Clasificarea observării statistice se poate realiza în funcţie de


următoarele criterii:
- după numărul de unităţi statistice;
- după perioada de timp la care se organizează;
- după modul de organizare.

I. Din punct de vedere al gradului de cuprindere a colectivităţii


studiate, observările statistice se clasifică în:
- observări statistice totale sau exhaustive: înseamnă consemnarea
într-o formă unitară a tuturor unităţilor statistice ale colectivităţii
studiate
- observări statistice parţiale: se efectuează asupra unei părţi a
colectivităţii.

II. Din punct de vedere al timpului de înregistrare, se disting


următoarele tipuri de observări statistice:
- observări statistice curente: ce se efectuează cu caracter
continuu, sistematic şi operativ asupra faptelor şi fenomenelor, în
timpul, la locul şi pe măsura apariţiei lor (Raportările statistice).
- observări statistice periodice: se fac la anumite intervale de timp,
dinainte stabilite, egale sau neegale. (recensământ, ancheta, sondaj)
- observări statistice unice (ocazionale): se utilizează în cadrul
unor colectivităţi de fapte şi evenimente discontinue, neobişnuite.

16
III. În funcţie de modul de organizare, se identifică următoarele
categorii de observări statistice:
1).Raportările statistice;
2).Recensământul;
3).Sondajul;
4).Ancheta;
5).Monografia.

1).Raportările statistice sunt documente tipizate oficiale, prin care


fiecare unitate economică sau instituţie publică este obligată să
raporteze periodic forurilor în drept, rezultatele obţinute în urma
desfăşurării unei activităţi. Raportul statistic se caracterizează prin
obligativitatea întocmirii, prin metodologia unitară de calcul a
indicatorilor raportaţi şi prin elemente comune, cuprinse în fiecare
formular tipizat, şi anume: elemente de formă (de identificare) şi
elemente de fond (de conţinut).
Sistemul raportărilor statistice reprezintă o observare totală, cu o
periodicitate bine precizată şi cu responsabilităţile stipulate prin lege
în privinţa autenticităţii informaţiilor furnizate.
Fiecare agent economic sau instituţie completează mai multe tipuri
de rapoarte statistice, ce privesc anumite laturi ale activităţii sale.

2).Recensământul este o observare totală, de mare amploare,


periodică, ce reprezintă situaţia la un moment dat a colectivităţii
supuse cercetării.
Recensământul populaţiei este o observare statistică iniţiată de stat,
pe baza unui act normativ.
Principiile metodologice privind organizarea recensământului sunt:
- principiul simultaneităţii, potrivit căruia înregistrările se referă la
acelaşi moment, numit ’’moment critic’’ pentru toate unităţile
statistice;
- principiul periodicităţii, ce presupune organizarea recensământului
la intervale egale de timp, pentru a putea asigura comparabilitatea
datelor ;
- principiul stabilităţii, ce se referă la faptul că recensământul trebuie
organizat atunci când colectivitatea înregistrează cel mai ridicat grad
de stabilitate.

17
Perioada de pregătire şi organizare a recensământului este foarte
mare şi vizează următoarele lucrări:
- elaborarea calendarului recensământului;
- întocmirea listelor pe localităţi, clădiri;
- sectorizarea teritoriului;
- elaborarea şi furnizarea formularelor şi instrucţiunilor;
- recrutarea şi pregătirea personalului;
- popularizarea recensământului în rândul populaţiei.
Principala formă de recensământ o constituie recensământul
populaţiei. Acesta se mai organizează pentru caracterizarea şeptelului,
pentru inventarierea produselor finite, pentru evaluarea mijloacelor
fixe.

3) Sondajul (observarea selectivă) este observare statistică


periodică, parţială, prin care se culeg date şi informaţii numai pentru o
parte a colectivităţii studiate, numită eşantion (mostră), urmând ca
rezultatele obţinute să fie generalizate la nivelul întregii colectivităţi.
Eşantionul trebuie să fie reprezentativ, să cuprindă aceleaşi structuri,
unități cu trăsături esenţiale şi valori tipice, ca şi colectivitatea din
care s-a extras.
Sondajul se utilizează pentru cercetarea bugetelor de familie,
recepţia mărfurilor, înregistrarea preţurilor, controlul calităţii
diferitelor produse, cercetări sociologice. Acesta se foloseşte ori de
câte ori nu se poate efectua o observare totală sau când e justificată din
punctul de vedere al operativităţii, economicităţii şi al condiţiilor de
realizare. De asemenea, se foloseşte frecvent la verificarea
autenticităţii datelor obţinute prin observare totală.

4) Ancheta este o observare parţială, periodică, ce se bazează pe


completarea benevolă a unor chestionare. Prin anchete se urmăreşte
obţinerea unor informaţii referitoare la tendinţele ce se manifestă în
colectivitatea care interesează. Rezultatele anchetelor sunt orientative,
deoarece nu se pune condiţia reprezentativităţii unităţilor de la care se
culeg date. Cele mai des întâlnite sunt anchetele privind cercetarea
pieţei şi a opiniei publice, referitor la preferinţele consumatorilor, iar
mai recent, anchetele se utilizează în demografie, privind: mortalitatea
pe grupe socio-profesionale, pe vârste, fertilitatea populaţiei.

18
5) Monografia presupune studierea exhaustivă a unei singure
unităţi statistice complexe, cum ar fi o unitate economico-socială,
unitate administrativ-teritorială.
Se efectuează monografii pentru studierea fenomenelor
demografice, ce din punct de vedere al sferei de cuprindere pot fi:
- monografii ce studiază un singur fenomen demografic (natalitate,
mortalitate) în cadrul întregii populaţii sau a unei părţi a acesteia, în
corelaţie cu toţi factorii sociali-economici care îl determină;
- monografii ce studiază un ansamblu de fenomene demografice
interdependente, în cadrul unei unităţi teritoriale sau zone geografice,
la nivelul cărora fenomenele demografice se diferenţiază cel mai mult,
în plus sau în minus faţă de media lor pe ţară.
Monografia necesită colaborarea şi conlucrarea unor cercetători din
mai multe domenii.

I.5.1.Controlul datelor

Fiecare procedeu de observare prezintă şi posibilitatea de a


înregistra erori, practic neexistând observări perfecte.
Erorile de observare reprezintă neconcordanţe între nivelul
înregistrat în formularele de observare şi cel real. Ele pot fi
întâmplătoare şi sistematice.
Erorile de observare întâmplătoare sunt abateri de la realitate
care intră sub incidenţa numerelor mari şi nu influenţează în mod
esenţial rezultatele medii, deoarece acţiunile lor într-un sens sunt egal
probabile cu acţiunile în sens contrar şi se compensează reciproc la
nivelul colectivităţii. Acestea se datorează neatenţiei, înţelegerii
greşite a sensului întrebărilor, a nerespectării instrucţiunilor şi
executării defectuoase a înregistrărilor.
Erorile sistematice sunt abateri voite ce denaturează realitatea
într-un singur sens, influenţând rezultatele întregii cercetări. Acestea
se concretizează în exagerări ale dimensiunilor, proporţiilor unui
anumit fenomen, fie de către persoanele înregistrate, fie de cele care
efectuează înregistrarea.
În vederea depistării erorilor de observare , datele înregistrate
sunt supuse controlului autenticităţii .

19
Controlul datelor statistice este o acţiune ulterioară
înregistrării şi se efectuează cu scopul de a asigura volumul complet şi
calitatea datelor înregistrate.
Datele statistice obţinute prin înregistrare sunt supuse unui
control cantitativ pentru a constata dacă au fost cuprinse toate unităţile
colectivităţii cercetate şi dacă la fiecare unitate au fost înscrise date
pentru toate caracteristicile cuprinse în formulare. Prin controlul
cantitativ se verifică dacă este complet volumul informaţiilor
statistice.
Pe lângă controlul cantitativ se efectuează şi un control
calitativ (logic) ce constă în verificarea valorilor pentru diferite
caracteristici între care există anumite relaţii de interdependenţă. Prin
control logic pot fi depistate eventuale erori sistematice, dacă se
compară în timp sau în spaţiu, unităţi statistice ce au condiţii
asemănătoare dar la care apar variaţii foarte mari în privinţa
indicatorilor înregistraţi.

20
CAPITOLUL II

SISTEMATIZAREA ŞI PREZENTAREA
DATELOR STATISTICE

II.1. Sistematizarea datelor prin centralizare şi grupare

Datele primare obţinute în urma observării statistice,


indiferent de tipul lor, prezintă o mare varietate, necesitând
sistematizarea acestora pentru a putea oferi claritatea necesară şi
adaptabilitatea pentru calcule.
Prin sistematizarea datelor se înţelege organizarea
colectivităţii studiate din punct de vedere al unităţilor componente şi
al caracteristicilor înregistrate. Sistematizarea are rolul de a facilita
compararea , corelarea logică a două sau mai multe caracteristici.
Realizată manual sau cu ajutorul calculatorului electronic, în
general, sistematizarea primară a datelor este matricială.
De exemplu : dacă se alege o colectivitate , notată cu U ,
alcătuită din n unităţi statistice, notate cu u1,u2,..,ui, …, un şi se aleg m
caracteristici , notate xj, aceste elemente pot fi descrise astfel:
____
U= {u1, u2,…,ui ,…,un} i=1,n
___
X= {x1 ,x2 , … ,xj, … ,xm } j=1,m

După înregistrarea valorilor şi variantelor caracteristicilor pentru toate


unităţile statistice se obţine o matrice de ordinul n*m, adică Xnm=[xij] ,
unde xij reprezintă valoarea caracteristicii j pentru unitatea statistică i.

Forma generală a matricei este prezentată în tabelul nr.2.1.:

21
Tabel 2.1.
Unităţile colectivităţii Caracteristicile observate (xj)
ui
x1 x2 . . . xj . . . xm
u1 x11 x12 . . . x1j . . . x1m
u2 x21 x22 . . . x2j ……… x 2m
.
. . . .
.
. . . .
.
xi1 xi2 . . . xij . . . xim
ui
. . . .
.
. . . .
.
. . . .
.
xn1 xn2 . . . xnj . . . xnm
un

Mărimea matricei depinde de numărul caracteristicilor alese şi de


numărul unităţilor supuse observării. Elementele matricei pot fi nule,
pozitive sau negative. Pe baza matricei, pentru necesităţile diferitelor
analize, se pot alcătui:
- vectorul linie “i”, format din totalitatea caracteristicilor
înregistrate la nivelul unei unităţi statistice a colectivităţii;
-vectorul coloană “j”, format din totalitatea valorilor unei
caracteristici la toate unităţile statistice.
Pe baza datelor primare, din caracteristicile numerice se pot calcula
caracteristici derivate prin:
a) operaţii de adunare-scădere, pentru datele exprimate în aceeaşi
unitate de măsură;
b) operaţii de multiplicare (de înmulţire) şi de raport (împărţire)
pentru datele exprimate în unităţi de măsură diferite.
scale de măsurare prin atribuirea de valori fiecărei caracteristici.
Se pot folosi patru scale de măsurare:
1) scala nominală;
2) scala ordinală;
3) scala de interval;
4) scala de raport.

22
1) Scala nominală constă în atribuirea de variante caracteristicilor
nenumerice, astfel încât toţi indivizii aparţinând aceleiaşi clase
să aibă aceeaşi valoare atribuită.
De exemplu, pentru caracteristica “domiciliu”, studenţii vor forma
două grupe. Prima grupă cuprinde studenţii din mediul urban, care se
poate codifica drept clasa 1 şi o grupă care cuprinde studenţii din
mediul rural, notată drept clasa 2.
Volumul de informaţii obţinut prin sistematizarea datelor cu
ajutorul scalei nominale este direct proporţional cu numărul
claselor construite; aşadar cu cât numărul claselor creşte, cu atât
analiza este mai amănunţită.
2) Scala ordinală se aplică tot în cazul caracteristicilor
nenumerice calitative, unităţile statistice putând fi ordonate
crescător sau descrescător şi li se pot atribui ranguri sau
numere de ordin.
De exemplu: ordonarea gimnaştilor după numărul de medalii
obţinute:
1. nici o medalie;
2. o medalie;
3. două medalii;
4. trei sau mai multe medalii.
3) Scala de interval se utilizează pentru caracteristicile atributive
cantitative şi presupune introducerea între valorile
caracteristicii a distanţei dintre ele. Aplicarea acestei scale
constă în atribuirea de valori caracteristicii măsurate în funcţie
de intervalul dintre valori. În acest caz, punctul zero al scalei şi
unitatea de măsură se pot alege arbitrar sau convenţional. Scala
de interval se aplică la cuantificarea curgerii timpului
calendaristic sau la măsurarea temperaturii.
4) Scala de raport (metrică) este cea mai înaltă treaptă de
măsurare, cu ajutorul acesteia se exprimă cele mai multe
caracteristici numerice economice. În cazul acestei scale,
punctul zero este dat în mod natural, semnificând efectiv
absenţa fenomenului.
Valorile măsurate pe scala de raport pot fi: cantităţile executate,
vândute, venituri realizate, preţuri unitare, vârsta, vechimea mică.
Sistematizarea datelor se efectuează prin centralizare şi grupare.

23
Centralizarea datelor constă în strângerea datelor la locul
prelucrării a tuturor informaţiilor şi determinarea totalurilor pentru
caracteristicile direct însumabile sau care devin însumabile, prin
aplicarea unor coeficienţi de echivalenţă.
Centralizarea datelor poate fi: - simplă;
- pe grupe.
Centralizarea simplă înseamnă agregarea valorilor individuale
ale caracteristicilor pentru toate unităţile de colectivităţi care permit
însumarea din punct de vedere al conţinutului, în scopul obţinerii
indicatorilor totalizatori. În urma centralizării simple se obţin
informaţii privind volumul colectivităţii şi valoarea totalizată a
caracteristicilor cuprinse în planul observării şi care sunt exprimate în
unităţi de măsură însumabile.
Centralizarea pe grupe are drept scop cunoaşterea mai
detaliată a fenomenului, permiţând analiza structurii colectivităţii.
Aceasta constă în gruparea datelor şi în calcularea indicatorilor
totalizatori pe fiecare grupă, iar pe baza lor a indicatorilor totalizatori
pe întreaga colectivitate. Centralizarea pe grupe include mai multe
centralizări simple.
În urma centralizării se obţin indicatori statistici totalizatori ce
au un conţinut concret şi o formă specifică de exprimare, motiv pentru
care sunt denumiţi indicatori absoluţi. Ei constituie baza
informaţională a cunoaşterii statistice şi sunt urmăriţi statistic la toate
structurile organizatorice ale economiei naţionale.
Gruparea statistică (clasificare, stratificare) constă în
împărţirea colectivităţilor statistice în grupe omogene de unităţi
statistice, după variaţia uneia sau mai multor caracteristici de grupare.
La aplicarea grupărilor se operează cu noţiunile următoare:
- caracteristica de grupare;
- variaţia;
- amplitudinea;
- grupa omogenă.
Caracteristica de grupare este acea însuşire în funcţie de care
unităţile statistice se separă pe clase sau pe grupe omogene.
Variaţia este proprietatea caracteristicilor de grupare, de a
înregistra mai multe valori sau mai multe forme de manifestare.

24
Amplitudinea,notată cu A, reprezintă câmpul de variaţie a
tuturor valorilor individuale ale unei caracteristici şi se determină ca
diferenţă între valoarea maximă şi minimă.
Grupa omogenă reprezintă clasa de unităţi statistice la care
variaţia caracteristicii de grupare este minimă.
Grupările statistice se pot clasifica după mai multe criterii.

1.În funcţie de numărul caracteristicilor de grupare, grupările


statistice pot fi:
- a. simple;
- b. combinate.
a. Grupările simple se efectuează după o singură caracteristică
de grupare şi sunt utile pentru determinarea tendinţei de concentrare a
fenomenelor.
Forma generală a unei grupări simple este prezentată în tabelul
simplu nr.2.2:
Forma generală a unei grupări simple
Tabel 2.2.
Caracteristica Număr de unităţi statistice
xi fi
x1 f1
x2 f2
. .
. .
xi fi
. .
. .
xn fn
.

TOTAL ∑fi

b. Grupările combinate se obţin după două sau mai multe


caracteristici. În acest caz, colectivitatea se împarte în grupe omogene
după o anumită caracteristică, apoi aceste grupe se împart, la rândul
lor, în alte subgrupe mai mici, după o altă caracteristică.
Gruparea combinată după mai mult de două caracteristici este
relativ rară, deoarece odată cu creşterea numărului de caracteristici,
scade claritatea, exigibilitatea unui astfel de tabel.

25
Tabelele obţinute după o grupare combinată se numesc tabele cu dublă
intrare (vezi tabelul nr.2.3.).
Tabel 2.3.
Caracteristica Total după
Caracte- yj y1 y2 . . . yj . . . ym caracteristica x
-ristica
xi
x1 f11 f12 . . . . f1j . . . f1m fx1
x2 f21 f22 . . . f2j . . . f2m fx2
. . . . . .
. . . . . .
xi fi1 fi2 . . . fij . . . fim fxi
. . . . . .
. . . . . .
xn fn1 fn2 . . . fnj . . . fnm fxn
Total după caracteristica y fy1 fy2 . . . fyj . . . fym ΣΣfij

Între frecvenţele totalizate pe rânduri şi coloane există


următoarele relaţii:
n m n m

∑∑ i =1 j =1
f ij = ∑ f xi = ∑ f yj
i =1 j =1

2.În funcţie de conţinutul caracteristicilor de grupare, există


următoarele categorii de grupări:
a) grupări teritoriale: în cazul în care împărţirea în grupe
omogene se face după apartenenţa teritorială a unităţii.
b) grupări cronologice: când timpul este considerat elementul
definitoriu în sistematizarea datelor.
c) grupări tipologice: în funcţie de o caracteristică atributivă
calitativă.
d) grupări cantitative (numerice): după o caracteristică atributivă
cantitativă.
În funcţie de gradul de variaţie, grupările cantitative pot fi:
- pe variante, în cazul în care numărul variantelor valorilor
numerice înregistrate este redus, iar fiecărei valori îi corespunde o
grupă.
- pe intervale, în cazul în care variaţia caracteristicii este
mare. Intervalele de grupare pot fi egale sau neegale.

26
Gruparea numerică pe intervale egale se realizează parcurgând mai
multe etape:
1. Se calculează amplitudinea (A), ca diferenţă între valoarea
maximă (xmax) şi valoarea minimă (xmin) a caracteristicii de
grupare:
A=xmax-xmin
2. Se determină numărul de grupe în care se va împărţi colectivitatea
după relaţia lui H. D. Sturges:

ng=1+3.322lgn
unde : ng- numărul de grupe
n – numărul de unităţi statistice din care este alcătuită
colectivitatea.
3. Se determină mărimea intervalelor de grupare (h), după formula :
A
h=
1 + 3.322 lg n
4. Se construiesc intervalele de grupare prin adunarea succesivă a
mărimii intervalelor de grupare pornind de la valoarea minimă a
caracteristicii de grupare (xinf), care devine limită inferioară a primului
interval de grupare.
În vederea obţinerii unei grupări corecte trebuie respectate câteva
reguli , cum ar fi:
- limita inferioară a primului interval se poate stabili mai mică
decât xinf;
- mărimea intervalului de grupare (k) trebuie să fie un număr
întreg, dacă este număr zecimal întotdeauna se rotunjeşte în sus;
- limita superioară a unui interval poate fi egală sau neegală cu
limita inferioară a intervalului imediat următor.
Forma unui tabel care prezintă o grupare pe intervale este
următoarea: Tabel 2.4.
Intervale de grupare după caracteristica xi Număr de unităţi statistice fi
x1inf-x1sup f1
x2inf-x2sup f2
… ...
xIinf-xIsup fi
... ...
xminf-xmsup fm

Total ∑fi

27
II.2. Serii statistice

Seriile statistice sunt rezultatul grupării datelor după una sau


mai multe caracteristici.
Seria statistică reprezintă corespondenţa dintre valorile
(variantele) unei caracteristici şi frecvenţa corespunzătoare sau
variaţia unei alte caracteristici, cu care se corelează.
Aşadar, seria statistică cuprinde două şiruri de date corespondente:
- primul şir se referă la criteriul de enumerare (valorile sau
variantele caracteristicii, momentele sau intervalele de timp, unităţile
teritoriale);
-al doilea şir cuprinde date numerice ce arată frecvenţa sau
mărimea primului şir.
Seriile statistice pot fi clasificate după mai multe criterii,
prezentate în continuare.
I. În funcţie de numărul caracteristicilor studiate, există
următoarele tipuri de serii statistice:
-serii unidimensionale (univariabile) obţinute în urma grupării
după o singură caracteristică;
-serii multidimensionale, obţinute în urma grupării după două
sau mai multe caracteristici.
II. În funcţie de conţinutul caracteristicii studiate, seriile
statistice pot fi:
a) serii de repartiţie (de distribuţie);
b) serii descriptive;
c) serii cronologice (de timp sau dinamice);
d) serii teritoriale (de spaţiu).
a) Seriile de distribuţie se elaborează când caracteristicile de
grupare studiate sunt atributive, exprimate numeric sau
nenumeric şi se realizează prin specificarea frecvenţelor,
respectiv a numărului de unităţi statistice la care s-a înregistrat
aceeaşi valoare sau variantă a caracteristicii.
Forma seriei de distribuţie:

x1 x2 ... xi…. xn
X:
f1 f2 … fi…. fn

28
unde:xi -reprezintă valorile individuale ale caracteristicii;
fi-reprezintă frecvenţele de apariţie ale valorilor caracteristicii.
Un exemplu de serie de distribuţie pe variante este prezentat în tabelul
nr.2.2,iar tipul seriei de distribuţie pe intervale este exemplificat în
tabelul nr.2.4.
b) Seriile descriptive prezintă o colectivitate prin enumerarea
unităţilor componente şi a valorilor principalelor caracteristici
înregistrate.
c) Seriile cronologice se elaborează pentru a descrie evoluţia în
timp a unui fenomen sau proces.
În funcţie de timpul la care se referă datele, seriile cronologice
pot fi:
- serii cronologice de momente, în cazul în care valorile
caracteristicii au fost înregistrate la anumite momente determinate de
timp. Termenii unei serii de momente nu se pot însuma direct, pentru
că ar duce la înregistrări repetate.
- serii cronologice de intervale, care prezintă valorile unei
caracteristici înregistrată pentru intervale de timp (luni, trimestre,
semestre, ani). Termenii unei serii de intervale sunt însumabili,
obţinându-se valoarea centralizată pentru întreaga perioadă.
Forma generală a unei serii dinamice este prezentată în tabelul
nr.2.5. :

Tabel 2.5.
Timpul (ti) Valorile caracteristicii xi
t0 x0
t1 x1
... . ... .
. .
ti xi
.. . ... .
.
tn xn

d) Seriile teritoriale rezultă din centralizarea frecvenţelor sau ale


variantelor caracteristicii studiate, după variaţia unei
caracteristici de spaţiu. De exemplu: altitudinea medie a
principalelor localităţi din judeţul Mureş.

29
Modelul unei serii teritoriale este cel prezentat în tabelul nr.2..6:
Tabel 2.6.
Unitatea teritorială Valorile
caracteristicii
A xA
B xB
. .
. .
Z xZ

II.3. Vizualizarea datelor cu ajutorul tabelelor şi


reprezentărilor grafice

Tabelul statistic se foloseşte în toate fazele cercetării


statistice, de la culegerea datelor, prelucrarea şi analiza lor, până la
prezentarea rezultatelor finale. Tabelul statistic poate fi format dintr-o
singură serie sau din mai multe serii.
Forma de prezentare a unui tabel statistic este o reţea de linii
verticale şi orizontale care prin întretăiere formează rândurile,
coloanele şi rubricile tabelului. Din punct de vedere al fondului,
tabelul statistic exprimă conţinutul unei colectivităţi printr-un număr
redus de cuvinte şi un număr mare de cifre. Elementele de bază ale
tabelului statistic sunt:
- subiectul tabelului, ce este dat de fenomenul sau procesul
cercetat şi presupune precizarea colectivităţii studiate şi a unităţilor
statistice. Acesta se descrie la capetele rândurilor.
- predicatul tabelului, ce precizează denumirea indicatorilor şi
caracteristicilor pentru care s-au înregistrat date şi cu ajutorul cărora
se studiază colectivitatea şi care se descriu la capetele coloanelor;
- datele numerice reprezintă valorile sau variantele
caracteristicilor şi se trec în rubricile tabelului;
- nota explicativă reprezintă un element facultativ şi are drept
scop precizarea sursei datelor sau a metodologiei distincte de calcul
pentru anumite valori din tabel.

30
Principalele tipuri de tabele statistice sunt:
1) Tabele statistice simple sunt folosite pentru înregistrarea şi
prezentarea datelor primare. Prezentarea colectivităţii în acest
caz se face prin simpla enumerare a unităţilor statistice,
înscriind în dreptul fiecărei unităţi valorile caracteristicilor
observate.
Tabelele statistice simple pot fi:
- enumerative;
- teritoriale, dacă datele numerice se repartizează în
funcţie de unităţi de spaţiu;
- cronologice, dacă valorile caracteristicilor se
înregistrează în funcţie de timp.
2) Tabelele statistice pe grupe cuprind datele numerice
referitoare la o colectivitate despărţită pe grupe omogene după
o singură caracteristică.
3) Tabelele statistice combinate (cu dublă intrare) sunt rezultatul
împărţirii colectivităţii în grupe omogene, după cel puţin două
caracteristici.
Reprezentările grafice, denumite şi diagrame sau grafice,
redau într-o formă expresivă evoluția unor fenomene, constituind nu
numai o formă de prezentare a rezultatelor cercetării, dar şi un suport
logic inductiv sau deductiv de analiză şi interpretare a fenomenelor
studiate.
Elementele constructive ale unui grafic sunt:
- titlul graficului, care trebuie să corespundă conţinutului datelor
prezentate;
- scara de reprezentare este locul geometric al punctelor cotate.
Aceasta se alege în funcţie de mărimea datelor de reprezentat, de
gradul de variaţie dintre ele, de spaţiul disponibil astfel încât să
asigure proporţionalitatea dimensiunii lor graficului.
- reţeaua graficului – poate fi reprezentată de sistemul axelor de
coordonate rectangulare Ox, Oy, primul cadran sau poate fi formată
din linii paralele verticale, orizontale, oblice pentru a distinge
diferitele părţi ale graficului.
- legenda are rolul de a explica semnificaţia simbolurilor utilizate,
semnelor convenţionale utilizate, haşurări, culori, reţele.
În funcţie de natura datelor de reprezentat există mai multe
tipuri de grafice:

31
a) diagrame prin areale se utilizează pentru reprezentarea
grafică a indicatorilor de volum unidimensionali,
înregistraţi pentru un număr redus de unităţi statistice (3-
5) sau pentru unităţi de timp. Aria figurii geometrice alese
trebuie să fie proporţională cu mărimea indicatorilor de
reprezentat. Există două tipuri de diagrame prin areale:
a1) diagrama prin pătrate;
a2) diagrama prin cercuri.
b) diagrame structurale evidenţiază raportul care există
între părţile componente ale colectivităţii. Fiecare figură
geometrică aleasă se va diviza în atâtea părţi câte grupe
omogene are colectivitatea cercetată.
Se disting trei categorii de diagrame structurale:
b1) dreptunghiul de structură;
De exemplu: reprezentarea grafică a structurii unei
colectivităţi formată din 8 unităţi statistice, respectiv 8
companii în funcţie de cifra de afaceri înregistrată în 2000 şi
2001 se ilustrează grafic ca în figura 2.1.:

Fig. 2.1. Structura cifrei de afaceri a companiilor multinaţionale în 2000 şi 2001

32
b2) cercul de structură;
De exemplu: structura unei firme industriale în funcţie de
producţia fizică realizată de cele 3 secţii productive pe parcursul unei
luni se poate reprezenta grafic ca în figura 2.2.:

Fig. 2.2. Structura producţiei fizice realizată în cadrul unei firme industriale de 3
secţii productive în luna ianuarie 2004

b3) pătratul de structură.

c) Reprezentări grafice ale seriilor de distribuţie cu


frecvenţe se utilizează în cazul în care valorile
caracteristicii sunt prezentate sub formă de intervale egale
sau neegale, şi pot fi de două tipuri:
c1) histograma;
De exemplu: distribuţia studenţilor unei grupe în funcţie
de media de la bacalaureat se poate reprezenta grafic ca în
figura 2.3.:

33
Fig. 2.3. Distribuţia studenţilor unei grupe în funcţie de media de la
bacalaureat

c2) poligonul frecvenţelor.


d) Cronograma: se foloseşte pentru a reprezenta grafic
valorile uneia sau mai multor serii cronologice.
De exemplu: Evoluţia producţiei de placaje a României în
perioada 1996-2003 se reprezintă cu ajutorul cronogramei ca
în figura 2.4.

Fig. 2.4. Evoluţia producţiei de placaje din România în perioada 1996-2003


Sursa: Anuarul statistic al României , 2005

34
e) Diagrame prin benzi şi coloane: se construiesc în cazul
în care se reprezintă valori ale unor serii teritoriale sau
serii cronologice de intervale egale. Acestea permit
reprezentarea în acelaşi sistem de axe a doi sau mai mulţi
indicatori între care există anumite interdependenţe.
De exemplu: Studenţii unei grupe în funcţie de profilul liceului
absolvit pot fi reprezentaţi grafic cu ajutorul diagramei prin benzi,
precum în figura 2.5.

Fig. 2.5. Repartizarea studenţilor unei grupe în funcţie de profilul liceului absolvit

f) Graficul norilor de puncte: se utilizează în cazul


grupărilor combinate pentru a evidenţia forma şi
intensitatea legăturii dintre caracteristici.
De exemplu: Legătura dintre suprafaţa comercială şi valoarea
vânzărilor pentru 10 magazine care aparţin aceleiaşi societăţi
comerciale se reprezintă grafic cu ajutorul norilor de puncte ca în
figura 2.6.

35
Fig. 2.6. Legătura dintre suprafaţa comercială şi valoarea vânzărilor pentru 10 magazine

Reprezentările grafice se pot realiza, în cea mai mare parte, cu


ajutorul programului EXCEL sau în anumite situaţii, se pot construi
manual. Regula de bază în construcţia unei reprezentări grafice este de
a asigura proporţionalitatea între dimensiunea figurilor geometrice
utilizate şi mărimea valorilor reprezentate.

II.4. Indicatorii statistici rezultaţi din prelucrarea primară


a datelor

Indicatorii statistici, ca expresie sintetică sau analitică a


fenomenelor şi proceselor de masă, sunt elaboraţi pe baza unor
metodologii şi tehnici specifice prin care li se stabileşte conţinutul,
puterea cognitivă şi legăturile cu ceilalţi indicatori.
Aceștia sunt purtători de informaţii, au conţinut real, obiectiv
determinat şi pot fi utilizaţi fie unilateral, pentru a caracteriza anumite
aspecte ale unor fenomene şi procese sub raportul volumului şi
structurii, fie sub formă de sistem de indicatori pentru a studia
interdependenţele dintre anumite fenomene.
Indicatorii folosiţi în cercetarea statistică pot fi:
- primari;
- derivaţi.

36
Indicatorii primari se obţin în urma prelucrării datelor
individuale, fie prin înregistrare directă, rezultaţi din observare, fie
prin însumare parţială, pe grupe sau totală, pe întreaga colectivitate a
datelor individuale de acelaşi fel.
Aceştia sunt exprimaţi în unităţi de măsură specifice caracteristicii
observate sau în cazul în care sunt caracteristici ale căror valori nu pot
fi însumate direct, se folosesc unităţi natural-convenţionale sau
valorice. De aceea indicatorii primari se mai numesc indicatori
absoluţi, cu un conţinut real şi o formă de exprimare concretă, care
reflectă volumul colectivităţii (pe total sau pe grupe) şi nivelul
cumulat al diferitelor caracteristici observate (pe total colectivitate sau
pe grupe de unităţi).
În activitatea social-economică, indicatorii primari absoluţi,
rezultaţi în urma sistematizării datelor, pot fi folosiţi ca atare, fără nici
o prelucrare suplimentară sau pot fi supuşi diferitelor prelucrări şi
procedee de calcul, obţinându-se indicatori derivaţi.
Indicatorii derivaţi se obţin prin prelucrarea indicatorilor
absoluţi prin diferite procedee de calcul şi au drept scop evidenţierea
aspectelor calitative ale fenomenelor şi proceselor cercetate, aspecte
ce nu pot fi surprinse de indicatorii absoluţi, cum ar fi: componenţa
structurală, intensitate, dinamică, nivel mediu, etc.
Indicatorii derivaţi se obţin, în general, într-un proces de
comparaţie realizat pe bază de diferenţă sau de raport.
Compararea datelor se poate face:
- la nivelul unităţii statistice pentru una sau mai multe
caracteristici
- la nivelul unei grupe omogene, din punct de vedere al uneia
sau mai multor caracteristici sau în ce priveşte numărul unităţilor
statistice ce compun grupa respectivă
- la nivelul întregii colectivităţi cercetate, de asemenea pentru
una sau mai multe caracteristici sau a numărului de unităţi statistice
componente.
Compararea pe bază de diferenţă se poate efectua, numai
atunci când datele sunt comparabile din punct de vedere al
conţinutului şi al unităţilor de măsură. Compararea pe bază de raport
se poate face atât în cazul datelor cu acelaşi conţinut, cât şi în cazul
datelor cu conţinut diferit dar interdependente între ele.

37
Indicatorii derivaţi ce se pot determina din prelucrarea
primară a datelor sunt:

a) modificarea absolută;
b) mărimile relative.
a) Modificarea absolută (∆) se calculează ca diferenţă între date de
acelaşi tip din punct de vedere al conţinutului şi al unităţii de măsură.
În cazul în care se referă la evoluţia în timp a unei caracteristici, se
mai numeşte spor sau reducere absolută. Diferenţa se efectuează între
mărimea comparată şi mărimea bază de comparaţie cu ajutorul
următoarelor formule:
∆x=xc – xbc=± , unde xc- este mărimea comparată
xbc- este mărimea bază de comparaţie
sau
∆∑x=∑xc - ∑xbc=±
sau
∆f=fc -fbc=± unde f-numărul de unităţi statistice
comparate.
b) Mărimile relative sunt indicatori derivaţi, rezultaţi din compararea
sub formă de raport a doi indicatori statistici şi exprimă printr-un
singur număr proporţiile indicatorului raportat faţă de indicatorul bază
de raportare. Formula generală de calcul:

xc
⋅ 10 k
xbc

unde k=0,1,2,3,…
Rezultatul raportării poate fi un număr întreg sau zecimal şi se poate
exprima sub formă de cât, coeficient, procent, promile, procentimile
sau în unităţi de măsură combinate.
Mărimile relative sunt instrumente necesare şi utile în analiza
întregii activităţi economice, dar construcţia lor simplă, permite
posibilitatea obţinerii unor indicatori ce estompează, uneori
denaturează aspectele reale. De aceea, calcularea lor trebuie precedată
de alegerea atentă a bazei de comparaţie şi verificarea comparabilităţii
datelor raportate. Drept bază de comparaţie se aleg acei indicatori faţă

38
de care indicatorii comparaţi permit obţinerea unor mărimi relative cu
grad mare de sintetizare şi care au sens economic.
Principalele tipuri de mărimi relative sunt:

1) Mărimi relative de structură;


2) Mărimi relative de coordonare;
3) Mărimi relative de dinamică;
4) Mărimi relative ale planului;
5) Mărimi relative de intensitate.

1) Mărimile relative de structură se determină atunci când o


colectivitate este separată în grupe sau clase, după variaţia uneia sau
mai multor caracteristici şi exprimă raportul în care se află un element
sau un grup de elemente ale colectivităţii, faţă de volumul întregii
colectivităţi.
Principalele mărimi relative de structură sunt:
- greutatea specifică;
- frecvenţa relativă.

a) Greutatea specifică, notată gi, se calculează prin raportarea


mărimilor agregate la nivelul grupelor omogene ale valorilor
individuale ale caracteristicii, la mărimile agregate pe întreaga
colectivitate a valorilor caracteristicii, după formula:

∑x
j =1
ij

gi = n m
⋅ 100
∑∑ x
i =1 j =1
ij

unde:
m - reprezintă numărul de unităţi statistice din cadrul unei grupe
omogene;
n – reprezintă numărul de grupe omogene în care este împărţită
colectivitatea;
xij – valoarea individuală a caracteristicii pentru unitatea statistică i din
grupa j.

39
Rezultatul arată ponderea valorii caracteristicii (a unui indicator) unei
grupe omogene în totalul valorii caracteristicii, la nivelul întregii
colectivităţi.
În cazul în care colectivitatea este prezentată în cadrul unei serii
descriptive, în care fiecare unitate statistică este evidenţiată separat,

xi
gi = n
⋅ 100
∑x
i =1
i

greutatea specifică se determină pe baza următoarei formule de calcul:


unde:
n – numărul de unităţi statistice care formează colectivitatea;
xi – valoarea individuală a caracteristicii pentru unitatea statistică i.

b) Frecvenţa relativă, notată fi*, se determină raportând frecvenţa


corespunzătoare unei grupe omogene (fi), la numărul total de unităţi
statistice din care este alcătuită colectivitatea (∑fi).
Formula de calcul este:
fi
= ⋅ 100
*
fi n


i =1
fi

Rezultatul, arată ponderea numărului de unităţi statistice dintr-


o grupă în numărul total de unităţi statistice ce alcătuiesc
colectivitatea.
Suma mărimilor relative de structură, calculată faţă de aceeaşi bază,
este întotdeauna egală cu 100%.
Măsura relativă de structură se reprezintă cu ajutorul diagramelor
structurale.

2). Mărimile relative de coordonare sau de teritoriu se calculează ca


raport între doi indicatori absoluţi de acelaşi fel, din aceeaşi perioadă
de timp, înregistraţi pentru grupe diferite ale aceleiaşi colectivităţi sau
pentru colectivităţi statistice de acelaşi fel, dar situate în spaţii diferite.
Formulele de calcul sunt:

xA
k A/ B = ⋅ (100)
xB
40
sau

unde: xA-valoarea caracteristicii pentru unitatea teritorială A;


xB-valoarea caracteristicii pentru unitatea teritorială B.
xB
kB / A = ⋅ (100)
xA
Mărimile relative de coordonare admit reversibilitatea, direcţia de
comparare nefiind mică; oricare dintre termenii comparaţi în funcţie
de scopul urmărit poate fi considerat ca termen comparat sau ca
termen bază de comparaţie.
Rezultatul arată cu câte procente este mai mare sau mai mic termenul
comparat faţă de termenul bază de comparaţie sau cât reprezintă
termenul comparat din termenul bază de comparaţie.
Dacă rezultatul rămâne sub formă de coeficient, arată de câte ori este
mai mare sau mai mic termenul comparat faţă de termenul bază de
comparaţie.

3). Mărimile relative de dinamică se folosesc pentru a caracteriza


evoluţia în timp a fenomenelor şi sunt specifice seriilor cronologice.
Acestea se determină ca raport între nivelul fenomenului dintr-
o perioadă, considerată perioadă curentă, notată cu 1 şi nivelul
aceluiaşi fenomen înregistrat într-o perioadă anterioară, considerată
perioadă de bază, notată cu 0.
Formula de calcul este:

x1
k1 / 0 = ⋅ (100)
x0
Dacă se compară între ei toţi termenii unei serii cronologice, se obţin
mărimi relative de dinamică cu baza fixă, în cazul în care se
raportează fiecare termen la termenul iniţial şi respectiv mărimi
relative cu baza mobilă, în cazul în care se raportează fiecare termen la
termenul din perioada precedentă.
Formulele de calcul sunt:

xi xi
ki / 0 = ⋅ (100) k i / i −1 = ⋅ (100)
x0 xi −1
41
Rezultatul sub formă de coeficient, arată de câte ori a crescut sau a
scăzut nivelul fenomenului în perioada curentă faţă de perioada de
bază. Dacă rezultatul se exprimă sub formă de procent, arată cu cât la
sută a crescut sau a scăzut, nivelul din perioada curentă faţă de nivelul
din perioada de bază.
Mărimile relative de dinamică, nu admit proprietatea de reversibilitate,
exprimându-se într-un singur sens.

4). Mărimile relative ale planului se folosesc ori de câte ori un


fenomen se desfăşoară în mod organizat, programat sau planificat.
Agenţii economici utilizează aceşti indicatori pentru caracterizarea
producţiei, aprovizionării, desfacerilor, costurilor, fondurilor de
salarii, în funcţie de programele elaborate şi urmărite.
Se pot determina: - mărimile relative ale sarcinii de plan;
- mărimile relative ale îndeplinirii planului.
Mărimea relativă a sarcinii de plan se determină raportând
nivelul planificat pentru perioada curentă, la nivelul efectiv realizat
într-o perioadă anterioară, luată drept bază de comparaţie, după
formula:

x pl
k pl / 0 = ⋅ (100)
x0

Rezultatul arată cu cât la sută este mai mic sau mai mare
nivelul planificat faţă de nivelul realizat în perioada de bază.
Mărimea relativă a îndeplinirii planului se obţine prin
raportarea nivelului efectiv realizat în perioada curentă, la nivelul
planificat pentru perioada curentă.
Formula de calcul este:

x1
k1 / pl = ⋅ 100
x pl
Rezultatul poate fi interpretat astfel:
dacă este: - mai mare de 100%, s-a înregistrat o depăşire de plan;
-egal cu 100%, planul a fost realizat integral;
- mai mic de 100%, planul nu a fost îndeplinit.

42
5). Mărimile relative de intensitate se calculează ca raport între doi
indicatori absoluţi, de natură diferită, dar între care există o relaţie de
interdependenţă. Cei doi termeni ai raportului au unităţi de măsură
diferite, iar mărimea rezultată prin raportare va avea o unitate de
măsură compusă. Acestea se pot determina la nivelul unităţilor
statistice, a grupelor omogene sau la nivelul colectivităţii.
Formula de calcul pentru o unitate statistică este:

xi
kx/ y = ⋅ 10 k
yi

iar pentru o grupă omogenă sau pentru întreaga colectivitate este:

k = ∑x i
⋅ 10k
∑ y i / ∑ xi ∑y i
În cazul în care valorile caracteristicilor xi, yi sunt agregate la
nivelul unei grupe omogene sau pentru întreaga colectivitate.
Rezultatul sub formă de coeficient arată câte unităţi din
valoarea caracteristicii de la numărător, se cuprind într-o singură
unitate a valorii caracteristicii de la numitor.
Mărimile relative de intensitate admit, în anumite situaţii şi
reversibilitatea:
yi
ky/x = ⋅ 10 k
xi

sau

k = ∑y i
⋅ 10k
∑ y i / ∑ xi ∑x i
Dacă rezultatul se înmulţeşte cu 100 va arăta câte unităţi din
indicatorul raportat revin la 100 unităţi ale indicatorului bază de
raportare.
Dacă rezultatul se înmulţeşte cu 1000 se obţin promile şi se
utilizează în cazul în care indicatorul comparat este mult mai mic
decât cel bază de comparaţie , iar exprimarea sub formă de coeficienţi

43
sau procente ar conduce la obţinerea unor mărimi relative greu de
reţinut şi interpretat.
În cazul în care rezultatul raportului dintre cele două mărimi
comparate are o valoare foarte mică se utilizează procentimile ,
exprimând indicatorul comparat la 10000 sau la 100000 unităţi din
indicatorul bază de comparaţie.

44
CAPITOLUL III

ANALIZA STATISTICĂ A SERIILOR DE


DISTRIBUŢIE CU FRECVENŢE

III.1. Necesitatea analizei

Fenomenele de masă studiate de statistică se caracterizează


prin variabilitatea formelor individuale de manifestare determinată de
acţiunea, uneori în sensuri diferite, a unui complex de factori esenţiali
sau neesenţiali, sistematici sau aleatorii, obiectivi sau subiectivi.
Intensitatea cu care acţionează factorii de influenţă, modul de
asociere a factorilor determină un anumit grad de împrăştiere sau de
concentrare a valorilor individuale către valori tipice şi în acelaşi timp
determină o anumită formă de repartiţie a frecvenţelor.
Legile statistice se manifestă la nivelul întregii colectivităţi şi
nu la nivelul fiecărei unităţi statistice.
Prin sistematizarea datelor statistice individuale prin
centralizare şi grupare, se obţin seriile de distribuţie cu frecvenţe, ce
prezintă drept trăsături specifice:
- variabilitatea;
- omogenitatea;
- independenţa;
- concentrarea sau aglomerarea termenilor.
Variabilitatea se manifestă atunci când influenţa factorilor
întâmplători este puternică şi împrăştierea valorilor înregistrate este
mare. În acest caz, colectivitatea prezintă o omogenitate scăzută.
Omogenitatea presupune existenţa unor abateri sau variaţii
minime între termenii seriei şi este, de regulă, rezultatul acţiunii
factorilor esenţiali determinaţi, cu caracter sistematic.
Independenţa termenilor provine din faptul că unităţile statistice
există independent unele faţă de altele şi fiecare valoare a
caracteristicii se înregistrează pentru o unitate statistică distinctă.

45
Pentru caracterizarea structurii seriei se calculează indicatorii de
frecvenţă, cu scopul de a cunoaşte ceea ce este esenţial şi comun în
formele individuale de manifestare şi care leagă între ele valorile
individuale ale caracteristicii.
Concentrarea sau aglomerarea faţă de unele valori tipice ale seriei
apare atunci când acţiunea factorilor esenţiali sau aleatori este
diferenţiată, cu intensităţi diferite şi seria prezintă o repartiţie
neuniformă a frecvenţelor. Modul de asociere a factorilor de influenţă
determină o tendinţă de concentrare a valorilor individuale spre
anumite valori tipice.
În acest caz, frecvenţele se pot concentra:
a) către una din extremităţile seriei (seria are forma J sau I);
b) către valoarea centrală (de mijloc), obţinându-se pe grafic o
repartiţie simetrică sau normală, numită curbă normală Gauss-
Laplace;
c) către ambele extremităţi, obţinându-se o repartiţie în formă de
“U”.
În cazul în care intensitatea factorilor de influenţă este uniformă,
frecvenţele de apariţie ale valorilor individuale sunt apropiate între ele
şi seria prezintă o repartiţie uniformă a frecvenţelor.
Există şi cazuri când nu se poate observa o regularitate sau când
repartiţia frecvenţelor indică o colectivitate structurată pe mai multe
tipuri calitative, situaţie în care este necesar ca seria respectivă să fie
descompusă în mai multe serii distincte.
Se impune aşadar, ca prin metode statistice corespunzătoare, să se
analizeze seriile de distribuţie cu frecvenţe, să se studieze forma de
repartiţie şi tendinţele de concentrare a frecvenţelor.
Pentru aceasta se utilizează un sistem de indicatori absoluţi, relativi şi
medii, ce vor fi prezentaţi în continuare.
Un rol important în analiza seriilor de repartiţie cu frecvenţe, revine
reprezentărilor grafice, ca prim mijloc de exprimare a formei de
repartiţie.

46
III.2. Indicatorii de frecvenţe

Noţiunea de frecvenţă se referă la numărul unităţilor statistice,


ce corespund unei grupe omogene.
Se disting trei tipuri de frecvenţe: absolute, relative, cumulate.
1.Frecvenţa absolută (fi; i – 1,….n) se obţine în cazul
colectivităţii analizate după o singură caracteristică şi arată numărul de
unităţi statistice, la care se înregistrează aceeaşi valoare variantă a
caracteristicii sau care au valorile caracteristicii încadrate în acelaşi
interval de variaţie.
2.Frecvenţa relativă (fi*; i – 1…n) reprezintă ponderea
numărului de unităţi dintr-o grupă în ansamblul colectivităţii, fiind o
mărime relativă de structură, ce se exprimă în procente şi permite
astfel compararea mai multor serii din punct de vedere al frecvenţelor.
3.Frecvenţele cumulate se pot calcula fie pe baza
frecvenţelor absolute fie pe baza celor relative. Cumularea
frecvenţelor se face succesiv, pornind fie din capătul de sus al seriei,
fie din cel de jos, obţinându-se astfel pentru fiecare valoare a
caracteristicii, frecvenţele cumulate ascendent sau descendent.
Acestea arată numărul (ponderea) unităţilor statistice ce au valori mai
mici sau egale şi mai mari, după caz, decât o anumită valoare a
caracteristicii.
Indicatorii de frecvenţe ai caracteristicii numerice pot fi
reprezentaţi ca în tabelul 3.1.:
Tabelul 3.1.
Valorile Frecvenţe Frecve Frecvenţe cumulate Frecvenţele cumulate
Caracteris le nţele absolute relative
ticii absolute relative Ascendent Descendent Ascendent Descendent
xi fi fI*
X1 f1 f1* Fa1=f1 Fa1=Σfi Fr1=f1* Fr1=Σfi*
X2 f2 f2* Fa2=f1+f2 Fa2=Σfi-f1 Fr2=f1*+f2* Fr2=Σfi*-f1*
. . . . . . .
. . . . . . .
xI fI fi* Fai=f1+..+fi . . .
. . . . . . .
. . . . . . .
. . . .
xn fn fn* Fan=Σfi Fan=fn Frn=Σfi* Frn=fn*

TOTAL Σfi Σfi* - - - -

47
x

III.3. Indicatorii tendinţei centrale

Indicatorii tendinţei centrale cu ajutorul cărora se poate


caracteriza o serie de repartiţie sunt mediile şi indicatorii de poziţie.

III.3.1. Mediile

Mediile sintetizează printr-o expresie numerică ceea ce este


tipic şi esenţial, ceea ce se manifestă drept tendinţă, legitate în masa
de valori individuale ale caracteristicii pentru care se determină.
Media este o valoare reprezentativă, numită şi “speranţa
matematică”, spre care tind toate valorile, variaţia dintre ele fiind
determinată numai de influenţa factorilor aleatori.
În vederea obţinerii unei medii reprezentative, trebuie să se
respecte următoarele cerinţe:
- să existe un număr suficient de mare de cazuri individuale
pentru caracteristica studiată din care se determină media;
- media să se determine din valori omogene; în caz contrar se
vor calcula medii parţiale pe subcolectivităţi omogene;
- să se aleagă tipul de medie care să corespundă cel mai bine
formei de manifestare a caracteristicii studiate.
În practica statistică, dată fiind diversitatea fenomenelor, se
utilizează mai multe tipuri de medii:
1. media aritmetică;
2. media armonică;
3. media pătratică;
4. media geometrică;
5. media cronologică.

Toate aceste medii se pot calcula ca medii simple sau ca medii


ponderate.
Mediile simple se determină în cazul în care numărul
variantelor valorilor caracteristicii, este egal cu numărul de unităţi
statistice.
Mediile ponderate se calculează când pentru fiecare variantă a
valorilor caracteristicii există frecvenţă.

48
III.3.1.1. Media aritmetică se foloseşte, în general, atunci
când fenomenul studiat prezintă modificări aproximativ constante,
apropiate de forma unei progresii aritmetice.
Media aritmetică reprezintă acea valoare la care ar fi ajuns
fiecare unitate statistică, dacă toţi factorii de influenţă ar fi acţionat în
mod constant.
Dacă media aritmetică este o valoare reprezentativă pentru
ansamblul datelor individuale, înseamnă că este acea mărime, cu care
dacă s-ar înlocui valorile individuale ale caracteristicii, suma acestora
ar rămâne constantă.
Fie o colectivitate statistică alcătuită din n unităţi statistice,
pentru care s-au înregistrat valorile unei caracteristici discrete notate
cu xi, x2,…,xi,…,xn. Media aritmetică simplă se determină ca raport
între suma termenilor xi şi numărul de termeni (n) după formula:
n

∑x i
x= i =1

Dacă fiecare valoare individuală xi, ar fi înlocuită cu media


aritmetică, valoarea totalizată a caracteristicii la nivelul colectivităţii
nu se modifică:
n
∑x
∑x = x1 + x 2 +... + xi + ... + x n = x + x + ... + x + ... + x = n ⋅ x ⇒ x =
i
i
i =1 n
În cazul în care pentru valorile individuale se înregistrează
frecvenţe absolute, notate f1, f2, …,fi,…,fn se obţine seria:

x1 x2 … xi… xn
X:

f1 f2 … fi …fn

unde i=1,2,…,n
iar media se determină cu ajutorul mediei aritmetice ponderate pe
baza frecvenţelor absolute sau a frecvenţelor relative, după caz:

49
n

∑x i fi
∑x i f i*
x= i =1
n x=
∑f
i =1
i
100

unde fi* se determină după formula:

fi
f i* = ⋅ 100
∑f i

O variantă a mediei aritmetice ponderate se utilizează pentru a


determina nivelul mediu a unei caracteristici alternative. În acest caz,
pentru a exprima numeric această caracteristică, în mod convenţional,
se acordă variantelor formei directe, valoarea “1”, iar variantelor
formei opuse, valoarea “0”.
Schematic, metoda de calcul se prezintă în următorul tabel:
Variantele posibile Valorile Frecvenţe absolute Frecvenţe relative fI*
de răspunsuri caracteristicii xi
Da – forma directă 1 N – numărul de
unităţi ce au p
înregistrat valoarea 1
Nu – forma opusă 0 M – numărul de
unităţi ce au q
înregistrat valoarea 0
TOTAL - ∑fi=N+M ∑fi*=p+q=1

Frecvenţele relative pentru forma directă şi pentru forma


opusă se obţin după următoarele formule:

N M
p= q=
N +M N +M
Aşadar, media caracteristicii alternative se calculează astfel:

50
x=
∑x f i i
=
1⋅ N + 0 ⋅ M
=
N
=p
∑f i N +M N+M

Media caracteristicii alternative se poate exprima şi în procente.

III.3.1.2.Proprietăţile mediei aritmetice


Media aritmetică prezintă o serie de proprietăţi, dintre care în practica
statistică se utilizează următoarele:
1) Într-un şir de valori egale, media aritmetică este egală cu
fiecare dintre ele. Deci,
x1 = x2 = … = xi = … = xn = xc=x, deoarece

x=
∑x i
=
∑x c
=
xc ⋅ n
= xc
n n n

2) Mărimea mediei aritmetice este întotdeauna cuprinsă în


intervalul de variaţie al caracteristicii studiate:

xmin≤ x ≤ xmax

Pentru o serie de distribuţie cu frecvenţe, media se încadrează între


valorile extreme ale caracteristicii, oscilând în jurul valorii cu
frecvenţa cea mai mare.

3) Într-o serie statistică, suma abaterilor individuale ale termenilor


seriei de la valoarea mediei lor aritmetice este egală cu zero, atât
pentru o serie simplă cât şi pentru o serie cu frecvenţe.
În cazul unei serii simple:
n

∑ (x
i =1
i − x) = 0
n n
∑x
∑x −∑x = ∑x − x ⋅n = ∑ xi − ⋅n = 0
i
i i
i =1 i =1 n

51
În cazul unei serii cu frecvenţe:
n

∑ (x
i =1
i − x) ⋅ f i = 0

∑x f ⋅ f
∑x f i − ∑ x ⋅ f i = ∑ xi f i − x ∑ f i = ∑ xi f i − ∑ =0
i i

∑f
i i
i

4) Într-o serie statistică, dacă toţi termenii se măresc sau se micşorează


cu o constantă “a”, atunci media noilor termeni este mai mică sau mai
mare decât media seriei inițiale, cu mărimea constantei “a”.

x=
∑x i ±a
±a
n

5) Dacă toţi termenii unei serii se micşorează sau se măresc de h ori,


atunci media se măreşte sau se micşorează de h ori.
Fie xi, i=1,…n, termenii seriei pentru care s-a calculat media
aritmetică şi x’ =xi/h , I=1,2,…,n termenii modificaţi ai seriei.
Atunci:

xi
∑ h ∑x 1 1 x
x= = ⋅ = x⋅ =
i

n n h h h
xi
∑ h ∑x 1 1 x
x = = i
⋅ = x⋅ =
n n h h h

Aceeaşi proprietate se verifică şi în cazul în care se înmulţesc


termenii seriei cu o constantă h:

x = x' ⋅ h

52
Proprietăţile 4 şi 5 se folosesc combinat, obţinându-se relaţia
de calcul simplificat a mediei aritmetice , atât pentru o serie
simplă cât şi pentru o serie cu frecvenţe, pe baza următoarelor
formule:
- pentru o serie simplă:
n
xi − a
∑ h
x= i =1
⋅h + a
n

a – este egală cu centrul de interval cu frecvenţa maximă;


h – lungimea unui interval.
- pentru o serie cu frecvenţe absolute:
n
xi − a
∑ h
⋅ fi
x= i =1
⋅h + a
∑ fi
- pentru o serie cu frecvenţe relative:

xi − a
∑( ) ⋅ fi
*

x= h ⋅h + a
100

6) Dacă într-o serie de distribuţie cu frecvenţe, se reduc


proporţional toate frecvenţele, atunci media calculată pe baza noilor
frecvenţe va fi egală cu media seriei iniţiale.
Fie media seriei iniţiale:

x=
∑x f i i

∑f i
Iar fi’ – frecvenţele micşorate:

fi 1
∑x i ⋅
c = c
∑ xi f i
x' = =x
fi 1
∑ c c
∑ fi
53
fi
fi =
,

7) Pentru o serie de repartiţie cu frecvenţele egale între ele,


media aritmetică ponderată se transformă în medie aritmetică simplă.
Dacă f1=f2=…=fi=…=fn=fc, Atunci:

x=
∑x f i i
=
∑x fi c
=
f c ∑ xi
=
∑x i
=x
∑f i ∑f c ∑f c n

8). Într-o colectivitate structurată pe grupe, media acesteia este


dependentă de media grupelor şi de frecvenţele grupelor respective.

Fie seria
x1 x2 … xi…xn împărţită în două grupe:
X:
f1 f2 …fi…fn

respectiv x1 x2 … xk având media xA şi numărul


XA:
f1 f2 … fk de unităţi fA

şi XB: xk*1 xk*2…xn


având media xB şi numărul de
fk*1 fk*2…fn unităţi fB

Atunci, media la nivelul întregii colectivităţi va fi:

54
k n n

f x + f B xB ∑ xi f i + ∑ xi f i ∑x i fi
x= A A = i =1 i = k +1
= i =1

fA + fB k n n

∑f +∑f
i =1
i
i = k +1
i ∑f
i =1
i

Unde mediile celor două grupe se calculează astfel:


k

∑x i fi k
xA = i =1
⇒ f A x A = ∑ xi f i
fA i =1
n

∑x i fi n
xB = i = k +1

fB
⇒ f B xB = ∑x
i = k +1
i
fi

9) Media aritmetică a sumei sau diferenţei dintre două


caracteristici aleatoare independente este egală cu suma sau diferenţa
mediilor celor două caracteristici.
Fie xi, yi valorile generale a două caracteristici, ce formează două
serii cu număr egal de termeni, cu mediile celor două caracteristici
cunoscute, atunci:
n n n

∑ ( xi ± y i ) ∑ xi ∑y i
x± y = i =1
= i =1
± i =1
= x± y
n n n

10). Media produsului a două caracteristici independente x şi y


este egală cu produsul mediilor celor două caracteristici.

x⋅ y = x⋅ y

Această proprietate se utilizează atunci când o caracteristică


complexă se poate exprima ca produs de două sau mai multe
caracteristici independente.

55
III.3.1.3.Media armonică, xh, se calculează din valorile
inverse ale termenilor unei serii.
În cazul unei serii simple, media armonică se determină astfel:
n
1 1 1 1 1
+ + ... + + ... + =∑
x1 x 2 xi x n i =1 xi

Dacă înlocuim termenii cu media lor se obţine:


n
1 1 1 1 1
+ + ... + + ... + =∑
xh xh xh x h i =1 xi
Formula mediei armonice simple este:

1 1 n
n⋅ = ∑ ⇒ xh = n
1
∑x
xn xi
i =1 i

Pentru o serie cu frecvenţe absolute, media armonică ponderată


are următoarea formulă:

xh =
∑f i

1
∑x ⋅ f i
i

Pentru o serie cu frecvenţe relative, media armonică ponderată


are formula generală:
n

∑f
*
i
100
xh = n
i =1
= n
1 1 *
∑x ∑
*
fi fi
i =1 i i =1 xi

56
Media armonică se determină în cazul în care se studiază o serie
bidimensională, care cuprinde valorile a două caracteristici xi, yi între
care există un raport de inversă proporţionalitate xi=1/yi. Pentru a
păstra acest raport şi în ce priveşte mediile pentru una dintre
caracteristici, media se va determina cu ajutorul mediei aritmetice, iar
pentru cealaltă cu ajutorul mediei armonice.
Dacă este calculată din aceleaşi valori pozitive, media armonică
este întotdeauna mai mică decât media aritmetică.

III.3.1.4.Media pătratică (xp) se calculează din pătratul valorilor


termenilor seriei:
n
x1 + x 2 + ... + xi + ...x n = ∑ xi2
2 2 2 2

i =1

înlocuind termenii cu media lor pătratică se obţine:


n
x p + x p + ... + x p + ... + x p = ∑ xi
2 2 2 2 2

i =1
Formula medie pătratice simple este:

∑x
2
n i
n ⋅ x p = ∑ xi ⇒ x p =
2 2 i =1

i =1 n

Pentru seriile de repartiţie cu frecvenţe, media pătratică


ponderată se calculează cu următoarele formule:

-din frecvenţe absolute: -din frecvenţe relative:

∑x f
2

∑x
2 *
xp = fi
i i

∑f xp =
i
i 100

Media pătratică se foloseşte în cazul în care predomină termenii


cu valori mari ai seriei, seria fiind asimetrică către valori mari.

57
În practica statistică, media pătratică se utilizează pentru
calcularea abaterii standard.
Determinată din aceleaşi valori ca şi media aritmetică, media
pătratică este întotdeauna mai mare.

III.3.1.5.Media geometrică (xg), se calculează în cazul în care


între termenii unei serii există relaţie de produs sau când fenomenul
studiat are o evoluţie exponenţială, apropiată de forma unei progresii
geometrice.
În acest caz, media geometrică reprezintă acea valoare cu care,
dacă se înlocuiesc termenii seriei, produsul acestora nu se modifică.

Produsul termenilor unei serii se exprimă matematic:

n
x1 ⋅ x 2 ⋅ ... ⋅ xi ⋅ ... ⋅ x n = ∏ xi
i =1
Înlocuind termenii cu media geometrică, se obţine:
n
x g ⋅ x g ⋅ ... ⋅ x g = ∏ xi
i =1
Formula mediei geometrice simple este:
n n
x g = ∏ xi ⇒ x g = n ∏x
n
i
i =1 i =1

Pentru o serie de repartiţie cu frecvenţe, se utilizează media


geometrică ponderată, fie pe baza frecvenţelor absolute, fie a celor
relative:

n n
x g = ∑ f i ∏ xi x g = 100 ∏ xi
fi f i*

i =1 i =1
Expresiile mediei geometrice se pot logaritma şi se obţin
următoarele formule:

58
-pentru media geometrică simplă:

∑ log x
log( x g ) = log(n ∏ x ) ⇒ log x =
i
i g
n

-pentru media geometrică ponderată:

log( x g ) = log ∑ i xi
f fi
⇒ log x g =
∑ f ⋅ log x
i i

∑f i

Prin logaritmare, media geometrică se transformă în logaritmul


mediei aritmetice.
Media geometrică se utilizează atunci când seria prezintă variaţii
foarte mari între termeni, variaţie ce se reduce prin logaritmare, astfel
încât valorile mai mici vor fi mai bine reprezentate în valoarea mediei.
Media geometrică nu se poate determina în cazul în care unul
dintre termeni este egal cu zero sau ia valori negative.
Determinată din aceleaşi valori, media geometrică este
întotdeauna mai mică decât media aritmetică.

III.3.1.6.Media cronologică (xc) este o formă transformată a


mediei aritmetice şi este specifică seriilor dinamice de momente cu
intervale egale şi neegale.
Media cronologică simplă se utilizează în cazul în care între
momentele la care se înregistrează valorile caracteristicile se formează
intervale egale de timp. Formula de calcul este:
y1 y
+ y 2 + y 3 + ... + n
y= 2 2
n −1
Media cronologică ponderată se utilizează în cazul în care între
momentele la care se înregistrează valorile caracteristicile se formează
intervale neegale de timp. Formula de calcul este:
t1 t +t  t
y1 ⋅ + y2  1 2  + ... y n n −1
y=
2  2  2
∑ ti

59
unde: ti - reprezintă mărimea intervalelor dintre două momente
consecutive, exprimată în număr de zile, număr de luni,număr de ani.

Între mediile prezentate există următoarea relaţie de inegalitate:

x h ≤ x g ≤ x ≤ x p ≤ xc
III.3.2. Indicatorii medii de poziţie

Indicatorii medii de poziţie au drept scop completarea


informaţiilor obţinute în urma calculării nivelului mediu şi studiază
variaţia caracteristicii, a formei de repartiţie a frecvenţelor şi
evidenţiază tendinţa de aglomerare, de concentrare a frecvenţelor.
Aceştia se utilizează pentru aprecierea gradului de semnificaţie a
mediei şi pentru determinarea gradului de asimetrie.
Principalii indicatori medii de poziţie sunt:
1). Modul sau valoarea modală;
2). Mediana;
3). Cuartile;
4). Decile;
5). Centile.

1). Modul, numit şi “valoare modală” sau “valoare


dominantă”, notata Mo, reprezintă acea valoare a caracteristicii, ce
corespunde celei mai mari frecvenţe de apariţie.
Pentru o serie de repartiţie cu frecvenţe pe variante, modul se
determină printr-o simplă analiză a seriei, stabilind cea mai mare
frecvenţă a seriei şi identificând valoarea modală, drept valoarea
caracteristicii corespunzătoare celei mai mari frecvenţe.
Pentru o serie de repartiţie cu frecvenţe pe intervale, se identifică
într-o primă etapă intervalul modal, adică intervalul cu frecvenţa
cea mai mare.
Valoarea modală se poate determina după una din următoarele
formule:

xM o
inf
+ xM o
sup
∆1
M o = xM o + hM o
inf
Mo = ∆1 + ∆ 2
2
60
În cazul în care frecvenţele sunt aproximativ simetric distribuite
în intervalul modal se utilizează prima formulă, iar dacă frecvenţele au
o distribuţie neuniformă se foloseşte cea de-a doua formulă.
xinfMo – limita inferioară a intervalului modal
xsupMo – limita superioară a intervalului modal
hMo – lungimea intervalului modal hMo=xsupMo - xinfMo
∆1 – diferenţa dintre frecvenţa intervalului modal şi frecvenţa
intervalului precedent
∆2 – diferenţa dintre frecvenţa intervalului modal şi frecvenţa
intervalului următor.

2). Cuantilele sunt indicatori cu ajutorul cărora se realizează


divizarea seriei într-un număr de părţi egale. Cuantilele de ordin “r”
sunt valori ale caracteristicii studiate, ce împart seria statistică
ordonată în “r” părţi egale.
Astfel, dacă:
r=2; se obţine cuantila de ordinul 2, numită mediană;
r=4; se obţin cuantile de ordin 4, numite cuartile;
r=10; se obţin cuantile de ordin 10, numite decile;
r=100; se obţin cuantile de ordin 100, numite centile.

2.1. Mediana (Me) este valoarea situată în mijlocul unei serii


ordonate crescător sau descrescător şi care împarte seria în două părţi
egale.
Determinarea medianei presupune ordonarea termenilor seriei
crescător sau descrescător, stabilirea locului medianei şi calcularea
valorii medianei.
Într-o serie simplă, formată dintr-un număr impar de termeni,
mediana va fi egală cu valoarea termenului central, de rang (n+1)/2,
unde n este numărul total de termeni.
Într-o serie simplă cu un număr par de termeni, mediana va fi
media aritmetică simplă a celor doi termeni centrali, de rang n/2 şi de
rang (n+2)/2.
În cazul seriilor de repartiţie cu frecvenţe, pe variante, mediana
este considerată valoarea caracteristicii corespunzătoare primei

61
frecvenţe cumulate ascendent, ce depăşeşte (Σfi+1)/2, unde Σfi este
numărul total de unităţi statistice.
În anumite situaţii, semnificaţia medianei suferă uneori din cauza
modului de determinare şi se recomandă renunţarea la mediană şi
alegerea altei valori tipice pentru caracterizarea tendinţei centrale.
Pentru o serie de repartiţie cu frecvenţe pe intervale, mediana se
determină astfel:
- se identifică intervalul median, adică intervalul de grupare ce
corespunde primei frecvenţe cumulate ascendent ce depăşeşte
(ΣfI+1)/2;
- se determină valoarea medianei folosind relaţia de calcul:
∑f i +1
− Fa ( M e − 1)
M e = xM e
inf
+ hM e 2
f Me
unde:
xMeinf – limita inferioară a intervalului median
hMe – lungimea intervalului median
fMe – frecvenţa absolută a intervalului median
Σfi – suma totală a frecvenţelor absolute
Fa(Me- 1) – frecvenţele cumulate ascendent până la intervalul
median.

2.2.Cuartilele (în număr de trei Q1, Q2 = Me, Q3) sunt acele valori
ale caracteristicii, ce împart seria ordonată crescător sau descrescător
în patru părţi egale, conţinând fiecare 25% din numărul observaţiilor.
Pentru o serie simplă, cuartilele se determină astfel:
- se stabileşte locul cuartilelor cu ajutorul următoarelor expresii:
(n + 1)/4 – pentru Q1; 2(n + 1)/4 – pentru Q2; 3(n +1)/4 – pentru Q3
În cazul unei serii simple cu un număr impar de termeni, cuartilele
sunt egale cu variantele caracteristicii ce au număr de ordine egal cu
expresiile determinate anterior.
Pentru seriile simple cu număr par de termeni, cuartilele se
calculează ca o medie aritmetică a termenilor vecini poziţiilor aflate
pe baza expresiilor determinate anterior.
Într-o serie de repartiţie pe intervale, cuartilele se calculează astfel:

62
- se identifică intervalele în care se situează Q1, Q2, şi Q3; acestea vor
fi intervalele corespunzătoare primelor frecvenţe cumulate ascendent,
ce depăşesc expresiile precizate la seriile pe variante.

Locul pentru cuartila Q1 se determină pe baza relaţiei:


1
(∑ f i + 1)
4

iar valoarea cuartilei Q1 este acea valoare a caracteristicii


corespunzătoare primei frecvenţe cumulate ascendent mai mare sau
egală cu expresia :
1/4(Σfi + 1).
Cuartila Q2 este egală cu Me, locul acesteia se obţine pe baza
relației:

1
(∑ f i + 1)
2

Cuartila Q3 este considerată valoarea caracteristicii corespunzătoare


primei frecvenţe cumulate ascendent ≥ ¾(Σfi+1). .

- se determină valorile cuartilelor după următoarele relaţii:


1
(∑ f i + 1) − Fa (Q1 − 1)
Q1 = xQ1
inf
+ hQ1 4
f Q1
2
(∑ f i + 1) − Fa (Q2 − 1)
Q2 = xQ2
inf
+ hQ2 4 = Me
f Q2

3
(∑ f i + 1) − Fa (Q3 − 1)
Q3 = xQ3
inf
+ hQ3 4
f Q3

63
unde: xQ1inf, xQ2inf, xQ3inf – limita inferioară a intervalului în care se
găseşte Q1, Q2, Q3;
hQ1, hQ2, hQ3 – lungimea intervalului în care se găseşte Q1, Q2, Q3;
fQ1, fQ2, fQ3 – frecvenţa absolută a intervalului în care se găseşte Q1,
Q2, Q3;
Fa(Q1- 1); Fa(Q2-1); Fa(Q3-1) – frecvenţele cumulate până la
intervalul precedent cuartilelor.

2.3.Decilele (în număr de nouă: D1, D2, D3, D4, D5=Me, D6, D7, D8,
D9) sunt acele valori ale caracteristicii ce împart seria în zece părţi
egale, conţinând fiecare 10% din numărul observaţiilor.
În cazul unei serii simple, ordonate crescător sau descrescător,
decilele se determină conform definiţiei.
Pentru seriile de repartiţie cu frecvenţe pe variante, cele două
decile DK, K=1,2,3,…9, vor fi, pe rând, acele valori ale caracteristicii
corespunzătoare primei frecvenţe cumulate ascendent, ce depăşeşte
expresia: K/10(Σfi+1); K=1,2,3,…9.
Pentru seriile de repartiţii cu frecvenţe pe intervale, decilele se
determină după formulele următoare:

1
(∑ f i + 1) − Fa (D1 − 1)
D1 = x D1 + hD21 ⋅ 10
inf

f D1
2
(∑ f i + 1) − Fa (D2 − 1)
D2 = x D2
inf
+ hD2 ⋅ 10
f D2

.....
5
(∑ f i + 1) − Fa (D5 − 1)
D5 = xD5
inf
+ hD5 ⋅ 10 = Me
f D5
......

64
9
(∑ f i + 1) − Fa (D9 − 1)
D9 = x D9
inf
+ hD9 ⋅ 10
f D9
Notaţiile sunt asemănătoare cu cele de la cuartile.

2.4. Centilele se determină asemănător cuartilelor şi decilelor,


calculul lor justificându-se în cazul fenomenelor ce prezintă variaţii
mari şi foarte mari ale valorilor individuale, cum ar fi: fenomene
demografice, clasamente în economia mondială. Ele sunt în număr de
99, împart variantele unei caracteristici în 100 părţi egale cu K/100;
K= 1,2,3...99.

III.4. Indicatorii variaţiei

Indicatorii variaţiei au drept scop verificarea omogenităţii,


variabilităţii şi a gradului de împrăştiere a valorilor individuale ale
caracteristicii, precum şi a reprezentativităţii mediei pentru întreaga
colectivitate. Tot cu ajutorul lor se caracterizează asimetria
repartiţiilor şi interdependenţa dintre factorii de influenţă, după care se
structurează unităţile unei colectivităţi în grupe omogene.
În funcţie de modul de calcul, indicatorii variaţiei pot fi simpli sau
sintetici, exprimaţi în mărimi absolute, relative şi medii.
Indicatorii simpli ai variaţiei sunt:
a) Amplitudinea absolută, A;
b) Amplitudinea relativă, A%;
c) Abaterea individuală absolută, di;
d) Abaterea individuală relativă, di%.

a) Amplitudinea absolută, A, se determină după formula: A= xmax


- xmin, iar pentru seriile de repartiţie cu frecvenţe pe intervale,
aceasta se calculează ca diferenţă între limita superioară a
ultimului interval (xnsup) şi limita inferioară a primului interval de
grupare (x1inf):

A= xnsup –x1inf

65
Amplitudinea se exprimă în unitatea de măsură a caracteristicii şi
de aceea, ea nu poate fi utilizată în comparaţii, ca măsură a variaţiei,
decât pentru seriile unde caracteristicile sunt exprimate în aceeaşi
unitate de măsură. Pentru a elimina acest inconvenient, se calculează
amplitudinea relativă a variaţiei.

b) Amplitudinea relativă a variaţiei (A%), se calculează ca raport


între amplitudinea absolută (A) şi nivelul mediu al caracteristicii:

A%= (A / x ) 100
Rezultatul arată ponderea amplitudinii în valoarea mediei.

c) Abaterile individuale absolute, di, se calculează ca diferenţă


între fiecare valoare individuală a caracteristicii xi şi nivelul
mediu:

di= xi-x = ±
Rezultatul arată abaterile valorilor individuale de la media lor.

d) Abaterile individuale relative, di%, se determină raportând


abaterile individuale absolute, la nivelul mediu:
di
di % = ⋅ 100
x
În analiza variaţiei se pot determina abaterile individuale minime
şi maxime, atât în mărime absolută cât şi relativă:

di min= xmin-x; di min%=(di min / x )100

di max= xmax-x; di max%=(di max / x )100

În cazul în care repartiţia este simetrică: dmax = dmin .


Indicatorii sintetici ai variaţiei evidenţiază abaterile tuturor
nivelurilor individuale ale caracteristicii de la media lor şi a
frecvenţelor de apariţie a acestora.

Indicatorii sintetici ai variaţiei sunt:


a) Abaterea medie liniară, d;

66
b) Dispersia, σ2;
c) Abaterea medie pătratică, σ;
d) Coeficientul de variaţie, v.

a) Abaterea medie liniară (d ) se calculează ca medie


aritmetică simplă sau ponderată a abaterilor individuale de la
media lor sau de la mediana lor, astfel:
- pentru o serie descriptivă:

n n

∑ xi − x ∑x i − Me
dx = i =1
dMe = i =1
n n
- pentru o serie de distribuţie cu frecvenţe absolute:

n n

∑ xi − x ⋅ f i ∑x i − M e ⋅ fi
dx = i =1
n
d Me = i =1
n


i =1
fi ∑f i =1
i

- pentru o serie de distribuţie cu frecvenţe relative:


n

∑x
n
− x ⋅ fi
*
∑x − M e ⋅ fi
*
i
i
dx = i =1
n d Me = i =1

∑f
* n

∑f
*
i
i
i =1
i =1

Aceasta se exprimă în unitatea de măsură a caracteristicii şi


arată cu câte unităţi se abat în medie, unităţile statistice de la nivelul
mediu. Calculul abaterii medii, este justificat numai în măsura în care
prezintă importanţă mărimea abaterii şi nu semnul acesteia.

b) Dispersia (σ2) caracterizează gradul de concentrare a valorilor


individuale. Aceasta se mai numeşte varianţă şi se calculează ca medie

67
aritmetică simplă sau ponderată a pătratelor abaterilor individuale de
la media lor.
Astfel:
- pentru o serie descriptivă:

∑ (x i − xi ) 2
σ2 = i =1
n

- pentru o serie de distribuţie cu frecvenţe absolute:

∑ (x i − xi ) 2 ⋅ f i
σ2 = i =1
n

∑f i =1
i

- pentru o serie de distribuţie cu frecvenţe relative:

∑ (x − xi ) 2 ⋅ f i
*
i
σ2 = i =1
n

∑f
*
i
i =1

c). Abaterea medie pătratică (σ), denumită “abatere standard” sau


“abatere tip”, se calculează ca medie pătratică simplă sau ponderată, a
abaterilor tuturor valorilor individuale de la media lor.
Astfel:
- pentru o serie descriptivă, formula de calcul este:

∑ (x )
2
−x
σ=
i

68
- pentru o serie de distribuţie cu frecvenţe absolute:

∑ (x − x )
2
⋅ fi
σ=
i

∑f i

- pentru o serie de distribuţie cu frecvenţe relative:

∑ (x )
2
− x fi
*

σ=
i

100

Abaterea medie pătratică se exprimă în unitatea de măsură a


caracteristicii şi este cu atât mai mare cu cât este mai intensă variaţia
valorilor individuale ale caracteristicii şi invers. Rezultatul arată cu
câte unităţi se abat în medie valorile caracteristicii de la nivelul mediu,
ţinând cont de influenţa abaterilor individuale mari ale caracteristicii
Pentru aceeaşi serie, abaterea medie liniară (d ) este mai mică sau
cel mult egală cu abaterea medie pătratică (σ): d ≤ σ.
Pentru o serie cu tendinţă de normalitate, abaterea medie liniară
reprezintă 4/5 din valoarea abaterii mediei pătratice: d ≅ (4/5) σ
Abaterea medie pătratică se utilizează atât pentru verificarea
omogenităţii valorilor individuale a reprezentativităţii mediei, cât şi
pentru caracterizarea asimetriei unei serii de repartiţie, la estimarea
erorilor de selecţie. Aceasta se calculează în analizele economice şi
financiare, în studii de marketing, de prognoză.

d). Coeficientul de variaţie (v), cunoscut şi sub denumirea de


coeficient de omogenitate, este indicatorul ce permite compararea
gradului de variaţie a două sau mai multe caracteristici de natură
diferită, urmărite pentru aceeaşi colectivitate.

Coeficientul de variaţie se calculează în două moduri:

69
- ca raport între abaterea medie liniară (d ) şi media colectivităţii
(x ):
d
v= ⋅ 100
x

- ca raport între abaterea medie pătratică (σ) şi nivelul mediu (x ):


σ
v= ⋅ 100
x
Coeficientul de variaţie ia valori de la 0-100%: 0≤v≤100%.
Coeficientul de variaţie poate fi folosit drept test de semnificaţie a
reprezentativităţii mediei, considerându-se următoarele praguri de
semnificaţie:
- 0<v≤17% → media este strict reprezentativă;
- 17%<v≤35% → media este moderat semnificativă;
- 35<v≤50% → media este relativ reprezentativă;
- v>50% → media nu este reprezentativă.
Din punct de vedere al gradului de omogenitate a colectivităţii:
- 0<v≤35% - variaţie mică, colectivitate omogenă, alcătuită
din unităţi statistice aparţinând aceluiaşi tip calitativ;
-35%<v≤50% -variaţie relativ mare;
-v>50% - variaţie foarte mare , eterogenitatea colectivităţii,
unităţile statistice aparţin unor tipuri calitative diferite.

III.4.1. Proprietăţile dispersiei

1. Pentru un şir de valori egale între ele, dispersia este nulă,


deoarece media lor aritmetică este egală cu fiecare dintre variantele
înregistrate.
Dacă x1=x2=…=xn=xc=x ⇒ σ2=0
2.În cazul în care se calculează dispersia pe baza proprietăţilor 4
şi 5 ale mediei aritmetice, se obţine formula de calcul simplificat al
dispersiei:
- pentru o serie descriptivă:
xi − a 2
∑( n
)
σ2 = ⋅ h 2 − ( x − a) 2
n 70
- pentru o serie de distribuţie cu frecvenţe absolute:

 xi − a 
2

∑ 
 h 

σ =
2
⋅ f i ⋅ h 2 − ( x − a) 2
∑ fi
- pentru o serie de distribuţie cu frecvenţe relative:
xi − a 2 *
∑( h
) ⋅ fi
σ2 = ⋅ h 2 − ( x − a) 2
100

unde “a” şi “ h” sunt valori arbitrare, convenabil stabilite, astfel


încât să permită simplificarea.
3). Dispersie într-o colectivitate împărţită pe grupe
Într-o colectivitate împărţită pe grupe, dispersia colectivităţii totale
(σ20) este egală cu media dispersiilor de grupe (σ2) plus dispersia
dintre grupe (δ2), după formula:
σ02=σ2 + δ2
Această relaţie este cunoscută sub denumirea de “regula de
adunare a dispersiilor” sau “ecuaţia fundamentală a analizei
dispersionale”.
Media dispersiilor de grupe (σ2) se calculează ca o medie
aritmetică a dispersiilor de grupă σj2 ponderate cu volumul grupelor fj.

∑σ ⋅ f.j
2
j
2 j =1
σ = p

∑ f.j
j =1
j=1,2,…,p - numărul grupei

71
Dispersia de grupă,σj2, se calculează ca o medie a pătratelor
abaterilor variantelor variabilei din cadrul unei grupe faţă de media
lor, după formula:
-dispersia de grupă: - media unei grupe j:
n

∑ (x
n
− xj )
2
f ij ∑x i f ij
xj = i =1
i
σ j2 = i =1 n

∑f
n

ij
∑f⋅j
i =1
i =1
unde: i=1,2,…k; j=1,2,…p.

Dispersia de grupă, măsoară influenţa factorilor întâmplători, care


au acţionat asupra valorilor caracteristicii pentru unităţile statistice
dintr-o anumită grupă a colectivităţii.
Dispersia dintre grupe (δ2), se calculează ca o medie aritmetică a
pătratelor abaterilor mediilor de grupă xj faţă de media generală a
colectivităţii x, după formula:

∑ (x )
p
2
j − x ⋅ f.j
j =1
δ2 = p

∑ f.
j =1
j

Dispersia dintre grupe măsoară influenţa factorului de grupare ce


a determinat separarea grupelor în cadrul colectivităţii.
Dispersia colectivităţii totale (σo2), sintetizează variaţia tuturor
valorilor individuale din colectivitatea totală, cauzată atât de influenţa
factorilor aleatori, ce acţionează în interiorul grupelor, cât şi de
influenţa factorului sistematic, în funcţie de care s-a structurat
colectivitatea generală, după formula:

72
∑ (x )
n
2
i − x ⋅ fi
σ 02 = i =1
n

∑f
i =1
i

Pe baza celor trei dispersii se pot construi alţi indicatori: gradul de


determinaţie (R2) şi gradul de nedeterminaţie (K2), care se calculează
cu ajutorul următoarelor relaţii de calcul:

δ2 σ2
R2 = ⋅ 100 K2 = ⋅ 100
σ 02 σ 02

Gradul de determinaţie (R2) exprimă măsura în care variaţia


caracteristicii urmărite, depinde de factorul principal sistematic după
care s-a structurat colectivitatea în grupe omogene.
Gradul de nedeterminaţie (K2) exprimă măsura în care variaţia
caracteristicii depinde de variaţia factorilor aleatori, ce acţionează în
interiorul grupelor.
Între cei doi indicatori există următoarea relaţie:

R 2 + K 2 = 100

Dacă R2>K2, înseamnă că factorul principal de grupare


acţionează în mod hotărâtor asupra variaţiei caracteristicii xi.
Dacă R2<K2, variaţia caracteristicii se datorează influenţei
exercitate de alte cauze, de factori întâmplători.

73
III.5. Analiza asimetriei repartiţiilor empirice

O analiză statistică completă a seriilor de repartiţie cuprinde,


pe lângă caracterizarea tendinţei centrale în cadrul seriilor, a
împrăştierii valorilor individuale faţă de tendinţa centrală, şi o analiză
a formei în care se repartizează frecvenţele în funcţie de valorile
individuale înregistrate. Forma repartiţiilor se analizează în primul
rând cu ajutorul metodei grafice: histogramei, poligonul frecvenţei şi a
curbei cumulative a frecvenţelor.
Într-o serie de distribuţie perfect simetrică, frecvenţele
valorilor individuale sunt egal repartizate de o parte şi de alta a
valorilor centrale, iar cele trei valori ale tendinţei centrale, respectiv
valoarea medie, mediana şi modala sunt egale.

În funcţie de poziţia şi valorile pe care le au cei trei indicatori ai


tendinţei centrale, se pot întâlni:
- serii simetrice;
- serii uşor asimetrice;
- serii cu tendinţă pronunţată de asimetrie.

a). Caracterizarea şi măsurarea asimetriei se poate face cu ajutorul


coeficientului de asimetrie, propus de K.Pearson, calculat cu
formula:
x − M0
C as =
σ

Acest coeficient ia valori în intervalul: Cas ∈ [-1;1] .

Într-o serie perfect simetrică Cas =0, deoarece x =Me=M0.

Dacă x >M0; atunci Cas ∈(0;1] → asimetrie pozitivă.

Dacă x <M0; atunci Cas∈[-1;0) → asimetrie negativă.

74
fi fi fi
fmax

xi Mo Me x xi x Me
x =Me=Mo
x>Mo x< Mo
a.serie perfect simetrică b. asimetrie pozitivă c.asimetrie
negativă
Fig. 3.1. Formele repartiţiilor empirice ale unei serii de distribuţie

b). Un alt procedeu de calcul al coeficientului de asimetrie,


propus de K.Pearson, are în vedere mediana şi se calculează raportând
abaterea mediei de la mediana luată de trei ori, la abaterea medie
pătratică, după formula:

C , as =
(
3 x − Me )
σ
unde: C’as ∈[-3;3]
Această formulă se foloseşte pentru seriile uşor asimetrice, în care
pentru un număr mare de cazuri individuale se verifică relaţia :

M0=x - 3(x - Me).

În serie asimetrică x ≠Me≠M0, iar forma unor astfel de serii este


“j”, “i” sau “u”.

Alţi coeficienţi de asimetrie se pot determina cu ajutorul cuartilelor


şi decilelor, astfel:

c). coeficientul intercuartilic Yule (casy) urmăreşte evidenţierea


poziţiei cuartilelor faţă de mediană, calculându-se pe baza formulei:

(Q3 − M e ) − (M e − Q1 )
C asy =
(Q3 − M e ) + (M e − Q1 )
75
unde: Casy ∈[-1; 1]
Dacă Casy =0 → serie simetrică.
Dacă Q3 - Me>Me – Q1 → Casy∈(0;1] → serie cu asimetrie pozitivă.
Dacă Q3 - Me<Me – Q1 → Casy∈[-1;0) →serie cu asimetrie
negativă.

d). Coeficientul de asimetrie interdecilic a lui Bowley (CasB) se


bazează pe relaţia dintre decile şi mediană, determinându-se după
formula:

CasB =
(D9 − M e ) − (M e − D1 )
(D9 − M e ) + (M e − D1 )
unde: CasB ∈[-1;1].
Cu cât valoarea coeficientului este mai apropiată de zero, cu atât
repartiţia este mai simetrică, iar cu cât coeficientul este mai apropiat
de ±1, cu atât seria este mai asimetrică.
Gradul şi tendinţa de asimetrie se pot caracteriza cu ajutorul
indicatorului denumit densitatea de repartiţie a frecvenţelor, util în
special în cazul seriilor de repartiţie pe intervale mari sau neegale.
Acest indicator se calculează raportând fiecare frecvenţă absolută
sau relativă, la lungimea intervalului respectiv. Dacă se utilizează
frecvenţele absolute, obţinem densitatea absolută a frecvenţelor (da),
iar dacă se utilizează frecvenţele relative, atunci rezultă densitatea
relativă a frecvenţelor (dr), astfel:

fi
da = f
*

hi dr = i
hi
unde: fi - frecvenţa absolută a intervalului i;
hi – mărimea intervalului i;
fi* - frecvenţa relativă a intervalului i.

76
Dacă valorile acestor indicatori au tendinţă de creştere către
valoarea centrală a caracteristicii, înseamnă că seria de distribuţie are
tendinţă de normalitate.

77
CAPITOLUL IV

INDICATORI ŞI METODE STATISTICE DE ANALIZĂ


A LEGĂTURILOR DINTRE FENOMENELE
ECONOMICO-SOCIALE

IV.1. Prezentarea şi clasificarea legăturilor dintre


caracteristicile social-economice

Fenomenele economico-sociale sunt fenomene complexe,


influenţate de acţiunea simultană a unui număr mare de factori
esenţiali sau neesenţiali, sistematici sau aleatori, obiectivi sau
subiectivi. În scopul fundamentării corecte a deciziilor privind aceste
fenomene, trebuie analizate legăturile cauzale existente între ele,
respectiv care este fenomenul ce determină şi care este fenomenul
determinat.
Statistica, cu ajutorul unor metode specifice, poate releva
existenţa legăturii, determina forma matematică în care se vor reda cel
mai bine legăturile şi poate măsura intensitatea lor.
Întrucât legile statisticii se manifestă la nivelul întregii
colectivităţi, ca tendinţă, rezultă că dependenţele social-economice se
vor evidenţia tot ca tendinţă, manifestată la nivelul unui număr mare
de cazuri individuale.
În vederea reliefării legăturilor şi a tendinţelor existente în
desfăşurarea lor, unităţile statistice se supun grupării, se organizează
în serii statistice, sub forma unor şiruri paralele de valori ale
caracteristicii rezultative (dependente sau “efect”), notate cu yi,
respectiv ale caracteristicii factoriale (independente sau “cauză”)
notate cu xi.
În funcţie de natura relaţiei de cauzalitate existente între două
caracteristici, există:
- legături funcţionale;
- legături stohastice.

78
Legăturile funcţionale sunt legături univoce, realizate direct între
două fenomene, în care unei valori a fenomenului independent x, îi
corespunde o singură valoare a fenomenului dependent y, în cazul în
care condiţiile rămân neschimbate.
Legăturile stohastice, de natură probabilistică, numite legături
statistice, presupun ca unei valori a caracteristicii factoriale x să îi
corespundă o distribuţie de valori a caracteristicii rezultative y, şi
aceasta pentru că y este influenţat nu doar de x ci şi de alţi factori.
Fenomenelor economico-sociale le sunt specifice legăturile
statistice generate de factori multipli, cu influenţe în sensuri şi de
intensităţi diferite. Ca urmare, legătura nu se manifestă în fiecare caz
în parte, ci numai în general şi în medie, pe baza unui număr mare de
cazuri individuale.
Legăturile statistice se pot clasifica după mai multe criterii.

1.După numărul caracteristicilor luate în studiu:


a. legături simple, când caracteristica rezultativă y este studiată doar
prin variaţia unei singure caracteristici factoriale x, ceilalţi factori sunt
cu acţiune constantă, consideraţi factori reziduali; de exemplu,
capacitatea de producţie (x) şi cifra de afaceri(y);
b. legături multiple, când caracteristica rezultativă y, este analizată
prin prisma variaţiei a două sau mai multe caracteristici factoriale x;
de exemplu, capacitatea de producţie (x1) şi numărul de salariaţi (x2)
determină variaţia cifrei de afaceri.

2.După forma de exprimare a caracteristicilor:


a. legături între caracteristici numerice, numite corelaţii, când atât
caracteristica rezultativă y, cât şi cea factorială x, sunt exprimate
numeric; de exemplu, legăturile între cheltuielile de producţie (x) şi
profit (y);
b. legături între caracteristici calitative, numite asocieri statistice,
când atât caracteristica rezultativă y, cât şi cea factorială x, sunt
exprimate prin cuvinte; de exemplu, legătura dintre profesie (x) şi
sectorul de activitate (y).

3.După sensul legăturilor dintre caracteristici:


a. legături directe, când modificarea caracteristicii factoriale x, are ca
efect modificarea în aceeaşi direcţie a caracteristicii rezultative y; de

79
exemplu, legătura între venitul populaţiei (x) şi volumul vânzărilor
unui produs (y);
b. legături indirecte, când modificarea caracteristicii factoriale x, are
ca efect modificarea în sens opus a caracteristicii rezultative y; de
exemplu, legătura dintre preţul unui produs (x) şi volumul vânzărilor
(y).
4.După forma modelului matematic prin care se exprimă
legătura:
a. legături liniare, când se exprimă prin ecuaţia liniei drepte; de
exemplu, legătura între veniturile lunare (x) şi cheltuielile lunare (y);
b. legături neliniare, când se exprimă prin ecuaţia unei curbe:
parabolă, hiperbolă, ecuaţie exponenţială; de exemplu, o legătură prin
parabolă poate fi între cantitatea de îngrăşăminte administrate (x) şi
producţia la hectar (y).

5.După modul de producere în timp, legăturile statistice


sunt de două categorii:
a. legături sincrone sau concomitente, atunci când în acelaşi timp cu
modificarea caracteristicii factoriale x, se modifică şi caracteristica
rezultativă y; de exemplu, legăturile dintre cheltuielile de reclamă (x)
şi volumul vânzărilor (y);
b. legături asincrone sau cu decalaj, În cazul în care modificarea
caracteristicii rezultative y, are loc după un decalaj de timp de la
modificarea caracteristicii factoriale x; de exemplu, legătura între
volumul investiţiilor în modernizarea capacităţilor de producţie (x) şi
cifra de afaceri (y).
Ca urmare a varietăţii legăturilor de interdependenţă între
fenomenele economico-sociale, precum şi situaţiile des întâlnite în
practică, când factorii de influenţă nu pot fi identificaţi sau cuantificaţi
direct, orice analiză statistică trebuie începută cu studiul calitativ,
multilateral al acestor fenomene. Cu cât fenomenele sunt mai
complexe, cu cât numărul factorilor este mai mare şi relaţiile de
cauzalitate mai dificil de identificat şi măsurat.

80
IV.2. Identificarea şi exprimarea formei legăturilor

În funcţie de modul de prezentare şi sistematizare a datelor


statistice ce urmează a fi analizate, se pot utiliza, într-o primă etapă,
metode simple de verificare a existenţei legăturii dintre caracteristicile
studiate. Cu ajutorul acestor metode, se poate stabili existenţa
raporturilor de interdependenţă, precum şi o primă interpretare a
legăturii, caracterizarea tendinţei manifestate în ceea ce priveşte sensul
şi intensitatea legăturii.
La cercetarea legăturii se pot utiliza metode analitice, care permit,
prin calcularea unor indicatori, măsurarea corelaţiei, atât în ce priveşte
existenţa şi direcţia legăturii, cât şi din punct de vedere al formei şi
intensităţii în care se realizează.
Metodele simple folosite pentru evidenţierea existenţei
legăturilor, pentru stabilirea direcţiei şi aprecierea formei acestora,
sunt:
a) metoda seriilor de date interdependente;
b) metoda grupărilor;
c) metoda tabelului de corelaţie;
d) metoda grafică.

a) Metoda seriilor de date interdependente se utilizează atunci


când se dispune de un număr mic de unităţi observate. Valorile
caracteristicilor studiate se prezintă paralel, sub forma unor serii
statistice, ordonând valorile caracteristicii factoriale x, crescător sau
descrescător. Prin compararea acestor şiruri paralele de date, se poate
observa dacă în variaţia lor există vreo legătură sau nu şi se poate
constata direcţia manifestată.

b) Metoda grupărilor, prezentată în cadrul subcapitolului de


sistematizare a datelor, se utilizează pentru evidenţierea legăturilor, în
cazul unui număr mare de unităţi observate, cu o amplitudine mare a
variaţiei pentru caracteristica factorială (x). Analiza legăturilor dintre
două caracteristici se realizează cu ajutorul grupărilor simple,
efectuate ştiinţific, după o caracteristică de grupare (x) cu rol
determinant în variaţia caracteristicii rezultative (y). Rezultatele
acestei grupări se trec într-un tabel astfel: pe prima coloană se prezintă
grupele după caracteristica factorială (x), iar în următoarele, datele

81
calculate pentru caracteristica rezultativă (y) în ce priveşte valorile
centralizate pe fiecare grupă, indicatorii medii şi relativi. Pentru
caracterizarea legăturii, ca tendinţă generală, se pot folosi mediile de
grupă. Acestea exprimă ceea ce este esenţial şi tipic în formarea
fenomenului studiat. Cu cât numărul de grupe este mai mare, cu atât
este mai fidel redată tendinţa manifestată în variaţia caracteristicilor,
iar pentru a reda cât mai obiectiv densitatea de repartiţie a frecvenţelor
pe grupe, este necesar ca gruparea să se facă pe intervale egale.
Prin prezentarea în paralel şi compararea variaţiei caracteristicii
rezultative (y), condiţionată de variaţia caracteristicii factoriale, se
asigură verificarea legăturii şi aprecierii direcţiei acesteia.

c) Metoda tabelului de corelaţie constituie o metodă ce


are la bază o grupare combinată după două caracteristici: una
factorială (x) şi una rezultativă (y), numărul de grupe după cele două
caracteristici fiind egal. Se centralizează frecvenţele după ambele
caracteristici şi se obţine un tabel cu dublă intrare, numit tabel de
corelaţie.
Grupele după x se trec pe orizontală în ordine crescătoare, iar
grupele după y pe verticală, în ordinea descrescătoare a caracteristicii
rezultative. Legătura dintre cele două variabile x şi y, se poate
caracteriza după modul de distribuire a frecvenţelor în interiorul
tabelului, astfel:
- dacă frecvenţele se distribuie fără nici o regularitate pe toată
suprafaţa tabelului, atunci se apreciază că între x şi y există o legătură
slabă sau nu există deloc legătură, cele două caracteristici fiind
independente;
- poziţia frecvenţelor în jurul diagonalei, ne informează despre
intensitatea legăturii: concentrarea frecvenţelor în jurul diagonalei
indică o legătură strânsă, în caz contrar există o legătură slabă;
- poziţia diagonalei indică, de regulă, sensul legăturii şi anume
diagonala din stânga jos-dreapta sus, indică o legătură directă, iar
diagonala stânga sus-dreapta jos, arată o legătură inversă.

d) Metoda grafică constă în reprezentarea în sistemul de axe


rectangulare, a celor “n” cupluri de valori (xi yi) ale indicatorilor
corelaţi, obţinându-se graficul de corelaţie sau corelograma. Pe axa
absciselor (0x) se reprezintă valorile caracteristicii factoriale x, pe axa

82
ordonatelor (0y) valorile caracteristicii rezultative y, iar intersecţia
cuplurilor de valori se marchează cu câte un punct. Cu cât dispunem
de un număr mai mare de valori înregistrate, cu atât imaginea este mai
sugestivă, obţinându-se pe grafic un număr mai mare de puncte de
intersecţie, fapt pentru care acest grafic mai este denumit şi “graficul
norilor de puncte”.
Prin imaginea oferită, graficul de corelaţie permite verificarea
existenţei legăturii şi sugerează nu numai sensul legăturii, dar şi forma
de legătură. Astfel:
- dacă punctele sunt dispersate la întâmplare, fără nici o
regularitate, iar linia trasată în mijlocul norului de puncte este paralelă
cu axa absciselor, rezultă că legătura între cele două caracteristici nu
este semnificativă sau nici nu există;
- dacă punctele se dispersează în direcţia unei anumite linii, ce
nu este paralelă cu axa Ox, rezultă că cele două caracteristici sunt
corelate;
- dacă tendinţa de concentrare a punctelor este în jurul
diagonalei ce leagă colţul stâng jos cu colţul drept sus a graficului,
rezultă o legătură liniară directă, iar dacă această diagonală leagă
colţul stâng sus cu colţul drept jos, rezultă o legătură liniară inversă. În
cazul legăturilor de tip liniar (directă sau inversă), variaţia celor două
caracteristici este uniformă.
Formele legăturilor în cazurile prezentate anterior sunt
reprezentate:

yi yi yi

xi xi xi
a.Lipsa legăturii b. Legătură liniară c. Legătură
liniară
directă inversă
Fig. 4.1. Forme ale legăturilor liniare

83
În practică, există situaţii când între x şi y există o legătură
neliniară, de forma unei hiperbole, parabole, funcţii exponenţiale sau
de alt tip şi variaţia caracteristicii rezultative (y), sub influenţa
modificării caracteristicii factoriale (x) este neuniformă.

Exemple de legături neliniare:


yi yi yi

xi xi xi
a.Legătură hiperbolică b. Legătură parabolică c.legătură
exponenţială
Fig.4.2. Forme de legături neliniare

Metoda grafică permite şi o apreciere globală a intensităţii


legăturii, dintre cele două caracteristici studiate. Dacă linia prin
mijlocul norului de puncte se poate trasa uşor şi există puţine puncte
dispersate faţă de această linie, atunci se apreciază o legătură mai
strânsă, în caz contrar, o legătură mai slabă.
Metoda grafică reprezintă punctul de plecare al metodelor
analitice de cercetare a dependenţelor dintre fenomene.
Metodele analitice permit măsurarea legăturii prin exprimarea
matematică a acesteia şi prin calculul unor indicatori ai corelaţiei,
asigurând astfel o imagine mai precisă a dependenţelor dintre
fenomene.

Principalele metode analitice sunt:


- metoda regresiei;
- metoda corelaţiei.

84
IV.3. Metoda regresiei

Metoda regresiei constă în cercetarea legăturilor existente între


fenomene cu ajutorul unor funcţii matematice, denumite funcţii de
regresie.
În folosirea acestei metode este important să se identifice funcţia
ce exprimă cel mai bine dependenţa dintre caracteristicile studiate.
Funcţia de regresie poate avea forme variate, fie de funcţie liniară sau
neliniară, de producţie sau logistică.

IV.3.1. Modelul regresiei simple (unifactoriale), exprimă dependenţa


caracteristicii rezultative y, numai în raport cu caracteristica factorială
y = f (x ) + ε
(x), făcând abstracţie de toţi ceilalţi factori de influenţă, considerându-
I constanţi şi este de forma:
unde: ε este variabila aleatoare cu dispersia constantă şi media nulă,
numită eroare, ce însumează influenţa factorilor neînregistraţi.
Modelul este o reflectare schematică, simplificată a realităţii,
construit după identificarea dependenţelor şi specificarea formei
legăturii dintre cele două fenomene.

IV.3.1.1. Modelul liniar sau regresia simplă liniară are la


bază ecuaţia liniei drepte şi este cel mai cunoscut model, specific
tipului de legătură dintre două caracteristici ce variază în progresie
aritmetică, adică:
y = a + bx + ε
unde: a,b – sunt parametrii necunoscuţi ai modelului, care trebuie
estimaţi.
În vederea estimării parametrilor a şi b se utilizează, de regulă,
metoda celor mai mici pătrate.
Dacă dispunem de n observaţii pereche (xi, yi), atunci modelul se
poate scrie sub forma:
y xi = a + bxi

85
yxi – valorile ecuaţiei de regresie, calculate pentru toate
unităţile observate, pe baza valorilor individuale xi şi sunt numite
valori teoretice ale lui y în funcţie de x; acestea se notează ca o medie,
întrucât evidenţiază tendinţa de realizare a corelaţiei, respectiv
tendinţa de variaţie a lui y, dacă ar fi depins numai de variaţia lui x;
xi – valorile individuale ale caracteristicii factoriale, obţinute
din observare;
a – parametru cu sens geometric de “ordonata de origine a
dreptei”, fiind valoarea lui y când x = 0; nu are semnificaţie
independentă, putând avea sens pozitiv sau negativ;
b- parametru numit “coeficient de regresie”, ce arată cu cât se
modifică y, dacă x se modifică cu o unitate; în graficul de corelaţie, b
indică panta liniei drepte.
Semnul coeficientului de regresie b, indică sensul legăturii, astfel
dacă:
b>0 ⇒ legătură directă;
b=0 ⇒ lipsa legăturii;
b<0 ⇒ legătură inversă.
Operaţia de înlocuire a termenilor înregistraţi, obţinuţi din
observare (yi), cu termenii teoretici, obţinuţi din calcul (yxi), ce
elimină variaţiile întâmplătoare şi evidenţiază tendinţa esenţială, se
numeşte ajustare.
Funcţia de ajustare, reprezentată printr-o dreaptă de regresie este:
y xi = a + bxi i = 1, n
Iar valorile înregistrate sunt de forma:
y i = a + bxi + ε i i = 1, n
Ajustarea se exprimă astfel:
yi − y xi = a + bxi + ε i − a − bxi = ε i
Se poate spune că estimarea parametrilor se bazează pe determinarea
funcţiei care minimizează erorile de ajustare. În cazul în care factorul
x este determinant pentru y, iar legătura este liniară, atunci valorile
ecuaţiei de regresie (yxi) trebuie să prezinte abateri minime faţă de
valorile înregistrate yi.

86
Întrucât aceste abateri se pot produce într-un sens sau altul, ele
sunt ridicate la pătrat, iar metoda se numeşte metoda celor mai mici
pătrate.
Determinarea parametrilor a şi b se face prin minimizarea funcţiei
de două variabile, ce are forma:

( )
n 2

F (a, b ) = ∑ y i − y xi = min
i =1
sau

∂F (a, b ) ∂F (a, b )
=0 =0
∂a n
∂b
2

F (a, b ) = ∑ ( y i − a − bxi ) = min


i =1
2∑ ( y i − a − bxi ) ⋅ xi = 0
Minimul funcţiei, se obţine prin derivarea funcţiei:

2∑ ( y i − a − bxi ) ⋅ 1 = 0

Rezultă sistemul:

Σa + Σbxi - Σyi = 0
Σaxi +Σbxi2 - Σxiyi = 0

Din care se obţine sistemul de ecuaţii:

na + bΣxi = Σyi
aΣxi + bΣxi2 = Σxiyi

Prin rezolvarea acestui sistem se obţin parametrii a şi b, iar pe baza lor


se calculează valoarea ecuaţiei de regresie pentru fiecare valoare a
caracteristicii x, respectiv:

x=
∑x i
y=
∑y i

n n
yxi = a + bxi , iar apoi se trece la ajustare.

87
Dacă funcţia de ajustare (yxi ) este corect aleasă şi datele utilizate
satisfac condiţia de omogenitate şi volum, atunci seria ajustată
exprimă clar tendinţa manifestată în dependenţa fenomenului.
Având calculate Σxi , Σyi şi cunoscând valoarea lui n, se pot
determina:
Înlocuind aceste valori în ecuaţia dreptei de regresie se obţine:

b=
∑ (x − x )(y − y )
i i

∑ (x − x )
2
i

x =a + bx şi rezultă a = y - bx ,


ceea ce dovedeşte că dreapta de regresie trece prin punctul
mediu (x ,y ).

IV.3.1.2. Regresia simplă neliniară: parabolă, exponenţială,


hiperbolică.

1. Modelul parabolei de gradul II este de forma:

y = a +bx +cx2 + ε

Funcţia de ajustare este reprezentată prin ecuaţia de regresie:

yxi = a +bxi +cxi2 ; i = 1,2,…,n

unde: a,b,c – parametrii necunoscuţi ce trebuie estimaţi.


Similar modelului liniar, se utilizează metoda celor mai mici pătrate
pentru estimarea lui a,b,c, prin minimizarea funcţiei:

( )
n 2

F(a ,b ,c ) = ∑ y i − y xi
i =1
obţinând sistemul de ecuaţii normale:
na + bΣxi + cΣxi2 = Σy
aΣxi +bΣxi2 +cΣxi3 = Σxiyi
aΣxi2 +bΣxi3 + cΣxi4 =Σxi2yI

88
Valorile obţinute pentru parametrii a,b,c se introduc în ecuaţia de
regresie şi se determină valoarea ecuaţiei pentru fiecare valoare a
caracteristicii xI , după care se trece la ajustare.

2. Modelul exponenţial are forma:


y = abx +ε
iar funcţia de ajustare este funcţia exponenţială:

yxi = abxi; i =1,2,…n; a,b∈R+


Funcţia se logaritmează transformând-o în model liniar:
lgyxi = y’ ; lga = a’ şi lgb = b’

atunci se obţine:
y’ = a’ +b’ xi
Se aplică în continuare metoda celor mai mici pătrate, ca şi în cazul
regresiei liniare simple şi se obţine sistemul de ecuaţii normale:

na’ +b’Σxi = Σyi’


a’Σxi + b’Σxi2 = Σxiyi’

Parametrii a şi b se obţin prin antilogaritmare, se înlocuiesc în


ecuaţia de regresie, se obţin valorile lui yxi şi se trece la ajustare.

3. Modelul hiperbolic exprimă dependenţa inversă dintre două


caracteristici şi are forma:

b'
y =a+ +ε
x

Ajustarea se realizează prin ecuaţia de regresie:


b
y xi = a +
xi

Pentru estimarea parametrilor a, b, se utilizează metoda celor mai


mici pătrate, parametrii obţinându-se prin rezolvarea sistemului de
ecuaţii normale:

89
În continuare ajustarea se realizează prin parcurgerea aceloraşi
paşi ca la modelele anterioare.
1 1 y
1 a∑ + b∑ 2 = ∑ i
na + b∑ = ∑ y i xi xi xi
xi

IV.3.2. Modelul regresiei multiple (multifactoriale), exprimă


dependenţa caracteristicii rezultative (y), în raport cu un număr mare
de factori, respectiv de caracteristici factoriale şi are forma:
Y = f(x1, x2,…xk,…xm) + ε; xk – caracteristici factoriale
independente
1. Regresia multiplă liniară este cel mai cunoscut model
multifactorial, utilizat atunci când caracteristica rezultativă (y) este
liniar dependentă faţă de caracteristicile factoriale (xk) şi se exprimă
cu relaţia:
yi = a + b1x1i + b2x2i +…+ bkxki +…+ bmxmi +εi
i = 1,2,…, n – număr de observaţii
k= 1,2,…, m – numărul caracteristicilor factoriale
bk, k = 1,2,…, m – coeficienţii de regresie multiplă care arată cu
cât se modifică y, dacă xk se modifică cu o unitate.
Parametrii se obţin utilizând metoda celor mai mici pătrate,
minimizând funcţia:

∑ (y ) = ∑ [y
n
− (a + b1 x1i + b2 x 2i + ... + bm x mi )]
2 2
i − y xi i
i =1
Similar modelului regresiei simple liniare, prin derivarea funcţiei
în raport cu toţi parametrii a, bk, se obţine sistemul de ecuaţii normale
cu k = 1, 2,…,m caracteristici factoriale şi m + 1 ecuaţii:
na + b1Σx1i + b2Σx2i + …+ bmΣxmi = Σyi
aΣx1i + b1Σx1i2 +b2Σx1ix2i +…+ bmΣx1ixmi = Σx1iyi
aΣx2i + b1Σx1ix2i + b2Σx2i2 +…+ bmΣx2ixmi = Σx2iyi
.
.
aΣxmi + b1Σx1Ixmi +…+ bmΣxmi2 = Σxmiyi

90
2. Regresia multiplă curbilinie se utilizează în cazul când
caracteristicile factoriale acţionează prin multiplicarea lor, iar
influenţele sunt proporţionale cu valoarea acestora.
Modelul are forma:

yi = ax1i ⋅ x 2i ⋅ x3i ⋅ ... ⋅ x mi +ε


b1 b2 b3 bm

Liniarizarea modelului se face prin logaritmare, după care se


estimează parametrii funcţiei liniare, prin metoda celor mai mici
pătrate. Procedeul este similar regresiei simple, dar calculele sunt mai
laborioase.
În practică, atunci când legătura între fenomene este slabă,
metoda regresiei trebuie îmbinată cu metoda corelaţiei, ce prin
calculul indicatorilor, măsoară intensitatea legăturii.

IV.4. Măsurarea intensităţii legăturilor. Metoda corelaţiei

Metoda corelaţiei, permite o ierarhizare a factorilor de influenţă.


Aceasta constă în calcularea unor indicatori ai corelaţiei, ce măsoară
intensitatea legăturii între două sau mai multe caracteristici,
exprimând, cât de strânsă este legătura dintre ele.
a) Covariaţia este un indicator ce se utilizează pentru măsurarea
legăturii liniare între o caracteristică rezultativă (y) şi una factorială.
Cu ajutorul graficului de corelaţie se reprezintă variabilitatea
caracteristicilor x şi y, în jurul mediilor lor. Mediile x şiy definesc
patru cadrane, abaterile valorilor individuale faţă de media lor având
semne diferite în cele patru cadrane, după cum se observă în graficul
alăturat:
yi
II(-,+) I(+,+)

III(-,-) IV(+,-)

Fig.4.3. Graficul de corelaţie

91
Formula de calcul a covariaţiei este:

COV( x , y ) =
∑ (x i − x yi − y)( )
n

În cadranele I şi III COV(x,y) >0 ⇒ evidenţiază o legătură directă.


În cadranele II şi IV COV(x,y) <0 ⇒ evidenţiază o legătură inversă.
Dacă COV(x,y) = 0 ⇒ x, y sunt independente, între ele nu există
legătură.
Cu cât valoarea covariaţiei este mai mare, cu atât legătura este mai
intensă şi invers.

b) Coeficientul de corelaţie liniară simplă măsoară intensitatea


în cazul legăturilor liniare, fiind independent de unităţile de măsură
ale caracteristicilor din care se determină.
Formula de calcul este:

 xi − x  y i − y 
∑  σ  σ 
rx , y =
 x  y = ∑ (x i )(
− x yi − y ) = cov(x, y )
n nσ x σ y σ xσ y

Dacă înlocuim mediile şi abaterile medii pătratice cu


formulele lor de calcul, se obţine formula de calcul a coeficientului de
corelaţie liniară simplă:

n∑ xi yi − ∑ xi ∑ yi
rx , y =
[n∑ x i
2 2
][
− (∑ xi ) n∑ yi − (∑ yi )
2 2
]
In practica statistică se utilizează frecvent această formulă, deoarece
conţine elemente deja calculate la ecuaţiile de regresie.
Coeficientul de corelaţie ia valori în intervalul [-1, 1].
Dacă: r∈(0, 1] → legătură directă;

92
r∈[-1, 0) → legătură inversă;
r=0 →x şi y sunt caracteristici independente sau
necorelate liniar.
Cu cât rezultatul coeficientului r se apropie de 1 sau de –1, cu atât
legătura este mai intensă.

c) Coeficientul de corelaţie liniară multiplă măsoară


intensitatea între o caracteristică rezultativă (y) şi două sau mai multe
caracteristici factoriale (x). Cel mai des utilizat coeficient, este cazul
corelaţiei dintre o caracteristică rezultativă (y) şi două caracteristici
factoriale (x1, x2), cu formula de calcul:

r 2 y / x1 + r 2 y / x2 − 2ry / x1 ⋅ ry / x2 ⋅ rx1 / x2
ry / x1 , x2 =
1 − r 2 x1 / x2

unde:

n∑ x1 y − ∑ x1 ∑ y
ry / x1 =
[n∑ x 1
2 2
][
− (∑ x1 ) n∑ y 2 − (∑ y )
2
]
n∑ x 2 y − ∑ x 2 ∑ y
ry / x 2 =
[n∑ x 2
2 2
][
− (∑ x 2 ) n∑ y 2 − (∑ y )
2
]

n∑ x1 x 2 − ∑ x1 ∑ x 2
rx1 / x2 =
[n∑ x 1
2 2
][
− (∑ x1 ) n∑ x 2 − (∑ x 2 )
2 2
]
Rezultatul se interpretează în acelaşi mod ca şi cel al coeficientului
de corelaţie simplă.

93
d) Raportul de corelaţie este indicatorul utilizat pentru
măsurarea intensităţii în cazul legăturilor neliniare. Calculul se
bazează pe descompunerea dispersiei totale a caracteristicii rezultative
y (σy2), în dispersia valorilor observate faţă de valorile estimate,
printr-o ecuaţie de regresie (σ2y/r) şi dispersia valorilor estimate faţă de
medie (σ2r/y), utilizând formula:

σ2y = σ2y/r + σ2r/y

sau

∑ (y y ) ∑ (y ) + ∑ (y )
2 2 2
− y xi −y
=
i i xi

n n n

unde yxi – este ecuaţia de regresie sub forma unei parabole,


hiperbole, exponenţiale sau de orice alt tip.
Raportând dispersiile parţiale la dispersia totală, se obţin:
coeficientul de determinaţie (R2x,y) şi coeficientul de nedeterminaţie
(K2x,y).
σ 2r / y σ 2y/r
R 2
= 2 K2 =
x, y
σ y σ 2y

Prin înlocuirea elementelor de calcul ale dispersiilor, cei doi indicatori


se mai pot calcula şi cu ajutorul următoarelor relaţii:

∑ (y )
2
−y
∑ (y )
xi 2
σ 2r / y n −y
= 2 = =
2 xi

∑( ) ∑ (y − y)
R x, y
σ y yi − y
2
i
2

94
∑ (y ) 2
− y xi
∑ (y − y )
i 2
σ 2y/r n
= 2 = =
2 i xi

∑( ) ∑ (y − y )
K x, y
σ y yi − y
2
i
2

n
Între R2 şi K2 se stabilesc următoarele relaţii:
R2x,y + K2x,y = 1 R2xy = 1 – K2x,y
Dacă R2x,y > K2x,y ⇒ caracteristica factorială (K) este factor
determinant pentru variaţia caracteristicii rezultative.
Raportul de corelaţie (Rx,y) se obţine ca rădăcină pătrată a
coeficientului de determinaţie:

R xy = R 2 xy Rx, y = 1 − K 2 x, y

∑ (y ) ∑ (y − y )
2 2
−y
Rx, y = Rx, y =
xi i xi

∑ (y − y) ∑ (y − y )
2 2
i i

Unde: Rx,y ∈ [0, 1]. Cu cât valoarea lui Rxy este mai apropiată de 1,
cu atât legătura este mai strânsă.

e) Coeficientul de asociere se utilizează pentru


măsurarea intensităţii legăturii dintre două caracteristici nenumerice,
alternative. Datele rezultate din observare se sistematizează şi se
prezintă într-un tabel de asociere, după cum rezultă din tabelul nr.4.1.
Elementele de calcul necesare pentru determinarea unui coeficient de
asociere
Tabel nr.4.1.

Variantele caracteristicii Variantele caracteristicii TOTAL


factoriale x rezultative y
y1 y2
x1 f11 f12 f11 + f12
x2 f21 f22 f21 + f22
TOTAL f11 + f21 f12 +f22 Σfij

95
Gradul de asociere dintre cele două caracteristici x şi y se măsoară
cu ajutorul coeficientului de asociere Yule, notat Cay obţinut pe baza
următoarei formule:
f11 f 22 − f 21 f12
C ay =
f11 f 22 + f 21 f12

Unde: Cay ∈ [-1; 1]


Dacă Cay ∈ (0, 1] , rezultă că între x şi y există o asociere
directă.
Dacă Cay ∈ [-1, 0), atunci între x şi y asocierea este inversă.
Dacă Cay = 0, nu există legătură între cele două
caracteristici.

f) Coeficientul de contingenţă are aceeaşi semnificaţie


ca şi coeficientul de asociere şi se calculează cu formula:

f11 f 22 − f 21 f12
Cc =
( f11 + f12 )( f 21 + f 22 )( f11 + f 21 )( f12 + f 22 )

Între cei doi coeficienţi , prezentaţi anterior, se verifică


relaţia: Cc > Cay.

g) Coeficienţii de corelaţie a rangurilor se utilizează


pentru măsurarea intensităţii legăturii dintre cele două caracteristici, în
cazul în care una sau ambele caracteristic sunt exprimate numeric,
respectiv sunt cuantificate cu ajutorul scalei ordinale prin atribuirea de
ranguri sau în cazul caracteristicilor exprimate ca mărimi relative de
intensitate.
În cazul acestor caracteristici, pentru determinarea coeficienţilor
de corelaţie a rangurilor, se parcurg următoarele etape:
1) se ordonează valorile ambelor caracteristici crescător sau
descrescător;
2) se acordă ranguri atât pentru caracteristica x, cât şi pentru
caracteristica y, ranguri ce se notează Rx , respectiv Ry , astfel:
- rangul pentru x va fi Rx = 1, 2, … , n unde n reprezintă
numărul de observaţii;

96
- rangul pentru y va fi Ry = 1, 2, …, n;
3) se determină diferenţele de rang pentru fiecare cuplu de valori
(xi, yi): Di = Ryi - Rxi ;
4) se stabileşte pentru fiecare valoare a caracteristicii rezultative
(yi) asociată caracteristicii factoriale (xi):
- numărul de ranguri superioare, notat P;
- numărul de ranguri inferioare, notat Q;
5) se calculează scorul S, după formula:S = P - Q
Legătura dintre x şi y se caracterizează cu ajutorul următorilor
coeficienţi de corelaţie a rangurilor:
- Coeficientul lui Spearman care are formula:
n
6∑ Di
2

CS = 1 − i =1

n3 − n

- Coeficientul Kendall are forma:


S
CK =
(
0,5 n 2 − n )
Unde: S – scorul determinat;
n – numărul de cupluri.
Cei doi indicatori iau valori în intervalul :[-1; 1].
Dacă CS şi CK ∈ (0; 1] , între x şi y există o legătură directă.
Dacă CS şi CK ∈ [-1; 0) , între x şi y este o legătură inversă.
Cu cât se apropie de –1 şi de 1, cu atât legătura este mai intensă.

97
CAPITOLUL V

SONDAJUL STATISTIC

V.1. Concepte de bază

Sondajul statistic sau observarea selectivă reprezintă o metodă


de investigaţie statistică prin care se obţin informaţii necesare şi
suficiente, cu grad de exactitate acceptabil despre întreaga
colectivitate cercetată, prin observarea numai a unei părţi a acesteia,
numite eşantion sau mostră.
Datele de selecţie, rezultate din observarea eşantionului se
prelucrează, iar indicatorii obţinuţi se extind, în anumite condiţii de
probabilitate asupra întregii colectivităţi. Extinderea rezultatelor de la
eşantion la colectivitate se poate face numai dacă eşantionul este
reprezentativ (ceea ce presupune ca într-un număr mai mic de unităţi
ce formează împreună un eşantion, să regăsim aceleaşi trăsături
esenţiale ca şi în întreaga colectivitate supusă cercetării).
Între indicatorii determinaţi (medie, dispersie) prin prelucrarea
datelor la nivelul eşantionului şi cei calculaţi la nivelul colectivităţii
apar unele diferenţe în plus sau în minus, numite erori de eşantionare
sau erori de selecţie. Aceste erori reprezintă abaterile între rezultatul
obţinut prin sondaj şi valoarea reală a unei caracteristici pentru
colectivitatea studiată. Cu cât eroarea de selecţie este mai mică, cu atât
gradul de precizie a selecţiei va fi mai mare şi invers.
Se consideră suficient de reprezentativ eşantionul care nu
conduce la erori faţă de colectivitatea de bază, decât cel mult ±5%.
Eroarea de selecţie se exprimă sintetic prin coeficientul de
reprezentativitate (r):

r = (| x – m | / m) ⋅ 100 -5% ≤ r ≤ 5%,


Unde: x – media eşantionului;
m – media colectivităţii, cunoscută dintr-o cercetare anterioară.

98
Diferenţa dintre media colectivităţii şi media eşantionului se
numeşte eroare de reprezentativitate.
Erorile de reprezentativitate pot fi:
- sistematice, care provin din nerespectarea principiului
fundamental al eşantionării şi anume nerespectarea caracterului aleator
al prelevării unităţilor;
-întâmplătoare, care nu pot fi evitate, şi sunt cauzate de un
număr mare de factori, dar ele sunt previzibile.

Pe lângă avantajele sale, operativitate, rapiditate,


economicitate, sondajul are şi anumite limite, date tocmai de apariţia
erorilor de selecţie şi de dificultăţile legate de alcătuirea eşantionului.
Problema constă în găsirea acelei mărimi a eşantionului, suportabilă
din punct de vedere al costului, ce oferă gradul de precizie acceptabil,
reflectând fidel colectivitatea din care s-a extras.

V.2. Tipuri de sondaj şi procedee de alcătuire a


eşantioanelor

După modul de organizare a colectivităţii generale şi după


modul de selecţie a unităţilor în eşantion, se disting mai multe tipuri
de sondaj:
A. Sondaje aleatoare (probabiliste):
- sondajul simplu repetat şi nerepetat;
- sondajul tipic (stratificat);
- sondajul de serii;
- sondajul în mai multe trepte;
- sondajul secvenţional.
B. Sondaje cu extracţie nealeatoare:
- sondajul dirijat;
- sondajul sistematic (sau mecanic).
Sondajul aleator simplu este sondajul ce corespunde cel mai bine
principiului fundamental al selecţiei, asigurând caracterul aleator al
prelevării. Acesta se aplică în special în cazul colectivităţilor
omogene.
În cazul acestui tip de sondaj, unităţile statistice sunt prelevate
la întâmplare, fără preferinţe, fiecare unitate a colectivităţii având
şanse egale de a face parte din eşantion. Dacă unităţile extrase, după

99
înregistrarea caracteristicilor urmărite sunt reintroduse în colectivitate,
atunci se aplică sondajul simplu “nerepetat”.
Procedeele ce pot fi utilizate pentru alcătuirea eşantionului
sunt:
1) Procedeul bilei revenite şi nerevenite;
2) Procedeul tabelului numerelor aleatoare;
3) Procedeul mecanic.

1) Procedeul bilei revenite şi nerevenite, este analog urnei lui


Bernoulli şi presupune parcurgerea următoarelor etape:
-se numerotează unităţile colectivităţii generale şi fiecare
număr este înregistrat pe o bilă (bileţele)
-se introduc într-o urnă bilele, se amestecă şi se extrage la
întâmplare câte un bileţel. Unitatea statistică ce are numărul extras
intră în alcătuirea eşantionului.
Bila extrasă poate fi reintrodusă în urnă şi atunci se aplică
schema sondajului simplu repetat, se amestecă din nou bilele şi se face
o nouă extragere sau bila nu se mai introduce în urnă, urmându-se
schema sondajului simplu nerepetat.

2) Procedeul tabelului numerelor aleatoare, se aplică de regulă pentru


colectivităţi de mari dimensiuni, unde procedeul anterior nu este
adecvat. Pentru formarea eşantionului se folosesc diferite tipuri de
tabele ce cuprind numere aleatoare formate din cifre grupate câte
două, două cu trei sau alte variante, aşezate pe coloane şi rânduri în
mod întâmplător. Tabelele se pot obţine cu ajutorul unor procedee de
amestecat numere sau sunt generate pe calculator prin programe
specifice.
Etapele specifice acestui procedeu sunt:
- se stabileşte volumul eşantionului;
- pentru selectarea unităţilor eşantionului se citesc din tabel
numerele aleatoare, punctul de începere al citirii alegându-se arbitrar;
- citirea se face de la stânga la dreapta şi de sus în jos în
ordinea crescătoare a coloanelor şi rândurilor ;
- dacă se ajunge la capăt se reîncepe citirea de la coloana 1,
rândul 1.

100
3) Procedeul mecanic este mai rapid şi presupune stabilirea
pasului de numărare şi a unităţii de la care se va porni, întrucât
includerea unităţilor în eşantion se face asemănător unei progresii
aritmetice.
Aplicarea acestui procedeu presupune parcurgerea
următoarelor etape:
- Se calculează raţia progresului, respectiv pasul de numărare,
cu relaţia:
p = N/n, unde N – volumul colectivităţii totale
n – volumul eşantionului

- Se determină în continuare unitatea de la care se porneşte în


construirea eşantionului, având numărul de ordine înregistrat şi p.
De exemplu: pentru o colectivitate formată din 420 unităţi
statistice din care dorim să extragem prin procedeul mecanic un
eşantion format din 35 unităţi, pasul de măsurare va fi:
p = N/n = 420/35 = 12
Punctul de plecare va fi una din unităţile statistice cuprinse
între 1 şi 12. Să presupunem că acesta este 3, atunci eşantionul va fi
format din următoarele unităţi: x, x + p, x + 2p, x + 3p,....

V.3. Estimarea mediei şi dispersiei. Eroarea medie de


reprezentativitate

În cazul cercetării statistice prin metoda sondajului se lucrează


cu indicatori pereche, calculaţi atât la nivelul eşantionului cât şi al
colectivităţii dintre care cei mai importanţi sunt media şi dispersia:

- media eşantionului: x = Σxi / n

- media colectivităţii: m = Σxi / N

- dispersia eşantionului:

S2 = Σ(xi - x)2 / n sau S2 = Σ(xi - x)2 / (n-1)

- dispersia colectivităţii:

101
σ2 = Σ(xi - m) / N

Pe baza acestor indicatori se pot determina alţi indicatori:


- dispersia mediilor de sondaj de la media generală σ2x ;
- abaterea medie pătratică a mediilor de sondaj de la media
generală, σx , denumită şi eroare medie de reprezentativitate.
Indicatorii obţinuţi la nivelul eşantionului pentru a fi
estimatori corecţi ai indicatorilor colectivităţii generale, trebuie să
îndeplinească anumite condiţii:
a) să fie estimaţii nedeplasate, adică valoarea medie a
indicatorilor de sondaj trebuie să fie egală cu indicatorul
corespunzător întregii colectivităţi;
b) să fie estimaţii consistente, adică indicatorul de sondaj să
conveargă în probabilitate, pentru un volum mare al
eşantionului, către indicatorul teoretic din colectivitatea
generală;
c) să fie estimaţii eficiente, adică să aibă dispersie minimă.

Eroarea medie de reprezentativitate (σx ) se calculează distinct


pentru fiecare tip de sondaj cu ajutorul unor formule specifice.

a)Sondajul aleator repetat – întrucât la acest tip de sondaj unităţile


extrase se reintroduc în colectivitate, toate unităţile au aceeaşi
probabilitate de a face parte din eşantion:

p = 1 / N ; N – volumul colectivităţii generale

Deoarece aceeaşi unitate statistică poate fi extrasă de mai


multe ori, rezultă că sondajul repetat dă naştere unor erori de sondaj
mai mari.
Numărul de eşantioane posibile în acest tip de sondaj este egal
cu “N”.
Se folosesc următoarele notaţii: N – volumul colectivităţii
generale; n – volumul eşantionului.

În practica statistică, eroarea medie de reprezentativitate, se


determină pornind de la relaţia demonstrată în teoria sondajului,

102
potrivit căreia dispersia mediilor tuturor eşantioanelor de la media
colectivităţii generale (∆(x) sau σ2x ) înmulţită cu volumul
eşantionului (n):

σ2 = D(x) ⋅ n sau σ2 = σ2x ⋅ n , de unde rezultă


D(x) = σ2 / n sau σ2x = σ2 / n

Ceea ce arată că în cazul sondajului rezultat dispersia mediilor


tuturor eşantioanelor de volum “n” este de n ori mai mică decât
dispersia colectivităţii generale.
Dacă dispersia colectivităţii generale (σ2) nu se cunoaşte,
atunci aceasta poate fi înlocuită cu eşantionul ei (S2) stabilit pe baza
unui eşantion de volum n, pe baza ipotezei că σ2 ≅ S2.
Aşadar:
σ2x = S2 / n , unde S 2 =
1
n
(
∑ xi − x )
2

Eroarea medie de reprezentativitate (σx), care este radicalul


dispersiei, se va determina după formula:

σ2 σ S
σx = = ≅
n n n

În teoria sondajului se demonstrează că S2 este un estimator


deplasat şi se poate obţine un estimator nedeplasat utilizând relaţia:
n
Sˆ 2 = ⋅S2
n −1

În cazul în care eşantionul este de volum mic, atunci:

Sˆ 2 =
1
n −1
∑ xi − x( )
2

b). Sondajul aleator nerepetat presupune ca o unitate odată


extrasă, să nu mai revină în colectivitatea generală, aşadar şansa
fiecărei unităţi de a intra în eşantion creşte pe măsura efectuării

103
extragerilor, volumul colectivităţii generale micşorându-se treptat cu
câte o unitate.
Probabilităţile de a fi incluse în eşantion vor fi pe rând:
- pentru prima extragere: p1 = 1 / N p=1/N
- pentru a doua extragere: p2 = 1 / (N – 1) p = 1 / (N – 1)
- pentru a treia extragere: p3 = 1 / (N – 2) p = 1 / (N – 2)
1
- pentru a n-a extragerea p n =
N − (n − 1)

La terminarea extragerilor, numărul unităţilor rămase va fi


N-n, unde :
N – volumul colectivităţii generale;
n – volumul eşantionului.
Numărul eşantioanelor posibile pentru acest tip de sondaj este
dat de formula combinărilor:

N!
CnN =
n!( N − n )!

În cazul sondajului aleator nerepetat, dispersia mediilor de


sondaj trebuie corectată, înmulţind-o cu raportul (N – n) / (N –1),
astfel:
σ2 N −n S2 N −n
σ x2 = ⋅ sau σ x2 = ⋅ unde
n n −1 n N −1

S2 =
1
n
(
∑ xi − x )2
este estimatorul dispersiei σ2, stabilit pe

baza unui eşantion, având ipoteza că σ2 ≅ S2 iar eroarea medie de


reprezentativitate va fi:

σ2 N −n σ N −n S N −n
σx = ⋅ = ⋅ ≈ ⋅
n n −1 n N −1 n n −1

104
N −n
Raportul se numeşte coeficient de corecţie a erorii
N −1
medii de reprezentativitate.
Pentru colectivităţile mari, nu se mai scade 1 de la numitor, iar
coeficientul de corecţie a erorii de reprezentativitate devine:
N −n n
= 1−
N N
unde raportul n / N poartă denumirea de proporţie de sondaj.
N −n
În calcule, pentru n / N <0,2 – coeficientul nu se ia
N −1
în considerare.
Coeficientul de corecţie a erorii medii de reprezentativitate
este întotdeauna subunitar, de aceea eroarea sondajului nerepetat este
întotdeauna mai mică decât eroarea sondajului repetat.
În general, precizia estimaţiei mediei colectivităţii generale
(m) prin media eşantionului (x ), exprimată sintetic cu ajutorul erorii
medii de reprezentativitate (σx) depinde mai mult de volumul
eşantionului (n) decât de volumul colectivităţii generale (N).

V.4. Precizia estimaţiei. Eroarea limită

Media eşantionului (x ) estimează cu atât mai exact media


colectivităţii generale (m) cu atât diferenţa x – n este mai mică.
Notăm cu δ eroarea limită, ce caracterizează precizia
estimaţiei. Dacă δ ∈|R+ , δ >0 şi |x - m| < δ, atunci cu cât δ este mai
mică cu atât estimaţia este mai precisă.
Putem indica astfel intervalul despre care să afirmăm cu o
probabilitate dată, că include media estimată a colectivităţii (m). Acest
interval este (x - δ , x + δ) şi se numeşte interval de încredere.
Probabilitatea ca intervalul (x - δ , x + δ) să includă media
necunoscută “m” este o probabilitate luată de regulă foarte apropiată
de 1 (100%), respectiv 0,95 (95%) ,..., 0,999 (99,9%) şi notată cu γ,
adică:
P( |x - m| < δ) = γ sau P(x - δ < m < x + δ) = γ

105
În cazul formării tuturor eşantioanelor posibile, suma probabilităţilor
de apariţie este egală cu 1. În practică însă, nu se cunosc aceste medii
de sondaj şi nici probabilităţile lor de apariţie, de aceea în calcularea
erorii limită (δ) se porneşte de la relaţia erorii medii de
reprezentativitate (σx) căreia se aplică un coeficient z.
σ2
Astfel: δ = σx ⋅ z , respectiv δ = z ⋅ → pentru sondajul
n
aleator repetat
σ2 N −n
δ =z ⋅ pentru sondajul aleator nerepetat
n N −1
Coeficientul z se determină în funcţie de probabilitatea cu care
se garantează rezultatele şi este tabelat, fiind argumentul funcţiei de
repartiţie normală Gauss-Laplace:
z 1
− z2
φ (z ) =
1
⋅ ∫e 2
dz
2π −z

Argumentul φ(z) are valori cu atât mai mari, mai apropiate de


1 cu cât z ia valori mai mari.
Rezultă că eroarea limită (δ) este şi ea o mărime variabilă,
depinzând de eroarea medie de reprezentativitate a mediilor de sondaj
(σx) şi de coeficientul de probabilitate (z).
În funcţie de probabilitatea dată:
- se ia din tabel valoarea lui z;
- se înlocuieşte în relaţia erorii limite δ = z ⋅σx;
- se determină intervalul de încredere (x - δ , x + δ).

V.5. Determinarea volumului eşantionului

a) Cazul sondajului repetat


Volumul eşantionului se determină pornind de la eroarea limită
maxim admisă, (δ), stabilită în funcţie de precizia necesară de
asigurat, astfel:

106
σ σ2
δ =z , relaţia ridicată la pătrat, devine: δ 2 = z 2 ⋅ , de
n n
unde se obţine volumul eşantionului:

z 2 ⋅σ 2
n= , unde z se citeşte în tabelele funcţiei Gauss-
δ2
Laplace.
Dacă dispersia, în colectivitate generală presupusă normală,
nu este cunoscută, atunci ea poate fi estimată cu ajutorul dispersiei de
sondaj, calculată pe baza unui eşantion de volum redus, extras din
colectivitatea de bază.
Astfel, n = (z2 ⋅ σ2) / δ2 devine:
t n −1,γ ⋅ Sˆ 2
n= , unde,
δ2
t2n-1 este valoarea tabelară a variabilei Student cu n-1 grade de libertate
corespunzătoare nivelului de încredere γ.
b) Cazul sondajului nerepetat
Pentru determinarea volumului eşantionului în cazul sondajului
nerepetat este necesar să se cunoască şi volumul colectivităţii
generale.
Formulele cu ajutorul cărora se calculează volumul eşantionului în
acest caz, sunt următoarele:

σ2  n 2 σ 
2
n
δ =z 1 −  se ridică la pătrat δ = z
2
1 − 
n  N n  N

N ⋅ z 2 ⋅σ 2 z 2σ 2
n= ⇒ n=
N δ 2 + z 2σ 2 z 2σ 2
δ2 +
N

107
Dispersia generală a colectivităţii (σ2), se poate afla din
cercetări anterioare, dintr-o cercetare prealabilă organizată pentru
estimarea dispersiei sau se determină cu ajutorul formulei:

σ max 2
=
(x min ) (
2
− x + x max − x )
2

c) Sondajul tipic (stratificat) se utilizează în cazul colectivităţilor


ce sunt sau pot fi împărţite în grupe omogene calitativ distincte
sau tipice.
Formarea eşantionului se realizează astfel: din fiecare grupă se
extrage un număr fix de unităţi folosind unul din procedeele de
prelevare aleatoare, astfel fiecare grupă va fi reprezentată în
eşantion, ceea ce asigură eşantionului un grad mare de
reprezentativitate.
În cazul sondajului tipic se verifică regula de adunare a
dispersiilor, potrivit căreia dispersia pe total colectivitate (σ20)
va fi egală cu suma mediei dispersiilor de grupă (σ2) şi
dispersiei dintre grupe (δ2).

σ2 = σ2 + δ2
Volumul eşantionului se determină după formulele:

n = (z2 ⋅ σ2) / δ2 – pentru sondajul tipic repetat


şi
2
z 2 ⋅σ
n= 2
- pentru sondaj tipic nerepetat
z 2 ⋅σ
δ +
2

d) Sondajul de serii se utilizează în cazul în care colectivitatea


generală este sau poate fi împărţită într-un număr oarecare de
unităţi complexe de sine-stătătoare, denumite serii (sau cuiburi)
şi formate din unităţi statistice simple.
Eşantionul se formează astfel: seriile în care a fost împărţită
colectivitatea generală se numerotează de la 1 la R. Din aceste

108
serii se aleg întâmplător r serii, folosind unul din procedeele
prezentate. Seriile selectate fac parte din eşantion şi se
înregistrează întregul.

e) Sondajul cu extracţie nealeatoare


Sondajul dirijat, presupune includerea în eşantion numai a
unităţilor pe care cercetătorul le consideră reprezentative, apropiate
de media ce trebuie estimată.
În practică, deseori este preferată eşantionarea dirijată deoarece
este mai ieftină decât selecţiile întâmplătoare, corespunde mai bine
scopului cercetării sau există situaţii când baza de sondaj este
incompletă sau inaccesibilă.
În multe situaţii există posibilitatea combinării sondajului aleator
cu sondajul dirijat, folosind avantajele fiecăruia.

109
BIBLIOGRAFIE

Andrei T., Stancu S., Statistica, Ed. ALL, Bucureşti, 1994


Andrei T., Stancu S., Pele D.T., Statistică. Teorie şi aplicaţii, Ed.
Economică, Bucureşti, 2002
Baron T., Biji E., Statistică teoretică şi economică, Ed. Didactică şi
Pedagogică,Bucureşti, 1996
Baron T., Korka M., Pecican E., Stănescu M., Statistică,
Ed.Didactică şi Pedagogică, Bucureşti, 1981
Baron T., Anghelache C., Ţiţan E., Statistică, Ed. Economică,
Bucureşti, 1996
Bădiţă M., Baron T., Korka M., Statistică pentru afaceri, Ed.
Eficient, Bucureşti, 1998
Bădiţă M., Cristache S. E., Dicţionar statistico-economic explicativ,
Ed. Luceafărul, Bucureşti, 2001
Biji E.(coordonator), Statistică teoretică şi economică, Ed. Didactică
şi Pedagogică,Bucureşti,1991
Biji E., Tővissi L., Bădiţă M., Statistică teoretică, ASE Bucureşti,
1984
Biji M., Biji E., Statistică teoretică, Ed. Didactică şi Pedagogică,
Bucureşti, 1979
Biji M., Dicţionar statistic economic, D.C.S., Bucureşti,1962
Calot Gr., Cours de statistique descriptive, Ed. Dunod, Paris, 1975
Capanu I., Mitruţ C-tin, Wagner P., Agregate macroeconomice.
Sistemul conturilor naţionale , Ed. ALL, Bucureşti, 1994
Capanu I., Wagner P., Statistica macroeconomică, CNS,
Bucureşti,1991
Dubois J., Methodologie economique et technique statistique,
Montpellier, 1995
Florea I., Statistică, vol.I., Universitatea Cluj- Napoca, 1986
Fourastie S.L., Statistiques appliquees a l’economie, Mason,
Paris,1993
Grais B., Statistique descriptive, Dunod, Paris, 1977
Guyon X., Statistique et econometrie, Ellipes, Paris, 2001
Hartley A., Bazele statisticii, Ed. Niculescu, Bucureşti, 1999

110
Isaic-Maniu Al., Grădinaru A., Voineagu V., Mitruţ C-tin,
Statistică teoretică şi economică, Ed. Tehnică, Chişinău, 1994
Isaic- Maniu Al., Mitruţ C-tin, Voineagu V., Statistica pentru
managementul afacerilor, ediţia a II-A, Ed. Economică, Bucureşti,
2000
Isaic- Maniu Al., Mitruţ C-tin, Voineagu V., Statistică, ediţia a II-
A, Ed. Universitară, Bucureşti, 2004
Ivănescu I. (coordonator), Statistică, Ed. Didactică şi Pedagogică,
Bucureşti, 1980
Jaba E., Statistica, Ed. Economică, Bucureşti, 1998
Kaufmann P., Statistique. Information. Estimation, Dunod, Paris,
1994
Lilea E., Goschin Z., Vătui M., Boldeanu D., Statistică aplicată, Ed.
Tribuna Economică, Bucureşti, 2002
Marin G., Puiu Al., Dicţionar de relaţii economice internaţionale,
Ed. Enciclopedică, Bucureşti, 1993
Mihoc Gh., Urseanu V., Urseanu E., Modele de analiză statistică,
Ed. Ştiinţifică şi Enciclopedică, Bucureşti, 1982
Negoescu Gh., Statistică, Ed. Zigotto, Galaţi, 1994
Negoescu Gh., Statistica ramurilor, Ed. Zigotto, Galaţi, 1995
Negoescu Gh., Ciobanu R., Bontaş A.C., Bazele statisticii pentru
afaceri, Ed. ALL BECK, Bucureşti, 1999
Niculescu I., Grădinaru G., Analiza statistică a activităţii economice
a întreprinderii, Ed. ASE, Bucureşti, 2001
Novak, Andrei, Statistică – teorie, aplicaţii, exerciţii, Ed. Sylvi,
Bucureşti, 2001
Quinet E., Series temporelles et decisions economiques, Ed. Dunod,
Paris, 1969
Roman M., Statistică financiar-bancară şi bursieră, Ed. ASE,
Bucureşti, 2003
Rotariu T., Iluţ P., Ancheta sociologică şi sondajul de opinie, Ed.
Polirom, Iaşi, 2001
Resa I.D., Statistică, Universitatea din Timişoara, 1986
Semenescu A., Statistică teoretică, statistică economic, matematici
financiare, aplicaţii informatice specializate, Ed. Matrix Rom,
Bucureşti, 2004
Şerban D., Statistica pentru studii de marketing şi administrarea
afacerilor, Ed. ASE, Bucureşti, 2004

111
Tővissi L., Isaic- Maniu Al., Statistica, ASE Bucureşti, 1994
Trebici, V., Mică enciclopedie statistică, Ed. Ştiinţifică şi
Enciclopedică Bucureşti, 1985
Yule G.U., Kendall, M.G., Introducere în teoria statisticii, Ed.
Ştiinţifică, Bucureşti, 1969
Ţarcă M., Statistică, Universitatea “Al. I. Cuza” Iaşi, 1984
Ţarcă M., Tratat de statistică aplicată, Ed. Didactică şi Pedagogică,
Bucureşti, 1998
Vaşloban E., Vaşloban G., Statistică, Ed. Univ. “Petru Maior”,
Tg.-Mureş, 1998
Voineagu V., Colibabă D., Grădinaru G., Statistică. Noţiuni
fundamentale şi aplicaţii, Ed. ASE, Bucureşti, 2002
Voineagu V., Ţiţan E., Ghiţă S., Statistică aplicată, Ed. Fundaţiei
“România de mâine”, Bucureşti, 2000
*** - Anuarul Statistic al României, 1989-2007
***- Dicţionar statistico-economic, D.C.S., Bucureşti, 1969

112

S-ar putea să vă placă și