Sunteți pe pagina 1din 280

STATISTICA

Curs 30h
Sem. 30h
harbued@ase.md
Bibliografie
1. Andrei, T.; Stancu, S.: Statistică. Teorie şi aplicaţii. Editura ALL,
Bucureşti, 1995
2. Baron, T.; Biji, E.: Statistică teoretică şi economică. Editura
Didactică şi Pedagogică, Bucureşti, 1996
3. Isaic-Maniu, Al.; Grădinaru, A.; Voineagu, V.; Mitruţ, C.:
Statistică teoretică şi economică. Editura Tehnică, Chişinău,
1994
4. Isaic-Maniu, Al.; Voineagu, V.; Mitruţ, C.: Statistica pentru
managementul afacerilor. Ediţia a II-a. Editura Economică,
Bucureşti, 1999
5. Jaba, E.: Statistică. Editura Economică, Bucureşti, 1998, 2000,
2002
6. Pecican, E. S.: Econometrie.Editura ALL, Bucureşti, 1994
7. Trebici, V.(Coord.):Mică enciclopedie de statistică. Editura
Ştiinţifică şi Enciclopedică, Bucureşti, 1985
1. Obiectul de studiu şi metoda
1.1. Locul şi particularităţile statisticii ca
obiect şi metodă în sistemul
ştiinţelor sociale şi economice.

1.2. Concepte de bază utilizate în


investigarea statistică a
fenomenelor economice sociale.
Rădăcinile istorice ale statisticii
moderne sunt:

 statistica practică
 statistica descriptivă
 aritmetica politică şi calculul
probabilităţilor
Statistica practică
înregistrări sistematice sau izolate, ce pot fi
asociate unor observări statistice utilizate şi
astăzi
 5000 – 2000 î.e.n. – lista de persoane şi bunuri pe
tăbliţe de argilă,
 “inventarierea” aurului în Egipt prin anii 2650-2190
î.e.n.,
 recensământul populaţiei la romani - 550 î.e.n.,
 diverse forme de înregistrare sunt aduse în Biblie şi
Talmud
Statistica descriptivă
ca disciplină de învăţământ şi de concepte a statisticii practice
necesară conducerii de stat
Printre primele descrieri sistematice se numără:
 lucrarea lui Francesco Sansovino (1521-1586)
despre guvernare şi administraţie, ceea ce avea în
vedere descrierea statului, cu bogăţiile sale.
 În România lucrarea lui Dmitrie Cantemir
“Descriptio Moldaviae” 1714 - 1716
 În Rusia lucrarea lui Kirilov “ Situaţia înfloritoare a
statului rus”, anii 20 ai sec. XVIII
Aritmetica politică şi calculul
probabilităţilor
ca fundamentare conceptuală şi mod de interpretare a
fenomenelor în statistica modernă.
 Numele acesta provine de la lucrarea lui William
Petty (1623-1687) “Aritmetica politică” (1690) , în
care utilizează aşa noţiuni ca medie, proporţie,
repetabilitate, cauzalitate etc.
 Prin mijlocul secolului XVIII-lea şi secolul XIX-lea este
specifică folosirea tot mai frecventă a metodelor
matematice şi în special calculul probabilităţilor în
investigarea şi interpretarea rezultatelor privind
fenomenele şi procesele din societate. Aici se poate
sublinia aportul adus de aşa savanţi ca: Fisher, Yule,
Pearson, Cebâşev, Liaponov, Marcov şi alţii.
Etimologia noţiunii statistică
 status - cea ce are sensul de stare politică
 statistica a fost pentru prima dată utilizată de
Gottfried Achenwall în 1746 pentru a
desemna o “ştiinţă a descrierii statului”
folosită pentru evaluarea într-o formă
sistemică a unor variabile, ca de exemplu -
producţia sau consumul de produse agricole.
Prin statistică se subînţelege:
 totalitatea datelor despre anumite fenomene -
statistica natalităţii, statistica muncii, statistica
suprafeţelor agricole, etc.;
 însuşi procesul de colectare a datelor cu
prelucrarea lor ulterioară, sau cu alte cuvinte
activitate practică a organelor de statistică;
 ştiinţa despre procedeele de investigaţie
statistică şi de formare a indicilor statistici cu
aplicare la cele mai variate fenomene sociale,
ansamblul metodelor şi procedeelor de culegere,
prelucrare şi analiză a datelor înregistrate, modul de
cercetare a fenomenelor de masă;
 disciplină ştiinţifică şi de învăţământ.
Obiectul de studiu al statisticii poate
fi definit astfel:

 statistica studiază fenomenele de masă,


fenomene care sunt supuse acţiunii legilor
statistice, se manifestă în condiţii concrete,
variabile în timp şi spaţiu, din punct de vedere
cantitativ şi în strânsă legătură cu aspectele
lor calitative.
Particularităţi ale fenomenelor
de masă:
 un număr mare de cazuri individuale, pentru ca
esenţa lor să fie pusă în evidenţă din punct de
vedere statistic;
 variabilitatea fenomenelor de masă, adică ele
sunt supuse acţiunii unui număr mare de factori de
influenţă de esenţialitate şi natură diferită;
 fenomene de tip nedeterministe, stohastice
(întâmplătoare);
 forma individuală de manifestare a fenomenelor
de masă este diferită.
Rolul statisticii
la nivel microeconomic şi macroeconomic se caracterizează în:
cunoaşterea situaţiei problematice; statistica contribuind la
colectarea de date; clasificarea datelor; prelucrarea și
prezentarea sub forma de serii, tabele, grafice, estimarea
parametrilor; analiza rezultatelor;
evaluarea de variante de decizie: modelare statistică;
testarea modelelor; formularea de ipoteze; verificarea
ipotezelor şi previziunea statistică;
formularea deciziei sau alegerea variantei optime: analiza
comparativă asupra variantelor; precizarea variantei de
decizie prin măsuri cantitative;
controlul aplicarii deciziei şi verificarea rezultatelor.
NOŢIUNI STATISTICE DE BAZĂ

Utilizarea statisticii presupune stăpânirea unui


limbaj specific.
Cunoaşterea semnificaţiei termenilor folosiţi
este prima condiţie a înţelegerii domeniului
studiat.
Principalele concepte statistice

 colectivitatea statistică;
 unităţile statistice;
 caracteristicile statistice;
 datele statistice;
 informaţiile statistice;
 indicatorii statistici.
Colectivitatea sau populaţia statistică

ansamblul elementelor de aceeaşi natură


care fac obiectul investigaţiei statistice

Pentru a forma o colectivitate statistică, elementele


componente trebuie să prezinte aceleaşi trăsături esenţiale

Orice cercetare statistică practică porneşte de la definirea


şi delimitarea colectivităţii statistice în timp, în spaţiu şi
sub aspect organizatoric
Colectivitatea sau populaţia statistică

poate avea caracter:

STATIC, când exprimă situaţia existentă la un moment dat (de ex:


populaţie, stocuri, capital fix), înregistrarea datelor făcându-se la anumite
momente de timp;

DINAMIC, atunci când corespunde unui proces care se


desfăşoară în timp (de ex: producţie, cheltuieli, consumuri), înregistrarea
datelor făcându-se pe un interval de timp.
Unităţile sau elementele statistice

componentele individuale distincte care


formează colectivitatea statistică.

au caracter obiectiv, sunt independente şi la nivelul lor se


face înregistrarea datelor observării.

In funcíe de numărul de unități incluse simultan în


colectivitatea statistică unitățile pot fi:

Simple Complexe
Variabila statistică
(caracteristică)

reprezintă criteriile pe baza cărora se


caracterizează componentele colectivităţii
statistice. Ele desemnează trăsături,
proprietăţi, însuşiri ale unităţilor statistice
care formează colectivitatea
Variabila statistică (caracteristică)

 După conţinutul/natura lor, pot fi

de timp, de spaţiu, atributive


 După modul de exprimare se separă în

− caracteristici calitative
− caracteristici cantitative
 După natura variaţiei, caracteristicile numerice pot fi

 cu variaţie continuă
 cu variaţie discontinuă (discretă)
Variabila statistică (caracteristică)

 După modul de manifestare la nivelul unităţilor statistice simple se


divizează în

alternative;

nealternative
 După modul de obţinere şi utilizare a datelor

 primare

derivate
Variabila statistică (caracteristică)

după relaţia de cauzalitate

variabile independente
variabile dependente
Date statistice
Reprezintă observațiile rezultate dintr-o
cercetare statistică, sau ansamblul valorilor
colectate în urma unei cercetări statistice
Conţinutul, esenţa datelor statistice formează informaţia
statistică.

În funcţie de tipul variabilelor la care se referă:


temporale, spaţiale sau atributive
cantitative sau calitative
În funcţie de numărul variabilelor la care se
referă:
date univariate
date bivariate
date multivariate

După momentul sau perioada de timp la care se


referă:
date dinamice
date statice
Scale de măsurare a datelor statistice (I)
 Scala nominală (categorială)
Este scala cu cel mai scăzut nivel al preciziei, utilizată pentru a atribui variantelor caracteristicii
măsurate „însuşiri”, cu scopul de a stabili diferenţe calitative între observaţii.
Rolul scalei nominale: de a încadra unităţile statistice în grupe/clase/categorii diferite, după un
anumit criteriu
Operaţii admise pe scala nominală: echivalenţa şi non-echivalenţa (= sau ≠) și nu “<“ sau mai “>“

 Scala ordinală (categorială)


Oferă un plus de precizie în „măsurare”, faţă de scala nominală, deoarece ea nu numai că împarte
unităţile colectivităţii studiate în clase/grupe omogene diferite, din punct de vedere al unei
caracteristici, ci permite şi stabilirea unei relaţii de ordine între aceste clase/grupe.
Valorile numerice atribuite pe această scală pot avea nişte numere de ordine (numite şi „ranguri”),
între care se pot scrie relaţii în termenii unor „inegalităţi”: a<b sau a>b

Nu putem afirma:
• cu câte grade Celsius diferă temperatura „scăzută” de cea „normală”
• cu câte kilograme este mai grea o persoană din categoria „peste greutatea normală” decât
una din categoria „cu greutatea normală”
Scale de măsurare a datelor statistice (II)
 Scala de interval (cardinală)
Caracteristici:
 este prima scală numerică (se aplică variabilelor numerice);
 permite, pe lângă stabilirea unei relaţii de ordine între variantele
numerice ale acestei scale şi determinarea şi interpretarea diferenţelor
dintre acestea;
 valorile numerice acordate pe această scală au semnificaţie cantitativă,
de aceea este permisă însumarea sau scăderea lor;
 fixarea punctului de origine (zero) poate fi făcută arbitrar (originea nu
este fixă);
 unitatea de măsură poate fi aleasă arbitrar.

punctajul obţinut la un test de inteligenţă: X=60 pt; Y=30 pt


alegerii arbitrare a punctului de origine: „zero” nu înseamnă,
neapărat, şi absenţa caracteristicii
 Scala de raport (proporţională)
Caracteristici:
 se aplică variabilelor numerice, având cel mai înalt nivel de
precizie;
 două valori, măsurate pe această scală se află, indiferent de
unitatea de măsură folosită, în acelaşi raport una faţă de alta;
 pe această scală sunt permise şi operaţiile de multiplicare şi de
divizare;
 punctul de origine (zero) este unul fix, rigid, este zero absolut,
matematic şi reprezintă absenţa caracteristicii;
 unitatea de măsură poate fi aleasă arbitrar.

Un agent economic cu 20 angajaţi și altul cu 10 angajați


Valoarea zero a unei variabile înseamnă „absenţă”
DENUMIREA SCALEI CARACTERISTICI ALE EXEMPLE DE
SCALEI UTILIZARE

NOMINALĂ Absenţa relaţiei de ordine Sex, stare civilă, stagiul militar,


profesia, culoarea părului

ORDINALĂ Relaţie de ordine Calificative pentru activitatea


şcolară, ordinea sosirii alergătorilor
dintr-o cursă, preferinţele
consumatorilor pentru un produs

INTERVAL Relaţie de ordine Temperatura Timpul calendaristic


Diferenţe (intervale) Punctajul obţinut la un test de
(CARDINALĂ) verificare a cunoştinţelor
semnificative
Origine arbitrară
Valoarea 0 nu înseamnă absenţă

RAPORT Relaţie de ordine Vârsta, greutatea corporală,


Diferenţe (intervale) salariul, profitul, cifra de afaceri,
(PROPORŢIONALĂ) număr de angajaţi
semnificative
Origine fixă, valoarea 0
înseamnă absenţă
Operaţii de multiplicare / divizare
SERII CRONOLOGICE
(SCR)

1.Analiza seriilor de timp


2.Ajustarea seriilor de timp
3.Prognoza pe baza SCR
Terminologie şi clasificări (1)

Seria cronologică (SC) reprezintă o serie de


date (de obicei consecutive) ce reflectă
evoluţia în timp a unui fenomen sau indicator

Tipuri de serii cronologice:


a) În raport cu forma de exprimare timpului
- SC de momente sau de stoc (neagregabile)
● ● ● ● ● ● ● ● ● ●
t

- SC de flux sau de interval (agregabile)


● ● ● ● ● ● ● ● ● ●
t
Terminologie şi clasificări (2)

b) În raport cu distanţa dintre termenii SC


- SC de perioade egal distanţate

- SC de perioade inegal distanţate

c) În raport cu tipul de date analizate


- SC formate din valori absolute
- SC formate din mărimi relative
- SC formate din mărimi medii
Reprezentarea grafică a SC

Numărul autoturismelor vândute de un dealer auto

40

35 cronogramă
(historiogramă)
30

25

20

15

10
apr.06 mai.06 iun.06 iul.06 aug.06 sep.06 oct.06 nov.06 dec.06 ian.07 feb.07 mar.07

40

35 diagramă prin
30 coloane
25

diagramă în coordonate 20

polare 15

10
apr.06 mai.06 iun.06 iul.06 aug.06 sep.06 oct.06 nov.06 dec.06 ian.07 feb.07 mar.07
Indicatorii seriilor cronologice (1)

 Distingem trei mari categorii de indicatori

I. Absoluţi I. Indicatorii absoluţi


II. Reativi a) Însăşi termenii seriei yt
b) Nivelul agregat al seriei Σyt (doar pentru SC
III. Medii
de flux)
c) Valoarea absolută a unui procent de
modificare
y0 Acest indicator arată care este echivalenţa (în cifre
A
100 absolute) a unei modificări (în plus sau în minus) cu 1%.
Indicatorii absoluţi (continuare)
d) Modificările absolute cu bază fixă

 t /1  yt  y1 t 2, n

Se calculează prin diferenţă între valoarea corespunzătoare perioadei t şi


valoarea corespunzătoare unei perioade imobile, considerată bază de
comparaţie. De obicei baza de comparaţie este primul termen al seriei.

e) Modificările absolute cu bază mobilă sau în lanţ


Se calculează prin diferenţă între valoarea corespunzătoare perioadei t şi
valoarea corespunzătoare perioadei precedente t-1.

 t / t  1  yt  yt  1 t 2, n
k
Proprietăţi 
t 2
t /t 1  k /1  k /1   k  1/1  k / k  1
Indicatorii relativi (1)
a) Indicii cu bază fixă
Se calculează prin raport între valoarea corespunzătoare perioadei t şi
valoarea corespunzătoare unei perioade imobile, considerată bază de
comparaţie. De obicei baza de comparaţie este primul termen al seriei.

yt
I t /1  t 2, n
y1

b) Indicii cu bază mobilă sau în lanţ


Se calculează prin raport între valoarea corespunzătoare perioadei t şi
valoarea corespunzătoare perioadei precedente t-1.
yt
It /t 1  t 2, n
yt  1
Proprietăţi I k /1
k
I k / k  1
I
t 2
t /t 1 I k /1 I k  1/1
Indicatorii relativi (2)
c) Ritmurile cu bază fixă

Reprezintă ratele (ritmurile de modificare) asociate indicilor cu bază fixă.

Rt / 1(%)  It / 1(100 )  1(100 ) t 2, n

d) Ritmurile cu bază mobilă sau în lanţ

Reprezintă ratele (ritmurile de modificare) asociate indicilor cu bază mobilă


sau în lanţ.

Rt / t  1 I t / t  1  1[00] t 2, n
Indicatorii medii (1)
a) Nivelul mediu al seriei
Reprezintă valoarea medie a indicatorului sau fenomenului corespunzătoare
întregului orizont de timp analizat.

Pentru serii de flux (interval) Pentru serii de momente (stoc)


folosim media aritmetică folosim media cronologică

y
 y t
y
 y2  y3  ...  yn  2  yn  1  y2n
y1
2
n n 1

b) Modificarea medie absolută


Reprezintă media aritmetică a modificărilor absolute cu bază în lanţ.
n

 t /t 1
 n /1 yn  y1
 t 2
 
n 1 n 1 n 1
Indicatorii medii (2)
c) Indicele mediu de dinamică

Reprezintă media geometrică a indicilor cu bază în lanţ.

n
yn
I n  1  I t / t  1 n  1 I n /1 n  1
t 2 y1

d) Ritmul mediu
Reprezintă rata (ritmul) asociat indicelui mediu de dinamică.

R I  1[00]
Componentele seriei cronologice

70
65

 Trendul sau tendinţa ( ŷt ) 60


55
50

 Componenta ciclică (C) 45


40
35

 Componenta sezonieră (S) 30


1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

 Factorii aleatori (întâmplători) (ε)

Model aditiv Model multiplicativ

yt  yˆ t  C  S   yt  yˆ t C S 
Metode de estimare a trendului (ajustarea SC)

 Metode mecanice
a) Metoda sporului/ reducerii medii
b) Metoda indicelui mediu
c) Metoda mediilor mobile (MMM)

 Metode analitice
Presupun aplicarea metodei regresiei în cazul SC. yt  f (t )  
•liniar

•polinomiale

•logistic

•autoregresive etc.
Metoda sporului/ reducerii medii

 Se aplică atunci când între termenii seriei există o tendinţă


de progresie aritmetică.

 Practic, se studiază modificările absolute cu bază în lanţ


(Δt/t-1) şi dacă se constată valori aproximativ egale se alege
această metodă.

Formula de ajustare:

yˆ t  y1   (t  1), t 1, n
Metoda indicelui mediu

 Se aplică atunci când între termenii seriei există o tendinţă


de progresie geometrică.

 Practic, se studiază indicii sau ritmurile cu bază în lanţ (It/t-1


sau Rt/t-1) şi dacă se constată valori aproximativ egale se
alege această metodă.

Formula de ajustare:
t 1
yˆ t  y1 I , t 1, n
Sondajul statistic
Terminologie (1)
 Unitatea statistică reprezintă
elementul de bază supus analizei
statistice. Există unităţi simple (de ex.:
persoane, obiecte etc.) şi unităţi
complexe (de ex.: gospodăria).
 Populaţia statistică este compusă
dintr-o mulţime finită de unităţi
statistice.
 Variabila (caracteristica) statistică
este o aplicaţie definită pe populaţia
studiată şi cu valori într-o anumită
mulţime.
Terminologie (2)
 Parametrul statistic este o ilustrare
(de obicei cantitativă) a stării variabile
statistice
 Estimatorul este o funcţie statistică
utilizată pentru aproximarea unui
parametru necunoscut la nivelul unei
populaţii statistice
 Eşantionul statistic o mulţime de
dimensiuni reduse a unităţilor statistice
dintr-o populaţie
Terminologie (3)
Motivaţii

• Costurile – informaţia este obţinută cu


eforturi financiar-logistice mult mai reduse
• Rapiditatea – informaţiile sunt obţinute mult
mai rapid
• Rezultate mai exacte – deşi pare paradoxal
este un fapt evident
• Cerinţe speciale – sunt situaţii în care aplicarea
metodei exhaustive este imposibilă din punct de
vedere practic
Avantajele sondajului
statistic
Cercetarea statistică prin sondaj, are drept obiectiv fundamental
culegerea datelor de la unităţile cuprinse într-un eşantion,
prelucrarea datelor de selecţie şi estimarea cu o anumită
probabilitate (eroare a parametrilor populaţiei generale din care s-a
extras eşantionul).

Comparativ cu cercetarea totală, cercetarea prin sondaj prezintă


multiple avantaje:
a) Este mai eficientă şi mai operative decât o observare totală ;
eşantion mic, costuri reduse, timp redus la o perioadă cât mai
scurtă;
b) Se organizează ori de câte ori nu se poate organiza o observare
totală (inginerie, astronomie, chimie, geodezie);
c) Planul de observare este mai bogat (nr. de variabile urmărite este
mare), ceea ce conduce la un volum mai mare de informaţii
necesare cunoaşterii;
d) Prin cercetările prin sondaj se actualizează bazele de date cu
privire la informaţiile statistice generale. Nu este domeniu de
activitate în care să nu se folosească cercetarea prin sondaj;
e) Controlul calităţii datelor de intrare poate fi mai riguros, iar erorile
de observare pot fi mai uşor înlăturate.
Delimitări conceptuale

• Sondajele probabiliste

- sunt definite prin aceea că alocă fiecărei unităţi din populaţie o probabilitate
egală şi nenulă de a aparţine eşantionului
- au avantajul că permit studierea şi calcularea preciziei estimatorilor şi au un
caracter ştiinţific riguros

• Anchetele sau sondajele nealeatoare


- se bazează mai mult pe considerente subiective, deci sunt
discutabile şi în consecinţă sunt mai puţin riguroase
- nu utilizează probabilităţi în extragerea unităţilor şi ca urmare precizia
estimatorilor nu poate fi determinată
- utilizarea lor este justificată mai mult din cauza unor constrângeri bugetare
sau atunci când sondajele aleatoare nu pot fi aplicate
Principalele tipuri de sondaje
probabiliste (aleatoare)
• Sondajul aleator simplu (SAS) – din populaţia statistică
studiată se extrage un eşantion de dimensiunea dorită
utilizând o metodă aleatoare.

• Sondajul stratificat (SS) – populaţia statistică este


împărţită în prealabil (utilizând diverse criterii) în mai
multe straturi. Din fiecare strat se extrage un eşantion.
Reuniunea acestor eşantioane formează eşantionul final

• Sondajul de serii/ de grupe/ cluster – populaţia


statistică studiată este împărţită în serii/ grupe/
clustere (de exemplu: o populaţie de studenţi este
împărţită în grupe). Se extrage apoi, în mod aleator,
un anumit număr de grupe/ clustere astfel create.
Toate unităţile statistice din grupele selectate
formează eşantionul ce va fi ulterior investigat.
Principalele tipuri de sondaje
probabiliste (aleatoare)
Eşantionul este selectat, în acest caz, întâmplător şi
evidenţiem:
• Eşantionarea la întâmplare – se foloseşte pentru populaţii
omogene
• Eşantioanele de voluntari – se folosesc mai ales în cercetările
medicale
• Eşantionarea dirijată – se foloseşte de obicei în cercetări
prealabile asupra populaţiei studiate
• Eşantionarea prin metoda cotelor – se foloseşte în
analizele socio-economice baza de sondaj nu este disponibilă
• Eşantionarea prin metoda
itinerariilor
Extragerea aleatoare a
eşantionului
Despre erorile ce apar în cazul
cercetărilor statistice
Erorile specifice cercetărilor
selective
Sondajul aleator simplu cu
revenire
Indicatori pereche de analiză
statistică (1)

Volumul
colectivităţii Volumul eşantionului (n)
generale (N)
r r

N  N i n  ni
i 1 i 1
Indicatori pereche de analiză
statistică (2)
Media
În eşantion
În colectivitatea
generală:
n
N

 xi x i

  i 1 x i 1

N n

r
n

x N i i xn i i

 i 1 x i 1

N i n i
Indicatori pereche de analiză
statistică (2)
Dispersia
n 30

 x  x 
n 2

 x   
2 i
i s2 
 2
 n
În colectivitatea
 x  x  n
N
În eşantion:

2
generală: xi    N i
 2 
2
i i
s2 
N i n i
Indicatori pereche de analiză
statistică (3)
Procedee de formare a
eşantioanelor
În cercetarea statistică prin sondaj, pentru a obţine
eşantioane reprezentative, se utilizează procedee aleatoare,
procedee dirijate şi procedee mixte.
Selecţia aleatoare se caracterizează prin faptul că
acordă fiecarei unităţi din populaţia originară o anumită şansă
de a fi inclusă în eşantion.
Includerea în eşantion se realizează obiectiv indiferent de cel
care realizează eşantionarea.
Principalele tipuri de selecţie aleatoare sunt:
Selecţie aleatoare simplă:
-procedeul loteriei
-procedeul tabelului cu numere aleatoare,
-procedeul pasului mechanic.
Selecţie aleatoare stratificată;
Selecţie aleatoare în cuiburi (cluster).
Erori în cercetarea statistică prin
sondaj (1)
Când apelăm la o cercetare statistică prin sondaj ne confruntăm cu
următoarele tipuri de erori:
a) Erori de observare, de calcul, modelare , specifice oricărei cercetări
statistice.
b) Erori de reprezentativitate, pot fi:
Erori sistematice : se întâlnesc în cazul în care voit ori nu, nu se respectă
metodologia selecţiei aleatoare; unităţile sunt selectate dirijat,
pseudoaleator ,”la
nimereala”. Pot fi eliminate printr-o construire riguroasă a bazei de sondaj şi
prin
respectarea procedeelor de selecţie.
Întâmplătoare : nu pot fi eliminate, deoarece ţin de esenţa sondajului.
Acestea ar fi
nule dacă eşantionul ar imita perfect structura colectivităţii generale dpdv al
caracteristicilor studiate. Teoria statistică demonstrează că dacă se lucrează
cu

eşantioane n>30, atuncimediile posibile de sondaj urmează la limită o
distribuţie normală
faţă de media colectivităţii generale, indiferent de distribuţia variabilei x.
Spunem că
media de sondaj este un estimator nedeplasat al mediei colectivităţii generale.
Ea poate fi,
repetând eşantionarea mai mare/mai mică decât ,dar nu este sistematic
Erori în cercetarea statistică prin sondaj
(2)
Ex. N=3, n=2 ; 5,6,7
Eşantioane posibile:
(5,5);(5,6); (5,7); (6,5);(6,6);(6,7);(7,5);(7,6);(7,7)
5 ; 5,5 ; 6 ; 5,5; 6 ; 6,5 ; 6 ; 6,5; 7

Distribuţia de frecvenţe:

Variante Nr. De cazuri


5 1
5,5 2
6 3
6,5 2
7 1
total 9
Erori în cercetarea statistică prin
sondaj (3)

În cazul în care volumul eşantionului este n 30 , trebuie


să ne asigurăm că variabila x în colectivitatea generală
este distribuită normal;
doar atunci vom putea aplica prezumţia că mediile de
selecţie se distribuie normal faţă de .

În privinţa dispersiei, cel de al doilea indicator ce


caracterizează o distribuţie, teoria statistică demonstrează
că 2
x 
2

dispersia mediilor posibile este egală cu: n


2
s
De obicei nu avem informaţii disponibile despre dispersia
2
colectivităţii generale, atunci lucrăm cu estimatorul
dispersiei pe care l-am notat cu2 , iar dispersia medilor de
selecţie va fi: s
x
s2 
n
Erori în cercetarea statistică prin sondaj
(4)

ESTIMAREA PE INTERVAL DE ÎNCREDERE A MEDIEI


NECUNOSCUTE DIN
COLECTIVITATEA GENERALĂ presupune:
I. Selectie aleatoare simpla cu revenire - variabila numerica:
1. pentru esantionul cu care lucram, calculam media x  si dispersia s 
2

x
 x i ni
 ni

s2 
 xi 
2
 x ni
n i

1. se determină eroarea medie probabilă de reprezentativitate (eroarea


standard) ; ea este abaterea medie pătratică a medie de sondaj:
Erori în cercetarea statistică prin
sondaj (5)

2. se determină eroarea medie probabilă de reprezentativitate (eroarea


standard) ; ea este abaterea medie pătratică a medie de sondaj:

s2 s
sx  
n n

3. În funcţie de probabilitatea cu care dorim să lucrăm în extinderea


rezultatelor, pe baza distribuţiei normale din tabelele statistice se citesc
valorile argumentului funcţiei de probabilitate , adică valorile lui z.
Determinarea volumului
eşantionului
În alegerea volumului eşantionului vorbim despre un volum
minim
necesar , cel care pune în relaţie de echilibru, pe de o parte
precizia şi probabilitatea dorite şi pe cealaltă parte resursele
avute
la dispoziţie.
s2 2 s2 2 z2s2
 x  zs x  z  z
x
 n 2
n n x

Dacă z şi  x pot fi stabilite de către cercetător, în schimb în privinţa împraştierii


datelor va trebui să facem următoarele presupuneri:
- Fie folosim dispersia dintr-un eventual eşantion stabilit anterior,
- în ipoteza unei distribuţii normale putem estima amplitudinea variaţiei:

Ax
s
4
SISTEMATIZAREA ŞI
PREZENTAREA INFORMAŢIEI
STATISTICE

1. Prelucrarea statistică – noţiuni generale


2. Probleme rezolvate în cadrul grupării statistice. Tipuri
de grupări statistice.
3. Prezentarea şi reprezentarea datelor statistice
 Serii statistice.
 Tabele statistice.
 Reprezentarea grafică.
1. PRELUCRAREA STATISTICĂ
NOŢIUNI GENERALE

Prelucrarea statistică se referă la operaţiile de sistematizare a


datelor primare pe întreaga colectivitate şi pe părţile ei
componente; calculul indicatorilor absoluţi şi derivaţi, precum şi
prezentarea rezultatelor obţinute.
Prelucrarea statistică primară
 centralizarea;
 gruparea sau clasificarea datelor şi calculul
indicatorilor statistici absoluţi;
 calculul indicatorilor derivaţi;
 prezentarea rezultatelor prelucrării sub
formă de serii, tabele şi grafice statistice.
Clasificarea şi gruparea statistică

 Structurarea colectivităţii în grupe omogene


după variaţia uneia sau mai multor
caracteristici de grupare se numeşte grupare
sau clasificare

 Gruparea statistică este cea mai semnificativă


modalitate de sistematizare a datelor după o
caracteristică numerică (cantitativă).
2. PROBLEME REZOLVATE ÎN CADRUL GRUPĂRII
STATISTICE. TIPURI DE GRUPĂRI STATISTICE.

 precizarea scopului grupării;


 stabilirea caracteristicilor de grupare;
 alegerea felurilor de grupare;
 stabilirea numărului de grupe în care urmează a fi
împărţită colectivitatea;
 determinarea mărimii intervalului de grupare (în cazul
caracteristicii numerice);
 delimitarea grupelor şi separarea unităţilor pe
intervale de grupare.
CARACTERISTICA DE GRUPARE

Prin caracteristica de grupare se înţelege


acea însuşire care stă la baza împărţirii
colectivităţii în grupe omogene. Drept
caracteristică de grupare se alege o
caracteristică esenţială cu caracter stabil
pentru unităţile colectivităţii.
Tipologia grupărilor

După numărul caracteristicilor puse la baza grupării

Gruparea simplă presupune separarea unităţilor unei


colectivităţi în grupe omogene după variaţia unei
singure caracteristici

Gruparea combinată presupune repartizarea unităţilor


în baza a două sau mai multe caracteristici în acelaşi
timp
După natura caracteristicilor

 teritoriale (de spaţiu)


 cronologice (de timp)
 calitative
După forma de exprimare a caracteristicii

 grupări după o caracteristică exprimată prin


cuvinte
 grupări după o caracteristică exprimată cifric
Gruparea după o caracteristică
calitativă exprimată cifric se poate
efectua
1. pe variante
2. pe intervale de variaţie.
Gruparea pe variante (xi) presupune ordonarea variantelor
(datelor) în sens crescător şi determinarea frecvenţei de
apariţiei a fiecărei variante.
Exemplul. Folosind datele cu
privire la producţia obţinută
într-o zi (producţia este
exprimată în bucăţi),
înregistrate asupra unui
eşantion de 50 de muncitori,
se cere să se efectueze
gruparea pe variante de
variaţie şi gruparea pe
intervale de variaţie.
Valori înregistrate:
30 48 26 65 65 50 48
26 35 37 57 69 37 45 37
50 35 37 69 21 45 48 39
66 57 54 66 65 59 48 57
41 45 59 41 57 65 37 54
45 45 45 48 45 49 48
49 45 54 57
Gruparea pe intervale de variaţie

Gruparea datelor pe intervale de variaţie se


utilizează atunci când caracteristica
numerică urmărită prezintă un număr mare
de valori individuale
Intervalele de grupare pot fi:
 intervale egale şi neegale;
 intervale închise şi deschise;
 intervale cu variaţie discretă şi cu variaţie
continuă.
Iteraţii în vederea sistematizării datelor pe
intervale de grupare este următorul
1. se stabileşte amplitudinea variaţiei (A)
2. se stabileşte numărul de grupe/intervale (k)
3. se stabileşte mărimea intervalului de
grupare (l)
4. se formează intervale de grupare
Inchiderea intervalelor deschise
Exemplu 2.O anchetă întreprinsă la începutul anului 2002 asupra 60 de societăţi comerciale
de mărime medie, permite următoarea înregistrare cu privire la numărul de salariaţi:
267 268 270 285 286 290 292 296 285 288
296 299 325 346 261 252 270 262 255 248
272 170 165 275 172 240 181 185 250 252
197 280 192 181 284 195 197 282 187 194
215 217 196 198 225 220 230 211 227 231
233 220 225 228 233 234 217 236 245 248

Se cere
Să se grupeze cele 60 societăţi comerciale pe 6 intervale egale de variaţie a numărului de
salariaţi
1.se stabileşte amplitudinea variaţiei A cu relaţia:
A  x max  x min 346  165 181 persoane Intervale de variaţie a Număr de societăţi
numărului de salariaţi comerciale

unde xmax,=346 persoane, iar xmin =165 persoane 165-195


195-225
9
11
2. se stabileşte mărimea intervalului de grupare (h). 225-255 17
255-285 12
A x max  x min 181 285-315 9
h   30 persoane 315-346 2
r r 6
Total 60
Gruparea a 60 unităţi comerciale după numărul de salariaţi
Limita superioară nu este inclusă în interval
PREZENTAREA ŞI REPREZENTAREA
INFORMAŢIEI STATISTICE

1. Seriile statistice.
2. Tabele statistice.
3. Reprezentarea grafică a datelor statistice
Seriile statistice

Seria statistică este prezentarea paralelă a două


sau mai multe şiruri de date statistice în care primul
şir reprezintă variaţia caracteristicii de grupare, iar
altele rezultatul centralizării frecvenţelor sau valorilor
unei alte caracteristici care se află în raport de
interdependenţă.
 Se impun unele observaţii
 succesiunea, mărimea valorilor înregistrate şi a
frecvenţelor corespunzătoare
 legătură univocă
În funcţie de natura caracteristicilor urmărite,
seriile statistice sunt clasificate în:

 serii de repartiţie sau serii de distribuţie;


 serii cronologice (sau de timp);
 serii teritoriale (sau de spaţiu)
 serii descriptive sau enumerative.
Tabele statistice

Сonstituie un ansamblu de judecăţi prezentat


într-o formă succintă, printr-o reţea de linii şi
coloane, cuvinte şi expresii numerice,
referitoare la fenomene şi procese studiate

Tabelul statistic (TS) este format dintr-o reţea


adecvată de linii paralele orizontale şi
verticale în care sunt încadrate datele, şi
cuprinde una sau mai multe serii statistice
Elementele constructive ale unui tabel statistic
sunt:
 titlul tabelului
 macheta tabelului simple (descriptive);
 de prelucrare;
 subiectul tabelului
pe grupe (obţinute în
 predicatul tabelului urma sistematizării
 conţinutul tabelului datelor);
combinate etc.
 sursa datelor
 notă explicativă
Categoriile tabelelor statistice
După faza de prelucrare şi utilizare
 tabele descriptive sau enumerative
 tabele de lucru de prelucrare

După felul cum este prelucrat subiectul sau predicatul


 tabele simple
 tabele combinate pe grupe (obţinute în urma sistematizării
datelor);
Grafice statistice

Graficul statistic reprezintă o altă formă de


prezentare a datelor sub formă de imagini
spaţiale a datelor unei serii, într-un sistem de
coordonate dat. Principiul de bază al unei
reprezentări grafice a unei serii statistice îl
constituie proporţionalitatea.
Elementele constitutive ale unui grafic statistic
sunt:
 titlul graficului;
 axa sau axele graficului;
 scara sau scările graficului pentru gradare;
 legenda care să explice culori, haşururi;
 graficul propriu-zis reprezentat de puncte, linii,
figuri geometrice în plan sau
spaţiu sau figuri natural convenţionale construite la
scara;
 sursa datelor se plasează imediat după grafic;
 note explicative
Principalele tipuri de grafice sunt:
 histograma
 poligonul frecvenţelor
 curba frecvenţelor
 diagramele de structură
 cronograma
 corelograma etc.
Tabel. Distribuţia elevilor după nota obţinută la o lucrare de control

Fig. 2 Poligonul frecvenţelor absolute pentru nota obţinută la lucrarea de control


INDICATORI
STATISTICI
• FUNCTIILE INDICATORILOR STATISTICI
• TIPURI DE INDICATORI STATISTICI
• INDICATORI STATISTICI CALCULATI CA MARIMI
RELATIVE
NOȚIUNE DE INDICATOR
STATISTIC
Statistica studiază fenomenele sub aspectul cantitativ -
numeric, în strânsă interdependenţă cu determinarea
lor calitativă, în condiţii date de timp, loc şi structură
organizatorică. Rezultatele cercetării statistice se
concretizează
într-un număr mare de expresii numerice
interdependente. În sensul cel mai larg, orice expresie
numerică obţinută într-un proces concret de cercetare
se numeşte indicator statistic.
Caracteristicile indicatorilor
statistici
■ au un continut concret, reprezinta categorii economice sau sociale ;
■ au o forma proprie de calcul sa se exprima numeric ;
■ sunt bine definiti in timp, in spatiu si sub aspect organizatoric ;
■ pot fi utilizati independent sau pot forma un sistem de indicatori.
Funcţiile indicatorilor
statistici
 masurare,
 comparare,
 analiza,
 sinteza,
 estimare
 verificare
Funcţia de măsurare

caracterizarea cantitativă a diferitelor aspecte ale realităţii obiective


studiate prin indicatori cu care se stabilesc dimensiunile colectivităţilor
cercetate şi ale părţilor lor componente.

indicatorii absoluti exprimati in numere, cantitati, valori etc., care


masoara o unitate, o grupa de unitati, o subcolectivitate sau o
colectivitate statistica, strict delimitate in timp, in spatiu si
organizatoric.

sunt exprimati in unitati concrete de masura.


Functia de comparare

provine din necesitatea cunoasterii modificarilor intervenite in


nivelul, structura sau dinamica fenomenelor

 diferenta
Indicatori derivati
 raport
Functia de analiza

in mod frecvent statistica opereaza cu


variabile complexe, care pot fi
descompuse fie intr-un produs de mai
multi factori, fie intr-o suma de mai
multe elemente componente.
Functia de sinteza

este specifica fenomenelor care se manifesta diferit de la o


unitate la alta

sintetiza intr-o singura expresie numerica, care determina


statistic ceea ce este esential si tipic pentru intreaga masa de
fenomene.
Functia de estimare

este specifica metodei statistice care are printre


fundamentele sale si teoria probabilitatilor.

Functia de estimare se foloseste si atunci cand datele care au stat


la baza calculelor statistice provin dintr-un sondaj cu caracter
reprezentativ
Functia de verificare a ipotezelor
si de testare a semnificatiei

validarea rezultatelor demersului


statistic

Fenomenele de masa fiind variabile in timp si spatiu ca urmare a


influentei mai multor factori, printre care si o componenta
aleatoare, pot fi studiate cu ajutorul mai multor modele statistice.
TIPURI DE INDICATORI
STATISTICI
dupa etapa in care apar in procesul de
cunoastere statistica

■ Indicatorii primari
■ Indicatorii derivati
Indicatorii primari

se obtin in cadrul prelucrarii primare a datelor statistice ca urmare a


procesului de centralizare a datelor unei observari statistice.
au continut concret si forma concreta de exprimare,
motiv din care indicatorii primari se mai numesc si
indicatori absoluti si constituie baza informationala
a cunoasterii statistice
Indicatorii derivati

se obtin in faza de prelucrare statistica a marimilor absolute prin


aplicarea variatelor metode si procedee de calcul statistic
(comparatii, abstractizari, generalizari)

fac posibila analiza aspectelor calitative ale fenomenelor si proceselor cercetate.


Indicatorii derivati (2)

Ei exprima:

 relatii cantitative dintre diferitele caracteristici statistice, dintre diferitele parti ale unei
colectivitati sau dintre fenomenele ce se gasesc intr-un anumit grad de
interdependenta;
 valorile tipice care se formeaza in mod obiectiv in cadrul aceleiasi perioade de timp
sau in dinamica;
 gradul si forma de variatie a caracteristicilor cercetate;
 legaturile de interdependenta dintre fenomene;
 tendinta obiectiva de manifestare a fenomenelor;
 rolul si contributia diferitilor factori la formarea si modificarea marimii unui
fenomene complex etc.
INDICATORI STATISTICI CALCULATI
CA MARIMI RELATIVE

Construirea marimilor relative


 intre termenii comparati sa existe o legatura fireasca de conditionare sau daca este
posibil chiar de cauzalitate;
 termenii raportului sa fie cu adevarat comparabili din punct de vedere al sferei de
cuprindere, al metodologiei de calcul, al structurii organizatorice etc.;
 baza de comparatie sa aiba o anumita semnificatie in evolutia fenomenului studiat.
Tipuri de marimi relative

■ marimi relative de structura;


■ marimi relative de coordonare;
■ marimi relative ale dinamicii;
■ marimi relative ale planului;
■ marimi relative de intensitate.
Aplicatie
INDICATORII TENDINŢEI
CENTRALE

1.Introducere în mărimile medii


2.Mărimile medii de calcul
3.Indicatorii centrali de poziţie
Definiția mărimilor
medii
 Mediile sunt, indicatori derivati care exprima ceea
ce este tipic, comun si general în configuratia
fenomenelor, și exprima intr-o maniera abstractă
tendinta centrala a valorilor individuale catre un
nivel de sinteza denumit marime medie.

Variabilitatea deosebită a acestora în formele lor individuale de


manifestare impune găsirea unor indicatori care să reunească valori
le individuale, exprimând printr-o măsură unică esenţa
fenomenului.
Caracteristici ale indicatorului tendinţei centrale ideal
(Yule 1945)

■ Să fie definit în mod obiectiv


■ Să depindă de toate valorile individuale
■ Să aibă o semnificaţie concretă (uşor de înţeles chiar şi de către
nespecialişti)
■ Să fie simplu şi rapid de calculat
■ Să fie puţin sensibil la fluctuaţiile de selecţie
■ Să permită calcule algebrice ulterioare
Tipuri de indicatori ai tendinţei centrale

 După rolul în statistică se clasifică:


a) mărimi medii fundamentale (media
aritmetică, modulul, mediana).
b) mărimi medii cu aplicaţii speciale (media
geometrică, armonică, pătratică, etc.)
 După modul de obţinere mărimile medii pot fi:
a) mărimi medii de calcul(media aritmetică,
armonică, geometrică)
b) mărimi medii de poziţie(modul, mediana).
 După tipul seriei de repartiție mărimile medii pot fi:
a) Simple
b) Ponderate (cu frecvență)
Tipuri de indicatori ai tendinţei centrale

 Mediile de calcul
 Media aritmetică
 caz particular (media variabilei de tip binar)
 Media pătratică
 Media geometrică
 Media armonică
 Media cronologică (se va discuta despre ea la capitolul Serii
cronologice)
 Indicatorii centrali de poziţie
 Mediana
 Valoarea modală
Media aritmetică
■ Se poate calcula doar pentru variabile cantitative
■ Se mai numeşte momentul de ordin 1
– pentru un şir simplu de valori

x
 x i

– n sau de date grupate pe intervale de


Pentru o serie de frecvenţe
grupare

x
 xni i

n i
Media armonică
■ Se mai numeşte momentul de ordin -1

n
– pentru un şir simplu de valori xh 
1
 xi

– Pentru o serie de frecvenţe sau de date grupate pe intervale de


grupare

xh 
 n i
1
x n i
i
Media geometrică

 Se foloseşte pentru calculul unor medii în cazul


mărimilor relative de dinamică
 pentru un şir simplu de valori
x n
g x i

 Pentru o serie de frecvenţe sau de date grupate pe


intervale de grupare


x g   xi
ni ni

Observaţie: MRD trebuie să fie exprimate sub formă


de indici (nu ritmuri) şi coeficienţi (nu procente)
Media pătratică
■ Se mai numeşte momentul de ordin 2

– pentru un şir simplu de valori xp 


 i
x 2

– Pentru o serie de frecvenţe sau de date grupate pe intervale de


grupare

xp 
x n 2
i i

n i
Media variabilei de tip binar

 Distribuţia după culoarea ochilor unei


populaţii de 100 de persoane este:

 Observaţie: orice variabilă se poate


“binariza”
Relaţia de ordine între cele patru tipuri
de medii

xh  x g  x  x p
INDICATORII TENDINŢEI
CENTRALE (II)
1.Introducere în mărimile medii
2.Mărimile medii de calcul
3.Indicatorii centrali de poziţie
Mediana (Me) (1)

■ Avantaj: Spre deosebire de medii, Me nu este


aşa de influenţată de apariţia valorilor extreme
■ Mod de calcul:
1. Se ordonează crescător seria de date
2. Se calculează poziţia (locul) Medianei

1

locMe  ( ni )  1
2

3. În funcţie de forma datelor disponibile vom
avea:
Mediana (Me) (2)

■ Pentru un şir simplu de valori:


– cu un număr impar de termeni
■ Me este valoarea de rang locMe din şirul obţinut
la pasul 2
– cu un număr par de termeni
■ Nu există un termen central. Me se calculează ca
o medie aritmetică simplă a termenilor centrali
Mediana (Me) (3)

■ Pentru o serie de frecvenţe:


1. Se calculează frecvenţe cumulate crescător (Fi) :
■ Fi oferă răspunsul la întrebarea: “Câte cazuri ale
variabilei xi sunt cel mult egale cu varianta
curentă?”
2. Mediana este prima variantă pentru care este
adevărată relaţia:
Fi locMe
Mediana (Me) (4)

■ Pentru o serie de date grupate pe intervale:


3. Se calculează frecvenţe cumulate crescător (Fi) :
■ Fi oferă răspunsul la întrebarea: “Câte cazuri ale
variabilei xi sunt cel mult egale cu limita
superioară a intervalului curent?”
4. Se alege intervalul ce conţine mediana ca fiind
primul interval pentru care este valabilă relaţia:
Fi locMe

5. În interiorul intervalului ce conţine mediana, formula


de calcul este:
locMe  Fi  1
Me x0  k
nMe
Mediana (5)

■ Mediana face parte din indicatorii quantilici


■ Alţi indicatori quantilici sunt:
– quartilele (împart o serie de date în 4)
– decilele (împart o serie de date în 10)
– centilele (procentilele) (împart o serie de date
în 100)
Valoarea modală (Mo)

■ Definiţie: Valoarea modală este valoarea cu


frecvenţă maximală de apariţie
■ Avantaje:
– Poate fi calculată pentru variabile calitative
(exprimate prin cuvinte) (de ex.: culoarea
ochilor, culoarea părului, starea civilă etc.)
– Şansele ca rezultatul să fie o valoare existentă
în realitate sunt mult mai mari decât la medii
Valoarea modală (Mo) (2)
Serie de date unimodală

50 Nota ni
45 1 5
40
35 2 7
30 3 12
Studenti

25
20
4 20
15 5 38
10
6 46
5
0 7 37
1 2 3 4 5 6 7 8 9 10
8 20
Nota 9 10
10 5
Mo Total 200
Valoarea modală (Mo) (3)

Serie de date bimodală

45 Nota ni
40 1 5
35
2 13
30
Studenti

25 3 22
20 4 35
15
5 14
10
5
6 7
0 7 25
1 2 3 4 5 6 7 8 9 10 8 41
Nota
9 27
Mo1 Mo2 10 11
Total 200
Valoarea modală (Mo)
(4)
■ Pentru o serie de date grupate pe intervale:
1. Se alege intervalul modal ca fiind intervalul cu
frecvenţa maximă
2. În interiorul intervalului modal, valoarea
modală se determină cu ajutorul formulei:

1
Mo  x0  k
1   2
Valoarea modală (Mo) (5)

Starea civilă ni

Casătorit 70

Necăsătorit 55
Valoarea modală este varianta:
Divorţat 12 “căsătorit”
Văduv 13

Total 150
Relaţia de ordine între x , Me şi Mo

Pentru o serie cel mult uşor asimetrică este valabilă relaţia:

x  Mo 3( x  Me )
INDICATORII VARIAŢIEI
(ÎMPRĂŞTIERII)
Indicatorii sintetici ai variaţiei (1)

Abaterea medie liniară


Definiţie: Media aritmetică a abaterilor individuale faţă de medie (di)
luate în valoare absolută
Pentru o serie de frecvenţe sau pentru o
Pentru un şir simplu de valori: serie de date grupate pe intervale de
grupare:
d
 x i  x  x  x n
i i
d
n n i

Abaterea medie liniară are ca unitate de măsură, unitatea de măsură a


variabilei analizate.
Indicatorii sintetici ai variaţiei (2)

Dispersia sau momentul centrat de ordin 2


Definiţie: Media aritmetică a pătratelor abaterilor individuale faţă de
medie (di)
Pentru o serie de frecvenţe sau pentru o
Pentru un şir simplu de valori: serie de date grupate pe intervale de
grupare:
 x i  x
2
 x  x  n
2

 2
  2

i i
n n i

Din considerente de interpretare vom lăsa dispersia fără unitate de


măsură.

Formula alternativă de calcul a dispersiei:  2 x p2  x 2


Indicatorii sintetici ai variaţiei (3)
Abaterea standard sau abaterea medie pătratică
Definiţie: Rădăcina pătrată a dispersiei   2

Proprietate: De obicei, între abaterea medie pătratică şi abaterea medie


liniară există următoarea relaţie:

4
d 
5
Abaterea medie pătratică are ca unitate de măsură, unitatea de măsură
a variabilei analizate.
Indicatorii sintetici ai variaţiei (4)

Coeficientul de variaţie sau de omogenitate


Definiţie: Este o exprimare în cifre relative (vezi indicatorii simpli ai
împrăştierii) a abaterii standard

CV  100
Proprietăţi: x
• de obicei CV ia valori în intervalul [0;100]
• valori mici (apropiate de limita inferioară) ale indicatorului indică o serie
omogenă (media, mediana, valoarea modală sunt reprezentative)
• valori mari (apropiate de limita superioară) ale indicatorului arată o serie
eterogenă (neomogenă) (media, mediana, valoarea modală sunt
nereprezentative)
• pentru a considera o serie omogenă, teoria recomandă, ca valoarea
CV sa fie cel mult 30-35%
Caz particular pentru dispersie
Dispersia variabilei de tip binar

(1  p ) 2
N  ( 0  p ) 2
M 2 N  2 M 
 
2 q
    p  
N M  N M   N M 

q p  p q  pq( p  q )  pq  p (1  p )
2 2

Dispersia maximă a variabilei de tip binar este 0,25


Studiul formei funcţiilor de repartiţie (1)

Asimetria

1) Metode simple de analiză a asimetriei


a) metoda vizuală
serie simetrică serie asimetrică spre stânga serie asimetrică spre dreapta
43

38 43
43
33 38
38
28

Studenti
33 33
23
28

Studenti
28
Studenti

18
23 23
13
18 18
8
13 13
3
8 8
2 3 4 5 6 7 8 9 10
3 3
Nota
2 3 4 5 6 7 8 9 10 2 3 4 5 6 7 8 9 10
Nota Nota
Asimetria (2)

b) metoda comparării indicatorilor tendinţei centrale ( x, Me şi Mo)


43

38

33

28

Studenti 23

18

13

3
2 3 4 5 Mo
6 7 8 9 10

Me Nota

x
Asimetria (3)

b) metoda comparării indicatorilor tendinţei centrale ( x, Me şi Mo)


43

38

33
28
Studenti

23

18

13
8

3
2 3 4 5 6 7 8 9 10
Mo Me x
Nota
Asimetria (4)

b) metoda comparării indicatorilor tendinţei centrale ( x , Me şi Mo)


43

38

33

28
Studenti

23
18

13

3
2 3 4 5 6 x 7 Me 8 Mo
9 10
Nota
Asimetria (5)
2) Metode analitice de
abordare

Coeficienţii de asimetrie ai lui Pearson

C as 
x  Mo 3x  Me 
C as 
 
Proprietăţi şi interpretare: Proprietăţi şi interpretare:
• interval de valori [-1;+1 ] • interval de valori [-3;+3 ]
• semnul arată direcţia asimetriei • semnul arată direcţia asimetriei
• valori mici (apropiate de 0) • valori mici (apropiate de 0)
indică o asimetrie de mică indică o asimetrie de mică
intensitate intensitate
• valori mari (apropiate de ±1) • valori mari (apropiate de ±3)
indică o asimetrie cu intensitate indică o asimetrie cu intensitate
Asimetria (6)

Coeficienţii lui Pearson (continuare) Coeficientul lui Bowley

 32 Cas 
q3  q2   q2  q1 
Cas  1  3 q3  q2   q2  q1 
2
unde: Proprietăţi şi interpretare:
 x  x  n
i
2
i • interval de valori [-1;+1 ]
 2  2

n i
• semnul arată direcţia asimetriei
• valori mici (apropiate de 0)
(momentul centrat de ordin 2)
indică o asimetrie de mică
intensitate
 x  x  n
3
i i
3  • valori mari (apropiate de ±1)
n i
indică o asimetrie cu intensitate
(momentul centrat de ordin 3) foarte mare
Boltirea (1)

50 1) Metoda vizuală
45
40
35

serie
30
mezocurtică serie leptocurtică serie platicurtică
Studenti

25
20
15
50
10
45
50
5 40
45
0 35
40
1 2 3 4 5 6 7 8 9 10 30

Studenti
35
25
30
Nota
Studenti

20
25 15
20 10
15 5
10 0
5 1 2 3 4 5 6 7 8 9 10

0 Nota
1 2 3 4 5 6 7 8 9 10
Nota
2

Boltirea (2)
2) Metoda
analitică

Coeficientul lui Pearson Coeficientul lui Fischer


4
2  2 unde
2  2  3
2

 i
x  x 4
ni
4  Interpretare:
n i 2 =0 (repartiţie mezocurtică)
(momentul centrat de ordinul 4)
2 >0 (repartiţie leptocurtică)
Interpretare: 2 <0 (repartiţie platicurtică)
β2=3 (repartiţie mezocurtică)
β 2>3 (repartiţie leptocurtică)
β 2<3 (repartiţie platicurtică)
Statistică teoretică şi economică

CAPITOLUL 9.
INDICII STATISTICI
Cuvinte cheie:
- indice cronologic
- indice individual
- indice de grup
- indice agregat
- indice al factorului cantitativ
- indice al factorului calitativ (intensiv)

Indicii sunt o categorie de indicatori utilizaţi în caracterizarea oricăror fenomene


social-economice, deoarece reflectă modificările care au loc, precum şi influenţa
diferiţilor factori care acţionează asupra fenomenului studiat.
Se poate spune că indicele sintetizează într-o expresie numerică nivelul relativ
atins de caracteristica studiată în cadrul unui ansamblu de caracteristici prin care este
definit fenomenul social-economic respectiv. În acelaşi timp, indicii se pot constitui într-
o metodă statistică de analiză în dinamică a evoluţiei unui fenomen.
De exemplu, cunoaşterea unor informaţii cum sunt: producţia, profitul, cifra de
afaceri şi capitalul unei firme agricole nu sunt suficiente pentru aprecierea ritmurilor
activităţii desfăşurate de respectiva firmă. Cu ajutorul indicilor se pot obţine informaţii
suplimentare referitoare la dinamica activităţii economice, precum şi identificarea
influenţelor altor factori economici asupra acestor indicatori.
Într-un sens mai larg, indicii sunt mărimi relative cu ajutorul cărora se evidenţiază
modificarea în timp a fenomenelor sociale şi economice faţă de o anumită perioadă.
Din punct de vedere cognitiv, indicii au următoarele funcţii:
- exprimă nivelul relativ al caracteristicii studiate pe un element
sau pe o colectivitate de elemente, pentru a arăta cât reprezintă
(de câte ori s-a modificat) nivelul analizat faţă de cel de
referinţă;
- în cazul unui sistem de variabile, legate printr-o relaţie de
multiplicare, indicii servesc şi ca instrument de analiză
factorială, dând posibilitatea descompunerii pe factori de
influenţă a variaţiei unei caracteristici complexe. În acest caz,
caracteristica complexă trebuie să fie rezultatul prin
multiplicare a cel puţin unui factor extensiv şi a unui factor
intensiv.
În sens matematic, indicele statistic este un număr pur, care măsoară variaţiile
relative ale unei mărimi ce reprezintă caracteristica statistică (x), frecvenţa (f) sau
fenomenul în tatalitatea sa (x ⋅ f) între două fracţiuni de timp sau de spaţiu.

9.1. Clasificarea indicilor.


Indicii se pot clasifica după următoarle criterii:
a) din punctul de vedere al destinaţiei lor:
Statistică teoretică şi economică

• indici cronologici (indici ai dinamicii), atunci când se fac comparaţii cu nivelul


unei perioade trecute;
• indici teritoriali, atunci când se compară două unităţi administrativ-teritoriale;
• indici de plan, atunci când se au în vedere relaţii existente între unităţile
economice, deci la nivel microeconomic (indicele sarcinii de plan, care se
calculează ca raport între nivelul planificat faţă de realizările precedente, şi
indicele realizării sau nerealizării planului, când se raportează nivelul realizat la
nivelul planificat);
b) Din punctul de vederea al sferei de cuprindere:
• indici individuali, atunci când ei exprimă nivelul relativ al unui singur element al
colectivităţii şi se notează cu ″i″; de exemplu:
1) indicele individual al variabilei complexe:

y1 x1 ⋅ f 1
i1y/ 0 = = ;
y 0 x0 ⋅ f 0

2) indicele individual al factorului cantitativ:

f1
i1f/ 0 = ;
f0

3) indicele individual al factorului calitativ:

x1
i1x/ 0 = .
x0

Deoarece y = x ⋅ f, variaţia în timp sau spaţiu a acestor caracteristici urmează


relaţia:

iy = ix ⋅ if

• indici de grup sau sintetici, care exprimă nivelul relativ al întregului ansamblu de
elemente şi se notează cu ″I″; de exemplu:
- indicele de grup al volumului valoric (Iy);
- indicele de grup al volumului fizic (Iq);
- indicele de grup al preţului (Ip);
De asemenea indicii de grup verifică sistemul Iy = Iq ⋅ Ip.
c) Din punctul de vedere al naturii elementelor colectivităţii (indicii se
diferenţiază ca metodă de calcul):
- în cazul unei colectivităţi eterogene, indicii pot fi calculaţi ca:
• indicii agregaţi, care recurg la o combinaţie teoretică ca mijloc de izolare a
influenţei fiecărui factor explicativ;
• indicii medii, care se formează ca medii aritmetice sau armonice ale indicilor
individuali;
Statistică teoretică şi economică

- în cazul unei colectivităţi omogene, variaţia factorului intensiv poate fi


caracterizată printr-un sistem de indici calculaţi ca raport a două medii.
d) Din punctul de vedere al sistemului de ponderare:
• indici cu pondere fixă sau constantă (Laspeyres - 18641):

I Lf =
∑f 1 ⋅ x0
I Lx =
∑f 0 ⋅ x1
I y ≠ I Lf ⋅ I Lx ;
∑f 0 ⋅ x0 ∑f 0 ⋅ x0

• indici cu pondere curentă sau variabilă (Paasche - 18742):

I pf =
∑f 1 ⋅ x1
I px =
∑f 1 ⋅ x1
I y ≠ I pf ⋅ I px ;
∑f 0 ⋅ x1 ∑f 1 ⋅ x0

• indici cu pondere combinată (încrucişată, mixtă):

If =
∑f 1 ⋅ x0
Ix =
∑f 1 ⋅ x1
I y = If ⋅Ix;
f 0 ⋅ x0 ∑f 1 ⋅ x0

deci, în acest din urmă caz, proprietatea de reversibilitate a factorilor se verifică.


• indici cu pondere ″ideală″ (Fisher – 19223):
i) în cazul factorului cantitativ:

I Ff =
∑f 1 ⋅ x0

∑f 1 ⋅ x1
= I Lf ⋅ I pf ;
∑f 0 ⋅ x0 ∑f 0 ⋅ x1

ii) în cazul factorului calitativ:

I Fx =
∑f 0 ⋅ x1

∑f 1 ⋅ x1
= I Lx ⋅ I px I y = I Ff ⋅ I Fx
∑f 0 ⋅ x0 ∑f 1 ⋅ x0

1
Etiene Laspeyres (1834 -1913), economist şi statistician german, profesor la universităţile din Basel,
Riga, Karlsruhe şi altele. În statistica preţurilor a formulat, în 1864, un indice care îi poartă numele.
Principalele sale lucrări sunt: HamburgerWarenpreise, 1851-1863 und die californischaustralischen
Goldetfeckungen seit 1848; Die Berechnung einer mitttleren Warenpreissteigerung.
2
Herman Paasche (1851-1925), economist şi statistician german, agent de bursă la Hamburg în perioada
formulării variantei de indice de preţuri cu pondere curentă. Principalele lucrări: Ulber die
Preisentwicklung der letzten Jahre nach den Hamburger Preisnoteierungen (1874); Studien uber die Natur
der Gerdwertung und ihre praktische Bedeutung in den lotzten Jahrzehnten auf Grund statistischen
Detaillmaterials entnommen der Stadt Halle a/S (1878).
3
Irving Fisher (1867-1947), economist şi statistician din S.U.A., a descoperit nu mai puţin de 352 de
variante, formulând şi varianta: ″indicele geometric″, care este cunoscut sub denumirea de ″indicele 353″
sau ″indicele ideal″, pentru că satisface toate testele de verificare, consemnate, de altfel, de acelaşi autor.
Lucrările principale: Mathematical Investigation in the Theoryof Value and Prices (1922); The Marking of
Index Numbers (1922); The Best From of Index Number (1921).
Statistică teoretică şi economică

e) Din punct de vedere al modului de alegere a bazei de raportare, indicii se


împart în:
• indici cu bază fixă, atunci când se face raportarea nivelului fiecărei perioade la
nivelul unei anumite perioade considerată perioadă de bază sau de comparare;
• indici cu bază mobilă, atunci când se face raportarea nivelului fiecărei perioade la
nivelul perioadei anterioare.
Se observă că efectuarea calculului unui indice se face raportând nivelul analizat,
notat cu indicativul ″1″, la nivelul de bază, de comparaţie, notat cu indicativul ″0″.

9.2. Probleme metodologice ale indicilor de grup.


Acest tip de probleme se referă la: alegerea bazei de rapoarte şi a formulei de calcul,
stabilirea sistemului de ponderare, cuprinderea fiecărui indice în sisteme coerente de
informaţii statistice.
Grupul de probleme poate fi soluţionat dacă satisfac o serie de teste (reguli) de
verificare:
- reversibilitatea în timp: constă în faptul că indicele calculat ca raport între
nivelul perioadei curente şi cel al perioadei de bază trebuie să fie o mărime inversă a
indicelui rezultat prin raportarea nivelului de bază la cel din perioada curentă. Cu alte
cuvinte, indicele anului ″b″ calculat cu bază în anul ″a″ reprezintă o mărime inversă a
indicelui anului ″a″ calculat cu baza în anul ″b″:

1
ib / a =
ia / b

Reversibilitatea trebuie să o întâlnim la toţi indicii. Deci, între cele două tipuri de
indici există relaţia:

ib / a ⋅ i a / b = 1

- reversibilitatea factorilor: produsul indicilor factorilor trebuie să fie egal cu


indicele variabilei complexe.
După această regulă, dacă se substituie factorii indicelui, produsul noilor indici nu se
modifică. Dacă factorii ″x″ şi ″f″ işi schimbă locurile între ei, rezultă că:

I 1y/(0x ) =
∑x
1 ⋅ f1
devine I 1y/(0x ) =
∑f 1 ⋅ x1
∑x 0 ⋅ f1 ∑f 0 ⋅ x1

şi respectiv:

I 1y/(0f ) =
∑x 0 ⋅ f1
devine I 1y/(0x ) =
∑f 0 ⋅ x1
∑x
0 ⋅ f0 ∑f 0 ⋅ x0
Statistică teoretică şi economică

Produsul noilor indici factoriali obţinuţi este egal cu indicele general al variaţiei
fenomenului complex;
- tranzitivitatea: presupune obţinerea indicelui cu bază fixă prin înmulţirea unui
şir de indici cu bază mobilă pentru peroada analizată.
Fie:

i1/0, i2/1, i3/0, i4/3, i5/4,


indici cu bază mobilă pe intervalul de timp (0…5); atunci indicele cu bază fixă 5
faţă de 0 va fi produsul acestor indici:

y1 y 2 y 3 y 4 y 5
i1 / 0 ⋅ i 2 / 1 ⋅ i3 / 2 ⋅i 4 / 3 ⋅i5 / 4 = ⋅ ⋅ ⋅ ⋅ = i5 / 0 ;
y 0 y1 y 2 y 3 y 4

- circularitatea: verifică indicii cu bază mobilă prin intermediul probalilităţii de


trecere dintr-o bază de calcul în alta.
Dacă se consideră anii ″a″, ″b″ şi ″c″ şi se calculează indicele anului ″b″ în bază
″a″ şi un indice pentru anul ″c″, produsul lor trebuie să fie egal cu indicele anului ″c″ cu
bază în anul ″a″.

ib / a ⋅ i c / n = i c / a

În acest caz:

ib / a ⋅ i c / b ⋅ i a / c = 1

De fapt, circularitatea este o extindere a testului reversibilităţii în timp.


Baza de raportare trebuie să fie astfel stabilită, încât să reflecte variaţia reală a
fenomenului supus analizei. Aceasta nu trebuie să exprime un nivel de excepţie al
variaţiei, ci un nivel obşnuit, conform tendinţei generale a evoluţiei fenomenului
respectiv.
În situaţia economiei de piaţă, alegerea bazei de calcul are o însemnătate
deosebită în urmărirea fenomenelor, considerând faptul că ciclul economic cuprinde atât
faze de avânt, cât şi faze de depresiune. În astfel de situaţii, baza poate fi aleasă ori o
perioadă de depresiune ori una de prosperitate, şi deci indicii nu reflectă corespunzător
evoluţia fenomenului respectiv.
De asemenea, există situaţii când prin modul de alegere a perioadei de bază
realitatea poate fi denaturată.
Pentru a soluţiona o asemenea problemă există două posibilităţi:
- calcularea unei medii a mărimilor din perioada unui întreg ciclul economic;
- schimbarea, relativ frecventă, a bazei de calcul.
Însă, schimbarea bazei de calcul necesită un volum de muncă dublu şi presupune
o discotinuitate, ceea ce împiedică comparaţia. Pentru a evita şi această problemă,
Stanley Jevos şi Alfred Marchall au propus construirea indicilor în lanţ continuu,
metodă care constă în schimbarea autonomă a bazei la fiecare calcul nou al indicelui.
Statistică teoretică şi economică

În ceea ce priveşte formula de calcul, aceasta se alege în funcţie de datele


disponibile şi de natura elementelor care compun clectivitatea se doreşte a fi studiată.
Astfel, există posibilitateate alegerii indicilor agregaţi, indicilor medii de grup sau a
indicilor obţinuţi ca raport de medii.
Sistemul de ponderare a fost şi continuă să fie aspectul care, în teoria şi practica
statistică, a creat cele mai multe probleme. Aceasta este o problemă-cheie a metodologiei
de construire a indicilor statistici.
O bază ştiinţifică a căpătat această problemă prin propunerea făcută de Etienne
Laspeyres în 1864, statistician german (1834-1913), astfel apărând în literatura statistică
formula indicelui Laspeyres sau metoda lui Laspeyres.
Indicii agregaţi ai volumului fizic şi ai preţului sunt construiţi folosind ponderile
la nivelul perioadei de bază. Astfel, s-a ajuns la relaţiile:

I 1q/ 0 =
∑ q1 ⋅ p 0 şi I 1p/ 0 =
∑q 0 ⋅ p1
∑ q0 ⋅ p0 ∑q 0 ⋅ p0

Se observă că, în cazul primului indice, cel al cantităţii (variabila cantitativă), s-a
utilizat ponderea (preţul) din perioada de bază, iar în cazul celui de-al doilea indice, cel al
preţului (variabila calitativă), s-a utilizat ponderea (cantitatea) din perioada de bază.
Acest tip de indice se mai numeşte şi cu pondere constantă sau fixă.
În 1874, economistul german Hermann Paasche a produs un indice, folosind
ponderile perioadei curente:

I 1q/ 0 =
∑q 1 ⋅ p1
şi I 1p/ 0 =
∑q 1 ⋅ p1
∑q 0 ⋅ p1 ∑q 1 ⋅ p0

In cazul indicelui cantităţii (variabila cantitativă), acesta este ponderat cu preţul


din perioada curentă, iar în cazul indicelui preţului (variabila calitativă), ponderea este
cantitatea din perioada curentă.
Acest tip de indice se mai numeşte şi cu pondere variabilă sau curentă.
Însă, nici unul dintre aceşti doi indici nu satisface o cerinţă importantă, şi anume,
proprietatea de reversibilitate a factorilor.
Formulele Laspeyres şi Paasche nu alcătuiesc un sistem comparabil de relaţii de
calcul, deoarece produsul variaţiei factorilor (Ip⋅Iq) nu conduce la obţinerea nivelului
relativ al variabilei complexă (Iv).
Un alt indice folosind ponderile din ambele perioade este indicele ″ideal″ al lui
Fischer. Formula indicelui său este, de fapt, o medie geometrică a formulelor lui
Laspeyres şi Paache:

I 1q/ 0 =
∑ p ⋅q ⋅ ∑ p
0 1 1 ⋅ q1
şi I 1p/ 0 =
∑p 1 ⋅ q0

∑q 1 ⋅ p1
∑p q ∑p
0 0 1 ⋅ q0 ∑p 0 ⋅ q0 ∑q 1 ⋅ p0
Statistică teoretică şi economică

Este considerat a fi un indice ideal datorită faptului că se încadrează în intervalul


de variaţie a valorilor celor doi indici calculaţi pe baza celor două sisteme de ponderare.
Deci, are puterea de compensare a tendinţei de modificare a ponderilor folosite.
Dacă indicii Laspeyres şi Paasche au la bază media aritmetică, indicele Fischer
foloseşte media geometrică, fapt cu care au fost de acord şi alţi teoreticieni.
În cazul acestui indice se observă:

v
I p = I Fq ⋅ I Fp
Indicele Fischer se foloseşte la calcul indicilor teritoriali, în situaţia comparării
mai multor ţări: de exemplu, indicele consumului populaţiei, unde preţurile luate ca
ponderi se referă la ţările comparate.
Indicele prezintă însă un dezavantaj destul mare, şi anume, necesită cunoaşterea
separată a tuturor elementelor de calcul, precum şi combinarea tuturor variabilelor
posibile, mai ales în cazul în care sfera de cuprindere a colectivităţii la care se referă
indicii este foarte mare. Bineînţeles, indicii calculaţi după aceste trei variante de
ponderare nu dau aceleaşi rezultate. Având în vedere aceste neajunsuri, cercetările cu
continuat pentru găsirea unui indice mai bun însă până în prezent nu s-au găsit decât noi
formule de compromis.
Astfel, Y.F. Edgenworth4 a propus următorul indice:

I 1p/ 0 =
∑p 1 ⋅ (q1 + q 0 )
∑p 0 ⋅ (q1 + q 0 )

Indicele cumulează cantităţile din perioada de bază cu cele din perioada curentă,
cumul folosit la studiul variaţiei preţului, adică variaţiei calitative. Însă, indicele are un
dezavantaj, el nu poate fi utilizat decât pentru studiul variaţiei variabilei calitative,
deoarece ponderea (variabila calitativă) poate fi cumulată; în schimb, la studiul variabilei
cantitative nu se poate aplica, deoarece factorii calitativi nu au sens să fie cumulaţi de la o
perioadă la alta.
O altă formulă de compromis a fost propusă de statisticianul polonez Jean
Wisniewski, în sensul unui indice mediu, elaborat cu ajutorul calculului integral.
Unii statisticiani au propus un procedeu simplu şi rapid, prin calcularea indicelui
pe baza medianei.
De asemenea, un alt procedeu de ponderare este şi cel propus de matematicianul
şi filosoful german Mortiz Wilhelm Drobisch:

I=
∑ p ⋅q :∑ p ⋅q
1 1 0 0

∑q ∑p 1 0

4
Francis Ysidor Edgeworth (1845-1926), statistician, matematician şi economist englez. Profesor în
economie la Oxford (1891) şi la Londra. A fost influenţat de concepţia bayesiană. A avut o importantă
contribuţie la teoria indicilor şi la aplicarea statisticii matematice în economie; autor al unor lucrări
fundamentale de teoria statisticii. Lucrări principale: On the Method of Ascertaining a Change in the Value
of Gold (1883); Defence of Index-Numbers (1896); Metretica sau metodica de măsurare a probabilităţii şi
unităţii (1887); Despre metodele statisticii (1885).
Statistică teoretică şi economică

Este de menţionat şi formula statisticianului francez Lucien March:

p1
∑p ⋅ q1
I= 0

∑q 1

În istoria statisticii au fost nenumărate încercări şi propuneri de ponderare, cele


mai utilizate însă sunt cele de tip Laspeyres, Paasche şi Fischer.

9.3. Descompunerea pe factori de influenţă a variaţiei unui fenomen complex


folosind metoda indicilor.
Explicarea cauzală a variaţiei unui fenomen complex reprezintă o funcţie cognitivă
importantă a indicilor. De exemplu, dacă dorim să analizăm influenţa volumului fizic (q)
şi a preţurilor (p) asupra variaţiei valorii producţiei (v), sau influenţa productivităţii
muncii (w) şi a numărului de ore-om cheltuite pentru producţie (T) asupra producţiei,
putem utiliza indicii ca metodă de separare şi cuantificare a acestor influenţe.
Orice variaţie a unui fenomen social-economic se poate studia atât în mărimi
absolute, cât şi în mărimi relative.
Descompunerea pe factori a sporului absolut se numeşte şi descompunere
aritmetică sau analitică, iar descompunerea în mărime relativă se numeşte descompunere
geometrică. Descompunerea analitică se bazează pe relaţia de adunare constând în
separarea modificării totale în suma modificărilor absolute a factorilor supuşi cercetării.
Descompunerea geometrică are la bază relaţia de produs şi constă în descompunerea
indicelui general în produsul indicilor factoriali.

Metoda substituirilor în lanţ


Această metodă constă în anihilarea, pe rând, a câte unui factor de influenţă,
menţinându-se variaţia factorului supus analizei. În această idee se vor folosi sisteme de
ponderare diferite, care fac ca produsul lor să fie egal cu indicele general.
Presupunem existenţa unui fenomen complex de tipul y = x ⋅ f.
Analizat în timp, acesta va fi:

I 1y/ 0 =
∑x
1 ⋅ f1
,
∑x
0 ⋅ f0

unde ″x″ este factorul calitativ şi ″f″ este factorul cantitativ. Corespunzător,
descompunerea analitică va fi:

∆ y1 / 0 = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 0

Influenţa factorului calitativ se determină după una dintre relaţiile:


Statistică teoretică şi economică

I 1y/(0x ) =
∑x 1 ⋅ f1
sau I 1y/(0x ) =
∑x 1 ⋅ f0
;
∑x 0 ⋅ f1 ∑x 0 ⋅ f0

În acest caz, modificările absolute vor avea următoarele relaţii:

∆ y1(/ x0) = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 1 sau ∆ y1(/ x0) = ∑ x1 ⋅ f 0 − ∑ x 0 ⋅ f 0

Influenţa factorului cantitativ se determină opţional după una din următoarele


relaţii:

I 1y/(0f ) =
∑x 1 ⋅ f1
sau I 1y/(0f ) =
∑x 0 ⋅ f1
∑x 1 ⋅ f0 ∑x 0 ⋅ f0

În acest caz, modificările absolute vor avea următoarele relaţii:

∆ y1(/ 0f ) = ∑ x1 ⋅ f 1 − ∑ x1 ⋅ f 0 sau ∆ y1(/ 0f ) = ∑ x 0 ⋅ f 1 − ∑ x 0 ⋅ f 0

Pentru a răspunde testelor de verificare:

I 1y/ 0 = I 1y/(0x ) ⋅ I 1y/(0f )


∆ y1 / 0 = ∆ y1(/ x0) ⋅ ∆ y1(/ 0f ) ,

va trebui să utilizăm una dintre următoarele două variante:


- varianta a:

I 1y/ 0 =
∑x 1 ⋅ f1
; ∆ y1 / 0 = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0

I 1y/(0x ) =
∑x 1 ⋅ f1
; ∆ y1(/ x0) = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 1 ;
∑x 0 ⋅ f1

I 1y/(0f ) =
∑x 0 ⋅ f1
; ∆ y1(/ x0) = ∑ x 0 ⋅ f 1 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0

- varianta b:

I 1y/ 0 =
∑x 1 ⋅ f1
; ∆ y1 / 0 = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0
Statistică teoretică şi economică

I 1y/(0x ) =
∑x 1 ⋅ f0
; ∆1y/(0x ) = ∑ x1 ⋅ f 0 − ∑ x0 ⋅ f 0 ;
∑x 0 ⋅ f0

I 1y/(0f ) =
∑x 1 ⋅ f1
; ∆ y1(/ 0f ) = ∑ x1 ⋅ f 1−∑ x1 ⋅ f 0 .
∑x 1 ⋅ f0

Se observă că ambele variante corespund testelor de verificare enunţate mai sus.


Cele două variante pornesc de la ipotezele: y1 > y0; x1 >x0; f1 > f0, deci vom avea şi
următoarele sporuri:

∆ y1 / 0 = y1 − y 0 ; ∆x1 / 0 = x1 − x 0 ; ∆ 1f / 0 = f 1 − f 0 .

Prin urmare, sporul variabilei complexe ″y″ în funcţie de factorul ″x″ va fi:
- pentru varianta a:

∆ y1(/ x0) = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 1 = ∑ f 1 ⋅ ( x1 − x 0 ) = ∑ f 1 ⋅ ∆x1 / 0 ;

- pentru varianta b:

∆ y1(/ x0) = ∑ x1 ⋅ f 0 − ∑ x 0 ⋅ f 0 = ∑ f 0 ⋅ ( x1 ⋅ x 0 ) = ∑ f 0 ⋅ ∆x1 / 0 ,

iar sporul variabilei complexe ″y″ în funcţie de factrul cantitativ ″f″ va fi:

∆ y1(/ 0f ) = ∑ x 0 ⋅ f 1 − ∑ x 0 ⋅ f 0 = ∑ x 0 ( f 1 − f 0 ) = ∑ x 0 ⋅ ∆ 1f / 0 ;

- pentru varianta b:

∆ y1(/ 0f ) = ∑ x1 ⋅ f 1 − ∑ x1 ⋅ f 0 = ∑ x1 ⋅ ( f 1 − f 0 ) = ∑ x1 ⋅ ∆ 1f / 0 .

Însă, din inegalitatea f1>f0 rezultă că sporul factorului ″x″ în prima variantă este
mai mare decât în cea de-a doua variantă cu produsul diferenţei dintre ponderi şi creşterea
variabilei calitative.
Dacă analizăm cel de-al doilea factor, sporul variaţiei complexe ″y″ în funcţie de
factorul cantitativ ″f″, rezultă că influenţa este mai mare cu aceeaşi valoare, deoarece
ponderea folosită x1 > x0 se multiplică pentru toată creşterea factorului ″f″. Cei mai mulţi
statisticieni şi economişti atribuie această diferenţă inlfuenţei factorului calitativ,
considerând faptul că modificarea acestuia este condiţionată de modificararea factorului
cantitativ şi deci este justificată folosirea ponderii din perioada curentă.
În general, dacă substiuirea începe cu factorul calitativ, atunci, pe măsură ce am
luat în considerare un factor, el rămâne în perioada de bază ca pondere, factorii neluaţi în
calcul însă vor fi stabiliţi în perioada curentă.
Statistică teoretică şi economică

Astfel, pentru a evidenţia mai clar această regulă, presupunem un fenomen


complex (y) influneţat de trei factori (x – factor calitativ, f şi t – factori cantitativi).
sistemul de indici şi descompunerea absolută vor fi:

I 1y/ 0 =
∑ x ⋅ f ⋅t
1 1 1
∆ y1 / 0 = ∑ x1 ⋅ f 1 ⋅ t1 − ∑ x 0 ⋅ f 0 ⋅ t 0 ;
∑ x ⋅ f ⋅t
0 0 0

I 1y/(0x ) =
∑ x ⋅ f ⋅t1 1 1
∆ y1(/ x0) = ∑ x1 ⋅ f 1 ⋅ t1 − ∑ x 0 ⋅ f 1 ⋅ t1 ;
∑ x ⋅ f ⋅t0 1 1

I 1y/(0f ) =
∑x 0 ⋅ f 1 ⋅ t1
∆ y1(/ 0f ) = ∑ x 0 ⋅ f 1 ⋅ t1 − ∑ x 0 ⋅ f 0 ⋅ t1 ;
∑x 0 ⋅ f 0 ⋅ t1

I 1y/(0f ) =
∑x 0 ⋅ f 0 ⋅ t1
∆ y1(/t0) = ∑ x 0 ⋅ f 0 ⋅ t1 − ∑ x 0 ⋅ f 0 ⋅ t 0 .
∑x 0 ⋅ f 0 ⋅ t0

Metoda influenţelor iozlate (MII) sau metda restului nedescompus (MRN)


Această metodă presupune modificarea unui factor, în situaţia în care ceilalţi
rămân la nivelul perioadei de bază. Astfel, suma influenţelor izolate ale celor doi factori
nu este egală cu întreaga modificare, rămânând un rest (restul nedescompus) datorat
interacţiunii celor doi factori.
Deci, utilizând această metodă, descompunerea se va face în felul următor:
- modificarea variabilei complexe:

I 1y/ 0 =
∑x 1 ⋅ f1
, respectiv ∆ 1 / 0 y = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0

- modificarea factorului cantitativ:

I 1y/(0f ) =
∑x 0 ⋅ f1
, respectiv ∆ y ( f ) = ∑ x 0 ⋅ f 1 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0

- modificarea factorului calitativ:

I 1y/(0x ) =
∑x 1 ⋅ f0
, respectiv ∆ y ( x ) = ∑ x1 ⋅ f 0 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0

- restul nedescompus:
Statistică teoretică şi economică

I 1y/(0x ∩ f ) =
∑x 1 ⋅ f1
:
∑x 1 ⋅ f0
, respectiv
∑x 0 ⋅ f1 ∑x 0 ⋅ f0

∆ y ( x∩ f ) = ∑ x1 ⋅ f1 − ∑ x0 ⋅ f 1 − ∑ x1 ⋅ f 0 + ∑ x0 ⋅ f 0

Relaţia dintre indici este:

I 1y/ 0 = I 1y/(0x ) ⋅ I 1y/(0f ) ⋅ I 1y/(0x ∩ f )

Restul nedescompus este necesar să fie repartizat pe cei doi factori de influemţă.
De regulă, repartizarea se face în funcţie de ponderea influenţei izolate a fiecărui factor în
totalul celor două influenţe izolate. Deci, se vor calcula coeficienţii de realizare:

∆y ( f ) ∆y ( x)
k = y( f )
f
şi k = y( f )
x
,
∆ + ∆y ( x) ∆ + ∆y ( x)

rezultând:
- influenţa totală a factorului cantitativ:

∆ y ( f ) = ∆y ( f ) + k f ⋅ ∆y ( x ∩ f ) ;

- influenţa totală a factorului calitativ:

∆ y ( x ) = ∆y ( x) + k x ⋅ ∆y ( x ∩ f )

Metoda influenţelor izolate oferă rezultate mai exacte decât metoda substituirilor
în lanţ, care atribuie întreg sporul nedescompus factorului calitativ. MSL se utilizează
numai în cazul în care factorul cantitativ se modifică nesemnificativ şi dacă ponderea sa
în restul nedescompus este foarte mică.

9.4. Indici calculaţi ca medie a indicilor individuali.


Practica economică a arătat că nu întotdeauna determinarea unor agregate de
forma x0 ⋅ f1 sau x1 ⋅ f0 este posibilă, pe de o parte, datorită unor cheltuieli suplimentare în
stabilirea acestora şi, pe de altă parte, datorită faptului că determinarea lor ar fi atunci
când s-ar cunoaşte numai variabila complexă (y), dar nu şi, separat, variabila calitativă
(x) şi cea cantitativă (f). În acest caz, pentru determinarea indicilor agregaţi se apelează la
indici ca medie (aritmetică sau ponderată) a indicilor individuali. Indicii rezultaţi vor fi
egali cu cei agregaţi.
Teoretic pot exista următoarele situaţii:
• se cunoaşte nivelul caracteristicii complexe în perioada de bază (y0 = f0 x0)
şi valorile factorului cantitativ în cele două perioade (f0 şi f1), deci şi
indicele individual (if):
Statistică teoretică şi economică

I 1f/ 0 =
∑x 0 ⋅ f1
if =
f1
⇒ f1 = i f ⋅ f 0 ;
∑x 0 ⋅ f0 f0

deci:

I f
=
∑i ⋅ x ⋅ f
f
0 0
;
∑x ⋅ f
1/ 0
0 0

• se cunoaşte nivelul caracteristicii complexe în perioada de bază (y0 = f0 ⋅


x0) şi valorile factorului calitativ (x0 şi x1), deci şi indicele individual (ix):

I 1x/ 0 =
∑x 1 ⋅ f0
ix =
x1
⇒ x1 = i x ⋅ x 0 ,
∑x 0 ⋅ f0 x0

deci:

I 1x/ 0 =
∑i x ⋅ f x
0 0

∑x ⋅ f 0 0

• se cunoaşte nivelul caracteristicii complexe în perioada curentă (y1 = x1 ⋅f1)


şi valorile factorului cantitativ în cele două perioade (f0 şi f1):

f
I1/ 0 =
∑x 1 ⋅ f1
if =
f1
⇒ f0 =
1
⋅ f1 ,
∑x 1 ⋅ f0 f0 if

deci:

I1/ 0 =
f ∑x ⋅ f 1 1

1
∑i ⋅x ⋅ f f 1 1

• se cunoaşte nivelul caracteristicii complexe înperioada curentă (y1 = x1 ⋅ f1)


şi valorile factorului calitativ în cele două perioade de analiză (x0 şi x1):

I 1x/ 0 =
∑x 1 ⋅ f1
ix =
x1
x0 =
1
⋅ x1 ,
∑x 0 ⋅ f1 x0 ix

deci:
Statistică teoretică şi economică

I 1x/ 0 =
∑x ⋅ f 1 1

1
∑i ⋅x ⋅ f
x 1 1

Se observă că, în cazurile a) şi b), indicii agregaţi au factorului cantitativ,


respectiv calitativ, au fost calculaţi ca o medie aritmetică a indicilor individuali ponderaţi
cu valoarea cunoscută x0 ⋅ f0.
În următoarele două cazuri, c) şi d), indicii agregaţi ai factorilor cantitativ şi
calitativ au fost determinaţi ca medii armonice ale indicilor individuali ponderaţi cu
valoarea cunoscută x1 ⋅ f1.
Aceste variante devin eficiente atunci când sistemul informaţional nu ne permite
obţinerea unui anumit tip de informaţii, având posibilitatea înlocuirii lor cu date
cunoscute, disponibile.

9.5. Indici calculaţi ca raport a două medii.


În practică apare deseori necesitatea de a calcula anumiţi indicatori calitativi la
nivel de colectivitate generală. În aceste condiţii, indicatorii respectivi au un caracter de
medie.
În anumite cazuri, când factorul cantitativ însumabil are o anumită structură (de
exemplu, salariaţii dintr-o filială a unei firme-mamă), fenomenul complex oglindeşte
influenţa schimbării în timp a doi factori: variaţia factorului calitativ şi structura
factorului cantitativ.
Pentru a rezolva o astfel de problemă, putem apela la calculul indicilor agregaţi ca
raport a două medii sau, altfel spus, la indicii valorilor medii. De exemplu, factorul
calitativ (preţul de vânzare, costul mediu, productivitatea muncii) poate fi reprezentat ca
medie, la nivelul întregii colectivităţi, astfel:

∑x ⋅ f = x

1 1
x= ⋅ g if ,
∑f
1
1

unde ponderea factorului cantitativ este calculată astfel:

fi
g if =
∑f i

Faptul că ponderea factorului cantitativ se determină pe baza însumării factorului


cantitativ ne conduce la ideea că putem utiliza calculul indicelui agregat cu ajutorul
raportului a două medii numai atunci când factorul cantitativ este însumabil. Dinamica
variabilei calitative calculată ca raport a două medii se face utilizând sistemul de indici
medii: indicele cu structură fixă, indicele cu structură variabilă şi indicele de variaţie a
structurii:
- indicele cu structură fixă:
Statistică teoretică şi economică

x ( x)
I SF =
∑x ⋅ f :∑x ⋅ f
1 1 0 1
.
∑f ∑f 1 1

Acest indice exprimă modificarea relativă a nivelului mediu în perioada curentă


faţă de perioada de bază sub influenţa factorului calitativ. În acest caz, modificarea
absolută a nivelului mediu al caracteristicii studiate se determină ca diferenţă între
numărătorul şi numitorul fiecărui indice:

∑x ⋅ f ∑x ⋅ f = x
∑ ⋅ g 1f − ∑ x 0 ⋅ g 1f ;
1 1 0 1
∆xSF( x ) = −
∑f ∑f
0
1 1

- indicele cu structură variabilă:

x ( x)
I SV =
∑x ⋅ f :∑x ⋅ f 1 1 0 0
.
∑f ∑f 1 0

Indicele exprimă modificarea relativă a nivelului mediu în perioada curentă faţă


de perioada de bază, luând în calcul atât influenţa factorului calitativ, cât şi a factorului
cantitativ (de strructură).
Modificarea absolută se determină după relaţia:

∆xSV( x , f ) =
∑x ⋅ f1 1

∑x ⋅ f 0 0
= ∑ x1 ⋅ g 1f − ∑ x 0 ⋅ g 0f
∑f 1 ∑f 0

- indicele de variaţie a structurii (modificare a stucturii):

I VSx ( f ) =
∑x ⋅ f :∑x ⋅ f
0 1 0 0
.
∑f ∑f 1 0

În acest caz, indicele reprezintă influenţa factorului cantitativ asupra dinamicii


valorii medii, iar determinarea modificării absolute este:

∆xVS( f ) =
∑x ⋅ f0 1

∑x ⋅ f 0 0
= ∑ x 0 g 1f − ∑ x 0 ⋅ g 0f .
∑f 1 ∑f 0

Relaţiile dintre aceşti indici şi respectiv, dintre modificările absolute sunt:

I SV = I SF ⋅ I VS ;
∆ SV = ∆ SF ⋅ ∆ VS .
Statistică teoretică şi economică

9.6. Indicii teritoriali.


În sens larg, putem spune că indicii teritoriali sunt mărimi relative de coordonare
utilizate pentru compararea fenomenelor şi proceselor economico-sociale de acelaşi fel
şi din aceeaşi unitate de timp, însă din unităţi de spaţiu diferite.
Indicii teritoriali se construiesc pentru comparaţiile economice şi sociale la nivel
internaţional sau naţional. Privitor la comparaţiile teritoriale naţionale, obiectul acestora îl
constituie: preţul mediu, costul mediu, recolta medie la hectar, salariul mediu,
productivitatea medie a muncii etc.
Pentru construirea indicilor teritoriali trebuie soluţionate următoarele probleme:
• asigurarea comprabilităţii conţinutului indicatorilor analizaţi;
• alegerea bazei de comparare;
• alegerea fenomenului formulei de calcul şi a sistemului de ponderare.
De exemplu, în cazul comparării a două unităţi administrativ-teritoriale A şi B,
avem următoarele variante:
a) indici teriotriali individuali:
- factorul calitativ (x):

XA XB
i Ax / B = sau i Bx / A = ;
XB XA

- factorul cantitativ (f):

fA fB
i Af / B = sau i Bf / A = ;
fB fA

- factorul complex (y = x ⋅ f):

yA X A f A yB X B ⋅ f B
i Ay / B = = sau i By / A = = .
yB X B f B yA X A ⋅ f A

În cazul celor doi factori, calitativ şi cantitativ, pe de o parte, şi al celui complex,


pe de altă parte, între cele două variante există relaţia de reversibilitatea în spaţiu:

i Ax / B ⋅ i Bx / A = 1
i af / B ⋅ i Bf / A = 1
i Ay / B ⋅ i By / A = 1

b) indici teritoriali de grup:


- forma agregată:

I Ay / B =
∑y A
=
∑X A ⋅ fA
sau I By / A =
∑y B
=
∑X B ⋅ fB
.
∑y B ∑X B ⋅ fB ∑y A X A ⋅ fA
Statistică teoretică şi economică

Principiul reversibilităţii în spaţiu nu este întotdeauna respectat, mai ales în cazul


indicilor de grup, deoarece apare elementul de ponderare sau frecvenţă.
Astfel, avem următoarle sisteme de ponderare:
- pentru factorul calitativ:

I Ax / B =
∑X A ⋅ fA
; I Ax / B =
∑X A ⋅ fB
∑X B ⋅ fA ∑X B ⋅ fB
sau

I Bx / A =
∑X B ⋅ fB
; I Bx / A =
∑X B ⋅ fA
.
∑X A ⋅ fB ∑X A ⋅ fA

- pentru factorul cantitativ:

I Af / B =
∑X A ⋅ fA
; I Af / B =
∑X B ⋅ fA
∑X A ⋅ fB ∑X B ⋅ fB

sau

I Bf / A =
∑X B ⋅ fB
; I Bf / A =
∑X A ⋅ fB
.
∑X B ⋅ fA ∑X A ⋅ fA

Pentru exemplificare să considerăm o societate comercială de export-import care


desface pe două pieţe diferite, două ţări diferite ″A″ şi ″B″, mai multe produse, în
cantităţile şi la preţurile din tabelul următor:

Denumire Cantitate (+) Preţ unitar ($/t) Volumul valoric al


produs vânzărilor ($)
qA qB pA pB QA QB
Produs A 20 25 80 75 1600 1875
Produs B 80 60 50 60 4000 3600
Produs C 45 40 100 120 4500 4800
TOTAL 145 125 - - 10.100 10.275

Pentru a compara cele două ţări, de fapt cele două pieţe, se va considera ca bază
de raportare piaţa ţării ″B″. Comparaţia se poate face din următoarele puncte de vedere:
- din punctul de vedere al cantităţilor vândute:

I Af / B =
∑f A
=
145
= 1,16 sau 116%
∑f B 125
Statistică teoretică şi economică

Acest rezultat arată că pe piaţa ″A″ s-au vândut cu 16% mai multe tone de marfă
decât pe piaţa ″B″:
- din punct de vedere al preţurilor:

I Ax / B =
xA
=
∑Q : ∑Q
A B
= 0,8473 sau 84,73%
xB ∑f ∑f
A B

Rezultatul arată că preţul mediu pe piaţa ″A″ a fost cu 15,27% mai mic decât
preţul mediu pe piaţa ″B″.
- din punctul de vedere al încasărilor:

I AQ/ B =
∑ Q A = 10100 = 0,9829 sau 98,29%
∑ QB 10275
Volumul valoric al tranzacţiilor pe piaţa ″A″ a fost cu 1,71% mai mic decât
volumul valoric al tranzacţiilor pe piaţa ″B″.
De remarcat, că şi în această situaţie se verifică relaţia:

I AQ/ B = I Af / B ⋅ I Ax / B

0,9829 = 1,16 ⋅ 0,8473

Analiza teritorială efectuată cu aportul indicilor teritoriali, trebuie să opteze pentru


acele relaţii de calcul care servesc cel mai bine scopului propus şi care sunt în măsură să
caracterizeze cel mai bine realitatea economico-socială.
Statistică teoretică şi economică

Probleme şi aplicaţii:
9.1. În exportul a trei produse se cunosc următoarele date comparative ale două
trimestre ale anului 1997:
(date convenţionale)
Denumire produs Indicii de preţuri Volumul valoric (mild.lei)
Trim III Trim IV
A 140 4 8
B 130 4 6
C 180 1 4

Se cere:
1. să se calculeze indicii individuali ai volumului valoric şi ai volumului fizic;
2. să calculeze indicii de grup care caracterizează evoluţia exportului celor trei produse;
3. să se măsoare influenţa factorilor posibili asupra evoluţiei volumului valoric al
exportului la nivelul firmei.

9.2. Se cunosc următoarele date referitoare la producţia de lactate realizată de


fabrica de lactate “Mioriţa-Lact” din Bucureşti:
(date convenţionale)
Produsul Unitate de Cantitate (mii) Preţuri (mii lei)
măsură
1996 1997 1996 1997
Lapte Litru 25 20 3 4
Brânză topită Buc. 8 12 5 7

Se cere:
1. să se facă analiza comparativă a indicilor de preţ calculaţi după relaţiile Laspeyres,
Paasche şi Fisher;
2. să se decompună pe factori de influenţă creşterea volumului valoric al vânzărilor de
produse lactate.

9.3. Cheltuielile de consum ale unei familii prezintă următoarele valori:


Grupa de Cheltuieli lunare (mii lei) Indicele
produse individual de
preţ
Per.bază Per.crt.
Alimentare 350 400 330
Nealimentare 100 170 250
Servicii 80 160 300

Se cere:
1. să se calculeze indicele de grup al preţului ca medie artimetică ponderată;
2. să se calculeze indicele de grup al preţului ca medie armonică ponderată.
Statistică teoretică şi economică

CAPITOLUL 7.
SERII CRONOLOGICE
Cuvinte cheie:
- ajustarea seriilor cronologice
- ciclicitatea
- indicii de dinamică cu bază fixă
- indicii de dinamică cu bază în lanţ
- modificarea absolută cu bază fixă
- modificarea absolută cu bază în lanţ
- ritm cu bază fixă
- ritm cu bază în lanţ
- serie cronologică
- sezonalitatea
- trend
- valoarea absolută a unui procent de creşterecu bază fixă
- valoarea absolută a unui procent de creşterecu bază în lanţ
- variaţia reziduală

Orice proces sau fenomen al activităţii umane poate fi studiat atât în timp, cât şi în
spaţiu. Analiza presupune, în principal, o cercetare în timp cu ajutorul unor indicatori
statistici specifici de-a lungul diferitelor perioade de timp. De exemplu, putem înregistra
volumul vânzărilor zilnice dintr-un magazin electrocasnic, evoluţia lunară a producţiei de
cărbune, evoluţia zilnică a ratei dobânzii sau a ratei de schimb.
este formată din două şiruri de date paralele, un şir arătând variaţia caracteristicii
de timp, iar cel de-al doilea – variaţia fenomenului sau a caracteristicii de la o perioadă la
alta. Seriile cronologice se mai numesc şi serii de timp sau serii dinamice. Deci, se poate
spune că seriile cronologice apar ca rezultat al unor măsurători ce se efectuează la
anumite momente sau intervale de timp, care pot fi egale sau neegale, asupra unei
colectivităţi în ansamblul său sau a unei părţi dintr-o colectivitate.
La construirea şi la analiza seriilor cronologice trebuie avute în vedere
proprietăţile acestora:
- variabilitatea termenilor;
- omogenizarea termenilor;
- periodicitatea termenilor;
- interdependenţa termenilor.
Să încercăm să explicăm fiecare dintre aceste proprităţi:
Variabilitatea termenilor unei serii cronologice rezultă din faptul că fiecare
termen este obţinut prin centralizarea unor date individuale. Acest lucru face să existe
anumite diferenţieri între termenii seriei, fie ca urmare a acţiunii factorilor aleatori, fie ca
urmare a faptului că în viaţa economică-socială legile se manifestă ca tendinţă generală,
imprimând fenomenelor şi proceselor diferite forme de variaţie.
Omogenitatea termenilor este înţeleasă în sensul că o anumită în sensul că o
anumită serie nu cuprinde decât fenomene şi procese de acelaşi gen, care sunt efecte ale
aceluiaşi tip de cauze. Pentru a asigura omogenitatea termenilor trebuie utilizată aceeaşi
Statistică teoretică şi economică

metodologie de evaluare şi calcul al indicatorilor, precum şi aceleaşi criterii de clasificare


privind mărimea intervalului de timp şi a unităţii statistice etc. Cu alte cuvinte,
prelucrarea unei serii cronologice trebuie să se facă după ce s-a verificat dacă datele
provin din aceeaşi sursă, dacă au aceleaşi grad de cuprindere a unităţilor, aceleaşi şi
metode de prelucrare: deci, trebuie asigurată comparabilitatea datelor.
Periodicitatea termenilor înseamnă asigurarea continuităţii datelor din punctul de
vedere al timpului. Variabila timp poate cunoaşte periodicităţii diferite. În baza acestei
priorităţi putem descrie evoluţia unui fenomen sau proces economic ori social sub forma
ecuaţiei: Yi = f(ti).
Interdependenţa termenilor unei serii cronologice este reultatul respectării
principiului unităţii de timp, spaţiu şi a structurii organizatorice. Având în vedere relaţiile
de cauzalitate, fiecare indicator depinde într-o anumită măsură de valoarea indicatorului
precedent.
În evoluţia fenomenelor şi proceselor economico-sociale se pot întâlni mai multe
tipuri de serii cronologice.
1) după modul de exprimare a indicatorilor, seriile cronologice pot fi:
1.1. serii cronologice formate din indicatori absoluţi, care reprezintă forma de
bază a seriilor de timp;
1.2. serii cronologice din indicatori relativi,care reprezintă un mod de prezentare
procentuală a datelor (în acest caz trebuie să se precizeze baza de raportare);
1.3. serii cronologice formate din indicatori medii, care reprezintă evoluţia unor
caracteristici calitative, de exmplu: salariul mediu, productivitatea muncii etc;
2) după timpul la care se referă datele, seriile cronologice pot fi:
2.1. serii cronologice de intervale de timp:sunt seriile în care fiecare indicator
reprezintă rezultatul unui proces sau fenomen la fiecare perioadă de timp. De exemplu:
evoluţia cifrei de afaceri, a profitului etc. Aceste serii se mai numesc şi serii de fluxuri;
2.2. serii cronologice de momente: sunt seriile în care fiecare indicator
caracterizează mărimea la care a ajuns caracteristica studiată la momentul calculului. De
exemplu: populaţia la 1 iulie, valoarea capitalului fix la sfârşitul anului etc. Aceste serii
se mai numesc şi serii de stocuri.

7.1.Componentele unei serii cronologice


Componentele unei serii cronologice sunt generate de factorii care interacţionează
cu cariabila rezultativă (Y) analizată, rezultând:
- trendul sau tendinţa generală (T), care poat fi:
- seculară;
- de durată medie (10-20 ani);
- de scurtă durată (3-10ani).
- sezonalitatea (S);
- ciclicitatea (C);
- variaţia reziduală (R).
Prin trend sau tendinţă generală se înţelege mişcarea relativ regulată a unui
fenomen sau proces în decursul unei perioade reprezentând o creştere sau o descreştere.
Sezonalitatea reprezintă existenţa unor oscilaţii (fluctuaţii) în funcţie de
anotimpuri, luni sau zile, în desfăşurarea unui fenomen sau proces pe o anumită durată.
Statistică teoretică şi economică

Ciclicitatea se manifestă mai ales în cazul fenomenelor şi proceselor economice


în cadrul economiei de piaţă şi se identifică, de cele mai multe ori, cu ciclul economic.
Atât sezonalitatea, cât şi ciclicitatea nu sunt întotdeauna prezente într-o serie
cronologică.
Variaţia reziduală poate fi de natură aleatoare, gaussiană sau accidentală şi
reprezintă fluctuaţii în funcţie de factorii aleatori. Variaţaia reziduală se mai numeşte şi
componenţa neregulată. Ea reprezintă cariaţia unei serii de timp care nu poate fi explicată
prin trend, ciclicitatea sau sezonalitate. Deoarece componenta reziduală este aleatoare,
efectele ei într-o serie de timp sunt foarte greu de prognozat.
În legătură cu componentele unei serii cronologice, există două modele statistice
de bază pentru o variabilă de timp:
a) modelul aditiv, adică repartizarea cantitativă a raportului dintre valorile seriei
cronologice şi componentele sale, presupunând o relaţie de independenţă a factorilor:

Y = T + S + C + R;
b) modelul multiplicativ, adică reprezentarea cantitativă a raportului dintr valorile
seriei cronologice şi componentele sale, presupunând o relaţie de proporţionalitate a
factorilor:
Y = T ⋅ S ⋅ C ⋅ R.

7. 2. Indicatorii statistici pentru prelucrarea seriilor cronologice.


Sistemul de indictori utilizaţi în prelucrarea seriilor cronologice este următorul:
a) indicatori absoluţi:
- nivelul absolut;
- modificările absolute (sporuri sau scăderi);
b) indicatori relativi:
- indici;
- ritmuri;
- valoara absolută a unui procent de creştere;
c) indicatorii medii;
- nivelul mediu;
- modificarea medie absolută;
- indicele mediu;
- ritmul mediu.
Indicatorii absoluţi se exprimă în unităţile de măsură concretă ale fenomenului
studiat.
Fiecare termen al seriei reprezintă un indicator de nivel şi însumând aceşti
indicatori putem obţine nivelul totalizat al termenilor.
Calculul indicatorilor absoluţi se rezumă la determinarea modificărilor absolute,
interpretate ca scopuri (scăderi) de la o unitate la alta.
Modificarea absolută poate fi calculată în două feluri:
- modificarea absolută cu bază fixă,care se obţine făcând diferenţa dintre
nivelul fiecărei perioade şi nivelul din perioada de referinţă:

∆ t / 1 = y t − y1 .
Statistică teoretică şi economică

- modificarea absolută cu bază în lanţ (glisantă, alunecătoare, mobilă), care se


obţine făcând diferenţa dintre nivelul fiecărei perioade şi nivelul perioadei imediat
următoare:

∆t / t −1 = yt − y t −1 .

Între aceste două tipuri de modificări există următoarea relaţie:

∑∆ t / t −1 = ∆t / 1

Indicatorii relativi sunt utilizaţi pentru a arăta de câte ori nivelul dintr-o anumită
perioadă se modifică faţă de nivelul atins de perioada de bază, sau pentru a determina
acelaşi lucru în procente.
Indicii de dinamică arată de câte ori s-a modificat un proces sau un fenomen de-a
lungul timpului.
Indicii se pot calcula:
- cu bază fixă, determinaţi după relaţia:

yt
I t /1 = ⋅ 100 ;
y1

- cu bază în lanţ, determinaţi după relaţia:

yt
I t / t −1 = ⋅ 100 .
y t −1

La fel ca şi în cazul modificărilor absolute, indicii cu bază fixă şi cei cu bază


mobilă comportă o relaţie între ei. De această dată, relaţia este de tip multiplicativ:

∏I t / t −1 = I t /1

Ritmul de creştere (descreştere) exprimă cu câte procente nivelul atins în


perioada curentă depăşeşte nivelul atins în perioada considerată de comparaţie. Ritmul se
poate calcula:
- cu bază fixă, determinat după relaţia:

y  y − y1 ∆
Rt / 1 = ( I t / 1 − 1) ⋅ 100 =  t − 1 ⋅ 100 = t ⋅ 100 = t / 1 ⋅ 100 ;
 y1  y1 y1

- cu bază în lanţ, determinat după relaţia:

 y  y − y t −1 ∆
Rt / t −1 = (I t / t −1 − 1) ⋅ 100 =  t − 1 ⋅ 100 = t ⋅ 100 = t / t −1 ⋅ 100
 y t −1  y t −1 y t −1
Statistică teoretică şi economică

Trecerea de ritmuri cu bază în lanţ la ritmuri cu bază fixă sau invers se face numai
prin transformarea acestora în indici de dinamică, fapt ce ne conduce la concluzia că în
cazul ritmurilor există inegalitatea:

∏R t / t −1 ≠ Rn / 1

Valoarea absolută a unui procent de creştere exprimă câte unităţi din sporul
înregistrat într-o perioadă revin la fiecare procent al ritmului. Acest indicator face
legătura între indicatorii absoluţi şi cei relativi.
Valoarea absolutã a unui procent se poate calcula:
- cu bază fixă,determinată pe baza relaţiei:
∆ y t − y1 y
At / 1 = t%/ 1 = = 1
R t / 1 y t − y1 100
⋅ 100
y1

- cu bază mobilă, determinată pe baza relaţiei:


-
∆ t / t −1 y t − y t −1 y
At / t −1 = = = t −1
Rt%/ t −1 y t − y t −1 100
⋅ 100
y t −1

Analizele efectuate în domeniul economic şi social se pot realiza şi prin calculul


mediilor de nivel şi al mediilor de ritm.
Astfel, nivelul mediu al unei caracteristici se determină după relaţia:

y=
∑y t

Modificarea medie absolută se determină din modificătile absolute cu bază în


lanţ:

∆=
∑∆ t / t −1
=
y t − y1
n −1 n −1

unde n-1 reprezintă numărul modificărilor absolute cu baza în lanţ.


Indicele mediu de dinamică reprezintă valoarea care, dacă ar substitui indicii de
bază în lanţ, procesul acestora nu s-ar modifica. De menţionat faptul că acest indice
mediu se determină atunci când indicii cu bază în lanţ au valori aproximativ egale.

yn
I = n −1 ∏ I t / t −1 = n −1
y1
Statistică teoretică şi economică

Ritmul mediu arată creşterea procentuală a fenomenului sau precesului studiat în


medie de la o perioadă la alta:

R = (I ⋅ 100) − 100

7. 3. Particularităţile prelucrării seriilor cronologice de momente.


Într-o serie de momente pot fi întâlnite două situaţii: serii de momente cu
intervale egale şi serii de momente cu intervale neegale între ele.
În primul caz, prelucrarea seriei se poate face într-una din următoarele variante:
1. Se transformă seria de momente în serie de intervale, calculându-se media
aritmetică pentru fiecare interval şi apoi indicatorii absoluţi, relativi şi medii.
2. Seriile de momente cu intervale egale între înregistraţi se prelucrează ca atare,
obţinându-se indicatorii absoluţi, relativi şi medii, cu excepţia mediei calculate după o
formulă specială de medie aritmetică, cunoscută sub denumirea de medie cronologică.
Media cronologică simplă se aplică pentru seriile de momente cu intervale egale.
Într-o serie de momente sunt n termeni şi (n-1) intervale, ceea ce înseamnă că fiecare
interval va fi marcat de câte doi termeni. Din această cauză, termenii externi apar o
singură dată, iar toţi ceilalţi de câte două ori.
Pentru a afla media pe total este necesar să se calculeze mediile parţiale pe
fiecare interval, la rândul lor, ca medii aritmetice simple din cei doi termeni ce marchează
intervalul respectiv.
Relaţia de calcul este următoarea:

y1 + y 2 y 2 + y 3 y + yn
+ ... + n −1
y cr = 2 2 2
n −1

Sunt (n-1) termeni la numitor, deoarece, faţă de numărul termenilor seriei, se pot
calcula (n-1) medii parţiale, pe fiecare interval.
După efectuarea calculelor obţinem:

y1 y
+ y 2 + y 3...+ y n −1 + n
y cr = 2 2
n −1

Această formulă, aplicându-se numai la seriile cronologice de momente, se


numeşte media cronologică şi are structura identică cu media generală calculată din
medii parţiale:
Media cronologică ponderată este utilizară în cazul în care între momentele
seriei sunt intervale neegale. Între termeni existând intervale inegale, se consideră că
modificarea lor se va realiza uniform de la un interval la altul. Deci, fiecare interval va fi
proporţionat cu câte o jumătate din lungimea intervalelor alăturate.
Intervalele de timp vor fi:
Statistică teoretică şi economică

t1 t1 + t 2 t 2 + t 3 t n −1
; ; ...
2 2 2 2

Media cronologică ponderată se determină după relaţia:

t  t t  t 
y1  1  + y 2  1 + 2  + ... y n  n −1 
2 2 2  2 
y cr =
 t 1   t1 t 2  t 
  +  +  + ... n −1 
2 2 2  2 
sau:
t  t +t  t 
y1  1  + y 2  1 2  + ... y n  n −1 
2  2   2 
y cr = n −1

∑t
i =1
i

Primul şi ultimul termen se ponderează cu jumătatea din primul interval, iar


termenii intermediari cu câte o jumătate din intervalele alăturate.

7. 4. Ajustarea seriilor cronologice.


Aplicarea unor metode statistico-matematice adecvate asupra unei serii timp în
dorinţa de a extrage ceea ce este esenţial şi tipic în evoluţia fenomenului sau procesului
analizat şi care prezintă caracter de lege se numeşte ajustarea seriei cronologice.
În teoria şi practica statistică sunt utilizate următoarele metode de ajustare:
a) Ajustarea grafică a seriei cronologice. Acest procedeu presupune trasarea
liberă şi aproximativă a unei drepte dau curbe asupra unei serii cronologice
empirice. O asemenea ajustare are un caracter orientativ şi oferă informaţii
asupra tendinţei generale a evoluţiei fenomenului sau procesului supus
cercetării. Însă, ajustarea grafică este subiectivă şi poate duce la determinări
diferite
b) Ajustarea mecanică a seriei cronologice. Acest procedeu constă în aplicarea
succesivă, în mod mecanic, a unor formule de calcul stabilite dinainte, pentru
toţi termenii reali.
Dintre aceste metode, amintim: metoda mediilor mobile; metoda sporului mediu;
metoda indicelui mediu.
Ajustarea pe baza mediilor mobile se foloseşte, în special, când variaţia
termenilor unei serii cronologice prezintă un aspect de regularitate ciclică. Prin
calcularea mediilor mobile se înlătură se înlătură această variaţie şi se prezintă seria de
date cu o variaţie lină, continuă.
Mediile mobile sunt medii parţiale, calculate dintr-un număr prestabilit de
termeni, în care se înlocuieşte pe rând primul termen cu termenul ce urmează în seria care
trebuie să fie austată. Mediile mobile se mai numesc şi medii glisante sau alunecătoare. În
practică, putem calcula medii mobile dintr-un număr impar sau par de termeni.
Spre exemplificare, vom folosi o serie formată din 5 termeni care urmează să fie
ajustaţi prin procedeul mediilor mobile calculate din trei termeni.
Statistică teoretică şi economică

Seria cronologică este:

y1, y2, y3, y4, y5,

y1 + y 2 + y 3
y1 = ;
3
y + y3 + y 4
y2 = 2
3
y3 + y 4 + y5
y3 =
3
În cazul calcului dintr-un număr impar de termeni, fiecare medie mobilă se va
plasa în dreptul unui termen ce corespunde cu poziţia termenului central, numărul
acestora fiind egal cu: n-(n'+1)
unde: n reprezintă numărul termenilor seriei ce urmează a fi ajustată;
n' numărul termenilor din care se calculează media.
În cazul când ajustarea se face pe baza mediilor mobile calculate dintr-un număr
par de termeni, mediile mobile se obţin în două trepte: în primul rând, se determină
mediile provizorii, care se plasează între termenii seriei, şi în al doilea rând, se determină
mediile mobile definitive sau centrate, care se plasează, în dreptul termenilor seriei şi cu
care se face ajustarea termenilor seriei iniţiale.
Considerând o serie in 8 termeni, se pot calcula 5 medii provizorii:

y + y 2 + y3 + y4
Yˆ1 = 1 ;
4
y + y3 + y 4 + y5
Yˆ2 = 2 ;
4
y + y4 + y6
Yˆ3 = 3 ;
4
y + y5 + y6 + y7
Yˆ4 = 4 ;
4
y + y5 + y6 + y7
Yˆ4 = 4 4 ;
4
y + y 6 + y 7 + y8
Yˆ5 = 5 .
4

Pe baza acestora, se pot calcula medii mobile definite ca o medie aritmetică


simplă a celor provizorii luate câte două:

Yˆ1 + Yˆ2 Yˆ2 + Yˆ3 Yˆ + Yˆ4 Yˆ4 + Yˆ5


Y1 = ; Y2 = ; Yˆ3 = 3 ; Y4 =
2 2 2 2

Ajustarea prin metoda sporului mediu se foloses atunci când, prelucrând seria de
date, se obţin sporuri cu bază în lanţ relativ asemănătoare ca valoare unele cu altele.
Statistică teoretică şi economică

Aceasta corespunde unei creşteri a nivelurilor cracteristicii studiate sub forma unei
progresii aritmetice cu raţia egală cu modificarea mediei absolute şi se bazează pe relaţia
care există între primul termen, modificările absolute cu bază în lanţ şi ultimul termen.
Astfel, putem considera că ultimul termen se determină după relaţia:

y n = y 0 + ∆ + ∆ + ∆....∆ ,
adică:
y n = y 0 + n∆

Relaţia care stă la baza ajustării prin procedeul modificării medii absolute va fi:
Yti = y1 + t i ∆ ,

unde: y1 – reprezintă termenul luat ca bază de ajustare;


ti – variabila de timp în raport cu baza de ajustare folosită (poziţie pe care termenul
respectiv o are faţă de termenul ales ca bază).
Ajustarea prin metoda indicelui mediu se foloseşte atunci când termenii seriei au
tendinţa unei progresii geometrice, în care raţia poate fi considerată egală cu indicele de
dinamică.
Ajustarea se bazează pe relaţia dintre primul termen, indicii de dinamică cu bază
în lanţ şi ultimul termen. Deci, dacă ultimul termen se scrie în funcţie de primul, acesta
va fi egal cu primul termen multiplicat succesiv cu indicii cu bază în lanţ.
Se poate considera că ultimul termen are următoarea formă:

y n = y 0 ⋅ I ⋅ I ⋅ ...I ,
adică:
yˆ n = y1 ⋅ I n

Pe baza acestei relaţii se pot determina valorile ajustate. Astfel, un termen


oarecare ajustat egal cu termenul ales ca bază, înmulţit cu indicele mediu de dinamică
ridicat la o putere egală cu numărul ce arată poziţia lui faţă de termenul ales ca bază.

Yˆti = y1 ⋅ (I ) i
t

Aplicarea metodei grafice şi a metodei mecanice se face cu anumite restricţii,


motiv pentru care analiza trebuie completată cu utilizarea metodelor analitice bazate pe
folosirea funcţiilor matematice de ajustare.
c) Ajustarea prin metode analitice. Tendinţa centrală a evoluţiei se exprimă ca o
funcţie de timp:
y = f(t), numită funcţie de ajustare;
t = valorile variabilei independente (timpul);
y = valorile variabilei dependente (fenomenele), care sunt prezentate în seria
cronologică.
Alegerea tipului de funcţie care se potriveşte cel mai bine pentru exprimarea
trendului se face pe baza următoarelor criterii aplicabile opţional:
Statistică teoretică şi economică

a) Criteriul bazat pe reprezentarea grafică. Se construieşte cronograma. Dacă graficul


prezintă o tendinţă de creştere absolută constantă, se poate aprecia că fenomenul creşte
liniar şi ecuaţia respectivă este:

Yt = a + b ⋅ t ,

în care:
Yt – sunt valorile ajustate calculate în funcţie de valorile caracteristicii factoriale
(t);
a – reprezintă parametrul care are sens de mărime medie şi arată nivelul atins de
"y", dacă influenţa tuturor factorilor – cu excepţia celui înregistrat – ar fi fost constantă
pe toată perioada. Din punctul de vedere al interpretării parametrului, acesta nu are o
semnificaţie economică;
b – reprezintă parametrul care sintetizează numai influenţa caracteristicii
factoriale (t) şi arată cu cât se modifică rezultanta la modificarea cu o unitate a factorului
de influenţă. Dacă b > 0, rezultă o relaţie directă (pozitivă); în cazul b < 0, rezultă o
relaţie inversă (negativă) între cele două fenomene;
t – reprezintă valorile caracteristicii factoriale care, în cazul seriilor cronologice,
este timpul.
Dacă graficul are o tendinţă de creştere exponenţială, atunci se poate aprecia că
fenomenul are forma unei funcţii exponenţiale a cărei ecuaţie de estimare este:

Yt = a ⋅ b t

Când pe grafic se obţine o curbă care are fie un punct de maxim, fie un punct de
minim, atunci se apreciază că fenomenul studiat se modifică în timp sub forma unei
parabole de gradul doi.
Ecuaţia de estimare a unei parabole de gradul doi exprimată în funcţie de timp
este:

Y1 = a + b ⋅ t + c ⋅ t 2

b) Criteriul diferenţelor. Corespunzător acestui criteriu, se procedează la calculul


diferenţelor absolute cu bază în lanţ de ordinul unu din termenii seriei, după relaţia:

∆(tt /) t −1 = y t − y t −1

de ordinul doi, după relaţia:

∆(t2/)t −1 = ∆(t1) − ∆(tt−)1 ş.a.m.d.

Se continuă cu calculul diferenţelor de ordin 3, 4 etc. până obţinem diferenţele de


ordin i, aproximativ egale.
Interpretarea acestor diferenţe se face astfel:
- dacă diferenţele absolute cu bază în lanţ de ordinul întâi sunt constante:
Statistică teoretică şi economică

se apreciază că seria cronologică respectivă are o tendinţă liniară;


- dacă diferenţele absolute cu bază în lanţ de ordinul doi calculate din diferenţele
de ordinul întâi sunt constante:

∆(t2/)t −1 = k 2 ,

se apreciază că seria cronologică are o tendinţă de forma parabolei de gradul doi k1 şi k2


sunt constante).
Dacă fenomenul cercetat s-a dezvoltat în progresie geometrică, adică indicii cu
bază în lanţ sunt constanţi (It/t+1 = constant), admitem că seria cronologică respectivă
prezintă o tendinţă exponenţială.
După alegerea funcţiei de ajustare se impune estimarea parametrilor funcţiei,
utilizând metoda celor mai mici pătrate. Această metodă are ca funcţie obiectiv
minimizarea sumei pătratelor valorilor reale de la cele ajustate, deci:

min ∑ ( y t − y t )
2
t = 1, 2, …,n.

Pentru funcţia liniară, această condiţie devine:


∑ [ y t − (a + bt )] = min
2

Pentru determinarea parametrilor "a" şi "b", scriem sistemul de ecuaţii normale;


înlocuind pe xi cu ti obţinem:

na + b∑ t i = ∑ y i

a ∑ t i + b∑ t i = ∑ t i y1
2

Orice fenomen social-economic depinde de o serie de factori a căror influenţă este


prezentată în timp, deci timpul serveşte doar la sistematizarea materialului statistic şi,
prin urmare, este necesară anihilarea influenţei; în consecinţă, se pune condiţia: Σti = 0.
În aceste condiţii, sistemul de ecuaţii devine:
na = ∑ y i

b∑ t i = ∑ t i ⋅ y i
2

de unde rezultă:

a=
∑ yi ; b = ∑ ti ⋅ yi
n ∑ t i2
Se observă că valoarea lui "a" este egală cu media seriei:

a=
∑y i
=y
n
Statistică teoretică şi economică

Pentru a satisface condiţia de mai sus, trebuie să se considere originea valorilor de


timp ca fiind în centrul seriei.
În cazul în care seria este formată dintr-un număr impar de termeni, originea
valorilor de timp va fi chiar în dreptul termenului central şi variaţia de timp se va măsura
în intervale întregi pozitive şi negative: 0; 1; 2; 3 etc.
În cazul în care seria este formată dintr-un număr par de termeni, se poate adopta
una dintre variantele de jos:

Seria t1 t2 t3 t4 t5 t6
var. I -5 -3 -1 1 3 5
var. II -2,5 -1,5 -0,5 0,5 1,5 2,5

Pentru ecuaţia de gradul doi, avem sistemul următor:

na + c ∑ t i2 = ∑ y1

b∑ t i = ∑ t i y i
2


a ∑ t i + c∑ t i = ∑ t i ⋅ y i
2 4 2

Din sistemul de mai sus se determină parametrii a, b şi c. Dacă b > 0, atunci are
loc o creştere accelerată de-a lungul perioadei, iar în cazul când c < 0, creşterea se
încetineşte.
Verificarea calculării ecuaţiilor de regresie se face pe baza relaţiei:

∑Y yi = ∑ yi

Această modalitate de verificare se bazează pe faptul că prin ajustare s-au


redistribuit influenţele factorilor, astfel, toţi factorii au fost consideraţi cu influenţă
constantă pe toată perioada şi variabil a fost numai timpul.
În teoria şi practica statistică sunt mai multe criterii de alegere privind cel mai
adecvat procedeu de ajustare a fenomenului real.
Astfel, există:
- un prim procedeu, prin care se determină suma abaterilor luate în valoare
absolută dintre datele empirice şi cele ajustate. Preocedeul pentru care această sumă este
minimă acela este cel mai bun.

∑y t − Yt = min ;

- un al doilea procedeu, prin calculul coeficientului de variaţie ca raport dintre


abaterea medie liniară a valorilor reale de la valorile ajustate şi nivelul mediu al
termenilor seriei empirice:

d y (t )
v y (t ) = ⋅ 100
y
Statistică teoretică şi economică

Abaterea medie liniară se calculează după relaţia de mai jos:

d y (t ) =
∑y t − yt
n
Alegerea se face după valoarea coeficientului de variaţie. Valoarea cea mai mică
arată metoda de ajustare cea mai bună.
Pentru aprecierea calităţii sau capacităţii de exprimare a funcţiei de ajustare
analitică, se utilizează următorii doi indicatori:
- abarerea standard sau eroarea standard a valorilor teoretice faţă de valorile
reale:

S yt / Yt =
∑ (y t − Yt )
2

- coeficientul de eroare:

S yt / Yt
e= ⋅ 100
y

Cu cât aceşti indicatori au valori mai mici, cu atât mai bună este funcţia de
ajustare aleasă.

7. 5. Calculul sezonalităţii.
Determinarea cantitativă sau statistică a sezonalităţii este necesară în procesul
decizional atât la nivel microeconomic, cât şi la nivel macroeconomic. În practica
internaţională se utilizează coeficientul de sezonalitate, stabilit ca raport între trimestrul
sau luna calendaristică cu activitatea maximă şi trimestrul sau respectiva lună
calendaristică cu activitatea minimă.
Pentru caracterizarea sezonalităţii se utilizează indici de sezonalitate, stabiliţi în
felul următor, pe o serie de date lunare sau trimestriale, complete, pentru o perioadă de 3-
5 ani consecutivi, se calculează pentru fiecare lună sau trimestru câte o medie yi. De
asemenea, se stabileşte o medie generală lunară sau trimestrială y0 pentru întreaga
perioadă. Comparând fiecare medie lunară sau trimestrială cu media generală, rezultă un
indice de sezonalitate; acest indice exprimă cât la sută reprezintă media lunii sau
trimestrului faţă de media generală:

yi =
∑y ij
y0 =
∑⋅ ∑ y ij
IS % =
yi
⋅ 100
n n⋅m y0

unde:
n este numărul anilor;
m - numărul subperioadelor.
Această metodă de determinare prin medii aritmetice a indicelui de sezonalitate
este acceptată în cazul seriilor cronologice care nu sunt foarte dinamice.
Statistică teoretică şi economică

Probleme si aplicatii:
7.1.Comerţul exterior al României a evoluat în perioada 1991-1996 conform cu
datele de mai jos:

Anii 1991 1992 1993 1994 1995 1996


Export (mil.$) 4266 4363 4892 6151 7910 8084
Import (mil.$) 5372 5784 6020 6562 9487 10555
Sursa: Anuarul de comerţ exterior al României, C.N.S., pag.9.

Se cere:
1. să se analizeze evoluţia exportului României în perioada 1991-1996 cu ajutorul
indicatorilor absoluţi, relativi şi medii;
2. să se reprezinte grafic evoluţia importului României în perioada analizată;
3. să se ajusteze seria de date referitoare la comerţul exterior al României
(export+import) în perioada analizată prin metode simple (elementare sau mecanice).

7.2. Evoluţia numărului populaţiei din mediul urban în perioada 1989-1995 a fost:

Anii 1989 1990 1991 1992 1993 1994 1995


Populaţia 12345 12609 12552 12367 12406 12428 12457
urbană
(mii loc.)
Sursa: Anuarul demografic al României, C.N.S., pag.4.

Se cere:
1 să se ajusteze seria de date utilizând metode elementare şi analitice de ajustare;
2. să se arate care din metodele folosite este cea mai potrivită;
3. să se efectueze extrapolarea seriei pentru următorii doi ani folosind metoda rezultată de
la punctul anterior.

7.3. În tabelul de mai jos sunt prezentate modificările absolute cu bază mobilă ale
dinamicii populaţiei ocupate în perioada 1991-1995 în România:

Anii 1991 1992 1993 1994 1995


Modificarea -54 -328 -396 -51 -518
absolută
Sursa: Statistica socială, C.N.S., pag.45.

Se cere:
1. să se reconstituie seria cunoscând că nivelul atins de populaţia ocupată în 1990 a fost
de 10840 mii persoane;
2. să se ajusteze seria de date cu ajutorul ecuaţiei liniare de ajustare.
Statistică teoretică şi economică

7.4. În învăţământul superior au apărut modificări de natură calitativă şi


cantitativă; dintre acestea numărul de studenţi înscrişi este prezentat în tabelul
următor:

Perioada 1991/1992 1992/1993 1993/1994 1994/1995 1995/1996


Ritmul cu 100 109,5 116,2 118,5 156,2
bază fixă
(%)
Sursa: Statistica socială, C.N.S.,1996, pag.155.

Se cere:
1. să se reconstituie seria cunoscând numărul de studenţi înscrişi în 1991/1992;
2. să reprezinte grafic seria cronologică reconstituită;
3. să se ajusteze seria cronologică prin metoda mediilor mobile şi să se determine
calitatea acestei metode de ajustare comparativ cu metoda indicelui mediu.

7.5. Se consideră următoarea serie cronologică reprezentând numărul mediu al


pensionarilor în perioada 1990-1995, în mii persoane:
2570; 3018; 3201; 3253; 3439; 3600.
Sursa: Statistica socială, C.N.S., pag.113.

Se cere:
1. să se determine indicatorii medii care caracterizează seria coronologică prezentată;
2. să se extrapoleze seria pentru anul 1996 utilizând cea mai bună metodă de ajustare.

7.6. Numărul de născuţi-vii după luna naşterii în perioada 1991-1995 este prezentat
în tabelul următor:

Luna 1991 1992 1993 1994 1995


Calendaristică
Ianuarie 22255 22868 19773 20316 19369
Februarie 20947 21877 18955 19181 18317
Martie 23613 23317 21298 21386 20077
Aprilie 23397 21613 21232 21780 19427
Mai 24845 22865 21515 22927 20388
Iunie 24785 23502 21064 22125 20097
Iulie 25082 23925 23400 22732 21437
August 23407 22940 22551 20911 20812
Septembrie 23056 20997 21229 20165 20161
Octombrie 22055 19894 20638 18729 19712
Noiembrie 20880 18315 18950 17651 18627
Decembrie 20953 18280 19389 18833 18216
Sursa: Anuarul demografic al României, C.N.S., 1996,pag.134.

Se cere:
1. să se caracterizeze şi să se măsoare sezonalitatea folosind metoda mediilor mobile;
2. să se măsoare sezonalitatea folosind cea mai bună metodă analitică;
3. să se determine şi interpreteze componenta reziduală.
TEMA 8. ANALIZA STATISTICĂ A LEGĂTURILOR DINTRE VARIABILELE ECONOMICE
1. Conceptul de legătură statistică
2. Tipuri de legături între variabilele economice
3. Metode elementare de caracterizare a legăturilor dintre variabile
4. Metoda regresiei
5. Indicatorii sintetici ai corelaţiei

1. Conceptul de legătură statistică


Asupra fenomenelor social-economice acţionează un număr de factori principali şi
secundari, esenţiali şi neesenţiali, care se găsesc în legătură reciprocă. Statistica, cu ajutorul unei
game variate de procedee şi metode, poate studia manifestarea concretă a acestor legături, le
poate exprima cantitativ şi măsura intensitatea cu care se produc.
Astfel, varietatea relaţiilor de interdependnţă întîlnite în cadrul fenomenelor economice
necesită identificarea, selectarea şi ierarhizarea factorilor de influenţă. Dar întîlnim şi alţi factori
care nu pot fi identifcaţi direct sau nu pot fi cuantificaţi decît cu ajutorul unor convenţionalităţi
statistice. Practic, identificarea legăturii dintre fenomene, identificarea factorilor de influenţă şi
stabilirea gradului lor de esenţialitate se poate realiza numai în urma unei analize calitative
multilaterale.
Legăturile dintre fenomenele şi procesele economice diferă de legăturile care se stabilesc
între fenomenele din domeniul ştiinţelor tehnice şi ale naturii. Pentru acest domeniu legăturile
sunt predominant cauzale, în sensul că unul din fenomene determină în mod univoc (ce are un
singur sens)schimbarea celuilalt. În acest caz este vorba de o legătură funcţională.
În carul legăturilor funcţionale, unei valori din şirul caracteristicii-cauză îi corespunde o
singură valoare din şirul caracteristicii-efect, iar modificării cantitative a primei caracteristici îi
corespunde o modificare cantitativă, de aceeaşi măsură, a celei de a doua.
Astfel de legături se pot modela printr-o funcţie matamatică de forma:
yi = f(x1, x2, ... , xp), în care x1, x2, ... , xp sunt factori care acţoinează împreună asupra
variabilei rezultative şi între care există şi o componentă aleatoare.
Legăturile dintre fenomenele şi procesele economice apar ca legături statistice (stohastice).
Particularitatea acestui tip de legătură constă în fapul că o caracteristică „x” – denumită
caracteristică factorială (independentă, exogenă sau cauză) – exercită o anumită influenţă asupra
unei alte caracteristici „y” – denumite caracteristică rezultativă (dependentă, endogenă sau efect).
În cadrul legăturilor statistice, unei valori a caracteristicii factoriale „x” îi corespunde o
distribuţie de valori a caracteristicii rezultative „y”, datorită faptului că asupra caracteristicii
dependente exercită influenţă şi alte caracteristici care, din punctul de vedere al legăturii dintre
„x” şi „y”, se consideră întîmplătoare. Valorile caracteristicii rezultative se modifică într-o măsură
mai mare sau mai mică, faţă de modificările valorilor caracteristicii factoriale, în funcţie de
condiţiile în care se manifestă relaţiile de cuazalitate.
Specific legăturilor din domeniul social-economic este faptul că legile care acţionează în
cadrul acestora au caracter de legi statistice, care nu pot fi verificate pentru fiecare caz în parte,
ci numai la nivelul întregului ansamblu.

2. Tipuri de legături între variabilele economice


Formele de manifestare ale relaţiilor de interdependenţă sunt extrem de variate şi adesea
destul de greu de sisizat. Pentru a le studia este necesar să fie clasificate în funcţie de unele
criterii, după care se pot deosebi unele de altele.
După numărul caracteristicilor care se iau în studiu:
- legături simple, cînd se consideră că există o singură caracteristică factorială
cu caracter esenţial care determină o caracteristică rezultativă, iar ceilalţi
factori sunt cu acţiune constantă interpretaţi ca factori reziduali ca, de
exemplu, legătura dintre suprafaţa comercială (x) şi valoarea desfacerilor (y);
- legături multiple, cînd se iau în studiu şi se interpretează mai mult de două
caracteristici factoriale.
După felul de exprimare a caracterisricilor:

1
- legături între variabilele statistice exprimate numeric (cantitativ) ca, de
exemplu, între valoarea încasărilor realizate la un hotel (y) şi numărul
locurilor de cazare ale acestuia (x);
- legături între variabilele statistice exprimate prin cuvinte ca, de exemplu,
legătura între studii şi ocupaţie.
Legăturile dintre caracteristicile numerice se mai numesc şi corelaţii statistice, iar cele între
caracteristici calitative – asocieri statistice..
După direcţia legăturilor:
- legături directe, cînd la creşterea (sau descreşterea) valorilor caracteristicii
factoriale corespunde creşterea (sau descreşterea) valorii caracteristicii
rezultative.
- legături inverse, cînd creşterii valorii unei caracteristici factoriale îi
corespunde descreşterea celeilalte caracteristici.
După expresia analitică a legăturilor deosebim:
- legături liniare, cînd se exprimă prin ecuaţia liniei drepte;
- legături neliniare sau curbilinii, cînd se exprimă prin ecuaţia unei curbe
(parabolă, hiperbolă, funcţie exponenţială etc.)
După timpul cînd se produce legătura pot fi:
- legături concomitente sau sincrone, la care, pe măsură ce se modifică
variabila funcţională, în acelaşi timp se modifică şi variabila rezultativă;
- legături asincrone sau cu decalaj, la care variaţia caracteristicii rezultative se
produc după scurgerea unei perioade de timp de la modificarea variabilei
factoriale.

3. Metode elementare de caracterizare a legăturilor dintre variabile

Metode elementare sau simple de cercetare a legăturilor statistice sunt:


- metoda seriilor paralele sau interdependente;
- metoda grupărilor;
- metoda tabelului de corelaţie;
- metoda grafică
Ele sunt metode folosite îndeosebi pentru sistematizarea informaţiilor, în vederea aplicării
unor metode adecvate de măsurare a corelaţiilor.
Metoda seriilor paralele sau interdependente constă în aşezarea a două serii în paralel,
în ordinea crescătoare sau descrescătoare a caracteristicii factoriale. Prin compararea seriilor de
valori astfel ordonate se poate stabili dacă există sau nu legătura între ele şi direcţia acesteia. Se
pot compara în acest mod serii de distribuţie cronologice sau teritoriale.
Seriile paralele se folosesc numai cînd avem un număr mic de unităţi observate. În cazul
unui număr mare de unităţi observate şi la care amplitudinea variaţiei este mare, pentru
sistematizarea datelor se recurge la metoda grupărilor.
Metoda grupărilor reprezintă un model de analiză capabil să surprindă aspectele esenţiale
ale legăturilor dintre variabilele economice şi sociale. Studiul legăturii se realizează după ce
unităţile colectivităţii se grupează în funcţie de caracteristica factorială, iar pentru caracteristica
rezultativă se calculează indicatorii derivaţi (mărimi relative sau medii) specifici fiecărei grupe.
Prin compararea variaţiei caracteristicii factoriale cu aceea a caracteristicii rezultative
(variaţie exprimată sub forma indicatorilor derivaţi, calculaţi pe grupe), se pot aproxima caracterul
legăturii, direcţia şi intensitatea ei. Pentru analiza legăturilor dintre fenomene, metoda grupării
trebuie să se aplice cu multă judecată astfel încît să se obţină grupe suficiente pentru a se
desprinde corect forma de interdependenţă dintre caracteristicile luate în studiu.
În cazul fenomenelor social-economice se recomandă ca , în general, să se folosească
grupe de intervale egale pentru fiecare dintre caracteristicile implicate în analiza de corelaţie.
Metoda tabelului de corelaţie constă în construirea unui tabel cu dublă intrare, ce
reprezintă o formă specială a unei grupări combinate, în care separarea pe grupe a unităţilor se
face după variaţia ambelor caracteristici – factorială şi rezultativă. Metoda se utilizează în cazul
unui număr mare de observaţii.

2
Valorile caracteristicii factoriale se trec în ordine crescătoare în capetele coloanelor, iar
valorile caracteristicii rezultative în ordine descrescătoare în capetele rîndurilor. În rubricile
formate la întretăierea acestora se înscriu frecvenţele cu care cele două caracteristici se
încadrează în intervalele respective. Se recomadă ca numărul grupelor formate după cele două
caracteristici să fie aproximativ egal, iar intervalele de grupare să fie egale.
În funcţie de modul de repartizare a frecvenţelor în tabelul de corelaţie se poate aprecia
direcţia legăturii şi intensitatea ei. În unele cazuri direcţia legăturii este dată de poziţia diagonalei
în jurul căreia se grupează frecvenţele; cînd diagonala leagă unghiul stîng de jos al tabelului cu
ungiul drept de sus legătura este directă, iar cînd uneşte ungiul stîng de sus cu ungiul drept de
jos se apreciază că între cele două caracteristici există legătură în sens invers. Modul de aşezare
a frecvenţelor în jurul diagonalei ne dă posibilitatea să apreciem intensitatea legăturii:
concentrarea intensă a frecvenţelor în jurul diagonalei indică existenţa unei legături strînse între
caracteristici. Dacă frecvenţele se repartizează pe întregul tabel fără nici o regularitate, atunci
sau nu există legătură, sau aceasta este foarte slabă.
Metoda grafică constă în construirea graficului de corelaţie – denumit şi corelogramă, ce
foloseşte sistemul axelor rectangulare, respectiv priml lor cadran. Procedura este următoarea:
valorile caracteristicii factoriale (x) sau intervalele acesteia se trec pe abscisă, iar pe ordonată,
valorile caracteristiciirezultative (y) sau intervalele respective. Fiecare unitate observată
purtătoare a celor două caracteristici corelate se reprezintă pe grafic printr-un punct. Se stabileşte
amplitudinea variaţiei caracteristicii factoriale şi, pe baza ei, scara de reprezentare pe abscisă.
Se recomandă ca şi pentru variabila rezultativă să se folosească pe cît posibil acelaţi număr de
diviziuni ale scării.
Reprezentarea grafică a legăturii în cîmpul de corelaţie are aspectul unui nor de puncte, de
aceea metoda grafică se mai numeşte „metoda norilor de puncte”. Metoda grafică este utilizată
cu bune rezultate pentru alegerea funcţiei analitice care se studiază (în cazul regresiei şi
corelaţiei).

4. Metoda regresiei
Pentru a înlătura neajunsurile utilizării metodelor elementare în studiul legăturilor dintre
fenomenele economice, statistica foloseşte o serie de metode analitice: metoda regresiei şi
metoda indicatorilor sintetic ai corelaţei.
Metoda regresiei constituie o metodă statistică de cercetare a legăturii dintre variabile cu
ajutorul unor funcţii, denumite funcţii de regresie. Notînd cu „y” variabila dependentă şi cu „x1, x2
...” variabilele independente, obţinem ecuaţia de regresie: y = f(x1, x2, ... , xn)
Datorită caracterului aleator al fenomenelor şi proceselor social-economice, modelul
teoretic se înlocuieşte cu modelul de dependenţă statistică:
Y = f(x1, x2, ... , xn) +, în care  reprezintă o eroare aleatoare (o variabilă reziduu), cu
dispersia constantă şi media nulă.
În funcţie de numărul factorilor (x1, x2, ... , xn) care influenţează caracteristică rezultativă (z),
deosebim:
- regresie unifactorială sau simplă, dacă funcţia include un factor;
- regresie multifactorială sau multiplă, dacă funcţa include mai mulţi factori
Regresia unifactorială descrie legătura dintre două variabile (y şi x), considerînd că ceilalţi
factori au o acţiune constantă asupra caracteristicii dependente y. Ecuaţia de regresie este: Y=
f(x)
Cele mai cunoscute modele de regresie unifactorială sunt:
a) Modelul liniar, cînd legătura dintre „y” şi „x” este liniară şi cînd aceste caracteristici
variază în progresie aritmetică:
yi =  + xi + 
Acest model teoretic se estimează printr-o ecuaţie medie de tendinţă care se poate scrie
astfel: Y = a + bxi +, în care „a” şi „b” sunt coeficienţii (parametrii) ce urmează să fie calculaţi,
iar Y se citeşte „y ajustat cu x”.
Parametrii „a” şi „b” se estimează cu ajutorul unor metode specifice oferite de statistică, ca
de exemplu: metoda verosimilităţii maxime, metoda celor mai mici pătrate etc. În practică,
frecvent, se foloseşte MMMP, care presupune ca suma pătratelor abaterilor dintre valorile
empirice (reale) „y” şi valorile teoretice (ajustate) „Y” să fie minimă, adică: (yi - Y)2 = minim

3
Înlocuin pe Y cu valoare sa obţinem: (yi – a - bxi)2 = minim
Derivînd această sumă în raport cu derivatele parametrilor „a” şi „b”, anulînd derivatele
parţiale, se obţine sistemul de ecuaţii normale:
na + bxi = yi
axi + bxi2 = yixi

unde „n” reprezintă numărul unităţilor observate


rezolvînd sistemul de ecuaţii obţinem valorile lui „a” şi „b”:

a
y x x y x
i
2
i i i i
b
n  xi y i   xi  y i
n  x   x  n  xi2   xi 
2 2 2
i i

Coeficientul „a” poate lua atît valori pozitive cît şi negative, reprezintă ordonata la origine,
respectiv, este valoarea lui „y” cînd „x” este egal cu zero.
Coeficientul „b” denumit coeficient de regresie – arată măsura în care se modifică
caracteristica dependentă în cazul în care caracteristica independentă se modifică cu o unitate.
În funcţie de semnul coeficientului de regresie putem aprecia tipul de legătură: în cazul corelaţiei
directe b0, în cazul corelaţiei inverse b0 şi în cazul în care b=0 se apreciază că cele două
variabile sunt independente.
În graficul de corelaţie coeficientul „b” indică panta liniei drepte.
Cu ajutorul coeficienţilor „a” şi „b” se calculează apoi valoarea ecuaţiei de regresie pentru
fiecare mărime a caracteristicii „x”. Aceste valori ale ecuaţiilor de regresie se numesc valori
teoretice ale caracteristicii „y” în funcţie de „x”, iar operaţia de înlocuire a termenilor reali „y” cu
valorile ecuaţiei de regresie (valori teoretice) se numeşte ajustare.

b) Modelul exponenţial, cînd legătura dintre cele două variabile este de formă
exponenţială şi cînd variabila dependentă creşte în progresie aritmetică, iar variabila
independentă creşte în progresie geometrică:
yi =  x + 
Cei doi parametri se estimează folosind modelul (funcţia de estimaţie):
Y = abx + 
Prin logaritmare, modelul se poate transforma în tr-un model liniar de forma:
Log Y = log a + x * log b
Sistemul de ecuaţii normale este:
nlog a + log bxi = log yi
log axi +log bx i2= (xilog yi )

cei doi parametri „a” şi „b”, cu ajutorul cărora se ajustează seria empirică, se obţin prin
antilogaritmare.

c) Modelul parabolic de gradul doi: yi =  + xi + xi2 + 


Pentru estimarea parametrilor se foloseşte funcţia de estimaţie:
Y = a + bxi + cx i2 + 
Determinarea celor trei parametri ai ecuaţiei de regresie de tip parabolic se face folosind
metoda celor mai mici pătrate, respectiv, determinînd minimul expresiei: (yi – a – bxi – cxi2)2 =
minim
Se obţine sistemul de ecuaţii normale:
na + bxi + cxi2 = yi
axi + bxi2 + cxi3= yixi
axi2 + bxi3 + cxi4= yixi2

d) Modelul hiperbolic, cînd are loc o dependenţă inversă dintre cele două variabile (x –
scade, y – creşte şi invers): yi =  + 1/xi *+ 
Funcţia de estimaţie este: Y = a + 1/x *b+ , iar cei doi parametri rezultă din rezolvarea
sistemului de ecuaţii normale:
na + b1/xi = yi

4
a1/xi + b1/xi2 = yi *1/xi

e) Modelul logaritmic: yi =  +  logxi + 


Funcţia de estimaţie este: Y = a + b logxi + 
Cînd a0 şi b0, curba este crescătoare, iar cînd a0 şi b0, curba este descrescătoare.
Folosind metoda celor mai mici pătrate, se ajunge la următorul sistem de ecuaţii normale:
na + blogxi = yi
alogxi + b(logxi2) = yi logxi

Regresia multifactorială descrie legături complexe între fenomenele economico-sociale,


care se caracterizează prin influenţa unui număr mare de factori (variabile independente) asupra
caracteristicii rezultative (variabila dependentă). Asemenea legături se pot exprima cu ajutorul
ecuaţiei de regresie multiplă dată de relaţia: Y = f(x1, x2, ... , xp) +,
în care: x1, x2, ... , xp reprezintă caracteristicile independente sau factoriale
 - variabilă reziduu, cu dispersia constantă şi media nulă
Cel mai utilizat model de regresie multifactorială este modelul liniar a cărui expresie se dă
cu relaţia: Y = a0 + a1 x1 + a2 x2 + ... + ap xp,
unde:
a0 – reprezintă coeficientul care exprimă influenţa factorilor neincluşi în model, consideraţi cu
acţiune constantă;
ai (i = 1,p) – sunt coeficienţii de regresie multiplă şi arată ponderea cu care influenţează fiecare
caracteristică „x” asupra caracteristicii rezultative „y”.
Specific regresiei multiple liniare este faptul că variabila rezultativă „y” se modifică uniform
în cazul în care variabilele factoriale „xi” se modifică cu o unitate.
Parametrii a0 , a1 , a2 ,..., ap se calculează pe baza MMMP, în care:
(yi – a0 – a1 x1 – a2 x2 - ... – ap xp)2 = minim
Prin derivare obţinem un sistem de ecuaţii normale cu „p” variabile factoriale şi „p+1”
parametri, respectiv:
na0 + a1x1 + a2x2 + ... + apxp = yi
a0 x1 + a1x12 + a2x2x1+ ... + apxpx1= yi x1
.............................................................................
a0 xp + a1x1xp + a2x2xp+ ... + apxp2 = yixp

Coeficienţii de regresie pot avea fie semn pozitiv, fie semn negativ şi arată tipul de legătură
(directă sau inversă) dintre variabila factorială „xi” şi variabila rezultativă „y”.
Un alt model de regresie multifactorială este modelul exponenţial de forma:
Y  a0 x1a1 * x2a2 * ... * x p p
a

Prin logaritmare, modelul exponenţial de mai sus se opate transforma în tr+un model liniar.
etc.

Notă: Pentru a verifica care model este cel mai potrivit, se calculează suma pătratelor
abaterilor dintre valorile reale şi valorile ajustate (după modelele propuse). Se consideră ca cel
mai adecvat modelul pentru care suma pătratelor abaterilor este cea mai mică. Precizarea este
valabilă atît pentru modelele de regresie unifactorială cît şi pentru modelele de regresie
multifactorială.

5. Indicatorii sintetici ai corelaţiei


Printre indicatorii sintetici ai corelaţiei pot fi numiţi:
- coeficientul de corelaţie liniară simplă;
- raportul de corelaţie;
- coeficientul de corelaţie multiplă etc.
Coeficientul de corelaţie liniară simplă măsoară numai intensitatea legăturii de tip liniar
dintre două variabile „x” şi „y”:

5
n  xi y i   xi  y i
r
n x 2
i
2

  xi  n  yi2   yi 
2

Coeficientul de corelaţie liniară simplă poate lua valori cuprinse între –1 şi +1, adică
satisface inegalităţile:  1  r  1 . Semnul semnifică tipul de legătură: semnul minus indică
legătura inversă, semnul plus indică legătura directă.
Cu cît Coeficientul de corelaţie liniară simplă are valori mai apropiate de 1 sau –1, cu atît
corelaţia rectilinie dintre variabilele „x” şi „y” este mai puternică. Pe măsură ce coeficientul de
corelaţie se apropie de zero, scade şi intensitatea legăturii dintre cele două variabile. În cazul în
care r = 0, variabilele sunt independente sau necorelate liniar, iar pentru r = 1 rezultă dependenţă
funcţională între cele două variabile.
În practică se consideră că, dacă:
0  r  0,2 , nu există o legătură semnificativă;
0,2  r  0,5 , există o legătură slabă;
0,5  r  0,75 , există o legătură de intensitate medie;
0,75  r  0,95 , există o legătură puternică;
0,95  r  1 , putem vorbi de o legătură relativ deterministă (funcţională)

Raportul de corelaţie, denumit şi coeficientul de corelaţie Pearson, măsoară atît intensitatea


legăturilor liniare cît şi curbilinii (neliniare):

 1
y  Y  i i
2

 y  y i
2

Raportul de corelaţie poate lua valori între 0 şi 1. Cu cît valoarea raportului este mai
apropiată de 1, cu atît legătura de corelaţie este mai puternică şi invers.
Notă: În cazul corelaţiei liniare, raportul de corelaţie este egal cu coeficientul de corelaţie
liniară simplă luat în valoare absolută şi poate fi considerată această relaţie, ca un test de
verificare a liniarităţii legăturii: r  

Coeficientul de corelaţie multiplă măsoară intensitatea legăturii dintre o caracteristică


rezultativă „y” şi două sau mai multe caracteristici factoriale „xi” (i = 1,p):

R y , x1 , x2 ,..., x p  1
 y  Y i  x1 , x2 ,..., x p
2

 y  y i
2

Coeficientul de corelaţie multiplă are întotdeauna valoare pozitivă şi este mai mare decît
oricare coeficient de corelaţie simplă dintre variabilelele factoriale şi cea rezultativă, luat în valoare
absolută.
Pătratul coeficientului de corelaţie multiplă este cunoscut în literatura de specialitate sub
denumirea de coeficient de determinaţie multiplă (R2). El exprimă ponderea cu care influenţează
concomitent caracteristicile factoriale, incluse în model, asupra caracteristicii rezultative. Evident,
ponderea cu care influenţează asupra caracteristicii rezultative ceilalţi factori, necuprinşi în model,
se obţine ca diferenţă între unitate şi R2. Se obţine astfel coeficientul de nedeterminaţie multiplă
(1-R2).
Rezultă relaţia: R2 + (1-R2) = 1

Chestionar de control
1. Ce înseamnă o legătură statistică
2. Care sunt tipurile de legături statistice între variabilele economice
3. Care sunt metode elementare de caracterizare a legăturilor dintre variabile
4. În ce constă metoda regresiei
5. Care sunt indicatorii sintetici ai corelaţiei
6. Caracterizarea coeficientului de corelaţie liniară simplă
7. Caracterizarea raportului de corelaţie
8. Caracterizarea coeficientului de corelaţie multiplă

6
Statistică teoretică şi economică

CAPITOLUL 5.
CERCETAREA SELECTIVĂ
Cuvinte cheie:
- cercetarea selectivă
- sondajul
- selecţia simplă repetată (urna cu bilă revenită).
- selecţia simplă nerepetată (urna cu bilă nerevenită),
- reprezentativitatea eşantionului
- eroare de reprezentativitate
- eroare medie de reprezentativitate
- eroarea limită admisă

În societatea contemporană, cea mai mare parte a informaţiilor despre mediul de


afaceri este obţinută nu prin înregistrări exhaustive, ci prin investigaţii parţiale, cunoscute
sub numele de anchete statistice. Ele sunt preferate ca urmare a faptului că oferă
informaţii suficient de corecte într-un timp relativ scurt, astfel încât managerul unei
întreprinderi sau omul de afaceri poate valorifica în timp real o oportunitate sau poate
evita, elimina sau măcar reduce o parte din riscurile implicării în circuitul economic.
În prezentul capitol sunt prezentate fundamentele sondajului statistic ca
instrument metodologic de realizare a anchetelor în rândul întreprinderilor, al menajelor,
al consumatorilor, al privitorilor la emisiunile TV, al ascultătorilor de radio etc.
Parcurgând acest capitol, economistul are posibilitatea de a înţelege avantajele şi
inconvenientele sondajului statistic, etapele acestei forme de cercetare a realităţii
economice, principalele procedee de eşantionare, precum şi modul de calcul al
indicatorilor specifici celor mai frecvent utilizate tipuri de selecţie. Sunt arătate, de
asemenea, modalităţile de extindere a rezultatelor sondajului asupra întregii colectivităţi
supuse cercetării, precum şi căile de determinare a volumului necesar al eşantionului într-
un sondaj statistic.
Nu întotdeauna este posibil sau rentabil (cost, durată) să facem o cercetare
exsuasivă. În aceste condiţii folosim cercetarea selectivă.
Cercetarea selectivă presupune culegerea şi prelucrarea datelor referitoare la o
parte a colectivităţii generale, iar rezultatele obţinute se extind asupra întregului obiect al
cunoaşterii pentru a obţine o caracterizare satisfăcătoare. Este necesar ca partea observată
(eşantion, mostră, probă, selecţie) să fie reprezentativă adică să reproducă la scară redusă
trăsăturile esenţiale ale colectivităţii întregi.
Sondajul este o formă a cercetării statistice realizată pe baza unei părţi
reprezentative din populaţia (colectivitatea generală) studiată. El presupune următoarele
etape consecutive:
1) extragerea unui eşantion reprezentativ din colectivitatea generală (eşantionarea)
şi culegerea de date despre despre elementele extrase (obserarea eşantionului);
2) descrierea statistică a eşantionului prin indicatori specifici fiecărei caracteristici
înregistrate în cadrul programului de observare (obţinerea estimatorilor);
3) extinderea rezultatelor obţinute la nivel de eşantion asupra colectivităţii generale
(estimarea parametrilor colectivităţii generale = inferenţa statistică).
Statistică teoretică şi economică

După scopul urmărit, sondajul statistic poate fi:


• sondaj descriptiv întreprins în vederea estimării parametrilor ce caracterizează o
populaţie;
• sondaj analitic realizat pentru verificarea (testarea) unor ipoteze statistice.
Realizarea sondajului are rost numai dacă volumul eşantionului (n) este mult mai mic
decât volumul colectivităţii generale (N) din care a fost extras.
Eşantionul (mostra, proba, colectivitatea de selecţie) este o submulţime a
populaţiei statistice, astfel extrasă (obţinută) încât să reprezinte principalele trăsături ale
colectivităţii generale.
Colectivitatea generală (populaţia) este alcătuită din totalitatea unităţilor (a
elementelor simple sau complexe) a căror mulţime formează fenomenul/procesul supus
analizei. Deoarece din întreaga populaţie se extrage un număr de elemente, ea se mai
numeşte şi bază de sondaj.
Atât colectivitatea generală, cât şi eşantionul se caracterizează prin indicatori
statistici. Dacă cercetarea este exhaustivă, indicatorii se mai numesc şi parametrii
colectivităţii generale. În cadrul sondajului statistic, parametrii se estimează cu ajutorul
indicatorilor specifici eşantionului, numiţi din acest motiv şi estimatori. În Tabelul nr. 5.1
se prezintă sistemul uzual de notaţii pentru parametrii colectivităţii generale şi estimatorii
lor în cadrul unui eşantion.

Avantaje cercetarii selective:


• mai ieftină, mai operativă, mai exactă pentru că se face pe un număr redus de
elemente;
• poate fi mai bogată, completă faţă de cercetarea totală;
• rezultatele cercetării selective pot fi verificate dacă este necesar prin altă cercetare
selectivă sau printr-o cercetare totală (invers nu);
• se foloseşte când se presupune distrugerea elementelor în cazul cercetării.

Noţiuni fundamentale flosite în cercetarea selectivă


Sunt de fapt noţiuni perechi care vizează colectivitatea generală pe de o parte şi
eşantionul pe de altă parte.

colectivitate eşantion
generală
N (volumul) n (volumul)
x 0 (media) x (media)
σ2 (dispersia)
σ 02 (dispersia)
p2 = M/N (pt. car. w = m/n
alternativ) σ w2 (1 − w)
σ (1 − p)
2
p

În general nu se cunosc aspecte legate de colectivitatea generală. Cercetartea


selectivă este folosită pentru a estima pe baza eşantionului parametrii colectivităţii
generale.
Statistică teoretică şi economică

5.1.Procedee de selecţie
Se recomandă alegerea procedeului de selecţie în funcţie de mărimea (N) a
colectivităţii generale şi în funcţie de omogenitatea sau eterogenitatea acesteia.
Dacă colectivitatea generală este omogenă putem folosi:
• procedeul loteriei
• procedeul tabelului cu numere întâmplătoare sau un program pe calculator de
generare de numere întâmplătoare;
• procedeul mecanic sau al pasului de numărare.
Dacă colectivitatea generală este eterogenă se recomandă folosirea selectţiei
dirijate pentru a asigura reprezentativitatea eşantionului (procedeul selecţiei stratificate,
selecţie tipică).
Dacă colectivitatea generală este alcătuită din unităţi complexe numite şi serii (de
ex. populaţia alcătuită pe familii, locurile de mărfuri grupate pe paleţi etc.) se recomandă
procedeul selecţiei de serie.

Procedeul loteriei.
Se aplică în cazul colectivităţii generale de volum mic, relativ omogenă.
Aplicablitatea constă în numerotarea de la 1 la N a tuturor elementelor din colectivitatea
generală (ceea ce uneori este incomod) confecţionând jetoane sau bile absolut de aceleaşi
dimensiuni, care se introduc într-o urnă şi se amestecă înainte de fiecare extragere.
Extragerea poate fi efectuată în două variante:
¾ selecţia simplă repetată (urna cu bilă revenită).
În acest caz, la fiecare extragere există o aplicabilitate de 1/N de a intra în
alcătuirea eşantionului. Folosind această variantă se pot forma foarte multe eşantioane
diferite având acelaşi volum, dar posibilitatea includerii a unui acelaşi element face ca
reprezentativitatea includerii a unui acelaşi element face ca reprezentativitatea
eşantionului să fie redusă.
¾ selecţia simplă nerepetată (urna cu bilă nerevenită), prin care probabilitatea
includerii în eşantion creşte, treptat pe măsura extragerii elementelor. La extragerea I,
probalilitatea extrageriiv este 1/N; la extragerea a II-a probalilitatea extragerii este de
1/(N-1) si asa mai departe; la ultima extragere, probalilitatea va fi: 1/[N – (n+1)].
Aceste eşantioane se bucură de o mai mare reprezentativitate, iar numărul lor este
CnN (mult mai mic decât la selecţia repetată Nn).
Pentru a evita constituirea urnelor cu bile se poate folosi fie tabele cu numere
întâmplătoare, fie un program de calculator care să genereze numere întâmplătoare.
Procedeul mecanic sau al pasului de numărare.
Acest procedeu este foarte operativ dar nu asigură o selecţie strict aleatoare, doar
primul element din eşantion se extrage la întâmplare, restul intrând în componenţa
eşantionului ca urmare a poziţiei ocupate.
Ştiind că există N elemente în colectivitatea generală şi că eşenationul trebuie să
fie de n elemente, se calculează k; k = N/n, adică pasul de numărare.
Din primele k elemente se extrage, la întâmplare, unul, acesta devenind primul
element al eşantionului. Numărul de ordine al celorlate elemente se află adunând succesiv
k.
Dacă elementele colectivităţii generale sunt eterogene, constatându-se o anumită
stratificare a colectivităţii generale se recomandă să fie folosită o selecţie dirijată
Statistică teoretică şi economică

(nealeatoare) pentru a asigura pătrunderea în eşantion a unor elemente din toate straturile
tipice. O asemenea selecţie dirijată este selecţia stratificată sau selecţia tipică: după
stabilirea volumului n al eşantionului se stabileşte componenţa pe straturi (număr de
elemente din fiecare strat), astfel încât structura eşantionului să corespundă structurii
colectivităţii generale. Pentru extragerea separată din fiecare strat a numărului
corespunzător de elemente, se utilizează unul din procedeele aleatoare de mai sus.
Selecţia de serii (sau de unităţi complexe) reprezintă un alt procedeu de selecţie.
Pentru colectivitatea organizată pe unităţi complexe (populaţia organizată pe familii) se
recomandă să nu distrugem aceste structuri pentru a extrage unităţi simple, ci să preferăm
extragerea de unităţi complexe sau extragerea de serii.

5.2.Reprezentativitatea eşantionului.
Reprezentativitatea eşantionului inseamna capacitatea acestuia de a reda
trăsăturile esenţiale ale colectivităţii generale din care s-a extras chiar dacă volumul
eşenationului este mult mai mic decât volumul colectivităţii din cade s-a extras.
Dintre metodele de exprimare a reprezentativităţii eşantionului cele mai frecvente
se referă la compararea structurii eşantionului cu structura colectivităţii generale sau la
compararea mediei eşantionului x cu media colectivităţii generale x 0, la una sau mai
multe caracteristici cunoscute, înregistrarea atât pe eşantion cât şi la colectivitatea
generală. De exemplu compararea mediei de vârstă a eşantionului cu media de vârstă a
întregii ţări.
Se întâmplă, în unele cazuri, să nu se cunoască nimic despre colectivitatea
generală. În acest caz când nu este posibilă compararea cu parametrii colectivităţii
generale, se recomandă extragerea a cel puţin două eşantioane diferite din aceeaşi
colectivitate generală şi compararea mediilor sau structurilor acestor eşantioane. Dacă ele
nu diferă semnificativ, atunci oricare dintre eşantioane poate fi folosit pentru a estima
parametrii colectivităţii generale.

5.3.Calculul indicatorilor de selecţie şi extinderea rezultatelor pentru principalele


tipuri de selecţie.
Diferenţa dintre media eşantionului şi media colectivităţii generale se numeşte
eroare de reprezentativitate. În domeniul social economic se consideră că eşantionul este
 x − x0 
reprezentativ cât timp această diferenţă este mai mică de ± 5%  ⋅ 100  faţă de
 x0 
media colectivităţii generale.
Eroarea de reprezentativitate este determinată fie de cauze sistematice (voite sau
întâmplătoare) care duc la alcătuirea unui eşantion după criterii subiective, fie de abateri
(erori) aleatoare.
Dacă se iau în considerare toate eşantioanele de un anumit volum n, obţinute prin
acelaşi procedeu de extragere, se constată mediile acestor eşantioane ( x i) se distribuie
normal faţă de valoarea pe care o înregistrează media colectivităţii generale ( x 0).
Eşantioanele având media identic egală cu x 0 sunt cele mai frecvente.
Se numeşte eroare medie de reprezentativitate abaterea medie pătratică a
mediilor de eşantionare faţă de x 0 . Pentru a putea calcula această valoare medie de
Statistică teoretică şi economică

reprezentativitate (µx pentru variabila numerică şi µw pentru variabila alternativă) ar


trebui să avem toate mediile de eşantioane posibile şi frecvenţele lor de apariţie.

µx =
∑ (x − x
i
2
0 ⋅ fi
∑f i

De obicei nu se cunoaşte decât un singur eşantion. Se poate face însă calcul


anticipat al lui µx pornind de la relaţia dintre dispersia colectivităţii generale (σ20),
pătratul erorii medii de reprezentativitate µx2 şi volumul eşantionului.
În cazul selecţiei simple repetate această relaţie este:

σ 02 = µ x2 ⋅ n

σ 02
ceea ce înseamnă că µ x = , adică eroarea medie de reprezentativitate este direct
n
proporţională cu dispersia colevtivităţii generale şi invers proporţională cu volumul
eşantionului.
Dacă nu se cunoaşte σ20 se acceptă că dispersia unicului eşantion cunoscut σ2
oferă o marjă satisfăcătoare a împrăştierii elementelor colectivităţii dacă eşantionul este
convenabil de mare. Totuşi se face o corecţie cu 1, adică:

σ2
µx = .
n −1
Dacă se foloseşte o variabilă alternativă, eroarea medie de reprezentativitate se
stabileşte potrivit aceloraşi relaţii, adică atunci când se cunoaşte dispersia colectivităţii
generale:
p (1 − p )
µw =
n

iar, dacă nu se cunoaşte decât eşantionul, atunci:

w(1 − w)
µw =
n −1

Aceste relaţii sunt pentru selecţia simplă repetată (mecanică)


Dacă se practică selecţia simplă nerepetată, eşantioanele sunt mai reprezentative
decât la selecţia repetată, se introduce un coeficient de corecţie pentru a estima eroarea
medie de reprezentativitate:
- pentru selecţia nerepetată, variabilă numerică:

σ 02  n σ 02  n
µx = 1 −  µx = 1 − 
n −1 N n  N
Statistică teoretică şi economică

- pentru o caracteristică alternativă:


w(1 − w)  n
µw = ⋅ 1 − 
n −1  N 

În practica economică nu interesează eroarea medie de reprezentativitate, ci


eroarea maximă (abaterea maximă) sau eroarea limită ce poate apare la estimare pentru o
anumită probabilitate.
Deoarece această eroare este diferenţa dintre x şi x 0 ne folosim de proprietăţile
repatiţiei normale pentru a asocia diverse mărimi ale erorii cu probalilităţile aferente.

Eroare limită se calculează:


• pentru variabilă numerică:

∆x = z ⋅ µx

• pentru variabila alternativă:

∆w = z ⋅ µw

Există tabele ale repartiţiei normale care ne arată relaţia dintre coeficientul de
multiplicare z sau t sau probabilitatea φ (z) sau φ (t) corespunzătoare.
Eroarea limită arată diferenţa maximă în plus sau în minus care poate surveni la o
anumită probabilitate φ (z), z fiind utilizat în calculul erorii limită.
Necunoscând parametrii colectivităţii generale, rezultă că pentru o variabilă
( )
numerică x 0 ∈ x ± ± ∆ x , iar pentru o variabilă alternativă avem p ∈ (w ± ∆ w ) cu
probabilitatea corespunzătoare.
φ (z) = funcţia de probabilitate cu care se generează rezultatele
z = coeficientul funcţiei de probabilitate.
Eroarea limită se poate mări sau micşora fie prin modificarea volumului
eşantionului (n), fie prin modificarea probabilităţii cu care se garantează rezultatele,
deoarece dispersia colectivităţii totale rămâne aceeaşi.
După modul în care se combină sistemul de organizare, felul unităţilor de selecţie
şi procedeul de selecţie folosit, în cercetarea activităţii economice şi sociale, se disting
următoarele tipuri de selecţie:
- selecţie întâmplătoare simplă;
- selecţie mecanică;
- selecţie tipică (stratificată);
- selecţia de serii.
Pentru fiecare tip de selecţie se calculează trei indicatori: eroarea de medie de
reprezentativitate, eroarea limită şi volumul eşantionului.
Selecţia întâmplătoare simplă este utilizată în special pentru colectivităţi formate
dintr-un număr de unităţi simple şi care se caracterizează printr-un anumit grad de
omogenitate. Erorile de reprezentativitate sunt mari în raport cu alte tipuri de selecţie,
Statistică teoretică şi economică

deoarece dispersia folosită măsoară variaţia totală a caracteristicii datorată cauzelor care
influenţează.
Deoarece, în practică, se lucrează cu o eroare limitată, calculul volumului
eşantionului (n) se face flosind formula erorii limită.
- selecţia întâmplătoare simplă repetată:

σ 02
∆x = z ⋅ µx = z ⋅
n
σ 2
z ⋅ σ 02 z 2 ⋅ σ i2
2
∆ =z ⋅
2
x
2 0
⇒ n= ≈
n ∆2x ∆2x

- selecţia întâmplătoare simplă nerepetată:

σ 02  n z 2 ⋅ σ 02 z 2 ⋅ σ i2
∆x = z ⋅ µx = z ⋅ 1 −  ⇒ n = ≈
n  N z 2 ⋅ σ 02 z 2 ⋅ σ i2
∆x +
2
∆2x +
N N

În mod similar se procedează şi în cazul caracteristicii alternative.


Următorul tabel sintetizează eroarea medie de reprezentativitate, eroarea limită şi
volumul eşantionului pentru caracteristica numerică şi pentru cea alternativă în cazul
selecţiei repetate şi a selecţiei nerepetate:

Indicatorul Caracteristica nealternativă (numerică)


selecţia repetată selecţia nerepetată
err. medie de 2 2 2 2
reprezentativitate σ0 σi σ0  n σi  n
µx = ≈ µx = 1 −  ≈ 1 − 
n n −1 n  N n −1 N
err. limită ∆x = z ⋅ µz ∆x = z ⋅ µx
volumul z ⋅σ2 2
z ⋅σ
2 2
z
2 2
⋅σ0 z
2 0
⋅σi
eşantionului n= 0
≈ i
n= ≈
∆2x ∆2x z
2 2
⋅σ0
2
z2 ⋅ σ i
2 2
∆x + ∆x +
N N

Indicatorul Caracteristica alternativă


selecţia repetată selecţia nerepetată
err. medie de 2 p (1 − p ) w(1 − w) p (1 − p )  n w(1 − w)  n 
reprezentativitate µ =σ ≈ µw = ⋅ 1 −  ≈ ⋅ 1 
w n n −1 n  N n −1  N 
err. limită ∆w = z ⋅ µw ∆w = z ⋅ µw
volumul 2 2 2 2
z ⋅ p (1 − p ) z ⋅ w(1 − w) z ⋅ p (1 − p ) z ⋅ w(1 − w)
eşantionului n= ≈ n= ≈
2 2 z 2 ⋅ p (1 − p ) 2
∆w ∆w 2 2 z ⋅ w(1 − w)
∆w + ∆w +
N N
Statistică teoretică şi economică

Selecţia mecanică se foloseşte atunci când se combină cu alte tipuri de selecţie.


Pentru calculul erorilor de selecţie se folosesc formulele de la seleţia întâmplătoare
simplă repetată. Acest tip de selecţie se aplică la cercetările de laborator şi la estimarea
recoltei medii la hectar a producţiei agricole înainte de recoltare.
Selecţia tipică (stratificată) se aplică cel mai frecvent în studiul fenomenelor
economico-sociale care au fost, în prealabil, împărtăşite în grupe omogene (straturi sau
tipuri) după o caracteristică esenţială.
• selecţia tipică simplă caracterizată prin faptul că extragerea unităţilor din fiecare
grupă se face la întâmplare fără a se ţine seama de ponderea unităţilor din fiecare grupă a
colectivităţii generale.
• selecţia tipică proporţională este selecţia la care volumul subeşantioanelor diferă
în raport cu ponderea pe care o are fiecare grupă în colectivitatea generală şi se respectă
proporţia de selecţie.
• selecţia tipică optimă se caracterizează prin faptul că la formara eşantionului se ia
în considerare ponderea pe care o au grupele în colectivitatea generală şi mărimea
variaţiei din interiorul grupelor măsurată prin abaterea medie pătratică.
În general, se poate spune că selecţia tipică dă cele mai mici erori în activitatea
practică dar este greu de aplicat.
Selecţia de serii se foloseşte când colectivitatea generală este formată din unităţi
complexe numite şi serii (echipe, brigăzi, magazine etc.). Aceste unităţi sunt formate din
unităţi simple care prezintă caracteristici ce le deosebesc una de alta, adică au un caracter
eterogen, în raport cu unităţile componente ale grupelor tipice care se caracterizează prin
omogenitate.
Caracteristic pentru acest tip de selecţie este faptul că în locul variantelor
concrete ale caracteristicilor de la sondajele bazate pe unităţi simple se vor folosi
indicatori de selecţie calculaţi la nivelul seriei. Cerinţa reprezentativităţii se va asigura
prin apropierea mediilor din seriile de unităţi selectate de mediile din seriile colectivităţii
generale.
Pentru extinderea rezultatelor asupra întregii colectivităţi se folosesc două
procedee:
• procedeul coeficientului de corecţie se foloseşte de obicei la verificarea
autenticităţii datelor culese dintr-o observare, totală.
• procedeul extinderii directe se utilizează la caracterizarea fenomenelor pentru
care nu dispunem de informaţii prin observarea totală. În esenţă acest procedeu constă în
estimarea parametrilor colectivităţii generale pe baza rezultatelor selecţiei statistice.

x − ∆ x < x0 < x + ∆ x

Pentru a ilustra valenţele cognitive ale indicatorilor prezentaţi mai sus, să


acceptăm că responsabilul departamentului de resurse umane dintr-o corporaţie
multinaţională având N = 4000 de angajaţi direct operativi a decis realizarea unui studiu
cu privire la nevoile de formare profesională continuă ale acestei categorii de salariaţi şi
disponibilitatea lor de a participa la astfel de programe.
Pentru a răspunde acestei decizii, consiliul director al corporaţiei aprobă
organizarea unui sondaj statistic în rândul salariaţilor, volumul eşantionului fiind de n =
100 de persoane. Asigurarea reprezentativităţii eşantionului de numai 2,5% din totalul
Statistică teoretică şi economică

n 
salariaţilor direct operativi  ⋅ 100 = 2,5%  s-a făcut prin luarea în considerare a
N 
vârstei, precum şi a structurii socio-profesionale a întregului personal operativ.
În cadrul programului de observare selectivă, între alte caracteristici urmărite, se
înregistrează vârsta salariaţilor (exprimată în ani de viaţă împliniţi), precum şi interesul
(disponibilitatea) acestora de a participa la un program de formare profesională continuă.
În tabelul de mai jos se prezintă rezultatul grupării în funcţie de vârstă a celor 100
de persoane din eşantionul extras aleator şi nerepetat.
Repartiţia personalului cuprins în eşantion în funcţie de vârstă
Grupe de vârstă Număr personal
(ani împliniţi)
Sub 25*) 17
25 – 35 30
35 – 45 25
45 – 55 18
peste 55 10
Total 100
*)
Limita superioară nu este cuprinsă în interval.

Prelucrarea datelor referitoare la această caracteristică numerică (vârsta personalului),


permite constatarea că la nivelul eşantionului, vârsta medie este de:

x=
∑ xi ni = 3740 = 37,4 ani,
∑ ni 100
iar dispersia în jurul mediei eşantionului este:
∑ (x − x ) n
2
14924
σ
i i
2
= = = 149,24 .
∑n i 100
Observaţii:
1) Eşantionul este destul de omogen (v = 32,7%) pentru a putea considera că media
de 37,4 ani caracterizează corect vârsta tuturor celor 100 de persoane înregistrate.
2) Dacă media nu este reprezentativă la nivelul eşantionului (v>>35%), nu are sens să
se mai continue cercetarea printr-o eventuală tentativă de extindere a acestui indicator
(deja nereprezentativ la nivel restrâns) asupra colectivităţii generale.

Între răspunsurile înregistrate de la cele 100 de persoane cuprinse în sondaj se mai


constată că 82 sunt dornice să participe la un program de formare continuă, în timp ce
restul de 18 persoane resping oportunitatea oferită de angajator. Această caracteristică
alternativă, prezintă o medie de:
m 82
w= = = 0,82
n 100
şi o dispersie de:
σ w2 = w(1 − w) = 0,82 ⋅ 0,18 = 0,1476
Dacă s-ar fi utilizat procedeul extragerii mecanice sau procedeul extragerii
repetate, atunci pentru calculul erorii medii de reprezentativitate a unui (oricărui) eşantion
de volum n=100 s-ar fi aplicat relaţiile [5.4] pentru caracteristica numerică şi [5.6] pentru
cea alternativă. Cum sondajul a avut în vedere extragerea nerepetată (pentru a spori
Statistică teoretică şi economică

reprezentativitatea eşantionului), se aplică relaţiile [5.4’] şi, respectiv [5.6’], obţinându-


se:

y pentru caracteristica numerică:


σ2  n 149,24  100 
µx = 1 −  = 1 −  = ±1,21 ani,
n −1 N  100 − 1  4000 
ceea ce înseamnă că media unui eşantion de volum n = 100 obţinut prin extragere
aleatoare nerepetată se abate în medie cu 1,2 ani (+) faţă de vârsta medie reală ( x0 ) a
celor 4000 de persoane angajate de corporaţie;

y pentru caracteristica alternativă:


w(1 − w)  n 0,1476  100 
µw = 1 −  = 1 −  = ±0,038
n −1  N 100 − 1  4000 
Rezultatul indică o abatere medie cu +3,8% a proporţiei personalului dornic de a
participa la formarea profesională continuă cuprins în eşantion, faţă de proporţia reală
 M
p=  în rândul întregului personal al corporaţiei.
 N

În practica economică nu interesează, de obicei, eroarea medie de


reprezentativitate a eşantionului, ci abaterea maximă sau eroarea limită ce poate apare
ca diferenţă între media unui eşantion (estimator) şi media colectivităţii generale
(parametru) la estimarea acestuia cu o anumită probabilitate.
Deoarece eroarea limită este diferenţa dintre x şi x 0, ne folosim de proprietăţile
repatiţiei normale pentru a asocia diverse mărimi ale erorii cu probalilităţile aferente
măsurate ca (sub) multipli ai abaterii standard a mediilor de eşantionare faţă de x0 .
Eroarea limită se calculează astfel:
• pentru variabilă numerică:

∆x = z ⋅ µx [5.7]

• pentru variabila alternativă:

∆w = z ⋅ µw [5.8]

Există tabele ale repartiţiei normale care exprimă relaţia dintre argumentul z sau t şi
funcţia de probabilitatea φ(z) sau φ(t) corespunzătoare.
În exemplul considerat, eroarea limită pentru o probabilitate Φ(z) = 0,95 (z = 1,96)
este:
y pentru caracteristica numerică, de aproximativ 2,4 ani:
∆ x = z ⋅ µ x = 1,96 ⋅ 1,21 = 2,37 ani ≅ 2,4 ani,
Statistică teoretică şi economică

Semnificaţia rezultatului: distanţa maximă ce poate exista între media eşantionului


( x0 ) este de +2,4 ani, această afirmaţie fiind valabilă cu o probabilitate de 0,95 (se
acceptă un prag de eroare α=0,05);

y pentru caracteristica alternativă:


∆ w = z ⋅ µ w = 1,96 ⋅ 0,038 = 0,07448 sau 7,4%.

Interpretarea este asemănătoare celei prezentate la ∆x. Diferenţa maximă între w şi p


(proporţia celor înclinaţi să facă un program de formare contiună în cadrul eşantionului –
w şi, respectiv în colectivitatea generală - p) este, cu aceeaşi probabilitate Φ(z) = 0,95 de
7,4%.

Observaţii:
1. Un tabel cu valorile funcţiei Gauss – Laplace corespunzând diferitelor valori ale lui z
se găseşte în volumul Bazele statisticii pentru economişti. Aplicaţii. Bucureşti, Editura
Tribuna Economică, 2002, p. 259-260.
2. Dacă s-ar fi folosit extragerea mecanică, sau extragerea repetată, eroarea limită era
ceva mai mare: ∆x = 2,41 ani (faţă de 2,37 ani); ∆w = 7,6% (faţă de 7,4%).
Coeficientul de corecţie aplicat în cazul sondajului nerepetat este întotdeauna o
mărime subunitară care restrânge mărimea erorii medii de reprezentativitate şi,
respectiv, a erorii limită, oferind o estimare mai exactă a parametrilor colectivităţii
generale.
3. Nu este obligatoriu ca probabilitatea cu care se estimează diverşi parametrii ai
colectivităţii generale să fie aceeaşi la toate variabilele cerectate.
Statistică teoretică şi economică

Probleme şi aplicaţii.
5.1. Un echipament de ambalare este astfel reglat încât să împacheteze câte 20 de
bomboane cu o toleranţă de ±1 bucată.
Pentru a aprecia calitatea reglajului, din producţia unei zile s-a prelevat prin
extragere mecanică un eşantion de 150 pachete care conţineau în total 3015
bomboane în loc de 3000 bomboane. Din cercetarea eşantionului rezultă că în jurul
mediei de 20,1 bomboane/pachet, intensitatea împrăştierii era de 7,2%, în condiţiile
în care 129 pachete conţineau exact 20 bomboane, 12 pachete aveau 21 sau mai
multe bomboane, iar 9 pachete erau cu 19 sau mai puţine bomboane.

Se cere:
Să se estimeze cu o probabilitate Φ(z) = 0,9973 (z = 3) numărul total de
bomboane ambalate în lotul de N = 3000 pachete realizate în cursul zilei şi să se observe
dacă echipamentul se încadrează în toleranţa admisă.

Rezolvare:
Din enunţul problemei rezultă că eşantionul se caracterizează prin:
• Volumul n = 150 pachete;
• Media x = 20,1 bomboane/pachet;
• Abaterea standard σ = 1,4472 bomboane/pachet (din relaţia coeficientului de

σ
variaţie v = ⋅ 100 = 7,2% )
x
Pe baza acestor date, se poate estima eroarea medie de reprezentativitate, ştiind
că în cazul extragerii mecanice se aplică relaţia de la sondajul simplu, aleator, repetat:

σ2 2,0944
µx = = = 0,118 bucati
n 150

Un eşantion de 150 produse prelevate mecanic din producţia zilei, prezintă, în


medie, o abatere cu 0,118 bomboane/pachet faţă de numărul mediu ( x0 ) ce caracterizează
întrega producţie.
Eroarea limită pentru Φ(z) = 0,9973:

∆ x = z ⋅ µ x = 3 ⋅ 0,118 = 0,35 bucati

Numărul mediu de bomboane/pachet în producţia zilei se situează, cu


probabilitatea de 0,9973 în intervalul:
x0 ∈ ( x ± ∆ x ), adica, x 0 ∈ ( 20,1 ± 0,35)
Prin urmare: 19,75 ≤ x 0 ≤ 20,45 , ceea ce, aplicat întregii producţii a zilei conduce
(prin multiplicarea cu N = 3000) la un număr total (T) de bomboane ambalate de:
59250 ≤ T ≤ 61350 , cu Φ(z) = 0,9973, în condiţiile în care reglajul trebuia să
încadreze acest număr între (20-1)⋅3000 = 57.000 bucăţi şi (20+1)⋅3000 = 63.000 bucăţi.
Statistică teoretică şi economică

Întrucât intervalul de estimare (59.250, 61.350) este mult mai mic decât toleranţa
admisă (57.000, 63.000), rezultă că reglajul este corespunzător.
Răspuns: Numărul total de bomboane ambalate este situat, cu Φ(z) = 0,9973 între
59.250 şi 61.350 bucăţi. Echipamentul se încadrează în tolerenţa admisă.
Cât de mare ar trebui să fie un eşantion, dacă numărul mediu de bomboane/pachet
ar trebui estimat cu Φ(z) = 0,9545 (z = 2) în limitele unui interval de ±0,5 bucăţi?

Rezolvare:

z 2 ⋅ σ 2 4 ⋅ 2,0944
n= = = 33,5104 ≅ 34 pachete .
∆2x 0,52

Răspuns: Pentru a răspunde unei astfel de exigenţe, ar fi suficient să se preleve


prin extragere mecanică doar 34 pachete, ceea ce la o producţie totală de 3000 pachete
N
înseamnă un pas de numărare ≈ 88 .
n
Să se observe în eşantionul de 150 pachete, cota de produse care nu îndeplinesc
cerinţa de 20 bomboane/pachet şi să se estimeze cu Φ(z) = 0,90 (z = 1,65) cota minimă şi
maximă, precum şi numărul minim şi maxim de pachete necorespunzătoare din punct de
vedere al conţinutului în producţia unei zile.
Rezolvare:
Din 150 pachete prelevate, 12+9 = 21 pachete conţin fie mai multe, fie mai puţine
produse decât numărul standard de 20 bomboane/pachet.
În cadrul eşantionului, media (w) şi dispersia ( σ w2 ) caracteristicii alternative
sunt:

m 21
w= = = 0,14 , ceea ce înseamnă că 14% din eşantion nu corespunde
n 150
standardului de ambalare.

σ w2 = w(1 − w) = 0,14 ⋅ 0,86 = 0,1204

Eroarea medie de reprezentativitate a unui eşantion de volum 150 obţinut prin


prelevare mecanică este de:

σ w2 0,1204
µw = = = 0,0283 sau 2,83%
n 150

Un eşantion de volum 150 prelevat mecanic se caracterizează, în medie, printr-o


cotă de produse necorespunzătoare cu 2,83% mai mare sau mai mică decât cota parte
specifică întregii producţii a unei zile.
Eroarea limită pentru o probabilitate de 0,90 este de:
Statistică teoretică şi economică

∆ w = z ⋅ µ w = 1,65 ⋅ 0,0283 = 0,0467 sau 4,7% .

La probabilitatea menţionată, abaterea maximă a unui eşantion de volum 150


prelevat mecanic faţă de cota reală de produse necorespunzătoare din producţia unei zile
este 4,7%.
În aceste condiţii, la Φ(z) = 0,90, cota minimă şi maximă de defecte în producţia
zilei este cuprinsă în intervalul:

p ∈ ( w ± ∆ w ), adica : p ∈ (0,14 ± 0,047) sau:


0,093 ≤ p ≤ 0,187 , cu Φ(z) = 0,90.

Numărul minim şi maxim de pachete necorespunzătoare (M) în producţia unei zile


se obţine înmulţind cu N = 3000 limitele intervalului în care se încadrează cota de
defecte:
279 ≤ M ≤ 561 pachete, cu Φ(z) = 0,90.
Cel puţin 279 pachete şi cel mult 561 pachete din lotul fabricat de 3000, cuprinde
mai mult sau mai puţin de 20 bomboane/pachet, cu o probabilitate de 0,90 (sau cu o
marjă de eroare acceptată de 1-0,90 = 0,10 sau 10%).
Având în vedere că un client nu va reclama decât în situaţia în care obţine mai
puţine bomboane decât numărul de 20 (care apare înscris pe pachet), se cere refacerea
calculelor, considerând că m = 9 pachete din 150 verificate.
Răspuns: w = 0,06; w(1-w) = 0,0564; µ w = 0,02; ∆ w = 0,03; 0,03 ≤ p ≤ 0,09 ;
90 ≤ M ≤ 270 pachete, cu Φ ( z ) = 0,9 .

5.2. Dintr-o comandă de 1000 piese, se prelevă un eşantion de 65 piese prin extragere
aleatoare, simplă, nerepetată. Potrivit comenzii, fiecare piesă ar trebui să cântărească
85 grame. După examinarea eşantionului, se constată că greutatea medie a pieselor
este de 87,2g, dispersia eşantionului fiind de 70,6746, abaterea standard de 8,4g,
coeficientul de variaţie 9,6%. Între piesele eşantionului se află 26 piese cu greutatea
mai mare decât cea prevăzută de comandă.

Se cere:
Estimarea cu Φ(z) = 0,9545 (z = 2) limitele intervalului în care se înscrie
greutatea medie a celor 1000 piese din lot.

Rezolvare:
Eroarea medie de reprezentativitate în cazul sondajului aleator, simplu, nerepetat,
se estimează astfel:

σ2  n 70,6746  65 
µx = 1 −  = 1 −  = 1,0083 g
n  N 65  1000 
Statistică teoretică şi economică

Eroarea limită:

∆ x = z ⋅ µ x = 2 ⋅ 1,0083 ≈ 2,02 g , pentru Φ(z) = 0,9545

Intervalul în care se înscrie greutatea medie a tuturor pieselor cu probabilitatea


menţionată este:
x 0 ∈ (87,2 ± 2,02) ⇒ 85,18 ≤ x 0 ≤ 89,22 g
Estimarea cu Φ(z) = 0,90 (z = 1,65) a cotei maxime de produse cu greutatea
depăşită.
Rezolvare:

σ w2  n
µw = 1 −  , unde σ w = w(1 − w) = 0,4 ⋅ 0,6 = 0,24
2

n  N

µ w = 0,059 sau 5,9%

∆ w = z ⋅ µ w = 1,65 ⋅ 0,059 = 0,097 sau 9,7%

Cota maximă este, de fapt, limita superioară a intervalului în care se înscrie p,


respectiv w + ∆w = 0,4 + 0,097 = 0,497, ceea ce, în mărime absolută, înseamnă 497 piese.
Cât de mare ar trebui să fie eşantionul extras prin acelaşi procedeu pentru o nouă
cercetare, dacă ar trebui să se estimeze cota minimă şi maximă cu probabilitatea Φ(z) =
0,9545 (z = 2) în limitele unui interval de ±5%, respective ±0,05.

Răspuns:

z 2 ⋅ σ w2 4 ⋅ 0,24
n= = = 974,62 ≅ 975 piese
z ⋅ σ w 0,05 + 0,00096
2 2 2
∆w +
2

Cu acest rezultat, locul cercetării selective este luat de examinarea integrală a


lotului comandat.

5.2.În rândul personalului operativ al unui centru de librării se efectuează un sondaj


stratificat cu extragere nerepetată. Între caracteristicile observate pe cele n = 80
de persoane din eşantion, se numără vânzările medii săptămânale (milioane lei)
şi felul raionului de mărfuri. Rezultatele înregistrării eşantionului se prezintă
astfel:
Statistică teoretică şi economică

Felul raionului de mărfuri Total


Anticariat Jucării Librărie Papetărie

Vânzări
medii (mil lei)
Până la 3 3 --- --- 2 5
3–5 5 3 12 8 28
5–7 2 5 12 10 29
7 şi peste --- 12 6 --- 18
Total 10 20 30 20 80

Se cere:
Să se caracterizeze acest eşantion.
Rezolvare:
Vânzarea medie săptămânală realizată de cele 80 persoane este x = 5,5 mil lei.
Amplitudinea variaţiei este de 6 mil lei, adică 109,09% faţă de medie. Acest indicator
permite aprecierea că cele 80 de elemente ale eşantionului prezintă o împrăştiere relativ
mare (peste 100%).
Dispersia eşantionului: σ 2 = 3,05 .
Abaterea standard: σ = 1,7464 mil lei.
Coeficientul de variaţie: v = 31,75%.
În pofida întinderii relativ mari a împrăştierii, colectivitatea este destul de
omogenă (intensitatea împrăştierii este sub 35%).
Analiza variaţiei vânzărilor medii săptămânale în cadrul celor 4 grupe constituite
după felul mărfurilor comercializate şi elementele de calcul pentru verificarea regulii de
adunare a dispersiilor sunt prezentate în tabelul 53.2. Pe baza acestei identităţi se
stabileşte în ce măsură influenţează felul mărfurilor variaţiei volumului vânzărilor
săptămânale.

Raionul j nj xj σ 2j xj − x ( x j − x)2 ⋅ n j σ 2j ⋅ n j
Anticariat 1 10 3,8 1,96 -1,7 28,9 19,6
Jucării 2 20 6,9 2,19 +1,4 39,2 43,8
Librărie 3 30 5,6 2,24 +0,1 0,3 67,2
Papetărie 4 20 4,8 1,76 -0,7 9,8 35,2
Total --- 80 --- --- --- 78,2 165,8

Regula de adunare a dispersiilor: σ 2 = δ 2 + σ 2 , în care:


‰ Dispersia generală a eşantionului este deja calculată: σ 2 = 3,05 .
‰ Dispersia indusă (explicată) de felul mărfurilor vândute:
Σ( x j − x ) 2 ⋅ n j 78,2
δ =
2
= = 0,9775 .
Σn j 80

Σσ 2 ⋅ n j 165,8
‰ Dispersia reziduală: σ = 2
= = 2,0725
Σn j 80
Statistică teoretică şi economică

Regula se verifică: 3,05 = 0,9775 + 2,0725, iar pe baza ei se calculează


coeficientul de determinaţie:

δ2 0,9775
D= ⋅ 100 = ⋅ 100 = 32%
σ 2
3,05

Varietatea mărfurilor comercializate în diferitele raioane ale centrului de librării


explică în proporţie de 32% variaţia vânzărilor medii săptămânale realizate de cele 80 de
persoane din eşantion.
Să se estimeze cu Φ(z) = 0,9545 (z = 2) volumul mediu săptămânal al vânzărilor
realizate de întregul personal operativ al centrului de librării (N = 760 persoane).
Rezolvare:
Eroarea medie de reprezentativitate în cazul sondajului stratificat cu extragere
nerepetată se determină astfel:

σ2 n 2,0725  80 
µx = 1 −  = 1 −  = 0,15 mil lei
n  N 80  760 

Eroarea limită:

∆ x = z ⋅ µ x = 2 ⋅ 0,15 = 0,3 mil.lei

Prin urmare, x 0 ∈ (5,5 ± 0,3) cu o probabilitate de 95,45%.


Limitele intervalului în care se încadrează vânzarea medie săptămânală a celor
760 angajaţi direct în procesul vânzării sunt: 5,2 mil lei şi, respectiv, 5,8 mil lei.
Pe acest temei, managementul acestei firme poate conta sâptămânal, cu Φ(z) =
0,9545, pe încasări situate între 3952 şi 4408 milioane lei.
Cât de mare ar trebui să fie eşantionul într-o nouă cercetare selectivă bazată pe
extracţia stratificată nerepetată a elementelor componente, dacă estimarea ar trebui făcută
cu aceeaşi probabilitate Φ(z) = 0,9545 (z = 2), dar în limitele unui interval de estimare de
±0,5 milioane lei?
Răspuns:

z2 ⋅σ 2 4 ⋅ 2,0725
n= = = 31,74 ≅ 32 persoane
z ⋅σ
2 2
8,28
∆2 + 0,5 +
2

N 760

Cu ce probabilitate s-ar putea face estimarea limitelor intervalului în care se


încadrează vânzarea medie săptămânală, dacă ∆ x = ±0,5 mil lei, dar se păstrează
mărimea iniţială a eşantionului: n = 80 persoane?
Răspuns: Prin înlocuire în relaţia de mai sus, se obţine că z = 3,28, ceea ce corespunde
lui Φ(z) = 0,999481 în orice tabel al distribuţiei normale.
Statistică teoretică şi economică

Revenind la un volum necesar al eşantionului de 32 persoane, cum se face


stratificarea?
Rezolvare:
Stratificarea se realizează pentru a asigura pătrunderea în eşantion a unor
elemente din toate tipurile existente în colectivitatea generală. Există mai multe tipuri de
stratificare a eşantionului:
(1) Un procedeu elementar constă în stratificarea simplă, respectiv împărţirea
volumului stabilit al eşantionului (n = 32) la numărul grupelor existente în colectivitatea
generală (r = 4 tipuri de mărfuri comercializate).
Prin urmare, câte 32:4 = 8 elemente se vor preleva din fiecare strat, prin extragere
nerepetată.
 Nj 
(2) Stratificarea proporţională ţine seama de structura   specifică mulţimii
 ΣN 
 j 
ce alcătuieşte colectivitatea generală. În cadrul firmei, personalul operativ (760 persoane)
prezintă următoarea structură: anticariat 9,5% (72 persoane), jucării 30% (228 persoane),
librărie 32,5% (247 persoane), iar în raioanele de papetărie circa 28% (213 persoane).
Pentru a transfera această structură asupra eşantionului, se foloseşte relaţia:
Nj
nj = n⋅
ΣN j
Astfel, cele 32 elemente din eşantion se repartizează după cum urmează: 3
persoane se prelevă (prin extragere nerepetată) dintre (cei 72 de) anticari; 10 persoane
dintre cele ce comercializează jucării; 10 persoane dintre librari şi 9 persoane dintre
vânzătoarele de la raioanele de papetărie:
3 + 10 + 10 + 9 = 32 persoane.
Evident, unele rotunjiri s-au impus fiind vorba de unităţi indivizibile (persoane)
ale colectivităţii generale.

(3) Stratificarea optimă a eşantionului presupune luarea în considerare nu numai a


structurii colectivităţii generale pe tipuri de activităţi ( N j cu j = 1, r ), dar şi a dispersiei
specifice fiecărei strat ( σ 2j ) din colectivitate.
Astfel, relaţia care se foloseşte la structurarea eşantionului devine:

N j ⋅ σ 2j
nj = n⋅
ΣN j ⋅ σ 2j

Mai sus s-au arătat valorile Nj, iar în tabelul 53.2, coloana a cincea, se află σ 2j . Cu
aceste date, pentru aflarea numărului de persoane care urmează să intre în alcătuirea
eşantionului din rândul celor care se ocupă de anticariat este:

72 ⋅ 1,96
n1 = 32 ⋅ = 2,88 ≅ 3 persoane.
1568,6
Statistică teoretică şi economică

Pentru celelalte trei grupe rezultă, în ordine: 10 persoane; 11 persoane; 8


persoane.
3 + 10 + 11 + 8 = 32 persoane.
Observaţie: Prelucrarea datelor referitoare la eventualele caracteristici alternative se face
în mod asemănător.

5.4. O societate comercială prezintă următoarea repartiţie a personalului său pe


grupe de vârstă:
(date convenţionale)
Grupe de vârstă (ani) Număr de persoane
Sub 20 10
20-30 30
30-40 40
40-50 15
peste 50 5
Total 100

Se cere:
1. să se reprezinte grafic repartiţia;
2. se consideră că cele 100 de persoane constituie un eşantion extras aleator, simplu,
nerepetat dintr-o colectivitate generală de 1000 persoane; să se determine intervalele de
vârstă între care se situează vârsta medie a celor 1000 persoane considerându-se
Φ( z ) = 0,9545; z = 2.

5.5. Timpul pentru înotătoarele cu vârsta cuprinsă între 9 şi 10 ani pe distanţa de 50


metrii, stilul fluture, este aproximativ normal distribuită cu media 49,4 secunde şi
abaterea standard de 2,8 secunde.
1. să se găsească probabilitatea în cazul unui eşantion aleator simplu de 25 de înotătoare
care să aibe media mai mare de 50,15 secunde.

5.6. Să se obţină un eşantion aleator de mărime 25 cu media x = 83,4 şi abaterea


medie pătratică σ = 12 , dintr-o populaţie cu o distribuţie normală dacă media
colectivităţii generale este x 0 = 83.

5.7. În tabelul următor sunt prezentaţi numărul de enoriaşi ai unei biserici ortodoxe
pe grupe de vârstă:

Vârsta (ani) Număr de enoriaşi


Sub 20 274
21-50 526
peste 50 345

Se cere:
1. dacă se efectuează o selecţie stratificată de volum n=100, să se determine numărul de
enoriaşi care trebuie să facă parte din fiecare strat;
2. aceeaşi cerinţă în cazul în care se cunosc abaterile standard ale celor trei straturi:
σ 1 = 1,2; σ 2 = 4,8; σ 3 = 2,3.
Statistică teoretică şi economică

5.8. Care este valoarea erorii standard a mediei unui eşantion de volum n=100,
selectat simplu, aleator repetat, dacă dispersia este egală cu 25?

5.9. În tabelul următor sunt prezentate datele referitoare la localitatea de rezidenţă


a studenţilor unei facultăţi economice:

Localizarea geografică Număr de studenţi


Nord – est 347
Sud – est 624
Sud – vest 196
Nord – vest 93
Se cere:
1. dacă se utilizează selecţia stratificată de volum n=200, care va fi mărimea fiecărui
strat?

5.10. Un eşantion de 500 de familii chestionate în legătură cu nivelul mediu al


cheltuielilor destinate produselor alimentare se prezintă astfel:

Cheltuieli pentru alimente (mii lei) Număr de persoane


Sub 500 80
500-800 120
600-900 150
900-1200 100
peste 1200 50
Total 500

1. să se determine coeficientul de asimetrie al repartiţiei;


2. dacă cele 500 de familii sunt considerate ca fiind o colectivitate generală din care se
extrege un eşantion aleator şi nerepetat cu φ ( z ) = 0,8064; z = 1,3 , să se deteremine
mărimea eşantionului.
CAPITOLUL 3

CAPITOLUL 3

ANALIZA ŞI DESCRIEREA NUMERICĂ A


SERIILOR STATISTICE UNIVARIATE

Consideraţii preliminare
Cel mai adesea, urmărim să caracterizăm prin indicatori statistici —
măsuri cantitative — datele statistice pe care le avem la dispoziţie. Scopul
capitolului următor este să prezinte indicatorii statistici, primari şi derivaţi,
simpli şi sintetici, ce se folosesc în mod frecvent pentru caracterizarea
statistică a seriilor statistice.
Vom putea, astfel, să analizăm tendinţa centrală, dar şi variabilitatea
datelor, forma distribuţiilor şi concentrarea datelor.
Să notăm şi faptul că, datorită particularităţilor lor, indicatorii
statistici ai seriilor cronologice vor fi trataţi într-un capitol distinct.

Termeni cheie
abatere individuală indicator
abatere intercuartilică indicatori de poziţie
abatere medie liniară indicatori derivaţi
abatere medie pătratică indicatori primari
abatere semiintercuartilică mărime medie
amplitudine mărimi relative
aplatizare. mediană
asimetrie medie aritmetică
boltire medie armonică
coeficient de determinaţie medie geometrică
coeficient de variaţie medie pătratică
cuantile mod
cuartile percentile
decile regula de adunare a dispersiilor
diagramă Box- Plot variabilitate
dispersie
STATISTICĂ ECONOMICĂ

Noţiuni teoretice

3.1. INTRODUCERE

În acest capitol, vom continua să examinăm modalităţile prin care


putem să rezumăm seturile de date statistice, în aşa fel încât trăsăturile lor
esenţiale să poată fi puse în evidenţă. În capitolele precedente, am învăţat
cum să grupăm datele brute într-o formă mai uşor de interpretat şi cum să
construim diferite reprezentări grafice ale datelor sistematizate. Având la
dispoziţie un set de date numerice, am început analiza statistică prin
determinarea valorii maxime şi valorii minime, apoi am determinat o
distribuţie de frecvenţe, histograma şi poligonul frecvenţelor. Aceste
instrumente au permis identificarea formei aproximative a distribuţiei şi au
indicat în jurul cărei valori sunt mai concentrate nivelurile individuale ale
variabilei.
Deşi o distribuţie de frecvenţe este, cu siguranţă, utilă în conturarea
unei idei de ansamblu privind distribuţia datelor între cele două valori
extreme, vom dori, în continuare, să rezumăm mai mult datele, calculând
câţiva indicatori statistici descriptivi. Indicatorii numerici descriptivi oferă
valori precise şi determinate în mod obiectiv, valori care pot fi uşor folosite,
interpretate şi comparate una cu alta. Pe scurt, aceştia permit o analiză mai
atentă a datelor, faţă de impresia generală pe care o oferă prezentarea datelor
sub formă de serii, tabele şi grafice.

3.2. INDICATORI STATISTICI PRIMARI ŞI DERIVAŢI

DEFINIŢIE: Indicatorul statistic — în sens larg — reprezentă expresia


numerică a unor fenomene şi procese social-economice, definite în timp,
spaţiu şi structură organizatorică.

Indicatorii statistici pot fi primari şi derivaţi.

Indicatorii primari se obţin, de regulă, în etapa de sistematizare a


datelor statistice, prin centralizarea şi agregarea acestora.
CAPITOLUL 3

Indicatorii derivaţi se obţin prin prelucrarea mărimilor absolute ale


indicatorilor primari.

Cele trei proprietăţi majore ale seriilor de date numerice, pe care le


putem analiza folosind indicatorii statistici sunt cele privitoare la tendinţa
centrală, la variabilitatea şi la forma distribuţiilor.

3.3. INDICATORI AI TENDINŢEI CENTRALE

O clasificare a indicatorilor tendinţei centrale se poate face, în


funcţie de modul de determinare a lor, în:
— indicatori (mărimi) medii de calcul: media aritmetică, armonică,
pătratică, geometrică etc.;
— indicatori medii de poziţie: modul, mediana.
Indicatorii fundamentali ai tendinţei centrale sunt: media
aritmetică, modul şi mediana, dar în anumite cazuri speciale putem apela
şi la alte tipuri de medii.

3.3.1. Media aritmetică

Media aritmetică (x ) reprezintă valoarea care înlocuind toţi


termenii unei serii nu modifică nivelul lor totalizator şi se calculează ca
suma valorilor raportată la numărul lor.
n
¦ xi
i =1
x= (3.1)
n
EXEMPLUL 3.1: Vechimea în muncă a fost înregistrată pentru cinci
salariaţi ai unei firme şi anume: 7, 5, 6,7 şi 8 ani. Vechimea medie este:
7 + 5 + 6 + 7 + 8 33
x= = = 6,6 ani
5 5
Observăm din fig. 3.1. cum media aritmetică pune în balanţă toate
valorile individuale:

5 6 7 8
X =6,6 ani
Fig. 3.1. Balansarea valorilor individuale prin calculul mediei
STATISTICĂ ECONOMICĂ

De asemenea, dacă vom considera următoarele date privind


vechimea în muncă, vom observa cum media aritmetică este afectată de
valorile extreme. Astfel, dacă presupunem că datele pentru vechimea în
muncă a 10 salariaţi sunt: 5, 4, 5, 5, 6, 6, 4 şi 20, atunci vechimea medie
este:
5 + 4 + ... + 4 + 20
x= = 6,6 ani
10

0 5 10 15 20
X =6,6 ani
Fig. 3.2. Balansarea valorilor individuale prin calculul mediei

În cazul în care datele au fost sistematizate într-o serie de distribuţie


(
de frecvenţe, în care valorile / centrele intervalelor de variaţie x i , i = 1, r )
apar cu frecvenţele ni media aritmetică (numită şi medie aritmetică
ponderată) este:
r
¦ xini
i =1
x= r
(3.2)
¦ ni
i =1

EXEMPLUL 3.2: Presupunem că pentru 200 de persoane s-au siste-


matizat datele culese cu privire la timpul zilnic petrecut în faţa televizorului,
rezultând (Tabelul 3.1):
Tabelul 3.1
Timp (min.) Număr de persoane xi xi • ni
(frecvenţe) ni
Până la 30 47 15 705
30-60 51 45 2295
60-90 76 75 5700
90-120 24 105 2520
120 şi peste 2 135 270
Total 200 – 11490
CAPITOLUL 3

r
¦ xini
i =1 11490
x= r
= = 57,45 minute
200
¦ ni
i =1

Asupra mediei aritmetice sunt de făcut câteva observaţii şi de


subliniat câteva proprietăţi:

a) Pentru un şir de valori constante, media este egală cu constanta;


b) Media are întotdeauna valoarea cuprinsă între valoarea minimă
din serie (xmin) şi valoarea maximă (xmax);
c) Suma abaterilor valorilor individuale (xi) de la media lor ( x ) este
întotdeauna egală cu zero (adică distanţele faţă de centru se balansează, se
compensează perfect);
d) Dacă valorile individuale ale unei variabile sunt mărite sau
micşorate cu constanta „a“, atunci media se modifică şi ea, în acelaşi sens,
cu aceeaşi constantă „a“;
e) Dacă valorile individuale ale unei variabile sunt modificate de h
ori, media se modifică şi ea de h ori;

Din aceste două proprietăţi, d) şi e), rezultă formula de calcul


simplificat al mediei aritmetice, pentru valori reduse cu constanta „a“ şi de h
§ x −a ·
ori ¨ x ’i = i , i = 1, n ¸ :
© h ¹
n n x −a

¦ xi ¦ i
x = i =1 ⋅ h + a = i =1 h ⋅ h + a (3.3)
n n
iar pentru o serie de distribuţie de frecvenţe:
r r x −a

¦ xini ¦ i ni
x = i =1 r
⋅ h + a = i =1 h
r
⋅h +a (3.4)
¦ ni ¦ ni
i =1 i =1

EXEMPLUL 3.3: Pe baza datelor din Tabelul 3.1 putem alege a=75,
h=30 şi atunci:
STATISTICĂ ECONOMICĂ

Tabelul 3.2
Timp (min.) Frecvenţe ni xi xi – a x i’ ⋅ n i
x i’ =
h
< 30 47 15 -2 - 94
30-60 51 45 -1 - 51
60-90 76 60 0 0
90-120 24 105 1 24
120 şi peste 2 135 2 4
Total 200 – – -117
r

¦ xini
i =1 − 117
x= r
⋅h +a = ⋅ 30 + 75 = 57,45 minute
200
¦ ni
i =1

f) Într-o serie de distribuţie de frecvenţe, dacă frecvenţele sunt


modificate de „c“ ori, media rămâne neschimbată.
Dacă „c“ reprezintă volumul total al colectivităţii §¨ n = ¦ n i ·¸ ,
r

© i =1 ¹
ni ni
frecvenţele sunt chiar frecvenţele relative n *i = , i = 1, r şi rezultă,
c n
deci:
r
*
¦ xi ⋅ ni
i =1
x= (3.5)
1
sau, dacă frecvenţele relative au fost exprimate în procente:
r
*%
¦ xi ⋅ ni
i =1
x= (3.6)
100

g) Dacă o serie statistică este alcătuită din mai multe serii


componente, pentru care s-au calculat medii parţiale x j , j = 1, m , atunci( )
media întregii serii poate fi calculată ca o medie aritmetică ponderată din
mediile parţiale:
m
¦ x jn j
j=1
x= m
(3.7)
¦nj
j=1
CAPITOLUL 3

unde nj reprezintă volumul seriei componente j (j = 1, m )

EXEMPLUL 3.4: Într-o colectivitate de 60 de persoane, din care 24 de


sex feminin şi 36 de sex masculin, s-a determinat vârsta medie a persoanelor
de sex feminin x F = 38,1 ani şi vârsta medie a persoanelor de sex masculin
x M = 42,2 ani. Vârsta medie în întreaga colectivitate este:
x F n F + x M n M 24 ⋅ 38,1 + 36 ⋅ 42,2
x= = = 40,56 ani
nF + nM 60

h) Pentru două caracteristici statistice X şi Y, pentru care s-au


calculat mediile x şi, respectiv, y , media sumei valorilor individuale (xi +
yi) este întotdeauna egală cu suma mediilor:
x+y=x+y (3.8)

i) Pentru două caracteristici statistice X şi Y, pentru care s-au


calculat x şi y , media produsului (xi • yi) este egală cu produsul mediilor,
doar dacă cele două variabile sunt independente:

xy = x ⋅ y (3.9)

3.3.2. Media unei variabile de tip alternativ

În cazul în care variabila studiată este de tip alternativ (dihotomic),


atunci celor două variante de răspuns (afirmativ şi negativ) li se vor acorda,
convenţional, valorile numerice 1 şi, respectiv, 0. Pentru calculul mediei
aritmetice, datele le putem sistematiza astfel (Tabelul 3.3):
Tabelul 3.3
Varianta de răspuns xi Frecvenţe ni Frecvenţe relative n *i
Afirmativ 1 m m
=f
n
Negativ 0 n-m n−m
= 1− f
n
Total – n 1
STATISTICĂ ECONOMICĂ

2
¦ xini
i =1 1 ⋅ m + 0(n − m ) m
x= = = =f (3.10)
n n n

3.3.3. Indicatori de poziţie

Indicatorii medii de poziţie sunt: modul şi mediana. Mediana face


parte din indicatorii (mai generali) de poziţie, numiţi cuantile, alături de
cuartile, decile etc.

3.3.3.1 Valoarea modală

Modul (M0) reprezintă valoarea cel mai des întâlnită într-o serie
statistică sau cea care are cea mai mare frecvenţă de apariţie.
În cazul seriilor de distribuţie de frecvenţe pe intervale de variaţie,
determinarea modului presupune mai întâi, identificarea intervalului cu frec-
venţă maximă (int M0). Apoi, modul se poate determina conform relaţiei:

§ d1 ·
M 0 = x inf M 0 + ¨¨ ¸¸ h M 0 (3.11)
© d1 + d 2 ¹
unde: xinfMo reprezintă limita inferioară a intervalului modal;
h M0 reprezintă mărimea intervalului modal;
d1 reprezintă diferenţa dintre frecvenţa intervalului modal şi a celui
precedent;
d2 reprezintă diferenţa dintre frecvenţa intervalului modal şi a celui
următor.

EXEMPLUL 3.5: Pentru datele din tabelul 3.1. valoarea modală este:
M 0 = 60 +
(76 − 51) ⋅ 30 = 69,74 minute
(76 − 51) + (76 − 24)
O distribuţie cu un singur mod se numeşte unimodală (fig. 3.3a),
o distribuţie este bimodală dacă are două valori dominante (moduri) (fig.
3.3b) şi multimodală dacă are mai mult de două moduri (fig. 3.3c).
CAPITOLUL 3

y y y
Frecvenþe

Frecvenþe
Frecvenþe
M0 x o M01 M02 x o M01 M02 M03 x
o
a) b) c)

Fig. 3.3 - Distribuţie de frecvenţe: a) unimodală; b) bimodală; c) multimodală

3.3.3.2 Mediana

Mediana (Me) este un indicator mediu de poziţie care face parte din
categoria cuantilelor. Ea reprezintă valoarea/varianta din mijlocul unei serii
de date, serie în care observaţiile au fost ordonate crescător (sau descrescă-
tor).
Dacă datele au fost sistematizate într-o serie de distribuţie de frec-
venţe pe variante, pentru determinarea medianei vom calcula, mai întâi,
frecvenţele cumulate (Fci). Prima frecvenţă cumulată mai mare decât
(n+1)/2, adică mai mare decât locul medianei, ne indică varianta mediană.

EXEMPLUL 3.6: Pentru 80 de familii dintr-un bloc (n=80), s-au siste-


matizat datele privind numărul membrilor de familie, rezultând distribuţia
de frecvenţe (Tabelul 3.4):
Tabelul 3.4
Numărul membrilor de Număr de familii ni Frecvenţe cumulate Fci
familie
1 12 12
2 23 35
3 30 65
4 8 73
5 7 80
Total 80 –

Varianta „3 membrii de familie“ reprezintă varianta mediană, situată


în mijlocul distribuţiei;

Pentru o serie de repartiţie de frecvenţe pe intervale de variaţie


(date de tip continuu), mediana se va încadra în intervalul median, primul
STATISTICĂ ECONOMICĂ

interval cu frecvenţa cumulată mai mare decât locul (rangul, poziţia) media-
nei.

1§ r ·
¨ ¦ n i + 1¸ − FC( Me−1)
2 © i=1 ¹
Me = x inf Me + h Me (3.12)
n Me

unde:
x inf Me reprezintă limita inferioară a intervalului median;
h Me reprezintă mărimea intervalului median;
1§ r · n +1
¨ ¦ n i + 1¸ = reprezintă locul medianei în serie;
2 © i =1 ¹ 2
FC(Me - 1) reprezintă frecvenţa cumulată a intervalului anterior celui
median;
nMe reprezintă frecvenţa absolută a intervalului median.

EXEMPLUL 3.7: Pe baza datelor din Tabelul 3.1,


100,5 − 98
Me = 60 + 30 ≈ 61 minute
76

3.3.3.3. Relaţia dintre mod, mediană şi medie


Me

Pentru o distribuţie simetrică, media, mediana şi modul coincid (Fig.


3.3a). Dacă distribuţia este cu tendinţă de normalitate dar pozitiv înclinată,
spre valori mari (cu coada mai lungă a distribuţiei spre valorile mari) atunci
x > Me > M 0 (Fig. 3.4b); dacă distribuţia este moderat oblică şi negativ
încheiată, spre valorile mici (cu coada mai lungă a distribuţiei spre valorile
mici, atunci x < Me < M 0 (Fig. 3.4c). În general, pentru repartiţii moderat
asimetrice, există o relaţie empirică între cele trei valori şi anume:

(
M 0 − x ≈ 3 Me − x ) (3.13)
CAPITOLUL 3

y y y

o x=Me=Mo x o Mo Me x x o x Me Mo x

Fig. 3.4 - a) distribuţie simetrică; b) distribuţie cu asimetrie pozitivă;


c) distribuţie cu asimetrie negativă

3.3.3.4. Cuantilele

Cuantilele, categorie de indicatori de poziţie din care face parte şi


mediana, pot fi uşor înţelese intuitiv prin extinderea noţiunii de mediană şi
reprezintă valori ce împart seria în părţi egale.

y Astfel,
cuartilele (cuantile
Frecvenþe relative

de ordin patru) împart seria


în patru părţi egale, ele
delimitând câte
25% din observaţii. Ele sunt
în număr 25% 25% 25% 25% de trei: Q1, Q2, Q3
(fig. x 3.5); Q1 se numeşte
o Q1 Q2=Me Q3
cuartila inferioară, Q2 este
egală Fig. 3.5 - Cuartilele într-o serie de repartiţie întotdeauna cu
mediana, Q3 se numeşte
cuartila superioară.
Similar se pot determina cuantile de ordin superior, ca de pildă
decilele (care sunt D1, ...., D9 şi delimitează câte 10% din observaţii, D5 =
Me) ori percentile (delimitează câte 1% din observaţii).

3.3.4. Alte tipuri de medii

3.3.4.1. Media armonică

( )
Media armonică x h este o medie de calcul cu aplicaţii speciale,
care se determină, pentru o serie de date cantitative, ca valoarea inversă a
STATISTICĂ ECONOMICĂ

mediei aritmetice, calculată din inversele valorilor seriei. Aşadar media


armonică simplă este:
n
xh = n (3.14)
1
¦
i =1 x i
Pentru o serie de distribuţie de frecvenţe, media armonică ponderată
este:
r
¦ ni
i =1
xh = (3.15)
r 1
¦ ni
i =1 x i
1
xh = r (3.16)
1 *
¦ ni
i =1 x i
100
xh = r (3.17)
1 *%
¦ ni
i =1 x i

EXEMPLUL 3.8: Un conducător auto cumpără ulei de motor, la preţul


de 90.000 lei/litru, în valoare totală de 450.000 lei dintr-un magazin, iar din
alt magazin, la preţul de 120.000 lei/litru, în valoare totală de 480.000 lei.
Care a fost preţul mediu pe litru, pe care l-a plătit?

¦ vi ¦ vi 450000 + 480000
p= = = = 103333,3 lei/litru
¦ qi ¦ v1 1 1
i ⋅ 450000 + ⋅ 480000
pi 90000 120000

3.3.4.2. Media pătratică

Media pătratică x p este tot o medie de calcul cu aplicaţii speciale


şi reprezintă valoarea care, înlocuind termenii seriei, nu modifică suma
pătratelor lor. Aşadar:
n
2
¦ xi
i =1
xp = (3.18)
n
CAPITOLUL 3

Pentru o serie de distribuţie de frecvenţe, media pătratică ponderată


este:

r
2
¦ xi ni
i =1
xp = r
(3.19)
¦ ni
i =1

r
2 *
¦ xi ni
i =1
xp = (3.20)
1

r
2 *%
¦ xi ni
i =1
xp = (3.21)
100

3.3.4.3. Media geometrică

( )
Media geometrică x g se calculează ca rădăcina de ordinul n din
produsul celor n valori ale unei serii de date. Ea este deci, acea valoare care
înlocuind termenii seriei nu modifică produsul lor:
n
xg = n ∏ xi (3.22)
i =1
Pentru o serie de distribuţie de frecvenţe, media geometrică se
calculează ca:
r
¦ ni r
x g = i =1 ∏ x in i (3.23)
i =1

Între mediile de calcul prezentate există relaţia:


xh ≤ xg ≤ x ≤ xp (3.24)
STATISTICĂ ECONOMICĂ

3.4. INDICATORI AI VARIABILITĂŢII

În analiza unei serii statistice de date cantitative ne interesează, pe


lângă indicatorii tendinţei centrale şi indicatorii variabilităţii, ai împrăştierii
valorilor. Astfel, două serii statistice pot diferi prin tendinţa centrală (Fig 3.6a),
prin împrăştierea datelor (Fig. 3.6b) sau prin amândouă (Fig. 3.6c).

y y y

o a) x o x o x
b) c)
Fig. 3.6 - a) Distribuţii cu tendinţă centrală diferită; b) Distribuţii cu variabilitate
diferită; c) Distribuţii cu tendinţă centrală şi variabilitate diferite

3.4.1. Indicatori simpli ai variabilităţii

Aceşti indicatori măsoară împrăştierea valorilor individuale ale


seriei, una faţă de alta, ori faţă de o valoare tipică.

3.4.1.1. Amplitudinea variaţiei

Amplitudinea variaţiei (Ax) se calculează ca valoarea maximă


minus valoarea minimă a variabilei:
Ax = xmax — xmin (3.25)

În expresie relativă amplitudinea se calculează ca:

x max − x min
A%
x = 100 (3.26)
x

3.4.1.2. Abaterea intercuartilică şi semiintercuartilică

Un alt indicator simplu al variaţiei este abaterea intercuartilică:

A Q = Q 3 − Q1 (3.27)
CAPITOLUL 3

Indicatorul are unitatea de măsură a variabilei studiate şi uneori se


foloseşte şi valoarea sa înjumătăţită, indicator cunoscut ca abaterea
semiintercuartilică:

Q 3 − Q1
A ’Q = (3.28)
2

3.4.1.3. Abaterea individuală

Un alt indicator simplu al variaţiei este abaterea individuală:

di = xi − x (3.29)

care ne arată împrăştierea fiecărei valori de la nivelul mediu.

Abaterea individuală se poate calcula şi în expresie relativă:

xi − x
d i% = (3.30)
x

De asemenea, prezintă interes abaterea maximă pozitivă:

d +max = x max − x (3.31)

şi abaterea maximă negativă:

d −max = x min − x (3.32)

3.4.2. Indicatori sintetici ai variabilităţii

3.4.2.1. Abaterea medie liniară


O primă soluţie la care putem apela pentru a surprinde, printr-o
singură măsură, întreaga împrăştiere din serie este să calculăm media
abaterilor individuale. Dar, pentru că aceste abateri se compensează
STATISTICĂ ECONOMICĂ

reciproc, trebuie să le considerăm în valoare absolută. Obţinem, astfel,


( )
abaterea medie liniară d x calculată pentru o serie simplă:
n
¦ xi − x
i =1
dx = (3.33)
n
iar în cazul unei serii de distribuţie de frecvenţe:
r
¦ xi − x ni
i =1
dx =
r
(3.34)
¦ ni
i =1
r
¦ x i − x n *i%
i =1
dx = (3.35)
100
Abaterea medie liniară se exprimă în unitatea de măsură a
caracteristicii şi ne arată cu cât se abat, în medie, valorile individuale de la
media lor.

EXEMPLUL 3.9: Pe baza datelor din Exemplul 3.2, obţinem:


Tabelul 3.5
Timp (min.) Nr. de persoane (ni) xi xi − x ni
până la 30 47 15 1995,15
30-60 51 45 634,95
60-90 76 75 1333,8
90-120 24 105 1141,2
120 şi peste 2 135 155,1
Total 200 – 5260,2
x = 57,45 minute
r
¦ xi − x ni
i =1 5260,2
dx
r
= = 26,30 min
200
¦ ni
i =1

3.4.2.2. Dispersia

( )
Dispersia s 2x se calculează ca media aritmetică a pătratelor
abaterilor individuale ale valorilor de la tendinţa centrală (uzual de la
medie). Pentru o serie simplă, formula dispersiei este:
CAPITOLUL 3

∑ (x i − x )
n 2

i =1
s 2x = (3.36)
n
iar pentru o serie de distribuţie de frecvenţe:
¦ (x i − x ) n i
r 2

i =1
s 2x = (3.37)
r
¦ ni
i =1
sau, pe baza frecvenţelor relative:
∑ (x i − x ) n *i%
r 2

i=1
s 2x = (3.38)
100

EXEMPLUL 3.10. Pe baza datelor din exemplul nr. 3.2, obţinem


Tabelul 3.6
Timp (min.) Nr. de persoane (ni) xi
(x i − x )2 ni
până la 30 47 15 84694,12
30-60 51 45 7905,13
60-90 76 75 23408,19
90-120 24 105 54264,06
120 şi peste 2 135 12028,00
Total 200 – 182299,50

¦ (x i − x ) n i
r 2

i =1 182299,5
s 2x = = = 911,4975
r 200
¦ ni
i =1
Se cuvine să facem şi asupra dispersiei câteva observaţii şi să
remarcăm câteva din proprietăţile sale:
a) Pentru un şir de valori constante, dispersia este nulă;
( )
b) Dispersia calculată faţă de medie s 2x este mai mică decât orice
altă dispersie calculată faţă de o valoare “a”, cu pătratul distanţei dintre
medie şi constanta a:
s 2x = s a2 − (x − a )
2
(3.39)
c) Dacă valorile variabilei statistice studiate sunt modificate
(micşorate sau mărite) cu constanta „a“, dispersia seriei rămâne
neschimbată;
STATISTICĂ ECONOMICĂ

d) Dacă valorile variabilei statistice studiate se modifică de h ori,


dispersia se modifică (în acelaşi sens) de h2 ori
Rezultă şi în calculul dispersiei că, dacă vom combina proprietăţile 2
şi 4, vom obţine formula de calcul simplificat al dispersiei, pentru o serie
simplă:
2
n § x −a ·
¦¨ i ¸
s 2x = i=1
© h ¹ 2
n
h − x−a ( )2 (3.40)
şi pentru o serie de distribuţie de frecvenţe:
2
r § xi − a ·
¦¨ ¸ ni
s 2x = i =1© h ¹
r
(
h2 − x − a )2 (3.41)
¦ ni
i =1
2
r§ x i − a · *%
¦¨ ¸ ni
s 2x = i=1
© h ¹
100
h2 − x − a ( )2 (3.42)

EXEMPLUL 3.11: Pe baza datelor prelucrate în exemplul 3.3, obţi-


nem:
Tabelul 3.7
Timp (min) Frecvenţe x −a
(x )
2 2
x ’i = i ’ 2 §x −a· x ’i ⋅ n i
ni h i =¨ i ¸
© h ¹
<30 47 -2 4 188
30-60 51 -1 1 51
60-90 76 0 0 0
90-120 24 1 1 24
120 şi peste 2 2 4 8
Total 200 – – 271

2
r § xi − a ·
¦¨ ¸ ni
s 2x = i =1© h ¹
r
(
h2 − x − a )2 = 200
271
⋅ 30 2 − (57,45 − 75)2 = 911,4975
¦ ni
i =1
e) Dispersia se poate calcula şi pe baza relaţiei:
CAPITOLUL 3

2
n n  n 
∑ x i2 ∑ x i2  ∑ xi 
i =1 2 i =1  
s 2x = −x = −  i=1  (3.43)
n n n
 
 
 
iar pentru o serie de distribuţie de frecvenţe:
2
r r § r ·
¦ x i2 n i ¦ x i2 n i ¨ ¦ xini ¸
2 ¨ ¸
s 2x = i=1 − x = i=1 − ¨ i=1 ¸ (3.44)
r r r
¦ ni ¦ ni ¨ ¦ ni ¸
¨ ¸
i =1 i =1 © i=1 ¹
2
r r § r ·
¦ x i2 n *i% ¦ x i2 n *i% ¨ ¦ x i n *i% ¸
2 ¨ ¸
s 2x = i=1 − x = i=1 − ¨ i=1 ¸ (3.45)
100 100 100
¨ ¸
¨ ¸
© ¹
f) Dacă o serie este compusă din m serii componente (grupuri),
fiecare serie componentă fiind de volum nj, j = 1, m , atunci se pot calcula
mediile seriilor componente, x j , j = 1, m şi dispersiile seriilor componente:

¦ (x i − x j )
nj
2

i =1
s 2x = , j = 1, m (3.46)
j nj
Dispersia generală a colectivităţii poate să fie scrisă în funcţie de dis-
persiile seriilor componente (grupurilor):
¦ (x j − x ) n j
m m 2
¦ s 2x j n j
j=1 j=1
s 2x = + (3.47)
m m
¦n j ¦nj
j=1 j=1
m
¦ s 2x j n j
j=1
Expresia: m
se numeşte media dispersiilor parţiale
¦nj
j=1

(grupurilor, seriilor componente) şi se notează cu s 2x .


STATISTICĂ ECONOMICĂ

m
¦ s 2x j n j
2 j=1
sx =
m
(3.48)
¦nj
j=1

¦ (x j − x ) n j
m 2

j=1
Expresia: m
sintetizează împrăştierea valorilor de la
¦nj
j=1
media generală, doar ca urmare a acţiunii factorului după care s-au alcătuit
grupurile, seriile componente. Această expresie se numeşte dispersia dintre
( )
grupe d 2x :

¦ (x j − x ) n j
m 2

j=1
d 2x = (3.49)
m
¦n j
j=1

Regula de adunare a dispersiilor este, deci:


2
s 2x = s x + d 2x (3.50)

( )
Putem spune că d 2x explică măsura în care factorul de grupare
determină variaţia variabilei studiate şi să calculăm coeficientul de
determinaţie:
d 2x
R2 = (3.51)
s 2x

sau, în expresie procentuală, gradul de determinaţie:


2 d 2x
R% = 100 (3.52)
s 2x

Evident, măsura în care alţi factori (din interiorul grupelor)


determină variaţia variabilei, este dată de coeficientul de nedeterminaţie:
2
sx
K2 = = 1− R2 (3.53)
s 2x
CAPITOLUL 3

sau gradul de nedeterminaţie:


2
2 sx 2
K% = 100 = 100 − R % (3.54)
s 2x

EXEMPLUL 3.12: O firmă ce comercializează produse cosmetice a realizat


într-o lună de vară, prin cele 30 de magazine de desfacere situate pe litoral,
o vânzare medie de 400 milioane lei pe magazin, cu o dispersie a vânzărilor
de 2500; iar prin cele 20 de magazine din zona montană, o vânzare medie de
200 milioane lei, cu o dispersie de 1600. Pentru a afla gradul în care zona de
amplasare a magazinelor determină variaţia vânzărilor, vom calcula:
x L ⋅ n L + x M ⋅ n M 30 ⋅ 400 + 20 ⋅ 200 16000
x= = = = 320 mil lei
nL + nM 50 50
2 s 2xL n L + s 2xM n M 2500 ⋅ 30 + 1600 ⋅ 20 107000
sx = = = = 2140
nL + nM 50 50

d 2x =
(x L − x )2 n L + (x M − x )2 n M = (400 − 320)2 30 + (200 − 320)2 20 =
nL + nM 50
480000
= = 9600
50
2
s 2x = s x + d 2x = 2140 + 9600 = 11740
Aşadar
2 d 2x 9600
R% = 100 = 100 = 81,77%
s 2x 11740

3.4.2.3. Dispersia unei variabile de tip alternativ

Pentru o variabilă de tip alternativ, sistematizată ca în tabelul 3.3,


dispersia este:

s f2 = f (1 − f ) (3.55)

3.4.2.4. Abaterea medie pătratică

În studiul variabilităţii datelor se foloseşte rădăcina pătrată a


dispersiei, indicator numit abaterea medie pătratică:
STATISTICĂ ECONOMICĂ

¦ (x i − x )
n 2

s x = s 2x = i =1 (3.56)
n
pentru o serie simplă, iar pentru o serie de distribuţie de frecvenţe:

¦ (x i − x ) n i
r 2

i =1
sx =
r
(3.57)
¦ ni
i =1

¦ (x i − x ) n *i%
r 2

sx = i =1 (3.58)
100

Abaterea medie pătratică (numită şi abatere tip, abatere


standard, deviaţie standard sau ecart tip) este calculată ca o medie
pătratică din abaterile termenilor seriei de la media lor. O regulă empirică ne
spune că, pentru serii de distribuţie de frecvenţe cu tendinţă de normalitate
(simetrice sau moderat asimetrice), abaterea medie liniară reprezintă
aproximativ patru cincimi din abaterea medie pătratică:

4
dx ≈ sx (3.59)
5

iar abaterea semiintercuartilică aproximativ două treimi din abaterea stan-


dard:
2
A ′Q ≈ sx (3.60)
3

EXEMPLUL 3.13 Pe baza datelor din Exemplul 3.2, obţinem:


s x = s 2x = 911,4975 = 30,19 minute
d x 26,30
= ≈ 0,87
sx 30,19

3.4.2.5. Coeficientul de variaţie

Pentru asigurarea comparabilităţii împrăştierii datelor se foloseşte


expresia relativă a variabilităţii, coeficientul de variaţie:
CAPITOLUL 3

s
v = x 100 (3.61)
x
Cu cât valoarea coeficientului de variaţie este mai mică, cu atât acest
lucru semnifică o omogenitate crescută a datelor.

EXEMPLUL 3.14. Pentru seriile de date:


A: 10; 11; 12; 13; 14; 15; 16
B: 60; 61; 62; 63; 64; 65; 66
sxA 2
vA = 100 = 100 = 15,4%
xA 13
sx B 2
vB = 100 = 100 = 3,2%
xB 63
Evident, variabilitatea relativă este mai scăzută în seria B.

3.4.2.6. Interpretarea abaterii medii pătratice

O regulă empirică, care se aplică distribuţiei normale simetrice sau


moderat asimetrice, ne spune că:
— aproximativ 68%din valori se situează în intervalul x ± σ x ;
— aproximativ 95% din valori se situează în intervalul x ± 2σ x ;
— aproximativ 99,8% din valori se situează în intervalul x ± 3σ x .
(fig. 3.7)
y
≈34%

≈34%
≈13,5%

≈13,5%

o ≈2,5% ≈2,5%
x-3σ x-2σ x-σ x x+σ x+2σ x+3σ x
Amplitudine

Figura 3.7 - Relaţia dintre amplitudine şi


abaterea medie pătratică
STATISTICĂ ECONOMICĂ

3.5. INDICATORI AI FORMEI DISTRIBUŢIEI

Forma unei distribuţii de frecvenţe se analizează, comparativ cu


distribuţia ideală, normală, prin: indicatori asimetrici (oblicităţii) şi
indicatori ai boltirii (excesului).

3.5.1. Indicatori ai asimetriei (oblicităţii)

Asimetria, în valoare absolută, se poate măsura cu indicatorii:

AS = x − M 0 (3.62)
sau
(
A S1 = 3 x − Me ) (3.63)

indicatori care au unitatea de măsură a variabilei studiate şi care sunt po-


zitivi sau negativi, în funcţie de tipul de asimetrie (coada mai lungă a dis-
tribuţiei spre valorile mari sau spre valorile mici).

Coeficientul de asimetrie (Pearson) este:

x − M0
C as = (3.64)
sx

coeficient care ia valori pozitive în cazul curbelor alungite spre dreapta


(asimetrie pozitivă) şi valori negative în cazul curbelor alungite spre stânga
(asimetrie negativă). Coeficientul de asimetrie poate să fie scris şi pe baza
relaţiei dintre medie şi mediană:

C as1 =
(
3 x − Me ) (3.65)
sx

EXEMPLUL 3.15. Pentru datele din Tabelul 3.2, prelucrate, obţinem:


x − M 0 57,45 − 69,74
C as = = = −0,407
sx 30,19
şi
CAPITOLUL 3

C as1 =
( =
)
3 x − Me 57,45 − 61
= −0,118
sx 30,19
ceea ce semnifică o asimetrie negativă moderată (coada mai lungă a distri-
buţiei înspre valorile mici).

Analiza oblicităţii (asimetriei) se poate face şi pe baza momentelor


centrate de ordin 3:

¦ (x i − x )
n 3

m 3 = i =1 (3.66)
n
sau, utilizând frecvenţe:

¦ (x i − x ) n i ¦ (x i − x ) n *i%
r 3 r 3

m 3 = i =1 = i =1 (3.67)
r 100
¦ ni
i =1
Coeficientul de asimetrie (Fisher) este:
m3 m 32
γ1 = = (3.68)
s 3x m 32
Coeficientul γ 1 va avea valoare mai mare decât zero în cazul
asimetriei pozitive, valoare mai mică decât zero în cazul asimetriei negative
şi va fi egal cu zero în cazul seriei perfect simetrice.

3.5.2. Indicatorii de poziţie şi forma distribuţiei

O măsură alternativă asimetriei poate să fie dată şi de:

ASQ=Q3+Q1-2Me (3.69)

dar, pentru a o exprima în coeficienţi adimensionali, o vom raporta la indi-


catorul de împrăştiere abaterea intercuartilică AQ (3.60) şi obţinem
coeficientul de asimetrie (Yule şi Kendall):

(Q 3 − Me) − (Me − Q1 ) Q 3 + Q1 − 2Me


C asq = = (3.70)
(Q 3 − Me) + (Me − Q1 ) Q 3 − Q1
STATISTICĂ ECONOMICĂ

Pe baza indicatorilor de poziţie se poate alcătui un rezumat al celor


cinci indicatori, care oferă informaţii privind tendinţa centrală, dar şi forma
distribuţiei studiate. Aceste cinci valori sunt:
— valoarea, minimă xmin (denumită, uneori, percentila 0);
— cuartila inferioară Q1 (delimitează cele mai mici 25% din valori);
— mediana Me (delimitează50% din valori);
— cuartila superioară Q3 (delimitează cele mai mari 25% din valori);
— valoarea maximă xmax (denumită, uneori, a 100-a percentilă).

Cele cinci valori se reprezintă grafic prin intermediul diagramei


Box-Plot (fig. 3.8). Pe grafic pot fi marcate şi media şi modul.

X m in Q1 Me Q3 X m ax
25% 25% 25% 25%

Fig. 3.8 - Diagrama Box-Plot

3.6. MĂRIMI RELATIVE

DEFINIŢIE: Mărimile relative reprezintă rezultatul comparării sub


formă de raport a doi indicatori statistici: un indicator comparat (raportat) şi
un indicator de bază de comparaţie (bază de raportare).

Forma generală a unei mărimi relative este:

x k
z= 10 (3.71)
y
unde: z reprezintă indicatorul relativ;
x reprezintă indicatorul comparat;
y reprezintă indicatorul bază de comparaţie;
CAPITOLUL 3

k reprezintă un număr întreg ce poate fi egal cu:


k=0 şi atunci exprimarea se face în coeficienţi;
k=2 şi atunci exprimarea se face în procente (%);
k=3, k=4, k=5 ,exprimarea se face în promile (0/00), respectiv
prodecimile (0/000) şi procentimile (0/0000).

3.6.1. Mărimi relative de structură

Mărimile relative de structură se calculează sub forma unui raport


între parte şi întreg, prezentând astfel structura colectivităţilor statistice
sistematizate atât după variabile cantitative cât şi după variabile calitative.
Mărimile relative de structură pot fi: greutăţi specifice (ponderi) şi frecvenţe
relative.
Greutatea specifică (ponderea) este:
xi
g ix = (3.72)
n
¦ xi
i =1

xi
g ix % = n
100 (3.73)
¦ xi
i =1

şi ne arată ponderea nivelului caracteristicii dintr-o unitate în nivelul total al


caracteristicii din colectivitatea statistică.
Dacă datele au fost sistematizate pe grupe/clase, atunci greutatea
specifică este:

ni
¦ x ij
j=1
g ix = (3.74)
r ni
¦ ¦ x ij
i =1 j=1

ni
¦ x ij
j=1
g ix % = 100 (3.75)
r ni
¦ ¦ x ij
i =1 j=1
STATISTICĂ ECONOMICĂ

EXEMPLUL 3.16: Pentru trei filiale ale unei firme s-au cules şi
sistematizat date privind producţia zilnică realizată de muncitori (Tabelul
3.8)
Tabelul 3.8
Judeţul/Filiala Număr de muncitori Producţia individuală (buc.)
0 1 2
Alba/A 4 120;130;120;90
Bacău/B 3 80;120;100;
Constanţa/C 6 140;70;90;100;110;120

Tabelul 3.9
Filiala Producţia pe Structura producţiei pe Structura
filială (buc.) filiale (%) colectivităţii de
muncitori (%)
0 1 2 3

A 460 33,09 30,77


B 300 21,58 23,08
C 630 45,33 46,15
Total 1390 100,00 100,00

Tot mărimi relative sunt şi frecvenţele relative.

3.6.2. Mărimi relative de coordonare

Mărimile relative de coordonare se calculează ca un raport între


două niveluri ale aceluiaşi indicator statistic, niveluri situate pe aceeaşi
treaptă de agregare: unitate, grupă, colectivitate statistică.
x
k ix j = i (3.76)
xj

Rezultatul ne arată de câte ori este mai mare (dacă rezultatul este
supraunitar), sau mai mic (dacă rezultatul este subunitar) nivelul variabilei
în unitatea (grupa, colectivitatea) i faţă de nivelul variabilei în unitatea
(grupa, colectivitatea) j.

Exprimarea rezultatului mărimii relative de coordonare (numită şi


raport de coordonare) se poate face şi în procente .
Reprezentarea grafică a mărimilor relative de coordonare se face
prin intermediul diagramei prin benzi, coloane ori suprafeţe.
CAPITOLUL 3

Pe baza datelor din Tabelul 3.8, col. 1 şi din Tabelul 3.9,


col.1,obtinem (vezi Tabelul 3.10):
Tabelul 3.10
Filiala Raport de coordonare
Pentru numărul de muncitori Pentru producţie
0 1 2

A 1,33 1,53
B 1,00 1,00
C 2,00 2,10

3.6.3. Mărimi relative de intensitate

Mărimile relative de intensitate au forma generală:


x
z= (3.77)
y

La nivelul întregului (alcătuit din unităţi, grupe etc.):


n n
¦x ¦ z⋅y n
i =1 i =1 y
Z=
n
=
n
= ¦ z ⋅gi (3.78)
i =1
¦y ¦y
i =1 i =1

Reprezentarea grafică a mărimilor relative de intensitate se face cu


ajutorul diagramelor prin coloane, prin benzi ori prin suprafeţe.

Pe baza datelor din Tabelul 3.8, col.1 şi Tabelul 3.9, col.1, putem
calcula producţia obţinută de un muncitor (bucăţi pe muncitor) (Tabelul
3.11):
Tabelul 3.11
Filiala Productivitatea muncii (buc./muncitor)
0 1
A 115
B 100
C 105
Total 106,92
STATISTICĂ ECONOMICĂ

3.6.4. Mărimi relative de dinamică

Mărimile relative de dinamică sunt folosite pentru analiza


evoluţiei în timp a fenomenelor social-economice.
x
i 1x 0i = 1i (3.79)
x 0i
x
i 1x 0 = 1i 100 (3.80)
x 0i
De remarcat că, la nivel totalizator (de întreg), calculăm indicii într-
una din variantele:
- ca medie aritmetică a indicilor individuali:
n n
¦ x1i n ¦ i1x 0i x 0i
I1Σx0 = i =1
= ¦ i1x 0i g 0xi = i =1
(3.81)
n n
i=1
¦ x 0i ¦ x 0i
i =1 i =1
- ca medie armonică a indicilor individuali:
n
¦ x1i
1
I1Σx0 = = i =1
(3.82)
n 1 n 1
¦ x g1xi ¦ x x1xi
i =1 i1 0i i =1 i1 0i

Evident, pentru o exprimare procentuală, rezultatele se înmulţesc cu 100.


Reprezentarea grafică a mărimilor relative de dinamică se poate face
prin diagrama prin coloane, benzi, ori suprafeţe.

3.6.5. Mărimi relative ale planului (prevederilor)

Mărimile relative ale planului sunt:

— mărimea relativă (indicele) sarcinii programate:

x pi
i px 0i = (3.83)
x 0i
CAPITOLUL 3

x pi
i px %0i = 100 (3.84)
x 0i

— mărimea relativă (indicele) realizării prevederilor (programului):

x 1i
i 1x pi = (3.85)
x pi

x 1i
i 1x %pi = 100 (3.86)
x pi

Se observa ca:
x pi x 1i x 1i
i px %0i ⋅ i 1x %
pi = ⋅ = = i 1x 0i (3.87)
x 0i x pi x 0i

Reprezentarea grafică a mărimilor relative ale prevederilor se face cu


ajutorul diagramei prin coloane, benzi ori suprafeţe.
STATISTICĂ ECONOMICĂ

Întrebări recapitulative

1. Ce este indicatorul statistic?


2. Care sunt funcţiile indicatorilor statistici?
3. Ce sunt indicatorii statistici? Cum se obţin ei?
4. Ce sunt indicatorii tendinţei centrale?
5. Care sunt principalele tipuri de indicatori ai tendinţei centrale?
6. Media aritmetică: definiţie, proprietăţi, observaţii, utilizări.
7. Care sunt indicatorii de poziţie?
8. Modul: definiţie, calcul, utilizări, proprietăţi.
9. Mediana: definiţie, calcul, utilizări, proprietăţi
10. Cum se determină mediana pentru o serie de distribuţie pe variante?
Dar pe intervale de variaţie?
11. Analiza comparativă a celor trei indicatori ai tendinţei centrale.
12. Ce sunt cuantilele?
13. Care este semnificaţia cuantilelor de ordin 4?
14. Media armonică: definiţie, calcul, utilizări, proprietăţi.
15. Media pătratică: definiţie, calcul, utilizări, proprietăţi.
16. Media geometrică: definiţie, calcul, utilizări, proprietăţi.
17. Ce se înţelege prin variabilitatea datelor statistice?
18. Necesitatea măsurării variabilităţii.
19. Ce este amplitudinea datelor? Calcul şi interpretare.
20. Care sunt indicatorii simpli ai variabilităţii?
21. Ce reprezintă abaterea medie liniară?
22. Dispersia: determinare, observaţii, proprietăţi.
23. Cum se determină media şi dispersia unei variabile alternative?
24. Cum se determină abaterea medie pătratică? Semnificaţie, utilizări.
25. Coeficientul de variaţie: calcul, utilizări.
26. Cum se compune dispersia pentru o serie structurată în serii compo-
nente?
27. Cum se interpretează abaterea medie pătreatică folosind regula
empirică?
28. Ce reprezintă oblicitatea unei repartiţii?
29. Cum se analizează asimetria (oblicitatea) unei repartiţii?
30. Cum se analizează boltirea/aplatizarea unei repartiţii?
31. Cum se poate studia forma distribuţiei folosind indicatorii de poziţie?
32. Cum se construieşte şi interpretează diagrama Box-Plot?
33. Cum se obţin indicatorii statistici derivaţi?
34. Ce sunt mărimile relative?
CAPITOLUL 3

35. Mărimile relative de structură: definiţie, utilizare, reprezentare gra-


fică, exemple.
36. Mărimile relative de coordonare: definiţie, utilizare, reprezentare gra-
fică, exemple.
37. Mărimile relative de intensitate: definiţie, utilizare, reprezentare gra-
fică, exemple.
38. Mărimile relative de dinamică: definiţie, utilizare, reprezentare gra-
fică, exemple.
39. Mărimile relative ale planului: definiţie, utilizare, reprezentare gra-
fică, exemple.
40. Care sunt cele trei proprietăţi pe care urmărim să le analizăm şi să le
descriem în analiza unui set de date numerice?
CAPITOLUL 2

CAPITOLUL 2

SISTEMATIZAREA ŞI PREZENTAREA
DATELOR STATISTICE

Consideraţii preliminare
În acest capitol, vom lua în consideraţie primul pas în prelucrarea
datelor, cel al sistematizării, prezentării şi reprezentării datelor, într-o
manieră în care să le facă mai uşor de analizat şi interpretat. Vom avea,
astfel, beneficii importante pe linia descoperirii caracterelor esenţiale ale
fenomenelor studiate şi “perierii” lor de aspectele întâmplătoare.

Termeni cheie

cartodiagramă frecvenţă redusă


cartogramă frecvenţă relativă
clasificare funcţie de repartiţie
corelogramă grafic statistic
cronogramă grupare
curbă cumulativă a frecvenţelor histogramă
diagramă de structură poligon al frecvenţelor
diagramă prin coloane serie cronologică
distribuţie de probabilitate serie de distribuţie de frecvenţe
distribuţie heterogradă serie statistică
distribuţie homogradă serie teritorială
distribuţie teoretică sistematizare
frecvenţă absolută tabel statistic
frecvenţă cumulată
STATISTICĂ ECONOMICĂ

Noţiuni teoretice

2.1. INTRODUCERE

După ce datele statistice au fost colectate din surse de date publicate,


din observări totale sau din observări parţiale – ele trebuie organizate, în
scopul de a avea o formă care să permită prelucrarea lor statistică diversă.
Cum observarea parţială – în mod special eşantionarea probabilistă –
salvează timp, resurse de muncă şi resurse băneşti, vom trata îndeosebi
problema sistematizării datelor provenite din eşantioane. Cu toate acestea,
trebuie să înţelegem că, indiferent dacă lucrăm cu date referitoare la
colectivităţi parţiale ori la colectivităţi totale, atunci când seturile de date
conţin în jur de 30 de observaţii sau peste acest număr (date de masă), cel
mai bun mod de a le examina este să le sistematizăm şi apoi să le prezentăm
în tabele şi grafice. Putem atunci, să extragem cele mai importante trăsături,
prin analiza seriilor şi graficelor statistice.

2.2. GRUPAREA ŞI CLASIFICAREA DATELOR STATISTICE

După cum am văzut, în etapa de observare statistică se culeg date


uni, bi sau multivariate, adică pentru fiecare unitate statistică se culeg date
privitoare la o singură caracteristică sau la mai multe caracteristici
considerate.

2.2.1. Principiile grupării/clasificării

Sistematizarea datelor se realizează prin gruparea şi clasificarea


datelor statistice, adică prin împărţirea lor în grupe/clase omogene, după
unul sau mai multe criterii de grupare/clasificare.
O grupă/clasă este omogenă dacă unităţile din interiorul ei tind să se
asemene cât mai mult între ele din punctul de vedere al criteriului utilizat,
adică dacă între unităţile din aceeaşi grupă/clasă există variaţii cât mai mici,
date de prezenţa factorilor aleatori, întâmplători.
CAPITOLUL 2

Criteriul de grupare/clasificare reprezintă variabila (caracteristica)


statistică în funcţie de care sistematizăm datele. După cum avem de-a face
cu un singur criteriu sau mai multe criterii de grupare/clasificare, vom vorbi
de grupări/clasificări simple sau combinate.

Dacă sistematizarea datelor se face după o variabilă nenumerică,


procesul se numeşte clasificare.

Gruparea reprezintă sistematizarea datelor după o variabilă


(caracteristică) numerică. În funcţie de tipul acesteia, gruparea se poate face
după o variabilă discretă sau continuă.

2.2.2. Gruparea pe intervale de variaţie

Intervalul de variaţie reprezintă un şir de valori ale variabilei


studiate, delimitat de intervalele vecine prin limita inferioară şi limita
superioară. Intervalele de variaţie pot fi de mărime egală sau neegală.

• Pentru gruparea pe intervale de variaţie se recomandă utilizarea


unui număr moderat de grupe. Deseori, un număr de 4 până la 10 grupe
este arbitrar recomandat, dar felul datelor poate necesita un alt număr de
grupe.
Pentru alegerea numărului de intervale de grupare (r) se poate utiliza
şi relaţia lui Sturges (în ipoteza repartiţiei aproximativ normale a unităţilor
după variabila studiată):
r = 1 + 3,322 log10 n (2.1.)
unde n reprezintă numărul total de unităţi din colectivitate (volumul colec-
tivităţii).
• Pentru sistematizarea datelor pe intervale de variaţie se recomandă
utilizarea intervalelor de mărime egală, cu excepţia cazurilor în care
analiza datelor, descoperirea unor tipuri calitative în colectivitate, necesită
folosirea unor intervale de mărime neegală.
• Mărimea intervalului (h) se recomandă a se rotunji la o valoare
convenabilă.
• Punctul de plecare în alcătuirea intervalelor de grupare se alege,
convenabil, 0 sau un număr întreg puţin mai mic decât valoarea minimă din
setul de date.
STATISTICĂ ECONOMICĂ

• Limitele intervalelor de grupare trebuie stabilite cu acurateţe,


respectând precizia datelor (cu acelaşi număr de zecimale, dacă valorile sunt
de această manieră).
• Limitele intervalelor de grupare se stabilesc exact, fără
ambiguităţi sau suprapunere, astfel încât fiecare unitate să poată fi
încadrată într-o singură clasă.

Aşadar, pentru sistematizarea datelor pe intervale egale de grupare se


prezintă următorii paşi:
1. Se stabileşte amplitudinea variaţiei caracteristicii:
A x = x max − x min (2.2.)
2. Se stabileşte numărul de grupe, r, în care vor fi sistematizate
datele
3. Se calculează mărimea aproximativă a intervalelor de grupare:
A x − x min
h ≈ = max (2.3.)
r r
4. Se stabilesc intervalele de grupare pornind de la xmin (sau de la o
valoare puţin mai mică):
xmin  xmin+h
xmin+h  xmin+2h
.....................................................
xmin + (r — 1)h  xmin + r ⋅ h

Se obţin, astfel, r grupe, pentru care vom stabili frecvenţele prin


numărarea unităţilor care se încadrează în fiecare grupă. Dacă există grupe
cu frecvenţă nulă, ori multe grupe cu o singură observaţie, poate fi necesară
revizuirea mărimii intervalelor sau a numărului de intervale.

2.3. SERII STATISTICE

Rezultatul sistematizării datelor prin grupare/clasificare se constituie


sub forma seriilor statistice.

DEFINIŢIE: Seria statistică este prezentarea ordonată a datelor refe-


ritoare la manifestările unui fenomen colectiv sub forma a două şiruri de
CAPITOLUL 2

date: unul priveşte variabila şi modul cum a fost sistematizată, iar al doilea
frecvenţa de apariţie sau nivelul unei variabile în raport cu primul şir.

2.3.1. Serii de distribuţie de frecvenţe pentru o variabilă


atributivă

A. Vom începe, acum, cu rezultatul sistematizării pe intervale de


grupare, pentru o variabilă numerică continuă, pentru care se obţine o serie
de distribuţie (repartiţie) de frecvenţe pe intervale, sub forma (Tabelul
2.1).

Tabelul 2.1.
Distribuţie de frecvenţe pe intervale de variaţie
Intervale de variaţie a variabilei (X) Numărul de unităţi statistice (frecvenţe)
x1inf – x1sup n1
x2inf – x2sup n2
. .
xinf – xisup ni
. .
. .
xrinf – xrsup nr
r
Total n = ∑ ni
i =1

OBSERVAŢII:
• dacă intervalele sunt cu variaţie discontinuă, atunci:
x(i+1)inf = xisup + ∆ (2.4)
unde ∆ este o unitate de discretizare
• dacă intervalele sunt cu variaţie continuă, adică:
x(i+1)inf = xisup (2.5)
atunci trebuie stabilit în ce interval se cuprinde valoarea de graniţă;
• mărimea intervalului de grupare se calculează:
hi = xisup – xiinf , i = i,r (2.6)
dacă intervalele sunt cu variaţie continuă, sau:
hi = x(i+1)inf – xi inf, i = i,r (2.7)
sau
hi = xisup – x(i–1)sup, i = 2,r (2.8)
indiferent dacă intervalele sunt cu variaţie continuă sau discontinuă.
STATISTICĂ ECONOMICĂ

• pentru prelucrarea ulterioară a datelor se consideră că fiecare din cele ni


unităţi dintr-o grupă au valoarea variabilei egală cu centrul de interval (xi).
h
x i = x i inf + i (2.9)
2
sau, dacă intervalele sunt cu variaţie continuă:
x i inf + x i sup
xi = (2.10)
2

Pe lângă frecvenţa absolută (ni) care indică numărul total de unităţi


statistice care au valoarea variabilei situată într-un interval (xiinf – xisup), se
poate calcula şi frecvenţa relativă a grupei, care indică proporţia din nu-
mărul total de unităţi, care se încadrează în grupă:
n n
n *i = r i = i (2.11)
n
∑ ni
i =1
unde n reprezintă volumul total al colectivităţii. Exprimată în procente,
frecvenţa relativă a grupei i este:
n n
n *i% = r i 100 = i 100 (2.12)
n
∑ ni
i =1
Dacă utilizăm frecvenţele relative, obţinem o serie de distribuţie
(repartiţie) de frecvenţe relative (Tabelul 2.2)

Tabelul 2.2.
Serie de distribuţie de frecvenţe relative
Intervale de variaţie a variabilei Frecvenţe relative
X1inf – x1sup n 1*
x2inf – x2sup
. n *2
. .
. .
xi inf – xi sup n *i
.
.
.
.
xrinf – xrsup *
nr
r
Total 1,00 = ∑ n *i
i =1
CAPITOLUL 2

Frecvenţele absolute cumulate (Fci) reprezintă numărul unităţilor


statistice care au valoarea variabilei mai mică (sau, eventual, egală) cu
limita superioară a grupei (deci, au valoarea variabilei mai mare decât x1inf şi
mai mică decât xisup).
i
Fci = ∑ n k (2.13)
k =1
Similar cu frecvenţele cumulate crescător, se pot calcula şi frecvenţe
cumulate descrescător:
r
Fdi = ∑ n k (2.14)
k =i
r
Fdi* = ∑ n *k (2.15)
k =i

EXEMPLUL 2.1 În urma sistematizării datelor cu privire la salariul


net încasat de o colectivitate de muncitori, s-a obţinut următoarea serie de
repartiţie (Tabelul 2.3):

Tabelul 2.3.
Distribuţia salariaţilor după salariul net
Număr de Frecvenţe Frecvenţe
Salariul net Frecvenţe
salariaţi absolute relative
(mii lei) relative n *i cumulate (Fci)
(ni) cumulate ( Fci* )
1,4 – 1,6 5 0,10 5 0,10
1,6 – 1,8 8 0,16 13 0,26
1,8 – 2,0 4 0,08 17 0,34
2,0 – 2,2 17 0,34 34 0,68
2,2 – 2,4 8 0,16 42 0,84
2,4 – 2,6 3 0,06 45 0,90
2,6 – 2,8 2 0,04 47 0,94
2,8 – 3,0 2 0,04 49 0,98
3,0 – 3,2 1 0,02 50 1,00
Total 50 1,00 — —

Dacă intervalele sunt neegale, pentru asigurarea comparabilităţii


datelor se pot calcula frecvenţe reduse la un interval etalon (standard).
Frecvenţa redusă (corectată) a unui interval ( n icor ) se calculează prin
raportarea frecvenţei absolute la un factor de corecţie (l) ce reprezintă
numărul intervalelor etalon ce încap într-un interval de grupare:
STATISTICĂ ECONOMICĂ

hi
l= (2.16)
h et
ni
n icor = (2.17)
l
unde hi reprezintă mărimea intervalului i, i = 1, r
het reprezintă mărimea intervalului etalon (de regulă mărimea celui
mai mic interval de grupare).

B. În cazul în care variabila de grupare este discretă şi gruparea se


efectuează pe variante, seria de distribuţie de frecvenţe este discretă sau
pe variante.

EXEMPLUL 2.2: Un exemplu de distribuţie de frecvenţe după o va-


riabilă discretă este distribuţia divorţurilor din România în anul 2000 după
numărul de copii minori rămaşi prin desfacerea căsătoriei (Tabelul 2.4),
pentru care s-au calculat şi frecvenţele relative (col.2) şi frecvenţele cumu-
late (col. 3 şi col. 4):

Tabelul 2.4.
Distribuţia divorţurilor după numărul de copii minori
rămaşi prin desfacerea căsătoriei, în România, anul 2000
Număr de Număr de Frecvenţe Frecvenţe Frecvenţe
copii minori divorţuri *
relative ( n i ) absolute relative
(ni) cumulate cumulate
(Fci) ( Fci* )
0 1 2 3 4
0 18.614 0,465 18.614 0,465
1 14.518 0,363 33.132 0,828
2 5.351 0,134 38.483 0,962
3 1.062 0,027 39.545 0,989
4 317 0,008 39.862 0,997
5 şi peste 5 123 0,003 39.985 1,000
Total 39.985 1,000 — —

Seriile de distribuţie de frecvenţe alcătuite după o variabilă


cantitativă (numerică), adică cele descrise de paragrafele A şi B, poartă
numele de distribuţii heterograde.
CAPITOLUL 2

C. O distincţie aparte trebuie făcută pentru seriile de distribuţie de


frecvenţe alcătuite după o variabilă calitativă (nenumerică) ce poartă
numele de distribuţii homograde.

EXEMPLUL 2.3: O distribuţie homogradă, după o variabilă nenume-


rică măsurată pe o scală nominală este distribuţia contractelor de asigurare
pe viaţă în România, în anul 1999, pe principalele companii (vezi Tabelul
2.5, unde se prezintă ca o distribuţie de frecvenţe relative):

Tabelul 2.5
Distribuţia contractelor de asigurare pe viaţă în România, anul 1999, pe
principalele companii
Procent din numărul total de
Compania
contracte încheiate (%)
Nederlanden 45,70
ASIROM S.A. 27,41
SARA MERKUR 12,16
UNITA 8,30
AIG Life 1,93
Garanta 1,35
Omniasig 0,96
METROPOL S.A. 0,92
Interamerican 0,57
ARDAF 0,25
Altele 0,45
Total 100,0

D. Seriile statistice de distribuţie de frecvenţe bidimensionale


sunt cele formate prin considerarea concomitentă a două variabile (X şi Y).
Forma unei astfel de serii de distribuţie bidimensională este (Tabelul 2.6)
STATISTICĂ ECONOMICĂ

Tabelul 2.6
Distribuţia de frecvenţe bidimensională
Intervale/variante
pentru Y
y1 y2 ... yj ... ym Total
Intervale/
Variante pentru X
x1 n11 n12 ... n1j ... n1m n1.
x2 n21 n22 ... n2j ... n2m n2.
. ................... ...
.
xi ni1 ni2 ... nij ... nim ni.
. .................... ...
.
xr nr1 nr2 ... nrj .... nrm nr.
Total n.1 n.2 .... n.j ... n.m n..

În acest tabel trebuie să remarcăm că:


m
n i⋅ = ∑ n ij (2.18)
j=1
r
n ⋅ j = ∑ n ij (2.19)
i =1
r m r m
n.. = ∑ n i. = ∑ n. j = ∑ ∑ n ij (2.20)
i =1 j=1 i =1 j=1

O situaţie aparte o întâlnim în cazul variabilelor alternative, când


datele se pot prezenta într-un tabel de asociere de forma (Tabelul 2.7):

Tabelul 2.7
Tabel de asociere
Clasele lui X Clasele lui Y Total
Y(y1) non Y(y2)
X(x1) n11 n12 n1. = n11 + n12
non X(x2) n21 n22 n2. = n21 + n22
Total n.1 = n11 + n21 n.2 = n12 + n22 n.. = n11 + n12+n21+n22

2.3.2. Serii cronologice

Seriile cronologice reprezintă seriile statistice ce se obţin prin


sistematizarea datelor după o variabilă de timp. O serie cronologică este
CAPITOLUL 2

alcătuită din două şiruri de date: unul cu privire la unităţile de timp, care pot
fi momente sau intervale de timp, iar cel de-al doilea cu privire la frecvenţa
de apariţie sau nivelul unui fenomen, înregistrat în aceste unităţi de timp.
Dacă unităţile de timp sunt momente, atunci seria cronologică se numeşte
de stoc (de momente), iar dacă unităţile de timp sunt intervale (perioade),
seria cronologică se numeşte de flux (de intervale). O serie cronologică se
notează:
1 2 ... t ... n  t 
  sau  , t = 1, n.
 y1 y 2 ... y t ... y n  y t 
EXEMPLUL 2.4. Evoluţia vânzărilor cotidianului naţional Libertatea
pentru perioada ianuarie 2001 – februarie 2002 (Tabelul 2.8).

Tabelul 2.8
Evoluţia vânzărilor cotidianului naţional Libertatea
Vânzările
Anul
(mii exemplare)
ianuarie 2001 104,0
februarie 2001 103,8
martie 2001 104,5
aprilie 2001 99,2
mai 2001 124,0
iunie 2001 127,8
iulie 2001 108,7
august 2001 110,0
septembrie 2001 116,7
octombrie 2001 123,8
noiembrie 2001 148,0
decembrie 2001 133,0
ianuarie 2002 139,0
februarie 2001 143,0

2.3.3. Serii teritoriale

Dacă variabila pentru care se sistematizează datele este o variabilă


de spaţiu (teritorială), adică elementul ce diferenţiază manifestările
fenomenului analizat este locul unde acestea s-au produs, atunci rezultatul
este o serie teritorială (de spaţiu).
STATISTICĂ ECONOMICĂ

EXEMPLUL 2.5: Rata şomajului în anul 1997 pentru 11 ţări din


Europa a fost (Tabelul 2.9):
Tabelul 2.9
Rata şomajului
Ţara Rata şomajului (%)
Austria 7,1
Belgia 13,2
Bulgaria 13,7
Elveţia 5,2
Franţa 12,4
Germania 12,5
Italia 12,3
Olanda 5,5
România 10,4
Spania 20,8
Ungaria 10,4

2.4. PREZENTAREA DATELOR ÎN TABELE STATISTICE

Tabelul statistic constituie o modalitate de prezentare a datelor


statistice şi este format dintr-o reţea de linii paralele, orizontale şi verticale
în care sunt încadrate datele statistice. Alături de funcţia de prezentare a
rezultatelor prelucrării primare şi secundare a datelor statistice, tabelele
statistice au şi funcţia sistematizare a datelor în vederea prelucrării lor.
Tabelele statistice conţin una sau mai multe serii statistice.

Tabelul statistic trebuie să fie elaborat după anumite reguli privind


elementele de conţinut şi de formă.

În funcţie de rolul lor în analiza şi prelucrarea datelor statistice,


tabelele statistice pot fi: simple (descriptive); de prelucrare; pe grupe
(obţinute în urma sistematizării datelor); combinate; de asociere.
CAPITOLUL 2

2.5. METODE GRAFICE DE DESCRIERE A DATELOR STATISTICE

Reprezentarea grafică este o metodă de descriere a datelor prin


intermediul figurilor geometrice ori a figurilor naturale.
Graficul este o imagine spaţială, cu caracter convenţional, care prin
diferite mijloace plastice de prezentare scoate în evidenţă ceea ce este
caracteristic şi esenţial în evoluţia fenomenelor, în schimbările structurale,
în ceea ce priveşte proporţiile şi corelaţiile cu alte fenomene de aceeaşi
natură sau calitativ diferite1.
• Cel mai adesea, graficele statistice sunt reprezentate într-un sistem
de coordonate rectangulare (ortogonale), adică în raport şi proporţional
cu două axe perpendiculare, dar se pot întâlni şi grafice reprezentate într-un
sistem de coordonate polare.
y

yi M
M
r

α
o xi x o x
a) b)

Fig. 2.1 - Reprezentare în coordonate: a) rectangulare b) polare

• Reţeaua graficului este alcătuită dintr-un sistem de linii verticale


şi orizontale sau de cercuri concentrice care ajută la construirea graficului.
• Scara de reprezentare stabileşte corespondenţa dintre o unitate de
măsură aleasă pe grafic şi unitatea relativă la X (sau Y). Scările de repre-
zentare pot fi aritmetice, logaritmice sau semilogaritmice.
• Legenda graficului are rolul de a explica diversele simboluri,
haşuri, culori folosite pentru a facilita înţelegerea reprezentării construite.

1
D. Haşigan, I. Marinescu - Grafice şi elemente de calcul grafic, Ed. Ştiinţifică, Bucu-
reşti, 1968.
STATISTICĂ ECONOMICĂ

• În afara acestor elemente specifice reprezentărilor grafice, trebuie


să subliniem necesitatea prezenţei unor elemente comune şi tabelelor
statistice: titlul, sursa datelor, numerotarea, note explicative etc.

Pentru a reprezenta corect proporţiile şi rapoartele care se


înregistrează între datele statistice prin intermediul graficelor, utilizăm
figuri geometrice, hărţi, diagrame figurale etc.
Principalele tipuri de grafice vor fi prezentate, în continuare, în
funcţie de felul seriilor statistice în care au fost sistematizate datele.

2.5.1. Histograma şi poligonul frecvenţelor

Pentru o serie de distribuţie de frecvenţe după o variabilă numerică


continuă (pe intervale), reprezentările grafice care ne permit să vizualizăm
distribuţia de frecvenţe sunt histograma şi poligonul frecvenţelor.
EXEMPLUL 2.6: Pentru seria de repartiţie de frecvenţe absolute pre-
zentată în tabelul 2.3, histograma este (fig. 2.2.):
y
40
35
30 Scara de reprezentare
Frecvenþe

25 Ox: 0,7 cm = 0,2 mil. lei


20 Oy: 0,5 cm = 2 persoane
15
10
5
0

1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 x
Salariul (mil. lei)

Fig. 2.2 - Histograma frecvenţelor absolute pentru salariul net al muncitorilor

O altă posibilitate de reprezentare grafică a distribuţiei de frecvenţe


pentru o caracteristică numerică de tip continuu este poligonul frecvenţelor.
EXEMPLUL 2.7: Pe baza datelor din tabelul 2.3, putem construi poli-
gonul frecvenţelor absolute, astfel (fig. 2.3 şi fig. 2.4.):
Fig. 2.3 - Poligonul frecvenţelor absolute pentru salariul net al muncitorilor
y
40
35
30
Frecvenþe

25
20
15
10 Scara de reprezentare
5 Ox: 0,8 cm = 0,2 mil. lei
0 Oy: 0,5 cm = 2 persoane

1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 x
Salariul (mil. lei)
CAPITOLUL 2

y
40
35
30
Frecvenþe

25
20
15
10 Scara de reprezentare
5
Ox: 0,8 cm = 0,2 mil. lei
0

1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 x Oy: 0,5 cm = 2 persoane
Salariul (mil. lei)

Fig. 2.4 - Histograma şi poligonul frecvenţelor absolute


pentru salariul net al muncitorilor

Trebuie să remarcăm că histograma şi poligonul frecvenţelor se pot


construi şi pe baza frecvenţelor relative.

EXEMPLUL 2.8: Pe baza datelor din tabelul 2.3, utilizând frecvenţele


relative, histograma şi poligonul frecvenţelor relative este (fig. 2.5.):

y
Frecvenþe relative (%)

40
35
30
25
20
15
10
5 Scara de reprezentare
0 Ox: 0,8 cm = 0,2 mil. lei

1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 x
Oy: 0,6 cm = 2 persoane
Salariul (mil. lei)

Fig. 2.5 - Histograma şi poligonul frecvenţelor relative pentru salariul net al


muncitorilor
STATISTICĂ ECONOMICĂ

Când intervalele devin suficient de mici, iar numărul de cazuri


rămâne finit pe fiecare interval, poligonul frecvenţelor apare ca o curbă
netedă (fig. 2.6.)

14

12

10
Frecvente

0
10 20 30 40 50 60 70 80 90
Intervale

a) set mic de date

35

30

25
Frecvente

20

15

10

0
1
4
7
10
13
16
19
22
25
28
31
34
37
40
43
46

Intervale

b) Set foarte mare de date


Fig. 2.6 - Efectul volumului colectivităţii asupra aspectului poligonului
frecvenţelor

Iată, deci, că histograma şi poligonul frecvenţelor oferă o primă


imagine asupra normalităţii sau tendinţei de normalitate, ori, din contră,
asupra asimetriei profunde a unei serii de distribuţie de frecvenţe. O
distribuţie normală, perfect simetrică (în forma clopotului lui Gauss-
Laplace) (vezi fig. nr. 2.7.a) este foarte rar întâlnită în practică; cu toate
CAPITOLUL 2

acestea ea este o distribuţie teoretică la care se face adeseori apel în analiza


statistică. În cele mai multe cazuri, distribuţiile de frecvenţe empirice au
tendinţă de normalitate, dar un anumit grad de asimetrie (fig.2.7b şi
fig.2.7.c). Există şi distribuţii profund asimetrice, în care frecvenţa maximă
se întâlneşte în primul ori în ultimul interval, pentru ca apoi frecvenţele să
descrească spre zero. Aceste distribuţii se numesc în formă de J (fig.2.7d şi
fig.2.7e). De asemenea, se pot întâlni distribuţii în formă de U, cu frecvenţe
maxime în ambele intervale extreme de variaţie şi cu frecvenţă minimă în
jurul intervalului central — din mijlocul distribuţiei (fig.2.7f). Este firesc,
aşadar, ca analiza statistică să înceapă cu vizualizarea, pe cale grafică, a
tendinţei de distribuţie a valorilor în colectivitatea cercetată.

y y y

o x o x o x

a) distribuţie normală, b) distribuţie cu tendinţă de b) distribuţie cu tendinţă de


perfect simetrică normalitate, asimetrică normalitate, asimetrică

y y y

o x o x o x
d) distribuţie în formă de J e) distribuţie în formă de J f) distribuţie în formă de U

Fig. 2.7 - Forme ale distribuţiilor de frecvenţe

O serie de distribuţie de frecvenţe alcătuită după o variabilă


numerică discretă se reprezintă grafic prin poligonul frecvenţelor.
STATISTICĂ ECONOMICĂ

EXEMPLUL 2.9: Distribuţia elevilor dintr-o clasă după nota obţinută


la o lucrare de control este cea prezentată în Tabelul 2.10. Reprezentarea
grafică a distribuţiei se prezintă în graficul din fig. 2.8.

Tabelul 2.10
Distribuţia elevilor după nota obţinută la o lucrare de control
Nota (xi) Număr de elevi (ni)
2 1
3 2
4 2
5 6
6 7
8 15
9 5
10 2
Total 40

16

14

12
10
Frecvente

8
6

2
0
0 1 2 3 4 5 6 7 8 9 10 11 12
Nota

Fig. 2.8 - Poligonul frecvenţelor absolute pentru nota obţinută la lucrarea de


control

2.5.2. Curba frecvenţelor cumulative (ogiva)

O altă modalitate de descriere a datelor cantitative continue,


construită de această dată pe baza frecvenţelor cumulative este curba
frecvenţelor cumulative (ogiva).
CAPITOLUL 2

Să subliniem mai întâi că frecvenţele cumulate sunt interpretate în


relaţie cu limitele exacte ale intervalelor de grupare.

EXEMPLUL 2.10: Pe baza datelor obţinute în tabelul 2.4. se poate


construi grafic curba frecvenţelor cumulate crescător (fig. 2.9.)

60

50
Frecvente cumulate

40

30

20

10

0
1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 3 3.2
Salariu (mil. lei)

Fig. 2.9 - Curba frecvenţelor cumulate crescător, pentru salariul net al


muncitorilor

Suprapus peste curba frecvenţelor cumulate crescător, ori într-un


grafic separat, se poate reprezenta curba frecvenţelor cumulate
descrescător. De asemenea, ogiva se poate reprezenta şi pe baza
frecvenţelor relative cumulate.

EXEMPLUL 2.11: Pe baza datelor din tabelul 2.3 col. 4, se poate con-
strui curba frecvenţelor relative cumulate crescător. (fig. 2.10).
STATISTICĂ ECONOMICĂ

1,2

1
Frecvente relative cumulate

0,8

0,6

0,4

0,2

0
1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8 3 3,2
Salariu (m il. lei)

Fig. 2.10 - Curba frecvenţelor relative cumulate crescător


pentru salariul net al muncitorilor

Reprezentarea grafică a frecvenţelor cumulate crescător pentru o


variabilă discretă, prin intermediul graficului frecvenţelor cumulate, va
avea, de această dată, aspectul unei scări, pentru că nici o unitate statistică
nu poate avea valoarea caracteristicii situată între variantele stabilite.
EXEMPLUL 2.12: Pe baza distribuţiei din tabelul 2.10 se poate deter-
mina distribuţia de frecvenţe absolute cumulate crescător (Tabelul 2.11) şi
reprezenta grafic în fig. 2.11.
CAPITOLUL 2

Tabelul 2.11
Distribuţia de frecvenţe cumulate a elevilor după nota obţinută la o lucrare de
control
Nota (xi) Frecvenţe absolute cumulate
crescător (Fci)
2 1
3 3
4 5
5 11
6 18
8 33
9 38
10 40

Frecvenþe cumulate (Y)


40

35

30

25

20

15

10

o 1 2 3 4 5 6 7 8 9 10 x (nota)

Fig. 2.11 - Graficul frecvenţelor cumulate crescător pentru distribuţia elevilor


după nota la lucrarea de control

2.5.3. Diagrama prin coloane şi diagrama prin benzi

Alte modalităţi uzuale de a reprezenta grafic o serie de distribuţie


de frecvenţe absolute sau relative, pentru o variabilă calitativă
(categorială) sunt diagrama prin coloane şi diagrama prin benzi.
STATISTICĂ ECONOMICĂ

EXEMPLUL 2.13: Pe baza datelor din tabelul 2.5, care reprezintă o


distribuţie de frecvenţe relative după o variabilă calitativă, reprezentarea
grafică este prin diagrama prin coloane (fig. 2.12) sau diagrama prin benzi
(fig. 2.13).

50
45.7
45
Frecvenţe relative (%)

40

35

30 27.41

25

20

15 12.16
10 8.3

5 1.93 1.35 0.96 0.92 0.57 0.25 0.45


0
l
n

fe

ta

le
A

ig

AF
A

po

am
de

IT

te
as
O

Li

an

ro

D
SA

N
IR

Al
n

er
ni
G

ar

AR
et
la

t
AS

m
AI

In
er

M
O
ed
N

Compania

Fig. 2.12 - Diagramă prin coloane

Nederl. 45.7
ASIROM 27.41
SARA 12.16
UNITA 2.3
Companie

AIG Life 1.93


Garanta 1.35
Omniasig 0.96
Metropol 0.92
Interam. 0.57
ARDAF 0.25
Altele 0.45

0 10 20 30 40 50
Frecvenţe relative (%)

Fig. 2.13 - Diagramă prin benzi


CAPITOLUL 2

2.5.4. Diagrama de structură

O altă modalitate de a prezenta grafic datele pe care le avem la dis-


poziţie cu privire la o serie de distribuţie de frecvenţe (vizual homogradă)
este diagrama de structură.

EXEMPLUL 2.14: Pe baza datelor din Tabelul 2.5., diagrama de


structură se prezintă astfel (fig. 2.14):

Altele
ARDAF
Interam.
Metropol
Omniasig
Garanta
AIG Lif e
UNITA
SARA
ASIROM
Nederl.
a.
STATISTICĂ ECONOMICĂ

Nederl.
ASIROM
SARA
100 UNITA
80 AIG Life
Garanta
60
% Omniasig
40
Metropol
20 Interam.

0 ARDAF

b. Altele

Nederl.
100
A SIROM
90
80 SA RA
70 UNITA
60 A IG Lif e
% 50 Garanta
40 Omnias ig
30 Metropol
20 Interam.
10
A RDA F
0
c. A ltele

Nederl.
ASIROM
SARA
100% UNITA
80% AIG Life

60% Garanta
% Omniasig
40%
Metropol
20%
Interam.
0% ARDAF
d. Altele

Fig. 2.14 - Diagrama de structură a contractelor de asigurări pe companii


de asigurare, în România, 1999: a. prin cerc; b. prin cilindru; c. prin
dreptunghi; d. prin paralelipiped
CAPITOLUL 2

2.5.5. Diagrama de împrăştiere (corelograma)

În cazul datelor bivariate, sistematizate într-o serie de distribuţie de


frecvenţe bidimensională, reprezentarea grafică uzuală în sistemul de coor-
donate rectangulare este diagrama de împrăştiere (despre care vom vorbi
mai pe larg într-un capitol următor) (fig. 2.15)

Cantitãþi vândute
din produsul X
(mii bucãþi) 250
**
**
200 ***
***
150 * * ***
* ***
100 * * **
***
* *** *
50 **
***
***
10
20 30 40 50 60 Cheltuieli cu
reclama (mld. lei)

Fig. 2.15 - Diagramă de împrăştiere

2.5.6. Cronograma

O serie cronologică se reprezintă grafic prin intermediul


cronogramei sau historiogramei. În sistemul de coordonate rectangulare,
pe axa absciselor se marchează unităţile de timp (t) — momente sau intervale
— iar pe axa ordonatelor valorile variabilei (yt).
Reprezentarea grafică a seriilor cronologice este prezentată mai pe
larg în capitolul 6.
EXEMPLUL 2.15: Pe baza datelor din tabelul 2.8, reprezentarea grafică
prin intermediul cronogramei (prin segmente de linie sau coloane) este (fig.
2.16)
Numarul de exemplare vandute Numarul de exemplare vandute
(mii exemplare)
(mii exemplare)
ia
nu
ar

0.00
20.00
40.00
60.00
80.00
100.00
120.00
140.00
160.00
ie

90.00
100.00
110.00
120.00
130.00
140.00
150.00

fe 20
br 01
ua
rie
20
m 01
ar
tie
20
ap 01
ril
ie
20
01
m
ai
20
iu 01
ni
e2
00
iu 1
lie

a)

b)
au 200
gu 1
se st

Lunile
pt
em 200
b 1

luni
oc rie 2
to 00
m 1
br
no ie
ie 20
m 01
br
de ie
ce 20
m
STATISTICĂ ECONOMICĂ

01
br
ie
ia 20
nu 01
ar
ie
fe 20
br 02
ua
rie
20
01

Fig. 2.16 - Cronogramă trasată prin a) linii; b) coloane


CAPITOLUL 2

2.5.7. Diagrama polară

În cazul în care seria cronologică prezintă variaţii sezoniere, pentru


reprezentarea grafică a evoluţiei unui fenomen putem folosi diagrama
polară (radială), construită în sistemul de coordonate polare. Acest tip de
diagramă se va prezenta mai pe larg în capitolul 6.

EXEMPLUL 2.16: Temperatura medie lunară a aerului la Bucureşti -


Filaret în anul 1996 se reprezintă grafic în fig. 2.17.

Ian
30
Dec. Feb.
20
Nov. 10 Mar.
0
Oct. -10 Apr.

Sept. Mai

Aug. Iun.
Iul.

Temperatura medie lunara a aerului la Bucuresti-Filaret în


anul 1996

Fig. 2.17 – Diagramă polară

2.5.8. Diagrama prin suprafeţe

O serie teritorială se poate reprezenta grafic prin diagrame prin


coloane, benzi ori diagramă prin suprafeţe. În diagrama prin suprafeţe se
construiesc, de obicei, pătrate sau cercuri, cu suprafeţele proporţionale cu
valorile reprezentate.

În cazul fenomenelor complexe, care se descompun în produsul a


trei factori se poate folosi diagrama de volum trasată prin paralelipipedul
dreptunghic. Cei trei factori se vor reprezenta pe lungimea, lăţimea şi
înălţimea paralelipipedului, iar nivelul fenomenului complex prin volumul
acestuia.
STATISTICĂ ECONOMICĂ

EXEMPLUL 2.17: Populaţia globului pe continente în anul 1998 se


prezintă astfel (mil. locuitori, Tabelul 2.12):
Tabelul 2.12
Continent Populaţie (mil. loc.)
Africa 778
America de Nord 472
America de Sud 332
Asia 3590
Europa 729

Reprezentarea grafică este redată în fig. 2.18.

Legendă:

Africa

America de Nord

America de Sud

Asia

Europa

Fig. 2.18 - Diagramă de suprafaţă

2.5.9. Alte tipuri de reprezentări grafice

Dacă aceste diagrame pot fi construite şi pentru alte serii statistice


(de exemplu: serii de distribuţii de frecvenţe homograde), o modalitate
specifică de reprezentare grafică a seriilor teritoriale este cartograma sau
cartodiagrama, în care pe o hartă se construiesc diagrame (în cazul
cartodiagramei), se haşurează sau se colorează diferit unităţile teritoriale (în
cazul cartogramei), în funcţie de nivelul înregistrat al variabilei.
Să notăm că există şi alte reprezentări grafice (diagrama Venn,
diagrama Chernoff) a căror acurateţe în construcţie este facilitată de
utilizarea pachetelor informatice specializate.
CAPITOLUL 1

CAPITOLUL 1

NOŢIUNI INTRODUCTIVE ŞI CULEGEREA


DATELOR STATISTICE

Consideraţii preliminare
În acest capitol vom face primii paşi în înţelegerea statisticii ca
ştiinţă şi disciplină de studiu. Cele mai multe întrebări din domeniul
afacerilor, din domeniul economic ori social nu au răspunsuri simple; ele
necesită clarificare şi discuţii, fundamentări ale deciziilor. Vom vedea cum
statistica poate fi folositoare în luarea deciziilor, în acceptarea sau
respingerea unor soluţii posibile.
Statistica vine, astfel, să aducă un plus de rigoare ştiinţifică, să po-
tenţeze abilitatea de a lua decizii, să suplimenteze calităţile unui bun
manager: experienţă, intuiţie etc.
Pentru a înţelege statistica este, însă, mai întâi, nevoie să ne
familiarizăm cu limbajul statistic, să cunoaştem conceptele de bază, etapele
cercetării statistice şi rolul statisticii în procesul decizional.
În măsura în care am înţeles că statistica este ştiinţa culegerii şi
prelucrării, analizei datelor, este potrivit să continuăm cu studierea
diferitelor tipuri de date ce pot fi culese şi a celor mai des utilizate metode
de colectare a datelor statistice.

Termeni cheie
caracteristică (variabilă statistică) legea stabilităţii frecvenţelor
caracteristică nenumerică observări parţiale
caracteristică numerică observări totale
colectivitate generală parametru
colectivitate parţială (eşantion) scală de interval
control statistic scală de raport
date bivariate scală nominală
date continue scală ordinală
STATISTICĂ ECONOMICĂ

date discrete sondaj aleator simplu


date multivariate sondaj în cuiburi
date statistice sondaj nealeator
date univariate sondaj probabilist
eroare statistică sondaj stratificat
eşantion statistică descriptivă
estimator statistică inferenţială
fenomen de masă surse primare de date
indicator surse secundare de date
inferenţă statistică, unitate statistică
lege statistică
CAPITOLUL 1

Noţiuni teoretice

1.1. ARGUMENTE ÎN FAVOAREA CUNOAŞTERII STATISTICII

Printre motivele şi argumentele în favoarea cunoaşterii statisticii se


numără următoarele:
- factorii decizionali au nevoie să ştie cum să descrie şi să prezinte în
modul cel mai potrivit informaţiile;
- factorii decizionali au nevoie să ştie cum să obţină previziuni
credibile privind variabilele de interes;
- factorii decizionali au nevoie să ştie cum să îmbunătăţească
desfăşurarea activităţilor de care sunt răspunzători;
- factorii decizionali au nevoie să ştie cum să tragă concluzii despre
colectivităţi numeroase, doar pe baza informaţiilor obţinute din eşantioane.

1.2. SEMNIFICAŢII ALE CUVÂNTULUI „STATISTICĂ“

Cuvântul statistică are o semnificaţie multiplă pentru cercetători,


specialişti, studenţi şi populaţie în general. Astfel, acest cuvânt poate să
ducă cu gândul la indicele preţurilor de consum, la cifra medie de afaceri a
unor firme, la rata şomajului, la datele publicate într-o revistă sau într-un
buletin oficial, ori, evident, la o disciplină de studiu din cadrul
învăţământului superior de specialitate.
Statistica este, aşadar, o activitate practică, dar şi mulţimea datelor
obţinute prin această activitate, publicaţiile de date ale diferitelor organisme
de specialitate, metodologia statistică, o ramură a ştiinţei şi cunoaşterii, ori o
disciplină ştiinţifică şi de învăţământ.

1.3. DEZVOLTAREA STATISTICII MODERNE

Pentru a pune în evidenţă rolul statisticii ca instrument de cunoaştere


a particularităţilor de volum, structură şi dinamică a fenomenelor şi
STATISTICĂ ECONOMICĂ

proceselor economico-sociale, este necesar să subliniem că din punct de


vedere istoric, apariţia şi dezvoltarea statisticii moderne îşi are rădăcinile în
trei fenomene separate: nevoile guvernelor ţărilor de a calcula date privind
cetăţenii şi activităţile ţărilor, dezvoltarea teoriei probabilităţilor şi apariţia şi
extinderea utilizării calculatoarelor.
De-a lungul istoriei, datele au fost permanent colectate; în timpul
civilizaţiei egiptene, greci şi romane, datele erau obţinute în scopul primar al
taxării şi înrolării în armată. În Evul Mediu, instituţiile bisericii strângeau
adesea şi păstrau informaţii, înregistrări privind naşterile, decesele şi
căsătoriile. Necesitatea prelucrării datelor din ce în ce mai numeroase, a
ajutat într-un fel sau altul – la dezvoltarea maşinilor de calcul şi implicit, la
revoluţia calculatoarelor personale, la începutul secolului XX.
Aceste progrese au determinat schimbări profunde ale domeniului de
studiu al statisticii în ultimii 30 de ani.

1.4. OBIECT ŞI METODĂ ÎN STATISTICĂ

Obiectul de studiu al statisticii îl constituie fenomenele şi procesele


care prezintă următoarele particularităţi: se produc într-un număr mare de
cazuri (sunt fenomene de masă); variază de la un element la altul, de la un
caz la altul; sunt forme individuale de manifestare în timp, în spaţiu şi ca
formă organizatorică.
Urmărind etapele oricărui proces de cunoaştere, pentru rezolvarea
problemelor care fac obiectul său de studiu, statistica, ca orice ştiinţă, şi-a
elaborat procedee şi metode speciale de cercetare, cum sunt cele ale
observării de masă, ale centralizării şi grupării, procedee şi modele de
analiză şi interpretare statistică. Putem spune că metoda statisticii este
constituită din „totalitatea operaţiilor, tehnicilor, procedeelor şi metodelor de
investigare statistică a fenomenelor ce aparţin unor procese de tip
stochastic“.
Complexitatea şi amploarea cercetării statistice fac imperios
necesară perfecţionarea continuă a metodelor de observare, prelucrare,
analiză. În acelaşi timp, dezvoltarea metodelor statisticii este strâns legată de
progresele înregistrate de teoria probabilităţilor şi statistica matematică,
precum şi de cele din domeniul informaticii economice.
CAPITOLUL 1

DEFINIŢIE: Statistica este ştiinţa care studiază aspectele cantitative


ale determinărilor calitative ale fenomenelor de masă, fenomene care sunt
supuse acţiunii legilor statistice ce se manifestă în condiţii concrete,
variabile în timp şi spaţiu.

1.5. STATISTICA DESCRIPTIVĂ VERSUS STATISTICA INFERENŢIALĂ

Necesitatea culegerii datelor pentru cunoaşterea unor întregi naţiuni


a constituit practic, punctul de plecare în dezvoltarea statisticii descriptive.

DEFINIŢIE: Statistica descriptivă poate fi definită ca totalitatea


metodelor de culegere, prezentare şi caracterizare a unui set de date, în
scopul de a descrie diferitele trăsături principale ale acestui set de date.

DEFINIŢIE: Statistica inferenţială poate fi definită ca


totalitatea metodelor ce fac posibilă estimarea caracteristicilor unei populaţii
sau luarea unor decizii privind o populaţie, pe baza rezultatelor obţinute pe
un eşantion.

Pentru a clarifica distincţia între statistica descriptivă şi cea


inferenţială sunt necesare câteva precizări, definiţii şi explicaţii privind
unele noţiuni şi concepte de bază ale statisticii.

1.6. NOŢIUNI ŞI CONCEPTE DE BAZĂ FOLOSITE ÎN STATISTICĂ

O primă noţiune de bază din statistică o reprezintă populaţia


(colectivitatea) statistică.

DEFINIŢIE: Populaţia statistică, denumită şi colectivitate statistică,


reprezintă totalitatea elementelor de aceeaşi natură, care au trăsături
esenţiale comune şi care sunt supuse unui studiu statistic.

Termenul de populaţie nu se referă doar la un grup de persoane.


Deşi, iniţial, conceptul a fost utilizat în acest sens restrâns (la recensăminte),
STATISTICĂ ECONOMICĂ

astăzi înţelesul său este lărgit, prin populaţie putându-se înţelege o


colectivitate de obiecte, persoane, păreri, gânduri, evenimente, opinii etc.
Cu cât este mai numeroasă o colectivitate, cu atât devine mai dificilă
cercetarea tuturor elementelor ei. O astfel de cercetare poate fi
consumatoare de timp şi costisitoare. Soluţia poate să fie, atunci, să extra-
gem o subcolectivitate din colectivitatea generală (numită şi colectivitate
parţială, eşantion sau colectivitate de selecţie).

DEFINIŢIE: Eşantionul reprezintă un subset de elemente selectate


dintr-o colectivitate statistică.

În felul acesta, se vor estima parametrii colectivităţii totale pe baza


rezultatelor obţinute în colectivitatea de selecţie, iar ceea ce a fost deter-
minat ca fiind tipic, esenţial şi caracteristic în eşantion, se presupune că ar fi
fost găsit dacă s-ar fi cercetat colectivitatea generală. Soliditatea acestei pre-
supuneri depinde de modul cum a fost extras eşantionul, iar de acurateţea
acestui proces depinde succesul demersului statistic. Reprezentativitatea eşan-
tionului este, aşadar, aspectul crucial al oricărui proces de cercetare pe bază
de sondaj statistic.

DEFINIŢIE: Inferenţa statistică reprezintă o decizie, o estimaţie, o


predicţie sau o generalizare privitoare la o colectivitate generală, bazată pe
informaţiile statistice obţinute pe un eşantion.

Statistica abordează colectivităţi statice (care exprimă o stare, un


nivel, la un moment dat) şi colectivităţi dinamice (care caracterizează un
proces, o devenire în timp).

Un alt concept de bază al statisticii îl reprezintă unitatea statistică.

DEFINIŢIE: Unitatea statistică reprezintă elementul constitutiv al


unei colectivităţi statistice şi care este purtătorul unui nivel al fiecărei
trăsături supuse observării şi cercetării statistice.

Unităţile statistice pot fi simple sau complexe. Unităţile complexe


sunt rezultate ale organizării sociale ori economice a colectivităţii statistice
(exemplu: familia).
CAPITOLUL 1

DEFINIŢIE: Caracteristica statistică reprezintă trăsătura, proprie-


tatea, însuşirea comună tuturor unităţilor unei colectivităţi şi care variază ca
nivel, variantă sau valoare, de la o unitate a colectivităţii la alta. Este
denumită şi variabilă statistică ori variabilă aleatoare.

DEFINIŢIE: Varianta/valoarea reprezintă nivelul concret pe care îl


poate lua o variabilă la nivelul unei unităţi sau grup de unităţi statistice.

DEFINIŢIE: Frecvenţa de apariţie a unei variante/valori reprezintă


numărul de apariţii al acestei variante/valori în colectivitate.

DEFINIŢIE: Datele statistice reprezintă caracterizarea numerică obţi-


nută de statistică în legătură cu unităţile, grupele sau colectivitatea studiată.

Datele statistice sunt mărimi concrete, rezultate din studiile efectuate


prin numărare, măsurare sau calcul statistic. Ele pot fi primare, prelucrate,
publicate sau stocate în baze sau bănci de date. Mesajul datelor statistice
este informaţia statistică.

DEFINIŢIE: Indicatorul statistic reprezintă expresia numerică a unor


fenomene, procese, activităţi sau categorii economice şi sociale, definite în
timp, spaţiu şi structură organizatorică.

EXEMPLUL 1.1. Pentru a ne referi la toate aceste noţiuni într-un


exemplu, să presupunem că primarul unei localităţi este interesat în
cunoaşterea percepţiei locuitorilor privind nivelul de trai. Colectivitatea sau
populaţia statistică, în acest caz, poate fi alcătuită din totalitatea cetăţenilor
cu domiciliul în localitatea respectivă, în timp ce eşantionul este alcătuit din
acele persoane care sunt selectate să participe la anchetă. Scopul anchetei
este de a descrie diverse caracteristici ale colectivităţii generale (parametrii:
venitul mediu etc.). Acest scop poate fi atins folosind indicatorii statistici
(estimatorii) obţinuţi pe baza eşantionului de locuitori, pentru a estima
diferitele caracteristici ale populaţiei de interes. Observăm astfel că scopul
major al statisticii inferenţiale este de atrage concluzii asupra parametrilor
colectivităţii generale, folosind estimatorii calculaţi pentru eşantion.
STATISTICĂ ECONOMICĂ

1.7. ETAPELE CERCETĂRII STATISTICE

Procesul cunoaşterii statistice presupune organizarea şi parcurgerea


unor etape distincte şi succesive care includ operaţiile de observare sau
culegere a datelor, de sistematizare şi prelucrare, de analiză şi interpretare a
rezultatelor.
Etapele cercetării statistice sunt:
— observarea statistică — etapă în care se culeg date şi informaţii
statistice de la unităţile colectivităţii, pentru toate caracteristicile urmărite;
— prelucrarea statistică — etapă în care datele sunt sistematizate şi
sunt calculaţi indicatorii statistici primari şi derivaţi, absoluţi şi sintetici ce
caracterizează fenomenul studiat;
— analiza şi interpretarea rezultatelor — etapă în care sunt verificate
ipotezele, formulate concluziile şi fundamentate procesele decizionale.

1.8. TIPURI DE DATE ŞI SCALE DE MĂSURARE A DATELOR

O primă posibilitate de a lua în considerare complexitatea datelor


statistice este în funcţie de numărul de caracteristici (variabile) la care se
referă aceste date. Astfel, datele univariate sunt cele care se referă la o
singură variabilă statistică. Avem deci o singură informaţie pentru fiecare
unitate statistică.
Metodele statistice vor fi folosite pentru a rezuma, a analiza
caracterele şi trăsăturile esenţiale ale acestui set de date, răspunzând la
întrebări precum: care sunt valorile tipice ce caracterizează setul de date, cât
de variate sunt ele, există unităţi sau grupuri care necesită o atenţie specială
etc.
Datele bivariate sunt cele care se referă la două variabile statistice
şi avem, aşadar, exact câte două informaţii pentru fiecare unitate statistică
din colectivitate.
În plus, faţă de caracterizarea separată a datelor pentru fiecare
variabilă — ca în cazul datelor univariate — metodele statistice pot să fie
folosite şi pentru a studia legătura, dependenţa dintre cele două variabile
considerate.
CAPITOLUL 1

Datele multivariate sunt cele care se referă la trei sau mai multe va-
riabile statistice, obţinând deci câte trei sau mai multe informaţii pentru
fiecare unitate statistică din colectivitatea studiată. Deşi sunt multivariate,
datele pot fi analizate separat (pentru fiecare variabilă), sau în interdepen-
denţă unele cu altele.
Putem observa că există două tipuri de bază de variabile aleatoare
(caracteristici) care pot fi studiate ca oferind niveluri observate sau date
statistice: caracteristici nenumerice (calitative), care oferă răspunsuri
categoriale şi caracteristici numerice (cantitative), care oferă răspunsuri
sub formă de valori numerice.
Datele discrete sunt răspunsuri numerice care apar în urma unui
proces de numărare, în timp ce datele continue sunt răspunsuri numerice
care apar în urma unui proces de măsurare.
Aşadar. caracteristicile statistice se pot clasifica după mai multe
criterii, astfel:
a) în funcţie de modul de exprimare, în:
— caracteristici calitative (nominative), exprimate în cuvinte:
profesie, culoarea părului, localitatea de domiciliu etc.;
— caracteristici cantitative (numerice), exprimate în cifre: salariu,
înălţime, greutate, cifră de afaceri etc. Sunt caracteristici măsurabile.

b) în funcţie de numărul variantelor/valorilor de răspuns pe care le


pot lua, în:
— caracteristici alternative (binare sau dihotomice), acelea care pot
lua doar două variante de răspuns, după modelul adevărat/fals din logică:
sex (M/F), stagiul militar (efectuat/neefectuat), starea civilă (căsătorit/necă-
sătorit);
— caracteristici nealternative — cele care pot lua mai multe
valori/variante de răspuns: salariu, profesie, cifră de afaceri, localitate de
domiciliu etc.

c) în funcţie de natura variaţiei caracteristicilor numerice, în:


— caracteristici continue (cu variaţie continuă), cele care pot lua
orice valoare din scara lor de variaţie: greutatea unei persoane, cifra de
afaceri a unei firme etc.;
— caracteristici discrete sau discontinue, cele a căror variaţie se
manifestă prin salturi; ele nu pot lua decât anumite valori pe scara lor de
variaţie (de regulă numere întregi): numărul de copii pe care îi are o familie,
numărul de oraşe dintr-un judeţ etc.
STATISTICĂ ECONOMICĂ

d) în funcţie de conţinutul caracteristicii, în:


— caracteristici de timp (exemplu: anul naşterii, anul înfiinţării unei
firme);
— caracteristici de spaţiu (exemplu: localitatea de domiciliu);
— caracteristici atributive, în care variabila reprezintă un atribut,
altul decât spaţiul ori timpul.

e) în funcţie de modul de obţinere şi caracterizare a fenomenului:


— caracteristici primare (obţinute, de regulă, în etapa de culegere a
datelor statistice);
— caracteristici derivate, obţinute în procesul prelucrării variabilelor
primare.

Putem, de asemenea, studia tipul datelor statistice în concordanţă cu


nivelul sau scala de măsurare folosită. Într-un sens larg, toate datele
statistice colecate sunt “măsurate” sau transpuse pe o scală de măsurare,
într-o formă sau alta.

Patru niveluri de măsurare sunt utilizate – de la cea mai slabă la cea


mai puternică - scala nominală, ordinală, de interval şi de raport, iar
prelucrarea datelor statistice se va face în mod distinct, în funcţie de gradul
de “rafinament” al scalei.

Forma cea mai elementară este scala nominală (de clasificare sau
scala denumirilor), când numerele sunt atribuite observaţiilor pentru a face
doar judecăţi despre identităţi sau diferenţieri de categorie. Cu ajutorul
scalei nominale numerele repartizate unor observaţii servesc drept numele
lor. Numerele sunt atribuite fiecărei categorii doar pentru a identifica unităţi
similare din interiorul unei categorii şi pentru a diferenţia aceste unităţi
similare de elementele unei alte categorii diferite.
Se face, astfel, o diferenţiere de specie, dar nu şi de grad.

Următoarea scală este scala ordinală, pe care sunt măsurate


tot varibile de tip nenumeric (calitativ), dar care pot fi, de această dată,
ordonate. Unităţile pot fi înşiruite una reltiv cu celaltă şi se poate realiza
astfel, o ierarhizare, dar distanţa între numerele acordate nu este obligatoriu
egală. Numerele pe scala ordinală nu reprezintă intervale egale pe scala de
măsurare.
CAPITOLUL 1

În continuare putem distinge scala de intervale (sau cardinală)


practic prima scală cu adevărat numerică, ce foloseşte unităţi de măsurare
egale. Se face astfel posibilă nu numai interpretarea ordinii notărilor pe
scală, dar şi a diferenţelor dintre ele.
În plus faţă de scala nominală şi cea ordinală, intervalele între
categoriile de pe scală sunt presupuse a fi egale. O caracteristică a scalei de
interval este absenţa unui punct zero absolut.
Judecăţi comparative ca „de două ori mai mult“, „de patru ori mai
puţin“ etc. nu pot fi făcute pentru compararea valorilor specifice măsurate
pe o scală de interval. Ca atare, multiplicarea sau divizarea valorilor nu are
sens.

Pentru ca afirmaţiile comparative pe baza multiplicării ori divizării


să aibă sens, este necesară o scală proporţională (de raport), în care există
un punct zero fix şi absolut (cum este cazul scalei pe care se măsoară
greutatea ori a celei pentru lungime).

1.9. CULEGEREA DATELOR STATISTICE

1.9.1. Surse de date statistice

În scopul aplicării metodelor statistice de analiză a fenomenelor şi


proceselor social-economice este necesar să avem la dispoziţie date
statistice. Putem să obţinem aceste informaţii din datele deja publicate (de
instituţii specializate, de exemplu), sau putem să construim un experiment, o
anchetă, un sondaj. Deci, o clasificare a surselor de date statistice poate fi:
surse primare şi surse secundare de date.
Dacă datele statistice sunt obţinute direct prin organizarea unei
observări statistice (totale sau parţiale), atunci persoana sau instituţia care a
realizat o astfel de observare este o sursă primară de date statistice. Dacă
datele sunt prelucrate în tabele şi grafice, în scopuri publice sau private, ele
vor fi surse secundare de date.

Datele primare sunt obţinute prin observări totale, când


înregistrarea valorilor sau variantelor caracteristicilor urmărite se face
pentru toate unităţile statistice din colectivitatea generală (de exemplu,
STATISTICĂ ECONOMICĂ

recensământul populaţiei), sau prin observări parţiale, când se culeg date


de la o parte a colectivităţii generale (de exemplu, sondajul statistic).

1.9.2. Planul observării statistice

DEFINIŢIE: Observarea statistică reprezintă acţiunea de culegere de


la unităţile statistice a informaţiilor referitoare la caracteristicile urmărite,
după criterii riguros stabilite.

Observarea trebuie să îndeplinească anumite condiţii: de cantitate


(volum) şi calitate, astfel:
• satisfacerea condiţiei de cantitate presupune obţinerea în timpul
stabilit a tuturor datelor necesare pentru efectuarea studiului statistic;
• satisfacerea condiţiei de calitate presupune asigurarea conţinutului
veridic al datelor culese, în vederea obţinerii unor rezultate cât mai exacte,
afectate de erori cât mai mici.
Observarea se efectuează după un plan riguros, care trebuie să
cuprindă:
• scopul observării;
• delimitarea colectivităţii şi unităţii de observare;
• stabilirea caracteristicilor ce vor fi înregistrate;
• alegerea formularelor de înregistrare;
• delimitarea timpului şi locului observării;
• stabilirea măsurilor organizatorice.

1.9.3. Recensământul statistic

Recensământul este o metodă de observare totală, cu caracter


periodic care surprinde un fenomen în mod static. Este una din cele mai
vechi metode de observare, întâlnită încă din antichitate (recensăminte ale
populaţiei — la romani).
Recensământul asigură o fotografiere, o surprindere a unui fenomen
la un anumit moment de timp (moment critic).

DEFINIŢIE: În mod oficial, recensământul populaţiei este „un proces


de culegere, prelucrare şi publicare a datelor demografice, economice şi
sociale, la un timp specificat şi valabile pentru toate persoanele din ţara
respectivă sau de pe un teritoriu delimitat“.
CAPITOLUL 1

Recensământul populaţiei este reglementat de către stat, prin acte


legislative, şi respectă principiile universalităţii, simultaneităţii şi
comparabilităţii.
Din domeniul populaţiei, recensământul s-a extins şi asupra altor do-
menii: există recensământ al locuinţelor, al animalelor, al unităţilor din in-
dustrie, comerţ, transport, agricultură (într-un cuvânt, recensământ econo-
mic).

1.9.4. Culegerea datelor utilizând sondajul statistic

Sondajul sau selecţia statistică este o metodă parţială de observare


statistică, din ce în ce mai larg utilizată în cercetările statistice moderne.
Sondajul se foloseşte pentru a înlocui o observare totală, de mare amploare,
mai dificil de realizat, care presupune angajarea unor cheltuieli ridicate de
resurse materiale, financiare şi umane.

Există două categorii esenţiale de sondaj: sondaj aleator (probabilist)


şi sondaj nealeator. Pentru multe studii este posibilă doar realizarea unei
eşantionări nealeatoare (cum ar fi ancheta statistică - care oferă informaţii
orientative, eşantionarea pe cote, observarea părţii principale etc.). Însă, în
analiza statistică, singura cale pentru a putea folosi corect inferenţa
statistică, de la eşantion la colectivitatea generală, este să utilizăm un sondaj
probabilist.
Un eşantion probabilist este acela în care unităţile din eşantion au
fost alese pe baza unor probabilităţi cunoscute. Tipurile de eşantionări
probabiliste cel mai des utilizate sunt: eşantionarea aleatoare simplă,
eşantionarea stratificată şi eşantionarea în cuiburi (cluster).
În sondajul aleator simplu şansa de selecţie în eşantion a fiecărei
unităţi statistice din colectivitatea generală trebuie să fie egală. Acesta este
un sondaj cu un singur grad, în care unităţile sunt extrase din întreaga
populaţie, care constituie baza de sondaj. Pentru efectuarea unei selecţii
simple aleatoare corecte, este esenţial să eliminăm elementele preferenţiale
ale alegerii umane care ar putea duce la formarea „arbitrară“ a eşantionului.
Un eşantion simplu aleator este aşadar selectat astfel încât:
— fiecare unitate statistică are o probabilitate egală de a fi aleasă în
eşantion şi
— unităţile sunt alese independent, fără legătură una cu cealaltă.
STATISTICĂ ECONOMICĂ

Sondajele pot fi repetate sau nerepetate, după cum există


posibilitatea revenirii unei aceleaşi unităţi în cadrul aceluiaşi eşantion.
În prima situaţie, a sondajului repetat (cu revenire), fiecare unitate
statistică extrasă din colectivitatea generală este reintrodusă în baza de
sondaj, după ce a fost citită şi caracteristicile au fost înregistrate.
În varianta sondajului nerepetat (fără revenire), unităţile sunt
extrase din colectivitatea generală, iar după înregistrarea caracteristicilor lor,
ele nu mai sunt reintroduse în colectivitatea de bază; selecţia se face după
modelul urnei din care se fac extrageri succesive fără a pune bila extrasă
înapoi, iar o unitate nu poate să apară în şirul succesiv al probelor decât o
singură dată.

Extragerea întâmplătoare a unităţilor şi alcătuirea eşantioanelor


aleatoare se poate realiza prin unul din următoarele procedee de selecţie:

1. Procedeul urnei cu bile (procedeul loteriei), este un procedeu de


selecţie aleatoare care poate fi realizat în varianta cu revenire sau fără re-
venire. Se stabileşte un cadru de identificare, astfel încât fiecare unitate din
colectivitatea generală este numerotată de la 1 la N. Numerele sunt notate pe
cartonaşe, bileţele sau bile iar acestea sunt amestecate atent. Se extrage apoi,
la întâmplare, un cartonaş (bilă) iar numărul citit identifică unitatea ce este
considerată ca făcând parte din eşantion. Pentru această unitate se înregis-
trează toate caracteristicile ce fac parte din programul cercetării.
În continuare, în varianta cu revenire (sondaj repetat), cartonaşul
(bila) este reintrodus în urnă, se repetă amestecarea iar extragerea se repetă
până când se obţine eşantionul de volum n.

În varianta sondajului fără revenire (sondaj nerepetat), cartonaşul


(bila) nu este reintrodusă în urnă, ceea ce înseamnă că o unitate statistică, o
dată extrasă în eşantion nu mai are şanse să mai reintre în colectivitatea de
origine şi să fie extrasă din nou.

2. Procedeul tabelului cu numere întâmplătoare este o altă


modalitate utilizată pentru alegerea unui eşantion aleator printr-o selecţie
probabilistă. Utilizarea tabelelor cu numere aleatoare constă în prelevarea
din cadrul populaţiei a unităţilor ale căror numere de ordine stabilite printr-o
numărătoare prealabilă, au fost citite după un anumit criteriu din „tabelul
numerelor întâmplătoare“.
CAPITOLUL 1

Tabelul cu numere aleatoare este o listă de numere în care fiecare


cifră – de la 0 la 9 – apare cu o probabilitate de 1/10, independent una de
alta (vezi Anexa)

EXEMPLUL 1.2. Să alegem un eşantion aleator de n=9 unităţi, dintr-o


colectivitate de 38 unităţi, începând din rândul 15, coloana 3 din tabelul cu
numere aleatoare. Numerele citite din tabel vor fi:
7295; 2925; 1518; 2568; 4892; 8716; 7843; 1747; 3375; 8715; 1523; 1379.
Cum N=38 are 2 cifre, se rearanjează secvenţa citită în grupuri de
câte 2 cifre, astfel:
72; 95; 29; 25; 15; 18; 25; 68; 48; 92; 87; 16; 78; 43; 17; 47; 33; 75; 87; 15;
23; 13; 79.
Se elimină numerele mai mari de 38 şi vor rămâne următoarele
numere ce identifică unităţile care sunt selectate în eşantion:
29; 25; 15; 18; 25; 16; 17; 33; 15; 15; 23; 13.
Dacă selecţia este fără revenire se vor elimina numerele ce reapar în
listă şi vor rămâne atunci numerele:
29; 25; 15; 18; 16; 17; 33; 23; 13.

3. Procedeul mecanic de selecţie a eşantionului presupune


prelevarea unităţilor din colectivitatea generală după un interval
predeterminat, denumit frecvent pas de numărare aplicat bazei de sondaj.
Pasul de numărare se calculează ca N/n=k
Numărul iniţial de la care se începe citirea se alege aleator între 1 şi
k, după care se citeşte tot a k-a unitate până la completarea eşantionului de n
unităţi statistice.

Stratificarea constă în divizarea colectivităţii generale de studiat în


„straturi“, clase tipice cât mai omogene, cu caracteristici cât mai asemănă-
toare, astfel încât unităţile statistice din interiorul fiecărui strat să prezinte,
cel puţin din punct de vedere teoretic, caracteristici comune specifice fie-
cărei clase. Straturile pot fi constituite din regiuni, judeţe, localităţi, medii,
sexe, subdiviziuni economice, grupe de vârstă etc. Cel mai frecvent, stratifi-
carea se foloseşte în studiul populaţiei care se separă folosind clasificările
oficiale sau, în funcţie de scop, cercetătorul îşi va face propria sa grupare, ca
de exemplu, după profesie sau vechimea în producţie.
Uneori, unităţile colectivităţii generale se prezintă, ca urmare a orga-
nizării economico-sociale, sub forma unităţilor complexe (ex: persoanele
alcătuiesc familii etc). În asemenea cazuri, sondajul poate fi organizat astfel
STATISTICĂ ECONOMICĂ

încât sa se extragă spre studiu unităţi complexe, urmând ca toate unităţile


simple din cadrul unităţilor complexe extrase să se cerceteze fără nici o ex-
cepţie (sondaj în cuiburi).
Mai mult, nu întotdeauna se dispune, ca bază de sondaj, de o listă
completă a unităţilor statistice simple. Dar, se poate dispune de o listă a
grupurilor de unităţi. Fiecare din aceste grupuri, unităţi de ordin superior,
numite cuiburi, conţine unul sau mai multe unităţi statistice ce interesează
investigaţia statistică. Prin cuib (grappe în franceză, cluster în engleză) se
înţelege o grupare de unităţi statistice concentrate şi strict delimitate
În loc de a distinge în populaţie două niveluri: unităţile şi populaţia
în ansamblu, aici se consideră trei niveluri: unităţile statistice, cuiburile
(grupurile) şi populaţia în ansamblu. Un sondaj în cuiburi constă în
alegerea (întâmplătoare) a unui eşantion din aceste unităţi colective, sau
cuiburi, pentru ca apoi să se studieze toţi indivizii pe care îi conţine fiecare
din aceste cuiburi alese (fără excepţie).

În practică, într-o serie de cazuri, din diferite motive extracţia se face


nealeator sau pseudoaleator (ex: sondaj pe cote, sondaj multifazic etc). Un
asemenea procedeu de extracţie este eşantionarea concentrată, care constă
în includerea în eşantion numai a acelei părţi ce reprezintă majoritatea
cazurilor individuale. Această metodă se confundă cu observarea părţii
principale.

Sondajul multifazic este un tip de schemă în care unele informaţii


sunt colectate de la întregul eşantion, iar un alt grup de informaţii
(amănunte, informaţii mai puţin importante pentru scopul cercetarii sau
informaţii care vizează un studiu colateral) sunt strânse de la un subeşantion
al aceluiaşi eşantion.
În eşantionarea pe cote (spre deosebire de celelalte tipuri de scheme
de eşantionare caracterizate prin a fi aleatoare şi în care se garantează
fiecărei unităţi statistice şansa calculabilă de a fi inclusă in eşantion),
alegerea unităţilor statistice reale ce urmează a fi incluse este lăsată pe
seama operatorilor.

În sondajele pseudo-aleatoare trebuie să se dispună de o bază de


sondaj, după care se decide alegerea persoanelor (unităţilor statistice) ce se
afla într-o situaţie dată privind un criteriu care nu este aleator, dar care se
consideră a fi independent de fenomenul studiat.
CAPITOLUL 1

Metoda de sondaj pe bază de eşantioane fixe este destul de


utilizată în cadrul cercetării statistice. Ideea de bază a acestei metode este
aceea că se obţin informaţii repetate de pe acelaşi eşantion. Informaţiile care
se obţin se pot referi la aceleaşi unitaţi statistice sau la unităţi mai mult sau
mai puţin diferite. Informaţiile culese se pot referi la acelaşi subiect de
cercetat sau la subiecte conexe.

Ancheta de opinie face parte, ca şi sondajul statistic din rândul


metodelor parţiale de observare, fără ca eşantionul pe baza căruia se
realizează ancheta, să fie obligatoriu reprezentativ faţă de colectivitatea
generală. Ancheta de opinie are drept scop cunoaşterea părerilor persoanelor
asupra diferitelor probleme (se efectuează anchete sociologice, demografice,
psihosociale, de marketing). Este posibilă folosirea, deopotrivă, a sondajului
statistic, cât şi a anchetei statistice (exemplu: în studiul cererii de mărfuri a
populaţiei).

Panelul este, de asemenea, o metodă de observare parţială, bazată pe


un eşantion stabil (fix), format dintr-un număr de persoane de la care se
obţin date conform metodei longitudinale, prin chestionare la diferite
momente de timp.

Monografia statistică — face parte din categoria observărilor


parţiale, special organizate, având ca obiect cunoaşterea multilaterală şi în
profunzime a unei singure unităţi complexe. Are, de regulă, un caracter
multidisciplinar (exemplu: monografia unei întreprinderi, a unei localităţi,
sau judeţ).

1.10. ERORI STATISTICE ŞI CONTROLUL DATELOR STATISTICE

Datorită volumului foarte mare de date cu care operează statistica,


este firesc să apară, uneori, şi erori. De aceea, în urma culegerii datelor,
informaţiile obţinute sunt supuse unui proces de control şi corectare, în
scopul depistării şi eliminării, pe cât posibil, a erorilor statistice.

DEFINIŢIE: Prin eroare statistică înţelegem, în sens larg, diferenţa


dintre nivelul real al unui indicator şi cel rezultat din investigaţia statistică.
STATISTICĂ ECONOMICĂ

Erorile de observare (înregistrare) se întâlnesc în procesul de


culegere a datelor statistice şi se pot datora obiectului observării,
anchetatorului, mijloacelor de înregistrare, metodei de culegere a datelor sau
condiţiilor externe. Aceste erori pot fi de două feluri: întâmplătoare şi
sistematice. Erorile de observare pot fi înlăturate prin controlul statistic.

DEFINIŢIE: Controlul datelor statistice este o operaţie intermediară,


prin care se trece de la observarea de masă la prelucrarea datelor statistice.

Controlul datelor în etapa observării poate fi:


— cantitativ;
— calitativ

Controlul cantitativ este un control de volum al datelor, prin care


se verifică completitudinea acestora. Acest control presupune:
— verificarea primirii tuturor formularelor la centrul de prelucrare;
— verificarea completării rubricilor.

Controlul calitativ presupune verificarea naturii calitative a datelor


culese. Acesta poate fi:
— control aritmetic;
— control logic.

S-ar putea să vă placă și