Sunteți pe pagina 1din 142

Statistică teoretică şi economică

CAPITOLUL 1.
ISTORICUL SI ROLUL STATISTICII
Cuvinte cheie:
- carcateristică statistică
- frecvenţă statistică
- statistica
- statistica teoretică
- statistica aplicată
- statistica descriptivă
- statistica inferenţială
- unitatea statistică
- variabilă statistică

Termenul de statistica, precum si primele formulari ale unui concept de statistica


a fost utilizat de filozoful german Gottfried Achewall (1719-1772) in anul 1749.
Termenul de statistica a fost popularizat in vestul Europei de catre englezul John
Sinclair (1754-1835) in perioada 1790-1800.
Insa, modul statistic de gandire si abordare a fenomenelor isi are originea in cele
mai vechi timpuri. Istoria consemneaza operatii de numarare a populatiei, de masurare a
terenurilor sau a altor resurse la popoarele antice, de exemplu la egipteni intre 2778-2160
i.H. si chinezi in jurul anului 2300 i.H.
Etimologic, statistica îşi are originea în latinescul “status” cu sensul de stare sau
situaţie, precum şi în termenul italian “stato” cu înţelesul de stat.
Termenul, în înţelesul original al său, a însemnat numărarea şi socotirea (în sens
de calculare) în activităţile cerute de dezvoltarea societăţii la acel moment.
Intr-un sens larg, statistica reprezintă un set de metode şi tehnici pentru obţinerea,
organizarea, agregarea, prezentarea, interpretarea şi analiza activităţilor cuantificabile
(numărabile). Statistica cercetează aspectul cantitativ (numeric) al fenomenelor şi
proceselor strict determinate în timp şi spaţiu. Aceste fenomene şi procese se manifestă
aparent ca fiind întâmplătoare şi independente, însă, în realitate, au esenţe comune, sunt
fenomene sau procese de tip colectiv (de masă).
Cercetând fiecare manifestare se pot afla o serie de trăsături ale acesteia, care însă
nu întotdeauna sunt specifice pentru întregul fenomen. Pentru a le putea desprinde trebuie
cercetată întreaga masă (colectivitate) a acestor manifestări, înlăturându-se treptat ceea
ce este neesenţial, întâmplător.
Fenomenele din acestă categorie se numesc fenomene de tip colectiv sau
fenomene de masă, întrucât cunoaşterea legilor care le guvernează presupune cercetarea
întregului ansamblu de manifestări individuale.
Legea statistică apare ca rezultantă medie a numeroase acţiuni individuale, ca o
necesitate care îşi croieşte drum printr-un număr mare de manifestări aparent
întâmplătoare.
Obiectul de studiu al statisticii îl formează fenomenele din domeniul vieţii sociale,
precum şi interdependenţa dintre acestea şi condiţiile meteriale în care se produc.
Statistică teoretică şi economică

Statistica este ştiinta care studiază aspectele cantitative ale determinărilor


calitative ale fenomenelor de masă, fenomene care sunt supuse acţiunii legilor statisticii
care se manifestă în condiţii concrete, variabile în timp şi spaţiu.
Funcţie de domeniul de cercetare aceste fenomene de tip colectiv prezintă
anumite particularităţi care duc la diferenţierea metodelor de cercetare.
Astfel, statistica se diferenţiază în:
• statistica teoretică sau teoria statisticii, care are ca obiect de studiu dezvoltarea
procedeelor şi metodelor de abordare şi analiză statistică a fenomenelor social-
economice;
• statistica aplicată sau statistica de ramură, în care se face particularizarea şi
adaptarea procedeelor şi metodelor la specificul domeniului cercetat (statistica
comerţului exterior, statistica economică, statistica industrială etc.)
De asemenea, statistica se împarte, din punct de vedere al scopului urmărit în sensul
caracterizarii unei populaţii sau a unei subpopulaţii cu extinderea concluziilor asupra
întregii populaţii, în:
• statistica descriptivă;
• statistica inferentială.
Termenul de statistică descriptivă a fost introdus pentru prima dată de G.T. Fechner
(1801-1877) în a doua jumatate a secolului al XIX-lea. Termenul german folosit
“kollektiv-masslehre” este foarte semnificativ dar, din păcate, prea lung. Statistica
descriptive presupune utilizarea metodelor pentru organizarea, agregarea şi descrierea
unei mulţimi de date.
Statistica inferenţială reprezintă un important instrument de analiză utilizat în
procesul de luare a deciziilor. Premisa de baza a statisticii inferenţiale este foarte simplă.
Ea face trecerea de la statistica descriptivă a unui eşantion (subpopulaţie) la descrierea
întregii mase care caracterizează fenomenul respective (populaţie). Cu alte cuvinte,
statistica inferenţială presupune metode pentru inferenţa asupra populaţiei generale având
la baza informaţii ale eşantionului desprins din colectivitatea generală. Una dintre
utilizarile imediate ale statisticii inferenţiale este previziunea economico-socială.
Rolul statisticii la nivel microeconomic şi macroeconomic se caracterizează în:
• cunoaşterea situaţiei problematice; statistica contribuind la colectarea de
date; clasificarea datelor; prelucrarea sub forma de serii, tabele, grafice,
estimarea parametrilor; analiza rezultatelor;
• evaluarea de variante de decizie: modelare statistică,; testarea modulelor;
formularea de ipoteze; verificarea ipotezelor şi previziunea statistică;
• formularea deciziei sau alegerea variantei optime: analiza comparativă
asupra variantelor; precizarea variantei de decizie prin măsuri cantitative;
• controlul aplicarii deciziei şi verificarea rezultatelor.
In concepţia actuala a ştiinţei, statistica poate fi considerată ca o disciplină de
graniţă care prin metodele sale asigură cercetărilor ştiinţifice un caracter interdisciplinar.
Apariţia unor ştiinţe ca cibernetica, informatica, teoria sistemelor, nu numai că au acelaşi
domeniu de investigaţie ca şi statistica, dar au impulsionat folosirea din ce în ce mai mult
a metodei statistice.
Organizarea activităţii de statistică în România revine în present Institutului
Naţional de Statistică. Acest organism are sarcina principală de a elabora informaţia
statistică necesară caracterizarii fenomenelor şi proceselor economice şi sociale la nivel
Statistică teoretică şi economică

microeconomic şi macroeconomic. Rezultatele activităţii Institutului Naţional de


Statistică se regăsesc în principal în publicaţii oficiale cu caracter periodic cum sunt:
“Buletin de Informare”, “Anuarul Statistic al României” etc.
Pe plan internaţional, principalul organism statistic este “Comisia de Statistică a
Naţiunilor Unite” înfiinţată în 1946. De asemenea, “Departamentul de Economie şi
Statistică” înfiinţat în cadrul OCDE in 1960, “Oficiul de Statistică al Uniunii Europene”
înfiinţat în 1958 şi “Institutul Inter-American de Statistică” fondat în 1940. Toate aceste
organisme cooperează cu guvernele ţărilor membre în vederea elaborării unor informaţii
comparabile pe plan internaţional pentru toate domeniile activităţii umane.

1.1.Noţiuni fundamentale folosite în statistică.


Colectivitatea statistică sau populaţie, reprezintă totalitatea unităţilor a căror
esenţă este definită prin aceeaşi determinare şi ale cărei unităţi sunt delimitate în timp şi
spaţiu formând o colectivitate statistică. Ea reprezintă forma de concretizare a
fenomenului sau procesului economic studiat. Statistica social-economică operează cu
colectivităţi finite, numarabile, spre deosebire de statistica matematică care operează cu
colectivităţi infinite.
Unitatea statistică adică fiecare element, manifestare sau concretizare a
colectivităţii este o unitate statistică. Această unitate este purtatoarea tuturor trăsăturilor
commune ale colectivităţii şi se înregistrează în timpul observării statistice. Funcţie de
conţinutul unităţii acestea pot fi:
• simple, fiecare element constituient;
• complexe, una sau mai multe unitati simple.
Unitatea de înregistrare sau raportare. In contextual organizării unui sistem
informaţional statistic la nivel naţional (1780 şi la noi în 1859 de către Dionisie Pop
Marţian), fiecare entitate cu personalitate juridică şi gestiune proprie poate contribui la
alimentarea bazei de date, furnizand sistematic date despre propria activitate.
Caracteristica sau variabila statistică reprezintă acea trăsătură a elementelor
colectivităţii care se înregistrează într-o manieră uniformă la nivelul fiecarei unităţi
constitutive. Caracteristicile care fac obiectul cercetării statistice trebuie să servească
obiectivului cunoaşterii. Fiecare caracteristică prezintă la nivelul unui element un nivel
specific care se numeşte variantă, valoare sau nivel.
Valorile înregistrate de aceeaşi caracteristică la unităţile colectivităţii statistice de
numesc variante. Caracteristicile statistice se mai numesc variabile statistice.
Frecvenţa. Dacă o anumită variantă se înregistrează de mai multe ori într-o
colectivitate de n elemente atunci numărul de apariţii ale variantei “i” se notează cu ni sau
fi şi se numeşte frecventă. Frecvenţa poate fi absolută sau relativă.
Statistică teoretică şi economică

Probleme şi aplicaţii:
1.1.Zece studenţi care se aflau în sala de lectură a unei biblioteci universitare au fost
chestionaţi în legătură cu motivul prezenţei lor acolo. Cinci dintre ei au răspuns că
se află acolo pentru studiu; doi au răspuns că încercau să doarmă; unul a răspuns
că trebuia să se întâlnească cu o colegă şi ultimii doi au răspuns prin întrebarea
“Aici este sala de lectură?”. Precizaţi care din următoarele propoziţii aparţin
statisticii descriptive şi care aparţin celei inferenţiale:

a) 20% din studenţii chestionaţi au răspuns că se aflau acolo pentru a încerca să doarmă;
b) unul dintre cei zece studenţi dintr-o universitate aşteaptă o colegă sau un coleg în sala
de lectură.

1.2. Arătaţi care din următoarele propoziţii aparţin statisticii descriptive sau
statisticii inferenţiale:
a) Dintre 100 de medici stomatologi chestionaţi au răspuns că 95% din pacienţii lor nu
mestecă chewing gum;
b) Media notelor obţinute într-o grupă de studenţi la examenul de statistică a fost 7,50;
c) Bazându-ne pe datele asupra inflaţiei din ultimii doi ani, rata inflaţiei pentru anul în
curs va fi de 35%.
Statistică teoretică şi economică

CAPITOLUL 2.
CERCETAREA STATISTICĂ
Cuvinte cheie:
- analiza şi interpretarea statistică
- caracteristica de grupare
- grafice statistice.
- observarea statistică
- observarea documentară
- observarea directă
- prelucrarea statistică
- plan de observare statistică.
- tabele statistice.

In sens larg, cercetarea statistică cuprinde totalitatea operaţiilor de culegere şi


observare, sistematizare şi prelucrare, stocare şi regăsire, analiză şi interpretare a
informaţiilor necesare pentru cunoaşterea şi conducerea proceselor sociale şi economice.
Etapele cercetării statistice sunt următoarele:
¾ Observarea statistică care cuprinde culegerea datelor individuale.
¾ Prelucrarea statistică care cuprinde sistematizarea datelor individuale; calculul
indicatorilor statistici şi prezentarea datelor sub forma de tabele, serii sau grafice
statistice;
¾ Analiza şi interpretarea statistică care cuprinde confruntarea şi compararea
datelor, verificarea ipotezelor, formularea concluziilor asupra cercetarii şi
fundamentarea calculelor de prognoză.

2.1. Observarea statistică


Observarea este prima etapa a cercetării statistice. Ea constă în culegerea de date
(informaţii) după o anumită metodologie pentru toate unităţile colectivităţii cercetate.
Scopul observării este comun cu cel al cercetării statistice, în sensul cunoaşterii
situaţiei existente, modificărilor structurale şi în dinamică sau al interdependenţei cu alte
fenomene.
In procesul observării statistice trebuie să se ţină seama de anumite principii,
dintre care:
• datele culese să fie autentice, să reflecte realitatea;
• datele să se refere numai la caracteristicile esenţiale, care răspund cel mai bine
scopului cercetării;
• culegerea de date trebuie să se realizeze în condiţii obiective, fără preferinţe din
partea cercetătorilor.

Pentru organizarea raţională a unei observari statistice trebuie rezolvate o serie de


probleme cu caracter organizatoric şi metodologic. Pentru aceasta este nevoie de un plan
de observare statistică.
Planul de observare statistică cuprinde:

10
Statistică teoretică şi economică

• scopul observării – subordonat scopului general pentru care s-a organizat


cercetarea;
• obiectul observării – îl formează colectivitatea cercetată sau mulţimea unităţilor
care se vor înregistra împreună;
• unitatea de observare – definită ca element component al colectivităţii. Pot exista
unităţi simple (personae fizice, mărfuri etc.) sau unităţi complexe (familie,
echipă, societate comercială etc.);
• programul observării – constă în stabilirea caracteristicilor care trebuie să fie
înregistrate, modalităţile concrete de culegere a datelor şi încadrarea în timp şi
spaţiu a activităţii de obţinere a informaţiilor;
• formulare şi instrucţiuni de completare – se prezintă sub forma de fişe şi liste.
Formularele de înregistrare cuprind şi instrucţiuni de înregistrare. Astfel, timpul
observării vizeaza două aspecte: stabilirea timpului la care se referă datele
înregistrate şi a duratei înregistrării;
• locul observării şi unitatea care raportează – în general, el coincide cu locul unde
este amplasat fenomenul înregistrat;
• probleme organizatorice – care asigură cât mai bune condiţii pentru desfăşurarea
observării.

Modalităţi de observare statistică.


Observarea statistică poate fi observare documentară sau observare directă.
Observarea documentară are loc atunci când se preiau date înregistrate din documente
sau publicaţii existente. In acest caz, costul este redus şi există cel puţin doua reguli care
trebuie respectate:
• nu trebuie să se preia informaţiile în mod automat, ci se verifica constistenţa
logică şi comparabilitatea acestor informaţii;
• atunci când se colectează date din mai multe surse este absolut necesară
verificarea comparabilităţii metodologiilor de elaborare a indicatorilor.
Observarea directă (nemijlocită) presupune contactul direct cu obiectul observării şi
înregistrarea element cu element a tuturor caracteristicilor cuprinse în programul
observării.

Erorile de observare statistică.


Principalele tipuri de erori statistice în etapa de observare sunt:
• erori întâmplatoare care provoaca abateri în sensul măririi sau micşorării
nivelului real al fenomenului. Acestea pot surveni din neatenţie şi nu au caracter
premeditat. In cazul colectivităţilor mari, acest tip de erori are un caracter redus;
• erori sistematice care produc abateri semnificative de regulă într-un singur sens
de la realitatea observată. Sunt generate din neînţelegere sau din rea credinţă
(voinţă).

2.2. Prelucrarea statistică


Prelucrarea statistică se referă la operaţiile de sistematizare a datelor primare pe
întreaga colectivitate şi pe părţile ei componente; calculul indicatorilor absoluţi şi
derivaţi, precum şi prezentarea rezultatelor obţinute.

11
Statistică teoretică şi economică

Prelucrarea statistică în sensul sistematizării şi generalizării datelor statistice


implică parcurgerea etapelor:
• centralizarea;
• gruparea sau clasificarea datelor şi calculul indicatorilor statistici absoluţi;
• calculul indicatorilor derivaţi;
• prezentarea rezultatelor prelucrării sub formă de serii, tabele şi grafice statistice.
Centralizarea constă în strângerea la un centru de prelucrare a tuturor formularelor
şi însumarea datelor fiecărei caracteristici aditive în parte, în scopul obţinerii indicatorilor
totalizatori. Există centralizări simple şi centralizări pe grupe. Centralizarea pe grupe
presupune gruparea prealabilă a datelor şi are drept scop cunoşaterea mai detaliată a
fenomenului, permiţând analiza structurii colectivităţii.

Un exemplu de formular de centralizare este prezentat mai jos:

Elementele Caracteristici
colectivitatii C1 C2 C3 …….. Cn
1 X X X X
2 - - X -
.
.
.
n X X X -
Total (n) C1 C2 C3 …….. Cn

Clasificarea şi gruparea statistică. Structurarea colectivităţii în grupe omogene


după variaţia uneia sau mai multor caracteristici de grupare se numeşte grupare sau
clasificare.
Prin grupe omogene se înţelege atunci când unităţile care o compun sunt de
acelaşi fel (aparţin aceluiaşi tip calitativ) şi ca nivel diferă în mică măsură una de alta.
Gruparea statistică este cea mai semnificativă modalitate de sistematizare a datelor după
o caracteristică numerică (cantitativă).
Tehnica grupării parcurge următoarele etape:
• alegerea şi folosirea caracteristicilor de grupare;
• alegerea numărului de grupe şi stabilirea mărimii intervalelor de grupare;
• enumerarea problemelor de cunoaştere care se rezolvă prin metoda grupărilor.

Prin caracteristica de grupare se înţelege acea însuşire care stă la baza împărţirii
colectivităţii în grupe omogene.
După numărul caracteristicilor puse la baza grupării se disting: grupări simple şi
grupări combinate.
După continutul caracteristicilor, grupările simple şi combinate pot fi: teritoriale,
cronologice sau atributive.
Grupările după caracterstici numerice sunt cele mai dificile, deoarece, cu cât
amplitudinea variaţiei este mai mare, cu atât este mai greu de asigurat omogenitatea
unităţilor din aceeaşi grupă.
In acest caz există două probleme:

12
Statistică teoretică şi economică

• alegerea numărului de grupe;


• stabilirea mărimii intervalului de grupare.
Mărimea intervalului de grupare se poate face după relaţia de mai jos:

A X max − X min
k= = ⋅
r r

sau se mai poate determina şi după formula lui H.A. Sturges1:

X max − X min
k= .
1 + 3,322 ⋅ log n

unde:
A = amplitudinea absolută;
r = numărul de grupe;
Intervalul de variaţie este un grup omogen de variante, despărţit de restul
colectivităţii prin limita inferioară şi limita superioară a grupei. Intervalele de grupare pot
fi: intervale egale şi intervale neegale; intervale deschise şi intervale inchise; intervale
cu variaţie continuă şi intervale cu variaţie discontinuă (discretă).

2.3. Prezentarea datelor statistice.


In vederea aplicării metodelor de calcul şi de interpretare statistică, rezultatele
sistematizării datelor se prezintă sub formă de serii, tabele sau grafice statistice.
Seria statistică este alcatuită din şiruri paralele de date, aflate în concordanţă
univocă, în sensul că valorile sau variantele unei (unor) caracteristici sunt prezentate în
raport de variantele sau intervalele de variaţie ale unei caracteristici numită caracteristică
de grupare.
Dintre caracteristicile înregistrate cu prilejul observării se alege aceea care
serveşte cel mai bine scopului cercetării. Uneori este necesară combinarea şi utilizarea
concomitentă a mai multor caracteristici de grupare.
In acest context distingem:
• serii unicriteriale (unidimensionale);
• serii multicriteriale (multidimensionale);
Seriile unicriteriale (unidimensionale) pot fi prezentate funcţie de natura
caracteristicii de grupare în trei tipuri distincte:
• serii cronologice (dinamice, de timp), când caracterstica de grupare este o
variabilă de timp;
• serii teritoriale (de spaţiu), cănd variabila de grupare este o caracteristică
administrative-teritorială;

1
H.A.Sturges: The Choise of a Class Interval, Journal of the American Statistical Association, vol.21, p.65-
66.

13
Statistică teoretică şi economică

• serii de repartiţie (de distribuţie), când caracteristica de grupare este un atribut


cantitativ sau calitativ al colectivităţii cercetate.

Tabele statistice.
Tabelul statistic este o formă de prezentare ordonată şi completă a datelor despre
o colectivitate cercetată, facilitând formarea unei imagini globale despre obiectul de
studiu.
Elementele constructive ale unui table statistic sunt:
• titlul tabelului, trebuie să precizeze în câteva cuvinte ce se prezintă în tabel, unde
şi când s-au produs evenimentele prezentate în tabel;
• macheta tabelului care cuprinde totalitatea liniilor orizontale şi verticale a căror
intersecţie conduce la formarea de rubrici pentru subiectul şi predicatul
tabelului;
• subiectul tabelului se înscrie în capetele rândurilor şi îl reprezintă colectivitatea
şi părţile sale componente;
• predicatul tabelului se înscrie în capătul coloanelor şi este format din totalitatea
aspectelor cantitative referitoare la colectivitatea cercetată. Macheta devine tabel
statistic când se umple cu date.
• conţinutul tabelului reprezintă totalitatea informaţiilor trecute în rubrici;
• sursa datelor se trece imediat sub tabel;
• notă explicativă se pune fie imediat după sursa datelor, fie în subsolul paginii pe
care se afla tabelul daca în etapa de culegere sau prelucrare a datelor din table s-
au folosit proceduri sau tehnici noi sau rar utilizate de către posibilii cititori.

Grafice statistice.
Graficul statistic reprezintă o altă formă de prezentare a datelor sub formă de
imagini spaţiale cu caracter convenţional care prin mijloace plastice reliefează unele
caracteristici esenţiale ale colectivităţii cercetate.
Elementele constitutive ale unui grafic statistic sunt:
• titlul graficului;
• axa sau axale graficului;
• scara sau scările graficului pentru gradare;
• legenda care să explice culori, haşuri;
• graficul propriu-zis reprezentat de puncte, linii, figuri geometrice în plan sau
spaţiu sau figuri natural convenţionale construite la scara;
• sursa datelor se plasează imediat după grafic;
• nota explicative.

Principalele tipuri de grafice sunt: diagramele prin benzi şi coloane; grafice prin
areale; diagrame de structură; diagrame polare etc.
Diagramele prin benzi se costruiesc sub forma unor dreptunghiuri cu latura mare
orizontală sprijinite pe o dreaptă ridicată în punctul de origine a axei (orizontale) de
reprezentare.
Diagrame prin coloane se construiesc sub forma unor dreptunghiuri cu latura
mare verticală cu ajutorul unui sistem de axe rectangulare.

14
Statistică teoretică şi economică

Graficele prin areale se construiesc sub forma unor figuri geometrice în plan a
căror suprafaţă este proporţională cu mărimea caracteristicii. De regulă, se folosesc
pătrate, romburi, cercuri, triunghiuri echilaterale, dreptunghiuri etc.
Diagramele de structură presupun un raport de proporţionalitate între suprafaţa
figurii geometrice şi totalul structurii de 100%.
Diagrama polară se utilizează, de obicei, pentru a ilustra sezonalitatea, dar poate
fi folosită şi pentru a da o imagine grafică raportului dintre elementele unor serii de
repartiţie.

Probleme şi aplicaţii.

2.1.O anchetă întreprinsă la începutul anului 2001 în Bucureşti în rândul a 60 de


societăţi comerciale de mărime medie, permite următoarea înregistrare cu privire la
numărul de salariaţi:

267 268 270 285 286 290 292 296 285 288
296 299 325 346 261 252 270 262 255 248
272 170 165 275 172 240 181 185 250 252
197 280 192 181 284 195 197 282 187 194
215 217 196 198 225 220 230 211 227 231
233 220 225 228 233 234 217 236 245 248

Se cere

1. Să se identifice nivelul minim şi maxim al numărului de salariaţi în cele 60 de societăţi


comerciale observate;
Răspuns: xmin = 165 persoane, xmax = 346 persoane

2.Să se grupeze cele 60 societăţi comerciale pe 6 intervale egale de variaţie a numărului


de salariaţi şi să se reprezinte grafic repartiţia de frecvenţe obţinută;
Rezolvare:
Numărul de grupe este h = 6, iar mărimea intervalului (k) este de aproximativ 30
persoane, potrivit relaţiei:
x − x min 346 − 165
k = max = = 30,167 ≅ 30 persoane
h 6
Intervalele de variaţie trebuie astfel stabilite încât:
a) să permită cuprinderea tuturor unităţilor observate;
b) centrele de intervale să fie, pe cât posibil, numere rotunde, care să faciliteze
calculele ulterioare. În tabelul de mai jos, primul interval de grupare are limita inferioară
egală chiar cu xmin. În schimb, ultimul interval de grupare rămâne deschis la limita
superioară pentru a putea permite cuprinderea unităţii cu 346 persoane ocupate.În ultima
coloană a tabelului sunt semnalate centrele intervalelor de grupare, care se obţin ca medie
aritmetică simplă a limitelor inferioare şi superioare ale fiecărei grupe.
Răspuns:

15
Statistică teoretică şi economică

Gruparea a 60 unităţi comerciale din Bucureşti


după numărul de salariaţi

Intervale de variaţie a Număr de societăţi Centrul intervalului


numărului de salariaţi comerciale de grupare
(n j ) (x j )
*
165 – 195 9 180
195 – 225 11 210
225 – 255 17 240
255 – 285 12 270
285 – 315 9 300
315 şi peste 2 330
Total 60 ---
*Limita superioară nu este inclusă în interval

Reprezentarea grafică este o histogramă sau un poligon de frecvenţe: pe axa


absciselor se măsoară cele şase intervale de grupare, iar pe axa ordonatelor frecvenţa
specifică fiecărei grupe.
Pentru o reprezentare grafică expresivă, se recomandă ca lungimea segmentului
aferent frecvenţei maxime înregistrate (in exemplul nostru nmax = 17) să fie aproximativ
egală cu lungimea segmentului folosit pentru reprezentarea celor şase grupe pe axa
absciselor.
Prin aplicarea formulei lui H.D. Sturges pentru estimarea mărimii (k) a
intervalelor de grupare rezultă valoarea 26,2 pentru cele N = 60 unităţi comerciale
observate:

x max − x min 346 − 165


k= = = 26,2
1 + 3,322 log N 1 + 3,322 ⋅ 1,77815
Având în vedere că variabila observată este numărul de salariaţi şi că această
variabilă nu admite diviziuni subunitare, se cere să se analizeze posibilitatea grupării
societăţilor comerciale pe intervale de câte 25 salariaţi, prima grupă urmând să cuprindă
toate unităţile cu personal de până la 175 persoane. Să se analizeze posibilitatea
reorganizării grupelor constituite.
Răspuns:
Gruparea a 60 unităţi comerciale din Bucureşti
după numărul de salariaţi
Intervale de variaţie a Număr de societăţi
numărului de salariaţi comerciale
(n j )
*
Sub 175 3
175 – 200 11
200 – 225 6
225 – 250 14
250 – 275 11
275 – 300 13
300 – 325 0
325 şi peste 2
Total 60

16
Statistică teoretică şi economică

*Limita superioară nu este inclusă în interval

Observaţie: Formula lui H.D. Sturgers oferă o soluţionare optimală a cerinţei de grupare
pe intervale egale numai în cazul unei distribuţii quasi-continue a unităţilor observate
între xmin şi xmax. În acest exemplu, intervalul penultim (300 - 325) este vid.
Totodată, coloana a doua a tabelului 1.2 reflectă fluctuaţii ale numărului de unităţi
cuprinse în diferite grupe, ceea ce poate fi considerat ca semn al unei sistematizări
deficitare a datelor observării statistice (între grupele cu 11 şi, respectiv 14 societăţi
comerciale apare una cu numai 6 unităţi, între grupele cu 14 şi, respectiv 13 societăţi se
înregistrează o grupă cu o frecvenţă mai mică, de 11 societăţi comerciale).
Pentru a elimina astfel de neajunsuri, există două alternative:
a) eluarea procesului de grupare a datelor observării tot pe intervale de variaţie
a numărului de salariaţi de 25 de persoane, dar, se glisează fie în sus (de exemplu, primul
interval să cuprindă societăţile cu până la 180 salariaţi, al doilea interval să fie de la 180
la 205 salariaţi etc.) fie în jos (de exemplu, prima grupă să fie până la 170 salariaţi etc.).
b) se procedează la regrupare, unind două câte două intervalele de variaţie a
numărului de salariaţi ai societăţilor comerciale. Mai jos se prezintă două variante de
regrupare a societăţilor comerciale observate, intervalele fiind de câte 50 salariaţi:

b1)
Intervale de variaţie a Număr de societăţi
numărului de salariaţi comerciale ( n j )
Sub 175* 3
175 – 225 17
225 – 275 25
275 – 325 13
325 şi peste 2
Total 60
*
Din felul în care sunt definite intervalele marginale de grupare,
rezultă că limita inferioară este inclusă în fiecare interval.

b2)
Intervale de variaţie a Număr de societăţi
numărului de salariaţi comerciale
(n j )
Sub 200* 14
200 – 250 20
250 – 300 24
300 şi peste 2
Total 60
*Limita superioară nu este inclusă în interval

Să se propună o grupare pe intervale neegale de variaţie a numărului de angajaţi,


pornind de la analiza tipologică a unităţilor înregistrate şi să se reprezinte grafic repartiţia
de frecvenţe obţinută.
Rezolvare:

17
Statistică teoretică şi economică

Din variantele deja prezentate de grupare pe intervale egale, se remarcă faptul că


majoritatea societăţilor comerciale observate se încadrează între 200 şi 300 salariaţi, cu o
concentrare de câte 12 unităţi în intervalele (220-239 salariaţi) şi (280-299).
În acest context, se avansează următoarea propunere de grupare pe intervale
neegale de variaţie a numărului de salariaţi:

Intervale de variaţie a Număr de societăţi Mărimea intervalului de


numărului de salariaţi comerciale grupare
(n j ) (k j )
sub 180 3 20*
180 – 199 11 20
200 – 239 16 40
240 – 279 16 40
280 – 299 12 20
300 – 350 2 50
Total 60 ---
*
Primul interval (deschis) se consideră a avea aceeaşi mărime
ca şi intervalul vecin (20 de salariaţi)

Reprezentarea grafică se realizează sub forma de histogramă. Ţinând cont de


faptul că fiecare grupă este ilustrată sub forma unui dreptunghi care are o latură egală cu
mărimea intervalului de grupare (kj), iar cealaltă cu numărul (nj) de elemente din grupă,
trebuie respectată proporţionalitatea dintre suprafeţele dreptunghiurilor. Astfel, atunci
când grupa este de 2 sau 2,5 ori mai mare, frecvenţa observată se micşorează de acelaşi
număr de ori. Numai aşa se realizează o reprezentare corectă a repartiţiei de frecvenţe pe
intervale neegale de grupare.
Se cere să se precizeze care este cea mai fidelă prezentare a colectivităţii
observate.
Rezolvare:
Se porneşte de la observarea numărului total de salariaţi în cele 60 de societăţi
60
comerciale înregistrate: ∑x
i =1
i = 14481 salariaţi.

Acea grupare care se abate cel mai puţin (în plus sau minus) de la această sumă
este considerată că denaturează cel mai puţin specificul colectivităţii analizate.
Datele fiind grupate, frecvenţa (nj) specifică fiecărei grupe (j) se înmulţeşte cu
centrul (xj) grupei pentru a calcula ∑ x j ⋅ n j .
j

Rezultatul calculelor arată astfel:


• Gruparea pe intervale de câte 30 persoane conduce la Σx j n j = 14610 persoane
(+0,9% faţă de efectivul persoanelor salariate în cele 60 de societăţi comerciale);
• Gruparea pe intervale de câte 25 persoane se caracterizează prin
Σx j n j = 14450 persoane (-0,2% faţă de numărul efectiv al salariaţilor), dar apare o
grupă vidă, ceea ce este inacceptabil;

18
Statistică teoretică şi economică

• Gruparea (b1) pe intervale de câte 50 salariaţi conduce la Σx j n j = 14700 persoane


(+1,5%), iar gruparea (b2), de aceeaşi mărime 50 a intervalelor prezintă
Σx j n j = 14200 persoane (-1,9%)
• Gruparea pe intervale neegale se caracterizează prin Σx j n j = 14410 persoane
(-0,5%).
Răspuns:
Cea mai fidelă prezentare a numărului de salariaţi este cea realizată pe intervale
neegale (cu o abatere de –0,5% faţă de numărul de salariaţi înregistraţi); prelucrarea
ulterioară a datelor poate fi îngreunată însă de această grupare pe intervale neegale.
Dintre grupările pe intervale egale, cea mai cea mai apropiată redare a realităţii se
realizează prin prima variantă de grupare (pe intervale de câte 30 de salariaţi) cu o
abatere de +0,9% faţă de numărul de salariaţi înregistraţi.

2.2 În cursul lunii martie 2001, trei echipe (A, B şi C) au realizat un număr de 220
de loturi de produse, fiecare lot fiind alcătuit din câte 500 de unităţi.
Cu prilejul unui control total dispus de managementul fabricii, s-au înregistrat
următoarele date (alături de însemnul echipei s-a notat numărul de produse defecte
din fiecare tip).

Nr Echipa Produse Nr Echipa Produse Nr Echipa Produse Nr Echipa Produse


crt defecte crt defecte crt defecte crt defecte
1 B 5 56 B 12 111 A 2 166 B 5
2 B 4 57 A 2 112 B 5 167 B 4
3 B 4 58 C 12 113 B 10 168 B 3
4 C 5 59 C 7 114 C 4 169 A 2
5 A 4 60 C 7 115 C 14 170 A 6
6 A 4 61 A 2 116 C 6 171 B 5
7 A 8 62 C 7 117 C 4 172 B 6
8 B 4 63 B 4 118 C 14 173 C 5
9 C 5 64 C 3 119 C 8 174 A 4
10 B 4 65 C 4 120 C 6 175 A 2
11 A 3 66 C 9 121 B 3 176 A 4
12 C 4 67 B 5 122 B 3 177 B 4
13 A 5 68 C 13 123 C 13 178 B 8
14 C 9 69 C 8 124 A 1 179 C 4
15 C 15 70 B 5 125 C 3 180 C 10
16 B 6 71 B 5 126 C 5 181 B 4
17 C 4 72 C 5 127 B 6 182 A 3
18 B 6 73 B 7 128 C 6 183 B 9
19 C 6 74 B 4 129 B 2 184 C 6
20 C 6 75 B 5 130 C 5 185 B 4
21 C 5 76 C 15 131 C 3 186 A 6
22 C 6 77 C 14 132 B 4 187 A 4
23 C 14 78 C 8 133 C 15 188 C 5
24 B 2 79 B 3 134 A 1 189 B 3
25 B 2 80 C 12 135 A 7 190 A 3
26 A 2 81 C 7 136 B 5 191 A 6
27 B 3 82 B 9 137 C 14 192 C 13
28 B 2 83 C 6 138 A 7 193 C 4
29 C 14 84 C 14 139 A 8 194 B 5
30 A 3 85 C 6 140 B 8 195 A 1
31 B 3 86 C 3 141 C 11 196 C 3
32 C 5 87 C 4 142 B 4 197 C 10
33 B 9 88 C 3 143 C 6 198 C 3
34 C 10 89 C 6 144 C 11 199 B 7
35 A 3 90 B 3 145 C 12 200 C 9
36 C 10 91 C 5 146 C 3 201 B 3

19
Statistică teoretică şi economică

37 B 8 92 B 8 147 C 4 202 B 5
38 C 10 93 C 9 148 B 3 203 A 1
39 B 4 94 A 6 149 C 4 204 C 4
40 C 7 95 C 11 150 C 5 205 C 7
41 B 5 96 C 3 151 B 3 206 A 2
42 A 7 97 C 12 152 C 10 207 B 2
43 B 8 98 C 11 153 C 8 208 B 2
44 A 2 99 A 4 154 A 7 209 C 5
45 C 4 100 A 5 155 A 2 210 A 3
46 A 3 101 C 5 156 B 8 211 A 2
47 B 4 102 C 4 157 A 3 212 B 6
48 A 2 103 B 5 158 A 5 213 C 12
49 C 7 104 C 4 159 B 5 214 C 6
50 A 1 105 A 2 160 C 7 215 C 9
51 B 5 106 C 10 161 A 5 216 A 5
52 C 4 107 A 6 162 B 4 217 A 6
53 B 7 108 B 6 163 C 3 218 C 5
54 A 1 109 C 7 164 B 5 219 C 10
55 A 6 110 B 7 165 A 2 220 B 7

Se cere:
Să se grupeze loturile în raport cu echipa care a realizat fabricaţia şi să se
reprezinte grafic repartiţia obţinută.

Rezolvare:
Repartiţia loturilor fabricate pe echipe:

Echipa Număr loturi


A 53
B 67
C 100
Total 220

Reprezentarea grafică se face printr-o diagramă prin benzi sau diagramă cu


coloane, cum se prezintă în figura urmatoare:

Repartiţia loturilor fabricate pe echipe


120
100
100
Număr loturi

80 67
53
60
40
20
0
Echipa A Echipa B Echipa C

Să se alcătuiască repartiţia loturilor fabricate în funcţie de numărul de produse


defecte identificate şi să se realizeze reprezentarea grafică a seriei astfel obţinute.
Rezolvare:

20
Statistică teoretică şi economică

Considerând că variabila “număr de produse defecte pe lot” se distribuie aproape


continuu între xmin = 1 defect/lot şi xmax = 15 defecte/lot, se poate recurge la gruparea pe
trei intervale egale de mărime cinci:
Repartiţia loturilor fabricate în funcţie de
numărul de produse defecte pe lot:

Număr de produse Număr loturi


defecte/lot
1–5 125
6 – 10 63
11 - 15 22
Total 220

Reprezentarea grafică este o histogramă sau un poligon de frecvenţe.


Să se alcătuiască repartiţia bidimensională a celor 220 de loturi, folosind grupările
unidimensionale anterioare ca instrumente de verificare a corectitudinii operaţiei de
grupare.
Rezolvare

Repartiţia loturilor fabricate în martie 2001 în funcţie


de echipa de lucru şi numărul de produse defecte pe lot:

Număr de produse Echipa Total


defecte/lot A B C
1–5 39 47 39 125
6 – 10 14 20 39 63
11 – 15 --- --- 22 22
Total 53 67 100 220

Observaţie: Ultima linie a tabelului de mai sus reproduce prima grupare, iar ultima
coloană cea de-a doua grupare a loturilor de produse.

2.3. Şirul următor de date reprezintă punctajele obţinute de 40 de candidaţi la


admiterea în învăţământul superior la ASE Bucureşti în anul 1998:
44; 84; 81; 56; 78; 29; 63; 79; 76; 53; 77; 35; 73; 78; 87; 26; 47; 60; 77; 86; 78; 82;
60; 62; 78; 68; 58; 67; 75; 88; 60; 50; 85; 72; 64; 73; 40; 72; 57; 84.
Observaţie: punctajul maxim obtenabil în 1998 a fost 90.

Se cere:
1. Să se observe punctajele maxim şi minim înregistrate în această colectivitate.
2. Să se grupeze candidaţii după rezultatele obţinute în cinci grupe egale.
3. Să se reprezinte grafic repartiţia obţinută.
4. Să se calculeze mărimile relative prin care se caracterizează structura colectivităţii în
funcţie de performanţa înregistrată de candidaţi, precum şi proporţia între grupele
constituite.

2.4. În cadrul unei universităţi, un număr de 25 de profesori de toate gradele


declară următoarele venituri salariale pe primele 6 luni ale anului 2000 (milioane

21
Statistică teoretică şi economică

lei): 24; 10; 14; 20; 23; 24; 12; 10; 17; 21; 22; 17; 15; 18; 12; 24; 21; 11; 18; 20; 24;
16; 18; 17; 22.

Se cere:
1. Să se grupeze datele pe 4 intervale egale.
2. Să se reprezinte grafic gruparea obţinută.

2.5.Ratele dobânzii practicate de 15 bănci comerciale într-o lună a anului 1998


variază astfel: 45%, 55%, 52%, 60%, 46%, 48%, 58%, 60%, 52%, 48%, 50%,
60%, 62%, 58%, 55%.

Se cere:
1. Să se reprezinte grafic această serie.
2. Să se grupeze băncile pe trei intervale de variaţie a ratei dobânzii practicate şi să se
facă o nouă reprezentare grafică a repartiţiei obţinute.

2.6. Managerul unei uzine a înregistrat numărul accidentelor la locul de muncă


din ultimele 24 de luni. Rezultatele sunt prezentate mai jos:

Numărul Frecvenţa
accidentelor accidentelor
1-2 6
3-4 10
5-6 5
7-8 2
9-10 1

Se cere:
1. să se determine frecvenţele cumulate crescător şi descrescător;
2. presupunem că în următoarea lună au loc 11 accidente, ce sugerează acest lucru
managerului?

2.7. O companie cu două filiale doreşte să compare salariile plătite. Acestea sunt
următoarele:
Salariu (mii lei) Filiala 1 Filiala 2
Sub 500 15 2
501-800 80 16
801-1100 55 12
1101-1400 30 11
peste 1401 20 9
Total 200 50
Se cere:
1. să se transforme aceste frecvenţe absolute în frecvenţe relative;
2. să se transforme aceste frecvenţe absolute în frecvenţe cumulate crescător;

22
Statistică teoretică şi economică

3. care dintre aceste modalităţi poate permite o mai uşoară comparare a salariilor
celor două filiale.

2.8. Arătaţi că:

4 3 4 3 4 3

∑∑ ( x
i =1 j =1
ij − 2 ⋅ y ij + 5) = ∑ ∑ x ij − 2 ⋅ ∑ ∑ y ij + 60.
i =1 j =1 i =1 j =1

2.9. Dacă x1=-1, x2=3, x3=5 şi y1=4, y2=0, y3=2, calculaţi următoarele:

3 3 3 3
a) ∑∑ x i ⋅ yj; b) (∑ xi ) ⋅ (∑ y i )
i =1 j =1 i =1 i =1

3 3 3 3
c) ∑∑ xi ( y j − 1); d) ∑∑ ( xi + y j ).
i =2 j =2 i =1 j =1

23
Statistică teoretică şi economică

CAPITOLUL 3.
INDICATORII STATISTICI
Cuvinte cheie:
- Indicatorul statistic
- Indicatorii absoluţi
- Indicatorii derivaţi
- Mărimile relative
- Mediana
- Modul
- media aritmetică
- media armonică
- media geometrică;
- media patratică

Indicatorul statistic este expresia numerică a unei categorii economice sau sociale
localizate în timp şi spaţiu (expresia numerică a unei trăsături observate pe o colectivitate
definită în timp şi spaţiu).
Indicatorii statistici au anumite funcţii: de măsurare, de comparare, de sinteză, de
estimare, de verificare a ipotezelor şi testare a semnificaţiei parametrilor statistici utilizaţi
etc.
In funcţie de metoda obţinerii indicatorilor şi de rolul jucat în cercetare,
indicatorii pot fi împărţiţi în două categorii:
• indicatori absoluţi (primari);
• indicatori derivaţi (secundari).
Indicatorii absoluţi sunt rezultatul observarii şi sistematizării datelor, în
consecinţă aceştia reflectă dimensiunea, mărimea, amplitudinea fenomenului în unităţi
concrete, specifice de măsură.
Indicatorii derivaţi se obţin în procesul de calcul statistic şi reflectă într-o
manieră, de regulă abstractă, aspecte calitative, evolutive ale colectivităţii cercetate.
Dintre indicatorii derivaţi amintim: mărimile relative şi mărimile medii; indicatorii
variaţiei şi ai asimetriei; indicii statistici; parametrii funcţiilor de regresie şi ajustare
analitică etc.

3.1. Mărimile relative.


Mărimile relative sunt cea mai simplă formă a indicatorilor derivaţi pentru că se
obţin prin raportatrea a două mărimi absolute, de tipul a/b.
Tocmai din acest motiv este obligatoriu să se respecte următoarele aspecte:
• între numărător şi numitor trebuie să existe o legătură logică;
• între numărător şi numitor trebuie să existe compatibilitate metodologică de timp
şi spaţiu pentru ca rezultatul sa fie util cunoşterii.
Mărimile relative se clasifică în:
• mărimi relative de dinamică;
• mărimi relative de structură;
Statistică teoretică şi economică

• mărimi relative de coordonare;


• mărimi relative de plan;
• mărimi relative de intensitate.
Mărimile relative de dinamică exprimă variaţia în timp a nivelului unei
caracteristici.
O serie cronologică y1, y2, y3, .....,yt, putem exprima modificarea în timp astfel:

yt
y t / t −1 =
y t −1
yt
yt / 0 =.
yo
Prima relaţie fiind mărimea relativă a dinamicii cu bază mobilă (în lanţ) iar cea de a
doua fiind mărime relativă a dinamicii cu baza fixă.
Mărimi relative de structură exprimă ponderea, cota parte, greutatea specifică a
unui element sau a unui grup de elemente în totalul colectivităţii.

ni
gi =
∑ ni
i

Mărimi relative de coordonare compară două elemente sau două grupuri ale
aceleiaşi colectivităţi sau două colectivităţi similare situate în spaţii diferite, coexistente
în timp de forma a/b sau b/a.
Mărimi relative de plan. In planificarea microeconomică se utilizează raportul
dintre nivelul propus de activitate (xplan) şi nivelul realizărilor perioadei precedente (x0)
pentru a arata intensitatea efortului necesar realizării planului:

x plan
⋅ 100.
x0

De asemenea, se calculează raportul dintre nivelul realizat curent (x1) şi


obiectivul planificat (xplan), adică:

x1
⋅ 100.
x plan

pentru a observa cât s-a realizat din obiectiv la data analizei.


Mărimile relative de intensitate reprezintă raportul între doi indicatori absoluţi de
natura diferită între care există o legătura logică. De exemplu, densitatea populaţiei care
se calculează ca raport între numărul populaţiei şi suprafaţă.
In analiza mărimilor relative trebuie permanent să facem trimitere la indicatorii
absoluţi pentru a nu ajunge la concluzii eronate.
Statistică teoretică şi economică

3.2. Mărimile medii.


Acestea sunt valori abstracte care tind să caracterizeze întrega colectivitate sau,
cel puţin, partea covârşitoare a elementelor colectivităţii.
Media trebuie înteleasă ca un nivel comun, ca un nivel la care ne aşteptăm, ca un
fel de speranţă matematică capabilă să exprime esenţa comună a tuturor sau majorităţii
manifestărilor individuale ce alcătuiesc colectivitatea cercetată.
Prin definiţie, media valorilor individuale ale unui fenomen de masă este expresia
sintetizării într-un singur nivel reprezentativ a tot ceea ce este esenţial, tipic şi obiectiv în
apariţia, manifestarea şi dezvoltarea lui.
Deşi, conţinutul acestor mărimi este abstract, forma de exprimare este concretă şi
anume aceleaşi unităţi de măsură precum cele folosite la observarea variabilelor
înregistrate.
Există două categorii de mărimi medii:
• medii poziţionale (necalculate);
• medii calculate.
Mediile poziţionale se identifică, de regulă, în rândul variantelor reale ale
colectivităţii fără a face calcule deosebite. Aceste mărimi ţin seama nu de nivelul
variantei, ci de poziţia lor în colectivitate. Există două medii poziţionale: mediana şi
modul.
Mediana reprezintă acea variantă a caracteristicii care ocupă poziţia centrală într-
o colectivitate ordonată crescator sau descrescător.
Locul medianei se calculează după relaţia:

n +1
Loc Me =
2
De exemplu: avem valorile 7;3;1;9;4;2;4. Aceste valori trebuie ordonate crescător sau descrescător.
In cazul nostru le vom ordona crescător astfel: 1;2;3;4;4;7;9.
Locul medianei utilizând formula de mai sus va fi: Loc Me = (7+1)/2 = 4.
Deci, locul medianei fiind 4, valoarea medianei se află pe locul al patrulea şi va fi egală cu Me = 4.
Dacă, avem un numar par te factori atunci locul medianei se va calcula după aceiaşi relaţie iar,
mediana se determină ca medie aritmetică simplă a celor două valori centrale.

Mediana are o anumită capacitate de a spune ce este comun în seria.


Modul sau dominanta este varianta cu frecvenţa cea mai mare de apariţie în
colectivitate.

In cazul exemplului nostru, frecvenţa maximă de apariţie este 2, deci varianta este 4 şi
rezultă că modul Mo = 4.

Pot exsita colectivităţi bidimensionale în care două sau mai multe variante
înregistrate au aceeaşi frecvenţă maximă. Se constată că aceste poziţii nu sunt în total
edificatoare.

Mediile calculate.
Mediile calculate se determina pe baza tuturor variantelor înregistrate într-o
colectivitate.
Statistică teoretică şi economică

In funcţie de natura variaţiei şi de natura datelor înregsitrate (majoritatea pozitive,


iar unele nule sau negative) distingem mai multe feluri de medii calculate. Dintre cele
mai utilizate sunt:
• media aritmetică;
• media armonică;
• media geometrică;
• media patratică;
• media cubică;
• media parabolică;
• media cronologică etc.

Media aritmetică.
Media aritmetică se foloseşte, în general, când fenomenul studiat înregsitrează
modificari aproximativ constante în progresie aritmetică.
Media aritmetică este acea valoare abstractă care înlocuind toate variantele unei
colectivităţi nu modifică suma elementelor.
Media aritmetică simplă are următoarea relaţie de calcul:

∑x i
x= i

Media aritmetică ponderată are relaţia de calcul următoare:

∑x ⋅n i i
x= i

∑n i
i

Media atirmetică are urmatoarele avantaje:


• popularitate (curent folosită);
• este uşor de înţeles.
Insă, media aritmetică are şi marele dezavantaj că este sensibilă atât la variantele
mici cât şi la cele mari. Dacă acestea nu se regasesc şi unele şi altele în colectivitatea
generală pentru a se compensa, media aritmetică este influenţată (atrasă) de acele
variante care predomină. Pe acest motiv media aritmetică riscă să fie nereprezentativă
pentru colectivitatea generală.
Funcţie de utilitatea practică, media aritmetică prezintă anumite proprietăţi, care
se pot împărţi în două grupe:
• proprietăţi de verificare a exactităţii calculului;
• proprietăţi de simplificare a calculului.
Din prima categorie amintim:
a) media aritmetică trebuie să fie totdeauna mai mare decât valoarea minimă şi mai
mică decât valoarea maximă:
Statistică teoretică şi economică

x min < x < x max ;

b) suma abaterilor nivelurilor individuale ale variabilei aleatoare de la media lor este
egală cu zero, întrucât, prin definiţie, media anihilează toate abaterile în plus sau
în minus de la nivelul sau:

∑ (x
i
i − x) = 0

∑ (x
i
i − x) ⋅ ni = 0.

Din cea de-a doua categorie de proprietăţi amintim:


a) dacă fiecare variantă xi se măreşte sau se micşorează printr-o cantitate constantă,
atunci noua colectivitate va avea media mărită sau micşorată cu această cantitate;
b) dacă fiecare variantă xi se diminuează sau se majorează cu ajutorul unui coeficient
constant k (prin înmulţire sau împarţire) noua medie va fi si ea de k ori mai mică
sau mai mare;
c) dacă se modifică printr-o constantă c frecvenţa de apariţie ni a variantelor din
colectivitate, media rămâne neschimbată.
De asemenea, putem menţiona şi următoarele proprietăţi:
• media aritmetică este o valoare internă a seriei din care a fost calculată;
• media aritmetică este asociativă;
• media aritmetică este translativă;
• media aritmetică a unui şir de valori constante este egală cu oricare dintre aceste
valori;
• media aritmetică a sumei pentru “k” serii este egală cu suma mediilor tuturor seriilor;
• media aritmetică a produsului a “k” variabile independente este egală cu produsul
mediilor celor “k” variabile.

Media armonică.
Media armonică reprezintă acea valoare care înlocuind termenii reali din
colectivitate nu modifică suma inverselor. Media armonică se calculează sub forma
neponderată sau ponderată după urmatoarele relaţii:

n
xh = .
1
∑x
i

xh =
∑n i
.
1
∑ x ⋅n i
i
Statistică teoretică şi economică

In analiza economică se foloseşte o medie aritmetică special ponderată. Ponderea


nu se face cu ni ci cu agregatul xini care se află în baza de date. In această formă media
arnomică este un artificu de calcul pentru determinarea mediei aritmetice atunci când
baza de date nu permite aflarea directă a cesteia.
Media armonică are următoarele proprietăţi:
• media armonică este o valoare internă seriei din care a fost calculată;
• media armonică este asociativă;
• media armonică nu este translativă.

Media geometrică.
Media geometrică reprezintă acea valoare care înlocuind elementele colectivităţii
nu modifică produsul acestora. Media geometrică poate fi calculată sub forma
neponderată sau ponderată astfel:

x g = n Π xi .

x g = ∑ i Πxini .
n

Media geometrică se bucură de avantajul că nu este influenţată nici de valorile mici


nici de cele mari, şi deci, este cea mai exactă mărime medie. In schimb are şi anumite
dezavantaje:
• nu poate fi aplicată dacă unele variante sunt nule sau negative;
• se determină relativ greu.
In domeniul economic se aplică în calculul indicelui mediu de creştere sau
descreştere, la determinarea indicilor ideali Fisher ca instrument de analiză a dinamicii
comerţului exterior în S.U.A., Canada, Japonia, Australia, Coreea de Sud cu tendinţa de
generalizare.
Media geometrică are următoarele proprietăţi:
• media geometrică este o valoare internă seriei statistice din care a fost calculată;
• media geometrică este asociativă;
• suma abaterilor logaritmilor variantelor unei variabile faţă de logaritmul mediei lor
geometrice este egală cu zero;
• puterea “n” a mediei geometrice calculată din “k” valori pozitive este egală cu media
geometrică a puterii “n” a celor “k” valori;
• media geometrică a două numere x1 şi x2 este egală cu media geometrică calculată
din media aritmetică şi media lor aritmetică.

Media patratică.
Media patratică reprezintă acea valoare care înlocuind variantele reale din
colectivitate nu modifică suma pătratelor lor. Se calculează ca medie simplă sau
ponderată dupa relaţiile:
Statistică teoretică şi economică

xp =
∑x 2
i
.
n

xp =
∑x ⋅n
2
i i
.
∑n i

Media patratică are avantajul unei aplicabilităţi generale şi poate fi calculată si


pentru cazul unor variante nule sau negative.
Media presupune şi dezavantajul că este sensibilă la variantele mari care prin
ridicare la patrat devin foarte mari.
Media pătratică are proprietăţile:
• media pătratică este o medie internă a seriei din care a fost calculată;
• media pătratică este influenţată într-o foarte mare măsură de variantele cu o valoare
mare şi invers, deoarece, prin ridicare la pătrat aceste valori devin foarte mari.

Intr-o serie statistică obisnuită la care se pot calcula toate aceste medii trebuie să
existe următoarea relaţie:

x h ≤ x g ≤ x ≤ x p ≤ xcr .

Pentru a exprima ceea ce este esenţial într-o colectivitate este suficient să folosim
o singură mărime medie, dar ea să fie aleasă în concordanţă cu tipul variaţiei şi cu datele
disponibile.
Statistică teoretică şi economică

Probleme şi aplicaţii
3.1. O societate comercială specializată în producţia şi exportul de confecţii a
realizat în anul 1999 un export de 10 milioane USD, în anul 2000 de 12 milioane
USD, iar pentru anul 2001 îşi propune să orienteze spre pieţele externe 60% dintr-o
producţie marfă estimată la 25 milioane USD.
Până la 31 martie 2001, societatea a realizat deja exporturi în valoare de 5
milioane USD şi avea în portofoliul de comenzi de executat contracte în valoare de
alte 8 milioane USD, din care 1 milion USD cu termene de livrare în 2002.

Se cere să se analizeze activitatea de export a societăţii comerciale, folosind indicatorii


absoluţi şi relativi adecvaţi.

Rezolvare:
ƒ Pentru a caracteriza dinamica exportului, se va observa că în anul 2000 exportul era
cu 2 milioane USD mai mare decât în 1999, respectiv de 1,2 ori (cu 20%) superior
realizărilor anului precedent.
Exportul programat pentru anul 2001 se situează la 15 milioane USD
60
( ⋅ 25 = 15 ). Aceasta înseamnă că exportul anului 2001 va putea fi de 1,25 ori mai
100
mare decât cel din 2000 (15:12) şi, respectiv, de 1,5 ori superior exportului din 1999, cu
condiţia îndeplinirii integrale a programului propus.
ƒ Programul de export pe anul 2001 prezintă următoarea structură din punct de
vedere al execuţiei la data de 31 martie 2001:

Indicatori absoluţi Indicatori relativi


(milioane USD) (%)
Total, 15 100,0
din care:
- derulat 5 33,3
- contractat 7* 46,7
- pentru contractare 3 20,0
*
doar 7 din cele 8 milioane contracte din portofoliul de
comenzi au termen de derulare în anul 2001
ƒ În analiza activităţii se pot face şi comparaţii între diversele stadii de execuţie a
programului de export, recurgând la mărimi relative de coordonare.
Astfel, la 31 martie 2001 societatea comercială mai avea de contractat exporturi
de 3 milioane USD faţă de contracte deja încheiate în contul anului 2001 în valoare de
5+7=12 milioane USD, ceea ce duce la un raport de 1 la 4 între cerinţa de a (mai)
contracta şi “deja contractat”. La aceeaşi dată, raportul între volumul de contracte
derulate şi cele rămase de derulat era de 5 la 7 sau 1 la 1,4.

3.2 Piaţa zahărului din România se caracteriza prin următoarele date specifice
anilor 1996 şi 1997 şi estimări pentru anul 2000:

Anul Suprafaţa cultivată cu Zahăr rafinat Consumul de Populaţia


sfeclă de zahăr (mii produs din sfeclă zahăr (mii
ha) (tone) (tone) locuitori)
Statistică teoretică şi economică

1996 136.680 237.430 578.830 22.608


1999 50.000 90.121 500.000 22.456
2000 30.000 50.000 450.000 22.280
Sursa: Date preluate din revista „Capital” nr 47/23 noiembrie 2000

Se cere să se determine şi comenteze evoluţia (1996 = 100%) următorilor


indicatori:
Suprafaţa cultivată cu sfeclă de zahăr;
Răspuns: 1999: 36,6%; 2000: 21,9%
Producţia de zahăr rafinat obţinut din sfeclă cultivată în ţară;
Răspuns: 1999: 38%; 2000: 21,1%
Randamentul la hectar al producţiei de zahăr din sfeclă;
Răspuns: 1996: 1,74 tone/ha (100%)
1999: 1,80 tone/ha (103,4%)
2000: 1,67 tone/ha (96%)

Consumul de zahăr;
Răspuns: 1999: 85,1%; 2000: 76,6%

Aprecierea consumului de zahăr din producţia proprie de zahăr din sfeclă cultivată în
ţară;
Răspuns: 1996: 40,4% (100%)
1999: 18,0% (44,6%)
2000: 11,1 (27,5%)
Consumul de zahăr pe locuitor
Răspuns: 1996: 26,0 kg/locuitor (100%)
1999: 22,3 kg/locuitor (85,8%)
2000: 20,2 kg/locuitor (77,7%)

3.3. La 15 octombrie, presa de mare tiraj anunţa că porumbul a mai rămas de


recoltat de pe 32 mii ha, ceea ce reprezintă 17% din suprafaţa cultivată în acel an.

Se cere să se răspundă la următoarele întrebări:

Care este suprafaţa totală cultivată?


Răspuns: 2011,8 mii ha

În ce proporţie s-a realizat recoltarea?


Răspuns: 83%

Ce suprafaţă s-a recoltat până la 15 octombrie?


Răspuns: 1669,8 mii ha

Care este raportul dintre suprafaţa recoltată şi cea rămasă de recoltat?


Răspuns: 4,88 la 1
Statistică teoretică şi economică

3.4 Să se determine mărimile medii specifice seriei de variante simple de mai jos şi
să se observe relaţia dintre indicatorii determinaţi: 7; 9; 4; 6; 3; 5; 8; 2.
Să se observe efectul atribuirii unor frecvenţe diferite variantelor seriei de mai
sus, potrivit tabelului alăturat:

xi 7 9 4 6 3 5 8 2
ni 4 1 9 4 8 4 3 3

Rezolvare:

Seria de variante simple se caracterizează prin următoarele medii calculate:

Σx i 44
• Media aritmetică: x = = = 5,5
n 8

n 8
• Media armonică: x h = = = 4,374
1 1,829
∑x
i

• Media geometrică: x g = n Πxi = 8 362880 = 4,954

Σxi2 284
• Media pătratică: xp = = = 5,958
n 8

Se constată că: x h < x g < x < x p

Dintre mediile poziţionale, doar mediana poate fi aflată, locul ei fiind egal cu

n +1 8 +1
= = 4,5 .
2 2

Aceasta înseamnă că în seria de variante ordonate crescător: 2; 3; 4; 5; 6; 7; 8; 9,


mediana va fi media aritmetică simplă a variantelor a patra şi a cincea, aşezate de o parte
şi de cealaltă parte faţă de mijlocul seriei:

5+6
Me = = 5,5
2

Se obseră că x ≡ Me .
Într-o serie de variante simple nu există valoare modală.
Pentru seria de variante cu frecvenţe, mediile calculate rezultă din aplicarea
relaţiilor:
Statistică teoretică şi economică

Σxi ⋅ ni 171
• Media aritmetică: x = = = 4,75
Σn i 36

Faţă de media specifică seriei de variante simple, se constată o micşorare cu 0,75


unităţi (această diminuare se poate exprima procentual comparând scăderea absolută cu
− 0,75
media iniţială, adică = −13,6% ). Reducerea se datorează faptului că variantele
5,5
mici ale seriei sunt mai frecvente decât variantele mari.

Σn i 36
• Media armonică: x h = = = 4,026
ni 8,9409
∑x
i

Deoarece media armonică este sensibilă la variantele mici ale seriei, scăderea nu
mai este atât de pronunţată ca în cazul mediei aritmetice. Totuşi, scăderea mediei
armonice a seriei de frecvenţe este de 0,348 unităţi (-8%) faţă de aceeaşi medie a seriei
de variante simple.

x g = Σni Πx i
ni
• Media geometrică: = 36 7 4 ⋅ 91 ⋅ 4 9 ⋅ ....2 3 ⋅ = 4,406

Aplicarea relaţiei de calcul presupune logaritmarea formulei de mai sus:

Σni lg xi 23,09098
lg x g = = = 0,64142
Σn i 36

Se observă că, pentru a uşura procesul de calcul, media geometrică ponderată


este transformată în medie aritmetică ponderată a logaritmilor variantelor, ponderarea
mediei realizându-se cu frecvenţa înregistrării variantelor în colectivitatea cercetată.
Media geometrică a variantelor seriei de frecvenţe este şi ea mai mică decât cea a
seriei simple, dar reducerea este cu 0,548 unităţi (-11,1%).

Σxi2 ⋅ ni 941
• Media pătratică: xp = = = 5,113
Σn i 36

Ea este, la rândul ei, cu 0,845 unităţi (-14,2%) mai mică decât aceeaşi fel de
medie calculată pe seria de intervale simple.

Se constată că se păstrază relaţia dintre medii:

xh < x g < x < x p ,


Statistică teoretică şi economică

însă atribuirea unor frecvenţe diferite variantelor seriei generează reduceri variabile de la
o medie la alta.

Medii poziţionale

Aflarea medianei presupune ordonarea prealabilă a termenilor seriei:

xi 2 3 4 5 6 7 8 9
ni 3 8 9 4 4 4 3 1

Σni + 1 36 + 1
Locul medianei este egal cu = = 18,5 , iar mediana este media
2 2
aritmetică simplă a variantelor x18 şi x19. Adunând treptat frecvenţele, se constată că
3+8+9=20, ceea ce înseamnă că ambele variante au valoarea 4, deci:
Me = 4

Modul reprezintă varianta cu frecvenţa cea mai mare:


Mo = 4

Prin urmare, în acest exemplu, mediana şi modul au aceeaşi valoare, 4, fiind mai
mici decât media aritmetică ponderată.

3.5. Orientarea geografică a exporturilor şi importurilor de mărfuri ale României a


cunoscut importante schimbări în cursul deceniului precedent. Potrivit Raportului
pe anul 1999 al Băncii Naţionale, publicat la Bucureşti, în iulie 2000, ponderea
grupelor de ţări s-a modificat astfel:

Grupe de ţări Exporturi (%) Importuri (%)


1990 1990 1990 1999
Ţări dezvoltate 44,1 72,2 31,2 68,5
Ţări în tranzaţie 36,4 11,8 37,6 19,7
Ţări în dezvoltare 19,5 16,0 31,2 11,8
Total 100,0 100,0 100,0 100,0

Se cere:
Să se caracterizeze intensitatea modificării orientării geografice a exporturilor şi,
respectiv, a importurilor româneşti în 1999 faţă de 1990
Rezolvare:
Întrucât enunţul problemei cuprinde doar date procentuale, iar suma abaterilor
structurale ale anului 1999 faţă de 1990 (exprimat în puncte procentuale la nivelul
fiecărei grupe de ţări) este nulă la nivelul tuturor exporturilor (sau importurilor), cerinţa
poate fi soluţionată prin folosirea unei medii pătratice simple.
Dacă se notează cu xi diferenţa între ponderea unei grupe de ţări “i” ( i = 1,3 ) în
anul 1999 şi ponderea aceleiaşi grupe de ţări în anul 1990 în totalul unui flux de mărfuri,
atunci intensitatea modificării orientării geografice (IMOG) va fi:
Statistică teoretică şi economică

Σxi2
IMOG = , cu n = 3
n

În cazul exporturilor României, intensitatea modificării era de:

1407,02
IMOG = = ±21,7 puncte procentuale
3

Pentru importurile României, intensitatea modificării era de:

2088,06
IMOG = = ±26,4 puncte procentuale
3

Evident, schimbarea orientării geografice a fost mai intensă în cazul importurilor


decât al exporturilor. Explicaţia acestei deosebiri se găseşte în creşterea semnificativă a
ponderii bunurilor manufacturate în totalul importurilor româneşti, acestea fiind
achiziţionate, cu prioritate, din ţările dezvoltate. Concomitent, s-a restrâns importul de
materii prime şi semifabricate importate, preponderent, din celelalte două grupe de ţări.

3.6. Se cunosc următoarele date referitoare la comerţul exterior al unor ţări în anul
1995 în milioane dolari S.U.A.

Ţara Export Import


Republica Cehă 21686 25313
Polonia 22892 29050
România 8084 11435
Slovacia 8595 8500
Ungaria 12435 15046
Sursa: Anuarul de comerţ exterior al României 1997, C.N.S.,pag.399.

Se cere:
1. să se calculeze mărimile relative de structură pentru export şi import;
2. să se efectueze ierarhizarea celor cinci ţări după aceste mărimi de structură.

3.7. O societate comercială prezintă următoarea situaţie referitoare la nivelul


fondului de salarii şi a numărului de salariaţi pe grupe de vechime în muncă:
(date convenţionale)
Grupe de vechime Fondul de salarii Numărul de salariaţi
(ani) (mil. Lei) (pers)
Sub 10 30 10
10 – 20 80 15
20 – 30 120 25
peste 30 60 5
Statistică teoretică şi economică

Se cere:
1 să se determine mărimile relative de coordonare faţă de ultima grupă de vechime;
2. să se reprezinte grafic fondul de salarii şi numărul de salariaţi;
3. să se determine mărimile relative de intensitate.

3.8. Se cunosc următoarele date referitoare la suprafaţa şi populaţia unui grup de


ţări din Europa, în 1996:

Ţara Suprafaţa Populaţia


(mii kmp) (mil. loc.)
Austria 83,9 8,06
Bulgaria 110,9 8,36
Rep. Cehă 78,9 10,32
Elveţia 41,3 7,07
Franţa 551,5 58,37
Germania 356,7 81,91
Italia 301,3 57,38
Polonia 323,3 38,62
Moldova 33,7 4,33
România 238,4 22,55
Ungaria 93,0 10,19
Sursa: Economia mondială în cifre, C.N.S.,pag.3.

Se cere:
1. să se calculeze mărimile relative de intensitate;
2. să se reprezinte grafic rezultatele obţinute.

3.9. Producţia de energie electrică într-un număr de ţări europene în anii 1995 şi
1996 se prezintă în tabelul următor:

Ţara Consum energ.el. 1995 Consum energ.el. 1996


Austria 56,6 54,8
Bulgaria 41,8 43,6
Rep. Cehă 60,8 64,3
Franţa 492,6 488,9
Germania 534,9 547,0
România 59,3 61,4
Ungaria 34,0 34,9
Sursa: Economia mondială în cifre, C.N.S., pag.41.

Se cere:
1. să se calculeze mărimile relative de dinamică;
2. să se reprezinte grafic rezultatele obţinute.

3.10. Se cunoaşte că o firmă de comerţ exterior a realizat în 1997 o cifră de afaceri


de 25 milioane dolari S.U.A., propunându-şi pentru 1998 o cifră de afaceri de 30
miloane dolari S.U.A. şi a realizat numai 28 milioane dolari S.U.A.

Să se determine mărimile relative ale planului:


Statistică teoretică şi economică

1. intensitatea efortului necesar realizării planului;


2. procentul realizat din obiectivul propus.

3.11. Principalele fenomene demografice ale populaţiei României în 1994 şi 1995


sunt prezentate în următorul tabel:

Anii Născuţi-vii Decedaţi Căsătorii Divorţuri


1994 246736 266101 154221 39663
1995 236640 271672 153943 34906
Sursa: Statistica socială, C.N.S., 1996, pag.22.
Se cunoaşte că populaţia la 1 iulie 1994 era de 22730622 locuitori şi la 1 iulie 1995 era de
22680951 locuitori.

Se cere:
1. să se calculeze mărimile relative de intensitate posibile;
2. să se compare evoluţia acestor fenomene demografice.

3.12. Determinaţi media, mediana şi modul pentru seria: 7, 10, 3, 6, 7, 12, 5, 8, 9 şi


12.

3.13. Un student obţine la două exemene următoarele puncte: 66 şi 95. Care medie
este mai avantajoasă pentru student atunci când comunică media părinţilor săi:
media aritmetică sau media geometrică.

3.14. Calculaţi media geometrică a următorilor trei indici de preţuri: indicele


preţurilor în 1997 faţă de 1996 a fost de 130%, indicele preţurilor în 1998 faţă de
1997 a fost de 125% şi indicele preţurilor în 1999 faţă de 1998 a fost de 110%. Se
poate utiliza o relaţie de calcul mai rapidă?

3.15. Se cunosc următoarele date referitoare la speranţa de viaţă la naştere în


perioada 1990-1995 în câteva ţări din centru şi sud-estul Europei:

Ţara Bărbaţi (ani) Femei (ani)


Albania 69,2 75,0
Bulgaria 67,8 74,9
Grecia 75,0 80,1
Polonia 66,7 75,7
România 66,6 73,3
Turcia 64,5 68,6
Ungaria 64,5 73,8
Sursa: Economia mondială în cifre, C.N.S., pag.21.

Se cere:
1. să se calculeze toate tipurile de medie posibile şi să se verifice relaţie dintre ele pentru
ambele sexe;
2. să se calculeze valoarea medieană şi cea modală pentru ambele sexe.
Statistică teoretică şi economică

3.16. O societate comercială prezintă următoarea situaţie în ceea ce priveşte


structura personalului pe grupe de vârstă:

(date convenţionale)
Grupe de vârstă (ani) Număr de persoane
Sub 20 10
20-25 14
25-30 20
30-35 36
35-40 15
peste 40 5

Se cere:
1 să se determine vârsta medie a personalului din societatea comercială respectivă;
2. să se calculeze vârsta care împarte cei 100 de salariaţi în două grupe egale;
3. să se determine vârsta cea mai des întâlnită.

3.17. Se cunoaşte distribuţia notelor obţinute de studenţii anului II din cadrul


Facultăţii de Relaţii Economice Internaţionale la exemenul de statistică din sesiunea
1998:

Grupe de note Număr de studenţi


Sub 4 4
4-6 26
6-8 35
8-10 15
Se cere:
1. să se determine nota medie la examenul de statistică pentru cei 80 de studenţi;
2. să se determine nota cea mai des obţinută de studenţi;
3. să se reprezinte grafic distribuţia de mai sus.

3.18. Se cunosc vânzările unei societăţi comerciale în perioada 1986-1996: 4,2; 5,3;
6,9; 7,2; 7,5; 8,3; 9,5; 11,0; 12,7; 14,4; 16,3. Datele sunt în miliarde lei, preţuri
comparabile. Managerul firmei a anunţat într-o conferinţă de presă că vânzarea
medie anuală pe întrega perioadă a fost 8,3 miliarde lei.

Se cere:
1. să se precizeze ce tip de medie a anunţat managerul firmei la conferinţa de presă.
Statistică teoretică şi economică

CAPITOLUL 4.
ANALIZA STATISTICĂ A SERIILOR DE REPARTIŢIE
Cuvinte cheie:
- amplitudinea variaţiei
- abaterea medie liniară
- abaterea medie pătratică (standard)
- coeficientul de variatie
- coeficientul de concentrare GINI
- dispersia
- dispersia explicata
- dispersia reziduala
- seria de repartiţie
- variabila alternativă

Seria de repartiţie sau seria de distribuţie este rezultatul grupării elementelor


unei colectivităţi în funcţie de variantele sau intervalele de variaţie ale (unor)
caracteristici atributive, cantitative sau calitative.
Dacă se foloseşte o singură caracteristică de grupare, seria de repartiţie se numeşte
unicriterială sau unidimensională.
Dacă caracteristica de grupare este numerică, seria de repartiţie se numeşte şi
serie de variaţie.
O caracteristică de grupare calitativă (nenumerică) conduce la alcătuirea unei serii
de repartiţie numită serie de atribute sau serie nominativă.
Un caz particular al seriilor nenumerice îl reprezintă variabila alternativă: două
strări sau variante nenumerice care se elimină reciproc.
Dacă se foloseşte concomitent mai multe caractristici de grupare atributive rezultă
o serie de repatiţie multicriterială sau multidimensională.

4.1. Particularităţile seriilor de repartiţie.


• omogenitatea termenilor, toate variantele au o esenţă, o determinare comună,
cauzată de factori hotărâtori care generează însăşi colectivitate cercetată;
• independenţa termenilor seriei, în sensul că fiecare valoare este specifică unui
element al colectivităţii şi nu depinde de valoarea înregistrată la celelalte
elemente;
• variabilitatea termenilor seriei, cauzată de faptul că pe lângă factorii hotărâtori,
esenţiali acţionează şi factori întâmplători, accidentali care fac ca manifestarea
individuală să fie diversă;
• concentrarea sau dispersarea termenilor, seriei în funcţie de raportul de forţă
dintre factorii esenţiali, hotărâtori şi factorii întâmplători.

Reprezentarea grafică se face prin:


- histogramă
- poligon de frecvenţă
- diagramă de benzi
Statistică teoretică şi economică

- diagramă de structură
- curbă de concentrare
- curba frecvenţelor cumulate
- ogivă
- diagramă de corelaţii

4.2.Sistemul de indicatori pentru caracterizarea unei repartiţii unidimensionale.


Acest sistem de indicatori cuprinde două categorii:
a) indicatori ce caracterizează frecvenţele de apariţie ale unei unităţi de acelaşi
fel;
b) indicatori ce caracterizează valorile sau variantele caracteristicii cercetate.
Din primul set de indicatori amintim urmatorii:
-frecvenţele absolute (ni) = numărul de elemente cuprinse într-o grupă;
- frecvenţele relative (nix) = cota parte, greutatea specifică a unei variante sau
grup de variante;
- frecvenţele cumulate = în procesul analizei se cumulează treptat fie
frecvenţele absolute, fie cele relative în sensul crescător şi/sau în sensul descrescător al
valorilor caracteristicii cercetate. Această cumulare serveşte la exprimarea nivelului de
concentrare în cadrul colectivităţii şi la determinarea indicatorilor tendinţei centrale;
- densitatea de frecvenţă, = în analiza seriilor de repartiţie la organizarea pe
intervale neegale de grupare, se calculează reportul ni/ki sau nix/ki (ki = mărimea
intervalelor de grupare). Marjoritatea variabilelor economice tind această densitate să se
diminueze crescător sau descrescător simetric către capetele seriei.

Din cel de-al doilea set de indicatori din cadrul sistemului de indicatori care
caracterizeaza repartiţiile unidimensionale fac parte:

- indicatorii tendinţei centrale;


- indicatorii variaţiei şi ai asimetriei;
- indicatorii concentrării.

Indicatorii tendinţei centrale.


Aceşti indicatori au misiunea de a exprima printr-un număr ceea ce este comun,
esenţial pentru elementele colectivităţii cercetate şi pentru că realitatea este atât de
diversă nu ne oprim doar la medie, ci vom adăuga şi mediana şi modul, ca o modalitate
de a reda esenţa comună a elementelor unei colectivităţi.
Dacă seria de date statistice este organizată pe variante distincte atunci media,
mediana şi modul se află potrivit relaţiilor daje studiate. Majoritatea seriilor este însă
organizată pe intervale (egale sau nu) de variaţie ale unei caracteristici de grupare şi în
acest context determinarea mediei, medianei şi a modului îmbracă unele particularităţi pe
care le vom ilustra în exemplul următor:
Gruparea localităţilor României după numărul populaţiei la data de 7 ianuarie 1992 este
dată în tabelul următor:

Interv. de var. a Nr. loc. Centr. x i ⋅ ni Frecvenţe xi -x (xi - x )2⋅ni


nr. pop. (mii (ni) interaţ. xi cumulate
pers.)
sub 5 11 3,5 38,5 11 -38,975 16709,556
Statistică teoretică şi economică

5-10 53 7,5 397,5 64 -34,975 64832,281


10-20 87 15,0 1305 151 -27,475 65674,178
20-50 61 35,0 2135 212 -7,475 3408,413
50-100 23 75,0 1725 235 32,525 24331,138
100-200 13 150,0 1950 248 107,525 150301,12
200-300 4 250-0 1000 252 207,525 172266,5
300-400 7 350,0 2450 259 307,525 662001,37
TOTAL 259 - 11.001 - - 1159524,3

Obs.1. din datele prezentate lipseşte oraşul Bucureşti care având o populaţie de peste 5 ori mai mare
decât limita superioară a ultimului interval de grupare se constituie într-un element atipic
al colectivităţii localităţilor urbane din România;
Obs.2. intervalele de grupare folosite în statistica oficială a României pentru aceste date sunt neegale.
Pentru calculul mediei este necesară stabilirea centrelor intervalelor de grupare (xi), ca
medii aritmetice simple ale limitelor fiecărui interval de grupare. Primul interval se consideră închis
la limita inferioară de 200 pers.

11001
x= = 42,475 mii persoane
259
Media este varianta care împarte seria ordonată în două părţi egale.

n +1 259 + 1
Loc Me = ; Loc Me = 130 .
2 2
Într-o serie organizată pe intervale de grupare, după aflarea locului medianei se procedează
la identificarea intervalului ce conţine mediana. Adunând treptat frecvenţele ajungem la un număr
mai mare sau egal cu cel al locului meidanei, astfel rezultând intervalul în care se găseşte mediana.
Mediana se calculează după relaţia următoare:

0,5(n + 1) − ∑ np Me
Me = x 0 + k ⋅ , unde:
n Me

x0 = limita inferioară a intervalului ce conţine mediana (în cazul nostru 10)


k = mărimea intervalului median
0,5 (n +1) = locul medianei
ΣnpMe = suma frecvenţelor până la intervalul ce conţine mediana (în cazul nostru 11+53 =
64)
nMe = frecvenţa intervalului ce conţine mediana

130 − 64
Me = 10 + 10 ⋅ = 17,586 mii pers.
87
Mediala separă în două părţi egale suma produselor dintre valorile variabilei şi frecvenţele
corespunzătoare. Mediala se aplică la repartiţia valorilor globale ale variabilei analizate.

locMl − ∑ npMl
Ml = x 0 + k ⋅ .
n Ml

Modul sau dominantă, varianta cu frecvenţa cea mai mare.


Statistică teoretică şi economică

Într-o serie organizată pe intervale de grupare, valoarea modală se află tot prin interpolare
în interiorul cu frecvenţa cea mai mare. Intervalul modal din tabel este (10-20) (nu este obligatoriu să
coincidă cu cel al medianei).
Modul se calculează după relaţia:

∆1
Mo = x 0 + k ⋅ , unde:
∆2 + ∆3

x0 = limita inferioară a intervalului modal (10)


k = mărimea acestui interval (10)
∆1 = diferenţa dintre frecvenţa modală şi frecvenţa intervalului imediat anterior
(87-53 = 34).
∆2 = diferenţa dintre frecvenţa modală şi frecvenţa intervalului imediat următor
(87-61= 26).

34
Mo = 10 + 10 ⋅ = 15,667 mii pers.
34 + 26

Prin faptul că mediana şi modul sunt valori apropiate se confirmăpresupunerea că x nu


reprezintă o valoare tipică pentru colectivitatea celor 259 localităţi urbane.

Chiar dacă cele trei valori ale tendinţei centrale ar fi fost foarte apropiate în
preocuparea economistului trebuie să se afle nu numai valorile tipice (cu caracter de
generalitate cu mediile) ci şi variabilitatea în jurul mediei. Se pune problema de a
carcteriza mărimea, intensitatea şi forma variaţiei în jurul mediei.

Indicatorii variaţiei şi ai asimetriei


În funcţie de numărul de variante luate în calcul şi după rolul îndeplinit în analiza
variaţiei distingem:
• indicatori simpli ai variaţiei;
• indicatori sintetici ai variaţiei.
Indicatorii simpli ai variaţiei:
a) abaterea fiecărei variante sau fiecărui centru de interval de grupare de la
medie, exprimat în mărimi absolute sau relative:

d i = xi − x
d i % = (( x i − x ) ⋅ x ) ⋅ 100

Aceşti indicatori nu caracterizează variaţia în cadrul colectivităţii.


b) amplitudinea variaţiei exprimă mărimea câmpului de împrăştiere în jurul mediei.
Se exprimă în mărimi relative:

A = x max − x min în cazul nostru 400-2 = 398 mii pers.

x max − x min 398


A% = ⋅ 100 în cazul nostru ⋅ 100 = 937%
x 42,475
Statistică teoretică şi economică

În general se apreciază că o amplitudine a variaţiei care tinde la 100% este


specifică unor colectivităţi omogene şi pe măsură ce aceasta se îndepărtează de 100%,
colectivitatea este din ce în cea mai eterogenă.
Indicatorii sintetici ai variaţiei sunt indicatorii care iau în calcul toate centrele de
grupare xi şi în funcţie de gradul de abstractizare şi de relaţia de calcul distingem patru
categorii de indicatori sintetici:
1 - abaterea medie liniară ( d )
2 – dispersia (σ2)
3 – abaterea medie pătratică (standard)
4 – coeficientul de variatie (v).
1) abaterea medie liniara este media aritmetică a abaterilor variantelor sau a
centrelor de interval de grupare xi de la media colectivităţii. Pentru că abaterile se
compensează se iau în calcul valorile absolute ale acestor diferenţe:

d=
∑ (x i − x)
n

d=
∑ (d )n
i i
=
∑ ( x − x ) = 10257,375 = ±39,604 mii pers.
i

∑n i ∑n i 259

Interpretare: populaţia din cele 259 de localităţi este cu 39,604 mii pers. mai mică sau mai
mare decât media calculată ca fiind egală cu 42,475 mii pers.
2) Dispersia poate fi definită ca medie aritmetică a pătratelor abaterilor de la
media colectivităţii. Este o mărime abstractă, adimensională ce nu serveşte direct analizei
variaţiei.

σ2 =
∑ (x i − x)
n

σ2 =
∑ (x i − x ) 2 ⋅ ni
=
1159524,5
= 4476,9285
∑n i 259

σ 2
=
∑x ⋅n 2
i i
− (x) 2 =
1626791
− (42,475) 2 = 4476,9285
∑n i 259

3) abaterea medie pătratică

σ = σ2

Rezultatul este întotdeuna mai mare decât d

σ = 4476,929 = 66,91 mii pers.


Statistică teoretică şi economică

4) coeficientul de variaţie este indicatorul cel mai sintetic care exprimă într-o
formă abstractă intensitatea variaţiei. Se calculează astfel:

σ 66,91
v= ⋅ 100 = ⋅ 100 = 157,5%
x 42,475

Coeficientul de variaţie se defineşte în domeniul numerelor pozitive. Dacă v este


până în 35% se consideră că intensitatea variaţiei este redusă, colectivitatea este omogenă
şi în consecinţă media este reprezentativă. Cu cât depăşim 35% cu atât intensitatea
variaţiei creşte şi colectivitatea este eterogenă iar media tinde să fie o mărime
nereprezentativă.
Forma variaţiei în jurul mediei se exprimă statistic prin mai mulţi indicatori dintre
care diferenţa între medie şi mod care se numeşte asimetrie:

as = x − Mo ≤ 0

- dacă x = Mo atunci există simetrie perfectă


- dacă x > Mo atunci există asimetrie pozitivă sau de stânga
- dacă x < Mo atunci există asimetrie negativă sau de dreapta
Tot pentru măsurarea asimetriei se foloseşte şi un coeficient al lui PEARSON:

x − Mo 3 ⋅ ( x − Me)
C as = sau C as′
σ σ
C as ∈ [− 1,1] C as′ ∈ [− 3,+3]

În măsura în care coeficientul de asimetrie se încadrează în intervalul (0; 0,3)


spunem că avem de-a face cu o asimetrie moderată şi consecinţă indicatorii tendinţei
centrale caracterizează corect colectivitatea.
Dacă trecem de 0,3 asimetria este mai puternică iar indicatorii tendinţei centrale
tind să fie nesemnificativi.
În exmplul nostru:

26,808
C as = = +0,4007 rezultă că media nu este caracteristică pentru că are loc
66,91
o asimetrie mică.

4.3.Indicatorii variaţiei într-o colectivitate împăţită pe grupe


Exemplu. Din studiul efectuat în două staţii de aşteptare (benzinari) în rândul a 100 de
conducători auto a rezultat că timpul mediu de aşteptare a celor 100 conducători a fost de:
x 0 = 50 min . Dispersia generală a fost de σ o2 = 200 , abaterea medie pătratică: σo=14,1421 iar
coeficientul de variaţie a fost de v0 = 28,28%. Aceasta înseamnă că timpul real de aşteptare al celor
100 călători este cu 14,14 min. sau cu 28,28% mai mare sau mai mic decât media generală de 50 min.
Această intensitate a variaţiei face ca media x o = 50 să fie reprezentativă.
Datele rezultate în urma studiului efectuat sunt următoarele:
Statistică teoretică şi economică

Punct de observare Timp de aşteptare (min) Total ni


xi până la 40 (30) 40-60 (50) 60-80 (70)
j=1 j=2 j=3
Benzinaria Baneasa 15 20 5 40
Benzinaria Otopeni 10 30 20 60
Total 25 50 25 100

linii şi j coloane se notează cu nij


Σni = Σnj = ΣΣnij = 100
suma suma
Pentru a demonstra
ultimei ultimei în ce măsură influenţează punctul de aşteptare (observare) variaţia
coloane
timpilor de aşteptareliniise calculează pentru fiecare grupă tipică media de grupă x i şi se observă
deosebirile dintre acestea şi meida generală.

yi =
∑ y ⋅nj ij
y0 =
∑ y ⋅n j j

∑n ij ∑n j
j

5000
y0 = = 50 min
100

15 ⋅ 30 + 50 ⋅ 20 + 70 ⋅ 5
y1 = = 45 min
40

30 ⋅ 10 + 50 ⋅ 30 + 70 ⋅ 20 3200
y2 = = = 53,3 min
60 60

se observă că x 2 se apropie mai mult de media generală x o = 50


Calculăm dispersiile de grupă:

∑(y j
j − y i ) ⋅ nij
σ = 2

∑n
i
ij
i

(30 − 45) 2 ⋅ 15 + (50 − 45) 2 ⋅ 5 7000


σ =
2
1 = = 175
40 40

σ 2
=
∑(y j − y0 ) 2 n j
∑n
0
j

(30 − 53,3) 2 ⋅ 10 + (50 − 53,3) 2 ⋅ 30 + (70 − 53,3) 2 ⋅ 20 188,89


σ =2
2 = = 188,89
60 60
Statistică teoretică şi economică

Pe baza acestor indicatori se trece la determinarea în cadrul fiecărei grupe a abaterii medii
pătratice (σi) şi a coeficientului de variaţie (vi).
Pentru a rezuma aceste consideraţii sub forma unor indicatori statistici ce calculează
dispersia explicată de numărul de staţii de aşteptare (σ2) şi dispersia reziduală (σ2) ca părţi ale
dispersiei generale (σ2o).
Dispersia explicată σ2 se calculează ca dispersia de grupă faţă de media generală şi se
numeşte explicată pentru că mediile de grupă sunt determinate, condiţionate de numărul de staţii de
aşteptare:

σ 2
=
∑(y i − y 0 ) ⋅ ni
=
(45 − 50) 2 ⋅ 40 + (53,3 − 50) 2 ⋅ 60 1653,4
= = 16,6
∑n i 100 100
Disperisa reziduală σ arată influenţa factorilor reziduali (alţi factori decât numărul de
2

staţii). Se calculează ca o medie aritmetică ponderată a dispersiilor de grupă:

σ 2
=
∑σ ⋅ ni
2
i
=
175 ⋅ 40 + 188,89 ⋅ 60 18333,4
= = 183,4
∑n i 100 100

Între aceste dispersii există următoarea relaţie:


dispersia generală = dispersia explicată + dispersia reziduală, adică:
dispersia generală este egală cu dispersia mediilor de grupă şi media dispersiilor de grupă.

σ 02 = σ 2 + σ 2

în cazul nostru: 200 = 16,6 + 183,4


Pe baza acestor relaţii se pot calcula doi coeficienţi:
- coeficientul de determinare (R2) care exprimă cota parte a variaţiei explicate în totalul
variaţiei:

σ2 16,6
R2 = ⋅ 100 = = 8,3%
σ0
2
200

Deci, în proporţie de 8,3% variaţia timpilor de aşteptare poate fi explicată prin factorul
″numărul de staţii de aşteptare″.
- coeficientul de nedeterminaţie (k2) care este o valoare complementară faţă de R2.

σ2 183,4
k = 2 ⋅ 100 =
2
⋅ 100 = 91,7%
σ0 200

Deoarece coeficientul de determinaţie este mai mic de 50% este necesară testarea statistică a
semnificaţiei influenţei factorului de grupare asupra variabilei cercetate.
Această testare statistică se face cu ajutorul testului Fisher-Snedecor (F). Acest test verifică
consistenţa influenţei factorului suplimentar de grupare comparând cele două părţi ale dispersiei
generale. Mai precis, se iau în considerare numărătorii acestor dispersii (denumiţi varianţe sau
devianţe) corectaţi cu un număr corespunzător al gradelor de libertate de variaţie.

∆2 ⋅ x ∆2 ⋅ z
F= :
r −1 n − r
Statistică teoretică şi economică

∆x2 = deviaţia explicată = numărătorul dispersiei explicate

∆2x = ∑ ( y i − y 0 ) 2 ⋅ ni

∆z2 = variaţia reziduală = numărătorul dispersiei reziduale

∆2z = ∑ σ i2 ⋅ ni

n = numărul elementelor colectivităţii


r = numărul de grupe constituite
1653,4 18333,4
F= : = 8,84
2 − 1 100 − 2

pentru σ = 0,05 coloana r-1 = 1


linia n-r = 98, rezultă Ftabelat = 3,86934
Valoarea calculată a lui F se compară cu valoarea tabelată pentru (r-1) (n-r) grade de
libertate, tabelarea făcându-se separat pentru diverse praguri σ de semnificaţie a erorii. De exemplu
acceptăm o eroare de σ = 0,05 atunci vom găsi în coloana r-1 pe linia n-r valoarea critică a lui F
pentru care factorul de grupare mai are semnificaţia reală (Ftabelat este o valoare minimă).
Dacă Fcalculat ≥ Ftabelat înseamnă că factorul de grupare are o influenţă consistentă (e o cauză
reală) cu eroarea acceptată.

4.4.Media şi dispersia unei variabile alternative.


Variabila alternativă este un caz particular al unei caracteristici atributive sau
nominative care nu prezintă decât două stări care se elimină reciproc. În felul acesta
elementele colectivităţii se împart în două categorii distinctive de tipul Da/Nu,
Fem/Masc, Urban/Rural etc.
Exemplu. În anul universitar 1991/1992 au fost înmatriculaţi în învăţământul superior de
stat 215226 studenţi, din care 99032 (46%) de sex feminin şi 116194 (54%) de sex masculin. Cele
două stări nu sunt exprimate numeric. Totuşi pentru a putea calcula media şi dispersia unei
asemenea variabile se acceptă atribuirea valorii 1 pentru starea sau varianta care ne interesează în
procesul de analiză şi o valoare (zero) pentru starea cealaltă.

Varianta caracter. valoarea Frecvenţe


atribuită
absolute (ni) relative (nxi)
x1 = F 1 M M
N
=p
x2 = B 0 N–M N−M
= q =1− p
N
TOTAL - N p+q=1

pentru valaorea observată xi avem media

x=
∑x ⋅ni i
=
1⋅ M + 0 ⋅ (N − M ) M
= =p
∑n i N N

Din totalul de N elemente ale unei colectivităţi se notează cu M numărul de elemente care
posedă starea care ne interesează (în cazul nostru n1 = M iar n2 = N-M, rezultă n1 + n2 = N
Statistică teoretică şi economică

prin urmare media unei caracteristici alternative este egală cu cota parte a elementelor care posedă
varianta (starea) ce ne interesează în analiză.

99032
P= = 0,46
215226
Dacă se foloseşte frecvenţa relativă atunci:

x = ∑ x i ⋅ nix = 1 ⋅ p + 0 ⋅ q = p

Dispersia acestei caracteristici se calculează tot după formula clasică:

σ2 =
∑ (x − x)
i
2

=
(1 − p) 2 ⋅ p + (0 − p) 2 ⋅ q q 2 p + p 2 ⋅ q
= = pq = 0,2484
∑n i p+q p+q

Dispersia unei caracteristici alternative este produsul cotelor părţi ale celor două stări sau
vriante în colectivitatea generală.
Media şi dispersia caracteristicii alternative se folosesc în estimarea unor parametrii ai
colectivităţii generale atunci când cercetarea se bazează pe eşantioane reprezentative.

4.5. Indicatorii statistici ai unei serii de atribute.


În exemplul de mai jos elementele colectivităţii sunt grupate după o caracteristică
nenumerică (atributivă sau nominativă) şi în consecinţă nu mai putem folosi media,
mediana, modul indicatorii asimetriei şi ai variaţiei pentru a caracteriza această repartiţie.
Cel mult să identificăm care este starea sau forma cea mai frecventă (starea modală) în
colectivitate.
Exemplu: numărul mediu de slariaţi din România pe activităţi specifice ale economiei naţionale în
1991 este următoprul: (în mii pers.)

Nr. Activitatea economică Nr. mediu salariaţi % activ în total


salariaţi
1 agricultură 603,0 8,2
2 silvicultură şi expl. forestieră 98,8 1,3
3 piscicultură şi pescuit 7,9 0,,,1
4 industria extractivă 277,6 3,8
5 industria prelucrătoare 3188,1 43,,1
6 energie electrică , term., gaze, apă 152,3 2,1
7 construcţii 482,6 6,5
8 servicii 2579,2 34,9
TOTAL 7389,5 100,0

Pentru a caracteriza o asemenea serie de repartiţie pe atribute se pot folosi:


• mărimi relative de coordonare
• mărimi relative de structură
• coeficienţi de concentrare
Mărimile relative de coordonare rezultă din compararea stărilor sau atributelor
între ele. Însă nu se admite orice fel de comparaţie, între stările comparate trebuie să
existe o legătură logică.
Statistică teoretică şi economică

Mărimile relative de stuctură exprimă ponderea (cota parte) a diferitelor stări în


totalul colectivităţii (vezi ultima coloană a tabelului). Suma mărimilor de structură trebuie
să fie egală cu 1 sau 100.
Coeficienţii de concentrare sintetizează aceste mărimi relative de structură într-o
unică expresie numerică şi constituie principalul instrument de analiză pentru
caracterizarea globală a repartiţiilor de felul acesta.

Coeficienţi de concentrare
1. GINI (1922, fondat de şcoala statistică din Italia)
n xi
c = ∑ g i2 , gi = i ,
∑ ni ∑ xi
gi = cota parte neprocentuală a fiecărei stări în totalul colectivităţii.

1
≤c≤i
n

n = numărul de stări specifice colectivităţii (n = 8 în cazul exemplului nostru).


Interpretarea rezultatului este greoaie întrucât limita inferioară a intervalului
depinde de numărul stărilor. În consecinţă s-au căutat diverse formule de normalizare
prin care coeficientul de concentrare să se înscrie în intervalul (0,1) pentru oricâte stări.
2. GINI-STRUCK

n∑ g i2 − 1
c′ = , 0 < c′ < 1
n −1

Interpretarea devine foarte simplă. Cu cât C′ tinde către 1 cu atât elementele


colectivităţii se concentrează mai intens pe câteva stări ale colectivităţii (specifice ei).
Dacă C′ tinde către 0 elemente se repartizează echilibrat sau uniform pe toate
stările specifice.
În cazul exemplului nostru:

8 ⋅ 0,32 − 1
c′ = = 0,4728 , adică alternează la mijlocul intervalului de definire, însă nu
8 −1
se poate vorbi de o repartiţie echilibrată.

Probleme şi aplicaţii
4.1. Pentru a verifica reglarea unei maşini de debitat, din producţia realizată de-a lungul
unei zile (N = 600 piese) se prelevă un eşantion n = 65 piese, care măsoară în mm:
90,9 93,2 72,4 91,7 93,2 67,4 75,0 83,3 75,0 90,2 99,2 88,6 62,8
95,5 76,1 78,8 97,0 65,2 77,8 86,4 87,1 76,1 86,4 96,2 83,3 87,9
70,5 83,3 91,7 93,9 91,7 84,1 85,6 87,9 89,4 85,6 84,1 100,0 80,3
92,4 88,6 92,4 97,7 7,9 95,5 87,1 91,7 96,2 92,4 86,4 81,8 76,5
89,4 92,4 93,2 88,6 87,1 97,0 96,2 86,1 90,9 87,9 98,5 98,5 81,8
Statistică teoretică şi economică

Se cere descrierea acestui eşantion prin indicatori specifici seriilor de distribuţie de


frecvenţe.
Rezolvarea 1
Gruparea pieselor pe variante distincte de lungime reduce (comprimă) seria de
lungimi observate ale celor 65 piese la 34 de variante distincte, cu următoarele frecvenţe:

Varianta cu frecvenţa Varianta cu frecvenţa


62,8 1 87,1 3
65,2 1 87,9 4
67,4 1 88,6 3
70,5 1 89,4 2
72,4 1 90,2 1
75,0 2 90,9 2
76,1 2 91,7 4
76,5 1 92,4 4
77,8 1 93,2 3
78,8 1 93,9 1
80,3 1 95,5 2
81,8 2 96,2 3
83,3 3 97,0 2
84,1 2 97,7 1
85,6 2 98,5 2
86,1 1 99,2 1
86,4 3 100,0 1

Aceasta este o serie de distribuţie de frecvenţe pe variante ale caracteristicii


lungimea pieselor măsurate, seria putând fi caracterizată prin indicatori ai tendinţei
centrale, indicatori ai variaţiei şi asimetriei.
Indicatorii tendinţei centrale sunt:

Σxi ni 5659
• Media: x = = = 87,0615 ≈ 87,1 mm
Σn i 65

Σni + 1 65 + 1
• Locul medianei: locMe = = = 33;
2 2

Mediana este a 33-a variantă în seria ordonată crescător. Deci, Me = 87,9 mm.
• Pentru a afla modul se va observa că frecvenţa maximă înregistrată este 4,
întâlnită la trei variante. Deci, seria de variante distincte ale caracteristicii
observate este o serie trimodală (cu trei moduri):
Mo = 87,9 mm; Mo = 91,7 mm; Mo = 92,4 mm.
Indicatorii variaţiei:

• Amplitudinea absolută a variaţiei:

A = x max − x min = 100.0 − 62.8 = 37,2 mm


Statistică teoretică şi economică

• Amplitudinea relativă a variaţiei:

A 37,2
A% = ⋅ 100 = ⋅ 100 = 42,7%
x 87,1

• Dispersia caracteristicii în jurul mediei:


Σ( x i − x ) 2 ⋅ ni 4606,94
σ =2
= = 70,876
Σn i 65

• Abaterea medie pătratică (abaterea standard):

σ = σ 2 = 8,42 mm

Cele 65 piese măsurate sunt în medie cu 8,42 mm mai scurte sau mai lungi decât media
calculată (87,1 mm).
• Coeficientul de variaţie:

σ
v= ⋅ 100 = 9,67%
x

Intensitatea variaţiei în jurul mediei este de numai 9,6%


Observaţii: 1) În prima variantă de rezolvarea a problemei, rezultatele sunt determinări
exacte, pe baza variantelor distincte ale caracteristicii observate.
2) Cele 65 piese măsurate alcătuiesc o colectivitate omogenă, întrucât variaţia
în jurul mediei este de numai 9,67%, cu mult sub nivelul de 35%. Altfel spus, media este
reprezentativă pentru toată colectivitatea.
Rezolvarea 2.
Dacă variantele se grupează pe intervale egale de câte 5 mm, atunci toţi indicatorii
ce descriu seria sunt estimări ale determinărilor obţinute la Rezolvarea 1.

Număr piese în Centre ale intervalelor de


fiecare grupă grupare xi⋅ni
(ni) (xi)
Intervale
de variaţie a
lungimii piesei
(mm)
Până la 65 1 62,5 62,5
65,1 – 70,0 2 67,5 135,0
70,1 – 75,0 4 72,5 290,0
75,1 – 80,0 5 77,5 387,5
80,1 – 85,0 8 82,5 660,0
85,1 – 90,0 18 87,5 1575,0
90,1 – 95,0 15 92,5 1387,5
95,1 – 100,0 12 97,5 1170,0
Total 65 --- 5667,5
Statistică teoretică şi economică

Indicatorii tendinţei centrale:


• Media estimată pe baza centrelor intervalelor de grupare este:
Σx n 5667,5
x= i i = = 87,1923 ≈ 87,2 mm ∗
Σn i 65

• Locul medianei este tot 33, dar se va observa că această variantă este cuprinsă
în intervalul (85,1 – 90,0). Prin interpolarea în acest interval, rezultă mediana:

0,5(Σn + 1) − F 33 − 20
Me = x Me + k Me ⋅ i = 85,1 + 5 ⋅ = 88,7 mm
f Me 18

unde F este suma frecvenţelor până la intervalul care conţine mediana.


• Pentru estimarea modului, se va observa că intervalul (85,1 – 90,0) este cel
care are frecvenţa maximă (cuprinde cele mai multe elemente ale
colectivităţii). Prin interpolare rezultă modul:

∆ 10
Mo = x Mo + k Mo ⋅ 1 = 85,1 + 5 ⋅ = 88,9 mm
∆ +∆ 10 + 3
1 2

Se constată că cei trei indicatori ai tendinţei centrale au valori estimate apropiate,


dar x < Me < Mo , ceea ce înseamnă că seria prezintă o uşoară asimetrie de dreapta
(modul este mai mare decât media aritmetică a colectivităţii cercetate).
Indicatorii variaţiei:
• Amplitudinea absolută a variaţiei estimată pe baza centrelor intervalelor de
grupare:

A = 97,5 – 62,5 = 35 mm

• Amplitudinea relativă a variaţiei:

A% = (35:87,2)*100 = 40,14%

Se observă o amplitudine restrânsă a variaţiei în jurul mediei estimate.


Pentru estimarea indicatorilor sintetici ai variaţiei se poate folosi următorul tabel
de calcul:


Eroarea de estimare (e) indusă de folosirea centrelor intervalelor de grupare, în locul variantelor reale, se
obţine comparând mediile din rezolvările 1 şi 2:
x −x 87.2 − 87.1
e = 2 1 ⋅ 100 = ⋅ 100 = +0,11% (o eroare neglijabilă).
x1 87.1
Statistică teoretică şi economică

Număr
piese (xi) xi − x ( xi − x ) 2 ni 2
xi ni
(ni)

Intervale de
variaţie a lungimii
piesei (mm)
Până la 65 1 62,5 -24,7 610,09 3906,25
65,1 – 70,0 2 67,5 -19,7 776,18 9112,50
70,1 – 75,0 4 72,5 -14,7 864,36 21025,00
75,1 – 80,0 5 77,5 -9,7 470,45 30031,25
80,1 – 85,0 8 82,5 -4,7 176,72 54450,00
85,1 – 90,0 18 87,5 0,3 1,62 137812,50
90,1 – 95,0 15 92,5 5,3 421,35 128343,75
95,1 – 100,0 12 97,5 10,3 1273,08 114075,00
Total 65 --- --- 4593,85 498756,25

Dispersia colectivităţii în jurul mediei poate fi determinată în două moduri:


- fie folosind totalul penultimei coloane a tabelului:

Σ( xi − x ) 2 ⋅ ni 4593,85
σ2 = = = 70,6746 ,
Σn i 65

-fie totalul din ultima coloană a tabelului pentru a înlocui în relaţia:

2
Σxi ⋅ ni 49756,25
σ2 = − (x)2 = − 87,2 2 = 69,3333
Σn i 65

Diferenţa dintre cele două rezultate este cauzată de rotunjirile repetate la prima
versiune a calculului.
Abaterea medie pătratică este radicalul de ordinul doi din dispersie:

σ 2 = σ 2 = 69.3333 = 8,3 mm ,

ceea ce arată că între lungimile reale ale celor 65 piese observate şi media estimată există
o distanţă medie de aproximativ 8,3 mm.

Coeficientul de variaţie este de:

σ 8,3
v= ⋅ 100 = ⋅ 100 = 9,5%
x 87,2
Statistică teoretică şi economică

Deci, intensitatea variaţiei în jurul mediei este redusă (sub 35%), colectivitatea
este omogenă, bine caracterizată prin valoarea medie a lungimii pieselor.

Coeficientul de asimetrie exprimă forma împrăştierii:


as = x − Mo = 87,2 − 88,9 = −1,7 mm
x − Mo − 1,7
C as = = = −0,2048
σ 8,3

Se observă o diferenţă de numai 1,7 mm între medie şi mod, modul fiind mai
mare, ceea ce înseamnă că seria prezintă o moderată asimetrie de dreapta (-0,2048).

4.2. O anchetă derulată în rândul salariaţilor unui lanţ de magazine conduce la


următoarea grupare a acestora în funcţie de salariul lunar (milioane lei) şi sex:

Număr de din care:


Intervale de variaţie salariaţi bărbaţi femei
a salariului lunar (mil lei)
până la 3,5*) 58 31 27
3,5 – 4,5 119 71 48
4,5 – 5,5 140 112 28
5,5 – 6,5 102 92 10
6,5 – 7,5 58 55 3
7,5 – 8,5 39 37 2
8,5 şi peste 24 22 2
Total 540 420 120
*)
limita superioară nu este cuprinsă în interval

Se cere:
Să se determine indicatorii tendinţei centrale şi să se comenteze rezultatele
folosind indicatorii variaţiei în jurul mediei şi indicatorii asimetriei.
Rezolvare
Salariul mediu lunar al celor 540 salariaţi investigaţi este de:

Σxi ni 28960
x= = = 5,363 mil lei / luna
Σn i 540

0,5(Σn + 1) − F 270,5 − 177


Me = x Me + k Me ⋅ i = 4,5 + 1 ⋅ = 5,168 mil lei / lună
f Me 140

∆ 21
Mo = x Mo + k Mo ⋅ 1 = 4,5 + 1 ⋅ = 4,856 mil lei / lună
∆ +∆ 21 + 38
1 2

Deoarece Mo < Me < x , rezultă că seria prezintă o asimetrie de stânga (a se


vedea mai jos intensitatea asimetriei).
Statistică teoretică şi economică

Intervalele marginale sunt deschise, ceea ce impune o estimare a amplitudinii


variaţiei cu cu ajutorul centrelor intervalelor de grupare:

A= x −x = 90 − 30 = 60 mil lei
max min
A
A % = ⋅ 100 = 111,9%
x
Întrucât amplitudinea variaţiei comparată cu media colectivităţii depăşeşte 100%,
se poate afirma că mărimea împrăştierii este destul de mare.
Dispersia se determină cu ajutorul formulei de calcul simplificat astfel:

2
Σx i ⋅ n i 16880
σ 02 = − ( x0 ) 2 = − 5,363 2 = 2,4979
Σni 540

iar abaterea medie pătratică este:

σ 0 = σ 02 = 1,58 mil lei

Coeficientul de variaţie:

σ0
v0 = ⋅ 100 = 29,5%
x0

Pentru că intensitatea împrăştierii este sub 35%, putem accepta că, pe total,
colectivitatea salariaţilor este relativ omogenă din punct de vedere al salariului lunar.
Indicatorii asimetriei propuşi de Pearson sunt:

Asimetria absolută: as = x − Mo = 5,353 − 4,856 = +0,507 mil lei


x − Mo 0 ,507
Coeficientul de asimetrie: C as = = = +0 ,3209 .
σ 1,58

Valoarea coeficientului indică o asimetrie moderată de stânga (pozitivă).


Să se determine x j şi σ 2j pentru salariaţii de sex masculin şi feminin şi să se
verifice regula de adunare a dispersiilor.
Rezovare:
Indicatorii specifici celor două grupe de salariaţi se obţin astfel:

• Pentru salariaţii de sex masculin:

Σxi ni1 2368


x1 = = = 5,638 mil lei
Σni1 420
Statistică teoretică şi economică

Σ( xi − x1 ) 2 ⋅ ni1
σ = 2
1 = 2,4309
Σni1

σ 1 = 1,559 mil lei


v1 = 27,7%

• Pentru salariaţii de sex feminin:

Σxi ni 2 528
x2 = = = 4,4 mil lei
Σn i 2 120

Σ( xi − x2 ) 2 ⋅ ni 2
σ 22 = = 1,54
Σni 2

σ 2 = 1,241 mil lei

v 2 = 28,2%

Dispersia explicată prin împărţirea salariaţilor după sex:

Σ( x j − x 0 ) 2 ⋅ n j ∆2y / x 43,0468
δ = 2
= = = 0,2649
Σn j Σn j 540

Dispersia reziduală:

Σσ 2j ⋅ n j ∆2y / z 1205,778
σ = 2
= = = 0,2649
Σn j Σn j 540

Regula de adunare a dispersiilor:

σ 02 = δ 2 + σ 2

2,4779 ≅ 0,2649 + 2,2329

Ca urmare a repetatelor rotunjiri, pot apare unele mici diferenţe, cum este şi în
acest caz.
Să se afle în ce măsură influenţează sexul salariaţilor variaţia în jurul mediei (D)
şi să se testeze dacă diferenţa (disparitatea salarială) este statistic consistentă (testul F şi,
eventual, testul t).
Rezovare:
Coeficientul de determinaţie:
Statistică teoretică şi economică

δ2 0 ,2649
D= ⋅ 100 = ⋅ 100 = 10 ,6%
σ0
2
2,979

Doar 10,6% din variaţia totală a salariilor poate fi explicată prin diferenţierea
salariaţilor după sex.
- Testul Fisher-Snedecor se aplică pentru a vedea dacă o asemenea influenţă redusă
este statistic semnificativă:
-
∆2y / x ∆2y / z 143,9468 1205,778 13,0468
F= : = : = = 63,825
r −1 n − r 2 −1 540 − 2 2,2412

Pentru probabilitatea p = 0,95 (eroare acceptată α = 0,05), F1, 538 ∈ (3,84; 3,92).
Cum Fcalculat > Ftabelat ⇒ factorul de grupare (sexul) are o influenţă consistentă
asupra variaţiei salariilor lunare ale celor 540 angajaţi.
- Testul Student pentru verificarea semnificaţiei diferenţei între două medii:

x1 − x 2 5,638 − 4,4 1,238


t= = = = 9,0723
σ 12 σ 22 2,4309 1,54 0,1365
+ +
n1 n2 420 120

Valoarea calculată este mult mai mare decât t = 1,96 (pentru o eroare acceptată α
= 0,05) sau t = 2,58 (pentru o eroare acceptată α = 0,01), ceea ce înseamnă că mediile
diferă consistent din punct de vedere statistic (grade de libertate n-r = 540-2 = 538).

Să se prezinte grafic disparitatea între salarizarea femeilor şi bărbaţilor.


Rezovare:
Disparitatea salarizării bărbaţi-femei poate fi observată prin compararea
repartiţiilor de frecvenţe relative pe intervale de variaţie a salariului lunar brut,
determinate pe baza ultimelor două coloane ale tabelului din enunţ:

Intervale de variaţie a Ponderea persoanelor cuprinse în diferite grupe de


salariului lunar (mil lei) salarizare faţă de total
la bărbaţi (%) la femei (%)
până la 3,5 7,4 22,5
3,5 – 4,5 16,9 40,0
4,5 – 5,5 26,7 23,3
5,5 – 6,5 21,9 8,3
6,5 – 7,5 13,1 2,5
7,5 – 8,5 8,8 1,7
8,5 şi peste 5,2 1,7
Total 100,0 100,0

În timp ce femeile se află preponderent grupate în primele trei intervale de


salarizare, bărbaţii se repartizează mai unioform pe întreaga gamă de salarizare, iar cei
mai mulţi se află în grupele 3, 4 şi 5, potrivit ordinii de prezentare din enunţul problemei.
Statistică teoretică şi economică

Structura câştigurilor salariale ale


angajaţilor de sex masculin

9% 5% 7%
17%
13%

22% 27%

sub 3.5 mil 3.5 - 4.5 mil 4.5 - 5.5 mil 5.5 - 6.5 mil
6.5 - 7.5 mil 7.5 - 8.5 mil 8.5 mil si peste

Structura câştigurilor salariale ale


angajaţilor de sex feminin
8% 3% 2%2%
23%

23%

39%

sub 3.5 mil 3.5 - 4.5 mil 4.5 - 5.5 mil 5.5 - 6.5 mil
6.5 - 7.5 mil 7.5 - 8.5 mil 8.5 mil si peste

Disparitatea mai poate fi remarcată şi prin observarea ponderii diferitelor grupe de


salarizare în totalul fondului de salarii achitat salariaţilor de sex masculin şi, respectiv,
feminin. Faţă de rezolvarea de mai sus (care are în vedere doar numărul de bărbaţi şi
femei cuprins în intervale de salarizare), această variantă ia în considerare şi salariile
plătite:
Statistică teoretică şi economică

Fondul de salarii (mil lei) Ponderea în total (%)


bărbaţi femei bărbaţi femei

Intervale de variaţie a
salariului lunar (mil lei)
până la 3,5 93 81 3,9 15,3
3,5 – 4,5 284 192 12,0 36,4
4,5 – 5,5 560 140 23,6 26,5
5,5 – 6,5 552 60 23,3 11,4
6,5 – 7,5 385 21 16,3 4,0
7,5 – 8,5 296 16 12,5 3,0
8,5 şi peste 198 18 8,4 3,4
Total 2368 528 100,0 100,0

Se constată că, în totalul salariilor încasate de femei, salariile mici cuprinse în


primele două intervale de grupare au ponderi considerabil mai mari decât în cazul
salariilor bărbaţilor. Situaţia se inversează la următoarele intervale de grupare (salarii
mijlocii şi mari): ponderea acestor grupe de salarizare este mult mi mică în cazul femeilor
decât la bărbaţi.

4.3. Calculaţi abaterea medie pătratică şi dispersia din următoarele valori: 2, 5, 7, 9


şi 10.

4.4. Se consideră o firmă de comerţ exterior care are 15 sucursale în oraşe diferite
grupate după profitul obţinut astfel:
(date convenţionale)
Grupe după profit (mil.$) Număr filiale
Sub 10 2
10-20 3
20-30 7
30-40 2
peste 40 1

Se cere:
1. să se determine indicatorii simplii ai variaţiei;
2. să se determine indicatorii sintetici ai variaţiei.

4.5. Fie x10 = 5 şi σ 2 10 = 20 media şi dispersia numerelor a1 ,..., a10 .


Presupunem că se adaugă termenul următor este a11 = 16 .
1. Care va fi media aritmetică x11 a numerelor a1 ,..., a11 ?
2. Presupunem că a11 = 5 . Calculaţi x11 şi σ 112 .
3. Determinaţi media aritmetică x n +1 a n+1 termeni ca o funcţie de x n , a n +1 şi de n.

4.6. Fie v coeficientul de variaţie al n numere. Dacă fiecare din aceste numere este
înmulţit cu 2, să se precizeze care va fi noul coeficent de variaţie?
Statistică teoretică şi economică

4.7. Pentru determinarea calităţii unor produse destinate exportului au fost


examinate un număr de 1000 produse din care 850 au fost confirmate ca făcând faţă
cerinţelor standardelor internaţionale.
Se cere:
1. procentul mediu de produse bune;
2. dispersia colectivităţii;
3. coeficientul de variaţie.

4.8. În urma efectuării unei anchete statistice într-un oraş de provincie în rândul a
300 de persoane privind timpul de deplasare zilnică rezultă următoarea situaţie:

Timp de deplasare zilnică (min.) Număr de persoane


0-30 30
30-60 60
60-90 100
90-120 70
120-150 40
Total 300

Se cere:
1. să se caracterizeze gradul de omogenitate al repartiţiei;
2. să se calculeze indicatorii tendinţei centrale;
3. să se măsoare gradul de asimetrie.
Statistică teoretică şi economică

CAPITOLUL 5.
CERCETAREA SELECTIVĂ
Cuvinte cheie:
- cercetarea selectivă
- sondajul
- selecţia simplă repetată (urna cu bilă revenită).
- selecţia simplă nerepetată (urna cu bilă nerevenită),
- reprezentativitatea eşantionului
- eroare de reprezentativitate
- eroare medie de reprezentativitate
- eroarea limită admisă

În societatea contemporană, cea mai mare parte a informaţiilor despre mediul de


afaceri este obţinută nu prin înregistrări exhaustive, ci prin investigaţii parţiale, cunoscute
sub numele de anchete statistice. Ele sunt preferate ca urmare a faptului că oferă
informaţii suficient de corecte într-un timp relativ scurt, astfel încât managerul unei
întreprinderi sau omul de afaceri poate valorifica în timp real o oportunitate sau poate
evita, elimina sau măcar reduce o parte din riscurile implicării în circuitul economic.
În prezentul capitol sunt prezentate fundamentele sondajului statistic ca
instrument metodologic de realizare a anchetelor în rândul întreprinderilor, al menajelor,
al consumatorilor, al privitorilor la emisiunile TV, al ascultătorilor de radio etc.
Parcurgând acest capitol, economistul are posibilitatea de a înţelege avantajele şi
inconvenientele sondajului statistic, etapele acestei forme de cercetare a realităţii
economice, principalele procedee de eşantionare, precum şi modul de calcul al
indicatorilor specifici celor mai frecvent utilizate tipuri de selecţie. Sunt arătate, de
asemenea, modalităţile de extindere a rezultatelor sondajului asupra întregii colectivităţi
supuse cercetării, precum şi căile de determinare a volumului necesar al eşantionului într-
un sondaj statistic.
Nu întotdeauna este posibil sau rentabil (cost, durată) să facem o cercetare
exsuasivă. În aceste condiţii folosim cercetarea selectivă.
Cercetarea selectivă presupune culegerea şi prelucrarea datelor referitoare la o
parte a colectivităţii generale, iar rezultatele obţinute se extind asupra întregului obiect al
cunoaşterii pentru a obţine o caracterizare satisfăcătoare. Este necesar ca partea observată
(eşantion, mostră, probă, selecţie) să fie reprezentativă adică să reproducă la scară redusă
trăsăturile esenţiale ale colectivităţii întregi.
Sondajul este o formă a cercetării statistice realizată pe baza unei părţi
reprezentative din populaţia (colectivitatea generală) studiată. El presupune următoarele
etape consecutive:
1) extragerea unui eşantion reprezentativ din colectivitatea generală (eşantionarea)
şi culegerea de date despre despre elementele extrase (obserarea eşantionului);
2) descrierea statistică a eşantionului prin indicatori specifici fiecărei caracteristici
înregistrate în cadrul programului de observare (obţinerea estimatorilor);
3) extinderea rezultatelor obţinute la nivel de eşantion asupra colectivităţii generale
(estimarea parametrilor colectivităţii generale = inferenţa statistică).
Statistică teoretică şi economică

După scopul urmărit, sondajul statistic poate fi:


• sondaj descriptiv întreprins în vederea estimării parametrilor ce caracterizează o
populaţie;
• sondaj analitic realizat pentru verificarea (testarea) unor ipoteze statistice.
Realizarea sondajului are rost numai dacă volumul eşantionului (n) este mult mai mic
decât volumul colectivităţii generale (N) din care a fost extras.
Eşantionul (mostra, proba, colectivitatea de selecţie) este o submulţime a
populaţiei statistice, astfel extrasă (obţinută) încât să reprezinte principalele trăsături ale
colectivităţii generale.
Colectivitatea generală (populaţia) este alcătuită din totalitatea unităţilor (a
elementelor simple sau complexe) a căror mulţime formează fenomenul/procesul supus
analizei. Deoarece din întreaga populaţie se extrage un număr de elemente, ea se mai
numeşte şi bază de sondaj.
Atât colectivitatea generală, cât şi eşantionul se caracterizează prin indicatori
statistici. Dacă cercetarea este exhaustivă, indicatorii se mai numesc şi parametrii
colectivităţii generale. În cadrul sondajului statistic, parametrii se estimează cu ajutorul
indicatorilor specifici eşantionului, numiţi din acest motiv şi estimatori. În Tabelul nr. 5.1
se prezintă sistemul uzual de notaţii pentru parametrii colectivităţii generale şi estimatorii
lor în cadrul unui eşantion.

Avantaje cercetarii selective:


• mai ieftină, mai operativă, mai exactă pentru că se face pe un număr redus de
elemente;
• poate fi mai bogată, completă faţă de cercetarea totală;
• rezultatele cercetării selective pot fi verificate dacă este necesar prin altă cercetare
selectivă sau printr-o cercetare totală (invers nu);
• se foloseşte când se presupune distrugerea elementelor în cazul cercetării.

Noţiuni fundamentale flosite în cercetarea selectivă


Sunt de fapt noţiuni perechi care vizează colectivitatea generală pe de o parte şi
eşantionul pe de altă parte.

colectivitate eşantion
generală
N (volumul) n (volumul)
x 0 (media) x (media)
σ2 (dispersia)
σ 02 (dispersia)
p2 = M/N (pt. car. w = m/n
alternativ) σ w2 (1 − w)
σ (1 − p)
2
p

În general nu se cunosc aspecte legate de colectivitatea generală. Cercetartea


selectivă este folosită pentru a estima pe baza eşantionului parametrii colectivităţii
generale.
Statistică teoretică şi economică

5.1.Procedee de selecţie
Se recomandă alegerea procedeului de selecţie în funcţie de mărimea (N) a
colectivităţii generale şi în funcţie de omogenitatea sau eterogenitatea acesteia.
Dacă colectivitatea generală este omogenă putem folosi:
• procedeul loteriei
• procedeul tabelului cu numere întâmplătoare sau un program pe calculator de
generare de numere întâmplătoare;
• procedeul mecanic sau al pasului de numărare.
Dacă colectivitatea generală este eterogenă se recomandă folosirea selectţiei
dirijate pentru a asigura reprezentativitatea eşantionului (procedeul selecţiei stratificate,
selecţie tipică).
Dacă colectivitatea generală este alcătuită din unităţi complexe numite şi serii (de
ex. populaţia alcătuită pe familii, locurile de mărfuri grupate pe paleţi etc.) se recomandă
procedeul selecţiei de serie.

Procedeul loteriei.
Se aplică în cazul colectivităţii generale de volum mic, relativ omogenă.
Aplicablitatea constă în numerotarea de la 1 la N a tuturor elementelor din colectivitatea
generală (ceea ce uneori este incomod) confecţionând jetoane sau bile absolut de aceleaşi
dimensiuni, care se introduc într-o urnă şi se amestecă înainte de fiecare extragere.
Extragerea poate fi efectuată în două variante:
¾ selecţia simplă repetată (urna cu bilă revenită).
În acest caz, la fiecare extragere există o aplicabilitate de 1/N de a intra în
alcătuirea eşantionului. Folosind această variantă se pot forma foarte multe eşantioane
diferite având acelaşi volum, dar posibilitatea includerii a unui acelaşi element face ca
reprezentativitatea includerii a unui acelaşi element face ca reprezentativitatea
eşantionului să fie redusă.
¾ selecţia simplă nerepetată (urna cu bilă nerevenită), prin care probabilitatea
includerii în eşantion creşte, treptat pe măsura extragerii elementelor. La extragerea I,
probalilitatea extrageriiv este 1/N; la extragerea a II-a probalilitatea extragerii este de
1/(N-1) si asa mai departe; la ultima extragere, probalilitatea va fi: 1/[N – (n+1)].
Aceste eşantioane se bucură de o mai mare reprezentativitate, iar numărul lor este
CnN (mult mai mic decât la selecţia repetată Nn).
Pentru a evita constituirea urnelor cu bile se poate folosi fie tabele cu numere
întâmplătoare, fie un program de calculator care să genereze numere întâmplătoare.
Procedeul mecanic sau al pasului de numărare.
Acest procedeu este foarte operativ dar nu asigură o selecţie strict aleatoare, doar
primul element din eşantion se extrage la întâmplare, restul intrând în componenţa
eşantionului ca urmare a poziţiei ocupate.
Ştiind că există N elemente în colectivitatea generală şi că eşenationul trebuie să
fie de n elemente, se calculează k; k = N/n, adică pasul de numărare.
Din primele k elemente se extrage, la întâmplare, unul, acesta devenind primul
element al eşantionului. Numărul de ordine al celorlate elemente se află adunând succesiv
k.
Dacă elementele colectivităţii generale sunt eterogene, constatându-se o anumită
stratificare a colectivităţii generale se recomandă să fie folosită o selecţie dirijată
Statistică teoretică şi economică

(nealeatoare) pentru a asigura pătrunderea în eşantion a unor elemente din toate straturile
tipice. O asemenea selecţie dirijată este selecţia stratificată sau selecţia tipică: după
stabilirea volumului n al eşantionului se stabileşte componenţa pe straturi (număr de
elemente din fiecare strat), astfel încât structura eşantionului să corespundă structurii
colectivităţii generale. Pentru extragerea separată din fiecare strat a numărului
corespunzător de elemente, se utilizează unul din procedeele aleatoare de mai sus.
Selecţia de serii (sau de unităţi complexe) reprezintă un alt procedeu de selecţie.
Pentru colectivitatea organizată pe unităţi complexe (populaţia organizată pe familii) se
recomandă să nu distrugem aceste structuri pentru a extrage unităţi simple, ci să preferăm
extragerea de unităţi complexe sau extragerea de serii.

5.2.Reprezentativitatea eşantionului.
Reprezentativitatea eşantionului inseamna capacitatea acestuia de a reda
trăsăturile esenţiale ale colectivităţii generale din care s-a extras chiar dacă volumul
eşenationului este mult mai mic decât volumul colectivităţii din cade s-a extras.
Dintre metodele de exprimare a reprezentativităţii eşantionului cele mai frecvente
se referă la compararea structurii eşantionului cu structura colectivităţii generale sau la
compararea mediei eşantionului x cu media colectivităţii generale x 0, la una sau mai
multe caracteristici cunoscute, înregistrarea atât pe eşantion cât şi la colectivitatea
generală. De exemplu compararea mediei de vârstă a eşantionului cu media de vârstă a
întregii ţări.
Se întâmplă, în unele cazuri, să nu se cunoască nimic despre colectivitatea
generală. În acest caz când nu este posibilă compararea cu parametrii colectivităţii
generale, se recomandă extragerea a cel puţin două eşantioane diferite din aceeaşi
colectivitate generală şi compararea mediilor sau structurilor acestor eşantioane. Dacă ele
nu diferă semnificativ, atunci oricare dintre eşantioane poate fi folosit pentru a estima
parametrii colectivităţii generale.

5.3.Calculul indicatorilor de selecţie şi extinderea rezultatelor pentru principalele


tipuri de selecţie.
Diferenţa dintre media eşantionului şi media colectivităţii generale se numeşte
eroare de reprezentativitate. În domeniul social economic se consideră că eşantionul este
 x − x0 
reprezentativ cât timp această diferenţă este mai mică de ± 5%  ⋅ 100  faţă de
 x0 
media colectivităţii generale.
Eroarea de reprezentativitate este determinată fie de cauze sistematice (voite sau
întâmplătoare) care duc la alcătuirea unui eşantion după criterii subiective, fie de abateri
(erori) aleatoare.
Dacă se iau în considerare toate eşantioanele de un anumit volum n, obţinute prin
acelaşi procedeu de extragere, se constată mediile acestor eşantioane ( x i) se distribuie
normal faţă de valoarea pe care o înregistrează media colectivităţii generale ( x 0).
Eşantioanele având media identic egală cu x 0 sunt cele mai frecvente.
Se numeşte eroare medie de reprezentativitate abaterea medie pătratică a
mediilor de eşantionare faţă de x 0 . Pentru a putea calcula această valoare medie de
Statistică teoretică şi economică

reprezentativitate (µx pentru variabila numerică şi µw pentru variabila alternativă) ar


trebui să avem toate mediile de eşantioane posibile şi frecvenţele lor de apariţie.

µx =
∑ (x − x
i
2
0 ⋅ fi
∑f i

De obicei nu se cunoaşte decât un singur eşantion. Se poate face însă calcul


anticipat al lui µx pornind de la relaţia dintre dispersia colectivităţii generale (σ20),
pătratul erorii medii de reprezentativitate µx2 şi volumul eşantionului.
În cazul selecţiei simple repetate această relaţie este:

σ 02 = µ x2 ⋅ n

σ 02
ceea ce înseamnă că µ x = , adică eroarea medie de reprezentativitate este direct
n
proporţională cu dispersia colevtivităţii generale şi invers proporţională cu volumul
eşantionului.
Dacă nu se cunoaşte σ20 se acceptă că dispersia unicului eşantion cunoscut σ2
oferă o marjă satisfăcătoare a împrăştierii elementelor colectivităţii dacă eşantionul este
convenabil de mare. Totuşi se face o corecţie cu 1, adică:

σ2
µx = .
n −1
Dacă se foloseşte o variabilă alternativă, eroarea medie de reprezentativitate se
stabileşte potrivit aceloraşi relaţii, adică atunci când se cunoaşte dispersia colectivităţii
generale:
p (1 − p )
µw =
n

iar, dacă nu se cunoaşte decât eşantionul, atunci:

w(1 − w)
µw =
n −1

Aceste relaţii sunt pentru selecţia simplă repetată (mecanică)


Dacă se practică selecţia simplă nerepetată, eşantioanele sunt mai reprezentative
decât la selecţia repetată, se introduce un coeficient de corecţie pentru a estima eroarea
medie de reprezentativitate:
- pentru selecţia nerepetată, variabilă numerică:

σ 02  n σ 02  n
µx = 1 −  µx = 1 − 
n −1 N n  N
Statistică teoretică şi economică

- pentru o caracteristică alternativă:


w(1 − w)  n
µw = ⋅ 1 − 
n −1  N 

În practica economică nu interesează eroarea medie de reprezentativitate, ci


eroarea maximă (abaterea maximă) sau eroarea limită ce poate apare la estimare pentru o
anumită probabilitate.
Deoarece această eroare este diferenţa dintre x şi x 0 ne folosim de proprietăţile
repatiţiei normale pentru a asocia diverse mărimi ale erorii cu probalilităţile aferente.

Eroare limită se calculează:


• pentru variabilă numerică:

∆x = z ⋅ µx

• pentru variabila alternativă:

∆w = z ⋅ µw

Există tabele ale repartiţiei normale care ne arată relaţia dintre coeficientul de
multiplicare z sau t sau probabilitatea φ (z) sau φ (t) corespunzătoare.
Eroarea limită arată diferenţa maximă în plus sau în minus care poate surveni la o
anumită probabilitate φ (z), z fiind utilizat în calculul erorii limită.
Necunoscând parametrii colectivităţii generale, rezultă că pentru o variabilă
( )
numerică x 0 ∈ x ± ± ∆ x , iar pentru o variabilă alternativă avem p ∈ (w ± ∆ w ) cu
probabilitatea corespunzătoare.
φ (z) = funcţia de probabilitate cu care se generează rezultatele
z = coeficientul funcţiei de probabilitate.
Eroarea limită se poate mări sau micşora fie prin modificarea volumului
eşantionului (n), fie prin modificarea probabilităţii cu care se garantează rezultatele,
deoarece dispersia colectivităţii totale rămâne aceeaşi.
După modul în care se combină sistemul de organizare, felul unităţilor de selecţie
şi procedeul de selecţie folosit, în cercetarea activităţii economice şi sociale, se disting
următoarele tipuri de selecţie:
- selecţie întâmplătoare simplă;
- selecţie mecanică;
- selecţie tipică (stratificată);
- selecţia de serii.
Pentru fiecare tip de selecţie se calculează trei indicatori: eroarea de medie de
reprezentativitate, eroarea limită şi volumul eşantionului.
Selecţia întâmplătoare simplă este utilizată în special pentru colectivităţi formate
dintr-un număr de unităţi simple şi care se caracterizează printr-un anumit grad de
omogenitate. Erorile de reprezentativitate sunt mari în raport cu alte tipuri de selecţie,
Statistică teoretică şi economică

deoarece dispersia folosită măsoară variaţia totală a caracteristicii datorată cauzelor care
influenţează.
Deoarece, în practică, se lucrează cu o eroare limitată, calculul volumului
eşantionului (n) se face flosind formula erorii limită.
- selecţia întâmplătoare simplă repetată:

σ 02
∆x = z ⋅ µx = z ⋅
n
σ 2
z ⋅ σ 02 z 2 ⋅ σ i2
2
∆ =z ⋅
2
x
2 0
⇒ n= ≈
n ∆2x ∆2x

- selecţia întâmplătoare simplă nerepetată:

σ 02  n z 2 ⋅ σ 02 z 2 ⋅ σ i2
∆x = z ⋅ µx = z ⋅ 1 −  ⇒ n = ≈
n  N z 2 ⋅ σ 02 z 2 ⋅ σ i2
∆x +
2
∆2x +
N N

În mod similar se procedează şi în cazul caracteristicii alternative.


Următorul tabel sintetizează eroarea medie de reprezentativitate, eroarea limită şi
volumul eşantionului pentru caracteristica numerică şi pentru cea alternativă în cazul
selecţiei repetate şi a selecţiei nerepetate:

Indicatorul Caracteristica nealternativă (numerică)


selecţia repetată selecţia nerepetată
err. medie de 2 2 2 2
reprezentativitate σ0 σi σ0  n σi  n
µx = ≈ µx = 1 −  ≈ 1 − 
n n −1 n  N n −1 N
err. limită ∆x = z ⋅ µz ∆x = z ⋅ µx
volumul z ⋅σ2 2
z ⋅σ
2 2
z
2 2
⋅σ0 z
2 0
⋅σi
eşantionului n= 0
≈ i
n= ≈
∆2x ∆2x z
2 2
⋅σ0
2
z2 ⋅ σ i
2 2
∆x + ∆x +
N N

Indicatorul Caracteristica alternativă


selecţia repetată selecţia nerepetată
err. medie de 2 p (1 − p ) w(1 − w) p (1 − p )  n w(1 − w)  n 
reprezentativitate µ =σ ≈ µw = ⋅ 1 −  ≈ ⋅ 1 
w n n −1 n  N n −1  N 
err. limită ∆w = z ⋅ µw ∆w = z ⋅ µw
volumul 2 2 2 2
z ⋅ p (1 − p ) z ⋅ w(1 − w) z ⋅ p (1 − p ) z ⋅ w(1 − w)
eşantionului n= ≈ n= ≈
2 2 z 2 ⋅ p (1 − p ) 2
∆w ∆w 2 2 z ⋅ w(1 − w)
∆w + ∆w +
N N
Statistică teoretică şi economică

Selecţia mecanică se foloseşte atunci când se combină cu alte tipuri de selecţie.


Pentru calculul erorilor de selecţie se folosesc formulele de la seleţia întâmplătoare
simplă repetată. Acest tip de selecţie se aplică la cercetările de laborator şi la estimarea
recoltei medii la hectar a producţiei agricole înainte de recoltare.
Selecţia tipică (stratificată) se aplică cel mai frecvent în studiul fenomenelor
economico-sociale care au fost, în prealabil, împărtăşite în grupe omogene (straturi sau
tipuri) după o caracteristică esenţială.
• selecţia tipică simplă caracterizată prin faptul că extragerea unităţilor din fiecare
grupă se face la întâmplare fără a se ţine seama de ponderea unităţilor din fiecare grupă a
colectivităţii generale.
• selecţia tipică proporţională este selecţia la care volumul subeşantioanelor diferă
în raport cu ponderea pe care o are fiecare grupă în colectivitatea generală şi se respectă
proporţia de selecţie.
• selecţia tipică optimă se caracterizează prin faptul că la formara eşantionului se ia
în considerare ponderea pe care o au grupele în colectivitatea generală şi mărimea
variaţiei din interiorul grupelor măsurată prin abaterea medie pătratică.
În general, se poate spune că selecţia tipică dă cele mai mici erori în activitatea
practică dar este greu de aplicat.
Selecţia de serii se foloseşte când colectivitatea generală este formată din unităţi
complexe numite şi serii (echipe, brigăzi, magazine etc.). Aceste unităţi sunt formate din
unităţi simple care prezintă caracteristici ce le deosebesc una de alta, adică au un caracter
eterogen, în raport cu unităţile componente ale grupelor tipice care se caracterizează prin
omogenitate.
Caracteristic pentru acest tip de selecţie este faptul că în locul variantelor
concrete ale caracteristicilor de la sondajele bazate pe unităţi simple se vor folosi
indicatori de selecţie calculaţi la nivelul seriei. Cerinţa reprezentativităţii se va asigura
prin apropierea mediilor din seriile de unităţi selectate de mediile din seriile colectivităţii
generale.
Pentru extinderea rezultatelor asupra întregii colectivităţi se folosesc două
procedee:
• procedeul coeficientului de corecţie se foloseşte de obicei la verificarea
autenticităţii datelor culese dintr-o observare, totală.
• procedeul extinderii directe se utilizează la caracterizarea fenomenelor pentru
care nu dispunem de informaţii prin observarea totală. În esenţă acest procedeu constă în
estimarea parametrilor colectivităţii generale pe baza rezultatelor selecţiei statistice.

x − ∆ x < x0 < x + ∆ x

Pentru a ilustra valenţele cognitive ale indicatorilor prezentaţi mai sus, să


acceptăm că responsabilul departamentului de resurse umane dintr-o corporaţie
multinaţională având N = 4000 de angajaţi direct operativi a decis realizarea unui studiu
cu privire la nevoile de formare profesională continuă ale acestei categorii de salariaţi şi
disponibilitatea lor de a participa la astfel de programe.
Pentru a răspunde acestei decizii, consiliul director al corporaţiei aprobă
organizarea unui sondaj statistic în rândul salariaţilor, volumul eşantionului fiind de n =
100 de persoane. Asigurarea reprezentativităţii eşantionului de numai 2,5% din totalul
Statistică teoretică şi economică

n 
salariaţilor direct operativi  ⋅ 100 = 2,5%  s-a făcut prin luarea în considerare a
N 
vârstei, precum şi a structurii socio-profesionale a întregului personal operativ.
În cadrul programului de observare selectivă, între alte caracteristici urmărite, se
înregistrează vârsta salariaţilor (exprimată în ani de viaţă împliniţi), precum şi interesul
(disponibilitatea) acestora de a participa la un program de formare profesională continuă.
În tabelul de mai jos se prezintă rezultatul grupării în funcţie de vârstă a celor 100
de persoane din eşantionul extras aleator şi nerepetat.
Repartiţia personalului cuprins în eşantion în funcţie de vârstă
Grupe de vârstă Număr personal
(ani împliniţi)
Sub 25*) 17
25 – 35 30
35 – 45 25
45 – 55 18
peste 55 10
Total 100
*)
Limita superioară nu este cuprinsă în interval.

Prelucrarea datelor referitoare la această caracteristică numerică (vârsta personalului),


permite constatarea că la nivelul eşantionului, vârsta medie este de:

x=
∑ xi ni = 3740 = 37,4 ani,
∑ ni 100
iar dispersia în jurul mediei eşantionului este:
∑ (x − x ) n
2
14924
σ
i i
2
= = = 149,24 .
∑n i 100
Observaţii:
1) Eşantionul este destul de omogen (v = 32,7%) pentru a putea considera că media
de 37,4 ani caracterizează corect vârsta tuturor celor 100 de persoane înregistrate.
2) Dacă media nu este reprezentativă la nivelul eşantionului (v>>35%), nu are sens să
se mai continue cercetarea printr-o eventuală tentativă de extindere a acestui indicator
(deja nereprezentativ la nivel restrâns) asupra colectivităţii generale.

Între răspunsurile înregistrate de la cele 100 de persoane cuprinse în sondaj se mai


constată că 82 sunt dornice să participe la un program de formare continuă, în timp ce
restul de 18 persoane resping oportunitatea oferită de angajator. Această caracteristică
alternativă, prezintă o medie de:
m 82
w= = = 0,82
n 100
şi o dispersie de:
σ w2 = w(1 − w) = 0,82 ⋅ 0,18 = 0,1476
Dacă s-ar fi utilizat procedeul extragerii mecanice sau procedeul extragerii
repetate, atunci pentru calculul erorii medii de reprezentativitate a unui (oricărui) eşantion
de volum n=100 s-ar fi aplicat relaţiile [5.4] pentru caracteristica numerică şi [5.6] pentru
cea alternativă. Cum sondajul a avut în vedere extragerea nerepetată (pentru a spori
Statistică teoretică şi economică

reprezentativitatea eşantionului), se aplică relaţiile [5.4’] şi, respectiv [5.6’], obţinându-


se:

y pentru caracteristica numerică:


σ2  n 149,24  100 
µx = 1 −  = 1 −  = ±1,21 ani,
n −1 N  100 − 1  4000 
ceea ce înseamnă că media unui eşantion de volum n = 100 obţinut prin extragere
aleatoare nerepetată se abate în medie cu 1,2 ani (+) faţă de vârsta medie reală ( x0 ) a
celor 4000 de persoane angajate de corporaţie;

y pentru caracteristica alternativă:


w(1 − w)  n 0,1476  100 
µw = 1 −  = 1 −  = ±0,038
n −1  N 100 − 1  4000 
Rezultatul indică o abatere medie cu +3,8% a proporţiei personalului dornic de a
participa la formarea profesională continuă cuprins în eşantion, faţă de proporţia reală
 M
p=  în rândul întregului personal al corporaţiei.
 N

În practica economică nu interesează, de obicei, eroarea medie de


reprezentativitate a eşantionului, ci abaterea maximă sau eroarea limită ce poate apare
ca diferenţă între media unui eşantion (estimator) şi media colectivităţii generale
(parametru) la estimarea acestuia cu o anumită probabilitate.
Deoarece eroarea limită este diferenţa dintre x şi x 0, ne folosim de proprietăţile
repatiţiei normale pentru a asocia diverse mărimi ale erorii cu probalilităţile aferente
măsurate ca (sub) multipli ai abaterii standard a mediilor de eşantionare faţă de x0 .
Eroarea limită se calculează astfel:
• pentru variabilă numerică:

∆x = z ⋅ µx [5.7]

• pentru variabila alternativă:

∆w = z ⋅ µw [5.8]

Există tabele ale repartiţiei normale care exprimă relaţia dintre argumentul z sau t şi
funcţia de probabilitatea φ(z) sau φ(t) corespunzătoare.
În exemplul considerat, eroarea limită pentru o probabilitate Φ(z) = 0,95 (z = 1,96)
este:
y pentru caracteristica numerică, de aproximativ 2,4 ani:
∆ x = z ⋅ µ x = 1,96 ⋅ 1,21 = 2,37 ani ≅ 2,4 ani,
Statistică teoretică şi economică

Semnificaţia rezultatului: distanţa maximă ce poate exista între media eşantionului


( x0 ) este de +2,4 ani, această afirmaţie fiind valabilă cu o probabilitate de 0,95 (se
acceptă un prag de eroare α=0,05);

y pentru caracteristica alternativă:


∆ w = z ⋅ µ w = 1,96 ⋅ 0,038 = 0,07448 sau 7,4%.

Interpretarea este asemănătoare celei prezentate la ∆x. Diferenţa maximă între w şi p


(proporţia celor înclinaţi să facă un program de formare contiună în cadrul eşantionului –
w şi, respectiv în colectivitatea generală - p) este, cu aceeaşi probabilitate Φ(z) = 0,95 de
7,4%.

Observaţii:
1. Un tabel cu valorile funcţiei Gauss – Laplace corespunzând diferitelor valori ale lui z
se găseşte în volumul Bazele statisticii pentru economişti. Aplicaţii. Bucureşti, Editura
Tribuna Economică, 2002, p. 259-260.
2. Dacă s-ar fi folosit extragerea mecanică, sau extragerea repetată, eroarea limită era
ceva mai mare: ∆x = 2,41 ani (faţă de 2,37 ani); ∆w = 7,6% (faţă de 7,4%).
Coeficientul de corecţie aplicat în cazul sondajului nerepetat este întotdeauna o
mărime subunitară care restrânge mărimea erorii medii de reprezentativitate şi,
respectiv, a erorii limită, oferind o estimare mai exactă a parametrilor colectivităţii
generale.
3. Nu este obligatoriu ca probabilitatea cu care se estimează diverşi parametrii ai
colectivităţii generale să fie aceeaşi la toate variabilele cerectate.
Statistică teoretică şi economică

Probleme şi aplicaţii.
5.1. Un echipament de ambalare este astfel reglat încât să împacheteze câte 20 de
bomboane cu o toleranţă de ±1 bucată.
Pentru a aprecia calitatea reglajului, din producţia unei zile s-a prelevat prin
extragere mecanică un eşantion de 150 pachete care conţineau în total 3015
bomboane în loc de 3000 bomboane. Din cercetarea eşantionului rezultă că în jurul
mediei de 20,1 bomboane/pachet, intensitatea împrăştierii era de 7,2%, în condiţiile
în care 129 pachete conţineau exact 20 bomboane, 12 pachete aveau 21 sau mai
multe bomboane, iar 9 pachete erau cu 19 sau mai puţine bomboane.

Se cere:
Să se estimeze cu o probabilitate Φ(z) = 0,9973 (z = 3) numărul total de
bomboane ambalate în lotul de N = 3000 pachete realizate în cursul zilei şi să se observe
dacă echipamentul se încadrează în toleranţa admisă.

Rezolvare:
Din enunţul problemei rezultă că eşantionul se caracterizează prin:
• Volumul n = 150 pachete;
• Media x = 20,1 bomboane/pachet;
• Abaterea standard σ = 1,4472 bomboane/pachet (din relaţia coeficientului de

σ
variaţie v = ⋅ 100 = 7,2% )
x
Pe baza acestor date, se poate estima eroarea medie de reprezentativitate, ştiind
că în cazul extragerii mecanice se aplică relaţia de la sondajul simplu, aleator, repetat:

σ2 2,0944
µx = = = 0,118 bucati
n 150

Un eşantion de 150 produse prelevate mecanic din producţia zilei, prezintă, în


medie, o abatere cu 0,118 bomboane/pachet faţă de numărul mediu ( x0 ) ce caracterizează
întrega producţie.
Eroarea limită pentru Φ(z) = 0,9973:

∆ x = z ⋅ µ x = 3 ⋅ 0,118 = 0,35 bucati

Numărul mediu de bomboane/pachet în producţia zilei se situează, cu


probabilitatea de 0,9973 în intervalul:
x0 ∈ ( x ± ∆ x ), adica, x 0 ∈ ( 20,1 ± 0,35)
Prin urmare: 19,75 ≤ x 0 ≤ 20,45 , ceea ce, aplicat întregii producţii a zilei conduce
(prin multiplicarea cu N = 3000) la un număr total (T) de bomboane ambalate de:
59250 ≤ T ≤ 61350 , cu Φ(z) = 0,9973, în condiţiile în care reglajul trebuia să
încadreze acest număr între (20-1)⋅3000 = 57.000 bucăţi şi (20+1)⋅3000 = 63.000 bucăţi.
Statistică teoretică şi economică

Întrucât intervalul de estimare (59.250, 61.350) este mult mai mic decât toleranţa
admisă (57.000, 63.000), rezultă că reglajul este corespunzător.
Răspuns: Numărul total de bomboane ambalate este situat, cu Φ(z) = 0,9973 între
59.250 şi 61.350 bucăţi. Echipamentul se încadrează în tolerenţa admisă.
Cât de mare ar trebui să fie un eşantion, dacă numărul mediu de bomboane/pachet
ar trebui estimat cu Φ(z) = 0,9545 (z = 2) în limitele unui interval de ±0,5 bucăţi?

Rezolvare:

z 2 ⋅ σ 2 4 ⋅ 2,0944
n= = = 33,5104 ≅ 34 pachete .
∆2x 0,52

Răspuns: Pentru a răspunde unei astfel de exigenţe, ar fi suficient să se preleve


prin extragere mecanică doar 34 pachete, ceea ce la o producţie totală de 3000 pachete
N
înseamnă un pas de numărare ≈ 88 .
n
Să se observe în eşantionul de 150 pachete, cota de produse care nu îndeplinesc
cerinţa de 20 bomboane/pachet şi să se estimeze cu Φ(z) = 0,90 (z = 1,65) cota minimă şi
maximă, precum şi numărul minim şi maxim de pachete necorespunzătoare din punct de
vedere al conţinutului în producţia unei zile.
Rezolvare:
Din 150 pachete prelevate, 12+9 = 21 pachete conţin fie mai multe, fie mai puţine
produse decât numărul standard de 20 bomboane/pachet.
În cadrul eşantionului, media (w) şi dispersia ( σ w2 ) caracteristicii alternative
sunt:

m 21
w= = = 0,14 , ceea ce înseamnă că 14% din eşantion nu corespunde
n 150
standardului de ambalare.

σ w2 = w(1 − w) = 0,14 ⋅ 0,86 = 0,1204

Eroarea medie de reprezentativitate a unui eşantion de volum 150 obţinut prin


prelevare mecanică este de:

σ w2 0,1204
µw = = = 0,0283 sau 2,83%
n 150

Un eşantion de volum 150 prelevat mecanic se caracterizează, în medie, printr-o


cotă de produse necorespunzătoare cu 2,83% mai mare sau mai mică decât cota parte
specifică întregii producţii a unei zile.
Eroarea limită pentru o probabilitate de 0,90 este de:
Statistică teoretică şi economică

∆ w = z ⋅ µ w = 1,65 ⋅ 0,0283 = 0,0467 sau 4,7% .

La probabilitatea menţionată, abaterea maximă a unui eşantion de volum 150


prelevat mecanic faţă de cota reală de produse necorespunzătoare din producţia unei zile
este 4,7%.
În aceste condiţii, la Φ(z) = 0,90, cota minimă şi maximă de defecte în producţia
zilei este cuprinsă în intervalul:

p ∈ ( w ± ∆ w ), adica : p ∈ (0,14 ± 0,047) sau:


0,093 ≤ p ≤ 0,187 , cu Φ(z) = 0,90.

Numărul minim şi maxim de pachete necorespunzătoare (M) în producţia unei zile


se obţine înmulţind cu N = 3000 limitele intervalului în care se încadrează cota de
defecte:
279 ≤ M ≤ 561 pachete, cu Φ(z) = 0,90.
Cel puţin 279 pachete şi cel mult 561 pachete din lotul fabricat de 3000, cuprinde
mai mult sau mai puţin de 20 bomboane/pachet, cu o probabilitate de 0,90 (sau cu o
marjă de eroare acceptată de 1-0,90 = 0,10 sau 10%).
Având în vedere că un client nu va reclama decât în situaţia în care obţine mai
puţine bomboane decât numărul de 20 (care apare înscris pe pachet), se cere refacerea
calculelor, considerând că m = 9 pachete din 150 verificate.
Răspuns: w = 0,06; w(1-w) = 0,0564; µ w = 0,02; ∆ w = 0,03; 0,03 ≤ p ≤ 0,09 ;
90 ≤ M ≤ 270 pachete, cu Φ ( z ) = 0,9 .

5.2. Dintr-o comandă de 1000 piese, se prelevă un eşantion de 65 piese prin extragere
aleatoare, simplă, nerepetată. Potrivit comenzii, fiecare piesă ar trebui să cântărească
85 grame. După examinarea eşantionului, se constată că greutatea medie a pieselor
este de 87,2g, dispersia eşantionului fiind de 70,6746, abaterea standard de 8,4g,
coeficientul de variaţie 9,6%. Între piesele eşantionului se află 26 piese cu greutatea
mai mare decât cea prevăzută de comandă.

Se cere:
Estimarea cu Φ(z) = 0,9545 (z = 2) limitele intervalului în care se înscrie
greutatea medie a celor 1000 piese din lot.

Rezolvare:
Eroarea medie de reprezentativitate în cazul sondajului aleator, simplu, nerepetat,
se estimează astfel:

σ2  n 70,6746  65 
µx = 1 −  = 1 −  = 1,0083 g
n  N 65  1000 
Statistică teoretică şi economică

Eroarea limită:

∆ x = z ⋅ µ x = 2 ⋅ 1,0083 ≈ 2,02 g , pentru Φ(z) = 0,9545

Intervalul în care se înscrie greutatea medie a tuturor pieselor cu probabilitatea


menţionată este:
x 0 ∈ (87,2 ± 2,02) ⇒ 85,18 ≤ x 0 ≤ 89,22 g
Estimarea cu Φ(z) = 0,90 (z = 1,65) a cotei maxime de produse cu greutatea
depăşită.
Rezolvare:

σ w2  n
µw = 1 −  , unde σ w = w(1 − w) = 0,4 ⋅ 0,6 = 0,24
2

n  N

µ w = 0,059 sau 5,9%

∆ w = z ⋅ µ w = 1,65 ⋅ 0,059 = 0,097 sau 9,7%

Cota maximă este, de fapt, limita superioară a intervalului în care se înscrie p,


respectiv w + ∆w = 0,4 + 0,097 = 0,497, ceea ce, în mărime absolută, înseamnă 497 piese.
Cât de mare ar trebui să fie eşantionul extras prin acelaşi procedeu pentru o nouă
cercetare, dacă ar trebui să se estimeze cota minimă şi maximă cu probabilitatea Φ(z) =
0,9545 (z = 2) în limitele unui interval de ±5%, respective ±0,05.

Răspuns:

z 2 ⋅ σ w2 4 ⋅ 0,24
n= = = 974,62 ≅ 975 piese
z ⋅ σ w 0,05 + 0,00096
2 2 2
∆w +
2

Cu acest rezultat, locul cercetării selective este luat de examinarea integrală a


lotului comandat.

5.2.În rândul personalului operativ al unui centru de librării se efectuează un sondaj


stratificat cu extragere nerepetată. Între caracteristicile observate pe cele n = 80
de persoane din eşantion, se numără vânzările medii săptămânale (milioane lei)
şi felul raionului de mărfuri. Rezultatele înregistrării eşantionului se prezintă
astfel:
Statistică teoretică şi economică

Felul raionului de mărfuri Total


Anticariat Jucării Librărie Papetărie

Vânzări
medii (mil lei)
Până la 3 3 --- --- 2 5
3–5 5 3 12 8 28
5–7 2 5 12 10 29
7 şi peste --- 12 6 --- 18
Total 10 20 30 20 80

Se cere:
Să se caracterizeze acest eşantion.
Rezolvare:
Vânzarea medie săptămânală realizată de cele 80 persoane este x = 5,5 mil lei.
Amplitudinea variaţiei este de 6 mil lei, adică 109,09% faţă de medie. Acest indicator
permite aprecierea că cele 80 de elemente ale eşantionului prezintă o împrăştiere relativ
mare (peste 100%).
Dispersia eşantionului: σ 2 = 3,05 .
Abaterea standard: σ = 1,7464 mil lei.
Coeficientul de variaţie: v = 31,75%.
În pofida întinderii relativ mari a împrăştierii, colectivitatea este destul de
omogenă (intensitatea împrăştierii este sub 35%).
Analiza variaţiei vânzărilor medii săptămânale în cadrul celor 4 grupe constituite
după felul mărfurilor comercializate şi elementele de calcul pentru verificarea regulii de
adunare a dispersiilor sunt prezentate în tabelul 53.2. Pe baza acestei identităţi se
stabileşte în ce măsură influenţează felul mărfurilor variaţiei volumului vânzărilor
săptămânale.

Raionul j nj xj σ 2j xj − x ( x j − x)2 ⋅ n j σ 2j ⋅ n j
Anticariat 1 10 3,8 1,96 -1,7 28,9 19,6
Jucării 2 20 6,9 2,19 +1,4 39,2 43,8
Librărie 3 30 5,6 2,24 +0,1 0,3 67,2
Papetărie 4 20 4,8 1,76 -0,7 9,8 35,2
Total --- 80 --- --- --- 78,2 165,8

Regula de adunare a dispersiilor: σ 2 = δ 2 + σ 2 , în care:


‰ Dispersia generală a eşantionului este deja calculată: σ 2 = 3,05 .
‰ Dispersia indusă (explicată) de felul mărfurilor vândute:
Σ( x j − x ) 2 ⋅ n j 78,2
δ =
2
= = 0,9775 .
Σn j 80

Σσ 2 ⋅ n j 165,8
‰ Dispersia reziduală: σ = 2
= = 2,0725
Σn j 80
Statistică teoretică şi economică

Regula se verifică: 3,05 = 0,9775 + 2,0725, iar pe baza ei se calculează


coeficientul de determinaţie:

δ2 0,9775
D= ⋅ 100 = ⋅ 100 = 32%
σ 2
3,05

Varietatea mărfurilor comercializate în diferitele raioane ale centrului de librării


explică în proporţie de 32% variaţia vânzărilor medii săptămânale realizate de cele 80 de
persoane din eşantion.
Să se estimeze cu Φ(z) = 0,9545 (z = 2) volumul mediu săptămânal al vânzărilor
realizate de întregul personal operativ al centrului de librării (N = 760 persoane).
Rezolvare:
Eroarea medie de reprezentativitate în cazul sondajului stratificat cu extragere
nerepetată se determină astfel:

σ2 n 2,0725  80 
µx = 1 −  = 1 −  = 0,15 mil lei
n  N 80  760 

Eroarea limită:

∆ x = z ⋅ µ x = 2 ⋅ 0,15 = 0,3 mil.lei

Prin urmare, x 0 ∈ (5,5 ± 0,3) cu o probabilitate de 95,45%.


Limitele intervalului în care se încadrează vânzarea medie săptămânală a celor
760 angajaţi direct în procesul vânzării sunt: 5,2 mil lei şi, respectiv, 5,8 mil lei.
Pe acest temei, managementul acestei firme poate conta sâptămânal, cu Φ(z) =
0,9545, pe încasări situate între 3952 şi 4408 milioane lei.
Cât de mare ar trebui să fie eşantionul într-o nouă cercetare selectivă bazată pe
extracţia stratificată nerepetată a elementelor componente, dacă estimarea ar trebui făcută
cu aceeaşi probabilitate Φ(z) = 0,9545 (z = 2), dar în limitele unui interval de estimare de
±0,5 milioane lei?
Răspuns:

z2 ⋅σ 2 4 ⋅ 2,0725
n= = = 31,74 ≅ 32 persoane
z ⋅σ
2 2
8,28
∆2 + 0,5 +
2

N 760

Cu ce probabilitate s-ar putea face estimarea limitelor intervalului în care se


încadrează vânzarea medie săptămânală, dacă ∆ x = ±0,5 mil lei, dar se păstrează
mărimea iniţială a eşantionului: n = 80 persoane?
Răspuns: Prin înlocuire în relaţia de mai sus, se obţine că z = 3,28, ceea ce corespunde
lui Φ(z) = 0,999481 în orice tabel al distribuţiei normale.
Statistică teoretică şi economică

Revenind la un volum necesar al eşantionului de 32 persoane, cum se face


stratificarea?
Rezolvare:
Stratificarea se realizează pentru a asigura pătrunderea în eşantion a unor
elemente din toate tipurile existente în colectivitatea generală. Există mai multe tipuri de
stratificare a eşantionului:
(1) Un procedeu elementar constă în stratificarea simplă, respectiv împărţirea
volumului stabilit al eşantionului (n = 32) la numărul grupelor existente în colectivitatea
generală (r = 4 tipuri de mărfuri comercializate).
Prin urmare, câte 32:4 = 8 elemente se vor preleva din fiecare strat, prin extragere
nerepetată.
 Nj 
(2) Stratificarea proporţională ţine seama de structura   specifică mulţimii
 ΣN 
 j 
ce alcătuieşte colectivitatea generală. În cadrul firmei, personalul operativ (760 persoane)
prezintă următoarea structură: anticariat 9,5% (72 persoane), jucării 30% (228 persoane),
librărie 32,5% (247 persoane), iar în raioanele de papetărie circa 28% (213 persoane).
Pentru a transfera această structură asupra eşantionului, se foloseşte relaţia:
Nj
nj = n⋅
ΣN j
Astfel, cele 32 elemente din eşantion se repartizează după cum urmează: 3
persoane se prelevă (prin extragere nerepetată) dintre (cei 72 de) anticari; 10 persoane
dintre cele ce comercializează jucării; 10 persoane dintre librari şi 9 persoane dintre
vânzătoarele de la raioanele de papetărie:
3 + 10 + 10 + 9 = 32 persoane.
Evident, unele rotunjiri s-au impus fiind vorba de unităţi indivizibile (persoane)
ale colectivităţii generale.

(3) Stratificarea optimă a eşantionului presupune luarea în considerare nu numai a


structurii colectivităţii generale pe tipuri de activităţi ( N j cu j = 1, r ), dar şi a dispersiei
specifice fiecărei strat ( σ 2j ) din colectivitate.
Astfel, relaţia care se foloseşte la structurarea eşantionului devine:

N j ⋅ σ 2j
nj = n⋅
ΣN j ⋅ σ 2j

Mai sus s-au arătat valorile Nj, iar în tabelul 53.2, coloana a cincea, se află σ 2j . Cu
aceste date, pentru aflarea numărului de persoane care urmează să intre în alcătuirea
eşantionului din rândul celor care se ocupă de anticariat este:

72 ⋅ 1,96
n1 = 32 ⋅ = 2,88 ≅ 3 persoane.
1568,6
Statistică teoretică şi economică

Pentru celelalte trei grupe rezultă, în ordine: 10 persoane; 11 persoane; 8


persoane.
3 + 10 + 11 + 8 = 32 persoane.
Observaţie: Prelucrarea datelor referitoare la eventualele caracteristici alternative se face
în mod asemănător.

5.4. O societate comercială prezintă următoarea repartiţie a personalului său pe


grupe de vârstă:
(date convenţionale)
Grupe de vârstă (ani) Număr de persoane
Sub 20 10
20-30 30
30-40 40
40-50 15
peste 50 5
Total 100

Se cere:
1. să se reprezinte grafic repartiţia;
2. se consideră că cele 100 de persoane constituie un eşantion extras aleator, simplu,
nerepetat dintr-o colectivitate generală de 1000 persoane; să se determine intervalele de
vârstă între care se situează vârsta medie a celor 1000 persoane considerându-se
Φ( z ) = 0,9545; z = 2.

5.5. Timpul pentru înotătoarele cu vârsta cuprinsă între 9 şi 10 ani pe distanţa de 50


metrii, stilul fluture, este aproximativ normal distribuită cu media 49,4 secunde şi
abaterea standard de 2,8 secunde.
1. să se găsească probabilitatea în cazul unui eşantion aleator simplu de 25 de înotătoare
care să aibe media mai mare de 50,15 secunde.

5.6. Să se obţină un eşantion aleator de mărime 25 cu media x = 83,4 şi abaterea


medie pătratică σ = 12 , dintr-o populaţie cu o distribuţie normală dacă media
colectivităţii generale este x 0 = 83.

5.7. În tabelul următor sunt prezentaţi numărul de enoriaşi ai unei biserici ortodoxe
pe grupe de vârstă:

Vârsta (ani) Număr de enoriaşi


Sub 20 274
21-50 526
peste 50 345

Se cere:
1. dacă se efectuează o selecţie stratificată de volum n=100, să se determine numărul de
enoriaşi care trebuie să facă parte din fiecare strat;
2. aceeaşi cerinţă în cazul în care se cunosc abaterile standard ale celor trei straturi:
σ 1 = 1,2; σ 2 = 4,8; σ 3 = 2,3.
Statistică teoretică şi economică

5.8. Care este valoarea erorii standard a mediei unui eşantion de volum n=100,
selectat simplu, aleator repetat, dacă dispersia este egală cu 25?

5.9. În tabelul următor sunt prezentate datele referitoare la localitatea de rezidenţă


a studenţilor unei facultăţi economice:

Localizarea geografică Număr de studenţi


Nord – est 347
Sud – est 624
Sud – vest 196
Nord – vest 93
Se cere:
1. dacă se utilizează selecţia stratificată de volum n=200, care va fi mărimea fiecărui
strat?

5.10. Un eşantion de 500 de familii chestionate în legătură cu nivelul mediu al


cheltuielilor destinate produselor alimentare se prezintă astfel:

Cheltuieli pentru alimente (mii lei) Număr de persoane


Sub 500 80
500-800 120
600-900 150
900-1200 100
peste 1200 50
Total 500

1. să se determine coeficientul de asimetrie al repartiţiei;


2. dacă cele 500 de familii sunt considerate ca fiind o colectivitate generală din care se
extrege un eşantion aleator şi nerepetat cu φ ( z ) = 0,8064; z = 1,3 , să se deteremine
mărimea eşantionului.
Statistică teoretică şi economică

CAPITOLUL 6
ANALIZA STATISTICĂ A LEGĂTURILOR DINTRE
VARIABILE
Cuvinte cheie:
- coeficientul de corelaţie;
- covarianţa;
- coeficientul de asociere propus de Yule;
- coeficientul de corelaţie a rangurilor Spearman;
- coeficientul de corelaţie a rangurilor Kendall
- indicele sau raportul de corelaţie.
- metoda regresiei

In realitatea economică majoritatea legaturilor dintre variabile sunt statistice


pentru ca variabila rezultativă (y) reacţionează nu numai la influenţa lui x ci şi la
influenţa concomitentă a altor variabile.
Orice legatură dintre două variabile poate fi inclusă într-una din următoarele
situaţii:
• legatură univocă, în sensul că x este variabilă factorială (cauzală, independentă,
explicativă), iar y este variabilă rezultativă (efect, dependentă, explicată) şi
influenţa este numai a lui x asupra lui y, fără să existe şi o influenţă a lui y asupra
lui x;
• legatură biunivocă în sensul că x este factor care determină variaţia lui y, dar în
acelaşi timp, y este factor de influenţă al lui x, adică interdependentă;
• evoluţia paralelă a două variabile fără ca între acestea să existe o legatură;
evoluţia paralelă fiind cauzată de o altă variabilă comună;
• simplu paralelism între două variabile între care există o potrivire numerică, dar
nici o legatură logică.

6.1. Tipologia legăturilor statistice.


Legăturile statistice se pot clasifica după mai multe criterii:

a) după numărul caracteristicilor luate în calcul:


¾ legături simple (există o variabilă cauzală şi una rezultativă);
¾ legături multiple (se consideră mai multe variabile cauzale şi efectul lor);

b) după sensul legaturii:


¾ legături directe (creşte x, creşte y);
¾ legături inverse (creşte sau scade x, scade sau creşte y);

c) în funcţie de forma analitică a legăturilor dintre variabile:


¾ legături liniare;
¾ legături curbilinii (parabolă, hiperbolă, exponenţială);
Statistică teoretică şi economică

d) în funcţie de timpul în care se realizează legătura:


¾ legături sincrone (conconitente);
¾ legături asincrone (cu decalaj);

e) după natura variabilelor:


¾ corelaţii statistice între variabile numerice;
¾ asociaţii statistice când intervine o caracteristica nenumerică.

Identificarea legăturii poate fi făcută printr-o serie de metode elementare de


organizare şi prezentare a informaţiilor statistice:
• metoda seriilor paralele;
• metoda grupării;
• metoda tabelului cu dublă intrare;
• metoda grafică.

6.2. Metoda regresiei.


Metoda regresiei este folosită pentru a caracteriza forma şi sensul legăturii dintre
variabile.
Se consideră că între cele două variabile există o interdependenţă în sensul că Yi
este influenţat de Xi.
Metoda regresiei trebuie să ne conducă la obţinerea unei expresii analitice a unei
funcţii de regresie care sintetizeazp forma şi sensul variaţiei lui y sub influenţa factorului
x (sau a factorilor luaţi în considerare).
Dacă acceptam un singur factor, atunci vom avea o regresie simplă sau
unifactorială, funcţia de regresie putând fi lianiară sau curbilinie.
Dacă acceptam doi sau mai mulţi factori, atunci vom obtine o regresie multiplă
sau multifactorială.
Se recomandă să se selecteze factorii în funcţie de importanţa influenţei lor.
Regresia liniară simplă.
Dacă acceptăm că între variabilele Xi şi Yi există o legatură directă de forma
liniară, metoda regresiei ne permite să estimăm parametrii funcţiei:

y i = f ( xi ) = a + b ⋅ xi .

Estimarea parametrilor funcţiei de regresie se face cu metoda celor mai mici


pătrate pe baza sistemului următor:

n ⋅ a + b ⋅ ∑ xi = ∑ y i

a ⋅ ∑ xi + b ⋅ ∑ xi = ∑ xi ⋅ y i .
2

Parametru “b” se numeşte coeficient de regresie şi exprimă sensul şi mărimea


influenţei lui x asupra lui y. Dacă “b” este pozitiv arată o legătură directă; dacă “b” este
negativ arată o legătură indirectă. Mărimea parametrului “b” arată cu cât se modifică
variabila rezultativă la creşterea cu o unitate a factorului de influenţă.
Statistică teoretică şi economică

Regresia simplă curbilinie.


Dintre funcţiile curbilinii în analiza economică şi socială se utilizează frecvent
funcţia polinom de gradul 2:

y i = f ( xi ) = a + b ⋅ xi + c ⋅ xi2 .

Sistemul pentru determinarea parametrilor ecuaţiei este:

n ⋅ a + b ⋅ ∑ xi + c ∑ xi2 = ∑ y i

a ⋅ ∑ x i + b ⋅ ∑ x i + c ⋅ ∑ x i = ∑ x i ⋅ y i
2 3


a ⋅ ∑ xi + b ⋅ ∑ xi + c ⋅ ∑ xi = ∑ xi ⋅ y i .
2 3 4 2

Regresia multiplă.
Regresia multiplă presupune luarea în considerare a influenţei concomitente a doi
sau mai mulţi factori. De exemplu, cea mai simplă funcţie polinomială de gradul unu
este:
y x1 , x2 ,... xk = a 0 + a1 ⋅ x1 + a 2 ⋅ x 2 + ... + a k ⋅ x k .

Parametrii se obţin din rezolvarea sistemului:

n ⋅ a 0 + a1 ⋅ ∑ x1i + ... + a1 ⋅ ∑ x1i + ... + a k ⋅ ∑ x ki = ∑ y i



a 0 ⋅ ∑ x1i + a1 ⋅ ∑ x1i + ... + a1 ⋅ ∑ x1i ⋅ x1i + ... + a k ⋅ ∑ x1i ⋅ x ki = ∑ x1i ⋅ y i
2


a 0 ⋅ ∑ x 2i +a1 ⋅ ∑ x1i ⋅ x 2i + ... + a1 ⋅ ∑ x 2i ⋅ x1i + ...a k ⋅ ∑ x 2i ⋅ x ki = ∑ x 2i ⋅ y i

 ...........
a 0 ⋅ ∑ x ki + a1 ⋅ ∑ x1i ⋅ x ki + ... + a1 ⋅ ∑ x1i ⋅ x ki + ... + a k ⋅ ∑ x ki2 = ∑ x ki ⋅ y i .

Regresia în condiţiile unei repartiţii bidimensionale este utilizată în situaţile în


care observarea statistică se organizează pe colectivităţi numeroase, informaţia culeasă
fiind organizată pe intervale de variaţie ale variabilei factoriale (x) şi ale variabilei
rezultative (y). Pentru estimarea parametrilor de regresie, în cazul ecuaţiei de gradul întâi,
se va folosi următorul sistem:

n ⋅ a + b ⋅ ∑ xi ⋅ n x = ∑ y i ⋅ n y
 .
a ⋅ ∑ xi ⋅ n x + b ⋅ ∑ xi ⋅ n x = ∑∑ xi ⋅ y i ⋅ n xy
2

Pentru caracterizarea functiei de regresie (calitatea functiei de regresie) se


folosesc urmatorii indicatori:
Statistică teoretică şi economică

Eroarea standard (abaterea medie pătratică a valorilor teoretice faţă de cele


reale) este folosită pentru a caracteriza funcţia de regresie sau calitatea funcţiei de
regresie:

S yi / Yi =
∑(y i − Yi ) 2
.
n

Coeficientul de eroare cuantifică intensitatea variaţiei în jurul funcţiei de regresie şi


poate fi considerat tot un indicator care arată calitatea ecuaţiei de regresie:

S yi / Yi
e= ⋅ 100 .
y

Coeficientul de determinaţie reprezintă o altă modalitate de a caracteriza calitatea


funcţiei de regresie (de regulă se trece în dreapta funcţiei de regresie):

 ∑ ( y i − Yi ) 2 
D = 1 −
2
2 
⋅ 100 .
 ∑ ( y i − y ) 

6.3. Metoda corelaţiei parametrice şi neparametrice.


Pentru a exprima intensitatea legăturii dintre variabile se utilizează la alegere
următorii indicatori:
• covarianţa;
• coeficientul de corelaţie;
• indicele sau raportul de corelaţie.

Covarianţa este o mărime absolută a intensităţii legăturii dintre variabile şi se


stabileşte ca medie aritmetică a produselor ( xi − x )( y i − y ) :

1
cov( x, y ) =
n
∑ ( xi − x )( yi − y ).
Dacă rezultatul este egal cu zero sau tinde către zero atunci între variabile nu
există legătură statistică. Dacă rezultatul este pozitiv legătura dintre variabile este directă.
Dacă rezultatul este negativ legătura dintre variabile este inversă. Valoarea maximă pe
care o poate lua covarianţa a două variabile este egală cu produsul dintre abaterea medie
pătratică a celor două variabile şi este întâlnită în cazul unei legături perfecte:

cov( x, y ) max = σ x ⋅ σ y .

Coeficientul de corelaţie măsoară intensitatea legăturii dintre două variabile şi se


calculează prin compararea covarianţei empirice, reale, cu valoarea maximă pe care o
Statistică teoretică şi economică

poate avea covarianţa. Coeficientul de corelaţie arată intensitatea şi sensul legăturii


dintre variabile.

rxy =
cov( x, y )
=
∑ (x i − x )( y i − y )
.
σ x ⋅σ y n ⋅σ x ⋅σ y

De asemenea, este folosită şi următoarea formulă dedusă din cea de mai sus:
n ⋅ ∑ x i ⋅ y i − ∑ xi ⋅ ∑ y i
rxy = .
[n ⋅ ∑ xi2 − (∑ xi ) 2 ][n ⋅ ∑ y i2 − (∑ yi ) 2 ]

În practica social-economică se utilizează următoarele interpretări ale


coeficientului de corelaţie:
rxy ∈ (0;0,2) , fie că nu există legătură, fie că legătura este foarte slabă;
rxy ∈ (0,2;0,5) , legătura este slabă şi necesită aplicarea unui test de verificare
a semnificaţiei statistice a acestei legături (testul Student);
rxy ∈ (0,5;0,75) , legătura este de intensitate medie;
rxy ∈ (0,75;0,95) , legătura este puternică;
rxy ∈ (0,95;1) , legătura este foarte puternică, cvasifuncţională.

Pentru legătura dintre variabile pentru repartiţia de frecvenţe, vom avea


următoarea relaţie:

n ⋅ ∑∑ xi ⋅ y i ⋅ n xy − ∑ xi ⋅ n x ⋅ ∑ y i ⋅ n y
rxy = .
[n ⋅ ∑ xi2 ⋅ n x − (∑ xi ⋅ n x ) 2 ][n ⋅ ∑ y i2 ⋅ n y − (∑ y i ⋅ n y ) 2 ]

Testul Student (testul t):

rxy
t= ⋅ n − 2.
1 − rxy2

Pentru a accepta ipoteza unei legături reale, valoarea calculată a lui “t” trebuie să
fie mai mare decât valoarea tabelată pentru “n-2” grade de libertate.

Raportul de corelaţie are o aplicabilitate universală pentru măsurarea intensităţii


legăturii dintre variabile indiferent de câte variabile luăm în calcul şi indiferent de forma
relaţiei dintre variabile. Raportul de corelaţie nu arată şi sensul legăturii dintre variabile,
ci numai intensitatea legăturii.
Statistică teoretică şi economică

R xy = 1−
∑(y i − Yi ) 2
.
∑(y i − y) 2

Raportul de corelaţie are acelaşi domeniu şi subdomenii de definire ca şi


coeficientul de corelaţie.
Ori de câte ori una sau mai multe variabile luate în calcul sunt nenumerice
(calitative, nominative) formulele corelaţiei parametrice devin înoperante.
Nu numai aceste variabile se pot trata prin metode nemarametrice ci chiar şi
variabilele numerice pot fi transformate în serii de ranguri (numere de ordine) sau în
variabile alternative.
Metodele neparametrice sunt:
• coeficientul de asociere propus de Yule;
• coeficientul de corelaţie a rangurilor Spearman;
• coeficientul de corelaţie a rangurilor Kendall.

De exemplu, dintr-un total de 3890 persoane care au achizitionat produse în timpul


unei săptămâni dintr-un magazin de cosmetice, 1350 sunt clienţi permananţi şi 2540 ocazionali. Din
acelaşi total 2590 sunt femei şi 1300 barbaţi. Se pune întrebarea dacă între fidelitatea faţă de
magazin şi clienţi se află o anumită legătură.

Barbaţi Femei Total


Clienţi permananţi 304 1046 1350
Clienţi ocazionali 996 1544 2540
Total 1300 2590 3890

Coeficientul de asociere Yule se utilizează atunci când unităţile caracteristicii


sunt separate în două grupe sau sunt de forma unei caracteristici alternative:

X Y Total
Y1 Y2
X1 A B A+B
X2 C D C+D
Total A+C B+D A+B+C+D

Pentru exprimarea intensitatii celor doua variabile se utilizeaza un coefficient de


asociere calculat astfel:

A⋅ D − B ⋅C
Q= .
A⋅ D + B ⋅C

Interpretarea rezultatului este identică cu cea de la coeficientul de corelaţie.


In cazul exemplului nostru rezultatul este Q = - 0,3788; rezultand o asociere
inversa intre sex si tipul de client in sensul ca nu barbatii sunt clienti permanenti, ci
femeile. Sau nu este adevarat ca fameile sunt cliente ocazionale.
Statistică teoretică şi economică

Coeficientul de corelaţie a rangurilor Spearman exprimă intensitatea şi sensul


legăturii dintre rangurilor celor “n” unităţi:

6 ⋅ ∑ d i2
rS = 1 − .
n(n − 1)

Pătratul diferenţei dintre rangurile atribuite aceleaşi unităţi este notat cu d i2 .


Interpretarea rezultatului este identică cu cea de la coeficientul de corelaţie.

Coeficientul de corelaţie a rangurilor Kendall este destinat tot analizei


intensităţii legăturii dintre rangurile celor n unităţi:

2⋅S
rK = .
n(n − 1)

Suma dintre numărul de ranguri superioare fiecărui rang şi numărul de ranguri


inferioare fiecărui rang se numeşte scor şi este notată cu S. Interpretarea rezultatului este
identică cu cea de la coeficientul de corelaţie.
Coeficientul de asociere al lui Yule, coeficientul de corelaţie a rangurilor
Spearman şi coeficientul de corelaţie a rangurilor Kendall fac parte din analiza corelaţiei
neparametrice.
Statistică teoretică şi economică

Probleme şi aplicaţii
6.1. Potrivit publicaţiilor OCDE, ţările membre s-au caracterizat în anul 1998 prin
niveluri ale performanţei interne (exprimate prin indicatorul PNB/locuitor) şi,
respectiv, ale performanţei externe (sintetizate sub forma exportului de bunuri şi
servicii/locuitor) cuprinse în tabelul de mai jos:
mii USD
Ţara PNB/locuitor Export de bunuri şi
servicii/locuitor
Australia 18,7 4,5
Austria 26,2 10,8
Belgia 24,4 17,4
Canada 19,1 8,2
R. Cehă 5,4 2,9
R. Coreea 6,4 3,7
Danemarca 32,9 11,6
Elveţia 36,9 14,4
Finlanda 24,5 9,3
Franţa 24.4 6,3
Germania 26,1 6,8
Grecia 11,4 1,8
Islanda 29,8 9,9
Irlanda 22,3 16,8
Italia 20,3 5,5
Japonia 30,0 3,7
Luxemburg 38,6 34,0
Marea Britanie 23,0 6,2
Mexic 4,4 1,3
Norvegia 32,9 14,4
Noua Zeelandă 13,8 4,9
Olanda 24,1 13,0
Polonia 3,9 0,9
Portugalia 10,6 3,2
Spania 14,1 3,8
S.U.A. 30,5 3,6
Suedia 25,9 11,3
Turcia 3,2 0,7
Ungaria 4,7 1,9

Sursa: OECD în Figures: Statistics on the Member Contries 1999 Edition, Paris,
1999
Se cere:
Să se precizeze rolul fiecărei variabile în analiza legăturii şi să se observe sensul
şi forma legăturii între cele două variabile folosind metoda seriilor paralele şi metoda
grafică.
Rezolvare
Potrivit teoriei economice a relaţiilor internaţionale, performanţa exterioară a unei
ţări depinde, în bună măsură, de cum şi ce anume produce şi oferă spre export economia
acelei ţări. Prin urmare, variabila PNB/locuitor se consideră a fi cauza sau variabila
independentă (explicativă sau factorială), variantele ei notându-se cu xi, iar variabila
export/locuitor este considerată efect sau variabilă dependentă (explicată sau rezultativă),
Statistică teoretică şi economică

variantele notându-se cu yi . Merită menţionat faptul că nivelul exportului/locuior realizat


de fiecare ţară depinde, în afară de propriul PNB/locuitor, de mulţi alţi factori, cum ar fi
politica comercială şi, în particular, acordurile şi înţelegerile economice la care este parte
contractantă, mediul conjunctural specific al diferitelor sectoare etc. În aceste condiţii,
mulţimea perechilor de valori (xi , yi ) reflectă o legătură statistică directă, ceea ce poate fi
constatat atât grafic (pe măsură ce xi este mai mare, şi yi tinde să fie mai mare), cât şi prio
metoda seriilor paralele (ordonând perrechile de valori xi, yi în sensul crescător al
variantelor caracteristicii PNB/locuitor).
Dispunerea celor 29 de puncte de coordonate xi, yi faţă de sistemul rectangular al
axelor de referinţă permite avansarea ipotezei unei legături directe de forma dreptei:
f(xi) = a +b xi.
¾ Să se estimeze şi comenteze parametrii funcţiei liniare de regresie
Rezolvare
Folosind datele din tabelul 66.1. se pot stabili următoarele sume: n = 29; ∑xi =
588,5;
∑yi = 232,8; ∑xi2 = 15066,39; ∑yi2 = 3237,5; ∑xi yi = 6192,56.
Pentru estimarea parametrilor acelei drepte pentru care distanţa este minimă până
la punctele de coordonate xi, yi, sistemul de ecuaţii normale:

n a + b ∑ x i = ∑ y i

a ∑ x i + b∑ x i = ∑ x i y i
2

se particularizează astfel:

29 a + 588,5 b = 232,8



588,5 a + 15066,39 b = 6192,56

Prin rezolvarea sistemului se găseşte:


a = - 1,51 Acest parametru nu are semnificaţie economică. Din punct de vedere
geometric este ordonata punctului în care dreapta de regresie
intersectează axa Oy.
b = + 0,47 Acest parametru se numeşte coeficient de regresie. Prin semn el exprimă,
sensul influenţei PNB/locuitor asupra exportului pe locuitor (+ înseamnă influenţă
directă), iar prin mărime, cunatumul influenţei (la fiecare creştere cu o unitate a cauzei,
variabila efect tinde să se modifice în acelaşi sens cu 0,47 unităţi).
Funcţia liniară de regresie:
f (xi) = - 1,51 + 0,47 xi
sintetizează pentru cele 29 de ţări membre ale OCDE tendinţa medie de variaţie a
performanţei externe, exprimate prin export/locuitor în anul 1998 sub influenţa exclusivă
a PNB/locuitor.
¾ Să se măsoare intensitatea legăturii dintre cele două variabile.
Rezolvare
Întrucât s-a avansat ipoteza unei legături liniare, se poate folosi coeficientul de corelaţie:
Statistică teoretică şi economică

n∑ x i y i − ∑ x i ∑ y i
r=
[n∑ x 2
i
2
][
− (∑ x i ) n∑ y i2 − (∑ y i )
2
]
Introducând datele de mai sus în această relaţie, rezultă r = + 0,7101, ceea ce
înseamnă că între PNB/locuitor şi exportul/locuitor al celor 29 ţări există în anul 1998 o
legătură directă de intensitate medie.
¾ Cum poate fi apreciată capacitatea funcţiei de regresie de a descrie
variaţia exportului/locuitor?
Răspuns
De obicei, se procedează la aflarea valorilor teoretice Yi ale caracteristicii
rezultative, înlocuind în funcţia identificată argumentul xi cu valorile succesive din
tabelul 61.1. (coloana PNB/locuitor).
Mulţimea diferenţelor (yi-Yi) alcătuieşte un domeniu de dispersie în jurul funcţiei
de regresie. Intensitatea împrăştierii se exprimă print-un coeficient de eroare a regresiei –
formă particulară a coeficientului de variaţie întâlnit la analiza seriilor de repartiţie (vezi
şi problemea nr. 67).
Ţinând seama de faptul că la punctul anterior al problemei s-a aflat coeficientul de
corelaţie r = 0,7191 şi că acest coeficient este cazul particular al indicatorului general de
comensurare parametrică a intensităţii legăturii dintre variabile – raport de corelaţie, se
ştie că prin ridicarea la pătrat şi înmulţirea cu 100 se află coeficientul de determinaţie
(D):
D = r2 ⋅ 100 = 0,71012 ⋅100 = 50,43%
Coeficientul de determinaţie este o altă modalitate de apreciere a calităţii funcţiei
de regresie. El arată că, funcţia sintetizează 50,43% din variaţia totală a
exportului/locuitor al ţărilor membre ale OCDE în anul 1998. Cota ridicată a
determinaţiei arată implicit faptul că PNB/locuitor este un factor important de influenţă,
iar aprecierea liniară a acestei influenţe satisfăcătoare.

6.2. Studiul relaţiei dintre nivelul de calificare şi compartamentul profesional


conduce la următoarele constatătri făcute pe un eşantion de 50 de salariaţi:

Comportament profesional Corespunzător Necorespunzător

Nivel de calificare
Calificat 18 7
Necalificat 9 16

¾ Se cere: să se estimeze intensitatea asocierii între cele două variabile


alternative.
Rezolvare
Dacă se notează: a = 18; b = 7; c = 9; d = 16, atunci coeficientul Yulle de asociere este:

ad − bc 18 ⋅ 16 − 7 ⋅ 9
Q= = = +0,641
ad + bc 18 ⋅ 16 + 7 ⋅ 9
Statistică teoretică şi economică

Rezultatatul exprimă o asociere directă de intensitate medie, (totuşi, nu foarte


puternică) între nivelul de calificare şi calitatea comportamentului profesional. Există şi
alţi factori (în afara nivelului de calificare), care influenţează comportamentul
salariaţailor.
Observaţie:
Aranjarea corectă a datelor în tabelul de asociere este esenţială: dacă varianta
independentă (nivel de calificare începe cu varianta pozitivă (calificat), urmând, apoi
varianta alternativă, atunci şi variabila dependentă (calitatea comportamentului
profesional) trebuie să fie înregistrată mai întâi cu varianta pozitivă (corespunzător) şi,
apoi, cu varianta (necorespunzător). Numai astfel mărimile a şi d exprimă asocierea
directă, iar c şi d asocierea inversă.

6.3. O analiză psihologică avansează ipoteza potrivit căreia disponibilitatea


cititorului de a se informa folosind concomitent ziare de orientare diferită scade pe
măsură ce vârsta acestuia creşte.
În tabel sunt prezentate rezultatele unei anchete întreprinse în rândul populaţiei de
peste 20 de ani dintr-o metropolă europeană (date convenţionale).
Printre întrebările anchetei s-au numărat:
- vârsta persoanei – considerată în continuare ca variabilă factorială sau
explicativă;
- numărul de cotidiane diferite consultate, de obicei, pe parcursul unei
săptămâni - variabilă rezultativă care – potrivit ipotezei – ar putea fi
explicată, între alte cauze, şi de vârsta cititorului.
-
Număr ziare 0-2 3–5 6 şi peste Total

Vârsta (ani)
20 – 40 7 956 5 712 1 682 15 350
40 – 60 7 548 4 703 1 025 13 276
peste 60 3 718 842 122 4 682
Total 19 222 11 257 2 829 33 308
Se cere:
¾ Să se estimeze parametrii funcţiei liniare de regresie care exprimă influenţa
vârstei asupra dorinţei de a utiliza surse diversificate de informare.
Rezolvare
Sistemul de ecuaţii normale pentru estimarea parametrilor unei drepte:
f (xi) = a + b xi ,
atunci când analiza de regresie se face pe baza unei repartiţii bidimensionale de frecvenţe
se scrie astfel:

n a + b∑ x i n x = ∑ y i n y

a ∑ x i n x + b∑ x i n x = ∑ ∑ x i y i n xy
2

Elementele ajutătoare de calcul se determină folosind notaţiile din tabelul 65.2.


Statistică teoretică şi economică

În acest tabel, s-a notat cu xi centrele intervalelor de grupare după vârsta


persoanelor chestionate şi cu yi centrele intervalelor de grupare după numărul ziarelor
diferite, consultate într-o săptămână.
Tot cu datele din acest tabel se află şi:
∑∑xiyinxy = 3 509 890

yi 1 4 7 Total (nx) xinx xi2nx


xi
30 7 956 5 712 1 682 15 350 460 500 13 815 000
50 7 548 4 703 1 025 13 276 663 800 33 190 000
70 3 718 842 122 4 682 327 740 22 941 800
Total (ny) 19 222 11 257 2 829 33 308 1 452 040 69 946 800
yi ny 19 222 45 028 19 803 84 053
yi2ny 19 222 180 112 138 621 337 955

Rezolvarea sistemului de ecuaţii normale:


33 308 a + 1 452 040 b = 84 053

1 452 040 a + 69 946 800 b = 3 509 890

conduce la următoarele rezultate:


a = + 1,5111; b = 0,0232
iar f (xi) = 1,5111 – 0 0232 xi
În cazul anchetei studiate, se constată că la fiecare creştere cu un an a vârstei
persoanei chestionate rezultă o tendinţă medie de reducere a interesului pentru surse
diferite de informare cu 0,0232 ziare. Având în vedere amplitudinea mare a vârstei
persoanelor, influenţa mică a lui X aszpra lui Y este doar aparentă: dacă la xi = 20 ani o
persoană din metropola investigată citeşte în medie f (20) = 1,05 ziare, o persoană de 60
de ani, citeşte în medie doar f (60) = 0,2 ziare.
¾ Să se măsoare intensitatea legăturii dintre cele două variabile, folosind rezultatele
anchetei.
Rezolvare
Coeficientul de corelaţie poate fi obţinut prin utilizarea calculelor ajutătoare
din tabelul 65.2 astfel:

n∑ ∑ x i y i n xy − ∑ x i n x ⋅ ∑ y i n y
r= = −0,1688 ,
[n∑ ( x n ) ][n∑ y
2
i x
2 2
i n y − (∑ y i n y ) 2 ]
ceea ce exprimă o legătură inversă slabă între cele două variabile.
Observaţie: Prin ridicarea la pătrat şi înmulţirea cu 100 rezultă un coeficient de
determinaţie de numai 2,8%. Interpretarea acestui rezultat: Dacă se consideră o influenţă
liniară a lui X asupra lui Y, atunci vârsta diferită a persoanelor explică doar 2,8% din
variaţia disparibilităţii cititorilor de a folosi concomitent surse (ziare) diferite pentru
informarea lor.
¾ Este statistic consistentă o influenţă atât de redusă?
Statistică teoretică şi economică

Răspuns
Aplicarea testului Student (t):

r
t= n − p = 31,2544 ,
1− r2

unde: r este valoarea absolută a coeficientului de corelaţie, n este volumul


colectivităţii cercetate, iar p = 2 (numărul de parametri ai funcţiei liniare de regresie),
rezultă o valoare calculată t = 31,2544 mult mai mare decât valoarea critică tabelară
pentru o eroare acceptată α = 0,05 (t = 1,96). Chiar şi pentru o eroare α = 0,0001
influenţa este semnificativă, t fiind tabelat cu 3,891.

6.4. Dintr-o analiză a compartimentului vânzării interne al unei societăţi comerciale


specializate în producţia de frigidere rezultă creşterea vânzărilor de la 8200 unităţi
în 1999 la 8740 unităţi în anul 2000, în condiţiile unei ieftiniri reale a produsului cu
4,2%.
În aceeaşi perioadă, veniturile reale ale populaţiei ţării au crescut cu 6,8%.
¾ Să se analizeze elasticitatea cererii pentru frigidere atât în raport cu evoluţia
preţului de vânzare, cât şi faţă de creşterea veniturilor populaţiei.
Rezolvare
Înainte de a calcula coeficienţii de elasticitate, este necesară determinarea ritmului de
creştere a vânzărilor ca expresie a dinamicii cererii
de frigidere.
Notând: y0 = 8200 bucăţi şi y1 = 8740 bucăţi, rezultă că:

y1 − y 0
Ry = ⋅ 100 = 6,6%
Y0

Elasticitatea cererii de frigidere în raport cu ieftinirea produsului se obţine


comparând ritmul de creştere a cererii cu ritmul de ieftinire a produsului:
E1 = Ry : Rx = 6,6 : 4,2 = 1,57
Cererea de frigidere este elastică faţă de ieftinirea produsului: la fiecare scădere
cu !% a preţului, cererea a crescut în perioada 1999-2000 cu 1,57%.

6.5. Producţia şi importul de biciclete au cunoscut în perioada 1990-1996


următoarea evoluţie în România (mii bucăţi):

ANUL 1990 1191 1992 1993 1994 1995 1996


Producţia de biciclete 136 107 67 41 28 22 19
Importul de biciclete 13 18 22 31 28 40 63

Se cere:
¾ să se reprezinte grafic legătura dintre cele două variabile;
¾ să se determine şi interpreteze parametrii funcţiei de regresie liniară;
Răspuns: Yˆi = 47,93 − 2,133 ⋅ x i
Statistică teoretică şi economică

¾ Să se determine valorile ajustate ale variabilei dependente Y; să se analizeze


validitatea statistică şi economică a modelului liniar
Răspuns:
Yˆi
8,90 17,23 28,71 36,17 39,90 41,62 42,48

¾ să se măsoare intensitatea legăturii dintre cele două variabile cu ajutorul


coeficientului de corelaţie şi a raportului de corelaţie;
Răspuns: r = - 0,78; R = 0,78

6.6. Comerţul exterior al României cu Danemarca a evoluat în perioada 1991-1998


astfel (mil USD):

ANUL 1991 1992 1993 1994 1995 1996 1997 1998


Export 2 4 6 9 15 14 16 23
Import 9 21 48 46 55 87 50 70

Se cere:
¾ să se reprezinte grafic relaţia export-import;
¾ să se determine şi comenteze parametrii funcţiei liniare de regresie;
Răspuns: a = 0,35; b = 0,2233
Notă: Ecuaţia liniară se consideră de forma yi = a + b ⋅ xi
¾ să se caracterizeze intensitatea legăturii dintre export şi import
Răspuns: R = 0,78

6.7. Este cunoscut faptul că există o legătură inversă între dinamica producţiei
industriale şi rata şomajului, astfel încât, atunci când rata şomajului scade,
producţia industrială creşte şi invers. Să se verifice această ipoteză folosind
următoarele date:

Ţara Producţia industrială Rata şomajului


(% de modificare) (%)
Australia 6,2 7,4
Belgia 0,7 10,9
Canada 5,4 7,7
Germania 2,3 8,9
Olanda 0,1 14,0
Italia 7,8 15,7
Japonia 12,8 2,6
Elveţia 5,6 20,1
Marea Britanie 3,3 9,0
S.U.A. 5,7 5,4

Se cere:
¾ Să se determine şi interpreteze coeficientul de corelaţie;
Statistică teoretică şi economică

Răspuns: r = - 0,36
¾ Să se testeze semnificaţia statistică a coeficientului obţinut, admiţând o eroare
α = 0,05
Răspuns: tcalc = 1,091, faţă de nivelul critic tabelat de 2,306 pentru α = 0,05 şi k = 8
grade de libertate
¾ Să se determine coeficienţii de corelaţie neparametrică Spearman şi Kendall .
Răspuns: CSpearman = - 0,36; CKendall = - 0,16
¾ Să se estimeze şi interpreteze parametrii funcţiei liniare de regresie.
Răspuns: a = 7.59; b = -0.256

6.8. Dintr-o anchetă statistică efectuată de o firmă asupra unor aspecte cu caracter
social şi economic, au rezultate următoarele aprecieri:

Aspecte social-economice Ranguri Ranguri


stabilite de stabilite de
salariaţi patroni
Aprecierea muncii bine făcute 1 8
Sentimentul de implicare la 2 10
realizarea producţiei
Problemele personale 3 9
Securitata muncii 4 2
Salarii 5 1
Interesul faţă de muncă 6 5
Organizara muncii 7 3
Localitatea angajaţilor 8 6
Condiţii de lucru 9 4
Disciplina 10 7

Se cere:
¾ Să se stabilească intensitata asocierii dintre cele două feluri de aprecieri
folosind de coeficienţii de corelaţie neparametrică (Spearman şi Kendall) între
cele două opţiuni;
Răspuns: CSpearman = -0,36; CKendall = - 0,16.

6.9. Cercetând relaţia dintre numărul investitorilor străini provenind dintr-o ţară şi
volumul capitalului investit de aceştia în România, este logic să se avanseze ipoteza
unei asocieri directe între cele două variabile. Această ipoteză se studiază folosind
datele referitoare la primele 40 de ţări care au efectuat investiţii în România în anul
″t″.
În tabelul de mai jos, cele două variabile numerice ″număr investitoi″ şi ″capital
investit″ au fost comprimate sub forma a două variabile alternative ţinând cont de
numărul mediu al investitorilor din fiecare ţară şi respectiv de volumul mediu al
capitalului provenit din fiecare ţară.

Capital investit Peste medie Sub medie


Număr investitori
Peste medie 5 5
Sub medie 9 21
Statistică teoretică şi economică

Să se determine şi comenteze intensitatea asocierii dintre cele două variabile.


Răspuns: + 0,4. O asociere directă destul de modestă din punct de vedere al intensităţii

6.10. Un analist de marketing urmăreşte în cinci luni efectul acţiunilor de publicitate


(x) veniturilor obţinute din vânzări (y). El înregistrează în acest sens cheltuieli de
productivitate milioane lei şi încasări din vânzări sute de milioane lei. În urma
prelucrării datelor a obţinut:

Σxi = 15;
Σyi = 10;
Σxi2 = 55; şi
Σxiyi = 37 (i = 1,5 ).

Analistul a stabilit pe baza unor teste specifice că dependenţa dintre variabile


situate este liniară. Ecuaţia dreptei de regresie este:

a) ŷ = 0,7x;
b) ŷ = 0,7 – 0,1x;
c) ŷ = 0,1 – 0,7x;
d) ŷ = 2 – 0,7x;
e) ŷ = 3,7 – 5,5x;

6.11. Legătura dintre raportul de corelaţie (R) şi raportul F utilizat în testarea


validităţii modelului liniar de regresie este exprimată prin relaţia:
6.12.
1− R2
a) F = (n − 2) ;
R2
R2
b) F= ;
1− R2
R2
c) F = ;
(1 − R 2 )(n − 2)
R2
d) F = (n − 2) ;
1− R2
R2 +1
e) F = (n − 2) ;
1− R2

6.13. Să se analizeze evoluţia pieţei televiziunii prin cablu din România, folosind
datele referitoare la perioada 1990-1999 preluate din revista ″Capital″ nr.
47/23 noiembrie 2000:

ANUL 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
Tarif mediu 0,01 0,03 0,40 0,80 1,30 1,80 2,30 2,70 3,00 3,20
lunar (USD)
Statistică teoretică şi economică

Nr. abonaţi 0,70 0,90 1,00 1,50 2,00 2,50 3,30 3,20 3,10 3,10
(milioane)

Recomandare
Se va elabora o diagramă de corelaţie. Pe baza acestei diagrame se alege forma
funcţiei de regresie. Pentru aprecierea intensităţii legăturii, se va folosi raportul de
corelaţie. Se pot folosi şi coeficienţi de elasticitate a evoluţiei, numărului de abonaţi faţă
de mişcarea tarifului mediu lunar, în diferitele intervale ale perioadei analizate.

6.13. Cum apreciaţi elasticitatea vânzărilor în raport cu creşterea veniturilor


populaţiei
a) elastică;
b) elasticitate unitară;
c) inelastică;
dacă într-o perioadă de trei ani vânzările au sporit cu 8,7%, iar veniturile cu
4,6%.
Justificaţi opţiunea făcută.

6.14. Este cunoscut faptul că există o legătură inversă între producţia industrială şi
rata şomajului, astfel încât atunci când rata şomajului scade, producţia industrială
creşte. În acest sens se cunosc următoarele date:

(date convenţionale)
Ţara Producţia industrială Rata şomajului
(% de modificare) (%)
Australia 6,2 7,4
Belgia 0,7 10,9
Canada 5,4 7,7
Germania 2,3 8,9
Olanda 0,1 14,0
Italia 7,8 15,7
Japonia 12,8 2,6
Elveţia 5,6 20,1
Marea Britanie 3,3 9,0
S.U.A. 5,7 5,4

Se cere:
1. să se determine ecuaţia de regresie dintre cele două variabile;
2. să se calculeze coeficentul de corelaţie;
3. să se calculeze coeficientul rangurilor Spearman şi Kendall şi să se compare cu
rezultatul obţinut la punctul anterior.

6.15. Datele următoare arată numărul de bacterii existente pe o lamelă la sfârşitul


fiecărei ore pe o perioadă de şase ore:
(date convenţionale)
Ora 1 2 3 4 5 6
Număr de bacterii 10 50 200 765 3070 12280
Statistică teoretică şi economică

Se cere:
1. utilizând metoda celor mai mici pătrate şi cunoscând că cele două fenomene evoluează
exponenţial să se determine ecuaţia de regresie;
2. să se calculeze, pe baza ecuaţiei de regresie obţinută la punctul anterior, numărul de
bacterii după şapte ore.

6.16. Preţul pe bucată în mii lei este dat de variabila “x” şi numărul de produse
vândute pe lună timp de 8 luni “y” sunt reprezentate în tabelul următor:

(date convenţionale)
X 12 13 14 12 14 15 17 19
Y 28 20 20 25 16 12 10 7

Se cere:
1. găsiţi ecuaţia de regresie liniară;
2. estimaţi numărul de produse vândute atunci când preţul pe unitate este 18.

6.17. Se cunoaşte că decizia managerială în ceea ce priveşte creşterea vânzărilor la


un magazin de încălţăminte se ia şi funcţie de mărimea suprafeţei destinate vânzării.
Astfel, magazinul prezintă următoarea situaţie:

(date convenţionale)
Suprafaţa comercială (mp) Valoarea vânzărilor (mil.lei)
50 8
120 14
180 20
210 24
250 30
300 42

Se cere:
1. să se stabilească parametrii ecuaţiei de regresie dintre cele două variabile;
2. să se determine coeficientul de corelaţie dintre variabile;
3. dacă managerul magazinului doreşte să mărească suprafaţa destinată vânzării la 350
mp., să se determine valoarea scontată a vânzărilor având la bază legătura liniară dintre
variabile.

6.18. Comerţul exterior al României cu câteva ţări europene prezintă următoarea


situaţie în 1996 (mil.$):
Ţara Export Import
Austria 169 349
Belgia 124 185
Danemarca 14 87
Germania 1486 2008
Grecia 177 186
Olanda 343 266
Spania 95 102
Suedia 44 77
Regatul Unit 248 330
Statistică teoretică şi economică

Sursa: Anuarul de comerţ exterior al României, 1997, C.N.S., pag.17.

Se cere:
1. considerând relaţia dintre export şi import de formă liniară, să se determine şi să se
interpreteze parametrii funcţiei de regresie;
2. să se măsoare şi să se comenteze intensitatea legăturii dintre cele două variabile
folosind o metodă parametrică şi una neparametrică.
Statistică teoretică şi economică

CAPITOLUL 7.
SERII CRONOLOGICE
Cuvinte cheie:
- ajustarea seriilor cronologice
- ciclicitatea
- indicii de dinamică cu bază fixă
- indicii de dinamică cu bază în lanţ
- modificarea absolută cu bază fixă
- modificarea absolută cu bază în lanţ
- ritm cu bază fixă
- ritm cu bază în lanţ
- serie cronologică
- sezonalitatea
- trend
- valoarea absolută a unui procent de creşterecu bază fixă
- valoarea absolută a unui procent de creşterecu bază în lanţ
- variaţia reziduală

Orice proces sau fenomen al activităţii umane poate fi studiat atât în timp, cât şi în
spaţiu. Analiza presupune, în principal, o cercetare în timp cu ajutorul unor indicatori
statistici specifici de-a lungul diferitelor perioade de timp. De exemplu, putem înregistra
volumul vânzărilor zilnice dintr-un magazin electrocasnic, evoluţia lunară a producţiei de
cărbune, evoluţia zilnică a ratei dobânzii sau a ratei de schimb.
este formată din două şiruri de date paralele, un şir arătând variaţia caracteristicii
de timp, iar cel de-al doilea – variaţia fenomenului sau a caracteristicii de la o perioadă la
alta. Seriile cronologice se mai numesc şi serii de timp sau serii dinamice. Deci, se poate
spune că seriile cronologice apar ca rezultat al unor măsurători ce se efectuează la
anumite momente sau intervale de timp, care pot fi egale sau neegale, asupra unei
colectivităţi în ansamblul său sau a unei părţi dintr-o colectivitate.
La construirea şi la analiza seriilor cronologice trebuie avute în vedere
proprietăţile acestora:
- variabilitatea termenilor;
- omogenizarea termenilor;
- periodicitatea termenilor;
- interdependenţa termenilor.
Să încercăm să explicăm fiecare dintre aceste proprităţi:
Variabilitatea termenilor unei serii cronologice rezultă din faptul că fiecare
termen este obţinut prin centralizarea unor date individuale. Acest lucru face să existe
anumite diferenţieri între termenii seriei, fie ca urmare a acţiunii factorilor aleatori, fie ca
urmare a faptului că în viaţa economică-socială legile se manifestă ca tendinţă generală,
imprimând fenomenelor şi proceselor diferite forme de variaţie.
Omogenitatea termenilor este înţeleasă în sensul că o anumită în sensul că o
anumită serie nu cuprinde decât fenomene şi procese de acelaşi gen, care sunt efecte ale
aceluiaşi tip de cauze. Pentru a asigura omogenitatea termenilor trebuie utilizată aceeaşi
Statistică teoretică şi economică

metodologie de evaluare şi calcul al indicatorilor, precum şi aceleaşi criterii de clasificare


privind mărimea intervalului de timp şi a unităţii statistice etc. Cu alte cuvinte,
prelucrarea unei serii cronologice trebuie să se facă după ce s-a verificat dacă datele
provin din aceeaşi sursă, dacă au aceleaşi grad de cuprindere a unităţilor, aceleaşi şi
metode de prelucrare: deci, trebuie asigurată comparabilitatea datelor.
Periodicitatea termenilor înseamnă asigurarea continuităţii datelor din punctul de
vedere al timpului. Variabila timp poate cunoaşte periodicităţii diferite. În baza acestei
priorităţi putem descrie evoluţia unui fenomen sau proces economic ori social sub forma
ecuaţiei: Yi = f(ti).
Interdependenţa termenilor unei serii cronologice este reultatul respectării
principiului unităţii de timp, spaţiu şi a structurii organizatorice. Având în vedere relaţiile
de cauzalitate, fiecare indicator depinde într-o anumită măsură de valoarea indicatorului
precedent.
În evoluţia fenomenelor şi proceselor economico-sociale se pot întâlni mai multe
tipuri de serii cronologice.
1) după modul de exprimare a indicatorilor, seriile cronologice pot fi:
1.1. serii cronologice formate din indicatori absoluţi, care reprezintă forma de
bază a seriilor de timp;
1.2. serii cronologice din indicatori relativi,care reprezintă un mod de prezentare
procentuală a datelor (în acest caz trebuie să se precizeze baza de raportare);
1.3. serii cronologice formate din indicatori medii, care reprezintă evoluţia unor
caracteristici calitative, de exmplu: salariul mediu, productivitatea muncii etc;
2) după timpul la care se referă datele, seriile cronologice pot fi:
2.1. serii cronologice de intervale de timp:sunt seriile în care fiecare indicator
reprezintă rezultatul unui proces sau fenomen la fiecare perioadă de timp. De exemplu:
evoluţia cifrei de afaceri, a profitului etc. Aceste serii se mai numesc şi serii de fluxuri;
2.2. serii cronologice de momente: sunt seriile în care fiecare indicator
caracterizează mărimea la care a ajuns caracteristica studiată la momentul calculului. De
exemplu: populaţia la 1 iulie, valoarea capitalului fix la sfârşitul anului etc. Aceste serii
se mai numesc şi serii de stocuri.

7.1.Componentele unei serii cronologice


Componentele unei serii cronologice sunt generate de factorii care interacţionează
cu cariabila rezultativă (Y) analizată, rezultând:
- trendul sau tendinţa generală (T), care poat fi:
- seculară;
- de durată medie (10-20 ani);
- de scurtă durată (3-10ani).
- sezonalitatea (S);
- ciclicitatea (C);
- variaţia reziduală (R).
Prin trend sau tendinţă generală se înţelege mişcarea relativ regulată a unui
fenomen sau proces în decursul unei perioade reprezentând o creştere sau o descreştere.
Sezonalitatea reprezintă existenţa unor oscilaţii (fluctuaţii) în funcţie de
anotimpuri, luni sau zile, în desfăşurarea unui fenomen sau proces pe o anumită durată.
Statistică teoretică şi economică

Ciclicitatea se manifestă mai ales în cazul fenomenelor şi proceselor economice


în cadrul economiei de piaţă şi se identifică, de cele mai multe ori, cu ciclul economic.
Atât sezonalitatea, cât şi ciclicitatea nu sunt întotdeauna prezente într-o serie
cronologică.
Variaţia reziduală poate fi de natură aleatoare, gaussiană sau accidentală şi
reprezintă fluctuaţii în funcţie de factorii aleatori. Variaţaia reziduală se mai numeşte şi
componenţa neregulată. Ea reprezintă cariaţia unei serii de timp care nu poate fi explicată
prin trend, ciclicitatea sau sezonalitate. Deoarece componenta reziduală este aleatoare,
efectele ei într-o serie de timp sunt foarte greu de prognozat.
În legătură cu componentele unei serii cronologice, există două modele statistice
de bază pentru o variabilă de timp:
a) modelul aditiv, adică repartizarea cantitativă a raportului dintre valorile seriei
cronologice şi componentele sale, presupunând o relaţie de independenţă a factorilor:

Y = T + S + C + R;
b) modelul multiplicativ, adică reprezentarea cantitativă a raportului dintr valorile
seriei cronologice şi componentele sale, presupunând o relaţie de proporţionalitate a
factorilor:
Y = T ⋅ S ⋅ C ⋅ R.

7. 2. Indicatorii statistici pentru prelucrarea seriilor cronologice.


Sistemul de indictori utilizaţi în prelucrarea seriilor cronologice este următorul:
a) indicatori absoluţi:
- nivelul absolut;
- modificările absolute (sporuri sau scăderi);
b) indicatori relativi:
- indici;
- ritmuri;
- valoara absolută a unui procent de creştere;
c) indicatorii medii;
- nivelul mediu;
- modificarea medie absolută;
- indicele mediu;
- ritmul mediu.
Indicatorii absoluţi se exprimă în unităţile de măsură concretă ale fenomenului
studiat.
Fiecare termen al seriei reprezintă un indicator de nivel şi însumând aceşti
indicatori putem obţine nivelul totalizat al termenilor.
Calculul indicatorilor absoluţi se rezumă la determinarea modificărilor absolute,
interpretate ca scopuri (scăderi) de la o unitate la alta.
Modificarea absolută poate fi calculată în două feluri:
- modificarea absolută cu bază fixă,care se obţine făcând diferenţa dintre
nivelul fiecărei perioade şi nivelul din perioada de referinţă:

∆ t / 1 = y t − y1 .
Statistică teoretică şi economică

- modificarea absolută cu bază în lanţ (glisantă, alunecătoare, mobilă), care se


obţine făcând diferenţa dintre nivelul fiecărei perioade şi nivelul perioadei imediat
următoare:

∆t / t −1 = yt − y t −1 .

Între aceste două tipuri de modificări există următoarea relaţie:

∑∆ t / t −1 = ∆t / 1

Indicatorii relativi sunt utilizaţi pentru a arăta de câte ori nivelul dintr-o anumită
perioadă se modifică faţă de nivelul atins de perioada de bază, sau pentru a determina
acelaşi lucru în procente.
Indicii de dinamică arată de câte ori s-a modificat un proces sau un fenomen de-a
lungul timpului.
Indicii se pot calcula:
- cu bază fixă, determinaţi după relaţia:

yt
I t /1 = ⋅ 100 ;
y1

- cu bază în lanţ, determinaţi după relaţia:

yt
I t / t −1 = ⋅ 100 .
y t −1

La fel ca şi în cazul modificărilor absolute, indicii cu bază fixă şi cei cu bază


mobilă comportă o relaţie între ei. De această dată, relaţia este de tip multiplicativ:

∏I t / t −1 = I t /1

Ritmul de creştere (descreştere) exprimă cu câte procente nivelul atins în


perioada curentă depăşeşte nivelul atins în perioada considerată de comparaţie. Ritmul se
poate calcula:
- cu bază fixă, determinat după relaţia:

y  y − y1 ∆
Rt / 1 = ( I t / 1 − 1) ⋅ 100 =  t − 1 ⋅ 100 = t ⋅ 100 = t / 1 ⋅ 100 ;
 y1  y1 y1

- cu bază în lanţ, determinat după relaţia:

 y  y − y t −1 ∆
Rt / t −1 = (I t / t −1 − 1) ⋅ 100 =  t − 1 ⋅ 100 = t ⋅ 100 = t / t −1 ⋅ 100
 y t −1  y t −1 y t −1
Statistică teoretică şi economică

Trecerea de ritmuri cu bază în lanţ la ritmuri cu bază fixă sau invers se face numai
prin transformarea acestora în indici de dinamică, fapt ce ne conduce la concluzia că în
cazul ritmurilor există inegalitatea:

∏R t / t −1 ≠ Rn / 1

Valoarea absolută a unui procent de creştere exprimă câte unităţi din sporul
înregistrat într-o perioadă revin la fiecare procent al ritmului. Acest indicator face
legătura între indicatorii absoluţi şi cei relativi.
Valoarea absolutã a unui procent se poate calcula:
- cu bază fixă,determinată pe baza relaţiei:
∆ y t − y1 y
At / 1 = t%/ 1 = = 1
R t / 1 y t − y1 100
⋅ 100
y1

- cu bază mobilă, determinată pe baza relaţiei:


-
∆ t / t −1 y t − y t −1 y
At / t −1 = = = t −1
Rt%/ t −1 y t − y t −1 100
⋅ 100
y t −1

Analizele efectuate în domeniul economic şi social se pot realiza şi prin calculul


mediilor de nivel şi al mediilor de ritm.
Astfel, nivelul mediu al unei caracteristici se determină după relaţia:

y=
∑y t

Modificarea medie absolută se determină din modificătile absolute cu bază în


lanţ:

∆=
∑∆ t / t −1
=
y t − y1
n −1 n −1

unde n-1 reprezintă numărul modificărilor absolute cu baza în lanţ.


Indicele mediu de dinamică reprezintă valoarea care, dacă ar substitui indicii de
bază în lanţ, procesul acestora nu s-ar modifica. De menţionat faptul că acest indice
mediu se determină atunci când indicii cu bază în lanţ au valori aproximativ egale.

yn
I = n −1 ∏ I t / t −1 = n −1
y1
Statistică teoretică şi economică

Ritmul mediu arată creşterea procentuală a fenomenului sau precesului studiat în


medie de la o perioadă la alta:

R = (I ⋅ 100) − 100

7. 3. Particularităţile prelucrării seriilor cronologice de momente.


Într-o serie de momente pot fi întâlnite două situaţii: serii de momente cu
intervale egale şi serii de momente cu intervale neegale între ele.
În primul caz, prelucrarea seriei se poate face într-una din următoarele variante:
1. Se transformă seria de momente în serie de intervale, calculându-se media
aritmetică pentru fiecare interval şi apoi indicatorii absoluţi, relativi şi medii.
2. Seriile de momente cu intervale egale între înregistraţi se prelucrează ca atare,
obţinându-se indicatorii absoluţi, relativi şi medii, cu excepţia mediei calculate după o
formulă specială de medie aritmetică, cunoscută sub denumirea de medie cronologică.
Media cronologică simplă se aplică pentru seriile de momente cu intervale egale.
Într-o serie de momente sunt n termeni şi (n-1) intervale, ceea ce înseamnă că fiecare
interval va fi marcat de câte doi termeni. Din această cauză, termenii externi apar o
singură dată, iar toţi ceilalţi de câte două ori.
Pentru a afla media pe total este necesar să se calculeze mediile parţiale pe
fiecare interval, la rândul lor, ca medii aritmetice simple din cei doi termeni ce marchează
intervalul respectiv.
Relaţia de calcul este următoarea:

y1 + y 2 y 2 + y 3 y + yn
+ ... + n −1
y cr = 2 2 2
n −1

Sunt (n-1) termeni la numitor, deoarece, faţă de numărul termenilor seriei, se pot
calcula (n-1) medii parţiale, pe fiecare interval.
După efectuarea calculelor obţinem:

y1 y
+ y 2 + y 3...+ y n −1 + n
y cr = 2 2
n −1

Această formulă, aplicându-se numai la seriile cronologice de momente, se


numeşte media cronologică şi are structura identică cu media generală calculată din
medii parţiale:
Media cronologică ponderată este utilizară în cazul în care între momentele
seriei sunt intervale neegale. Între termeni existând intervale inegale, se consideră că
modificarea lor se va realiza uniform de la un interval la altul. Deci, fiecare interval va fi
proporţionat cu câte o jumătate din lungimea intervalelor alăturate.
Intervalele de timp vor fi:
Statistică teoretică şi economică

t1 t1 + t 2 t 2 + t 3 t n −1
; ; ...
2 2 2 2

Media cronologică ponderată se determină după relaţia:

t  t t  t 
y1  1  + y 2  1 + 2  + ... y n  n −1 
2 2 2  2 
y cr =
 t 1   t1 t 2  t 
  +  +  + ... n −1 
2 2 2  2 
sau:
t  t +t  t 
y1  1  + y 2  1 2  + ... y n  n −1 
2  2   2 
y cr = n −1

∑t
i =1
i

Primul şi ultimul termen se ponderează cu jumătatea din primul interval, iar


termenii intermediari cu câte o jumătate din intervalele alăturate.

7. 4. Ajustarea seriilor cronologice.


Aplicarea unor metode statistico-matematice adecvate asupra unei serii timp în
dorinţa de a extrage ceea ce este esenţial şi tipic în evoluţia fenomenului sau procesului
analizat şi care prezintă caracter de lege se numeşte ajustarea seriei cronologice.
În teoria şi practica statistică sunt utilizate următoarele metode de ajustare:
a) Ajustarea grafică a seriei cronologice. Acest procedeu presupune trasarea
liberă şi aproximativă a unei drepte dau curbe asupra unei serii cronologice
empirice. O asemenea ajustare are un caracter orientativ şi oferă informaţii
asupra tendinţei generale a evoluţiei fenomenului sau procesului supus
cercetării. Însă, ajustarea grafică este subiectivă şi poate duce la determinări
diferite
b) Ajustarea mecanică a seriei cronologice. Acest procedeu constă în aplicarea
succesivă, în mod mecanic, a unor formule de calcul stabilite dinainte, pentru
toţi termenii reali.
Dintre aceste metode, amintim: metoda mediilor mobile; metoda sporului mediu;
metoda indicelui mediu.
Ajustarea pe baza mediilor mobile se foloseşte, în special, când variaţia
termenilor unei serii cronologice prezintă un aspect de regularitate ciclică. Prin
calcularea mediilor mobile se înlătură se înlătură această variaţie şi se prezintă seria de
date cu o variaţie lină, continuă.
Mediile mobile sunt medii parţiale, calculate dintr-un număr prestabilit de
termeni, în care se înlocuieşte pe rând primul termen cu termenul ce urmează în seria care
trebuie să fie austată. Mediile mobile se mai numesc şi medii glisante sau alunecătoare. În
practică, putem calcula medii mobile dintr-un număr impar sau par de termeni.
Spre exemplificare, vom folosi o serie formată din 5 termeni care urmează să fie
ajustaţi prin procedeul mediilor mobile calculate din trei termeni.
Statistică teoretică şi economică

Seria cronologică este:

y1, y2, y3, y4, y5,

y1 + y 2 + y 3
y1 = ;
3
y + y3 + y 4
y2 = 2
3
y3 + y 4 + y5
y3 =
3
În cazul calcului dintr-un număr impar de termeni, fiecare medie mobilă se va
plasa în dreptul unui termen ce corespunde cu poziţia termenului central, numărul
acestora fiind egal cu: n-(n'+1)
unde: n reprezintă numărul termenilor seriei ce urmează a fi ajustată;
n' numărul termenilor din care se calculează media.
În cazul când ajustarea se face pe baza mediilor mobile calculate dintr-un număr
par de termeni, mediile mobile se obţin în două trepte: în primul rând, se determină
mediile provizorii, care se plasează între termenii seriei, şi în al doilea rând, se determină
mediile mobile definitive sau centrate, care se plasează, în dreptul termenilor seriei şi cu
care se face ajustarea termenilor seriei iniţiale.
Considerând o serie in 8 termeni, se pot calcula 5 medii provizorii:

y + y 2 + y3 + y4
Yˆ1 = 1 ;
4
y + y3 + y 4 + y5
Yˆ2 = 2 ;
4
y + y4 + y6
Yˆ3 = 3 ;
4
y + y5 + y6 + y7
Yˆ4 = 4 ;
4
y + y5 + y6 + y7
Yˆ4 = 4 4 ;
4
y + y 6 + y 7 + y8
Yˆ5 = 5 .
4

Pe baza acestora, se pot calcula medii mobile definite ca o medie aritmetică


simplă a celor provizorii luate câte două:

Yˆ1 + Yˆ2 Yˆ2 + Yˆ3 Yˆ + Yˆ4 Yˆ4 + Yˆ5


Y1 = ; Y2 = ; Yˆ3 = 3 ; Y4 =
2 2 2 2

Ajustarea prin metoda sporului mediu se foloses atunci când, prelucrând seria de
date, se obţin sporuri cu bază în lanţ relativ asemănătoare ca valoare unele cu altele.
Statistică teoretică şi economică

Aceasta corespunde unei creşteri a nivelurilor cracteristicii studiate sub forma unei
progresii aritmetice cu raţia egală cu modificarea mediei absolute şi se bazează pe relaţia
care există între primul termen, modificările absolute cu bază în lanţ şi ultimul termen.
Astfel, putem considera că ultimul termen se determină după relaţia:

y n = y 0 + ∆ + ∆ + ∆....∆ ,
adică:
y n = y 0 + n∆

Relaţia care stă la baza ajustării prin procedeul modificării medii absolute va fi:
Yti = y1 + t i ∆ ,

unde: y1 – reprezintă termenul luat ca bază de ajustare;


ti – variabila de timp în raport cu baza de ajustare folosită (poziţie pe care termenul
respectiv o are faţă de termenul ales ca bază).
Ajustarea prin metoda indicelui mediu se foloseşte atunci când termenii seriei au
tendinţa unei progresii geometrice, în care raţia poate fi considerată egală cu indicele de
dinamică.
Ajustarea se bazează pe relaţia dintre primul termen, indicii de dinamică cu bază
în lanţ şi ultimul termen. Deci, dacă ultimul termen se scrie în funcţie de primul, acesta
va fi egal cu primul termen multiplicat succesiv cu indicii cu bază în lanţ.
Se poate considera că ultimul termen are următoarea formă:

y n = y 0 ⋅ I ⋅ I ⋅ ...I ,
adică:
yˆ n = y1 ⋅ I n

Pe baza acestei relaţii se pot determina valorile ajustate. Astfel, un termen


oarecare ajustat egal cu termenul ales ca bază, înmulţit cu indicele mediu de dinamică
ridicat la o putere egală cu numărul ce arată poziţia lui faţă de termenul ales ca bază.

Yˆti = y1 ⋅ (I ) i
t

Aplicarea metodei grafice şi a metodei mecanice se face cu anumite restricţii,


motiv pentru care analiza trebuie completată cu utilizarea metodelor analitice bazate pe
folosirea funcţiilor matematice de ajustare.
c) Ajustarea prin metode analitice. Tendinţa centrală a evoluţiei se exprimă ca o
funcţie de timp:
y = f(t), numită funcţie de ajustare;
t = valorile variabilei independente (timpul);
y = valorile variabilei dependente (fenomenele), care sunt prezentate în seria
cronologică.
Alegerea tipului de funcţie care se potriveşte cel mai bine pentru exprimarea
trendului se face pe baza următoarelor criterii aplicabile opţional:
Statistică teoretică şi economică

a) Criteriul bazat pe reprezentarea grafică. Se construieşte cronograma. Dacă graficul


prezintă o tendinţă de creştere absolută constantă, se poate aprecia că fenomenul creşte
liniar şi ecuaţia respectivă este:

Yt = a + b ⋅ t ,

în care:
Yt – sunt valorile ajustate calculate în funcţie de valorile caracteristicii factoriale
(t);
a – reprezintă parametrul care are sens de mărime medie şi arată nivelul atins de
"y", dacă influenţa tuturor factorilor – cu excepţia celui înregistrat – ar fi fost constantă
pe toată perioada. Din punctul de vedere al interpretării parametrului, acesta nu are o
semnificaţie economică;
b – reprezintă parametrul care sintetizează numai influenţa caracteristicii
factoriale (t) şi arată cu cât se modifică rezultanta la modificarea cu o unitate a factorului
de influenţă. Dacă b > 0, rezultă o relaţie directă (pozitivă); în cazul b < 0, rezultă o
relaţie inversă (negativă) între cele două fenomene;
t – reprezintă valorile caracteristicii factoriale care, în cazul seriilor cronologice,
este timpul.
Dacă graficul are o tendinţă de creştere exponenţială, atunci se poate aprecia că
fenomenul are forma unei funcţii exponenţiale a cărei ecuaţie de estimare este:

Yt = a ⋅ b t

Când pe grafic se obţine o curbă care are fie un punct de maxim, fie un punct de
minim, atunci se apreciază că fenomenul studiat se modifică în timp sub forma unei
parabole de gradul doi.
Ecuaţia de estimare a unei parabole de gradul doi exprimată în funcţie de timp
este:

Y1 = a + b ⋅ t + c ⋅ t 2

b) Criteriul diferenţelor. Corespunzător acestui criteriu, se procedează la calculul


diferenţelor absolute cu bază în lanţ de ordinul unu din termenii seriei, după relaţia:

∆(tt /) t −1 = y t − y t −1

de ordinul doi, după relaţia:

∆(t2/)t −1 = ∆(t1) − ∆(tt−)1 ş.a.m.d.

Se continuă cu calculul diferenţelor de ordin 3, 4 etc. până obţinem diferenţele de


ordin i, aproximativ egale.
Interpretarea acestor diferenţe se face astfel:
- dacă diferenţele absolute cu bază în lanţ de ordinul întâi sunt constante:
Statistică teoretică şi economică

se apreciază că seria cronologică respectivă are o tendinţă liniară;


- dacă diferenţele absolute cu bază în lanţ de ordinul doi calculate din diferenţele
de ordinul întâi sunt constante:

∆(t2/)t −1 = k 2 ,

se apreciază că seria cronologică are o tendinţă de forma parabolei de gradul doi k1 şi k2


sunt constante).
Dacă fenomenul cercetat s-a dezvoltat în progresie geometrică, adică indicii cu
bază în lanţ sunt constanţi (It/t+1 = constant), admitem că seria cronologică respectivă
prezintă o tendinţă exponenţială.
După alegerea funcţiei de ajustare se impune estimarea parametrilor funcţiei,
utilizând metoda celor mai mici pătrate. Această metodă are ca funcţie obiectiv
minimizarea sumei pătratelor valorilor reale de la cele ajustate, deci:

min ∑ ( y t − y t )
2
t = 1, 2, …,n.

Pentru funcţia liniară, această condiţie devine:


∑ [ y t − (a + bt )] = min
2

Pentru determinarea parametrilor "a" şi "b", scriem sistemul de ecuaţii normale;


înlocuind pe xi cu ti obţinem:

na + b∑ t i = ∑ y i

a ∑ t i + b∑ t i = ∑ t i y1
2

Orice fenomen social-economic depinde de o serie de factori a căror influenţă este


prezentată în timp, deci timpul serveşte doar la sistematizarea materialului statistic şi,
prin urmare, este necesară anihilarea influenţei; în consecinţă, se pune condiţia: Σti = 0.
În aceste condiţii, sistemul de ecuaţii devine:
na = ∑ y i

b∑ t i = ∑ t i ⋅ y i
2

de unde rezultă:

a=
∑ yi ; b = ∑ ti ⋅ yi
n ∑ t i2
Se observă că valoarea lui "a" este egală cu media seriei:

a=
∑y i
=y
n
Statistică teoretică şi economică

Pentru a satisface condiţia de mai sus, trebuie să se considere originea valorilor de


timp ca fiind în centrul seriei.
În cazul în care seria este formată dintr-un număr impar de termeni, originea
valorilor de timp va fi chiar în dreptul termenului central şi variaţia de timp se va măsura
în intervale întregi pozitive şi negative: 0; 1; 2; 3 etc.
În cazul în care seria este formată dintr-un număr par de termeni, se poate adopta
una dintre variantele de jos:

Seria t1 t2 t3 t4 t5 t6
var. I -5 -3 -1 1 3 5
var. II -2,5 -1,5 -0,5 0,5 1,5 2,5

Pentru ecuaţia de gradul doi, avem sistemul următor:

na + c ∑ t i2 = ∑ y1

b∑ t i = ∑ t i y i
2


a ∑ t i + c∑ t i = ∑ t i ⋅ y i
2 4 2

Din sistemul de mai sus se determină parametrii a, b şi c. Dacă b > 0, atunci are
loc o creştere accelerată de-a lungul perioadei, iar în cazul când c < 0, creşterea se
încetineşte.
Verificarea calculării ecuaţiilor de regresie se face pe baza relaţiei:

∑Y yi = ∑ yi

Această modalitate de verificare se bazează pe faptul că prin ajustare s-au


redistribuit influenţele factorilor, astfel, toţi factorii au fost consideraţi cu influenţă
constantă pe toată perioada şi variabil a fost numai timpul.
În teoria şi practica statistică sunt mai multe criterii de alegere privind cel mai
adecvat procedeu de ajustare a fenomenului real.
Astfel, există:
- un prim procedeu, prin care se determină suma abaterilor luate în valoare
absolută dintre datele empirice şi cele ajustate. Preocedeul pentru care această sumă este
minimă acela este cel mai bun.

∑y t − Yt = min ;

- un al doilea procedeu, prin calculul coeficientului de variaţie ca raport dintre


abaterea medie liniară a valorilor reale de la valorile ajustate şi nivelul mediu al
termenilor seriei empirice:

d y (t )
v y (t ) = ⋅ 100
y
Statistică teoretică şi economică

Abaterea medie liniară se calculează după relaţia de mai jos:

d y (t ) =
∑y t − yt
n
Alegerea se face după valoarea coeficientului de variaţie. Valoarea cea mai mică
arată metoda de ajustare cea mai bună.
Pentru aprecierea calităţii sau capacităţii de exprimare a funcţiei de ajustare
analitică, se utilizează următorii doi indicatori:
- abarerea standard sau eroarea standard a valorilor teoretice faţă de valorile
reale:

S yt / Yt =
∑ (y t − Yt )
2

- coeficientul de eroare:

S yt / Yt
e= ⋅ 100
y

Cu cât aceşti indicatori au valori mai mici, cu atât mai bună este funcţia de
ajustare aleasă.

7. 5. Calculul sezonalităţii.
Determinarea cantitativă sau statistică a sezonalităţii este necesară în procesul
decizional atât la nivel microeconomic, cât şi la nivel macroeconomic. În practica
internaţională se utilizează coeficientul de sezonalitate, stabilit ca raport între trimestrul
sau luna calendaristică cu activitatea maximă şi trimestrul sau respectiva lună
calendaristică cu activitatea minimă.
Pentru caracterizarea sezonalităţii se utilizează indici de sezonalitate, stabiliţi în
felul următor, pe o serie de date lunare sau trimestriale, complete, pentru o perioadă de 3-
5 ani consecutivi, se calculează pentru fiecare lună sau trimestru câte o medie yi. De
asemenea, se stabileşte o medie generală lunară sau trimestrială y0 pentru întreaga
perioadă. Comparând fiecare medie lunară sau trimestrială cu media generală, rezultă un
indice de sezonalitate; acest indice exprimă cât la sută reprezintă media lunii sau
trimestrului faţă de media generală:

yi =
∑y ij
y0 =
∑⋅ ∑ y ij
IS % =
yi
⋅ 100
n n⋅m y0

unde:
n este numărul anilor;
m - numărul subperioadelor.
Această metodă de determinare prin medii aritmetice a indicelui de sezonalitate
este acceptată în cazul seriilor cronologice care nu sunt foarte dinamice.
Statistică teoretică şi economică

Probleme si aplicatii:
7.1.Comerţul exterior al României a evoluat în perioada 1991-1996 conform cu
datele de mai jos:

Anii 1991 1992 1993 1994 1995 1996


Export (mil.$) 4266 4363 4892 6151 7910 8084
Import (mil.$) 5372 5784 6020 6562 9487 10555
Sursa: Anuarul de comerţ exterior al României, C.N.S., pag.9.

Se cere:
1. să se analizeze evoluţia exportului României în perioada 1991-1996 cu ajutorul
indicatorilor absoluţi, relativi şi medii;
2. să se reprezinte grafic evoluţia importului României în perioada analizată;
3. să se ajusteze seria de date referitoare la comerţul exterior al României
(export+import) în perioada analizată prin metode simple (elementare sau mecanice).

7.2. Evoluţia numărului populaţiei din mediul urban în perioada 1989-1995 a fost:

Anii 1989 1990 1991 1992 1993 1994 1995


Populaţia 12345 12609 12552 12367 12406 12428 12457
urbană
(mii loc.)
Sursa: Anuarul demografic al României, C.N.S., pag.4.

Se cere:
1 să se ajusteze seria de date utilizând metode elementare şi analitice de ajustare;
2. să se arate care din metodele folosite este cea mai potrivită;
3. să se efectueze extrapolarea seriei pentru următorii doi ani folosind metoda rezultată de
la punctul anterior.

7.3. În tabelul de mai jos sunt prezentate modificările absolute cu bază mobilă ale
dinamicii populaţiei ocupate în perioada 1991-1995 în România:

Anii 1991 1992 1993 1994 1995


Modificarea -54 -328 -396 -51 -518
absolută
Sursa: Statistica socială, C.N.S., pag.45.

Se cere:
1. să se reconstituie seria cunoscând că nivelul atins de populaţia ocupată în 1990 a fost
de 10840 mii persoane;
2. să se ajusteze seria de date cu ajutorul ecuaţiei liniare de ajustare.
Statistică teoretică şi economică

7.4. În învăţământul superior au apărut modificări de natură calitativă şi


cantitativă; dintre acestea numărul de studenţi înscrişi este prezentat în tabelul
următor:

Perioada 1991/1992 1992/1993 1993/1994 1994/1995 1995/1996


Ritmul cu 100 109,5 116,2 118,5 156,2
bază fixă
(%)
Sursa: Statistica socială, C.N.S.,1996, pag.155.

Se cere:
1. să se reconstituie seria cunoscând numărul de studenţi înscrişi în 1991/1992;
2. să reprezinte grafic seria cronologică reconstituită;
3. să se ajusteze seria cronologică prin metoda mediilor mobile şi să se determine
calitatea acestei metode de ajustare comparativ cu metoda indicelui mediu.

7.5. Se consideră următoarea serie cronologică reprezentând numărul mediu al


pensionarilor în perioada 1990-1995, în mii persoane:
2570; 3018; 3201; 3253; 3439; 3600.
Sursa: Statistica socială, C.N.S., pag.113.

Se cere:
1. să se determine indicatorii medii care caracterizează seria coronologică prezentată;
2. să se extrapoleze seria pentru anul 1996 utilizând cea mai bună metodă de ajustare.

7.6. Numărul de născuţi-vii după luna naşterii în perioada 1991-1995 este prezentat
în tabelul următor:

Luna 1991 1992 1993 1994 1995


Calendaristică
Ianuarie 22255 22868 19773 20316 19369
Februarie 20947 21877 18955 19181 18317
Martie 23613 23317 21298 21386 20077
Aprilie 23397 21613 21232 21780 19427
Mai 24845 22865 21515 22927 20388
Iunie 24785 23502 21064 22125 20097
Iulie 25082 23925 23400 22732 21437
August 23407 22940 22551 20911 20812
Septembrie 23056 20997 21229 20165 20161
Octombrie 22055 19894 20638 18729 19712
Noiembrie 20880 18315 18950 17651 18627
Decembrie 20953 18280 19389 18833 18216
Sursa: Anuarul demografic al României, C.N.S., 1996,pag.134.

Se cere:
1. să se caracterizeze şi să se măsoare sezonalitatea folosind metoda mediilor mobile;
2. să se măsoare sezonalitatea folosind cea mai bună metodă analitică;
3. să se determine şi interpreteze componenta reziduală.
Statistică teoretică şi economică

CAPITOLUL 8.
SERII TERITORIALE
Cuvinte cheie:
- coeficientul repartiţiei teritoriale
- indicele dezvoltării umane
- indicele libertăţii economice
- metoda rangurilor
- rata de decalaj (devansare)
- seriile teritoriale

Seriile teritoriale numite şi serii de spaţiu sunt şiruri de valori ale unor
caracteristici statice ordonate in raport cu unităţile administrative sau diviziile teritoriale
de care aparţin.
Termenii unei astfel de serii sunt fie indicatori absoluţi, ce se obţin prin
cumularea în cadrul fiecărei unităţi administrativ-teritoriale a tuturor elementelor
(manifestărilor) referitoare la caracteristica cercetată, fie indicatori derivaţi, ce rezultă
din aplicarea unor procedee de calcul la nivelul fiecărei unităţi observate.
Prin urmare, seriile teritoriale operează cu unităţi complexe, ca de exemplu:
judeţul, regiunea, zona, ţara, continentul etc. Aceasta face ca fiecare unitate
administrativ-teritorială să poată fi caracterizată atât în mod independent, sub forma unui
studiu monografic, cât şi ca parte sau nivel al unei variabile studiate în profil teritorial.
De exemplu, populaţia unui judeţ poate constitui obiectul unei monografii, în care
se prezintă toate aspectele legate de numărul, structura pe sexe şi grupe de vârstă,
natalitate, mortalitate, nupţialitate, fertilitate, repartiţie socio-profesională, pe tipuri de
localităţi etc.La nivelul ţării, însă, populaţia judeţului este privită ca parte a întregului ce
se constituie în populaţia României.
Complexitatea unităţilor administrativ-teritoriale determină selectarea cu mult
discernământ a acelor indicatori, care au capacitatea de a exprima specificitatea variaţiei
în spaţiu, pornind de la compatibilitatea informaţiilor şi relevanţa expresiilor lor
cantitative.
Pe de altă parte, pentru a realiza o cunoaştere cât mai completă a colectivităţilor
analizate în profil teritorial, se recomandă folosirea în paralel a mai multor şiruri de date,
care reflectă variaţia în interiorul aceluiaşi spaţiu a mai multor caracteristici, de regulă,
interdependente. Rezultatul acestei conduite este o serie teritorială multidimensională.
De exemplu, în tabelul de mai jos se prezintă câteva caracteristici ale populaţiei
României observată pe cele opt regiuni statistice constituite prin gruparea judeţelor. În
prima coloană, se prezintă numărul de persoane la data de 1 iunie 1997, iar în coloana a
doua ponderea regiunilor în totalul populaţiei.
Comparaţia între regiuni sunt însă mult mai interesante dacă se folosesc indicatori
derivaţi, precum cei cuprinşi în coloanele 3-5 ale aceluiaşi tabel. Desigur pot fi adăugaţi
şi alţi indicatori pentru a avea o imagine mai exactă a populaţiei ţării repartizată pe cele
opt regiuni.
Populaţia României în 1997 observată pe regiuni statistice
Statistică teoretică şi economică

Sporul
Numărul Densitatea Ponderea natural
Ponderea în
Regiunea populaţiei populaţiei populaţiei (pers/100
total (%)
(persoane) (pers/km2) urbane (%) 0
loc)
Nord-Est 3.785.530 16.8 102.7 44.4 1.8
Sud-Est 2.973.256 13.1 82.3 57.5 -1.3
Sud 3.496.579 15.5 101.5 41.9 -3.3
Sud-Vest 2.419.686 10.7 82.8 45.4 -3.2
Vest 2.073.740 9.2 64.7 62.6 -3.6
Nord-Vest 2.861.521 12.7 83.8 52.7 -2.1
Centru 2.660.679 11.8 78.0 60.6 -1.1
Bucureşti 2.304.934 10.2 1265.8 88.8 -4.4
Total 22.545.925 100.0 - - -
Media pe - - 94.6 55.0 -1.9
toată ţara
Sursa: Anuarul Statistic al României 1998,CNS,Bucureşti,1999, p863-865

Seriile teritoriale prezintă unele particularităţi de care trebuie să se ţină seama in


analiza variaţiei în spaţiu a diferitelor caracteristici economico-sociale.
O primă particularitate a seriilor teritoriale constă în independenţa termenilor
ceea ce înseamnă că nivelele specifice diferitelor unităţi administrativ-teritoriale nu se
condiţionează reciproc. Această particularitate permite caracterizarea separată a fiecărei
unităţi, fie prin compararea cu o altă unitate, fie prin încadrarea ei în nivelul totalizator al
seriei.
În al doilea rând, se remarcă omogenitatea seriei, în sensul că toţi termenii au
acelaşi conţinut economico-social, aceeaşi definiţie statistică a sferei de cuprindere.
În al trilea rând, seriile teritoriale se caracterizează prin simultaneitatea
termenilor, ceea ce înseamnă că toate variantele se referă la unul şi acelaşi moment al
observării sau la aceeaşi perioadă de înregistrare (în exemplul citat, anul 1997).
O a patra particularitate constă în variabilitatea termenilor, determinată de
combinarea factorilor esenţiali, care asigură specificul întregii serii teritoriale, cu
mulţimea factorilor întâmplători, care produc diferenţieri de la o unitate administrativ-
teritorială la alta. Tocmai această particularitate a seriilor teritoriale face posibilă
aplicarea metodelor de calcul şi analiză statistică.
Reprezentarea grafică a seriilor teritoriale se face cu ajutorul cartogramei sau a
cartodiagramei. Fiecare grafic se construieşte pe fondul unei hărţi a unităţilor
administrativ-teritorile cercetate. În cazul cartogramei, fiecare unitate este haşurată
distinct, potrivit nivelului observat al caracteristicii în perimetrul administrativ-teritorial
respectiv şi în concordanţă cu tipurile (grupele) calitative distinse pe baza studiului
variaţiei în spaţiu.
Potrivit datelor din coloana a treia a tabelului de mai sus, există trei tipuri de
regiuni din punct de vedere al densităţii populaţiei:
• cu densitate joasă (regiunea Vest) cu densitatea 64,7 locuitori/km2 ;
• cu densitate mijlocie (patru regiuni) având densitatea cuprinsă între 78
locuitori/km2 şi 83,8 locuitori/km2 ;
• cu densitate ridicată ( două regiuni cu densitatea de peste 100 locuitori/km2 ;
Statistică teoretică şi economică

Regiunea Bucureşti, alcătuită din Judeţul Ilfov şi Municipiul Bucureşti este o


structură atipică ce nu poate fi alăturată celorlalte regiuni, întrucât are o densitate de
1265,8 locuitori/km2 în 1997.
Pentru fiecare tip calitativ se alege o haşură distinctă pentru a evidenţia deosebirea
de densitate a populaţiei de la o regiune la alta (vezi Fig.5.1.)
Cartodiagrama presupune construirea în spaţiul fiecărei unităţi administrativ-
teritoriale a unei diagrame statistice, care oglindeşte un aspect al analizei teritoriale.
Pentru a ilustra ponderea diferită a populaţiei urbane, în fiecare regiune se trasează o
diagramă circulară în care se haşurează sectorul de cerc corespunzător populaţiei urbane.
Dacă numărul unităţilor teritoriale este redus, se pot folosi şi diagrame prin benzi
sau coloane pentru a ilustra mărimea diferită de la o unitate teritorială la alta a
indicatorului cercetat.

8.1.Indicatori statistici ai seriilor teritoriale.


Prelucrarea datelor unei serii teritoriale se face cu ajutorul unui sistem de
indicatori, adecvat naturii termenilor şi scopului de cunoaştere urmărit. Prin folosirea
acestui sistem de indicatori se pun în evidenţă diferenţierile dintre unităţile administrativ-
teritoriale, dar, în acelaşi timp, se reliefează ceea ce este tipicşi semnificativ pentru
întraga colectivitatesupusă analizei, precum şi uniformitatea seriei teritoriale, sau,
dimpotrivă, dispersarea inegală în spaţiu a caracteristicii cercetate. Dacă seria este
alcătuită din mărimi absolute se pot folosi următorii indicatori statistici:
• Indicatori absoluţi - indicatori de nivel ;
- decalajul (avansul) absolut;
• Indicatorii relativi - indicii teritoriali;
- ratele de decalaj (devansare);
- mărimile relative de structură;
- indicele (coeficientul) repartiţiei teritoriale;
• Indicatorii medii - nivelul mediu
mediana, eventual modul.
Analiza seriilor teritoriale poate fi completată în funcţie de obiectivele cercetării
prin aplicarea metodologiei prezentate în paragrafele de “Analiză
dispersională”,”Corelaţia parametrică şi neparametrică “etc.
Se consideră o serie teritorială alcătuită din n termeni absoluţi:
Unitatea teritorială 1; 2; …i; … j; … n

Nivelul caracteristicii y1 y2 …yi …yj …yn


Fiecare termen (y i ) al seriei teritoriale constituie un indicator de nivel care
exprimă nivelul
(volumul) caracteristicii, costatat în unitatea administrativ-teritorială i ( i= 1, n ). Pe baza
termenilor, se trece la efectuarea comparaţiilor în profil teritorial.
În mărime absolută, se obţine decalajul sau, respectiv, avansul ( ∆ y) al unei
unităţi administativ- teritoriale i faţă de unitatea j, pe baza relaţiei:

∆ y j i = y i -y
Statistică teoretică şi economică

În funcţie de scopul analizei, comparaţiile în profil teritorial între două unităţi pot
fi făcute fie în sensul dat de relaţia, fie în sens invers:

∆ y i j = y j -y i

Înainte de a trece la compararea a două unităţi teritoriale fie prin scădere, fie prin
raportare, se va analiza dacă are logică şi conţinut economic rezultatul comparării.
Dacă seria este alcătuită din mărimi derivate, se recomandă folosirea rapoartelor
pentru a efectua comparaţiile între unităţile teritoriale, deoarece 1% înseamnă pentru
fiecare unitate a seriei altceva.
În acest context, se trece la utilizarea indicatorilor relativi. Indicii teritoriali sunt
mărimi relative de coordonare, care se obţin prin raportarea termenilor unei serii de
spaţiu. Ei măsoară variaţia unor colectivităţi coexistente în timp, dar situate în spaţii
diferite din punct de vedere al diferitelor caracteristici ce fac obiectul studiului în profil
teritorial. De exemplu, dacă se studiază o variabilă y pentru două unităţi teritoriale i şi j
se obţin doi indici individuali :

yi yj
i iy j = şi i yj i =
yj yi
Operând cu unităţi statistice complexe, analiza în profil teritorial presupune
uneori menţinerea la nivelul totalizator al unităţilor comparate, aşa cum s-a procedat mai
sus. Alteori, însă, este necesară pătrunderea în profunzimea structurii unităţilor teritoriale
comparate, iar descompunerea pe factori de influienţă a variaţiei unor caracteristici
complexe necesită alegerea unui sistem de pondere şi a unei baze de raportare. Pentru
rezolvarea acestor cerinţe se recurge la utilizarea indicilor teritoriali de grup, care se
prezintă în paragraful final al capitolului.
Rata de decalaj (devansare), numită frecvent şi decalaj (avans) relativ este
expresia procentuală a diferenţei absolute dintre termenii unei serii teritoriale. Notăm cu
( ∆%y ) această rată, se calculează astfel :
- de pe poziţia unităţii teritoriale j:

y1 − y j
∆%yi j = .100 = 100 (i iy j – 1 )
yj

- de pe poziţia unităţii teritoriale i:

y j − yi
∆%y j i = .100 = 100 (i yj i – 1 )
yi

Mărimi relative calculate ca rapoarte faţă de medie. Alegerea termenilor de


comparaţie poate fi deseori apreciată ca fiind subiectivă. De aceea, frecvent se întâlnesc
ca bază de comparaţie pentru termenii unei serii teritoriale însuşi nivelul mediu, mediana
Statistică teoretică şi economică

sau modul seriei. Notând cu ( y ) nivelul mediu, relaţiile de mai sus devin :

∆yi y
= yi – y ,
yi yi
i j
=
y
yi
∆%yi y =100(i y
–1 )
Nivelul mediu al seriei teritoriale ( y ) trebuie determinat în funcţie de natura
termenilor. Pentru o serie formată din mărimi absolute, se stabileşte media aritmetică
simplă, dar ea tinde să fie lipsită de valoarea analitică în contextul determinării complexe
a variaţiei în spaţiu.
Nivelul mediu al seriilor teritoriale alcătuite din mărimi relative de structură sau
de intensitate se calculează ca medii aritmetice ponderate.
In cazul seriilor teritoriale, alcătuite din mărimi relative de dinamică, nivelul
mediu poate fi aflat prin aplicarea mediei geometrice simple. Această relaţie se
recomandă şi pentru seriile formate din mărimi relative de coordonare (cu condiţia ca
baza de raportare să fie aceeaşi pentru toţi termenii seriei).
Un aspect distinct al analizei seriilor teritoriale, îl constituie caracterizarea
gradului de uniformitate (sau de diformitate) a repartiţiei în spaţiu. Acest aspect se
exprimă prin coeficientul repartiţiei teritoriale1 aplicabil numai seriilor cu termeni direct
însumabile, deci, numai seriilor alcătuite din mărimi absolute. In prealabil, se determină
mărimiile relative de structură pentru fiecare din termenii seriei.
Există mai multe procedee, de determinare a acestui indicator. Astfel,
statisticianul italian Corrado Gini a propus utilizarea rădăcinii pătrate din suma pătratelor
ponderilor celor (n) unităţi administrativ teritoriale din totalul colectivităţii cercetate.
Notând cu gi poderea unităţii (i), coeficientul Gini (C ) se obţine potrivit relaţiei:

C= ∑g 2
i , unde i = 1, n .

1
Coeficientul Gini ia valori în intervalul [ ,1 ]. Atunci când cele (n) unităţi au
n
ponderi egale în colectivitate, adică repartiţia teritorială este absolut uniformă, rezultă

1
C=
n

iar dacă variabila cercetată se concentrează într-o singură unitate teritorială, C= 1


Variabilitatea limitei inferioare a coeficientului Gini, în raport cu numărul (n) al
unităţilor administrativ-teritoriale, determină o anumită dificultate în utilizarea lui atunci
când se compară colectivităţi cu organizare teritorială diferită (de exemplu, comparaţii
între ţări, între zone geografice sau continente). Pentru a înlătura acest inconvienent, în
practica statistică internaţională sau propus o serie de procedeee de corectare a formulei
Gini, astfel ca indicatorul să ia valori în intervalul [0,1], indiferent câte unităţi ar avea
Statistică teoretică şi economică

colectivitatea cercetată. Un astfel de procedeu este dat de relaţia de interpolare de mai


jos:

n∑ g i2 − 1
C’ =
n −1

Faţă de aceste variante de corectare a coeficientului Gini, formula prezintă


avantajul unei aplicări lesnicioase şi cel al evidenţei valorilor extreme admise:
0 ≤ C’ ≤ 1

8.2.Extrapolarea in profil teritorial.


Cercetarea seriilor teritoriale într-o viziune statică nu este întotdeauna
edificatoare. Deseori, analizele în profil teritorial cuprind şi unul sau mai mulţi indicatori
care exprimă dinamica specifică fiecărei unităţi-administrativ teritoriale.
In contextul preocupărilor pentru dezvoltarea regională se acordă un interes
deosebit analizelor şi prognozelor în profil teritorial, acestea având la bază (între alte
date) aspectele legate de dinamica diferenţiată a indicatorilor analizaţi.
Astfel se pot pune problemele legate de determinarea gradului de devansare, de
timpul în care nivelul unui indicator se poate dubla sau tripla, pe perioada de timp după
care un judeţ va ajunge din urmă un alt judeţ, sau de ritmul de creştere necesar pentru a
ajunge la un anumit nivel.
In acest sens, se folosesc indicii (coeficienţii de devansare) care se calculează fie
pentru două unităţi teritoriale fie în interiorul aceleaşi colectivităţi pentru două variabile
în evoluţia lor în timp. Coeficientul de devansare rezultă în acest caz, din compararea a
doi indici cronologici stabiliţi pentru unităţi teritoriale distincte, indici calculaţi prin
raportarea la nivelele corespunzătoare din anul de bază, specifice fiecărui judeţ, după
formula:

Ii
I iy j = ,
Ij

În care II = y ni y1i indicele raportat ;


Ij = y nj y1 j indice bază de raportare
Un coeficient de devansare arată de câte ori creşte mai repede nivelul unităţii
raportate faţă de evoluţia nivelului unităţii constituite ca bază de raportare.
Un alt aspect al extrapolării în profil teritorial este acela când se cunoaşte ritmul
mediu anual de dezvoltare al unui judeţ sau al unei ţări şi se pune problema să se
calculeze după ce număr de ani (perioadă de timp) fenomenul s-ar modifica de un număr
de ori, sau de câte ori se va modifica fenomenul după un timp dat, în ambele cazuri
păstrându-se aceleaşi condiţii de dezvoltare.
Presupunând că se dă indicele mediu de creştere şi se admite o relaţie de progresie
geometrică între termenii, se poate scrie:

It = K ,
Statistică teoretică şi economică

în care :
I reprezintă indicele mediu de creştere în timp a fenomenului ;
t reprezintă numărul de ani după care se va produce schimbarea de K ori ;
K reprezintă coeficientul de schimbare a fenomenului după trecerea celor t ani
( pentru dublare K=2, pentru triplare K=3 etc.).
Unităţile teritoriale evolueză cu niveluri şi ritmuri de dezvoltare diferite. In acest
contex, se pune problema de a afla când va ajunge din urmă o unitate teritorială pe alta,
considerând că evoluţia lor se face în progresie geometrică cu raţia egală cu indicele
mediu de creştere. Pentru aceasta este necesar să se cunoască nivelurile absolute pentru
momentul de calcul şi indicii de creştere, existând relaţia:

yi < yj şi Ii > Ij .

Cele două judeţe vor avea acelaşi nivel absolut dacă:

y’i = y’j

în care: y’ reprezină nivelul fenomenului din momentul final t. Aceasta înseamnă că ,între

y şi y’ există relaţiile:

y’i= yi Iti ; y’j = yj Itj

Deci yi Iti = yj Itj


sau:

log yi + t · log Ii = log yj + t · log Ij

de unde rezultă:

log y j − log y i
t=
log I i − log I j

Dacă orizontul egalizării nivelelor este prea mult îndepărtat (t este prea mare), se
poate estima ritmul mediu necesar de dezvoltare pentru unitatea teritorială rămasă în
urmă, presupunând că intervalul de recuperare a decalajului este dat (t = numărul de ani
în care se produce recuperarea integrală a decalajului). Pornind de la relaţiade mai sus,
dacă unitatea i îşi propune recuperarea decalajului faţă de unitatea j, rezultă:

1
log Ii = log Ij + ( log yj - log yi )
t
Desigur este de competenţa factorilor de decizie din fiecare unitate administrativ
eritorială, din fiecare ţară de a stabili dacă o asemenea creştere rapidă (exprimată de Ii)
este necesară, pornind de la efortul economic şi financiar pe care o asemenea creştere îl
presupune.
Statistică teoretică şi economică

8.3.Ierarhizarea multicriteriala a unitatilor administrativ-teritoriale.


Comparaţiile în profil teritorial şi elaborarea de clasamente ale unităţilor
administrativ-teritoriale reprezintă actualmente o importanţă deosebită atât la nivel
naţional, cât şi pe plan internaţional în vederea măsurării decalajelor şi a elaborării
strategiei optime de dezvoltare.
Pornind de la faptul că fiecare indicator statistic asigură informaţia cantitativă
limitată la o singură însuşire a colectivităţii analizate în profil teritorial, ierarhizarea
unităţilor în funcţie de variaţia unui singur indicator este oricând susceptibilă de a fi
completată, criticată uneori chiar contrazisă prin informaţiile oferite de indicatorii
complementari, care caracterizează alte aspecte ale aceleiaşi colectivităţi.
Datorită acestui fapt, în ultima vreme sunt tot mai frecvente analizele
multicriteriale ale dezvoltării în profil teritorial, clasamentele fiind elaborate prin
combinarea unui set cât mai complet de indicatori statistici, care asigură caracterizarea
multilaterală a fiecărei unităţi administrativ-teritoriale, în conformitate cu obiectivele
cercetării.
In acest context, ierarhizarea multicriterială a unităţilor administrativ-teritoriale
presupune parcurgerea următoarelor etape de lucru:
- selectarea indicatorilor care urmează să fie folosiţi în
elaborarea clasamentului multicriterial;
- alegerea formei de exprimare a rezultatului comparării
unităţilor administrativ-teritoriale şi eventual, elaborarea de
clasamente provizorii pe baza fiecărui indicator selectat;
- determinarea metodei de agregare într-un mic indicator a
comparaţiilor simple, unicriteriale;
- valorificarea rezultatelor ierarhizării multicriteriale.
Selectarea indicatorilor aşezaţi la baza ierarhizării multicriteriale trebuie să
pornească de la obiectivele cercetării şi presupune o profundă cunoaştere a domeniului de
activitate în care urmează să se efectueze investigaţiile, astfel încât să fie asigurată
comparabilitatea indicatorilor şi corelarea diverselor aspecte ale colectivităţii de unităţi
cercetate în vederea unei caracterizări cât mai complete a variaţiei în profil teritorial.
Pentru următoarele etape de lucru sau formulat în literatura statistică mai multe
metode, unele din acestea fiind prezentate în continuare.
Metoda rangurilor presupune atribuirea de ranguri fiecărei unităţi administrativ-
teritoriale, în mod succesiv, în funcţie de fiecare indicator cuprins în analiză: unitatea cu
performanţă calitativă maximă obţine rangul unu, următoarele unităţi fiind numerotate cu
ranguri tot mai mari, rangul cel mai mare (egal cu n – numărul de unităţi al seriei
cercetate) fiind atribuit unităţii care înregistrează nivelul calitativ minim al fiecărei
variabile. Prin însumarea rangurilor corespunzătoare fiecărei unităţi teritoriale se obţine
un “scor”. Ţara care obţine scorul cel mai mic este cea mai performantă din toate
punctele de vedere incluse în analiza multicriterială şi obţine rangul final 1. Pe măsură ce
scorul creşte, se măreşte şi rangul final, până când se ajunge la rangul n atribuit ţării care
însumează punctajul (scorul) maxim. Metoda rangurilor prezintă avantajul unei aplicări
uşoare şi rapide oferind o informaţie, în general corectă în legătură cu clasamentul
unităţilor administrativ-teritoriale. In plus, rezultatele pot fi valorificate în cercetările
Statistică teoretică şi economică

bazate pe procedee neparametrice de măsurare a intensităţii legăturii dintre variabile.


Neajunsurile acestei metode sunt legate de dubla nivelare a mărimii variabile a
diferenţelor dintre unităţi prin înlocuirea lor cu o progresie aritmetică având raţia 1, prima
nivelare are loc la atribuirea rangurilor pentru fiecare dintre caracteristicile cuprinse în
studiu, iar a doua nivelare survine la înlocuirea scorului cu şirul de ranguri finale. Se
pierde, în felul acesta, o bună parte din calitatea informaţiei, diferitele distanţe dintre
unităţile succesive fiind în mod sistematic înlocuite cu diferenţa (1) dintre rangurile
succesive. Un alt neajuns constă în faptul că frecvent se întâmplă ca două sau mai multe
unităţi teritoriale să întruneasce acelaşi scor. Departajarea lor nu se poate face decât prin
intervenţia cercetătorului, care introduce un criteriu ales (subiectiv).
O serie de metode matriceale evită aceste neajunsuri calculănd distanţa dintre
elementele (unităţile administrativ-teritoriale) unui spaţiu m- dimensional, unde m este
numărul caracteristicilor cuprinse în analiză. Aceste metode, deşi mai laborioase oferă
rezultate net superioare metodei rangurilor întrucât nu mai are loc denaturarea distanţei
reale dintre unităţile administrativ-teritoriale consecutive.
Aplicarea metodelor matriceale presupune utilizarea calculatorului atunci când
numărul (n) al unităţilor teritoriale şi numărul (m) al caracteristicilor este mai mare.
Rezultate la fel de valoroase pot fi obţinute, însă, şi prin aplicarea unor metode mai
simple, bazate pe observarea distanţei relative dintre unităţi. Ele presupun, de obicei, (1)
constituirea unei unităţi fictive ale cărei caracteristici prezintă nivelele maxime observat
în colectivitatea reală, (2) alegerea unui procedeu de măsurare a distanţei dintre unităţile
reale şi această unitate fictivă (la fiecare caracteristică aflată în studiu) şi (3) stabilitatea
unui procedeu de agregare a informaţiilor obţinute pentru fiecare unitate reală. Cu cât
rezultatul este mai mic decât unitatea, cu atât distanţa ( în spaţiul “m” dimensional )
faţă de maximul posibil este mai mare şi deci unitatea teritorială este mai puţin
dezvoltată.
Comparativ cu metoda rangurilor, prelucrarea statistică este desigur mai
laborioasă, dar meritul acestor metode este acela al conservării calitative a informaţiilor
cu privire la distanţele reale dintre elementele colectivităţii cercetate în spaţiul
“m”dimensional. Agregarea informaţiilor într-un indice sintetic cu nivele distincte pentru
fiecare unitate a colectivităţii permite măsurarea decalajelor reale dintre unităţi, precum şi
valorificarea rezultatelor ierarhizării multicriteriale în cercetările statistice ulterioare
bazate pe procedee parametrice.
În cele ce urmează se prezintă una din variantele metodei bazate pe observarea
distanţei relative dintre unităţi, şi anume aceea care se bazează pe exprimarea distanţei
observabile la fiecare caracteristică luată în studiu sub forma mărimii relative de
coordonare calculată pentru fiecare element al colectivităţii faţă de unitatea cu
performanţă maximă.
Procedînd în acest fel, rezultatul comparaţiilor dintre unităţi este limitat la
intervalul ( 0,100 % ), întrucât baza de comparaţie este varianta care ilustreză
performanţa maximă la fiecare caracteristică.
În vederea agregării mărimilor relative de coordonare specifice fiecărei ţări într-
un indice sintetic se utilizează media geometrică. Operaţiunea pentru agregarea de tip
multiplicativ este determinată de următoarele considerente:
- un produs de indicatori conduce la calculul unei medii
geometrice, care beneficiază de
Statistică teoretică şi economică

- avantajul de a fi mai puţin expusă influenţei faţă de variantele


extreme, deci este o mărime mai exactă decât media aritmetică
- posibilitatea de a înregistra la două sau mai multe unităţi
teritoriale acelaşi produs este mai mică decât aceea a sumelor
(scorurilor) egale, micşorând practic până la
eliminare,intervenţia subiectivă în stabilirea ierarhiei finale.

8.4.Indicii sintetici pentru caracterizarea unitatilor administativ-teritoriale.


În ultimii 10-15 ani, în literatura de specialitate care se ocupă de diverse aspecte
ale situaţiei economico-sociale observate in variabilitatea lor pe regiuni, pe ţări, pe
continente au apărut noi indicatori sub denumirea de “indici “ sau “indici sintetici”.
Aceştia cuprind într-o construcţie numerică specială variaţia multidimensională
observată la nivelul fiecărei unităţi dintr-o serie teritorială. Se ajunge astfel la o
caracterizare sintetică, a situţiei din fiecare teritoriu observat.
Denumirea de "indici" pentru acest fel de indicatori sintetici este preluată din
literatura de specialitate de limbă engleză pentru a păstra compatibilitatea terminologică1.
Pentru a înţelege particularitatea determinării acestor indici sintetici folosiţi în analiza
variaţiei în profil teritorial, se prezintă pe larg metodologia de calcul a indicelui
dezvoltării umane, apoi se evocă şi alţi indici frecvent întâlniţi în literatura de
specialitate.
Indicele dezvoltării umane (IDU) sintetizează într-o expresie numerică unică
variaţia a trei caracteristici: longevitatea, nivelul de educaţie şi standardul de viaţă al
populaţiei dintr-o regiune sau ţară, folosind o medie aritmetică simplă.
Longevitatea este observată prin prisma speranţei de viaţă exprimată în ani.
Pentru a caracteriza nivelul de educţie se foloseşte o medie aritmetică ponderată a
gradului de cuprindere în în învăţământul de toate nivelurile (o pondere de o treime) şi a
gradului de alfabetizare a populaţiei (pondere de două treimi).
Standardul de viaţă se caracterizează prin produsul intern brut pe brut locuitor.
Atunci când se fac comparaţii între ţări, PIB/locuitor este estimat în dolari SUA la
paritatea puterii de cumpărare. In scopul sintetizării într-o expresie numerică unică a
celor trei aspecte, datele fiecărei componente se aduce într-o formă abstractă prin
compararea lor cu valorile minime şi maxime specifice, folosind relaţia:

x − xmin
I=
xmax − xmin

în care "I" este "indicele" sau expresia numerică abstractă rezultantă.


In tabelul de mai jos sunt prezentate datele specifice pentru populaţia
României în anul 1998, precum şi valorile minime şi maxime pentru fiecare componentă.
Ultima coloană cuprinde "indicele" "I" pentru fiecare componentă.

Determinarea indicolor "I" pentru calculul IDU populaţiei României în anul 1998
"x"
Indicatorul observat xmin xmax I
în 1998
Speranţa de viaţă 62,2 25 85 0,737
(ani)
Statistică teoretică şi economică

Gradul de cuprindere în învăţământ (%) 63,9 0 100 0,639


Gradul de alfabetizare (%) 97,0 0 100 0,970
PIB/locuitor (USD) 3679 100 40000 0,576

Nivelul de educaţie a populaţiei României în 1998 se caracterizează pe baza


datelor tabelului de mai sus prin următoarea medie aritmetică ponderată :
I = 0,639+0,333+0,97+0,667 = 0,86
Preluând din tabel şi datele referitoare la speranţa de viaţă şi standardul de viaţă,
alături de indicele nivelului de educaţie, IDU se obţine ca medie aritmetică simplă a celor
trei componente :

0,737 + 0,860 + 0,576


IDU R0 −1998
=
3
= 0,724

In tabelul de mai jos se prezintă pe regiunile statistice şI pe întreaga ţara IDU


specifici anului 1996.

Indicele dezvoltării umane observat în România în 1996


Regiunea PIB/loc (mii ISS ISE IPCU IPI ILRBL
statistică lei) 1996

Nord-Est 3678,1 0,688 0,746 0,591 0,613 0,804


Sud 4367,8 0,589 0,573 0,471 0,480 0,834
Sud-Vest 4405,9 0,587 0,600 0,409 0,537 0,801
Nord-Vest 4497,2 0,548 0,579 0,494 0,482 0,639
Sud-Est 4823,8 0,518 0,559 0,499 0,373 0,642
Centru 5112,7 0,465 0,487 0,446 0,292 0,635
Vest 5644,1 0,394 0,465 0,446 0,158 0,507
Bucureşti 6879,6 0,117 0,127 0,342 0,000 0,000

România 4794,4 0,510 0,538 0,472 0,394 0,637

Sursa: M.Molnar- Sărăcia şi protecţia socială, Ed. Fundaţiei România de Mâine, Bucureşti,
1999,pag.84.

Indicele libertăţii economice (ILE) conceput în 1989 în SUA pentru a caracteriza


gradul de demonopolizare a economiei tuturor ţărilor lumii foloseşte un set de zece
factori (caracteristici), pentru fiecare dintre aceştia acordându-se o notă pe scala de la 1 la
5. Valoarea 1 înseamnă o implicare redusă a statului în economie, valoarea 5 înseamnă
control total, economie de tip centralizat, de comandă.
Acest indice în cazul României a condus la următoarele aspecte:
C1 - politica comercială - are scorul "1" deoarece există un nivel scăzut al
protecţionismului; rata tarifară medie fiind de 3%. C2 - politica fiscală - are un scor de
"4,5" ceea ce arată un grad ridicat al fiscalităţii; C3 - consumul guvernamental - are
scorul 5 datorită ponderii foarte mari a acestor cheltuieli în PIB, aproximativ 35,5%; C4 -
politica monetară - cu scorul de "5" având în vedere rata mare a inflaţiei; C5 - fluxul de
Statistică teoretică şi economică

capital şi investiţiile străine - România are o politică relativ echilibrată în ceea ce priveşte
investiţiile străine, multe dintre barierele în acest domeniu sunt formale, ele rezultând din
menţinerea unei anumite birocraţii; C6 - politica bancară - scorul este de "3" datorită
faptului că băncile sunt în continuare sub un control strict exercitat de guvern. De
remarcat că există totuşi anumite oportunităţi faţă de băncile străine care operează în
România; C7 - controlul asupra salariilor şi preţurilor - are scorul "2" deoarece preţurile
sunt stabilite prin intermediul pieţei, iar în domeniul salariului România are legislaţie
privitoare la salariul minim şi la salariul mediu pe economie; C8 - dreptul de proprietate
- are scorul "4+" datorită nivelului redus în legislaţie asupra proprietăţii private;
C9 - alte reglemăntări - are scorul "4" datorită inexistenţei unei reglementări eficiente
asupra corupţiei şi datorită existenţei unor bariere legislative în domeniul afacerilor;
C10 - piaţa neagră - cu scorul de "5" datorită unui nivel ridicat al activităţii pe această
piaţă.
Din notele astfel acordate se face o medie aritmetică simplă, rezultând valoarea de
3,55 pentru România, ceea ce o situează pe poziţia 82 în rândul a 100 de ţări observate în
1995.

Indicele libertăţii economice în 1995


Nr Tara C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 Medi
crt. a
1 Hong Hong 1 1,5 1 2 1 2 1 1 1 1 1,25
2 Singapore 1 2,5 1 1 1 2 1 1 1 1 1,25
3 Bahrain 2 1 3 1 2 2 2 1 1 1 1,60
4 USA 2 4 2 1 2 2 2 1 2 1 1,90
5 Japan 2 4,5 1 1 3 2 2 1 2 1 1,95
Taiwan
6 2 2,5 2 1 3 3 2 1 2 1 1,95
7 UK 2 4,5 3 1 2 2 2 1 1 1 1,95
8 Canada 2 4 2 1 3 2 2 1 2 1 2,00
9 Germany 2 5 2 1 2 2 2 1 2 1 2,00
Austria 2 4,5 3 1 2 1 2 1 3 1 2,05
10
. . .
82 România 1 4,5 5 5 2 3 2 4 4 5 3,55
Sursa: Extras din documentul "Index of Economic Freedom" prezentat de Centrul
Internaţional de Studii Antreprenoriale, Universitatea Bucureşti, 1995
Deşi indicii sintetici pentru caracterizarea unităţilor administrativ-teritoriale
folosesc o metodologie extrem de simplă pentru agregarea informaţiilor, ei oferă o
caracterizare complexă "sintetică" pentru fiecare unitate.
Singura problemă a determinării unor astfel de indici pare să fie identificarea unui
tablou cât mai complet de caracteristici pentru a satisface exigenţele de analiză în profil
teritorial.
Statistică teoretică şi economică

Probleme si aplicatii
8.1. Pentru a efectua o ierarhizare multicriterială a unor ţări europene în privinţa
dezvoltării învăţământului superior se cunosc următoarele date:

Ţara C1 C2 C3
Bulgaria 4,2 2942 10
Grecia 3,7 2846 17
România 3,6 1568 16
Turcia 3,4 1960 27
Sursa: Economia mondială în cifre, 1998, C.N.S., pag.109, 111.
unde:
C1 = popnderea cheltuielilor totale pentru învăţământ în PNB;
C2 = numărul studenţilor la 100000 locuitori ;
C3 = numărul de studenţi la un cadru didactic.

Se cere:
1. să se calculeze indicii de concentrare pentru fiecare caracteristică în parte;
2. să se calculeze energia informaţională pentru fiecare caracteristică în parte;
3. să se efectueze ierarhizarea ţărilor luând în considerare toate cele trei criterii.
Statistică teoretică şi economică

CAPITOLUL 9.
INDICII STATISTICI
Cuvinte cheie:
- indice cronologic
- indice individual
- indice de grup
- indice agregat
- indice al factorului cantitativ
- indice al factorului calitativ (intensiv)

Indicii sunt o categorie de indicatori utilizaţi în caracterizarea oricăror fenomene


social-economice, deoarece reflectă modificările care au loc, precum şi influenţa
diferiţilor factori care acţionează asupra fenomenului studiat.
Se poate spune că indicele sintetizează într-o expresie numerică nivelul relativ
atins de caracteristica studiată în cadrul unui ansamblu de caracteristici prin care este
definit fenomenul social-economic respectiv. În acelaşi timp, indicii se pot constitui într-
o metodă statistică de analiză în dinamică a evoluţiei unui fenomen.
De exemplu, cunoaşterea unor informaţii cum sunt: producţia, profitul, cifra de
afaceri şi capitalul unei firme agricole nu sunt suficiente pentru aprecierea ritmurilor
activităţii desfăşurate de respectiva firmă. Cu ajutorul indicilor se pot obţine informaţii
suplimentare referitoare la dinamica activităţii economice, precum şi identificarea
influenţelor altor factori economici asupra acestor indicatori.
Într-un sens mai larg, indicii sunt mărimi relative cu ajutorul cărora se evidenţiază
modificarea în timp a fenomenelor sociale şi economice faţă de o anumită perioadă.
Din punct de vedere cognitiv, indicii au următoarele funcţii:
- exprimă nivelul relativ al caracteristicii studiate pe un element
sau pe o colectivitate de elemente, pentru a arăta cât reprezintă
(de câte ori s-a modificat) nivelul analizat faţă de cel de
referinţă;
- în cazul unui sistem de variabile, legate printr-o relaţie de
multiplicare, indicii servesc şi ca instrument de analiză
factorială, dând posibilitatea descompunerii pe factori de
influenţă a variaţiei unei caracteristici complexe. În acest caz,
caracteristica complexă trebuie să fie rezultatul prin
multiplicare a cel puţin unui factor extensiv şi a unui factor
intensiv.
În sens matematic, indicele statistic este un număr pur, care măsoară variaţiile
relative ale unei mărimi ce reprezintă caracteristica statistică (x), frecvenţa (f) sau
fenomenul în tatalitatea sa (x ⋅ f) între două fracţiuni de timp sau de spaţiu.

9.1. Clasificarea indicilor.


Indicii se pot clasifica după următoarle criterii:
a) din punctul de vedere al destinaţiei lor:
Statistică teoretică şi economică

• indici cronologici (indici ai dinamicii), atunci când se fac comparaţii cu nivelul


unei perioade trecute;
• indici teritoriali, atunci când se compară două unităţi administrativ-teritoriale;
• indici de plan, atunci când se au în vedere relaţii existente între unităţile
economice, deci la nivel microeconomic (indicele sarcinii de plan, care se
calculează ca raport între nivelul planificat faţă de realizările precedente, şi
indicele realizării sau nerealizării planului, când se raportează nivelul realizat la
nivelul planificat);
b) Din punctul de vederea al sferei de cuprindere:
• indici individuali, atunci când ei exprimă nivelul relativ al unui singur element al
colectivităţii şi se notează cu ″i″; de exemplu:
1) indicele individual al variabilei complexe:

y1 x1 ⋅ f 1
i1y/ 0 = = ;
y 0 x0 ⋅ f 0

2) indicele individual al factorului cantitativ:

f1
i1f/ 0 = ;
f0

3) indicele individual al factorului calitativ:

x1
i1x/ 0 = .
x0

Deoarece y = x ⋅ f, variaţia în timp sau spaţiu a acestor caracteristici urmează


relaţia:

iy = ix ⋅ if

• indici de grup sau sintetici, care exprimă nivelul relativ al întregului ansamblu de
elemente şi se notează cu ″I″; de exemplu:
- indicele de grup al volumului valoric (Iy);
- indicele de grup al volumului fizic (Iq);
- indicele de grup al preţului (Ip);
De asemenea indicii de grup verifică sistemul Iy = Iq ⋅ Ip.
c) Din punctul de vedere al naturii elementelor colectivităţii (indicii se
diferenţiază ca metodă de calcul):
- în cazul unei colectivităţi eterogene, indicii pot fi calculaţi ca:
• indicii agregaţi, care recurg la o combinaţie teoretică ca mijloc de izolare a
influenţei fiecărui factor explicativ;
• indicii medii, care se formează ca medii aritmetice sau armonice ale indicilor
individuali;
Statistică teoretică şi economică

- în cazul unei colectivităţi omogene, variaţia factorului intensiv poate fi


caracterizată printr-un sistem de indici calculaţi ca raport a două medii.
d) Din punctul de vedere al sistemului de ponderare:
• indici cu pondere fixă sau constantă (Laspeyres - 18641):

I Lf =
∑f 1 ⋅ x0
I Lx =
∑f 0 ⋅ x1
I y ≠ I Lf ⋅ I Lx ;
∑f 0 ⋅ x0 ∑f 0 ⋅ x0

• indici cu pondere curentă sau variabilă (Paasche - 18742):

I pf =
∑f 1 ⋅ x1
I px =
∑f 1 ⋅ x1
I y ≠ I pf ⋅ I px ;
∑f 0 ⋅ x1 ∑f 1 ⋅ x0

• indici cu pondere combinată (încrucişată, mixtă):

If =
∑f 1 ⋅ x0
Ix =
∑f 1 ⋅ x1
I y = If ⋅Ix;
f 0 ⋅ x0 ∑f 1 ⋅ x0

deci, în acest din urmă caz, proprietatea de reversibilitate a factorilor se verifică.


• indici cu pondere ″ideală″ (Fisher – 19223):
i) în cazul factorului cantitativ:

I Ff =
∑f 1 ⋅ x0

∑f 1 ⋅ x1
= I Lf ⋅ I pf ;
∑f 0 ⋅ x0 ∑f 0 ⋅ x1

ii) în cazul factorului calitativ:

I Fx =
∑f 0 ⋅ x1

∑f 1 ⋅ x1
= I Lx ⋅ I px I y = I Ff ⋅ I Fx
∑f 0 ⋅ x0 ∑f 1 ⋅ x0

1
Etiene Laspeyres (1834 -1913), economist şi statistician german, profesor la universităţile din Basel,
Riga, Karlsruhe şi altele. În statistica preţurilor a formulat, în 1864, un indice care îi poartă numele.
Principalele sale lucrări sunt: HamburgerWarenpreise, 1851-1863 und die californischaustralischen
Goldetfeckungen seit 1848; Die Berechnung einer mitttleren Warenpreissteigerung.
2
Herman Paasche (1851-1925), economist şi statistician german, agent de bursă la Hamburg în perioada
formulării variantei de indice de preţuri cu pondere curentă. Principalele lucrări: Ulber die
Preisentwicklung der letzten Jahre nach den Hamburger Preisnoteierungen (1874); Studien uber die Natur
der Gerdwertung und ihre praktische Bedeutung in den lotzten Jahrzehnten auf Grund statistischen
Detaillmaterials entnommen der Stadt Halle a/S (1878).
3
Irving Fisher (1867-1947), economist şi statistician din S.U.A., a descoperit nu mai puţin de 352 de
variante, formulând şi varianta: ″indicele geometric″, care este cunoscut sub denumirea de ″indicele 353″
sau ″indicele ideal″, pentru că satisface toate testele de verificare, consemnate, de altfel, de acelaşi autor.
Lucrările principale: Mathematical Investigation in the Theoryof Value and Prices (1922); The Marking of
Index Numbers (1922); The Best From of Index Number (1921).
Statistică teoretică şi economică

e) Din punct de vedere al modului de alegere a bazei de raportare, indicii se


împart în:
• indici cu bază fixă, atunci când se face raportarea nivelului fiecărei perioade la
nivelul unei anumite perioade considerată perioadă de bază sau de comparare;
• indici cu bază mobilă, atunci când se face raportarea nivelului fiecărei perioade la
nivelul perioadei anterioare.
Se observă că efectuarea calculului unui indice se face raportând nivelul analizat,
notat cu indicativul ″1″, la nivelul de bază, de comparaţie, notat cu indicativul ″0″.

9.2. Probleme metodologice ale indicilor de grup.


Acest tip de probleme se referă la: alegerea bazei de rapoarte şi a formulei de calcul,
stabilirea sistemului de ponderare, cuprinderea fiecărui indice în sisteme coerente de
informaţii statistice.
Grupul de probleme poate fi soluţionat dacă satisfac o serie de teste (reguli) de
verificare:
- reversibilitatea în timp: constă în faptul că indicele calculat ca raport între
nivelul perioadei curente şi cel al perioadei de bază trebuie să fie o mărime inversă a
indicelui rezultat prin raportarea nivelului de bază la cel din perioada curentă. Cu alte
cuvinte, indicele anului ″b″ calculat cu bază în anul ″a″ reprezintă o mărime inversă a
indicelui anului ″a″ calculat cu baza în anul ″b″:

1
ib / a =
ia / b

Reversibilitatea trebuie să o întâlnim la toţi indicii. Deci, între cele două tipuri de
indici există relaţia:

ib / a ⋅ i a / b = 1

- reversibilitatea factorilor: produsul indicilor factorilor trebuie să fie egal cu


indicele variabilei complexe.
După această regulă, dacă se substituie factorii indicelui, produsul noilor indici nu se
modifică. Dacă factorii ″x″ şi ″f″ işi schimbă locurile între ei, rezultă că:

I 1y/(0x ) =
∑x
1 ⋅ f1
devine I 1y/(0x ) =
∑f 1 ⋅ x1
∑x 0 ⋅ f1 ∑f 0 ⋅ x1

şi respectiv:

I 1y/(0f ) =
∑x 0 ⋅ f1
devine I 1y/(0x ) =
∑f 0 ⋅ x1
∑x
0 ⋅ f0 ∑f 0 ⋅ x0
Statistică teoretică şi economică

Produsul noilor indici factoriali obţinuţi este egal cu indicele general al variaţiei
fenomenului complex;
- tranzitivitatea: presupune obţinerea indicelui cu bază fixă prin înmulţirea unui
şir de indici cu bază mobilă pentru peroada analizată.
Fie:

i1/0, i2/1, i3/0, i4/3, i5/4,


indici cu bază mobilă pe intervalul de timp (0…5); atunci indicele cu bază fixă 5
faţă de 0 va fi produsul acestor indici:

y1 y 2 y 3 y 4 y 5
i1 / 0 ⋅ i 2 / 1 ⋅ i3 / 2 ⋅i 4 / 3 ⋅i5 / 4 = ⋅ ⋅ ⋅ ⋅ = i5 / 0 ;
y 0 y1 y 2 y 3 y 4

- circularitatea: verifică indicii cu bază mobilă prin intermediul probalilităţii de


trecere dintr-o bază de calcul în alta.
Dacă se consideră anii ″a″, ″b″ şi ″c″ şi se calculează indicele anului ″b″ în bază
″a″ şi un indice pentru anul ″c″, produsul lor trebuie să fie egal cu indicele anului ″c″ cu
bază în anul ″a″.

ib / a ⋅ i c / n = i c / a

În acest caz:

ib / a ⋅ i c / b ⋅ i a / c = 1

De fapt, circularitatea este o extindere a testului reversibilităţii în timp.


Baza de raportare trebuie să fie astfel stabilită, încât să reflecte variaţia reală a
fenomenului supus analizei. Aceasta nu trebuie să exprime un nivel de excepţie al
variaţiei, ci un nivel obşnuit, conform tendinţei generale a evoluţiei fenomenului
respectiv.
În situaţia economiei de piaţă, alegerea bazei de calcul are o însemnătate
deosebită în urmărirea fenomenelor, considerând faptul că ciclul economic cuprinde atât
faze de avânt, cât şi faze de depresiune. În astfel de situaţii, baza poate fi aleasă ori o
perioadă de depresiune ori una de prosperitate, şi deci indicii nu reflectă corespunzător
evoluţia fenomenului respectiv.
De asemenea, există situaţii când prin modul de alegere a perioadei de bază
realitatea poate fi denaturată.
Pentru a soluţiona o asemenea problemă există două posibilităţi:
- calcularea unei medii a mărimilor din perioada unui întreg ciclul economic;
- schimbarea, relativ frecventă, a bazei de calcul.
Însă, schimbarea bazei de calcul necesită un volum de muncă dublu şi presupune
o discotinuitate, ceea ce împiedică comparaţia. Pentru a evita şi această problemă,
Stanley Jevos şi Alfred Marchall au propus construirea indicilor în lanţ continuu,
metodă care constă în schimbarea autonomă a bazei la fiecare calcul nou al indicelui.
Statistică teoretică şi economică

În ceea ce priveşte formula de calcul, aceasta se alege în funcţie de datele


disponibile şi de natura elementelor care compun clectivitatea se doreşte a fi studiată.
Astfel, există posibilitateate alegerii indicilor agregaţi, indicilor medii de grup sau a
indicilor obţinuţi ca raport de medii.
Sistemul de ponderare a fost şi continuă să fie aspectul care, în teoria şi practica
statistică, a creat cele mai multe probleme. Aceasta este o problemă-cheie a metodologiei
de construire a indicilor statistici.
O bază ştiinţifică a căpătat această problemă prin propunerea făcută de Etienne
Laspeyres în 1864, statistician german (1834-1913), astfel apărând în literatura statistică
formula indicelui Laspeyres sau metoda lui Laspeyres.
Indicii agregaţi ai volumului fizic şi ai preţului sunt construiţi folosind ponderile
la nivelul perioadei de bază. Astfel, s-a ajuns la relaţiile:

I 1q/ 0 =
∑ q1 ⋅ p 0 şi I 1p/ 0 =
∑q 0 ⋅ p1
∑ q0 ⋅ p0 ∑q 0 ⋅ p0

Se observă că, în cazul primului indice, cel al cantităţii (variabila cantitativă), s-a
utilizat ponderea (preţul) din perioada de bază, iar în cazul celui de-al doilea indice, cel al
preţului (variabila calitativă), s-a utilizat ponderea (cantitatea) din perioada de bază.
Acest tip de indice se mai numeşte şi cu pondere constantă sau fixă.
În 1874, economistul german Hermann Paasche a produs un indice, folosind
ponderile perioadei curente:

I 1q/ 0 =
∑q 1 ⋅ p1
şi I 1p/ 0 =
∑q 1 ⋅ p1
∑q 0 ⋅ p1 ∑q 1 ⋅ p0

In cazul indicelui cantităţii (variabila cantitativă), acesta este ponderat cu preţul


din perioada curentă, iar în cazul indicelui preţului (variabila calitativă), ponderea este
cantitatea din perioada curentă.
Acest tip de indice se mai numeşte şi cu pondere variabilă sau curentă.
Însă, nici unul dintre aceşti doi indici nu satisface o cerinţă importantă, şi anume,
proprietatea de reversibilitate a factorilor.
Formulele Laspeyres şi Paasche nu alcătuiesc un sistem comparabil de relaţii de
calcul, deoarece produsul variaţiei factorilor (Ip⋅Iq) nu conduce la obţinerea nivelului
relativ al variabilei complexă (Iv).
Un alt indice folosind ponderile din ambele perioade este indicele ″ideal″ al lui
Fischer. Formula indicelui său este, de fapt, o medie geometrică a formulelor lui
Laspeyres şi Paache:

I 1q/ 0 =
∑ p ⋅q ⋅ ∑ p
0 1 1 ⋅ q1
şi I 1p/ 0 =
∑p 1 ⋅ q0

∑q 1 ⋅ p1
∑p q ∑p
0 0 1 ⋅ q0 ∑p 0 ⋅ q0 ∑q 1 ⋅ p0
Statistică teoretică şi economică

Este considerat a fi un indice ideal datorită faptului că se încadrează în intervalul


de variaţie a valorilor celor doi indici calculaţi pe baza celor două sisteme de ponderare.
Deci, are puterea de compensare a tendinţei de modificare a ponderilor folosite.
Dacă indicii Laspeyres şi Paasche au la bază media aritmetică, indicele Fischer
foloseşte media geometrică, fapt cu care au fost de acord şi alţi teoreticieni.
În cazul acestui indice se observă:

v
I p = I Fq ⋅ I Fp
Indicele Fischer se foloseşte la calcul indicilor teritoriali, în situaţia comparării
mai multor ţări: de exemplu, indicele consumului populaţiei, unde preţurile luate ca
ponderi se referă la ţările comparate.
Indicele prezintă însă un dezavantaj destul mare, şi anume, necesită cunoaşterea
separată a tuturor elementelor de calcul, precum şi combinarea tuturor variabilelor
posibile, mai ales în cazul în care sfera de cuprindere a colectivităţii la care se referă
indicii este foarte mare. Bineînţeles, indicii calculaţi după aceste trei variante de
ponderare nu dau aceleaşi rezultate. Având în vedere aceste neajunsuri, cercetările cu
continuat pentru găsirea unui indice mai bun însă până în prezent nu s-au găsit decât noi
formule de compromis.
Astfel, Y.F. Edgenworth4 a propus următorul indice:

I 1p/ 0 =
∑p 1 ⋅ (q1 + q 0 )
∑p 0 ⋅ (q1 + q 0 )

Indicele cumulează cantităţile din perioada de bază cu cele din perioada curentă,
cumul folosit la studiul variaţiei preţului, adică variaţiei calitative. Însă, indicele are un
dezavantaj, el nu poate fi utilizat decât pentru studiul variaţiei variabilei calitative,
deoarece ponderea (variabila calitativă) poate fi cumulată; în schimb, la studiul variabilei
cantitative nu se poate aplica, deoarece factorii calitativi nu au sens să fie cumulaţi de la o
perioadă la alta.
O altă formulă de compromis a fost propusă de statisticianul polonez Jean
Wisniewski, în sensul unui indice mediu, elaborat cu ajutorul calculului integral.
Unii statisticiani au propus un procedeu simplu şi rapid, prin calcularea indicelui
pe baza medianei.
De asemenea, un alt procedeu de ponderare este şi cel propus de matematicianul
şi filosoful german Mortiz Wilhelm Drobisch:

I=
∑ p ⋅q :∑ p ⋅q
1 1 0 0

∑q ∑p 1 0

4
Francis Ysidor Edgeworth (1845-1926), statistician, matematician şi economist englez. Profesor în
economie la Oxford (1891) şi la Londra. A fost influenţat de concepţia bayesiană. A avut o importantă
contribuţie la teoria indicilor şi la aplicarea statisticii matematice în economie; autor al unor lucrări
fundamentale de teoria statisticii. Lucrări principale: On the Method of Ascertaining a Change in the Value
of Gold (1883); Defence of Index-Numbers (1896); Metretica sau metodica de măsurare a probabilităţii şi
unităţii (1887); Despre metodele statisticii (1885).
Statistică teoretică şi economică

Este de menţionat şi formula statisticianului francez Lucien March:

p1
∑p ⋅ q1
I= 0

∑q 1

În istoria statisticii au fost nenumărate încercări şi propuneri de ponderare, cele


mai utilizate însă sunt cele de tip Laspeyres, Paasche şi Fischer.

9.3. Descompunerea pe factori de influenţă a variaţiei unui fenomen complex


folosind metoda indicilor.
Explicarea cauzală a variaţiei unui fenomen complex reprezintă o funcţie cognitivă
importantă a indicilor. De exemplu, dacă dorim să analizăm influenţa volumului fizic (q)
şi a preţurilor (p) asupra variaţiei valorii producţiei (v), sau influenţa productivităţii
muncii (w) şi a numărului de ore-om cheltuite pentru producţie (T) asupra producţiei,
putem utiliza indicii ca metodă de separare şi cuantificare a acestor influenţe.
Orice variaţie a unui fenomen social-economic se poate studia atât în mărimi
absolute, cât şi în mărimi relative.
Descompunerea pe factori a sporului absolut se numeşte şi descompunere
aritmetică sau analitică, iar descompunerea în mărime relativă se numeşte descompunere
geometrică. Descompunerea analitică se bazează pe relaţia de adunare constând în
separarea modificării totale în suma modificărilor absolute a factorilor supuşi cercetării.
Descompunerea geometrică are la bază relaţia de produs şi constă în descompunerea
indicelui general în produsul indicilor factoriali.

Metoda substituirilor în lanţ


Această metodă constă în anihilarea, pe rând, a câte unui factor de influenţă,
menţinându-se variaţia factorului supus analizei. În această idee se vor folosi sisteme de
ponderare diferite, care fac ca produsul lor să fie egal cu indicele general.
Presupunem existenţa unui fenomen complex de tipul y = x ⋅ f.
Analizat în timp, acesta va fi:

I 1y/ 0 =
∑x
1 ⋅ f1
,
∑x
0 ⋅ f0

unde ″x″ este factorul calitativ şi ″f″ este factorul cantitativ. Corespunzător,
descompunerea analitică va fi:

∆ y1 / 0 = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 0

Influenţa factorului calitativ se determină după una dintre relaţiile:


Statistică teoretică şi economică

I 1y/(0x ) =
∑x 1 ⋅ f1
sau I 1y/(0x ) =
∑x 1 ⋅ f0
;
∑x 0 ⋅ f1 ∑x 0 ⋅ f0

În acest caz, modificările absolute vor avea următoarele relaţii:

∆ y1(/ x0) = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 1 sau ∆ y1(/ x0) = ∑ x1 ⋅ f 0 − ∑ x 0 ⋅ f 0

Influenţa factorului cantitativ se determină opţional după una din următoarele


relaţii:

I 1y/(0f ) =
∑x 1 ⋅ f1
sau I 1y/(0f ) =
∑x 0 ⋅ f1
∑x 1 ⋅ f0 ∑x 0 ⋅ f0

În acest caz, modificările absolute vor avea următoarele relaţii:

∆ y1(/ 0f ) = ∑ x1 ⋅ f 1 − ∑ x1 ⋅ f 0 sau ∆ y1(/ 0f ) = ∑ x 0 ⋅ f 1 − ∑ x 0 ⋅ f 0

Pentru a răspunde testelor de verificare:

I 1y/ 0 = I 1y/(0x ) ⋅ I 1y/(0f )


∆ y1 / 0 = ∆ y1(/ x0) ⋅ ∆ y1(/ 0f ) ,

va trebui să utilizăm una dintre următoarele două variante:


- varianta a:

I 1y/ 0 =
∑x 1 ⋅ f1
; ∆ y1 / 0 = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0

I 1y/(0x ) =
∑x 1 ⋅ f1
; ∆ y1(/ x0) = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 1 ;
∑x 0 ⋅ f1

I 1y/(0f ) =
∑x 0 ⋅ f1
; ∆ y1(/ x0) = ∑ x 0 ⋅ f 1 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0

- varianta b:

I 1y/ 0 =
∑x 1 ⋅ f1
; ∆ y1 / 0 = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0
Statistică teoretică şi economică

I 1y/(0x ) =
∑x 1 ⋅ f0
; ∆1y/(0x ) = ∑ x1 ⋅ f 0 − ∑ x0 ⋅ f 0 ;
∑x 0 ⋅ f0

I 1y/(0f ) =
∑x 1 ⋅ f1
; ∆ y1(/ 0f ) = ∑ x1 ⋅ f 1−∑ x1 ⋅ f 0 .
∑x 1 ⋅ f0

Se observă că ambele variante corespund testelor de verificare enunţate mai sus.


Cele două variante pornesc de la ipotezele: y1 > y0; x1 >x0; f1 > f0, deci vom avea şi
următoarele sporuri:

∆ y1 / 0 = y1 − y 0 ; ∆x1 / 0 = x1 − x 0 ; ∆ 1f / 0 = f 1 − f 0 .

Prin urmare, sporul variabilei complexe ″y″ în funcţie de factorul ″x″ va fi:
- pentru varianta a:

∆ y1(/ x0) = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 1 = ∑ f 1 ⋅ ( x1 − x 0 ) = ∑ f 1 ⋅ ∆x1 / 0 ;

- pentru varianta b:

∆ y1(/ x0) = ∑ x1 ⋅ f 0 − ∑ x 0 ⋅ f 0 = ∑ f 0 ⋅ ( x1 ⋅ x 0 ) = ∑ f 0 ⋅ ∆x1 / 0 ,

iar sporul variabilei complexe ″y″ în funcţie de factrul cantitativ ″f″ va fi:

∆ y1(/ 0f ) = ∑ x 0 ⋅ f 1 − ∑ x 0 ⋅ f 0 = ∑ x 0 ( f 1 − f 0 ) = ∑ x 0 ⋅ ∆ 1f / 0 ;

- pentru varianta b:

∆ y1(/ 0f ) = ∑ x1 ⋅ f 1 − ∑ x1 ⋅ f 0 = ∑ x1 ⋅ ( f 1 − f 0 ) = ∑ x1 ⋅ ∆ 1f / 0 .

Însă, din inegalitatea f1>f0 rezultă că sporul factorului ″x″ în prima variantă este
mai mare decât în cea de-a doua variantă cu produsul diferenţei dintre ponderi şi creşterea
variabilei calitative.
Dacă analizăm cel de-al doilea factor, sporul variaţiei complexe ″y″ în funcţie de
factorul cantitativ ″f″, rezultă că influenţa este mai mare cu aceeaşi valoare, deoarece
ponderea folosită x1 > x0 se multiplică pentru toată creşterea factorului ″f″. Cei mai mulţi
statisticieni şi economişti atribuie această diferenţă inlfuenţei factorului calitativ,
considerând faptul că modificarea acestuia este condiţionată de modificararea factorului
cantitativ şi deci este justificată folosirea ponderii din perioada curentă.
În general, dacă substiuirea începe cu factorul calitativ, atunci, pe măsură ce am
luat în considerare un factor, el rămâne în perioada de bază ca pondere, factorii neluaţi în
calcul însă vor fi stabiliţi în perioada curentă.
Statistică teoretică şi economică

Astfel, pentru a evidenţia mai clar această regulă, presupunem un fenomen


complex (y) influneţat de trei factori (x – factor calitativ, f şi t – factori cantitativi).
sistemul de indici şi descompunerea absolută vor fi:

I 1y/ 0 =
∑ x ⋅ f ⋅t
1 1 1
∆ y1 / 0 = ∑ x1 ⋅ f 1 ⋅ t1 − ∑ x 0 ⋅ f 0 ⋅ t 0 ;
∑ x ⋅ f ⋅t
0 0 0

I 1y/(0x ) =
∑ x ⋅ f ⋅t1 1 1
∆ y1(/ x0) = ∑ x1 ⋅ f 1 ⋅ t1 − ∑ x 0 ⋅ f 1 ⋅ t1 ;
∑ x ⋅ f ⋅t0 1 1

I 1y/(0f ) =
∑x 0 ⋅ f 1 ⋅ t1
∆ y1(/ 0f ) = ∑ x 0 ⋅ f 1 ⋅ t1 − ∑ x 0 ⋅ f 0 ⋅ t1 ;
∑x 0 ⋅ f 0 ⋅ t1

I 1y/(0f ) =
∑x 0 ⋅ f 0 ⋅ t1
∆ y1(/t0) = ∑ x 0 ⋅ f 0 ⋅ t1 − ∑ x 0 ⋅ f 0 ⋅ t 0 .
∑x 0 ⋅ f 0 ⋅ t0

Metoda influenţelor iozlate (MII) sau metda restului nedescompus (MRN)


Această metodă presupune modificarea unui factor, în situaţia în care ceilalţi
rămân la nivelul perioadei de bază. Astfel, suma influenţelor izolate ale celor doi factori
nu este egală cu întreaga modificare, rămânând un rest (restul nedescompus) datorat
interacţiunii celor doi factori.
Deci, utilizând această metodă, descompunerea se va face în felul următor:
- modificarea variabilei complexe:

I 1y/ 0 =
∑x 1 ⋅ f1
, respectiv ∆ 1 / 0 y = ∑ x1 ⋅ f 1 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0

- modificarea factorului cantitativ:

I 1y/(0f ) =
∑x 0 ⋅ f1
, respectiv ∆ y ( f ) = ∑ x 0 ⋅ f 1 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0

- modificarea factorului calitativ:

I 1y/(0x ) =
∑x 1 ⋅ f0
, respectiv ∆ y ( x ) = ∑ x1 ⋅ f 0 − ∑ x 0 ⋅ f 0 ;
∑x 0 ⋅ f0

- restul nedescompus:
Statistică teoretică şi economică

I 1y/(0x ∩ f ) =
∑x 1 ⋅ f1
:
∑x 1 ⋅ f0
, respectiv
∑x 0 ⋅ f1 ∑x 0 ⋅ f0

∆ y ( x∩ f ) = ∑ x1 ⋅ f1 − ∑ x0 ⋅ f 1 − ∑ x1 ⋅ f 0 + ∑ x0 ⋅ f 0

Relaţia dintre indici este:

I 1y/ 0 = I 1y/(0x ) ⋅ I 1y/(0f ) ⋅ I 1y/(0x ∩ f )

Restul nedescompus este necesar să fie repartizat pe cei doi factori de influemţă.
De regulă, repartizarea se face în funcţie de ponderea influenţei izolate a fiecărui factor în
totalul celor două influenţe izolate. Deci, se vor calcula coeficienţii de realizare:

∆y ( f ) ∆y ( x)
k = y( f )
f
şi k = y( f )
x
,
∆ + ∆y ( x) ∆ + ∆y ( x)

rezultând:
- influenţa totală a factorului cantitativ:

∆ y ( f ) = ∆y ( f ) + k f ⋅ ∆y ( x ∩ f ) ;

- influenţa totală a factorului calitativ:

∆ y ( x ) = ∆y ( x) + k x ⋅ ∆y ( x ∩ f )

Metoda influenţelor izolate oferă rezultate mai exacte decât metoda substituirilor
în lanţ, care atribuie întreg sporul nedescompus factorului calitativ. MSL se utilizează
numai în cazul în care factorul cantitativ se modifică nesemnificativ şi dacă ponderea sa
în restul nedescompus este foarte mică.

9.4. Indici calculaţi ca medie a indicilor individuali.


Practica economică a arătat că nu întotdeauna determinarea unor agregate de
forma x0 ⋅ f1 sau x1 ⋅ f0 este posibilă, pe de o parte, datorită unor cheltuieli suplimentare în
stabilirea acestora şi, pe de altă parte, datorită faptului că determinarea lor ar fi atunci
când s-ar cunoaşte numai variabila complexă (y), dar nu şi, separat, variabila calitativă
(x) şi cea cantitativă (f). În acest caz, pentru determinarea indicilor agregaţi se apelează la
indici ca medie (aritmetică sau ponderată) a indicilor individuali. Indicii rezultaţi vor fi
egali cu cei agregaţi.
Teoretic pot exista următoarele situaţii:
• se cunoaşte nivelul caracteristicii complexe în perioada de bază (y0 = f0 x0)
şi valorile factorului cantitativ în cele două perioade (f0 şi f1), deci şi
indicele individual (if):
Statistică teoretică şi economică

I 1f/ 0 =
∑x 0 ⋅ f1
if =
f1
⇒ f1 = i f ⋅ f 0 ;
∑x 0 ⋅ f0 f0

deci:

I f
=
∑i ⋅ x ⋅ f
f
0 0
;
∑x ⋅ f
1/ 0
0 0

• se cunoaşte nivelul caracteristicii complexe în perioada de bază (y0 = f0 ⋅


x0) şi valorile factorului calitativ (x0 şi x1), deci şi indicele individual (ix):

I 1x/ 0 =
∑x 1 ⋅ f0
ix =
x1
⇒ x1 = i x ⋅ x 0 ,
∑x 0 ⋅ f0 x0

deci:

I 1x/ 0 =
∑i x ⋅ f x
0 0

∑x ⋅ f 0 0

• se cunoaşte nivelul caracteristicii complexe în perioada curentă (y1 = x1 ⋅f1)


şi valorile factorului cantitativ în cele două perioade (f0 şi f1):

f
I1/ 0 =
∑x 1 ⋅ f1
if =
f1
⇒ f0 =
1
⋅ f1 ,
∑x 1 ⋅ f0 f0 if

deci:

I1/ 0 =
f ∑x ⋅ f 1 1

1
∑i ⋅x ⋅ f f 1 1

• se cunoaşte nivelul caracteristicii complexe înperioada curentă (y1 = x1 ⋅ f1)


şi valorile factorului calitativ în cele două perioade de analiză (x0 şi x1):

I 1x/ 0 =
∑x 1 ⋅ f1
ix =
x1
x0 =
1
⋅ x1 ,
∑x 0 ⋅ f1 x0 ix

deci:
Statistică teoretică şi economică

I 1x/ 0 =
∑x ⋅ f 1 1

1
∑i ⋅x ⋅ f
x 1 1

Se observă că, în cazurile a) şi b), indicii agregaţi au factorului cantitativ,


respectiv calitativ, au fost calculaţi ca o medie aritmetică a indicilor individuali ponderaţi
cu valoarea cunoscută x0 ⋅ f0.
În următoarele două cazuri, c) şi d), indicii agregaţi ai factorilor cantitativ şi
calitativ au fost determinaţi ca medii armonice ale indicilor individuali ponderaţi cu
valoarea cunoscută x1 ⋅ f1.
Aceste variante devin eficiente atunci când sistemul informaţional nu ne permite
obţinerea unui anumit tip de informaţii, având posibilitatea înlocuirii lor cu date
cunoscute, disponibile.

9.5. Indici calculaţi ca raport a două medii.


În practică apare deseori necesitatea de a calcula anumiţi indicatori calitativi la
nivel de colectivitate generală. În aceste condiţii, indicatorii respectivi au un caracter de
medie.
În anumite cazuri, când factorul cantitativ însumabil are o anumită structură (de
exemplu, salariaţii dintr-o filială a unei firme-mamă), fenomenul complex oglindeşte
influenţa schimbării în timp a doi factori: variaţia factorului calitativ şi structura
factorului cantitativ.
Pentru a rezolva o astfel de problemă, putem apela la calculul indicilor agregaţi ca
raport a două medii sau, altfel spus, la indicii valorilor medii. De exemplu, factorul
calitativ (preţul de vânzare, costul mediu, productivitatea muncii) poate fi reprezentat ca
medie, la nivelul întregii colectivităţi, astfel:

∑x ⋅ f = x

1 1
x= ⋅ g if ,
∑f
1
1

unde ponderea factorului cantitativ este calculată astfel:

fi
g if =
∑f i

Faptul că ponderea factorului cantitativ se determină pe baza însumării factorului


cantitativ ne conduce la ideea că putem utiliza calculul indicelui agregat cu ajutorul
raportului a două medii numai atunci când factorul cantitativ este însumabil. Dinamica
variabilei calitative calculată ca raport a două medii se face utilizând sistemul de indici
medii: indicele cu structură fixă, indicele cu structură variabilă şi indicele de variaţie a
structurii:
- indicele cu structură fixă:
Statistică teoretică şi economică

x ( x)
I SF =
∑x ⋅ f :∑x ⋅ f
1 1 0 1
.
∑f ∑f 1 1

Acest indice exprimă modificarea relativă a nivelului mediu în perioada curentă


faţă de perioada de bază sub influenţa factorului calitativ. În acest caz, modificarea
absolută a nivelului mediu al caracteristicii studiate se determină ca diferenţă între
numărătorul şi numitorul fiecărui indice:

∑x ⋅ f ∑x ⋅ f = x
∑ ⋅ g 1f − ∑ x 0 ⋅ g 1f ;
1 1 0 1
∆xSF( x ) = −
∑f ∑f
0
1 1

- indicele cu structură variabilă:

x ( x)
I SV =
∑x ⋅ f :∑x ⋅ f 1 1 0 0
.
∑f ∑f 1 0

Indicele exprimă modificarea relativă a nivelului mediu în perioada curentă faţă


de perioada de bază, luând în calcul atât influenţa factorului calitativ, cât şi a factorului
cantitativ (de strructură).
Modificarea absolută se determină după relaţia:

∆xSV( x , f ) =
∑x ⋅ f1 1

∑x ⋅ f 0 0
= ∑ x1 ⋅ g 1f − ∑ x 0 ⋅ g 0f
∑f 1 ∑f 0

- indicele de variaţie a structurii (modificare a stucturii):

I VSx ( f ) =
∑x ⋅ f :∑x ⋅ f
0 1 0 0
.
∑f ∑f 1 0

În acest caz, indicele reprezintă influenţa factorului cantitativ asupra dinamicii


valorii medii, iar determinarea modificării absolute este:

∆xVS( f ) =
∑x ⋅ f0 1

∑x ⋅ f 0 0
= ∑ x 0 g 1f − ∑ x 0 ⋅ g 0f .
∑f 1 ∑f 0

Relaţiile dintre aceşti indici şi respectiv, dintre modificările absolute sunt:

I SV = I SF ⋅ I VS ;
∆ SV = ∆ SF ⋅ ∆ VS .
Statistică teoretică şi economică

9.6. Indicii teritoriali.


În sens larg, putem spune că indicii teritoriali sunt mărimi relative de coordonare
utilizate pentru compararea fenomenelor şi proceselor economico-sociale de acelaşi fel
şi din aceeaşi unitate de timp, însă din unităţi de spaţiu diferite.
Indicii teritoriali se construiesc pentru comparaţiile economice şi sociale la nivel
internaţional sau naţional. Privitor la comparaţiile teritoriale naţionale, obiectul acestora îl
constituie: preţul mediu, costul mediu, recolta medie la hectar, salariul mediu,
productivitatea medie a muncii etc.
Pentru construirea indicilor teritoriali trebuie soluţionate următoarele probleme:
• asigurarea comprabilităţii conţinutului indicatorilor analizaţi;
• alegerea bazei de comparare;
• alegerea fenomenului formulei de calcul şi a sistemului de ponderare.
De exemplu, în cazul comparării a două unităţi administrativ-teritoriale A şi B,
avem următoarele variante:
a) indici teriotriali individuali:
- factorul calitativ (x):

XA XB
i Ax / B = sau i Bx / A = ;
XB XA

- factorul cantitativ (f):

fA fB
i Af / B = sau i Bf / A = ;
fB fA

- factorul complex (y = x ⋅ f):

yA X A f A yB X B ⋅ f B
i Ay / B = = sau i By / A = = .
yB X B f B yA X A ⋅ f A

În cazul celor doi factori, calitativ şi cantitativ, pe de o parte, şi al celui complex,


pe de altă parte, între cele două variante există relaţia de reversibilitatea în spaţiu:

i Ax / B ⋅ i Bx / A = 1
i af / B ⋅ i Bf / A = 1
i Ay / B ⋅ i By / A = 1

b) indici teritoriali de grup:


- forma agregată:

I Ay / B =
∑y A
=
∑X A ⋅ fA
sau I By / A =
∑y B
=
∑X B ⋅ fB
.
∑y B ∑X B ⋅ fB ∑y A X A ⋅ fA
Statistică teoretică şi economică

Principiul reversibilităţii în spaţiu nu este întotdeauna respectat, mai ales în cazul


indicilor de grup, deoarece apare elementul de ponderare sau frecvenţă.
Astfel, avem următoarle sisteme de ponderare:
- pentru factorul calitativ:

I Ax / B =
∑X A ⋅ fA
; I Ax / B =
∑X A ⋅ fB
∑X B ⋅ fA ∑X B ⋅ fB
sau

I Bx / A =
∑X B ⋅ fB
; I Bx / A =
∑X B ⋅ fA
.
∑X A ⋅ fB ∑X A ⋅ fA

- pentru factorul cantitativ:

I Af / B =
∑X A ⋅ fA
; I Af / B =
∑X B ⋅ fA
∑X A ⋅ fB ∑X B ⋅ fB

sau

I Bf / A =
∑X B ⋅ fB
; I Bf / A =
∑X A ⋅ fB
.
∑X B ⋅ fA ∑X A ⋅ fA

Pentru exemplificare să considerăm o societate comercială de export-import care


desface pe două pieţe diferite, două ţări diferite ″A″ şi ″B″, mai multe produse, în
cantităţile şi la preţurile din tabelul următor:

Denumire Cantitate (+) Preţ unitar ($/t) Volumul valoric al


produs vânzărilor ($)
qA qB pA pB QA QB
Produs A 20 25 80 75 1600 1875
Produs B 80 60 50 60 4000 3600
Produs C 45 40 100 120 4500 4800
TOTAL 145 125 - - 10.100 10.275

Pentru a compara cele două ţări, de fapt cele două pieţe, se va considera ca bază
de raportare piaţa ţării ″B″. Comparaţia se poate face din următoarele puncte de vedere:
- din punctul de vedere al cantităţilor vândute:

I Af / B =
∑f A
=
145
= 1,16 sau 116%
∑f B 125
Statistică teoretică şi economică

Acest rezultat arată că pe piaţa ″A″ s-au vândut cu 16% mai multe tone de marfă
decât pe piaţa ″B″:
- din punct de vedere al preţurilor:

I Ax / B =
xA
=
∑Q : ∑Q
A B
= 0,8473 sau 84,73%
xB ∑f ∑f
A B

Rezultatul arată că preţul mediu pe piaţa ″A″ a fost cu 15,27% mai mic decât
preţul mediu pe piaţa ″B″.
- din punctul de vedere al încasărilor:

I AQ/ B =
∑ Q A = 10100 = 0,9829 sau 98,29%
∑ QB 10275
Volumul valoric al tranzacţiilor pe piaţa ″A″ a fost cu 1,71% mai mic decât
volumul valoric al tranzacţiilor pe piaţa ″B″.
De remarcat, că şi în această situaţie se verifică relaţia:

I AQ/ B = I Af / B ⋅ I Ax / B

0,9829 = 1,16 ⋅ 0,8473

Analiza teritorială efectuată cu aportul indicilor teritoriali, trebuie să opteze pentru


acele relaţii de calcul care servesc cel mai bine scopului propus şi care sunt în măsură să
caracterizeze cel mai bine realitatea economico-socială.
Statistică teoretică şi economică

Probleme şi aplicaţii:
9.1. În exportul a trei produse se cunosc următoarele date comparative ale două
trimestre ale anului 1997:
(date convenţionale)
Denumire produs Indicii de preţuri Volumul valoric (mild.lei)
Trim III Trim IV
A 140 4 8
B 130 4 6
C 180 1 4

Se cere:
1. să se calculeze indicii individuali ai volumului valoric şi ai volumului fizic;
2. să calculeze indicii de grup care caracterizează evoluţia exportului celor trei produse;
3. să se măsoare influenţa factorilor posibili asupra evoluţiei volumului valoric al
exportului la nivelul firmei.

9.2. Se cunosc următoarele date referitoare la producţia de lactate realizată de


fabrica de lactate “Mioriţa-Lact” din Bucureşti:
(date convenţionale)
Produsul Unitate de Cantitate (mii) Preţuri (mii lei)
măsură
1996 1997 1996 1997
Lapte Litru 25 20 3 4
Brânză topită Buc. 8 12 5 7

Se cere:
1. să se facă analiza comparativă a indicilor de preţ calculaţi după relaţiile Laspeyres,
Paasche şi Fisher;
2. să se decompună pe factori de influenţă creşterea volumului valoric al vânzărilor de
produse lactate.

9.3. Cheltuielile de consum ale unei familii prezintă următoarele valori:


Grupa de Cheltuieli lunare (mii lei) Indicele
produse individual de
preţ
Per.bază Per.crt.
Alimentare 350 400 330
Nealimentare 100 170 250
Servicii 80 160 300

Se cere:
1. să se calculeze indicele de grup al preţului ca medie artimetică ponderată;
2. să se calculeze indicele de grup al preţului ca medie armonică ponderată.

S-ar putea să vă placă și