Sunteți pe pagina 1din 425

CAPITOLUL 1

CAPITOLUL 1

NOŢIUNI INTRODUCTIVE ŞI CULEGEREA


DATELOR STATISTICE

Consideraţii preliminare
În acest capitol vom face primii paşi în înţelegerea statisticii ca
ştiinţă şi disciplină de studiu. Cele mai multe întrebări din domeniul
afacerilor, din domeniul economic ori social nu au răspunsuri simple; ele
necesită clarificare şi discuţii, fundamentări ale deciziilor. Vom vedea cum
statistica poate fi folositoare în luarea deciziilor, în acceptarea sau
respingerea unor soluţii posibile.
Statistica vine, astfel, să aducă un plus de rigoare ştiinţifică, să po-
tenţeze abilitatea de a lua decizii, să suplimenteze calităţile unui bun
manager: experienţă, intuiţie etc.
Pentru a înţelege statistica este, însă, mai întâi, nevoie să ne
familiarizăm cu limbajul statistic, să cunoaştem conceptele de bază, etapele
cercetării statistice şi rolul statisticii în procesul decizional.
În măsura în care am înţeles că statistica este ştiinţa culegerii şi
prelucrării, analizei datelor, este potrivit să continuăm cu studierea
diferitelor tipuri de date ce pot fi culese şi a celor mai des utilizate metode
de colectare a datelor statistice.

Termeni cheie
caracteristică (variabilă statistică) legea stabilităţii frecvenţelor
caracteristică nenumerică observări parţiale
caracteristică numerică observări totale
colectivitate generală parametru
colectivitate parţială (eşantion) scală de interval
control statistic scală de raport
date bivariate scală nominală
date continue scală ordinală

1
STATISTICĂ ECONOMICĂ

date discrete sondaj aleator simplu


date multivariate sondaj în cuiburi
date statistice sondaj nealeator
date univariate sondaj probabilist
eroare statistică sondaj stratificat
eşantion statistică descriptivă
estimator statistică inferenţială
fenomen de masă surse primare de date
indicator surse secundare de date
inferenţă statistică, unitate statistică
lege statistică

2
CAPITOLUL 1

Noţiuni teoretice

1.1. ARGUMENTE ÎN FAVOAREA CUNOAŞTERII STATISTICII

Printre motivele şi argumentele în favoarea cunoaşterii statisticii se


numără următoarele:
- factorii decizionali au nevoie să ştie cum să descrie şi să prezinte în
modul cel mai potrivit informaţiile;
- factorii decizionali au nevoie să ştie cum să obţină previziuni
credibile privind variabilele de interes;
- factorii decizionali au nevoie să ştie cum să îmbunătăţească
desfăşurarea activităţilor de care sunt răspunzători;
- factorii decizionali au nevoie să ştie cum să tragă concluzii despre
colectivităţi numeroase, doar pe baza informaţiilor obţinute din eşantioane.

1.2. SEMNIFICAŢII ALE CUVÂNTULUI „STATISTICĂ“

Cuvântul statistică are o semnificaţie multiplă pentru cercetători,


specialişti, studenţi şi populaţie în general. Astfel, acest cuvânt poate să
ducă cu gândul la indicele preţurilor de consum, la cifra medie de afaceri a
unor firme, la rata şomajului, la datele publicate într-o revistă sau într-un
buletin oficial, ori, evident, la o disciplină de studiu din cadrul
învăţământului superior de specialitate.
Statistica este, aşadar, o activitate practică, dar şi mulţimea datelor
obţinute prin această activitate, publicaţiile de date ale diferitelor organisme
de specialitate, metodologia statistică, o ramură a ştiinţei şi cunoaşterii, ori o
disciplină ştiinţifică şi de învăţământ.

1.3. DEZVOLTAREA STATISTICII MODERNE

Pentru a pune în evidenţă rolul statisticii ca instrument de cunoaştere


a particularităţilor de volum, structură şi dinamică a fenomenelor şi

3
STATISTICĂ ECONOMICĂ

proceselor economico-sociale, este necesar să subliniem că din punct de


vedere istoric, apariţia şi dezvoltarea statisticii moderne îşi are rădăcinile în
trei fenomene separate: nevoile guvernelor ţărilor de a calcula date privind
cetăţenii şi activităţile ţărilor, dezvoltarea teoriei probabilităţilor şi apariţia şi
extinderea utilizării calculatoarelor.
De-a lungul istoriei, datele au fost permanent colectate; în timpul
civilizaţiei egiptene, greci şi romane, datele erau obţinute în scopul primar al
taxării şi înrolării în armată. În Evul Mediu, instituţiile bisericii strângeau
adesea şi păstrau informaţii, înregistrări privind naşterile, decesele şi
căsătoriile. Necesitatea prelucrării datelor din ce în ce mai numeroase, a
ajutat într-un fel sau altul – la dezvoltarea maşinilor de calcul şi implicit, la
revoluţia calculatoarelor personale, la începutul secolului XX.
Aceste progrese au determinat schimbări profunde ale domeniului de
studiu al statisticii în ultimii 30 de ani.

1.4. OBIECT ŞI METODĂ ÎN STATISTICĂ

Obiectul de studiu al statisticii îl constituie fenomenele şi procesele


care prezintă următoarele particularităţi: se produc într-un număr mare de
cazuri (sunt fenomene de masă); variază de la un element la altul, de la un
caz la altul; sunt forme individuale de manifestare în timp, în spaţiu şi ca
formă organizatorică.
Urmărind etapele oricărui proces de cunoaştere, pentru rezolvarea
problemelor care fac obiectul său de studiu, statistica, ca orice ştiinţă, şi-a
elaborat procedee şi metode speciale de cercetare, cum sunt cele ale
observării de masă, ale centralizării şi grupării, procedee şi modele de
analiză şi interpretare statistică. Putem spune că metoda statisticii este
constituită din „totalitatea operaţiilor, tehnicilor, procedeelor şi metodelor de
investigare statistică a fenomenelor ce aparţin unor procese de tip
stochastic“.
Complexitatea şi amploarea cercetării statistice fac imperios
necesară perfecţionarea continuă a metodelor de observare, prelucrare,
analiză. În acelaşi timp, dezvoltarea metodelor statisticii este strâns legată de
progresele înregistrate de teoria probabilităţilor şi statistica matematică,
precum şi de cele din domeniul informaticii economice.

4
CAPITOLUL 1

DEFINIŢIE: Statistica este ştiinţa care studiază aspectele cantitative


ale determinărilor calitative ale fenomenelor de masă, fenomene care sunt
supuse acţiunii legilor statistice ce se manifestă în condiţii concrete,
variabile în timp şi spaţiu.

1.5. STATISTICA DESCRIPTIVĂ VERSUS STATISTICA INFERENŢIALĂ

Necesitatea culegerii datelor pentru cunoaşterea unor întregi naţiuni


a constituit practic, punctul de plecare în dezvoltarea statisticii descriptive.

DEFINIŢIE: Statistica descriptivă poate fi definită ca totalitatea


metodelor de culegere, prezentare şi caracterizare a unui set de date, în
scopul de a descrie diferitele trăsături principale ale acestui set de date.

DEFINIŢIE: Statistica inferenţială poate fi definită ca


totalitatea metodelor ce fac posibilă estimarea caracteristicilor unei populaţii
sau luarea unor decizii privind o populaţie, pe baza rezultatelor obţinute pe
un eşantion.

Pentru a clarifica distincţia între statistica descriptivă şi cea


inferenţială sunt necesare câteva precizări, definiţii şi explicaţii privind
unele noţiuni şi concepte de bază ale statisticii.

1.6. NOŢIUNI ŞI CONCEPTE DE BAZĂ FOLOSITE ÎN STATISTICĂ

O primă noţiune de bază din statistică o reprezintă populaţia


(colectivitatea) statistică.

DEFINIŢIE: Populaţia statistică, denumită şi colectivitate statistică,


reprezintă totalitatea elementelor de aceeaşi natură, care au trăsături
esenţiale comune şi care sunt supuse unui studiu statistic.

Termenul de populaţie nu se referă doar la un grup de persoane.


Deşi, iniţial, conceptul a fost utilizat în acest sens restrâns (la recensăminte),

5
STATISTICĂ ECONOMICĂ

astăzi înţelesul său este lărgit, prin populaţie putându-se înţelege o


colectivitate de obiecte, persoane, păreri, gânduri, evenimente, opinii etc.
Cu cât este mai numeroasă o colectivitate, cu atât devine mai dificilă
cercetarea tuturor elementelor ei. O astfel de cercetare poate fi
consumatoare de timp şi costisitoare. Soluţia poate să fie, atunci, să extra-
gem o subcolectivitate din colectivitatea generală (numită şi colectivitate
parţială, eşantion sau colectivitate de selecţie).

DEFINIŢIE: Eşantionul reprezintă un subset de elemente selectate


dintr-o colectivitate statistică.

În felul acesta, se vor estima parametrii colectivităţii totale pe baza


rezultatelor obţinute în colectivitatea de selecţie, iar ceea ce a fost deter-
minat ca fiind tipic, esenţial şi caracteristic în eşantion, se presupune că ar fi
fost găsit dacă s-ar fi cercetat colectivitatea generală. Soliditatea acestei pre-
supuneri depinde de modul cum a fost extras eşantionul, iar de acurateţea
acestui proces depinde succesul demersului statistic. Reprezentativitatea eşan-
tionului este, aşadar, aspectul crucial al oricărui proces de cercetare pe bază
de sondaj statistic.

DEFINIŢIE: Inferenţa statistică reprezintă o decizie, o estimaţie, o


predicţie sau o generalizare privitoare la o colectivitate generală, bazată pe
informaţiile statistice obţinute pe un eşantion.

Statistica abordează colectivităţi statice (care exprimă o stare, un


nivel, la un moment dat) şi colectivităţi dinamice (care caracterizează un
proces, o devenire în timp).

Un alt concept de bază al statisticii îl reprezintă unitatea statistică.

DEFINIŢIE: Unitatea statistică reprezintă elementul constitutiv al


unei colectivităţi statistice şi care este purtătorul unui nivel al fiecărei
trăsături supuse observării şi cercetării statistice.

Unităţile statistice pot fi simple sau complexe. Unităţile complexe


sunt rezultate ale organizării sociale ori economice a colectivităţii statistice
(exemplu: familia).

6
CAPITOLUL 1

DEFINIŢIE: Caracteristica statistică reprezintă trăsătura, proprie-


tatea, însuşirea comună tuturor unităţilor unei colectivităţi şi care variază ca
nivel, variantă sau valoare, de la o unitate a colectivităţii la alta. Este
denumită şi variabilă statistică ori variabilă aleatoare.

DEFINIŢIE: Varianta/valoarea reprezintă nivelul concret pe care îl


poate lua o variabilă la nivelul unei unităţi sau grup de unităţi statistice.

DEFINIŢIE: Frecvenţa de apariţie a unei variante/valori reprezintă


numărul de apariţii al acestei variante/valori în colectivitate.

DEFINIŢIE: Datele statistice reprezintă caracterizarea numerică obţi-


nută de statistică în legătură cu unităţile, grupele sau colectivitatea studiată.

Datele statistice sunt mărimi concrete, rezultate din studiile efectuate


prin numărare, măsurare sau calcul statistic. Ele pot fi primare, prelucrate,
publicate sau stocate în baze sau bănci de date. Mesajul datelor statistice
este informaţia statistică.

DEFINIŢIE: Indicatorul statistic reprezintă expresia numerică a unor


fenomene, procese, activităţi sau categorii economice şi sociale, definite în
timp, spaţiu şi structură organizatorică.

EXEMPLUL 1.1. Pentru a ne referi la toate aceste noţiuni într-un


exemplu, să presupunem că primarul unei localităţi este interesat în
cunoaşterea percepţiei locuitorilor privind nivelul de trai. Colectivitatea sau
populaţia statistică, în acest caz, poate fi alcătuită din totalitatea cetăţenilor
cu domiciliul în localitatea respectivă, în timp ce eşantionul este alcătuit din
acele persoane care sunt selectate să participe la anchetă. Scopul anchetei
este de a descrie diverse caracteristici ale colectivităţii generale (parametrii:
venitul mediu etc.). Acest scop poate fi atins folosind indicatorii statistici
(estimatorii) obţinuţi pe baza eşantionului de locuitori, pentru a estima
diferitele caracteristici ale populaţiei de interes. Observăm astfel că scopul
major al statisticii inferenţiale este de atrage concluzii asupra parametrilor
colectivităţii generale, folosind estimatorii calculaţi pentru eşantion.

7
STATISTICĂ ECONOMICĂ

1.7. ETAPELE CERCETĂRII STATISTICE

Procesul cunoaşterii statistice presupune organizarea şi parcurgerea


unor etape distincte şi succesive care includ operaţiile de observare sau
culegere a datelor, de sistematizare şi prelucrare, de analiză şi interpretare a
rezultatelor.
Etapele cercetării statistice sunt:
— observarea statistică — etapă în care se culeg date şi informaţii
statistice de la unităţile colectivităţii, pentru toate caracteristicile urmărite;
— prelucrarea statistică — etapă în care datele sunt sistematizate şi
sunt calculaţi indicatorii statistici primari şi derivaţi, absoluţi şi sintetici ce
caracterizează fenomenul studiat;
— analiza şi interpretarea rezultatelor — etapă în care sunt verificate
ipotezele, formulate concluziile şi fundamentate procesele decizionale.

1.8. TIPURI DE DATE ŞI SCALE DE MĂSURARE A DATELOR

O primă posibilitate de a lua în considerare complexitatea datelor


statistice este în funcţie de numărul de caracteristici (variabile) la care se
referă aceste date. Astfel, datele univariate sunt cele care se referă la o
singură variabilă statistică. Avem deci o singură informaţie pentru fiecare
unitate statistică.
Metodele statistice vor fi folosite pentru a rezuma, a analiza
caracterele şi trăsăturile esenţiale ale acestui set de date, răspunzând la
întrebări precum: care sunt valorile tipice ce caracterizează setul de date, cât
de variate sunt ele, există unităţi sau grupuri care necesită o atenţie specială
etc.
Datele bivariate sunt cele care se referă la două variabile statistice
şi avem, aşadar, exact câte două informaţii pentru fiecare unitate statistică
din colectivitate.
În plus, faţă de caracterizarea separată a datelor pentru fiecare
variabilă — ca în cazul datelor univariate — metodele statistice pot să fie
folosite şi pentru a studia legătura, dependenţa dintre cele două variabile
considerate.

8
CAPITOLUL 1

Datele multivariate sunt cele care se referă la trei sau mai multe va-
riabile statistice, obţinând deci câte trei sau mai multe informaţii pentru
fiecare unitate statistică din colectivitatea studiată. Deşi sunt multivariate,
datele pot fi analizate separat (pentru fiecare variabilă), sau în interdepen-
denţă unele cu altele.
Putem observa că există două tipuri de bază de variabile aleatoare
(caracteristici) care pot fi studiate ca oferind niveluri observate sau date
statistice: caracteristici nenumerice (calitative), care oferă răspunsuri
categoriale şi caracteristici numerice (cantitative), care oferă răspunsuri
sub formă de valori numerice.
Datele discrete sunt răspunsuri numerice care apar în urma unui
proces de numărare, în timp ce datele continue sunt răspunsuri numerice
care apar în urma unui proces de măsurare.
Aşadar. caracteristicile statistice se pot clasifica după mai multe
criterii, astfel:
a) în funcţie de modul de exprimare, în:
— caracteristici calitative (nominative), exprimate în cuvinte:
profesie, culoarea părului, localitatea de domiciliu etc.;
— caracteristici cantitative (numerice), exprimate în cifre: salariu,
înălţime, greutate, cifră de afaceri etc. Sunt caracteristici măsurabile.

b) în funcţie de numărul variantelor/valorilor de răspuns pe care le


pot lua, în:
— caracteristici alternative (binare sau dihotomice), acelea care pot
lua doar două variante de răspuns, după modelul adevărat/fals din logică:
sex (M/F), stagiul militar (efectuat/neefectuat), starea civilă (căsătorit/necă-
sătorit);
— caracteristici nealternative — cele care pot lua mai multe
valori/variante de răspuns: salariu, profesie, cifră de afaceri, localitate de
domiciliu etc.

c) în funcţie de natura variaţiei caracteristicilor numerice, în:


— caracteristici continue (cu variaţie continuă), cele care pot lua
orice valoare din scara lor de variaţie: greutatea unei persoane, cifra de
afaceri a unei firme etc.;
— caracteristici discrete sau discontinue, cele a căror variaţie se
manifestă prin salturi; ele nu pot lua decât anumite valori pe scara lor de
variaţie (de regulă numere întregi): numărul de copii pe care îi are o familie,
numărul de oraşe dintr-un judeţ etc.
9
STATISTICĂ ECONOMICĂ

d) în funcţie de conţinutul caracteristicii, în:


— caracteristici de timp (exemplu: anul naşterii, anul înfiinţării unei
firme);
— caracteristici de spaţiu (exemplu: localitatea de domiciliu);
— caracteristici atributive, în care variabila reprezintă un atribut,
altul decât spaţiul ori timpul.

e) în funcţie de modul de obţinere şi caracterizare a fenomenului:


— caracteristici primare (obţinute, de regulă, în etapa de culegere a
datelor statistice);
— caracteristici derivate, obţinute în procesul prelucrării variabilelor
primare.

Putem, de asemenea, studia tipul datelor statistice în concordanţă cu


nivelul sau scala de măsurare folosită. Într-un sens larg, toate datele
statistice colecate sunt “măsurate” sau transpuse pe o scală de măsurare,
într-o formă sau alta.

Patru niveluri de măsurare sunt utilizate – de la cea mai slabă la cea


mai puternică - scala nominală, ordinală, de interval şi de raport, iar
prelucrarea datelor statistice se va face în mod distinct, în funcţie de gradul
de “rafinament” al scalei.

Forma cea mai elementară este scala nominală (de clasificare sau
scala denumirilor), când numerele sunt atribuite observaţiilor pentru a face
doar judecăţi despre identităţi sau diferenţieri de categorie. Cu ajutorul
scalei nominale numerele repartizate unor observaţii servesc drept numele
lor. Numerele sunt atribuite fiecărei categorii doar pentru a identifica unităţi
similare din interiorul unei categorii şi pentru a diferenţia aceste unităţi
similare de elementele unei alte categorii diferite.
Se face, astfel, o diferenţiere de specie, dar nu şi de grad.

Următoarea scală este scala ordinală, pe care sunt măsurate


tot varibile de tip nenumeric (calitativ), dar care pot fi, de această dată,
ordonate. Unităţile pot fi înşiruite una reltiv cu celaltă şi se poate realiza
astfel, o ierarhizare, dar distanţa între numerele acordate nu este obligatoriu
egală. Numerele pe scala ordinală nu reprezintă intervale egale pe scala de
măsurare.
10
CAPITOLUL 1

În continuare putem distinge scala de intervale (sau cardinală)


practic prima scală cu adevărat numerică, ce foloseşte unităţi de măsurare
egale. Se face astfel posibilă nu numai interpretarea ordinii notărilor pe
scală, dar şi a diferenţelor dintre ele.
În plus faţă de scala nominală şi cea ordinală, intervalele între
categoriile de pe scală sunt presupuse a fi egale. O caracteristică a scalei de
interval este absenţa unui punct zero absolut.
Judecăţi comparative ca „de două ori mai mult“, „de patru ori mai
puţin“ etc. nu pot fi făcute pentru compararea valorilor specifice măsurate
pe o scală de interval. Ca atare, multiplicarea sau divizarea valorilor nu are
sens.

Pentru ca afirmaţiile comparative pe baza multiplicării ori divizării


să aibă sens, este necesară o scală proporţională (de raport), în care există
un punct zero fix şi absolut (cum este cazul scalei pe care se măsoară
greutatea ori a celei pentru lungime).

1.9. CULEGEREA DATELOR STATISTICE

1.9.1. Surse de date statistice

În scopul aplicării metodelor statistice de analiză a fenomenelor şi


proceselor social-economice este necesar să avem la dispoziţie date
statistice. Putem să obţinem aceste informaţii din datele deja publicate (de
instituţii specializate, de exemplu), sau putem să construim un experiment, o
anchetă, un sondaj. Deci, o clasificare a surselor de date statistice poate fi:
surse primare şi surse secundare de date.
Dacă datele statistice sunt obţinute direct prin organizarea unei
observări statistice (totale sau parţiale), atunci persoana sau instituţia care a
realizat o astfel de observare este o sursă primară de date statistice. Dacă
datele sunt prelucrate în tabele şi grafice, în scopuri publice sau private, ele
vor fi surse secundare de date.

Datele primare sunt obţinute prin observări totale, când


înregistrarea valorilor sau variantelor caracteristicilor urmărite se face
pentru toate unităţile statistice din colectivitatea generală (de exemplu,

11
STATISTICĂ ECONOMICĂ

recensământul populaţiei), sau prin observări parţiale, când se culeg date


de la o parte a colectivităţii generale (de exemplu, sondajul statistic).

1.9.2. Planul observării statistice

DEFINIŢIE: Observarea statistică reprezintă acţiunea de culegere de


la unităţile statistice a informaţiilor referitoare la caracteristicile urmărite,
după criterii riguros stabilite.

Observarea trebuie să îndeplinească anumite condiţii: de cantitate


(volum) şi calitate, astfel:
• satisfacerea condiţiei de cantitate presupune obţinerea în timpul
stabilit a tuturor datelor necesare pentru efectuarea studiului statistic;
• satisfacerea condiţiei de calitate presupune asigurarea conţinutului
veridic al datelor culese, în vederea obţinerii unor rezultate cât mai exacte,
afectate de erori cât mai mici.
Observarea se efectuează după un plan riguros, care trebuie să
cuprindă:
• scopul observării;
• delimitarea colectivităţii şi unităţii de observare;
• stabilirea caracteristicilor ce vor fi înregistrate;
• alegerea formularelor de înregistrare;
• delimitarea timpului şi locului observării;
• stabilirea măsurilor organizatorice.

1.9.3. Recensământul statistic

Recensământul este o metodă de observare totală, cu caracter


periodic care surprinde un fenomen în mod static. Este una din cele mai
vechi metode de observare, întâlnită încă din antichitate (recensăminte ale
populaţiei — la romani).
Recensământul asigură o fotografiere, o surprindere a unui fenomen
la un anumit moment de timp (moment critic).

DEFINIŢIE: În mod oficial, recensământul populaţiei este „un proces


de culegere, prelucrare şi publicare a datelor demografice, economice şi
sociale, la un timp specificat şi valabile pentru toate persoanele din ţara
respectivă sau de pe un teritoriu delimitat“.

12
CAPITOLUL 1

Recensământul populaţiei este reglementat de către stat, prin acte


legislative, şi respectă principiile universalităţii, simultaneităţii şi
comparabilităţii.
Din domeniul populaţiei, recensământul s-a extins şi asupra altor do-
menii: există recensământ al locuinţelor, al animalelor, al unităţilor din in-
dustrie, comerţ, transport, agricultură (într-un cuvânt, recensământ econo-
mic).

1.9.4. Culegerea datelor utilizând sondajul statistic

Sondajul sau selecţia statistică este o metodă parţială de observare


statistică, din ce în ce mai larg utilizată în cercetările statistice moderne.
Sondajul se foloseşte pentru a înlocui o observare totală, de mare amploare,
mai dificil de realizat, care presupune angajarea unor cheltuieli ridicate de
resurse materiale, financiare şi umane.

Există două categorii esenţiale de sondaj: sondaj aleator (probabilist)


şi sondaj nealeator. Pentru multe studii este posibilă doar realizarea unei
eşantionări nealeatoare (cum ar fi ancheta statistică - care oferă informaţii
orientative, eşantionarea pe cote, observarea părţii principale etc.). Însă, în
analiza statistică, singura cale pentru a putea folosi corect inferenţa
statistică, de la eşantion la colectivitatea generală, este să utilizăm un sondaj
probabilist.
Un eşantion probabilist este acela în care unităţile din eşantion au
fost alese pe baza unor probabilităţi cunoscute. Tipurile de eşantionări
probabiliste cel mai des utilizate sunt: eşantionarea aleatoare simplă,
eşantionarea stratificată şi eşantionarea în cuiburi (cluster).
În sondajul aleator simplu şansa de selecţie în eşantion a fiecărei
unităţi statistice din colectivitatea generală trebuie să fie egală. Acesta este
un sondaj cu un singur grad, în care unităţile sunt extrase din întreaga
populaţie, care constituie baza de sondaj. Pentru efectuarea unei selecţii
simple aleatoare corecte, este esenţial să eliminăm elementele preferenţiale
ale alegerii umane care ar putea duce la formarea „arbitrară“ a eşantionului.
Un eşantion simplu aleator este aşadar selectat astfel încât:
— fiecare unitate statistică are o probabilitate egală de a fi aleasă în
eşantion şi
— unităţile sunt alese independent, fără legătură una cu cealaltă.

13
STATISTICĂ ECONOMICĂ

Sondajele pot fi repetate sau nerepetate, după cum există


posibilitatea revenirii unei aceleaşi unităţi în cadrul aceluiaşi eşantion.
În prima situaţie, a sondajului repetat (cu revenire), fiecare unitate
statistică extrasă din colectivitatea generală este reintrodusă în baza de
sondaj, după ce a fost citită şi caracteristicile au fost înregistrate.
În varianta sondajului nerepetat (fără revenire), unităţile sunt
extrase din colectivitatea generală, iar după înregistrarea caracteristicilor lor,
ele nu mai sunt reintroduse în colectivitatea de bază; selecţia se face după
modelul urnei din care se fac extrageri succesive fără a pune bila extrasă
înapoi, iar o unitate nu poate să apară în şirul succesiv al probelor decât o
singură dată.

Extragerea întâmplătoare a unităţilor şi alcătuirea eşantioanelor


aleatoare se poate realiza prin unul din următoarele procedee de selecţie:

1. Procedeul urnei cu bile (procedeul loteriei), este un procedeu de


selecţie aleatoare care poate fi realizat în varianta cu revenire sau fără re-
venire. Se stabileşte un cadru de identificare, astfel încât fiecare unitate din
colectivitatea generală este numerotată de la 1 la N. Numerele sunt notate pe
cartonaşe, bileţele sau bile iar acestea sunt amestecate atent. Se extrage apoi,
la întâmplare, un cartonaş (bilă) iar numărul citit identifică unitatea ce este
considerată ca făcând parte din eşantion. Pentru această unitate se înregis-
trează toate caracteristicile ce fac parte din programul cercetării.
În continuare, în varianta cu revenire (sondaj repetat), cartonaşul
(bila) este reintrodus în urnă, se repetă amestecarea iar extragerea se repetă
până când se obţine eşantionul de volum n.

În varianta sondajului fără revenire (sondaj nerepetat), cartonaşul


(bila) nu este reintrodusă în urnă, ceea ce înseamnă că o unitate statistică, o
dată extrasă în eşantion nu mai are şanse să mai reintre în colectivitatea de
origine şi să fie extrasă din nou.

2. Procedeul tabelului cu numere întâmplătoare este o altă


modalitate utilizată pentru alegerea unui eşantion aleator printr-o selecţie
probabilistă. Utilizarea tabelelor cu numere aleatoare constă în prelevarea
din cadrul populaţiei a unităţilor ale căror numere de ordine stabilite printr-o
numărătoare prealabilă, au fost citite după un anumit criteriu din „tabelul
numerelor întâmplătoare“.

14
CAPITOLUL 1

Tabelul cu numere aleatoare este o listă de numere în care fiecare


cifră – de la 0 la 9 – apare cu o probabilitate de 1/10, independent una de
alta (vezi Anexa)

EXEMPLUL 1.2. Să alegem un eşantion aleator de n=9 unităţi, dintr-o


colectivitate de 38 unităţi, începând din rândul 15, coloana 3 din tabelul cu
numere aleatoare. Numerele citite din tabel vor fi:
7295; 2925; 1518; 2568; 4892; 8716; 7843; 1747; 3375; 8715; 1523; 1379.
Cum N=38 are 2 cifre, se rearanjează secvenţa citită în grupuri de
câte 2 cifre, astfel:
72; 95; 29; 25; 15; 18; 25; 68; 48; 92; 87; 16; 78; 43; 17; 47; 33; 75; 87; 15;
23; 13; 79.
Se elimină numerele mai mari de 38 şi vor rămâne următoarele
numere ce identifică unităţile care sunt selectate în eşantion:
29; 25; 15; 18; 25; 16; 17; 33; 15; 15; 23; 13.
Dacă selecţia este fără revenire se vor elimina numerele ce reapar în
listă şi vor rămâne atunci numerele:
29; 25; 15; 18; 16; 17; 33; 23; 13.

3. Procedeul mecanic de selecţie a eşantionului presupune


prelevarea unităţilor din colectivitatea generală după un interval
predeterminat, denumit frecvent pas de numărare aplicat bazei de sondaj.
Pasul de numărare se calculează ca N/n=k
Numărul iniţial de la care se începe citirea se alege aleator între 1 şi
k, după care se citeşte tot a k-a unitate până la completarea eşantionului de n
unităţi statistice.

Stratificarea constă în divizarea colectivităţii generale de studiat în


„straturi“, clase tipice cât mai omogene, cu caracteristici cât mai asemănă-
toare, astfel încât unităţile statistice din interiorul fiecărui strat să prezinte,
cel puţin din punct de vedere teoretic, caracteristici comune specifice fie-
cărei clase. Straturile pot fi constituite din regiuni, judeţe, localităţi, medii,
sexe, subdiviziuni economice, grupe de vârstă etc. Cel mai frecvent, stratifi-
carea se foloseşte în studiul populaţiei care se separă folosind clasificările
oficiale sau, în funcţie de scop, cercetătorul îşi va face propria sa grupare, ca
de exemplu, după profesie sau vechimea în producţie.
Uneori, unităţile colectivităţii generale se prezintă, ca urmare a orga-
nizării economico-sociale, sub forma unităţilor complexe (ex: persoanele
alcătuiesc familii etc). În asemenea cazuri, sondajul poate fi organizat astfel

15
STATISTICĂ ECONOMICĂ

încât sa se extragă spre studiu unităţi complexe, urmând ca toate unităţile


simple din cadrul unităţilor complexe extrase să se cerceteze fără nici o ex-
cepţie (sondaj în cuiburi).
Mai mult, nu întotdeauna se dispune, ca bază de sondaj, de o listă
completă a unităţilor statistice simple. Dar, se poate dispune de o listă a
grupurilor de unităţi. Fiecare din aceste grupuri, unităţi de ordin superior,
numite cuiburi, conţine unul sau mai multe unităţi statistice ce interesează
investigaţia statistică. Prin cuib (grappe în franceză, cluster în engleză) se
înţelege o grupare de unităţi statistice concentrate şi strict delimitate
În loc de a distinge în populaţie două niveluri: unităţile şi populaţia
în ansamblu, aici se consideră trei niveluri: unităţile statistice, cuiburile
(grupurile) şi populaţia în ansamblu. Un sondaj în cuiburi constă în
alegerea (întâmplătoare) a unui eşantion din aceste unităţi colective, sau
cuiburi, pentru ca apoi să se studieze toţi indivizii pe care îi conţine fiecare
din aceste cuiburi alese (fără excepţie).

În practică, într-o serie de cazuri, din diferite motive extracţia se face


nealeator sau pseudoaleator (ex: sondaj pe cote, sondaj multifazic etc). Un
asemenea procedeu de extracţie este eşantionarea concentrată, care constă
în includerea în eşantion numai a acelei părţi ce reprezintă majoritatea
cazurilor individuale. Această metodă se confundă cu observarea părţii
principale.

Sondajul multifazic este un tip de schemă în care unele informaţii


sunt colectate de la întregul eşantion, iar un alt grup de informaţii
(amănunte, informaţii mai puţin importante pentru scopul cercetarii sau
informaţii care vizează un studiu colateral) sunt strânse de la un subeşantion
al aceluiaşi eşantion.
În eşantionarea pe cote (spre deosebire de celelalte tipuri de scheme
de eşantionare caracterizate prin a fi aleatoare şi în care se garantează
fiecărei unităţi statistice şansa calculabilă de a fi inclusă in eşantion),
alegerea unităţilor statistice reale ce urmează a fi incluse este lăsată pe
seama operatorilor.

În sondajele pseudo-aleatoare trebuie să se dispună de o bază de


sondaj, după care se decide alegerea persoanelor (unităţilor statistice) ce se
afla într-o situaţie dată privind un criteriu care nu este aleator, dar care se
consideră a fi independent de fenomenul studiat.

16
CAPITOLUL 1

Metoda de sondaj pe bază de eşantioane fixe este destul de


utilizată în cadrul cercetării statistice. Ideea de bază a acestei metode este
aceea că se obţin informaţii repetate de pe acelaşi eşantion. Informaţiile care
se obţin se pot referi la aceleaşi unitaţi statistice sau la unităţi mai mult sau
mai puţin diferite. Informaţiile culese se pot referi la acelaşi subiect de
cercetat sau la subiecte conexe.

Ancheta de opinie face parte, ca şi sondajul statistic din rândul


metodelor parţiale de observare, fără ca eşantionul pe baza căruia se
realizează ancheta, să fie obligatoriu reprezentativ faţă de colectivitatea
generală. Ancheta de opinie are drept scop cunoaşterea părerilor persoanelor
asupra diferitelor probleme (se efectuează anchete sociologice, demografice,
psihosociale, de marketing). Este posibilă folosirea, deopotrivă, a sondajului
statistic, cât şi a anchetei statistice (exemplu: în studiul cererii de mărfuri a
populaţiei).

Panelul este, de asemenea, o metodă de observare parţială, bazată pe


un eşantion stabil (fix), format dintr-un număr de persoane de la care se
obţin date conform metodei longitudinale, prin chestionare la diferite
momente de timp.

Monografia statistică — face parte din categoria observărilor


parţiale, special organizate, având ca obiect cunoaşterea multilaterală şi în
profunzime a unei singure unităţi complexe. Are, de regulă, un caracter
multidisciplinar (exemplu: monografia unei întreprinderi, a unei localităţi,
sau judeţ).

1.10. ERORI STATISTICE ŞI CONTROLUL DATELOR STATISTICE

Datorită volumului foarte mare de date cu care operează statistica,


este firesc să apară, uneori, şi erori. De aceea, în urma culegerii datelor,
informaţiile obţinute sunt supuse unui proces de control şi corectare, în
scopul depistării şi eliminării, pe cât posibil, a erorilor statistice.

DEFINIŢIE: Prin eroare statistică înţelegem, în sens larg, diferenţa


dintre nivelul real al unui indicator şi cel rezultat din investigaţia statistică.

17
STATISTICĂ ECONOMICĂ

Erorile de observare (înregistrare) se întâlnesc în procesul de


culegere a datelor statistice şi se pot datora obiectului observării,
anchetatorului, mijloacelor de înregistrare, metodei de culegere a datelor sau
condiţiilor externe. Aceste erori pot fi de două feluri: întâmplătoare şi
sistematice. Erorile de observare pot fi înlăturate prin controlul statistic.

DEFINIŢIE: Controlul datelor statistice este o operaţie intermediară,


prin care se trece de la observarea de masă la prelucrarea datelor statistice.

Controlul datelor în etapa observării poate fi:


— cantitativ;
— calitativ

Controlul cantitativ este un control de volum al datelor, prin care


se verifică completitudinea acestora. Acest control presupune:
— verificarea primirii tuturor formularelor la centrul de prelucrare;
— verificarea completării rubricilor.

Controlul calitativ presupune verificarea naturii calitative a datelor


culese. Acesta poate fi:
— control aritmetic;
— control logic.

18
CAPITOLUL 1

Întrebări recapitulative

1. Care sunt semnificaţiile cuvântului statistică?


2. Care sunt principalele momente în dezvoltarea statisticii moderne?
3. Ce reprezintă statistica descriptivă? Dar statistica inferenţială?
4. Ce este statistica?
5. Care este obiectul de studiu al statisticii?
6. Care este principiul fundamental al statisticii?
7. Care sunt principalele concepte folosite în statistică?
8. Ce este colectivitatea statistică?
9. Ce reprezintă inferenţa statistică?
10. Ce este caracteristica statistică?
11. Principalele clasificări ale variabilelor statistice
12. Ce sunt datele statistice?
13. Care este diferenţa dintre variabilă statistică şi variantă statistică?
14. Cum se stabileşte frecvenţa de apariţie a unei variante?
15. Ce reprezintă parametrul statistic?
16. Ce reprezintă estimatorul statistic?
17. Care sunt principalele etape ale cercetării statistice?
18. Ce tipuri de date statistice cunoaşteţi? Exemplificaţi.
19. Ce semnificaţie are scala de măsurare?
20. Arătaţi principalele tipuri de scale de măsurare.
21. Când se utilizează scala nominală în măsurarea valorilor caracteristicilor
statistice?
22. Prezentaţi proprietăţile scalei ordinale.
23. Definiţi scala de interval şi scala de raport. Exemple de utilizare.
24. Ce reprezintă observarea statistică? În ce constă importanţa ei?
25. Care sunt elementele planului de observare?
26. Prezentaţi recensământul statistic.
27. Care sunt principalele procedee de eşantionare aleatoare?
28. Ce reprezintă stratificarea?
29. Cum se realizează un sondaj în cuiburi?
30. Care sunt principalele metode de sondaj nealeator?
31. Definiţi conceptul de eroare statistică.
32. Arătaţi principalele tipuri de erori statistice.
33. Cum se efectuează controlul datelor statistice?
34. Cum se realizează controlul automat al datelor statistice?

19
CAPITOLUL 1

Teste de autoevaluare

1. Deseori, locuitorii unui oraş preferă să achiziţioneze produse şi servicii


din afara ariei lor comerciale locale. Acest fenomen afectează îndeosebi
localităţile mici, întrucât dacă el ia amploare, poate influenţa negativ
prosperitatea localităţii. Pentru a reduce dimensiunea unui astfel de fenomen
şi a determina motivele care îi fac pe unii localnici să cumpere produse şi
servicii din afara localităţii lor, un grup de cercetători au făcut un studiu pe
200 de locuitori ai unei aşezări.
a) Identificaţi populaţia statistică, eşantionul şi unitatea statistică;
b) Identificaţi câteva caracteristici ce ar putea fi înregistrate. Arătaţi
tipul şi scala lor de măsurare.

2. O companie de produse cosmetice doreşte să lanseze un nou produs.


Pentru a testa impresiile consumatorilor, 100 de persoane alese aleator
primesc câte o mostră din acest produs şi, după ce-l testează, ele sunt rugate
să răspundă la întrebările din următorul formular:
a) Ce vârstă aveţi?
b) Care este ocupaţia dv.?
c) În ce clasă de venituri vă situaţi (sub 5 mil. lei, între 5-10 mil. lei, peste
10 mil. lei etc.)?
d) Ce calităţi apreciaţi la acest produs?
e) Ce notă aţi acorda (pe o scală de la 1 la 10) acestui produs?
f) Veţi cumpăra produsul dacă va fi disponibil în magazine?
Clasificaţi variabilele cuprinse în întrebări în cantitative sau calitative şi
arătaţi scala lor de măsurare.

3. Pentru următoarele exemple, arătaţi unitatea statistică, variabila statistică,


tipul variabilei şi scala ei de măsurare:
a) numărul de pagini a 300 de cărţi dintr-o bibliotecă;
b) profitul obţinut în anul 2001 de către 200 de agenţi economici;
c) temperatura la sol înregistrată în 30 de zile consecutive, la ora 6 a.m., la
staţia Filaret;
d) localitatea de naştere a 100 de salariaţi ai unei întreprinderi;
e) calificativele obţinute de 50 de studenţi la un test de psihologie.

4. Transformaţi următoarele variabile nealternative în variabile dihotomice,


completând în coloana 2 a tabelulul următor, variantele pe care le
consideraţi potrivite:
20
CAPITOLUL 1

Variabila Variante pentru variabila Variante pentru


nealternativă variabila alternativă
a) cifra de afaceri 100 mld. lei, 90 mld. lei, 150
mld. lei, 200 mld. lei, etc.
b) localitatea de naştere Iaşi, Braşov, Bucureşti,
Câmpulung, Bucureşti, etc.
c) temperatura apei 10º C, 12º C, 23º C, 21º C,
19º C, etc.

5. Arătaţi dacă următoarele exemple reprezintă o variabilă statistică sau o


constantă:
a) numărul de zile din luna august;
b) numărul acţiunilor tranzacţionate în 100 de zile diferite ale anului la
Bursa din New York;
c) vârsta studenţilor care au intrat la Academia de Studii Economice;
d) timpul necesar unor persoane pentru a completa un formular;
e) vârsta la care o persoană poate vota pentru prima dată;
f) punctajul obţinut de 100 de participanţi la un concurs de cultură
generală;
g) punctajul maxim posibil a fi obţinut la un test de economie;
h) sumele cheltuite anual de către 100 de studenţi pe cărţi de specialitate.

6. Directorul unui liceu doreşte să studieze în ce măsură elevii claselor a


XII-a cunosc limba engleză. În acest scop, sunt selectaţi aleator 100 de
elevi, care sunt supuşi unui test.
I. Elevii selectaţi pentru acest studiu reprezintă:
a) populaţia; b) statistica; c) parametrul; d) eşantionul.
II. În acest studiu, gradul în care elevii cunosc limba engleză, determinat
prin testul acordat, reprezintă:
a) statistica; b) variabila; c) parametrul; d) eşantionul.
III. Punctajele obţinute de elevi la test constituie:
a) date; b) eşantionul; c) statistici; d) populaţia.
IV. Punctajul mediu obţinut la test de către elevii din eşantion reprezintă:
a) parametrul; b) statistica; c) variabila; d) date.
V. Când generalizăm aceste rezultate, spunem că facem o inferenţă la
nivelul:
a) datelor; b) variabilelor; c) statisticilor; d) populaţiei.

21
CAPITOLUL 1

VI. Punctajul mediu obţinut de către toţi elevii din clasele a XII-a ale
liceului, reprezintă:
a) parametrul; b) variabila; c) date; d) populaţia.

7. Comentatorii de fotbal folosesc adesea, în relatările lor din timpul


meciurilor, expresii ca: "Numărul de şuturi pe poartă", "Numărul de
cornere", "Numărul loviturilor libere", etc., pe care ei le includ în aşa-zisele
"Statistici ale meciului". Sunt aceste numere, într-adevăr, statistici? Şi dacă
nu, ce reprezintă ele?

8. Dintr-o colectivitate de N = 50.000 de persoane – baza de sondaj, să se


selecteze aleator, pe baza tabelului cu numere aleatoare, un eşantion de n =
200 de unităţi, exemplificându-se pentru 20 de unităţ procedeul.

9. Pentru următoarele cazuri, precizaţi unitatea statistică, identificaţi varia-


bila statistică studiată şi tipul de variabilă. Precizaţi dacă variabila este
cantitativă sau calitativă, dacă ea este continuă sau discontinuă:
a) Timpii de execuţie, în secunde, a 400 de programe BASIC;
b) Absenteismul angajaţilor (zile);
c) Profesiile a 200 de salariaţi;
d) Numărul personalului din 1000 de întreprinderi;
e) Numărul copiilor din 2000 de familii.

10. Clasificaţi următoarele exemple de date statistice în numerice (canti-


tative) şi nenumerice (calitative). Arătaţi scala de măsurare:
a) rata lunară a şomajului în judeţul A, în anul 2000;
b) cifra de afaceri realizată de firmele unui oraş, în primul trimestru al
anului 2001;
c) afilierea la un partid politic a 50 de directori executivi selectaţi
întâmplător, fiecare dintre aceştia putând avea o singură afiliere la un partid
politic;
d) cursul valutar zilnic oficial al leului în raport cu U.S.D;
e) tipul de ulei de motor cumpărat cel mai recent de 75 de posesori de
automobile selectaţi întâmplător, fiecare posesor putând preciza un singur
tip;
f) numărul persoanelor de sex feminin care îndeplinesc funcţia de director
economic pe judeţe;
g) salariul mediu pe ramuri ale economiei naţionale, martie 2001;

22
CAPITOLUL 1

h) judeţele în care cinci cotidiene au realizat cele mai multe abonamente în


anul 2000;
i) numărul de ore de program sportiv transmise de 15 televiziuni prin cablu;
j) procentul mediu dintr-o zi de lucru, consumat în şedinţe de către 50 de
directori;
k) marca de calculator cumpărat cel mai de recent de 20 de persoane;
l) preţul calculatorului cumpărat cel mai de recent de 20 de oameni de
afaceri;
m) luna din anul 2000 în care 50 de agenţi economici selectaţi întâmplător
au realizat cele mai mari vânzări;
n) culoarea de tapet (alta decât albă) la care 5 dintre cei mai importanţi
importatori de tapete au realizat cele mai mari venituri din vânzări, pentru
firmă;
o) indicele preţurilor de consum în ultimele 6 luni;
p) cheltuielile cu reclama făcute de 50 de firme selectate aleator;
q) tipul de reclamă publicitară preferată de 50 de firme selectate aleator;
r) marca de automobile americane pe care o indică 25 de mecanici auto ca
producând cele mai credibile maşini;

11. Presupuneţi că lucraţi pentru o firmă de sondare a opiniei publice şi


doriţi să estimaţi proporţia cetăţenilor care, în eventualitatea organizării de
alegeri astăzi, ar vota cu partidul de guvernământ. Definiţi populaţia statis-
tică pe care o eşantionaţi. Dar dacă v-ar interesa să estimaţi proporţia
cetăţenilor care, la viitoarele alegeri, ar vota cu partidul de guvernământ,
care ar fi populaţia eşantionată?

12. O companie de asigurări doreşte să determine proporţia medicilor care


au fost implicaţi în ultimul an în una sau mai multe acţiuni judiciare de rele
practici. Compania selectează întâmplător 500 de medici care au practicat în
ultimul an şi determină proporţia. Identificaţi populaţia de interes, eşan-
tionul şi inferenţa statistică dorită.

13. O companie de produse alimentare doreşte să comercializeze un nou


produs de snack-food. Pentru a vedea cum reacţionează cumpărătorii la
acest produs, compania organizează o testare a gusturilor pentru 100 de
cumpărători selectaţi întâmplător la un magazin suburban. Cumpărătorii
sunt rugaţi să guste produsul şi apoi să completeze un chestionar cu
următoarele întrebări:
a) Care este vârsta dumneavoastră?

23
CAPITOLUL 1

b) Sunteţi persoana care face de obicei cumpărături pentru familia dv.?


c) Câte persoane sunt în familia dv.?
d) Cum notaţi, pe o scală de la 1 la 10, gustul produsului, dacă 1 este cel mai
puţin gustos?
e) Veţi cumpăra acest produs dacă va fi disponibil în magazine?
f) Dacă răspunsul la e) este “Da”, cât de des veţi cumpăra produsul?
Clasificaţi datele oferite de răspunsuri în cantitative şi calitative şi indicaţi
scala de măsurare pentru fiecare dintre ele.

14. Un cercetător este interesat să compare salariul de încadrare pentru


bărbaţii şi femeile care intră în serviciu imediat după absolvirea facultăţii.
Sunt cercetaţi 100 de bărbaţi şi 100 de femei.
a) Descrieţi populaţia;
b) Descrieţi eşantionul;
c) Descrieţi inferenţa care interesează.

15. Despre scala de interval, ca scală de măsurare a datelor statistice, se


poate afirma că:
a) este prima scală propriu-zis numerică;
b) punctul „zero“ absolut al scalei indică absenţa caracteristicii;
c) mai este denumită şi „scala proporţională“;
d) originea şi unitatea de măsură folosită sunt arbitrare;
e) permite interpretarea ordinii notărilor, cât şi a diferenţelor dintre ele.

16. Ordinea în care sosesc alergătorii dintr-o cursă reprezintă o variabilă


statistică ale cărei valori pot fi măsurate pe o scală:
a) nominală;
b) proporţională;
c) de interval;
d) ordinală;
e) cardinală.

17. Temperatura la sol măsurată în 10 zile consecutive în Bucureşti, ca


variabilă statistică, are valori ce pot fi măsurate pe o scală:
a) de raport;
b) de interval;
c) ordinală;
d) cardinală;
e) pe nici una dintre scalele menţionate.

24
CAPITOLUL 1

18. Salariul net pentru 50 de angajaţi ai unei firme se poate măsura pe o


scală:
a) proporţională;
b) ordinală;
c) cardinală;
d) de raport;
e) nominală.

19. Se efectuează următoarele notaţii:


I. stabilirea scopului observării;
II. culegerea datelor statistice;
III. controlul calităţii datelor culese şi remedierea erorilor;
IV. delimitarea colectivităţii şi a unităţii de observare;
V. stabilirea măsurilor organizatorice;
VI. delimitarea timpului şi locului observării;
VII. stabilirea caracteristicilor ce vor fi înregistrate;
VIII. alegerea formularelor de înregistrare.
Planul după care se desfăşoară observarea statistică cuprinde în mod necesar
elementele:
a) I, II, III, IV, V, VI;
b) I, IV, VII, VIII, VI, V;
c) I, II, V, VI, VII, VIII;
d) I, II, III, VI, VII;
e) nici una dintre variantele indicate.

20. Fişa este un formular de înregistrare a datelor statistice despre care se


poate afirma că:
a) se completează pentru o singură unitate de observare;
b) se completează pentru mai multe unităţi de observare;
c) se foloseşte atunci când programul observării cuprinde mai multe
caracteristici;
d) se foloseşte atunci când programul observării cuprinde puţine carac-
teristici;
e) se foloseşte atunci când unităţile de observare sunt dispersate în plan
teritorial;

21. Erorile de înregistrare sistematice sunt acelea care:


a) se produc în urma unor accidente;
b) determină, de regulă, abateri în ambele în ambele sensuri faţă de valorile
reale ale fenomenului;
c) determină, de regulă, abateri într-un singur sens faţă de valorile reale;

25
CAPITOLUL 1

d) pot apărea datorită neînţelegerii şi neaplicării corecte a instrucţiunilor


datorită comodităţii sau relei-credinţe;
e) nu pot fi înlăturate prin control statistic.

22. Controlul cantitativ al datelor în etapa de observare statistică presupune:


a) efectuarea, prin sondaj, a unor calcule între diferiţi indicatori înscrişi în
formulare;
b) verificarea primirii tuturor formularelor la Centrul de prelucrare;
c) verificarea şi interpretarea relaţiilor dintre diferiţi indicatori;
d) verificarea completării tuturor rubricilor;
e) el se mai numeşte şi control de volum al datelor.

23. Selecţia statistică:


a) este o metodă de observare totală;
b) este asemănătoare cu ancheta de opinie, cu deosebirea că eşantionul de la
care s-au cules datele trebuie să fie reprezentativ;
c) este o metodă asemănătoare cu ancheta statistică, cu deosebirea că
selecţia statistică nu presupune obligativitatea completării chestionarelor;
d) este o metodă asemănătoare cu ancheta statistică, cu deosebirea că
eşantionul nu trebuie să îndeplinească în mod obligatoriu condiţia de
reprezentativitate;
e) este o metodă de observare parţială prin care se caracterizează aprofundat
o singură unitate statistică.

26
CAPITOLUL 1

Răspunsurile testelor de autoevaluare


1.
a) Populaţia statistică: totalitatea cumpărătorilor din localitatea studiată;
Eşantionul: cei 200 de cumpărători;
Unitatea statistică: cumpărătorul;
b) Caracteristici statistice:
− vârsta cumpărătorilor (numerică, continuă, scală de raport);
− sexul cumpărătorilor (nenumerică, scală nominală);
− ocupaţia cumpărătorilor (nenumerică, scală nominală);
− venitul cumpărătorilor (numerică, continuă, scală de raport);
− tipul produselor preferate a fi achiziţionate din afara localităţii
(nenumerică, scală nominală);
− frecvenţa cu care cumpărătorii achiziţionează produse şi servicii din
afara localităţii:
• nenumerică, scală ordinală (dacă variantele de răspuns sunt:
niciodată, foarte rar, rar, des, foarte des etc.);
• numerică, discontinuă, scală de interval (dacă variantele sunt: o
dată, de două ori etc.)

2.
a) cantitativă, scală de raport;
b) calitativă, scală nominală;
c) cantitativă, scală de raport;
d) calitativă, scală nominală;
e) cantitativă, scală de interval;
f) calitativă, scală nominală.

3.
Întrebarea Unitatea statistică Variabila Tipul variabilei Scala de măsurare
statistică
a) cartea numărul de cantitativă, de raport
pagini discontinuă
b) agentul economic profitul cantitativă, de raport
continuă
c) ziua temperatura cantitativă, de interval
continuă
d) salariatul localitatea calitativă nominală
de naştere
e) studentul calificativul calitativă ordinală

27
CAPITOLUL 1

4.
a) pentru variabila "cifra de afaceri": sub 150 mld. lei / 150 şi peste 150
mld. lei;
b) pentru variabila "localitatea de naştere": Bucureşti / Provincie;
c) pentru variabila "temperatura apei": sub 20º C / 20º C şi peste 20º C.

5.
a) constantă; e) constantă;
b) variabilă; f) variabilă;
c) variabilă; g) constantă;
d) variabilă; h) variabilă.

6.
I. d); IV. b);
II. b); V. d);
III. a); VI. a).

7.
Aceste numere nu reprezintă statistici, ci date. Pe baza acestor date se pot
calcula statistici (de exemplu: ponderea cornerelor executate de fiecare
echipă, ponderea timpului cât s-a aflat în posesia mingii fiecare echipă etc.).

8.
Tuturor persoanelor din colectivitatea totală li se acordă numere de ordine
de la 1 la 50.000. Selectăm poziţia din tabelul cu numere aleatoare de la care
se va efectua citirea numerelor. Să presupunem că începem citirea de la
rândul 33 coloana 3. Numerele citite din tabel, de la stânga la dreapta pe
linie, plecând de la poziţia aleasă, sunt:

1673; 8043; 4464; 1914; 5222; 8162; 7968; 1337; 9055;


2793; 3306; 7642; 1608; 1681; 8615; 0979; 3086; 7477;
6865; 0579; 8257; 7822; 3741; 8244; 0743; 9889; 7823;
9604; 5184; 3498; 0338; 8712; 7988; 5788; 4681; 6256;
9491; 0659; 8523; 9201; 8405; 8364; 1295; 5144; 6064;
6886; 5305; 2616; 3195.

Cum N = 50.000 are 5 cifre, se rearanjează secvenţele de cifre


menţionate mai sus în grupuri de câte 5 cifre:

28
CAPITOLUL 1

16.738; 04.344; 64.191; 45.222; 81.627;


96.813; 37.905; 52.793; 33.067; 64.216;
08.168; 18.615; 09.793; 08.674; 77.686;
50.579; 82.577; 82.237; 41.824; 40.743;
98.897; 82.396; 04.518; 43.498; 03.388;
71.279; 88.578; 84.681; 62.569; 49.106;
59.852; 39.201; 84.058; 36.412; 95.514;
46.064; 68.865; 30.526; 16.319.

Din aceste numere, se elimină numerele mai mari de 50.000 şi vor


rămâne următoarele numere, care corespund numerelor de odine ale
persoanelor ce vor fi incluse în eşantion:

16.738; 04.344; 45.222; 37.905; 33.067;


08.168; 18.615; 09.793; 08.674; 41.824;
40.743; 04.518; 43.498; 03.388; 49.106;
39.201; 36.412; 46.064; 30.526; 16.319.

9.
a) unitatea statistică: programul BASIC;
variabila statistică: timpul de execuţie – cantitativă, continuă.
b) unitatea statistică: angajatul;
variabila statistică: numărul de zile absentate – numerică, discretă.
c) unitatea statistică: salariatul;
variabila statistică: profesia – calitativă.
d) unitatea statistică: întreprinderea;
variabila statistică: numărul de personal – cantitativă, discretă.
e) unitatea statistică: familia;
variabila statistică: numărul de copii – cantitativă, discretă.

10.
a) cantitativă, scală de raport;
b) cantitativă, scală de raport;
c) calitativă, scală nominală;
d) cantitativă, scală de raport;
e) calitativă, scală nominală;
f) cantitativă, scală de raport;
g) cantitativă, scală de raport;
h) calitativă, scală nominală;

29
CAPITOLUL 1

i) cantitativă, scală de raport;


j) cantitativă, scală de raport;
k) calitativă, scală nominală;
l) cantitativă, scală de raport;
m) calitativă, scală ordinală;
n) calitativă, scală nominală (eventual ordinală, dacă se introduce criteriul
intensităţii culorii);
o) cantitativă, scală de raport;
p) cantitativă, scală de raport;
q) calitativă, scală nominală;
r) calitativă, scală nominală.

11.
• în primul caz: populaţia cu drept de vot astăzi;
• în al doilea caz: populaţia cu drept de vot astăzi, precum şi cei care vor
avea drept de vot la viitoarele alegeri, dar care nu au astăzi.

12.
populaţia – medicii care au practicat în ultimul an; eşantionul – cei 500 de
medici care au practicat în ultimul an, selectaţi; inferenţa: proporţia celor
implicaţi în acţiuni judiciare de rele practici.

13.
a) cantitativă – scală de raport;
b) calitativă – scală nominală;
c) cantitativă – scală de raport;
d) calitativă – scală ordinală;
e) calitativă – scală nominală;
f) calitativă – scală ordinală (dacă răspunsul este de tipul: rar, des, foarte des
etc.)

14.
a) două populaţii - cea a femeilor care s-au încadrat pe un post imediat după
absolvirea facultăţii şi cea a bărbaţilor care s-au încadrat imediat după
absolvirea facultăţii;
b) eşantioanele – cei 100 de bărbaţi şi cele 100 de femei;
c) inferenţele – salariile medii de încadrare pentru bărbaţi şi pentru femei.

30
CAPITOLUL 1

15. a), e)

16. d)

17. b), d)

18. a), d)

19. b).

20. a), d), e).

21. c), d).

22. b), d), e).

23. b).

31
CAPITOLUL 1

Teste de autoevaluare propuse spre rezolvare


1. Legăturile dintre fenomenele economico-sociale de masă sunt:
a) legături funcţionale;
b) legături care se supun acţiunilor legilor stochastice;
c) legături ce pot fi puse în evidenţă la nivelul fiecărei unităţi în parte;
d) legături univoc determinate;
e) legături ce pot fi puse în evidenţă la nivelul ansamblului.

2. Recensământul, ca metodă de observare statistică:


a) nu presupune culegerea datelor de la toate unităţile populaţiei statistice
bine determinate;
b) are exclusiv un caracter demografic;
c) se încadrează în sfera observărilor cu caracter permanent;
d) se organizează cu o anumită periodicitate;
e) este o observare totală.

3. Care sunt avantajele cunoaşterii statisticii?


a) Răspundeţi din punctul de vedere al unui economist, în general;
b) Răspundeţi din punctul de vedere al unui factor decizional;
c) Răspundeţi pentru un domeniu de afaceri particular care prezintă un
interes special pentru dumneavoastră.

4. Alegeţi o firmă şi enumeraţi căile prin care analiza statistică poate fi


folosită în activităţile de luare a deciziilor, în interiorul firmei.

5. Explicaţi modul în care interacţionează analiza statistică şi experienţa în


afaceri?

6. Estimaţiile statistice sunt întotdeauna corecte? Dacă nu, de ce alte


informaţii mai aveţi nevoie (pe lângă valorile estimate) în scopul de a utiliza
efectiv estimaţiile?

7. Un consultant de specialitate tocmai v-a prezentat o analiză statistică


foarte complicată, însoţită de o serie de ecuaţii şi simboluri matematice.
Rezultatele acestei impresionante analize vin împotriva intuiţiei şi experi-
enţei dumneavoastră. Explicaţi şi argumentaţi reacţia dumneavoastră.

32
CAPITOLUL 1

8. De ce este important să identificăm colectivitatea, tipul şi sursa datelor,


atunci când evaluăm rezultatele unui studiu statistic?

9. Numiţi trei indicatori de care o firmă poate să fie interesată şi pentru care
nu sunt disponibile valori exacte. Pentru fiecare indicator, explicaţi cum
poate fi utilă estimaţia.

10. Descrieţi două tipuri de decizii pe care le puteţi lua în afaceri şi în care
analiza statistică vă poate fie utilă.

11. Citiţi un număr recent al Ziarului Financiar. Identificaţi un articol care se


bazează, direct sau indirect, pe statistici. Descrieţi şi analizaţi pe scurt arti-
colul şi ataşaţi o copie. Care dintre etapele cercetării statistice este reprezen-
tată aici?

12. Explicaţi care dintre etapele cercetării statistice se regăsesc în urmă-


toarele situaţii:
a) Departamentul de control al calităţii dintr-o uzină examinează detaliat
informaţiile cantitative privitoare la producţia şi productivitatea ultimelor 6
luni, în scopul de a identifica posibile deficienţe;
b) Un grup de specialişti elaborează un chestionar pentru un sondaj de
opinie privind efectul reclamelor asupra vânzărilor realizate de o firmă;
c) Un analist estimează, pe baza datelor disponibile, vânzările firmei pentru
trimestrul următor.

13. Găsiţi rezultatele unui sondaj de opinie, publicate într-un ziar sau într-o
revistă. Explicaţi cum au fost aplicate etapele cercetării statistice, pentru a
cunoaşte părerea oamenilor privind problema studiată.

14. În ce sens datele bivariate reprezintă mai mult decât exact două seturi
separate de date univariate?

15. Alegeţi o firmă şi precizaţi trei caracteristici (variabile) care ar putea fi


importante pentru firmă. Pentru fiecare variabilă, indicaţi dacă este calitativă
sau cantitativă, discretă sau continuă.

16. Găsiţi un tabel de date statistice prezentat într-un articol dintr-un ziar sau
dintr-o revistă.

33
CAPITOLUL 1

a) Clasificaţi setul de date în raport cu numărul variabilelor la care se referă


datele;
b) Care este colectivitatea statistică? Dar unitatea statistică?
c) Datele sunt statice sau dinamice?
d) Clasificaţi fiecare variabilă în raport cu tipul acesteia;
e) Precizaţi scala de măsurare pentru fiecare variabilă.

17. Următorul tabel reprezintă date referitoare la statutul profesional a cinci


angajaţi ai unei firme, extrase din baza de date pentru resurse umane, la 8.
07. 2000:

Sex Salariu brut (lei) Profesie Vechime (ani)


M 6.320.000 economist 20
F 5.800.000 inginer 18
F 3.700.000 tehnician 4
M 4.200.000 economist 8
M 5.400.000 inginer 15

a) Care este unitatea statistică?


b) Datele prezentate sunt univariate sau multivariate?
c) Care dintre aceste variabile sunt cantitative? Dar calitative?
d) Există o variabilă calitativă ordinală? Justificaţi răspunsul;
e) Datele sunt statice sau dinamice? Justificaţi răspunsul.

18. Următoarele date reprezintă vânzările (mil. lei) şi profitul (mil. lei),
realizate de o firmă în primele 6 luni ale anului 2001:
Vânzări Profit (Pierderi)
1005 9
81 7
42 (6)
84 5
123 16
117 14

a) Care este unitatea statistică pentru acest set de date?


b) Datele sunt univariate, bivariate sau multivariate? Justificaţi.
c) Datele sunt cantitative sau calitative?
d) Pe ce scală sunt măsurate variabilele prezentate?
e) Datele sunt statice sau dinamice? Justificaţi.

34
CAPITOLUL 1

19. Presupunem că aţi luat cina într-un restaurant în care aţi intrat pentru
prima dată. Consideraţi mâncarea prost preparată şi serviciul inadecvat.
Decideţi să nu reveniţi niciodată în acest restaurant. Care este colectivitatea
şi eşantionul? Care este inferenţa pe care o faceţi? Cât de credibilă este
această inferenţă? Ce variabile aţi luat în considerare?

20. Monografia statistică


a) este o metodă de observare totală;
b) este o metodă de observare parţială;
c) are ca obiect cunoaşterea aprofundată sub multiple aspecte a unei singure
unităţi complexe;
d) are caracter periodic, surprinzând un fenomen în mod static;
e) presupune culegerea datelor de la un eşantion care trebuie să
îndeplinească condiţia de reprezentativitate.

35
CAPITOLUL 2

CAPITOLUL 2

SISTEMATIZAREA ŞI PREZENTAREA
DATELOR STATISTICE

Consideraţii preliminare
În acest capitol, vom lua în consideraţie primul pas în prelucrarea
datelor, cel al sistematizării, prezentării şi reprezentării datelor, într-o
manieră în care să le facă mai uşor de analizat şi interpretat. Vom avea,
astfel, beneficii importante pe linia descoperirii caracterelor esenţiale ale
fenomenelor studiate şi “perierii” lor de aspectele întâmplătoare.

Termeni cheie

cartodiagramă frecvenţă redusă


cartogramă frecvenţă relativă
clasificare funcţie de repartiţie
corelogramă grafic statistic
cronogramă grupare
curbă cumulativă a frecvenţelor histogramă
diagramă de structură poligon al frecvenţelor
diagramă prin coloane serie cronologică
distribuţie de probabilitate serie de distribuţie de frecvenţe
distribuţie heterogradă serie statistică
distribuţie homogradă serie teritorială
distribuţie teoretică sistematizare
frecvenţă absolută tabel statistic
frecvenţă cumulată

36
STATISTICĂ ECONOMICĂ

Noţiuni teoretice

2.1. INTRODUCERE

După ce datele statistice au fost colectate din surse de date publicate,


din observări totale sau din observări parţiale – ele trebuie organizate, în
scopul de a avea o formă care să permită prelucrarea lor statistică diversă.
Cum observarea parţială – în mod special eşantionarea probabilistă –
salvează timp, resurse de muncă şi resurse băneşti, vom trata îndeosebi
problema sistematizării datelor provenite din eşantioane. Cu toate acestea,
trebuie să înţelegem că, indiferent dacă lucrăm cu date referitoare la
colectivităţi parţiale ori la colectivităţi totale, atunci când seturile de date
conţin în jur de 30 de observaţii sau peste acest număr (date de masă), cel
mai bun mod de a le examina este să le sistematizăm şi apoi să le prezentăm
în tabele şi grafice. Putem atunci, să extragem cele mai importante trăsături,
prin analiza seriilor şi graficelor statistice.

2.2. GRUPAREA ŞI CLASIFICAREA DATELOR STATISTICE

După cum am văzut, în etapa de observare statistică se culeg date


uni, bi sau multivariate, adică pentru fiecare unitate statistică se culeg date
privitoare la o singură caracteristică sau la mai multe caracteristici
considerate.

2.2.1. Principiile grupării/clasificării

Sistematizarea datelor se realizează prin gruparea şi clasificarea


datelor statistice, adică prin împărţirea lor în grupe/clase omogene, după
unul sau mai multe criterii de grupare/clasificare.
O grupă/clasă este omogenă dacă unităţile din interiorul ei tind să se
asemene cât mai mult între ele din punctul de vedere al criteriului utilizat,
adică dacă între unităţile din aceeaşi grupă/clasă există variaţii cât mai mici,
date de prezenţa factorilor aleatori, întâmplători.

37
CAPITOLUL 2

Criteriul de grupare/clasificare reprezintă variabila (caracteristica)


statistică în funcţie de care sistematizăm datele. După cum avem de-a face
cu un singur criteriu sau mai multe criterii de grupare/clasificare, vom vorbi
de grupări/clasificări simple sau combinate.

Dacă sistematizarea datelor se face după o variabilă nenumerică,


procesul se numeşte clasificare.

Gruparea reprezintă sistematizarea datelor după o variabilă


(caracteristică) numerică. În funcţie de tipul acesteia, gruparea se poate face
după o variabilă discretă sau continuă.

2.2.2. Gruparea pe intervale de variaţie

Intervalul de variaţie reprezintă un şir de valori ale variabilei


studiate, delimitat de intervalele vecine prin limita inferioară şi limita
superioară. Intervalele de variaţie pot fi de mărime egală sau neegală.

• Pentru gruparea pe intervale de variaţie se recomandă utilizarea


unui număr moderat de grupe. Deseori, un număr de 4 până la 10 grupe
este arbitrar recomandat, dar felul datelor poate necesita un alt număr de
grupe.
Pentru alegerea numărului de intervale de grupare (r) se poate utiliza
şi relaţia lui Sturges (în ipoteza repartiţiei aproximativ normale a unităţilor
după variabila studiată):
r = 1 + 3,322 log10 n (2.1.)
unde n reprezintă numărul total de unităţi din colectivitate (volumul colec-
tivităţii).
• Pentru sistematizarea datelor pe intervale de variaţie se recomandă
utilizarea intervalelor de mărime egală, cu excepţia cazurilor în care
analiza datelor, descoperirea unor tipuri calitative în colectivitate, necesită
folosirea unor intervale de mărime neegală.
• Mărimea intervalului (h) se recomandă a se rotunji la o valoare
convenabilă.
• Punctul de plecare în alcătuirea intervalelor de grupare se alege,
convenabil, 0 sau un număr întreg puţin mai mic decât valoarea minimă din
setul de date.

38
STATISTICĂ ECONOMICĂ

• Limitele intervalelor de grupare trebuie stabilite cu acurateţe,


respectând precizia datelor (cu acelaşi număr de zecimale, dacă valorile sunt
de această manieră).
• Limitele intervalelor de grupare se stabilesc exact, fără
ambiguităţi sau suprapunere, astfel încât fiecare unitate să poată fi
încadrată într-o singură clasă.

Aşadar, pentru sistematizarea datelor pe intervale egale de grupare se


prezintă următorii paşi:
1. Se stabileşte amplitudinea variaţiei caracteristicii:
A x = x max − x min (2.2.)
2. Se stabileşte numărul de grupe, r, în care vor fi sistematizate
datele
3. Se calculează mărimea aproximativă a intervalelor de grupare:
A x − x min
h ≈ = max (2.3.)
r r
4. Se stabilesc intervalele de grupare pornind de la xmin (sau de la o
valoare puţin mai mică):
xmin  xmin+h
xmin+h  xmin+2h
.....................................................
xmin + (r — 1)h  xmin + r ⋅ h

Se obţin, astfel, r grupe, pentru care vom stabili frecvenţele prin


numărarea unităţilor care se încadrează în fiecare grupă. Dacă există grupe
cu frecvenţă nulă, ori multe grupe cu o singură observaţie, poate fi necesară
revizuirea mărimii intervalelor sau a numărului de intervale.

2.3. SERII STATISTICE

Rezultatul sistematizării datelor prin grupare/clasificare se constituie


sub forma seriilor statistice.

DEFINIŢIE: Seria statistică este prezentarea ordonată a datelor refe-


ritoare la manifestările unui fenomen colectiv sub forma a două şiruri de

39
CAPITOLUL 2

date: unul priveşte variabila şi modul cum a fost sistematizată, iar al doilea
frecvenţa de apariţie sau nivelul unei variabile în raport cu primul şir.

2.3.1. Serii de distribuţie de frecvenţe pentru o variabilă


atributivă

A. Vom începe, acum, cu rezultatul sistematizării pe intervale de


grupare, pentru o variabilă numerică continuă, pentru care se obţine o serie
de distribuţie (repartiţie) de frecvenţe pe intervale, sub forma (Tabelul
2.1).

Tabelul 2.1.
Distribuţie de frecvenţe pe intervale de variaţie
Intervale de variaţie a variabilei (X) Numărul de unităţi statistice (frecvenţe)
x1inf – x1sup n1
x2inf – x2sup n2
. .
xinf – xisup ni
. .
. .
xrinf – xrsup nr
r
Total n = ∑ ni
i =1

OBSERVAŢII:
• dacă intervalele sunt cu variaţie discontinuă, atunci:
x(i+1)inf = xisup + ∆ (2.4)
unde ∆ este o unitate de discretizare
• dacă intervalele sunt cu variaţie continuă, adică:
x(i+1)inf = xisup (2.5)
atunci trebuie stabilit în ce interval se cuprinde valoarea de graniţă;
• mărimea intervalului de grupare se calculează:
hi = xisup – xiinf , i = i,r (2.6)
dacă intervalele sunt cu variaţie continuă, sau:
hi = x(i+1)inf – xi inf, i = i,r (2.7)
sau
hi = xisup – x(i–1)sup, i = 2,r (2.8)
indiferent dacă intervalele sunt cu variaţie continuă sau discontinuă.

40
STATISTICĂ ECONOMICĂ

• pentru prelucrarea ulterioară a datelor se consideră că fiecare din cele ni


unităţi dintr-o grupă au valoarea variabilei egală cu centrul de interval (xi).
h
x i = x i inf + i (2.9)
2
sau, dacă intervalele sunt cu variaţie continuă:
x i inf + x i sup
xi = (2.10)
2

Pe lângă frecvenţa absolută (ni) care indică numărul total de unităţi


statistice care au valoarea variabilei situată într-un interval (xiinf – xisup), se
poate calcula şi frecvenţa relativă a grupei, care indică proporţia din nu-
mărul total de unităţi, care se încadrează în grupă:
n n
n *i = r i = i (2.11)
n
∑ ni
i =1
unde n reprezintă volumul total al colectivităţii. Exprimată în procente,
frecvenţa relativă a grupei i este:
n n
n *i% = r i 100 = i 100 (2.12)
n
∑ ni
i =1
Dacă utilizăm frecvenţele relative, obţinem o serie de distribuţie
(repartiţie) de frecvenţe relative (Tabelul 2.2)

Tabelul 2.2.
Serie de distribuţie de frecvenţe relative
Intervale de variaţie a variabilei Frecvenţe relative
X1inf – x1sup n 1*
x2inf – x2sup
. n *2
. .
. .
xi inf – xi sup n *i
.
.
.
.
xrinf – xrsup *
nr
r
Total 1,00 = ∑ n *i
i =1

41
CAPITOLUL 2

Frecvenţele absolute cumulate (Fci) reprezintă numărul unităţilor


statistice care au valoarea variabilei mai mică (sau, eventual, egală) cu
limita superioară a grupei (deci, au valoarea variabilei mai mare decât x1inf şi
mai mică decât xisup).
i
Fci = ∑ n k (2.13)
k =1
Similar cu frecvenţele cumulate crescător, se pot calcula şi frecvenţe
cumulate descrescător:
r
Fdi = ∑ n k (2.14)
k =i
r
Fdi* = ∑ n *k (2.15)
k =i

EXEMPLUL 2.1 În urma sistematizării datelor cu privire la salariul


net încasat de o colectivitate de muncitori, s-a obţinut următoarea serie de
repartiţie (Tabelul 2.3):

Tabelul 2.3.
Distribuţia salariaţilor după salariul net
Număr de Frecvenţe Frecvenţe
Salariul net Frecvenţe
salariaţi absolute relative
(mii lei) relative n *i cumulate (Fci)
(ni) cumulate ( Fci* )
1,4 – 1,6 5 0,10 5 0,10
1,6 – 1,8 8 0,16 13 0,26
1,8 – 2,0 4 0,08 17 0,34
2,0 – 2,2 17 0,34 34 0,68
2,2 – 2,4 8 0,16 42 0,84
2,4 – 2,6 3 0,06 45 0,90
2,6 – 2,8 2 0,04 47 0,94
2,8 – 3,0 2 0,04 49 0,98
3,0 – 3,2 1 0,02 50 1,00
Total 50 1,00 — —

Dacă intervalele sunt neegale, pentru asigurarea comparabilităţii


datelor se pot calcula frecvenţe reduse la un interval etalon (standard).
Frecvenţa redusă (corectată) a unui interval ( n icor ) se calculează prin
raportarea frecvenţei absolute la un factor de corecţie (l) ce reprezintă
numărul intervalelor etalon ce încap într-un interval de grupare:
42
STATISTICĂ ECONOMICĂ

hi
l= (2.16)
h et
ni
n icor = (2.17)
l
unde hi reprezintă mărimea intervalului i, i = 1, r
het reprezintă mărimea intervalului etalon (de regulă mărimea celui
mai mic interval de grupare).

B. În cazul în care variabila de grupare este discretă şi gruparea se


efectuează pe variante, seria de distribuţie de frecvenţe este discretă sau
pe variante.

EXEMPLUL 2.2: Un exemplu de distribuţie de frecvenţe după o va-


riabilă discretă este distribuţia divorţurilor din România în anul 2000 după
numărul de copii minori rămaşi prin desfacerea căsătoriei (Tabelul 2.4),
pentru care s-au calculat şi frecvenţele relative (col.2) şi frecvenţele cumu-
late (col. 3 şi col. 4):

Tabelul 2.4.
Distribuţia divorţurilor după numărul de copii minori
rămaşi prin desfacerea căsătoriei, în România, anul 2000
Număr de Număr de Frecvenţe Frecvenţe Frecvenţe
copii minori divorţuri *
relative ( n i ) absolute relative
(ni) cumulate cumulate
(Fci) ( Fci* )
0 1 2 3 4
0 18.614 0,465 18.614 0,465
1 14.518 0,363 33.132 0,828
2 5.351 0,134 38.483 0,962
3 1.062 0,027 39.545 0,989
4 317 0,008 39.862 0,997
5 şi peste 5 123 0,003 39.985 1,000
Total 39.985 1,000 — —

Seriile de distribuţie de frecvenţe alcătuite după o variabilă


cantitativă (numerică), adică cele descrise de paragrafele A şi B, poartă
numele de distribuţii heterograde.

43
CAPITOLUL 2

C. O distincţie aparte trebuie făcută pentru seriile de distribuţie de


frecvenţe alcătuite după o variabilă calitativă (nenumerică) ce poartă
numele de distribuţii homograde.

EXEMPLUL 2.3: O distribuţie homogradă, după o variabilă nenume-


rică măsurată pe o scală nominală este distribuţia contractelor de asigurare
pe viaţă în România, în anul 1999, pe principalele companii (vezi Tabelul
2.5, unde se prezintă ca o distribuţie de frecvenţe relative):

Tabelul 2.5
Distribuţia contractelor de asigurare pe viaţă în România, anul 1999, pe
principalele companii
Procent din numărul total de
Compania
contracte încheiate (%)
Nederlanden 45,70
ASIROM S.A. 27,41
SARA MERKUR 12,16
UNITA 8,30
AIG Life 1,93
Garanta 1,35
Omniasig 0,96
METROPOL S.A. 0,92
Interamerican 0,57
ARDAF 0,25
Altele 0,45
Total 100,0

D. Seriile statistice de distribuţie de frecvenţe bidimensionale


sunt cele formate prin considerarea concomitentă a două variabile (X şi Y).
Forma unei astfel de serii de distribuţie bidimensională este (Tabelul 2.6)

44
STATISTICĂ ECONOMICĂ

Tabelul 2.6
Distribuţia de frecvenţe bidimensională
Intervale/variante
pentru Y
y1 y2 ... yj ... ym Total
Intervale/
Variante pentru X
x1 n11 n12 ... n1j ... n1m n1.
x2 n21 n22 ... n2j ... n2m n2.
. ................... ...
.
xi ni1 ni2 ... nij ... nim ni.
. .................... ...
.
xr nr1 nr2 ... nrj .... nrm nr.
Total n.1 n.2 .... n.j ... n.m n..

În acest tabel trebuie să remarcăm că:


m
n i⋅ = ∑ n ij (2.18)
j=1
r
n ⋅ j = ∑ n ij (2.19)
i =1
r m r m
n.. = ∑ n i. = ∑ n. j = ∑ ∑ n ij (2.20)
i =1 j=1 i =1 j=1

O situaţie aparte o întâlnim în cazul variabilelor alternative, când


datele se pot prezenta într-un tabel de asociere de forma (Tabelul 2.7):

Tabelul 2.7
Tabel de asociere
Clasele lui X Clasele lui Y Total
Y(y1) non Y(y2)
X(x1) n11 n12 n1. = n11 + n12
non X(x2) n21 n22 n2. = n21 + n22
Total n.1 = n11 + n21 n.2 = n12 + n22 n.. = n11 + n12+n21+n22

2.3.2. Serii cronologice

Seriile cronologice reprezintă seriile statistice ce se obţin prin


sistematizarea datelor după o variabilă de timp. O serie cronologică este

45
CAPITOLUL 2

alcătuită din două şiruri de date: unul cu privire la unităţile de timp, care pot
fi momente sau intervale de timp, iar cel de-al doilea cu privire la frecvenţa
de apariţie sau nivelul unui fenomen, înregistrat în aceste unităţi de timp.
Dacă unităţile de timp sunt momente, atunci seria cronologică se numeşte
de stoc (de momente), iar dacă unităţile de timp sunt intervale (perioade),
seria cronologică se numeşte de flux (de intervale). O serie cronologică se
notează:
1 2 ... t ... n  t 
  sau  , t = 1, n.
 y1 y 2 ... y t ... y n  y t 
EXEMPLUL 2.4. Evoluţia vânzărilor cotidianului naţional Libertatea
pentru perioada ianuarie 2001 – februarie 2002 (Tabelul 2.8).

Tabelul 2.8
Evoluţia vânzărilor cotidianului naţional Libertatea
Vânzările
Anul
(mii exemplare)
ianuarie 2001 104,0
februarie 2001 103,8
martie 2001 104,5
aprilie 2001 99,2
mai 2001 124,0
iunie 2001 127,8
iulie 2001 108,7
august 2001 110,0
septembrie 2001 116,7
octombrie 2001 123,8
noiembrie 2001 148,0
decembrie 2001 133,0
ianuarie 2002 139,0
februarie 2001 143,0

2.3.3. Serii teritoriale

Dacă variabila pentru care se sistematizează datele este o variabilă


de spaţiu (teritorială), adică elementul ce diferenţiază manifestările
fenomenului analizat este locul unde acestea s-au produs, atunci rezultatul
este o serie teritorială (de spaţiu).

46
STATISTICĂ ECONOMICĂ

EXEMPLUL 2.5: Rata şomajului în anul 1997 pentru 11 ţări din


Europa a fost (Tabelul 2.9):
Tabelul 2.9
Rata şomajului
Ţara Rata şomajului (%)
Austria 7,1
Belgia 13,2
Bulgaria 13,7
Elveţia 5,2
Franţa 12,4
Germania 12,5
Italia 12,3
Olanda 5,5
România 10,4
Spania 20,8
Ungaria 10,4

2.4. PREZENTAREA DATELOR ÎN TABELE STATISTICE

Tabelul statistic constituie o modalitate de prezentare a datelor


statistice şi este format dintr-o reţea de linii paralele, orizontale şi verticale
în care sunt încadrate datele statistice. Alături de funcţia de prezentare a
rezultatelor prelucrării primare şi secundare a datelor statistice, tabelele
statistice au şi funcţia sistematizare a datelor în vederea prelucrării lor.
Tabelele statistice conţin una sau mai multe serii statistice.

Tabelul statistic trebuie să fie elaborat după anumite reguli privind


elementele de conţinut şi de formă.

În funcţie de rolul lor în analiza şi prelucrarea datelor statistice,


tabelele statistice pot fi: simple (descriptive); de prelucrare; pe grupe
(obţinute în urma sistematizării datelor); combinate; de asociere.

47
CAPITOLUL 2

2.5. METODE GRAFICE DE DESCRIERE A DATELOR STATISTICE

Reprezentarea grafică este o metodă de descriere a datelor prin


intermediul figurilor geometrice ori a figurilor naturale.
Graficul este o imagine spaţială, cu caracter convenţional, care prin
diferite mijloace plastice de prezentare scoate în evidenţă ceea ce este
caracteristic şi esenţial în evoluţia fenomenelor, în schimbările structurale,
în ceea ce priveşte proporţiile şi corelaţiile cu alte fenomene de aceeaşi
natură sau calitativ diferite1.
• Cel mai adesea, graficele statistice sunt reprezentate într-un sistem
de coordonate rectangulare (ortogonale), adică în raport şi proporţional
cu două axe perpendiculare, dar se pot întâlni şi grafice reprezentate într-un
sistem de coordonate polare.
y

yi M
M
r

α
o xi x o x
a) b)

Fig. 2.1 - Reprezentare în coordonate: a) rectangulare b) polare

• Reţeaua graficului este alcătuită dintr-un sistem de linii verticale


şi orizontale sau de cercuri concentrice care ajută la construirea graficului.
• Scara de reprezentare stabileşte corespondenţa dintre o unitate de
măsură aleasă pe grafic şi unitatea relativă la X (sau Y). Scările de repre-
zentare pot fi aritmetice, logaritmice sau semilogaritmice.
• Legenda graficului are rolul de a explica diversele simboluri,
haşuri, culori folosite pentru a facilita înţelegerea reprezentării construite.

1
D. Haşigan, I. Marinescu - Grafice şi elemente de calcul grafic, Ed. Ştiinţifică, Bucu-
reşti, 1968.
48
STATISTICĂ ECONOMICĂ

• În afara acestor elemente specifice reprezentărilor grafice, trebuie


să subliniem necesitatea prezenţei unor elemente comune şi tabelelor
statistice: titlul, sursa datelor, numerotarea, note explicative etc.

Pentru a reprezenta corect proporţiile şi rapoartele care se


înregistrează între datele statistice prin intermediul graficelor, utilizăm
figuri geometrice, hărţi, diagrame figurale etc.
Principalele tipuri de grafice vor fi prezentate, în continuare, în
funcţie de felul seriilor statistice în care au fost sistematizate datele.

2.5.1. Histograma şi poligonul frecvenţelor

Pentru o serie de distribuţie de frecvenţe după o variabilă numerică


continuă (pe intervale), reprezentările grafice care ne permit să vizualizăm
distribuţia de frecvenţe sunt histograma şi poligonul frecvenţelor.
EXEMPLUL 2.6: Pentru seria de repartiţie de frecvenţe absolute pre-
zentată în tabelul 2.3, histograma este (fig. 2.2.):
y
40
35
30 Scara de reprezentare
Frecvenþe

25 Ox: 0,7 cm = 0,2 mil. lei


20 Oy: 0,5 cm = 2 persoane
15
10
5
0

1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 x
Salariul (mil. lei)

Fig. 2.2 - Histograma frecvenţelor absolute pentru salariul net al muncitorilor

O altă posibilitate de reprezentare grafică a distribuţiei de frecvenţe


pentru o caracteristică numerică de tip continuu este poligonul frecvenţelor.
EXEMPLUL 2.7: Pe baza datelor din tabelul 2.3, putem construi poli-
gonul frecvenţelor absolute, astfel (fig. 2.3 şi fig. 2.4.):
Fig. 2.3 - Poligonul frecvenţelor absolute pentru salariul net al muncitorilor
y
40
35
30
Frecvenþe

25
20 49
15
10 Scara de reprezentare
5 Ox: 0,8 cm = 0,2 mil. lei
0 Oy: 0,5 cm = 2 persoane

1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 x
Salariul (mil. lei)
CAPITOLUL 2

y
40
35
30
Frecvenþe

25
20
15
10 Scara de reprezentare
5
Ox: 0,8 cm = 0,2 mil. lei
0

1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 x Oy: 0,5 cm = 2 persoane
Salariul (mil. lei)

Fig. 2.4 - Histograma şi poligonul frecvenţelor absolute


pentru salariul net al muncitorilor

Trebuie să remarcăm că histograma şi poligonul frecvenţelor se pot


construi şi pe baza frecvenţelor relative.

EXEMPLUL 2.8: Pe baza datelor din tabelul 2.3, utilizând frecvenţele


relative, histograma şi poligonul frecvenţelor relative este (fig. 2.5.):

y
Frecvenþe relative (%)

40
35
30
25
20
15
10
5 Scara de reprezentare
0 Ox: 0,8 cm = 0,2 mil. lei

1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 x
Oy: 0,6 cm = 2 persoane
Salariul (mil. lei)

Fig. 2.5 - Histograma şi poligonul frecvenţelor relative pentru salariul net al


muncitorilor

50
STATISTICĂ ECONOMICĂ

Când intervalele devin suficient de mici, iar numărul de cazuri


rămâne finit pe fiecare interval, poligonul frecvenţelor apare ca o curbă
netedă (fig. 2.6.)

14

12

10
Frecvente

0
10 20 30 40 50 60 70 80 90
Intervale

a) set mic de date

35

30

25
Frecvente

20

15

10

0
1
4
7
10
13
16
19
22
25
28
31
34
37
40
43
46

Intervale

b) Set foarte mare de date


Fig. 2.6 - Efectul volumului colectivităţii asupra aspectului poligonului
frecvenţelor

Iată, deci, că histograma şi poligonul frecvenţelor oferă o primă


imagine asupra normalităţii sau tendinţei de normalitate, ori, din contră,
asupra asimetriei profunde a unei serii de distribuţie de frecvenţe. O
distribuţie normală, perfect simetrică (în forma clopotului lui Gauss-
Laplace) (vezi fig. nr. 2.7.a) este foarte rar întâlnită în practică; cu toate
51
CAPITOLUL 2

acestea ea este o distribuţie teoretică la care se face adeseori apel în analiza


statistică. În cele mai multe cazuri, distribuţiile de frecvenţe empirice au
tendinţă de normalitate, dar un anumit grad de asimetrie (fig.2.7b şi
fig.2.7.c). Există şi distribuţii profund asimetrice, în care frecvenţa maximă
se întâlneşte în primul ori în ultimul interval, pentru ca apoi frecvenţele să
descrească spre zero. Aceste distribuţii se numesc în formă de J (fig.2.7d şi
fig.2.7e). De asemenea, se pot întâlni distribuţii în formă de U, cu frecvenţe
maxime în ambele intervale extreme de variaţie şi cu frecvenţă minimă în
jurul intervalului central — din mijlocul distribuţiei (fig.2.7f). Este firesc,
aşadar, ca analiza statistică să înceapă cu vizualizarea, pe cale grafică, a
tendinţei de distribuţie a valorilor în colectivitatea cercetată.

y y y

o x o x o x

a) distribuţie normală, b) distribuţie cu tendinţă de b) distribuţie cu tendinţă de


perfect simetrică normalitate, asimetrică normalitate, asimetrică

y y y

o x o x o x
d) distribuţie în formă de J e) distribuţie în formă de J f) distribuţie în formă de U

Fig. 2.7 - Forme ale distribuţiilor de frecvenţe

O serie de distribuţie de frecvenţe alcătuită după o variabilă


numerică discretă se reprezintă grafic prin poligonul frecvenţelor.

52
STATISTICĂ ECONOMICĂ

EXEMPLUL 2.9: Distribuţia elevilor dintr-o clasă după nota obţinută


la o lucrare de control este cea prezentată în Tabelul 2.10. Reprezentarea
grafică a distribuţiei se prezintă în graficul din fig. 2.8.

Tabelul 2.10
Distribuţia elevilor după nota obţinută la o lucrare de control
Nota (xi) Număr de elevi (ni)
2 1
3 2
4 2
5 6
6 7
8 15
9 5
10 2
Total 40

16

14

12
10
Frecvente

8
6

2
0
0 1 2 3 4 5 6 7 8 9 10 11 12
Nota

Fig. 2.8 - Poligonul frecvenţelor absolute pentru nota obţinută la lucrarea de


control

2.5.2. Curba frecvenţelor cumulative (ogiva)

O altă modalitate de descriere a datelor cantitative continue,


construită de această dată pe baza frecvenţelor cumulative este curba
frecvenţelor cumulative (ogiva).
53
CAPITOLUL 2

Să subliniem mai întâi că frecvenţele cumulate sunt interpretate în


relaţie cu limitele exacte ale intervalelor de grupare.

EXEMPLUL 2.10: Pe baza datelor obţinute în tabelul 2.4. se poate


construi grafic curba frecvenţelor cumulate crescător (fig. 2.9.)

60

50
Frecvente cumulate

40

30

20

10

0
1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 3 3.2
Salariu (mil. lei)

Fig. 2.9 - Curba frecvenţelor cumulate crescător, pentru salariul net al


muncitorilor

Suprapus peste curba frecvenţelor cumulate crescător, ori într-un


grafic separat, se poate reprezenta curba frecvenţelor cumulate
descrescător. De asemenea, ogiva se poate reprezenta şi pe baza
frecvenţelor relative cumulate.

EXEMPLUL 2.11: Pe baza datelor din tabelul 2.3 col. 4, se poate con-
strui curba frecvenţelor relative cumulate crescător. (fig. 2.10).

54
STATISTICĂ ECONOMICĂ

1,2

1
Frecvente relative cumulate

0,8

0,6

0,4

0,2

0
1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8 3 3,2
Salariu (m il. lei)

Fig. 2.10 - Curba frecvenţelor relative cumulate crescător


pentru salariul net al muncitorilor

Reprezentarea grafică a frecvenţelor cumulate crescător pentru o


variabilă discretă, prin intermediul graficului frecvenţelor cumulate, va
avea, de această dată, aspectul unei scări, pentru că nici o unitate statistică
nu poate avea valoarea caracteristicii situată între variantele stabilite.
EXEMPLUL 2.12: Pe baza distribuţiei din tabelul 2.10 se poate deter-
mina distribuţia de frecvenţe absolute cumulate crescător (Tabelul 2.11) şi
reprezenta grafic în fig. 2.11.

55
CAPITOLUL 2

Tabelul 2.11
Distribuţia de frecvenţe cumulate a elevilor după nota obţinută la o lucrare de
control
Nota (xi) Frecvenţe absolute cumulate
crescător (Fci)
2 1
3 3
4 5
5 11
6 18
8 33
9 38
10 40

Frecvenþe cumulate (Y)


40

35

30

25

20

15

10

o 1 2 3 4 5 6 7 8 9 10 x (nota)

Fig. 2.11 - Graficul frecvenţelor cumulate crescător pentru distribuţia elevilor


după nota la lucrarea de control

2.5.3. Diagrama prin coloane şi diagrama prin benzi

Alte modalităţi uzuale de a reprezenta grafic o serie de distribuţie


de frecvenţe absolute sau relative, pentru o variabilă calitativă
(categorială) sunt diagrama prin coloane şi diagrama prin benzi.

56
STATISTICĂ ECONOMICĂ

EXEMPLUL 2.13: Pe baza datelor din tabelul 2.5, care reprezintă o


distribuţie de frecvenţe relative după o variabilă calitativă, reprezentarea
grafică este prin diagrama prin coloane (fig. 2.12) sau diagrama prin benzi
(fig. 2.13).

50
45.7
45
Frecvenţe relative (%)

40

35

30 27.41

25

20

15 12.16
10 8.3

5 1.93 1.35 0.96 0.92 0.57 0.25 0.45


0
l
n

fe

ta

le
A

ig

AF
A

po

am
de

IT

te
as
O

Li

an

ro

D
SA

N
IR

Al
n

er
ni
G

ar

AR
et
la

t
AS

m
AI

In
er

M
O
ed
N

Compania

Fig. 2.12 - Diagramă prin coloane

Nederl. 45.7
ASIROM 27.41
SARA 12.16
UNITA 2.3
Companie

AIG Life 1.93


Garanta 1.35
Omniasig 0.96
Metropol 0.92
Interam. 0.57
ARDAF 0.25
Altele 0.45

0 10 20 30 40 50
Frecvenţe relative (%)

Fig. 2.13 - Diagramă prin benzi

57
CAPITOLUL 2

2.5.4. Diagrama de structură

O altă modalitate de a prezenta grafic datele pe care le avem la dis-


poziţie cu privire la o serie de distribuţie de frecvenţe (vizual homogradă)
este diagrama de structură.

EXEMPLUL 2.14: Pe baza datelor din Tabelul 2.5., diagrama de


structură se prezintă astfel (fig. 2.14):

Altele
ARDAF
Interam.
Metropol
Omniasig
Garanta
AIG Lif e
UNITA
SARA
ASIROM
Nederl.
a.

58
STATISTICĂ ECONOMICĂ

Nederl.
ASIROM
SARA
100 UNITA
80 AIG Life
Garanta
60
% Omniasig
40
Metropol
20 Interam.

0 ARDAF

b. Altele

Nederl.
100
A SIROM
90
80 SA RA
70 UNITA
60 A IG Lif e
% 50 Garanta
40 Omnias ig
30 Metropol
20 Interam.
10
A RDA F
0
c. A ltele

Nederl.
ASIROM
SARA
100% UNITA
80% AIG Life

60% Garanta
% Omniasig
40%
Metropol
20%
Interam.
0% ARDAF
d. Altele

Fig. 2.14 - Diagrama de structură a contractelor de asigurări pe companii


de asigurare, în România, 1999: a. prin cerc; b. prin cilindru; c. prin
dreptunghi; d. prin paralelipiped
59
CAPITOLUL 2

2.5.5. Diagrama de împrăştiere (corelograma)

În cazul datelor bivariate, sistematizate într-o serie de distribuţie de


frecvenţe bidimensională, reprezentarea grafică uzuală în sistemul de coor-
donate rectangulare este diagrama de împrăştiere (despre care vom vorbi
mai pe larg într-un capitol următor) (fig. 2.15)

Cantitãþi vândute
din produsul X
(mii bucãþi) 250
**
**
200 ***
***
150 * * ***
* ***
100 * * **
***
* *** *
50 **
***
***
10
20 30 40 50 60 Cheltuieli cu
reclama (mld. lei)

Fig. 2.15 - Diagramă de împrăştiere

2.5.6. Cronograma

O serie cronologică se reprezintă grafic prin intermediul


cronogramei sau historiogramei. În sistemul de coordonate rectangulare,
pe axa absciselor se marchează unităţile de timp (t) — momente sau intervale
— iar pe axa ordonatelor valorile variabilei (yt).
Reprezentarea grafică a seriilor cronologice este prezentată mai pe
larg în capitolul 6.
EXEMPLUL 2.15: Pe baza datelor din tabelul 2.8, reprezentarea grafică
prin intermediul cronogramei (prin segmente de linie sau coloane) este (fig.
2.16)

60
Numarul de exemplare vandute Numarul de exemplare vandute
(mii exemplare)
(mii exemplare)
ia
nu
ar

0.00
20.00
40.00
60.00
80.00
100.00
120.00
140.00
160.00
ie

90.00
100.00
110.00
120.00
130.00
140.00
150.00

fe 20
br 01
ua
rie
20
m 01
ar
tie
20
ap 01
ril
ie
20
01
m
ai
20
iu 01
ni
e2
00
iu 1
lie

a)

b)
au 200
gu 1
se st

Lunile
pt
em 200
b 1

luni
oc rie 2
to 00
m 1
br
no ie
ie 20
m 01
br
de ie
ce 20
m
STATISTICĂ ECONOMICĂ

01
br
ie
ia 20
nu 01
ar
ie
fe 20
br 02
ua
rie
20
01

Fig. 2.16 - Cronogramă trasată prin a) linii; b) coloane

61
CAPITOLUL 2

2.5.7. Diagrama polară

În cazul în care seria cronologică prezintă variaţii sezoniere, pentru


reprezentarea grafică a evoluţiei unui fenomen putem folosi diagrama
polară (radială), construită în sistemul de coordonate polare. Acest tip de
diagramă se va prezenta mai pe larg în capitolul 6.

EXEMPLUL 2.16: Temperatura medie lunară a aerului la Bucureşti -


Filaret în anul 1996 se reprezintă grafic în fig. 2.17.

Ian
30
Dec. Feb.
20
Nov. 10 Mar.
0
Oct. -10 Apr.

Sept. Mai

Aug. Iun.
Iul.

Temperatura medie lunara a aerului la Bucuresti-Filaret în


anul 1996

Fig. 2.17 – Diagramă polară

2.5.8. Diagrama prin suprafeţe

O serie teritorială se poate reprezenta grafic prin diagrame prin


coloane, benzi ori diagramă prin suprafeţe. În diagrama prin suprafeţe se
construiesc, de obicei, pătrate sau cercuri, cu suprafeţele proporţionale cu
valorile reprezentate.

În cazul fenomenelor complexe, care se descompun în produsul a


trei factori se poate folosi diagrama de volum trasată prin paralelipipedul
dreptunghic. Cei trei factori se vor reprezenta pe lungimea, lăţimea şi
înălţimea paralelipipedului, iar nivelul fenomenului complex prin volumul
acestuia.

62
STATISTICĂ ECONOMICĂ

EXEMPLUL 2.17: Populaţia globului pe continente în anul 1998 se


prezintă astfel (mil. locuitori, Tabelul 2.12):
Tabelul 2.12
Continent Populaţie (mil. loc.)
Africa 778
America de Nord 472
America de Sud 332
Asia 3590
Europa 729

Reprezentarea grafică este redată în fig. 2.18.

Legendă:

Africa

America de Nord

America de Sud

Asia

Europa

Fig. 2.18 - Diagramă de suprafaţă

2.5.9. Alte tipuri de reprezentări grafice

Dacă aceste diagrame pot fi construite şi pentru alte serii statistice


(de exemplu: serii de distribuţii de frecvenţe homograde), o modalitate
specifică de reprezentare grafică a seriilor teritoriale este cartograma sau
cartodiagrama, în care pe o hartă se construiesc diagrame (în cazul
cartodiagramei), se haşurează sau se colorează diferit unităţile teritoriale (în
cazul cartogramei), în funcţie de nivelul înregistrat al variabilei.
Să notăm că există şi alte reprezentări grafice (diagrama Venn,
diagrama Chernoff) a căror acurateţe în construcţie este facilitată de
utilizarea pachetelor informatice specializate.

63
CAPITOLUL 2

Întrebări recapitulative

1. Ce este sistematizarea datelor statistice?


2. Care sunt principiile după care se efectuează gruparea/clasificarea
datelor statistice?
3. Ce reprezintă clasificarea datelor statistice?
4. Cum se efectuează gruparea pe intervale de variaţie?
5. Definiţi conceptul de serie statistică.
6. Ce reprezintă frecvenţa relativă şi cum se calculează?
7. Arătaţi semnificaţia şi modul de obţinere a frecvenţelor cumulate,
absolute şi relative. Exemplificaţi.
8. Definiţi conceptele de serie heterogradă şi serie homogradă.
9. Seria statistică de distribuţie de frecvenţe bidimensională —
definiţie, formă de prezentare.
10. Ce reprezintă şi cum se construieşte tabelul de asociere?
11. Ce reprezintă seria cronologică?
12. Ce reprezintă seria teritorială?
13. Enumeraţi regulile de construire a tabelelor statistice.
14. Ce reprezintă graficul statistic?
15. Care sunt principalele reguli de construire a graficelor statistice?
16. Cum se reprezintă grafic o serie de distribuţii de frecvenţe?
17. Cum se construieşte ogiva?
18. Cum se reprezintă grafic o serie de distribuţii de frecvenţe pe
intervale neegale?
19. Cum se utilizează diagrama prin benzi şi diagrama prin coloane?
20. Cum se construieşte diagrama de structură?
21. Cum se utilizează diagrama prin suprafeţe?
22. Cum se construieşte corelograma?
23. Cum se reprezintă grafic seriile cronologice?
24. Cum se reprezintă grafic seriile teritoriale?

64
CAPITOLUL 2

Teste de autoevaluare

1. Managerul unei companii farmaceutice este preocupat de faptul că


medicamente similare sunt vândute la preţuri sensibil diferite în farmaciile
din zonă. De aceea, au fost înregistrate preţurile de vânzare ale unuia şi
aceluiaşi medicament în 40 de farmacii. Acestea sunt (u.m.): 26; 32; 33; 12;
11; 19;18; 21; 21; 40; 39; 27; 30; 32; 34; 12; 17; 36; 25; 15; 24; 23; 29; 30;
30; 26; 17; 23; 14; 28; 29; 24; 19; 21; 28; 20; 22; 27; 22; 27.
a) Să se sistematizeze datele pe intervale de mărime 5, începând cu
intervalul 11-15;
b) să se determine centrele de interval;
c) să se grupeze datele pe cinci intervale continue, de mărime egală şi să se
reprezinte grafic rezultatele grupării.

2. Se consideră următoarea reprezentare grafică privind distribuţia


studenţilor din anul I al unei facultăţi economice după numărul minutelor
necesare pentru rezolvarea unui test grilă (fig. 2.1’):

1,2
1
1 0,9

0,8 0,65
0,6

0,4
0,15
0,2 0,05
0
0
… 10-14 14-18 18-22 22-26 26-30

Fig. 2.1’

a) Ce tip de distribuţie s-a reprezentat grafic?


b) Explicaţi de ce valoarea de pe axa Oy, corespunzătoare primului interval
este 1.

65
STATISTICĂ ECONOMICĂ

c) Transformaţi distribuţia reprezentată grafic într-o distribuţie de frecvenţe


relative şi reprezentaţi-o grafic.
d) Care este ponderea studenţilor care au rezolvat testul grilă în mai puţin
de 18 minute? Dar în mai mult de 22 minute?

3. Despre cei 500 de angajaţi ai unui agent economic cu activitate în


domeniul construcţiilor se cunosc următoarele date:

Intervale de variaţie a Sub 10 10-15 15-20 20-25 25-30 peste 30


vechimii în activitate (ani)
Ponderea angajaţilor (%) 5 12 30 75 90 100

a) Să se precizeze tipul frecvenţelor redate în tabel;


b) Să se determine frecvenţele absolute şi să se reprezintă grafic;
c) Să se calculeze centrele de interval;
d) Să se calculeze frecvenţele absolute cumulate crescător şi
descrescător şi să se reprezintă grafic;
e) Care este ponderea salariaţilor care au o vechime de peste 25 de
ani? Câţi salariaţi îndeplinesc această condiţie?

4. Nivelul de instruire pentru cei 50 de angajaţi ai unei societăţi comer-


ciale este (se fac notaţiile: P = absolvenţi de învăţământ primar; G = ab-
solvenţi de învăţământ gimnazial; L = absolvenţi de învăţământ liceal; S =
absolvenţi de învăţământ superior):
Tabelul 2.1’
Numărul curent al Nivelul de instruire
angajatului
1 G
2 S
3 S
4 L
5 L
6 G
7 S
8 L
9 S
10 L
11 P
12 S
13 L

66
CAPITOLUL 2

14 L
15 S
16 L
17 S
18 G
19 S
20 L
21 S
22 S
23 L
24 G
25 G
26 S
27 L
28 S
29 L
30 L
31 L
32 S
33 L
34 S
35 L
36 P
37 L
38 L
39 L
40 G
41 L
42 L
43 L
44 G
45 L
46 L
47 L
48 L
49 L
50 L

a) Să se sistematizeze datele;
b) Să se reprezinte grafic informaţiile sistematizate;
c) Să se calculeze ponderea salariaţilor pentru fiecare nivel de instruire şi
să se reprezinte grafic rezultatele;

5. Venitul salarial (u. m.) pentru 50 de angajaţi ai unei companii este:


62; 82; 89; 97; 114; 63; 83; 90; 98; 119; 64; 84; 90; 99; 123; 65; 84; 91;

67
STATISTICĂ ECONOMICĂ

101; 132; 69; 85; 91; 102; 133; 72; 86; 92; 104; 134; 74; 86; 93; 105; 145;
76; 87; 94; 107; 146; 77; 88; 95; 110; 164; 79; 89; 96; 113; 174.
a) Să se sistematizeze datele pe 7 intervale egale de variaţie şi să se
reprezinte grafic;
b) Să se grupeze datele pe intervale neegale de variaţie;
c) Să se reprezinte grafic rezultatele de la pct. b).

6. Pentru următoarele secvenţe ale unor grupări, calculaţi limitele exacte,


mărimea intervalului şi centrele de interval:
a) ............. b) ............. c) .............
8 – 12 1,5 – 3,5 1,50 – 1,75
13 – 17 4,0 – 6,0 2,00 – 2,25
............. ............. .............

7. Pentru următoarea secvenţă din cadrul unei grupări:


5,00 – 5,49
5,50 – 5,99
6,00 – 6,49
6,50 – 6,99
se pot face următoarele afirmaţii:
a) intervalele sunt egale, continue;
b) intervalele sunt egale, discontinue;
c) intervalele sunt neegale, discontinue;
d) valoarea 5,497 a variabilei pentru o anumită unitate statistică se
încadrează în grupa 5,00 – 5,49;
e) dacă o unitate statistică are valoarea caracteristicii egală cu 5,492,
atunci ea se încadrează în grupa 5,00 – 5,49;
f) valoarea 5,498 a variabilei se încadrează în grupa 5,50 – 5,99.

8. Frecvenţa absolută cumulată crescător a unei grupe reprezintă:


a) ponderea unităţilor care se încadrează în grupa respectivă;
b) ponderea unităţilor care au valoarea caracteristică mai mică sau
eventual egală cu limita superioară a grupei;
c) numărul unităţilor care au valoarea caracteristicii mai mică sau
egală cu limita inferioară a grupei;
d) numărul unităţilor care au valoarea caracteristicii mai mică sau
egală cu limita superioară a grupei;
e) numărul unităţilor care au valoarea caracteristicii mai mare sau
egală cu limita inferioară a grupei.

68
CAPITOLUL 2

9. Frecvenţa relativă cumulată crescător a ultimei grupe este egală cu:


a) numărul unităţilor statistice din grupa respectivă;
b) ponderea unităţilor statistice din grupa respectivă în total colecti-
vitate;
c) 100%;
d) numărul total de unităţi statistice din colectivitate;
e) 1,00.

10. Se cunosc datele următoare:


Tabelul 2.2’
Număr de piese realizate zilnic (bucăţi) Muncitori (%)
10 5
15 20
17 45
20 15
22 15

Tabelul prezintă:
a) o distribuţie heterogradă de frecvenţe absolute;
b) o distribuţie homogradă de frecvenţe absolute;
c) o distribuţie heterogradă de frecvenţe relative, pe variante;
d) o distribuţie homogradă de frecvenţe relative;
e) nici una dintre variantele de mai sus.

11. Subiectul unui tabel statistic reprezintă:


a) reţeaua de linii ce alcătuiesc rubricile tabelului;
b) colectivitatea la care se referă datele;
c) sistemul de indicatori cuprinşi în tabel;
d) datele numerice sau denumirile textuale care se completează în
rubricile tabelului;
e) nici una dintre variantele de mai sus.

12. Care dintre următoarele reprezentări grafice sunt incorecte şi de ce?

69
STATISTICĂ ECONOMICĂ

Vânzãri Vânzãri
(mil) (mil)

30 30

20 20

10 10
Filiala Filiala
0 A B C 0 A B C
a) b)

Vânzãri
(mil)

30

20

10
Filiala
0 A B C
c)
Stoc
Stoc (mii buc.)
(mii buc.)
13

12

11

10

0
ian. feb. mar. apr. mai Ani ian. feb. mar. apr. mai Ani
e) f)

Fig. 2.2’

70
CAPITOLUL 2

Răspunsurile testelor de autoevaluare


1.
a) Ştim că în cazul intervalelor discontinue, mărimea acestora se determină
conform relaţiei:

hi = x isup − x iinf + ∆

unde: hi = mărimea intervalului i


∆ = valoarea cu care se discretizează intervalele

sup
Cum pentru intervalul 11-15, x i − x iinf = 4 şi hi = 5, rezultă că ∆ = 1.
Deci intervalele pe care se efectuează gruparea sunt:

11-15
16-20
21-25
26-30
31-35
36-40

Rezultatele grupării sunt redate în tabelul următor (col. 0,1):


Tabelul 2.3’
Intervale de variaţie a preţului de Număr de farmacii Centre de interval
vânzare a medicamentului (u.m.)
0 1 2

11-15 5 13,5
16-20 6 18,5
21-25 10 23,5
26-30 12 28,5
31-35 4 33,5
36-40 3 38,5
Total 40 -

b) Centrele de interval se determină cu relaţia:

hi
CI i = x iinf +
2
71
STATISTICĂ ECONOMICĂ

şi sunt calculate în tabelul 2.3’, col. 2.

c) Se notează cu X - caracteristica de grupare (preţul de vânzare a


medicamentului). Se parcurg următorii paşi:

¾ se calculează amplitudinea variaţiei caracteristicii:

Ax = xmax - xmin = 40 - 11 = 29 u.m.

¾ se stabileşte numărul de grupe:

r=5

¾ se determină mărimea intervalului de grupare:

h = Ax r = 29 5 ≈ 6 u.m.

¾ se stabilesc intervalele de variaţie şi se efectuează gruparea:

Varianta I Varianta II
Tabelul 2.4’
Intervale de Număr de Intervale de Număr de
variaţie a preţului farmacii variaţie a preţului farmacii
de vânzare (u.m.) de vânzare (u.m.)
0 1 0 1
11-17 5 10-16 5
17-23 11 16-22 11
23-29 12 22-28 12
29-35 9 28-34 9
35-41 3 34-40 3
Total 40 Total 40
Notă: limita inferioară inclusă în interval Notă: limita superioară inclusă în interval

2.
a) În graficul din fig. 2.1’ s-a reprezentat grafic o distribuţie de frecvenţe
relative cumulate decrescător, exprimate prin coeficienţi.
b) Deoarece întotdeauna frecvenţa cumulată descrescător a primului
interval coincide cu suma frecvenţelor din care s-au calculat cumulatele.
În cazul nostru, frecvenţele fiind relative şi exprimate în coeficienţi,
suma lor este 1.
72
CAPITOLUL 2

c) Rezultatele sunt evidenţiate în tabelul 2.5’.


Tabelul 2.5’
Intervale de variaţie a numărului Frecvenţe Frecvenţe relative
de minute necesar rezolvării relative cumulate
testului (minute) Crescător Descrescător
0 1 2 3
10-14 0,1 0,1 1,00
14-18 0,25 0,35 0,9
18-22 0,5 0,85 0,65
22-26 0,1 0,95 0,15
26-30 0,05 1,00 0,05
Total 1,00 - -

Distribuţia de frecvenţe relative este reprezentată grafic în fig. 2.3’

0.6
0.5
Frecvente relative

0.4
0.3
0.2
0.1
0
… 10-14 14-18 18-22 22-26 26-30
Minute

Fig. 2.3’

d) Ponderea studenţilor care au rezolvat testul grilă în mai puţin de 18


minute este de 35%, iar a celor care l-au rezolvat în mai mult de 22
minute este de 15%.

3.
a) În tabel sunt redate frecvenţele relative (exprimate procentual)
cumulate crescător.
b) Cum n = numărul total de angajaţi; n = 500.

ni n n∗ % ⋅ n
n ∗i % = ⋅100 = i ⋅100 Ÿ n i = i (Tabelul 2.6’, col. 3)
¦ ni n 100

73
STATISTICĂ ECONOMICĂ

Tabelul 2.6’
Intervale de Ponderea Frecvenţe Frecvenţe Centre Frecvenţe absolute
variaţie a angajaţilor relative absolute de cumulate
vechimii în (%) (ni*%) (ni) interval Crescător Descres-
producţie (xi) cător
(ani)
0 1 2 3 4 5 6
5 - 10 5 5 25 7,5 25 500
10 - 15 12 7 35 12,5 60 475
15 - 20 30 18 90 17,5 150 440
20 - 25 75 45 225 22,5 375 350
25 - 30 90 15 75 27,5 450 125
30 - 35 100 10 50 32,5 500 50
Total - 100 500 - - -

Reprezentarea grafică se face prin histogramă şi poligonul frecvenţelor


(fig. 2.4’)

Numãr de
salariaþi
225

180 Scara:
Ox: 0,6cm = 5 ani
135 Oy: 1cm = 45 persoane

90

45

Vechime (ani)
~

0 5 10 15 20 25 30 35

Fig. 2.4’ - Distribuţia angajaţilor după vechimea în producţie.

sup
c) x inf
i + xi
xi =
2

74
CAPITOLUL 2

d) Frecvenţele absolute cumulate crescător şi descrescător sunt calculate


în coloanele 5, respectiv 6, iar reprezentarea lor grafică se face cu ajutorul
curbelor frecvenţelor cumulate (fig. 2.5’).

Cumulate
500

400

300

200

100
Vechime
0 5 10 15 20 25 30 35

Fig. 2.5’ - Graficul frecvenţelor cumulate.

e) Ponderea salariaţilor care au peste 25 ani vechime este de 15 + 10 =


25%, respectiv această condiţie este îndeplinită de 125 de salariaţi.

4.
a) Se face o clasificare a datelor disponibile. Caracteristica după care se
realizează clasificarea este nivelul de instruire. Această caracteristică
numerică (calitativă) are patru variante: P, G, L, S; se va efectua deci o
clasificare/grupare pe variante. Rezultatul sistematizării se regăseşte în
tabelul 2.7’.
Tabelul 2.7’
Nivelul de instruire Numărul de angajaţi Ponderea angajaţilor
(%)
0 1 2
Primar 2 4
Gimnazial 7 14
Liceal 27 54
Superior 14 28
Total 50 100

b) Reprezentarea grafică poate fi efectuată sub formă de coloane sau


benzi:

75
STATISTICĂ ECONOMICĂ

Nr. angajaþi
Nivel de
30 instruire
S
25

20 L

15
G
10

5 Nivel de P
instruire Nr. angajaþi
0 P G L S 0 5 10 15 20 25 30 35
a) b)
Fig. 2.6’ - Diagrama prin: a) coloane; b) benzi

ni
c) n ∗i = ⋅100 (coloana 2).
∑ ni

Reprezentarea grafică se poate realiza printr-o diagramă de structură:

Structura salariaţilor după nivelul de instruire

Primar
Gimnazial
Superior
Primar
Gimnazial
Liceal
Superior
Liceal

Fig. 2.7’ - Structura salariaţilor după nivelul de instruire.

5.
a) Ax=xmax-xmin=174-62=112. u.m.
r = 7 (nr. de grupe)

76
CAPITOLUL 2

A x 112
h= = = 16 u.m.
r 7

Tabelul 2.8’
Intervale de variaţie a venitului Nr. de salariaţi
salarial (ni)
(u. m.)
62 – 78 9
78 – 94 18
94 – 110 11
110 – 126 5
126 – 142 3
142 – 158 2
158 – 174 2
Total 50
Notă: limita inferioară este inclusă în interval.

Reprezentarea grafică a distribuţiei pe intervale egale se va face prin


histogramă şi poligonul frecvenţelor (fig 2.8’)

Fig. 2.8’ - Distribuţia salariaţilor după venitul salarial.

b) Pentru gruparea datelor pe intervale neegale de variaţie se poate


proceda în felul următor:
I. Se formează intervale neegale de variaţie, procedându-se la regruparea
celor 50 de valori:

77
STATISTICĂ ECONOMICĂ

Vom forma 3 grupe neegale, cu ajutorul a doi indicatori, şi anume:


n
∑ xi
– media aritmetică: x = i =1
; unde
n
xi = valorile individuale ale caracteristicii (venitul salarial);
n
∑ xi − x
– abaterea medie liniară: d = i =1 , indicator ce va fi studiat mai
n
detaliat în capitolul 3.

Valorile celor doi indicatori, pentru datele problemei noastre, vor fi:
4896
x= = 97,92 ≅ 98 u.m.
50
926
d= = 18,5 u.m.
50
Cu ajutorul celor 2 indicatori se vor calcula limitele (inferioară şi supe-
rioară) ale intervalului mijlociu.

liminf = x − d = 98 − 18,5 = 79,5 ≅ 80 u.m.limsup = x + d = 98 + 18,5 = 116,5 ≅ 117 u.m.

Se formează cele 3 intervale neegale:


– grupa salariilor mici: sub x − d , adică sub 80 u.m.;
– grupa salariilor medii (mijlocii): între x − d şi x + d , adică între 80 şi
117 u.m.;
– grupa salariilor mari: peste x + d , adică peste 117 u.m.
Primul şi ultimul interval pot fi mărginite atribuindu-li-se o limită
inferioară (xmin) şi, respectiv, superioară (xmax).
Aşadar, intervalele vor fi:
– venituri salariale mici: 62-80 u.m.
– venituri salariale medii: 80-117 u.m.
– venituri salariale mari: 117-174 u.m.

78
CAPITOLUL 2

Tabelul 2.9’
Intervale de variaţie a Număr de salariaţi
veniturilor salariale (ni)
(u.m.)
62 – 80 (sub 80) 10
80 – 117 31
117 – 174 (peste 174) 9
Total 50

II. Se formează intervalele neegale de variaţie, prin „alipirea“


intervalelor egale aflate la punctul a).
Una dintre variante ar fi:
– primul interval egal poate constitui grupa veniturilor salariale mici (62-
78 u.m.);
– intervalele 2 şi 4, prin alipire, pot constitui grupa veniturilor salariale
mijlocii (78 – 110 u.m.);
– intervalele 4, 5, 6 şi 7, prin alipire, pot forma grupa veniturilor salariale
mari (110 – 174 u.m.).
Tabelul 2.10’
Intervale de variaţie a Număr de hi ki n cor
i
veniturilor salariale salariaţi
(u.m.)
0 1 2 3 4

62 – 78 9 16 1 9
78 – 110 29 32 2 14,5
110 – 174 12 64 4 3
Total 50 – – –

c) Pentru reprezentarea grafică se vor calcula frecvenţele reduse la


unitate. Se foloseşte rezultatul ultimei grupări (tabelul 2.10’).
Se procedează astfel:
– se calculează mărimea fiecărui interval, prin diferenţă între limita
superioară şi cea inferioară:
h i = x sup
i − x inf
i (col. 2)
– se alege un interval etalon – intervalul cu mărimea cea mai mică (hi);
– se calculează coeficienţii de corecţie (de reducere a frecvenţelor, prin
raportarea mărimii fiecărui interval la mărimea intervalului etalon):
h
k i = i (col. 3);
h1

79
STATISTICĂ ECONOMICĂ

– se calculează frecvenţele reduse (corectate) prin împărţirea frecvenţelor


absolute la coeficienţii de corecţie:
n
n icor = i (col. 4).
ki
În reprezentarea grafică, coloanele vor avea o lăţime proporţională cu
lungimea intervalelor, iar înălţimea – proporţională cu frecvenţele corectate:

Fig. 2.9’ - Distribuţia salariaţilor după venitul salarial.

6.
Tabelul 2.11’
Grupe Limite exacte Mărimea Centrul de
intervalului interval
0 1 2 3

a) 8 – 12 7,5 – 12,5 5 10,5


13 – 17 12,5 – 17,5 5 15,5
b) 1,5 – 3,5 1,25 – 3,75 2,5 2,75
4,0 – 6,0 3,75 – 6,25 2,5 5,25
c) 1,50 – 1,75 1,375 – 1,875 0,5 1,75
2,00 – 2,25 1,875 – 2,375 0,5 2,25

Se observă că în toate cele 3 cazuri date avem intervale discontinue.


Calculul limitelor exacte se face astfel:
– la limita inferioară a fiecărui interval se scade jumătate din „unitatea“
de discretizare a intervalelor (unitatea de discretizare ∆ este diferenţa dintre

80
CAPITOLUL 2

limita superioară a unui interval şi limita inferioară a intervalului imediat


următor).
Exemplu: la cazul a), ∆ = 13 – 12 = 1;
la cazul b), ∆ = 4 – 3,5 = 0,5;
la cazul c), ∆ = 2 – 1,75 = 0,25.
– la limita superioară a fiecărui interval se adună jumătate din unitatea de
discretizare a intervalelor.
Limitele astfel calculate se regăsesc în col. 1.
Mărimea intervalului se regăseşte fie ca diferenţa între două limite de
acelaşi fel (inferioare sau superioare) succesive, fie adăugând la diferenţa
dintre limita superioară şi cea inferioară a unui interval unitatea de discre-
tizare (col. 2).
Centrele de interval se obţine adăugând la limita inferioară a fiecărui
interval discontinuu jumătate din mărimea intervalului (col. 3).

7. b), e), f).


8. d).
9. c), e).
10. c).
11. b).
12.
a) este incorect, deoarece pe axa Ox sunt reprezentat variantele unei
variabile calitative, şi de aceea coloanele ar trebui să aibă lăţimi egale;
b) este incorect, deoarece coloanele ar trebui să fie disparate, puţin
distante unele de altele, pentru a nu da senzaţia de continuitate pe
axa Ox.
c) este corect;
d) este incorect, deoarece axa Oy îşi are originea în 10, nu în 0, aşa
cum este cazul scalei de raport;
e) este incorect, deoarece scările de reprezentare nu au fost alese
echilibrat pe cele 2 axe, (graficul este prea extins pe orizontală,
ceea ce duce la falsa aplatizare, alternare a variaţiei fenomenului).
f) este incorect deoarece pe axa Oy trebuie figurată o întrerupere de
scară (între 0 şi 10).

Aşadar, incorecte sunt graficele a), b), d), e), f).

81
STATISTICĂ ECONOMICĂ

Teste propuse spre rezolvare

1. Care dintre următoarele afirmaţii privind distribuţiile de frecvenţe nu este


adevărată:
a) Datele dintr-o distribuţie de frecvenţe nu sunt prezentate în ordinea
înregistrării;
b) Datele dintr-o distribuţie de frecvenţe sunt condensate într-un singur
indicator;
c) Distribuţia de frecvenţe arată numărul de observaţii care se încadrează în
fiecare grupă/clasă;
d) Distribuţiile de frecvenţe fac parte din statistica descriptivă;
e) Distribuţiile de frecvenţe pot, uneori, distorsiona distribuţia întregului set de
date.

2. Considerăm următoarea distribuţie de frecvenţe a temperaturilor zilnice:


Tabelul 2.12’
Clase de temperatură (C) Frecvenţe (zile)
0 1

(-5) – (-3) 14
(-2) – 0 27
1–3 3
4–6 5
7–9 1
Total 50

În câte zile temperatura a fost mai mare decât (nu egală cu) punctul de îngheţ?
a) 41;
b) 36;
c) 27;
d) 9;
e) nu se poate determina pe baza informaţiilor disponibile.

3. Pe baza distribuţiei prezentate la problema 2, să se precizeze în câte zile


temperatura a fost mai mică decât (nu egală cu) punctul de îngheţ:
a) 9;
b) 41;
c) 27;
d) 14;
e) nu se poate determina pe baza informaţiilor disponibile.

4. Distribuţia de frecvenţe prezentată la problema 2 este:


a) simetrică;

82
CAPITOLUL 2

b) asimetrică spre dreapta (predomină valorile mici);


c) asimetrică spre stânga (predomină valorile mari);
d) în formă de U;
e) în formă de J.

5. Ce este greşit în următoarea distribuţie de frecvenţe a preţurilor diferitelor


tipuri de fructe tropicale, practicate de vânzătorii din pieţele unui oraş?

Tabelul 2.13’
Intervale de variaţie a preţului Număr de vânzători (frecvenţe)
(mii lei)
0 1

18-20 20
20-22 15
22-24 25
24-26 4
26-28 11
28-29 20
Total 95

a) Sunt prea puţine intervale de variaţie;


b) Sunt prea multe intervale de variaţie;
c) Distribuţia nu este normală sau cu tendinţă de normalitate;
d) Intervalele sunt de mărime inegală;
e) Nu sunt precizate cu exactitate limitele intervalelor.

6. Considerăm următoarea distribuţie a sumelor încasate în plus de un vânzător,


ca urmare a diferenţelor de gramaj la cântărirea unui produs:
Tabelul 2.14’
Intervale de variaţie Număr de cazuri
(mii lei) (frecvenţe)
0 1

0,01 - 1,00 1
1,01 – 2,00 0
2,01 – 3,00 1
3,01 – 4,00 0
4,01 – 5,00 2
5,01 – 6,00 1
6,01 – 7,00 1
7,01 – 8,00 2
Total 8

Ce este greşit în această distribuţie de frecvenţe?

83
STATISTICĂ ECONOMICĂ

a) Nu sunt precizate cu exactitate limitele intervalelor de variaţie;


b) Sunt prea puţine intervale de variaţie;
c) Sunt prea multe intervale de variaţie;
d) Mărimea intervalului de variaţie nu este multiplu de 5;
e) Intervalele de variaţie sunt de mărime neegală.

7. Pentru distribuţia prezentată la problema 6, limitele exacte ale primului


interval sunt:
a) 0,01 şi 1,01;
b) 0,00 şi 0,99;
c) 0,01 şi 1,00;
d) 0,00 şi 1,00;
e) 0,005 şi 1,005.

8. Pentru distribuţia prezentată centrul de interval al primului interval este:


a) 0,51;
b) 0,50;
c) 0,55;
d) 0,49;
e) 0,505.

9. Un set de date privitoare la o variabilă conţine valori cuprinse între 36 şi 324.


Se doreşte alcătuirea unei distribuţii de frecvenţe cu 12 intervale de variaţie.
Mărimea intervalului de variaţie este:
a) 23;
b) 12;
c) 10;
d) 25;
2) 288.

10. Cum apreciaţi că este distribuţia de frecvenţe reprezentată mai jos?

84
CAPITOLUL 2

Frecvenþe

o lei

Fig. 2.10’

a) Simetrică;
b) Asimetrică spre dreapta;
c) Asimetrică spre stânga;
d) În formă de J;
e) În formă de U.

11. Presupunem că doriţi să alcătuiţi o serie de distribuţie de frecvenţe pentru


valoarea vânzărilor zilnice ale unui produs.
În care dintre următoarele cazuri este cel mai probabil să alcătuiţi o serie cu 8-
10 intervale?
a) Doriţi să aflaţi în câte zile vânzările sunt sub 8 milioane lei;
b) Sunt 10 observaţii în setul de date;
c) Vânzările zilnice sunt identice pe perioada considerată;
d) Variabila are o amplitudine mare a variaţiei;
e) Preţul este calculat în dolari.

12. Care este avantajul histogramei ca metodă de prezentare a datelor?


a) Mărimea neegală a intervalelor nu afectează graficul;
b) Ariile coloanelor sunt proporţionale cu frecvenţele claselor;
c) Nu apar niciodată valori negative;
d) Valorile extreme sunt uşor de reprezentat;
e) Se poate construi şi în sistemul de coordonate polare.

13. Considerăm următoarea distribuţie de frecvenţe:

85
STATISTICĂ ECONOMICĂ

Tabelul 2.15’
Intervale (metri) Frecvenţe
0 1
10,50 – 10,99 20
11,00 – 11,49 15
11,50 – 11,99 30
12,00 – 12,49 38
12,50 – 12,99 36
13,00 – 13,49 90
13,50 – 13,99 215
14,00 – 14,49 198
14,50 – 14,99 128
Total 770

a) Care este centrul de interval al primului interval?


b) Care sunt limitele exacte ale primului interval?
c) Câte unităţi au valoarea variabilei mai mică decât 12,00?
d) Câte unităţi au valoarea variabilei mai mare decât 12,00?
e) Distribuţia este simetrică sau asimetrică?
f) Construiţi histograma şi poligonul frecvenţelor pentru această distribuţie
de frecvenţe?
g) Calculaţi frecvenţele relative, frecvenţele cumulate şi reprezentaţi-le
grafic.

14. Un set de date conţine observaţii cu valori între 124 şi 298.


Dacă dorim construirea unei distribuţii de frecvenţe pe 9 intervale egale:
a) Determinaţi mărimea intervalului de grupare;
b) Propuneţi valoarea minimă de la care se porneşte construirea intervalelor;
c) Stabiliţi limitele şi centrul primului interval.

15. Construiţi o histogramă şi un poligon al frecvenţelor pentru o distribuţie de


frecvenţe:
a) simetrică;
b) asimetrică, în care predomină valorile mici;
c) asimetrică, în care predomină valorile mari;
d) altfel decât a), b) şi c).

16. Pentru următoarele valori: 40, 50, 10, 6, 15, 23, 39, 42, 62, 65, 1, 19, 32, 7,
24, 68, 29, 72, 74, 62, 58, 9, 23, 23, 25, 76, 22, 2, 54, 53,
a) Construiţi o serie de distribuţie de frecvenţe începând de la valoarea 0, pe
10 intervale de variaţie de mărime egală;
b) Construiţi histograma şi poligonul frecvenţelor;
c) Calculaţi frecvenţele cumulate şi reprezentaţi-le grafic.

86
CAPITOLUL 2

17. Numărul unor componente electrice respinse ca necorespunzătoare calitativ,


din loturi de câte 250 bucăţi, a fost înregistrat pentru 40 de loturi recente. Datele
sunt următoarele:
3, 2, 7, 5, 3, 1, 1, 7, 0, 6, 2, 4, 3, 2, 1, 5, 2, 2, 4, 5, 0, 3, 1, 5, 4, 3, 2, 1, 0, 6, 3, 5, 7,
4, 0, 1, 7, 6, 3, 2.
a) Construiţi distribuţia de frecvenţe pe baza datelor;
b) Construiţi histograma şi poligonul frecvenţelor;
c) Identificaţi valoarea/valorile extreme;
d) Înlăturaţi valoarea/valorile extreme şi construiţi o nouă histogramă.

18. Notăm:
I. Omogenitate; II. Unicitate; III. Variabilitate; IV. Universalitate; V. Depen-
denţă.
Principiile după care se efectuează gruparea/clasificarea datelor sunt:
a) I, II, III;
b) I, III, IV;
c) II, III, IV, V;
d) I, II, IV;
e) I, II, IV, V.
19. Frecvenţa relativă cumulată descrescător corespunzătoare unei grupe
reprezintă:
a) numărul de unităţi care au valoarea caracteristicii mai mare sau egală cu
limita inferioară a grupei;
b) ponderea unităţilor care au valoarea caracteristicii între limita inferioară şi
cea superioară a grupei;
c) ponderea unităţilor care au valoarea caracteristicii mai mică decât limita
superioară a grupei;
d) ponderea unităţilor care au valoarea caracteristicii mai mare sau egală cu
limita inferioară a grupei;
e) numărul unităţilor care au valoarea caracteristicii mai mică sau egală cu
limita inferioară a grupei.

20. Frecvenţele reduse la un interval etalon se utilizează:


a) în cazul grupărilor pe intervale egale;
b) în cazul grupărilor pe intervale neegale;
c) pentru asigurarea comparabilităţii datelor;
d) pentru asigurarea omogenităţii datelor;
e) se obţin prin raportarea frecvenţelor absolute la un factor de corecţie,
reprezentând numărul intervalelor de grupare ce încap într-un interval
etalon.

87
STATISTICĂ ECONOMICĂ

21. Gruparea firmelor care au vechime în activitate de până la 5 ani, după


judeţul în care-şi desfăşoară activitatea, este o grupare:
a) cronologică;
b) combinată;
c) teritorială;
d) după o caracteristică numerică, şi anume „vechimea“;
e) după o caracteristică calitativă, şi anume „firma“.

22. Pentru distribuţia a 200 de muncitori, după timpul lucrat în medie pe zi, se
dă următoarea reprezentare grafică:

Frecvenþe
100
100
90 80
80
70
60 50
50
40
40
30 25
20
10 timp mediu
~

0 7,0 7,2 7,4 7,6 7,8 8,0 lucrat (ore)

Fig. 2.11’ - Distribuţia muncitorilor după timpul lucrat.

Distribuţia din figura 2.18 de mai sus reprezintă:


a) o distribuţie heterogradă de frecvenţe absolute;
b) o distribuţie heterogradă de frecvenţe absolute cumulate crescător;
c) o distribuţie homogradă de frecvenţe absolute cumulate descrescător;
d) o distribuţie heterogradă de frecvenţe relative cumulate descrescător;
e) o distribuţie homogradă de frecvenţe relative cumulate.

23. O diagramă polară se foloseşte la reprezentarea grafică a:


a) unei serii teritoriale;
b) unei distribuţii de frecvenţe relative;
c) unei serii cronologice care prezintă variaţii sezoniere;
d) unei serii de orice tip, când folosim pentru reprezentarea grafică o scară
logaritmică;
e) când nu se pot folosi alte tipuri de grafice;

88
CAPITOLUL 2

24. Diagramele de suprafaţă prin figuri geometrice bidimensionale se folosesc


când:
a) avem de reprezentat grafic date bivariate;
b) avem de reprezentat grafic frecvenţe relative;
c) avem de reprezentat grafic fenomene independente;
d) avem de reprezentat grafic o caracteristică complexă ce se descompune în
produsul a doi factori;
e) în nici unul dintre cazurile menţionate.

25. 40 de studenţi ai unei facultăţi economice au obţinut următoarele rezultate


la un test de statistică:
63; 88; 79; 92; 86; 87; 83; 78; 40; 67; 68; 76; 46; 81; 92; 77; 84; 76; 70; 76;
77; 75; 98; 81; 82; 81; 87; 78; 70; 60; 64; 79; 52; 82; 77; 81; 77; 70; 74; 61.
a) Să se sistematizeze datele pe intervale egale de variaţie, în variantele:
– intervale continue;
– intervale discontinue.
b) Să se reprezinte grafic informaţiile sistematizate.

26. Calculaţi limitele exacte, mărimea intervalelor şi centrele de interval în


cazul următoarelor grupuri:
a) 5 – 10 b) 5 – 10 c) 100 – 124 d) 1,0 – 6,5
10 – 15 11 – 16 125 – 149 7,0 – 12,5

27. Se dă următoarea reprezentare grafică, privind distribuţia a 50 de firme


dintr-un judeţ în funcţie de numărul salariaţilor:

Numãr de
firme 50
50
43
40
35
30
20
20
7
10
Numãr de
0 10 20 30 40 50 60 salariaþi

Fig. 2.12’ - Distribuţia firmelor după numărul angajaţilor.

a) Ce tip de distribuţie s-a reprezentat grafic?

89
STATISTICĂ ECONOMICĂ

b) Calculaţi frecvenţele relative şi reprezentaţi-le grafic.


c) Determinaţi frecvenţele relative cumulate crescător şi descrescător şi
interpretaţi valorile corespunzătoare grupelor de firme care au între 40 –
50 salariaţi.

28. Distribuţia a 96 de unităţi comerciale după suprafaţa comercială este


următoarea:

Tabelul 2.16’
Intervale de variaţie a Număr de unităţi comerciale
suprafeţei comerciale
(m2)
0 1
110 – 114 1
115 – 119 3
120 – 124 8
125 – 129 11
130 – 134 17
135 – 139 22
140 – 144 14
145 – 149 6
150 – 154 10
155 – 159 3
160 – 164 1

a) Care este lungimea fiecărui interval?


b) Dar centrele de interval?
c) Care sunt limitele exacte ale intervalelor?
d) Presupuneţi că selectaţi aleator încă 4 unităţi comerciale, cu suprafeţele
comerciale: 115,5; 134,5; 161 şi 141. În ce intervale le veţi include?

29. Înălţimea şi greutatea a 45 de studenţi ai unei facultăţi, selectaţi aleator, sunt


următoarele:
Tabelul 2.17’
Student 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Înălţime 178 181 174 173 200 185 170 169 166 170 165 180 161 167 180
(cm)
Greutate 58 74 64 66 75 70 50 58 54 51 58 57 48 53 70
(Kg)

Tabelul 2.17’ continuare


Student 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Înălţime 192 164 162 180 180 164 180 165 160 164 165 166 190 178 157
(cm)
Greutate 76 52 49 80 70 48 68 53 44 54 54 57 75 75 40
(Kg)

90
CAPITOLUL 2

Tabelul 2.17’ continuare


Student 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45
Înălţime 165 160 160 154 162 181 166 189 168 173 165 168 179 176 165
(cm)
Greutate 55 50 49 44 47 68 55 75 53 63 51 51 68 63 50
(Kg)

a) Să se grupeze studenţii pe cinci intervale de mărime egală după înălţime şi să


se reprezinte grafic.
b) Pentru distribuţia de frecvenţe de la punctul a), să se calculeze frecvenţele
absolute cumulate şi să se reprezinte grafic.
c) Să se efectueze o grupare combinată a studenţilor după înălţime şi greutate
(se vor lua şi pentru greutate tot cinci intervale egale); să se reprezinte grafic
rezultatele.

30. Numărul comenzilor primite de o companie în ultimele 25 de zile


lucrătoare este:

3 0 1 4 4
4 2 5 3 6
4 5 1 4 2
3 0 2 0 5
4 2 3 3 1

a) Sistematizaţi numărul comenzilor primite sub forma unei distribuţii de


frecvenţe;
b) Construiţi un grafic adecvat pentru reprezentarea rezultatelor
sistematizării;
c) Comentaţi distribuţia obţinută.

31. Operaţiile necesare a fi efectuate pe două tipuri de maşini sunt de trei


categorii: întreţinere uzuală, înlocuire parţială, reparaţii speciale. Pentru
ultimele 12 luni se dau datele:
Tabelul 2.18’
Tipul operaţiei Frecvenţe
Tipul de maşină X Tipul de maşină Y
0 1 2

Întreţinere uzuală 12 14
Înlocuire parţială 6 2
Reparaţii speciale 2 4

91
STATISTICĂ ECONOMICĂ

Reprezentaţi informaţiile utilizând tipurile de grafice adecvate.

32. Se dau cheltuielile săptămânale cu transportul în comun ale locuitorilor


din cele trei zone ale unui oraş:
Tabelul 2.19’
Cheltuieli săptămânale de Ponderea locuitorilor din zona (%)
transport (u.m.) A B C
0 1 2 3

sub 2 60 40 20
2-4 30 30 30
4-6 10 30 50
Descrieţi datele prezentate folosind cât mai multe tipuri de reprezentări
grafice adecvate. Comentaţi.

33. Construiţi o histogramă pentru informaţiile din tabelul următor:


Tabelul 2.20’
Intervale de variaţie a Număr de firme
profitului/pierderilor (u.m.)
0 1

sub -15 20
-15 ÷-10 38
-10 ÷ - 5 178
-5 ÷ 0 580
0÷5 360
5 - 10 114
peste 10 14

92
CAPITOLUL 3

CAPITOLUL 3

ANALIZA ŞI DESCRIEREA NUMERICĂ A


SERIILOR STATISTICE UNIVARIATE

Consideraţii preliminare
Cel mai adesea, urmărim să caracterizăm prin indicatori statistici —
măsuri cantitative — datele statistice pe care le avem la dispoziţie. Scopul
capitolului următor este să prezinte indicatorii statistici, primari şi derivaţi,
simpli şi sintetici, ce se folosesc în mod frecvent pentru caracterizarea
statistică a seriilor statistice.
Vom putea, astfel, să analizăm tendinţa centrală, dar şi variabilitatea
datelor, forma distribuţiilor şi concentrarea datelor.
Să notăm şi faptul că, datorită particularităţilor lor, indicatorii
statistici ai seriilor cronologice vor fi trataţi într-un capitol distinct.

Termeni cheie
abatere individuală indicator
abatere intercuartilică indicatori de poziţie
abatere medie liniară indicatori derivaţi
abatere medie pătratică indicatori primari
abatere semiintercuartilică mărime medie
amplitudine mărimi relative
aplatizare. mediană
asimetrie medie aritmetică
boltire medie armonică
coeficient de determinaţie medie geometrică
coeficient de variaţie medie pătratică
cuantile mod
cuartile percentile
decile regula de adunare a dispersiilor
diagramă Box- Plot variabilitate
dispersie

93
STATISTICĂ ECONOMICĂ

Noţiuni teoretice

3.1. INTRODUCERE

În acest capitol, vom continua să examinăm modalităţile prin care


putem să rezumăm seturile de date statistice, în aşa fel încât trăsăturile lor
esenţiale să poată fi puse în evidenţă. În capitolele precedente, am învăţat
cum să grupăm datele brute într-o formă mai uşor de interpretat şi cum să
construim diferite reprezentări grafice ale datelor sistematizate. Având la
dispoziţie un set de date numerice, am început analiza statistică prin
determinarea valorii maxime şi valorii minime, apoi am determinat o
distribuţie de frecvenţe, histograma şi poligonul frecvenţelor. Aceste
instrumente au permis identificarea formei aproximative a distribuţiei şi au
indicat în jurul cărei valori sunt mai concentrate nivelurile individuale ale
variabilei.
Deşi o distribuţie de frecvenţe este, cu siguranţă, utilă în conturarea
unei idei de ansamblu privind distribuţia datelor între cele două valori
extreme, vom dori, în continuare, să rezumăm mai mult datele, calculând
câţiva indicatori statistici descriptivi. Indicatorii numerici descriptivi oferă
valori precise şi determinate în mod obiectiv, valori care pot fi uşor folosite,
interpretate şi comparate una cu alta. Pe scurt, aceştia permit o analiză mai
atentă a datelor, faţă de impresia generală pe care o oferă prezentarea datelor
sub formă de serii, tabele şi grafice.

3.2. INDICATORI STATISTICI PRIMARI ŞI DERIVAŢI

DEFINIŢIE: Indicatorul statistic — în sens larg — reprezentă expresia


numerică a unor fenomene şi procese social-economice, definite în timp,
spaţiu şi structură organizatorică.

Indicatorii statistici pot fi primari şi derivaţi.

Indicatorii primari se obţin, de regulă, în etapa de sistematizare a


datelor statistice, prin centralizarea şi agregarea acestora.
94
CAPITOLUL 3

Indicatorii derivaţi se obţin prin prelucrarea mărimilor absolute ale


indicatorilor primari.

Cele trei proprietăţi majore ale seriilor de date numerice, pe care le


putem analiza folosind indicatorii statistici sunt cele privitoare la tendinţa
centrală, la variabilitatea şi la forma distribuţiilor.

3.3. INDICATORI AI TENDINŢEI CENTRALE

O clasificare a indicatorilor tendinţei centrale se poate face, în


funcţie de modul de determinare a lor, în:
— indicatori (mărimi) medii de calcul: media aritmetică, armonică,
pătratică, geometrică etc.;
— indicatori medii de poziţie: modul, mediana.
Indicatorii fundamentali ai tendinţei centrale sunt: media
aritmetică, modul şi mediana, dar în anumite cazuri speciale putem apela
şi la alte tipuri de medii.

3.3.1. Media aritmetică

Media aritmetică (x ) reprezintă valoarea care înlocuind toţi


termenii unei serii nu modifică nivelul lor totalizator şi se calculează ca
suma valorilor raportată la numărul lor.
n
¦ xi
i =1
x= (3.1)
n
EXEMPLUL 3.1: Vechimea în muncă a fost înregistrată pentru cinci
salariaţi ai unei firme şi anume: 7, 5, 6,7 şi 8 ani. Vechimea medie este:
7 + 5 + 6 + 7 + 8 33
x= = = 6,6 ani
5 5
Observăm din fig. 3.1. cum media aritmetică pune în balanţă toate
valorile individuale:

5 6 7 8
X =6,6 ani
Fig. 3.1. Balansarea valorilor individuale prin calculul mediei

95
STATISTICĂ ECONOMICĂ

De asemenea, dacă vom considera următoarele date privind


vechimea în muncă, vom observa cum media aritmetică este afectată de
valorile extreme. Astfel, dacă presupunem că datele pentru vechimea în
muncă a 10 salariaţi sunt: 5, 4, 5, 5, 6, 6, 4 şi 20, atunci vechimea medie
este:
5 + 4 + ... + 4 + 20
x= = 6,6 ani
10

0 5 10 15 20
X =6,6 ani
Fig. 3.2. Balansarea valorilor individuale prin calculul mediei

În cazul în care datele au fost sistematizate într-o serie de distribuţie


(
de frecvenţe, în care valorile / centrele intervalelor de variaţie x i , i = 1, r )
apar cu frecvenţele ni media aritmetică (numită şi medie aritmetică
ponderată) este:
r
¦ xini
i =1
x= r
(3.2)
¦ ni
i =1

EXEMPLUL 3.2: Presupunem că pentru 200 de persoane s-au siste-


matizat datele culese cu privire la timpul zilnic petrecut în faţa televizorului,
rezultând (Tabelul 3.1):
Tabelul 3.1
Timp (min.) Număr de persoane xi xi • ni
(frecvenţe) ni
Până la 30 47 15 705
30-60 51 45 2295
60-90 76 75 5700
90-120 24 105 2520
120 şi peste 2 135 270
Total 200 – 11490

96
CAPITOLUL 3

r
¦ xini
i =1 11490
x= r
= = 57,45 minute
200
¦ ni
i =1

Asupra mediei aritmetice sunt de făcut câteva observaţii şi de


subliniat câteva proprietăţi:

a) Pentru un şir de valori constante, media este egală cu constanta;


b) Media are întotdeauna valoarea cuprinsă între valoarea minimă
din serie (xmin) şi valoarea maximă (xmax);
c) Suma abaterilor valorilor individuale (xi) de la media lor ( x ) este
întotdeauna egală cu zero (adică distanţele faţă de centru se balansează, se
compensează perfect);
d) Dacă valorile individuale ale unei variabile sunt mărite sau
micşorate cu constanta „a“, atunci media se modifică şi ea, în acelaşi sens,
cu aceeaşi constantă „a“;
e) Dacă valorile individuale ale unei variabile sunt modificate de h
ori, media se modifică şi ea de h ori;

Din aceste două proprietăţi, d) şi e), rezultă formula de calcul


simplificat al mediei aritmetice, pentru valori reduse cu constanta „a“ şi de h
§ x −a ·
ori ¨ x ’i = i , i = 1, n ¸ :
© h ¹
n n x −a

¦ xi ¦ i
x = i =1 ⋅ h + a = i =1 h ⋅ h + a (3.3)
n n
iar pentru o serie de distribuţie de frecvenţe:
r r x −a

¦ xini ¦ i ni
x = i =1 r
⋅ h + a = i =1 h
r
⋅h +a (3.4)
¦ ni ¦ ni
i =1 i =1

EXEMPLUL 3.3: Pe baza datelor din Tabelul 3.1 putem alege a=75,
h=30 şi atunci:

97
STATISTICĂ ECONOMICĂ

Tabelul 3.2
Timp (min.) Frecvenţe ni xi xi – a x i’ ⋅ n i
x i’ =
h
< 30 47 15 -2 - 94
30-60 51 45 -1 - 51
60-90 76 60 0 0
90-120 24 105 1 24
120 şi peste 2 135 2 4
Total 200 – – -117
r

¦ xini
i =1 − 117
x= r
⋅h +a = ⋅ 30 + 75 = 57,45 minute
200
¦ ni
i =1

f) Într-o serie de distribuţie de frecvenţe, dacă frecvenţele sunt


modificate de „c“ ori, media rămâne neschimbată.
Dacă „c“ reprezintă volumul total al colectivităţii §¨ n = ¦ n i ·¸ ,
r

© i =1 ¹
ni ni
frecvenţele sunt chiar frecvenţele relative n *i = , i = 1, r şi rezultă,
c n
deci:
r
*
¦ xi ⋅ ni
i =1
x= (3.5)
1
sau, dacă frecvenţele relative au fost exprimate în procente:
r
*%
¦ xi ⋅ ni
i =1
x= (3.6)
100

g) Dacă o serie statistică este alcătuită din mai multe serii


componente, pentru care s-au calculat medii parţiale x j , j = 1, m , atunci( )
media întregii serii poate fi calculată ca o medie aritmetică ponderată din
mediile parţiale:
m
¦ x jn j
j=1
x= m
(3.7)
¦nj
j=1

98
CAPITOLUL 3

unde nj reprezintă volumul seriei componente j (j = 1, m )

EXEMPLUL 3.4: Într-o colectivitate de 60 de persoane, din care 24 de


sex feminin şi 36 de sex masculin, s-a determinat vârsta medie a persoanelor
de sex feminin x F = 38,1 ani şi vârsta medie a persoanelor de sex masculin
x M = 42,2 ani. Vârsta medie în întreaga colectivitate este:
x F n F + x M n M 24 ⋅ 38,1 + 36 ⋅ 42,2
x= = = 40,56 ani
nF + nM 60

h) Pentru două caracteristici statistice X şi Y, pentru care s-au


calculat mediile x şi, respectiv, y , media sumei valorilor individuale (xi +
yi) este întotdeauna egală cu suma mediilor:
x+y=x+y (3.8)

i) Pentru două caracteristici statistice X şi Y, pentru care s-au


calculat x şi y , media produsului (xi • yi) este egală cu produsul mediilor,
doar dacă cele două variabile sunt independente:

xy = x ⋅ y (3.9)

3.3.2. Media unei variabile de tip alternativ

În cazul în care variabila studiată este de tip alternativ (dihotomic),


atunci celor două variante de răspuns (afirmativ şi negativ) li se vor acorda,
convenţional, valorile numerice 1 şi, respectiv, 0. Pentru calculul mediei
aritmetice, datele le putem sistematiza astfel (Tabelul 3.3):
Tabelul 3.3
Varianta de răspuns xi Frecvenţe ni Frecvenţe relative n *i
Afirmativ 1 m m
=f
n
Negativ 0 n-m n−m
= 1− f
n
Total – n 1

99
STATISTICĂ ECONOMICĂ

2
¦ xini
i =1 1 ⋅ m + 0(n − m ) m
x= = = =f (3.10)
n n n

3.3.3. Indicatori de poziţie

Indicatorii medii de poziţie sunt: modul şi mediana. Mediana face


parte din indicatorii (mai generali) de poziţie, numiţi cuantile, alături de
cuartile, decile etc.

3.3.3.1 Valoarea modală

Modul (M0) reprezintă valoarea cel mai des întâlnită într-o serie
statistică sau cea care are cea mai mare frecvenţă de apariţie.
În cazul seriilor de distribuţie de frecvenţe pe intervale de variaţie,
determinarea modului presupune mai întâi, identificarea intervalului cu frec-
venţă maximă (int M0). Apoi, modul se poate determina conform relaţiei:

§ d1 ·
M 0 = x inf M 0 + ¨¨ ¸¸ h M 0 (3.11)
© d1 + d 2 ¹
unde: xinfMo reprezintă limita inferioară a intervalului modal;
h M0 reprezintă mărimea intervalului modal;
d1 reprezintă diferenţa dintre frecvenţa intervalului modal şi a celui
precedent;
d2 reprezintă diferenţa dintre frecvenţa intervalului modal şi a celui
următor.

EXEMPLUL 3.5: Pentru datele din tabelul 3.1. valoarea modală este:
M 0 = 60 +
(76 − 51) ⋅ 30 = 69,74 minute
(76 − 51) + (76 − 24)
O distribuţie cu un singur mod se numeşte unimodală (fig. 3.3a),
o distribuţie este bimodală dacă are două valori dominante (moduri) (fig.
3.3b) şi multimodală dacă are mai mult de două moduri (fig. 3.3c).

100
CAPITOLUL 3

y y y
Frecvenþe

Frecvenþe
Frecvenþe
M0 x o M01 M02 x o M01 M02 M03 x
o
a) b) c)

Fig. 3.3 - Distribuţie de frecvenţe: a) unimodală; b) bimodală; c) multimodală

3.3.3.2 Mediana

Mediana (Me) este un indicator mediu de poziţie care face parte din
categoria cuantilelor. Ea reprezintă valoarea/varianta din mijlocul unei serii
de date, serie în care observaţiile au fost ordonate crescător (sau descrescă-
tor).
Dacă datele au fost sistematizate într-o serie de distribuţie de frec-
venţe pe variante, pentru determinarea medianei vom calcula, mai întâi,
frecvenţele cumulate (Fci). Prima frecvenţă cumulată mai mare decât
(n+1)/2, adică mai mare decât locul medianei, ne indică varianta mediană.

EXEMPLUL 3.6: Pentru 80 de familii dintr-un bloc (n=80), s-au siste-


matizat datele privind numărul membrilor de familie, rezultând distribuţia
de frecvenţe (Tabelul 3.4):
Tabelul 3.4
Numărul membrilor de Număr de familii ni Frecvenţe cumulate Fci
familie
1 12 12
2 23 35
3 30 65
4 8 73
5 7 80
Total 80 –

Varianta „3 membrii de familie“ reprezintă varianta mediană, situată


în mijlocul distribuţiei;

Pentru o serie de repartiţie de frecvenţe pe intervale de variaţie


(date de tip continuu), mediana se va încadra în intervalul median, primul

101
STATISTICĂ ECONOMICĂ

interval cu frecvenţa cumulată mai mare decât locul (rangul, poziţia) media-
nei.

1§ r ·
¨ ¦ n i + 1¸ − FC( Me−1)
2 © i=1 ¹
Me = x inf Me + h Me (3.12)
n Me

unde:
x inf Me reprezintă limita inferioară a intervalului median;
h Me reprezintă mărimea intervalului median;
1§ r · n +1
¨ ¦ n i + 1¸ = reprezintă locul medianei în serie;
2 © i =1 ¹ 2
FC(Me - 1) reprezintă frecvenţa cumulată a intervalului anterior celui
median;
nMe reprezintă frecvenţa absolută a intervalului median.

EXEMPLUL 3.7: Pe baza datelor din Tabelul 3.1,


100,5 − 98
Me = 60 + 30 ≈ 61 minute
76

3.3.3.3. Relaţia dintre mod, mediană şi medie


Me

Pentru o distribuţie simetrică, media, mediana şi modul coincid (Fig.


3.3a). Dacă distribuţia este cu tendinţă de normalitate dar pozitiv înclinată,
spre valori mari (cu coada mai lungă a distribuţiei spre valorile mari) atunci
x > Me > M 0 (Fig. 3.4b); dacă distribuţia este moderat oblică şi negativ
încheiată, spre valorile mici (cu coada mai lungă a distribuţiei spre valorile
mici, atunci x < Me < M 0 (Fig. 3.4c). În general, pentru repartiţii moderat
asimetrice, există o relaţie empirică între cele trei valori şi anume:

(
M 0 − x ≈ 3 Me − x ) (3.13)

102
CAPITOLUL 3

y y y

o x=Me=Mo x o Mo Me x x o x Me Mo x

Fig. 3.4 - a) distribuţie simetrică; b) distribuţie cu asimetrie pozitivă;


c) distribuţie cu asimetrie negativă

3.3.3.4. Cuantilele

Cuantilele, categorie de indicatori de poziţie din care face parte şi


mediana, pot fi uşor înţelese intuitiv prin extinderea noţiunii de mediană şi
reprezintă valori ce împart seria în părţi egale.

y Astfel,
cuartilele (cuantile
Frecvenþe relative

de ordin patru) împart seria


în patru părţi egale, ele
delimitând câte
25% din observaţii. Ele sunt
în număr 25% 25% 25% 25% de trei: Q1, Q2, Q3
(fig. x 3.5); Q1 se numeşte
o Q1 Q2=Me Q3
cuartila inferioară, Q2 este
egală Fig. 3.5 - Cuartilele într-o serie de repartiţie întotdeauna cu
mediana, Q3 se numeşte
cuartila superioară.
Similar se pot determina cuantile de ordin superior, ca de pildă
decilele (care sunt D1, ...., D9 şi delimitează câte 10% din observaţii, D5 =
Me) ori percentile (delimitează câte 1% din observaţii).

3.3.4. Alte tipuri de medii

3.3.4.1. Media armonică

( )
Media armonică x h este o medie de calcul cu aplicaţii speciale,
care se determină, pentru o serie de date cantitative, ca valoarea inversă a

103
STATISTICĂ ECONOMICĂ

mediei aritmetice, calculată din inversele valorilor seriei. Aşadar media


armonică simplă este:
n
xh = n (3.14)
1
¦
i =1 x i
Pentru o serie de distribuţie de frecvenţe, media armonică ponderată
este:
r
¦ ni
i =1
xh = (3.15)
r 1
¦ ni
i =1 x i
1
xh = r (3.16)
1 *
¦ ni
i =1 x i
100
xh = r (3.17)
1 *%
¦ ni
i =1 x i

EXEMPLUL 3.8: Un conducător auto cumpără ulei de motor, la preţul


de 90.000 lei/litru, în valoare totală de 450.000 lei dintr-un magazin, iar din
alt magazin, la preţul de 120.000 lei/litru, în valoare totală de 480.000 lei.
Care a fost preţul mediu pe litru, pe care l-a plătit?

¦ vi ¦ vi 450000 + 480000
p= = = = 103333,3 lei/litru
¦ qi ¦ v1 1 1
i ⋅ 450000 + ⋅ 480000
pi 90000 120000

3.3.4.2. Media pătratică

Media pătratică x p este tot o medie de calcul cu aplicaţii speciale


şi reprezintă valoarea care, înlocuind termenii seriei, nu modifică suma
pătratelor lor. Aşadar:
n
2
¦ xi
i =1
xp = (3.18)
n

104
CAPITOLUL 3

Pentru o serie de distribuţie de frecvenţe, media pătratică ponderată


este:

r
2
¦ xi ni
i =1
xp = r
(3.19)
¦ ni
i =1

r
2 *
¦ xi ni
i =1
xp = (3.20)
1

r
2 *%
¦ xi ni
i =1
xp = (3.21)
100

3.3.4.3. Media geometrică

( )
Media geometrică x g se calculează ca rădăcina de ordinul n din
produsul celor n valori ale unei serii de date. Ea este deci, acea valoare care
înlocuind termenii seriei nu modifică produsul lor:
n
xg = n ∏ xi (3.22)
i =1
Pentru o serie de distribuţie de frecvenţe, media geometrică se
calculează ca:
r
¦ ni r
x g = i =1 ∏ x in i (3.23)
i =1

Între mediile de calcul prezentate există relaţia:


xh ≤ xg ≤ x ≤ xp (3.24)

105
STATISTICĂ ECONOMICĂ

3.4. INDICATORI AI VARIABILITĂŢII

În analiza unei serii statistice de date cantitative ne interesează, pe


lângă indicatorii tendinţei centrale şi indicatorii variabilităţii, ai împrăştierii
valorilor. Astfel, două serii statistice pot diferi prin tendinţa centrală (Fig 3.6a),
prin împrăştierea datelor (Fig. 3.6b) sau prin amândouă (Fig. 3.6c).

y y y

o a) x o x o x
b) c)
Fig. 3.6 - a) Distribuţii cu tendinţă centrală diferită; b) Distribuţii cu variabilitate
diferită; c) Distribuţii cu tendinţă centrală şi variabilitate diferite

3.4.1. Indicatori simpli ai variabilităţii

Aceşti indicatori măsoară împrăştierea valorilor individuale ale


seriei, una faţă de alta, ori faţă de o valoare tipică.

3.4.1.1. Amplitudinea variaţiei

Amplitudinea variaţiei (Ax) se calculează ca valoarea maximă


minus valoarea minimă a variabilei:
Ax = xmax — xmin (3.25)

În expresie relativă amplitudinea se calculează ca:

x max − x min
A%
x = 100 (3.26)
x

3.4.1.2. Abaterea intercuartilică şi semiintercuartilică

Un alt indicator simplu al variaţiei este abaterea intercuartilică:

A Q = Q 3 − Q1 (3.27)

106
CAPITOLUL 3

Indicatorul are unitatea de măsură a variabilei studiate şi uneori se


foloseşte şi valoarea sa înjumătăţită, indicator cunoscut ca abaterea
semiintercuartilică:

Q 3 − Q1
A ’Q = (3.28)
2

3.4.1.3. Abaterea individuală

Un alt indicator simplu al variaţiei este abaterea individuală:

di = xi − x (3.29)

care ne arată împrăştierea fiecărei valori de la nivelul mediu.

Abaterea individuală se poate calcula şi în expresie relativă:

xi − x
d i% = (3.30)
x

De asemenea, prezintă interes abaterea maximă pozitivă:

+
d max = x max − x (3.31)

şi abaterea maximă negativă:


d max = x min − x (3.32)

3.4.2. Indicatori sintetici ai variabilităţii

3.4.2.1. Abaterea medie liniară


O primă soluţie la care putem apela pentru a surprinde, printr-o
singură măsură, întreaga împrăştiere din serie este să calculăm media
abaterilor individuale. Dar, pentru că aceste abateri se compensează

107
STATISTICĂ ECONOMICĂ

reciproc, trebuie să le considerăm în valoare absolută. Obţinem, astfel,


( )
abaterea medie liniară d x calculată pentru o serie simplă:
n
¦ xi − x
i =1
dx = (3.33)
n
iar în cazul unei serii de distribuţie de frecvenţe:
r
¦ xi − x ni
i =1
dx =
r
(3.34)
¦ ni
i =1
r
¦ x i − x n *i%
i =1
dx = (3.35)
100
Abaterea medie liniară se exprimă în unitatea de măsură a
caracteristicii şi ne arată cu cât se abat, în medie, valorile individuale de la
media lor.

EXEMPLUL 3.9: Pe baza datelor din Exemplul 3.2, obţinem:


Tabelul 3.5
Timp (min.) Nr. de persoane (ni) xi xi − x ni
până la 30 47 15 1995,15
30-60 51 45 634,95
60-90 76 75 1333,8
90-120 24 105 1141,2
120 şi peste 2 135 155,1
Total 200 – 5260,2
x = 57,45 minute
r
¦ xi − x ni
i =1 5260,2
dx
r
= = 26,30 min
200
¦ ni
i =1

3.4.2.2. Dispersia

( )
Dispersia s 2x se calculează ca media aritmetică a pătratelor
abaterilor individuale ale valorilor de la tendinţa centrală (uzual de la
medie). Pentru o serie simplă, formula dispersiei este:
108
CAPITOLUL 3

∑ (x i − x )
n 2

i =1
s 2x = (3.36)
n
iar pentru o serie de distribuţie de frecvenţe:
¦ (x i − x ) n i
r 2

i =1
s 2x = (3.37)
r
¦ ni
i =1
sau, pe baza frecvenţelor relative:
∑ (x i − x ) n *i%
r 2

i=1
s 2x = (3.38)
100

EXEMPLUL 3.10. Pe baza datelor din exemplul nr. 3.2, obţinem


Tabelul 3.6
Timp (min.) Nr. de persoane (ni) xi
(x i − x )2 ni
până la 30 47 15 84694,12
30-60 51 45 7905,13
60-90 76 75 23408,19
90-120 24 105 54264,06
120 şi peste 2 135 12028,00
Total 200 – 182299,50

¦ (x i − x ) n i
r 2

i =1 182299,5
s 2x = = = 911,4975
r 200
¦ ni
i =1
Se cuvine să facem şi asupra dispersiei câteva observaţii şi să
remarcăm câteva din proprietăţile sale:
a) Pentru un şir de valori constante, dispersia este nulă;
( )
b) Dispersia calculată faţă de medie s 2x este mai mică decât orice
altă dispersie calculată faţă de o valoare “a”, cu pătratul distanţei dintre
medie şi constanta a:
s 2x = s a2 − (x − a )
2
(3.39)
c) Dacă valorile variabilei statistice studiate sunt modificate
(micşorate sau mărite) cu constanta „a“, dispersia seriei rămâne
neschimbată;

109
STATISTICĂ ECONOMICĂ

d) Dacă valorile variabilei statistice studiate se modifică de h ori,


dispersia se modifică (în acelaşi sens) de h2 ori
Rezultă şi în calculul dispersiei că, dacă vom combina proprietăţile 2
şi 4, vom obţine formula de calcul simplificat al dispersiei, pentru o serie
simplă:
2
n § x −a ·
¦¨ i ¸
s 2x = i=1
© h ¹ 2
n
h − x−a ( )2 (3.40)
şi pentru o serie de distribuţie de frecvenţe:
2
r § xi − a ·
¦¨ ¸ ni
s 2x = i =1© h ¹
r
(
h2 − x − a )2 (3.41)
¦ ni
i =1
2
r§ x i − a · *%
¦¨ ¸ ni
s 2x = i=1
© h ¹
100
h2 − x − a ( )2 (3.42)

EXEMPLUL 3.11: Pe baza datelor prelucrate în exemplul 3.3, obţi-


nem:
Tabelul 3.7
Timp (min) Frecvenţe x −a
(x )
2 2
x ’i = i ’ 2 §x −a· x ’i ⋅ n i
ni h i =¨ i ¸
© h ¹
<30 47 -2 4 188
30-60 51 -1 1 51
60-90 76 0 0 0
90-120 24 1 1 24
120 şi peste 2 2 4 8
Total 200 – – 271

2
r § xi − a ·
¦¨ ¸ ni
s 2x = i =1© h ¹
r
(
h2 − x − a )2 = 200
271
⋅ 30 2 − (57,45 − 75)2 = 911,4975
¦ ni
i =1
e) Dispersia se poate calcula şi pe baza relaţiei:

110
CAPITOLUL 3

2
n n  n 
∑ x i2 ∑ x i2  ∑ xi 
i =1 2 i =1  
s 2x = −x = −  i=1  (3.43)
n n n
 
 
 
iar pentru o serie de distribuţie de frecvenţe:
2
r r § r ·
¦ x i2 n i ¦ x i2 n i ¨ ¦ xini ¸
2 ¨ ¸
s 2x = i =1 − x = i =1 − ¨ i =1 ¸ (3.44)
r r r
¦ ni ¦ ni ¨ ¦ ni ¸
¨ ¸
i =1 i =1 © i=1 ¹
2
r r § r ·
¦ x i2 n *i% ¦ x i2 n *i% ¨ ¦ x i n *i% ¸
2 ¨ ¸
s 2x = i=1 − x = i=1 − ¨ i=1 ¸ (3.45)
100 100 100
¨ ¸
¨ ¸
© ¹
f) Dacă o serie este compusă din m serii componente (grupuri),
fiecare serie componentă fiind de volum nj, j = 1, m , atunci se pot calcula
mediile seriilor componente, x j , j = 1, m şi dispersiile seriilor componente:

¦ (x i − x j )
nj
2

i =1
s 2x = , j = 1, m (3.46)
j nj
Dispersia generală a colectivităţii poate să fie scrisă în funcţie de dis-
persiile seriilor componente (grupurilor):
¦ (x j − x ) n j
m m 2
¦ s 2x j n j
j=1 j=1
s 2x = + (3.47)
m m
¦n j ¦nj
j=1 j=1
m
¦ s 2x j n j
j=1
Expresia: m
se numeşte media dispersiilor parţiale
¦nj
j=1

(grupurilor, seriilor componente) şi se notează cu s 2x .

111
STATISTICĂ ECONOMICĂ

m
¦ s 2x j n j
2 j=1
sx =
m
(3.48)
¦nj
j=1

¦ (x j − x ) n j
m 2

j=1
Expresia: m
sintetizează împrăştierea valorilor de la
¦nj
j=1
media generală, doar ca urmare a acţiunii factorului după care s-au alcătuit
grupurile, seriile componente. Această expresie se numeşte dispersia dintre
( )
grupe d 2x :

¦ (x j − x ) n j
m 2

j=1
d 2x = (3.49)
m
¦n j
j=1

Regula de adunare a dispersiilor este, deci:


2
s 2x = s x + d 2x (3.50)

( )
Putem spune că d 2x explică măsura în care factorul de grupare
determină variaţia variabilei studiate şi să calculăm coeficientul de
determinaţie:
d 2x
R2 = (3.51)
s 2x

sau, în expresie procentuală, gradul de determinaţie:


2 d 2x
R% = 100 (3.52)
s 2x

Evident, măsura în care alţi factori (din interiorul grupelor)


determină variaţia variabilei, este dată de coeficientul de nedeterminaţie:
2
sx
K2 = = 1− R2 (3.53)
s 2x

112
CAPITOLUL 3

sau gradul de nedeterminaţie:


2
2 sx 2
K% = 100 = 100 − R % (3.54)
s 2x

EXEMPLUL 3.12: O firmă ce comercializează produse cosmetice a realizat


într-o lună de vară, prin cele 30 de magazine de desfacere situate pe litoral,
o vânzare medie de 400 milioane lei pe magazin, cu o dispersie a vânzărilor
de 2500; iar prin cele 20 de magazine din zona montană, o vânzare medie de
200 milioane lei, cu o dispersie de 1600. Pentru a afla gradul în care zona de
amplasare a magazinelor determină variaţia vânzărilor, vom calcula:
x L ⋅ n L + x M ⋅ n M 30 ⋅ 400 + 20 ⋅ 200 16000
x= = = = 320 mil lei
nL + nM 50 50
2 s 2xL n L + s 2xM n M 2500 ⋅ 30 + 1600 ⋅ 20 107000
sx = = = = 2140
nL + nM 50 50

d 2x =
(x L − x )2 n L + (x M − x )2 n M = (400 − 320)2 30 + (200 − 320)2 20 =
nL + nM 50
480000
= = 9600
50
2
s 2x = s x + d 2x = 2140 + 9600 = 11740
Aşadar
2 d 2x 9600
R% = 100 = 100 = 81,77%
s 2x 11740

3.4.2.3. Dispersia unei variabile de tip alternativ

Pentru o variabilă de tip alternativ, sistematizată ca în tabelul 3.3,


dispersia este:

s f2 = f (1 − f ) (3.55)

3.4.2.4. Abaterea medie pătratică

În studiul variabilităţii datelor se foloseşte rădăcina pătrată a


dispersiei, indicator numit abaterea medie pătratică:

113
STATISTICĂ ECONOMICĂ

¦ (x i − x )
n 2

s x = s 2x = i =1 (3.56)
n
pentru o serie simplă, iar pentru o serie de distribuţie de frecvenţe:

¦ (x i − x ) n i
r 2

i =1
sx =
r
(3.57)
¦ ni
i =1

¦ (x i − x ) n *i%
r 2

sx = i =1 (3.58)
100

Abaterea medie pătratică (numită şi abatere tip, abatere


standard, deviaţie standard sau ecart tip) este calculată ca o medie
pătratică din abaterile termenilor seriei de la media lor. O regulă empirică ne
spune că, pentru serii de distribuţie de frecvenţe cu tendinţă de normalitate
(simetrice sau moderat asimetrice), abaterea medie liniară reprezintă
aproximativ patru cincimi din abaterea medie pătratică:

4
dx ≈ sx (3.59)
5

iar abaterea semiintercuartilică aproximativ două treimi din abaterea stan-


dard:
2
A ′Q ≈ sx (3.60)
3

EXEMPLUL 3.13 Pe baza datelor din Exemplul 3.2, obţinem:


s x = s 2x = 911,4975 = 30,19 minute
d x 26,30
= ≈ 0,87
sx 30,19

3.4.2.5. Coeficientul de variaţie

Pentru asigurarea comparabilităţii împrăştierii datelor se foloseşte


expresia relativă a variabilităţii, coeficientul de variaţie:

114
CAPITOLUL 3

s
v = x 100 (3.61)
x
Cu cât valoarea coeficientului de variaţie este mai mică, cu atât acest
lucru semnifică o omogenitate crescută a datelor.

EXEMPLUL 3.14. Pentru seriile de date:


A: 10; 11; 12; 13; 14; 15; 16
B: 60; 61; 62; 63; 64; 65; 66
sxA 2
vA = 100 = 100 = 15,4%
xA 13
sx B 2
vB = 100 = 100 = 3,2%
xB 63
Evident, variabilitatea relativă este mai scăzută în seria B.

3.4.2.6. Interpretarea abaterii medii pătratice

O regulă empirică, care se aplică distribuţiei normale simetrice sau


moderat asimetrice, ne spune că:
— aproximativ 68%din valori se situează în intervalul x ± σ x ;
— aproximativ 95% din valori se situează în intervalul x ± 2σ x ;
— aproximativ 99,8% din valori se situează în intervalul x ± 3σ x .
(fig. 3.7)
y
≈34%

≈34%
≈13,5%

≈13,5%

o ≈2,5% ≈2,5%
x-3σ x-2σ x-σ x x+σ x+2σ x+3σ x
Amplitudine

Figura 3.7 - Relaţia dintre amplitudine şi


abaterea medie pătratică

115
STATISTICĂ ECONOMICĂ

3.5. INDICATORI AI FORMEI DISTRIBUŢIEI

Forma unei distribuţii de frecvenţe se analizează, comparativ cu


distribuţia ideală, normală, prin: indicatori asimetrici (oblicităţii) şi
indicatori ai boltirii (excesului).

3.5.1. Indicatori ai asimetriei (oblicităţii)

Asimetria, în valoare absolută, se poate măsura cu indicatorii:

AS = x − M 0 (3.62)
sau
(
A S1 = 3 x − Me ) (3.63)

indicatori care au unitatea de măsură a variabilei studiate şi care sunt po-


zitivi sau negativi, în funcţie de tipul de asimetrie (coada mai lungă a dis-
tribuţiei spre valorile mari sau spre valorile mici).

Coeficientul de asimetrie (Pearson) este:

x − M0
C as = (3.64)
sx

coeficient care ia valori pozitive în cazul curbelor alungite spre dreapta


(asimetrie pozitivă) şi valori negative în cazul curbelor alungite spre stânga
(asimetrie negativă). Coeficientul de asimetrie poate să fie scris şi pe baza
relaţiei dintre medie şi mediană:

C as1 =
(
3 x − Me ) (3.65)
sx

EXEMPLUL 3.15. Pentru datele din Tabelul 3.2, prelucrate, obţinem:


x − M 0 57,45 − 69,74
C as = = = −0,407
sx 30,19
şi

116
CAPITOLUL 3

C as1 =
( =
)
3 x − Me 57,45 − 61
= −0,118
sx 30,19
ceea ce semnifică o asimetrie negativă moderată (coada mai lungă a distri-
buţiei înspre valorile mici).

Analiza oblicităţii (asimetriei) se poate face şi pe baza momentelor


centrate de ordin 3:

¦ (x i − x )
n 3

m 3 = i =1 (3.66)
n
sau, utilizând frecvenţe:

¦ (x i − x ) n i ¦ (x i − x ) n *i%
r 3 r 3

m 3 = i =1 = i =1 (3.67)
r 100
¦ ni
i =1
Coeficientul de asimetrie (Fisher) este:
m3 m 32
γ1 = = (3.68)
s 3x m 32
Coeficientul γ 1 va avea valoare mai mare decât zero în cazul
asimetriei pozitive, valoare mai mică decât zero în cazul asimetriei negative
şi va fi egal cu zero în cazul seriei perfect simetrice.

3.5.2. Indicatorii de poziţie şi forma distribuţiei

O măsură alternativă asimetriei poate să fie dată şi de:

ASQ=Q3+Q1-2Me (3.69)

dar, pentru a o exprima în coeficienţi adimensionali, o vom raporta la indi-


catorul de împrăştiere abaterea intercuartilică AQ (3.60) şi obţinem
coeficientul de asimetrie (Yule şi Kendall):

(Q 3 − Me) − (Me − Q1 ) Q 3 + Q1 − 2Me


C asq = = (3.70)
(Q 3 − Me) + (Me − Q1 ) Q 3 − Q1

117
STATISTICĂ ECONOMICĂ

Pe baza indicatorilor de poziţie se poate alcătui un rezumat al celor


cinci indicatori, care oferă informaţii privind tendinţa centrală, dar şi forma
distribuţiei studiate. Aceste cinci valori sunt:
— valoarea, minimă xmin (denumită, uneori, percentila 0);
— cuartila inferioară Q1 (delimitează cele mai mici 25% din valori);
— mediana Me (delimitează50% din valori);
— cuartila superioară Q3 (delimitează cele mai mari 25% din valori);
— valoarea maximă xmax (denumită, uneori, a 100-a percentilă).

Cele cinci valori se reprezintă grafic prin intermediul diagramei


Box-Plot (fig. 3.8). Pe grafic pot fi marcate şi media şi modul.

X m in Q1 Me Q3 X m ax
25% 25% 25% 25%

Fig. 3.8 - Diagrama Box-Plot

3.6. MĂRIMI RELATIVE

DEFINIŢIE: Mărimile relative reprezintă rezultatul comparării sub


formă de raport a doi indicatori statistici: un indicator comparat (raportat) şi
un indicator de bază de comparaţie (bază de raportare).

Forma generală a unei mărimi relative este:

x k
z= 10 (3.71)
y
unde: z reprezintă indicatorul relativ;
x reprezintă indicatorul comparat;
y reprezintă indicatorul bază de comparaţie;

118
CAPITOLUL 3

k reprezintă un număr întreg ce poate fi egal cu:


k=0 şi atunci exprimarea se face în coeficienţi;
k=2 şi atunci exprimarea se face în procente (%);
k=3, k=4, k=5 ,exprimarea se face în promile (0/00), respectiv
prodecimile (0/000) şi procentimile (0/0000).

3.6.1. Mărimi relative de structură

Mărimile relative de structură se calculează sub forma unui raport


între parte şi întreg, prezentând astfel structura colectivităţilor statistice
sistematizate atât după variabile cantitative cât şi după variabile calitative.
Mărimile relative de structură pot fi: greutăţi specifice (ponderi) şi frecvenţe
relative.
Greutatea specifică (ponderea) este:
xi
g ix = (3.72)
n
¦ xi
i =1

xi
g ix % = n
100 (3.73)
¦ xi
i =1

şi ne arată ponderea nivelului caracteristicii dintr-o unitate în nivelul total al


caracteristicii din colectivitatea statistică.
Dacă datele au fost sistematizate pe grupe/clase, atunci greutatea
specifică este:

ni
¦ x ij
j=1
g ix = (3.74)
r ni
¦ ¦ x ij
i =1 j=1

ni
¦ x ij
j=1
g ix % = 100 (3.75)
r ni
¦ ¦ x ij
i =1 j=1

119
STATISTICĂ ECONOMICĂ

EXEMPLUL 3.16: Pentru trei filiale ale unei firme s-au cules şi
sistematizat date privind producţia zilnică realizată de muncitori (Tabelul
3.8)
Tabelul 3.8
Judeţul/Filiala Număr de muncitori Producţia individuală (buc.)
0 1 2
Alba/A 4 120;130;120;90
Bacău/B 3 80;120;100;
Constanţa/C 6 140;70;90;100;110;120

Tabelul 3.9
Filiala Producţia pe Structura producţiei pe Structura
filială (buc.) filiale (%) colectivităţii de
muncitori (%)
0 1 2 3

A 460 33,09 30,77


B 300 21,58 23,08
C 630 45,33 46,15
Total 1390 100,00 100,00

Tot mărimi relative sunt şi frecvenţele relative.

3.6.2. Mărimi relative de coordonare

Mărimile relative de coordonare se calculează ca un raport între


două niveluri ale aceluiaşi indicator statistic, niveluri situate pe aceeaşi
treaptă de agregare: unitate, grupă, colectivitate statistică.
x
k ix j = i (3.76)
xj

Rezultatul ne arată de câte ori este mai mare (dacă rezultatul este
supraunitar), sau mai mic (dacă rezultatul este subunitar) nivelul variabilei
în unitatea (grupa, colectivitatea) i faţă de nivelul variabilei în unitatea
(grupa, colectivitatea) j.

Exprimarea rezultatului mărimii relative de coordonare (numită şi


raport de coordonare) se poate face şi în procente .
Reprezentarea grafică a mărimilor relative de coordonare se face
prin intermediul diagramei prin benzi, coloane ori suprafeţe.

120
CAPITOLUL 3

Pe baza datelor din Tabelul 3.8, col. 1 şi din Tabelul 3.9,


col.1,obtinem (vezi Tabelul 3.10):
Tabelul 3.10
Filiala Raport de coordonare
Pentru numărul de muncitori Pentru producţie
0 1 2

A 1,33 1,53
B 1,00 1,00
C 2,00 2,10

3.6.3. Mărimi relative de intensitate

Mărimile relative de intensitate au forma generală:


x
z= (3.77)
y

La nivelul întregului (alcătuit din unităţi, grupe etc.):


n n
¦x ¦z⋅y n
i =1 i =1 y
Z=
n
=
n
= ¦ z ⋅gi (3.78)
i =1
¦y ¦y
i =1 i =1

Reprezentarea grafică a mărimilor relative de intensitate se face cu


ajutorul diagramelor prin coloane, prin benzi ori prin suprafeţe.

Pe baza datelor din Tabelul 3.8, col.1 şi Tabelul 3.9, col.1, putem
calcula producţia obţinută de un muncitor (bucăţi pe muncitor) (Tabelul
3.11):
Tabelul 3.11
Filiala Productivitatea muncii (buc./muncitor)
0 1
A 115
B 100
C 105
Total 106,92

121
STATISTICĂ ECONOMICĂ

3.6.4. Mărimi relative de dinamică

Mărimile relative de dinamică sunt folosite pentru analiza


evoluţiei în timp a fenomenelor social-economice.
x
i 1x 0i = 1i (3.79)
x 0i
x
i 1x 0 = 1i 100 (3.80)
x 0i
De remarcat că, la nivel totalizator (de întreg), calculăm indicii într-
una din variantele:
- ca medie aritmetică a indicilor individuali:
n n
¦ x1i n ¦ i1x 0i x 0i
I1Σx0 = i =1
= ¦ i1x 0i g 0xi = i =1
(3.81)
n n
i=1
¦ x 0i ¦ x 0i
i =1 i =1
- ca medie armonică a indicilor individuali:
n
¦ x1i
1
I1Σx0 = = i =1
(3.82)
n 1 n 1
¦ x g1xi ¦ x x1xi
i =1 i1 0i i =1 i1 0i

Evident, pentru o exprimare procentuală, rezultatele se înmulţesc cu 100.


Reprezentarea grafică a mărimilor relative de dinamică se poate face
prin diagrama prin coloane, benzi, ori suprafeţe.

3.6.5. Mărimi relative ale planului (prevederilor)

Mărimile relative ale planului sunt:

— mărimea relativă (indicele) sarcinii programate:

x pi
i px 0i = (3.83)
x 0i

122
CAPITOLUL 3

x pi
i px %0i = 100 (3.84)
x 0i

— mărimea relativă (indicele) realizării prevederilor (programului):

x 1i
i 1x pi = (3.85)
x pi

x 1i
i 1x %pi = 100 (3.86)
x pi

Se observa ca:
x pi x 1i x 1i
i px %0i ⋅ i 1x %
pi = ⋅ = = i 1x 0i (3.87)
x 0i x pi x 0i

Reprezentarea grafică a mărimilor relative ale prevederilor se face cu


ajutorul diagramei prin coloane, benzi ori suprafeţe.

123
STATISTICĂ ECONOMICĂ

Întrebări recapitulative

1. Ce este indicatorul statistic?


2. Care sunt funcţiile indicatorilor statistici?
3. Ce sunt indicatorii statistici? Cum se obţin ei?
4. Ce sunt indicatorii tendinţei centrale?
5. Care sunt principalele tipuri de indicatori ai tendinţei centrale?
6. Media aritmetică: definiţie, proprietăţi, observaţii, utilizări.
7. Care sunt indicatorii de poziţie?
8. Modul: definiţie, calcul, utilizări, proprietăţi.
9. Mediana: definiţie, calcul, utilizări, proprietăţi
10. Cum se determină mediana pentru o serie de distribuţie pe variante?
Dar pe intervale de variaţie?
11. Analiza comparativă a celor trei indicatori ai tendinţei centrale.
12. Ce sunt cuantilele?
13. Care este semnificaţia cuantilelor de ordin 4?
14. Media armonică: definiţie, calcul, utilizări, proprietăţi.
15. Media pătratică: definiţie, calcul, utilizări, proprietăţi.
16. Media geometrică: definiţie, calcul, utilizări, proprietăţi.
17. Ce se înţelege prin variabilitatea datelor statistice?
18. Necesitatea măsurării variabilităţii.
19. Ce este amplitudinea datelor? Calcul şi interpretare.
20. Care sunt indicatorii simpli ai variabilităţii?
21. Ce reprezintă abaterea medie liniară?
22. Dispersia: determinare, observaţii, proprietăţi.
23. Cum se determină media şi dispersia unei variabile alternative?
24. Cum se determină abaterea medie pătratică? Semnificaţie, utilizări.
25. Coeficientul de variaţie: calcul, utilizări.
26. Cum se compune dispersia pentru o serie structurată în serii compo-
nente?
27. Cum se interpretează abaterea medie pătreatică folosind regula
empirică?
28. Ce reprezintă oblicitatea unei repartiţii?
29. Cum se analizează asimetria (oblicitatea) unei repartiţii?
30. Cum se analizează boltirea/aplatizarea unei repartiţii?
31. Cum se poate studia forma distribuţiei folosind indicatorii de poziţie?
32. Cum se construieşte şi interpretează diagrama Box-Plot?
33. Cum se obţin indicatorii statistici derivaţi?
34. Ce sunt mărimile relative?

124
CAPITOLUL 3

35. Mărimile relative de structură: definiţie, utilizare, reprezentare gra-


fică, exemple.
36. Mărimile relative de coordonare: definiţie, utilizare, reprezentare gra-
fică, exemple.
37. Mărimile relative de intensitate: definiţie, utilizare, reprezentare gra-
fică, exemple.
38. Mărimile relative de dinamică: definiţie, utilizare, reprezentare gra-
fică, exemple.
39. Mărimile relative ale planului: definiţie, utilizare, reprezentare gra-
fică, exemple.
40. Care sunt cele trei proprietăţi pe care urmărim să le analizăm şi să le
descriem în analiza unui set de date numerice?

125
STATISTICĂ ECONOMICĂ

Teste de autoevaluare

1. O mare companie producătoare de produse electrocasnice are 200 de


magazine de desfacere. Pentru aceste magazine s-au înregistrat vânzările
săptămânale de combine frigorifice (în bucăţi). Datele sistematizate se
prezintă astfel:
Tabelul 3.1’
Grupe de magazine după vânzările Ponderea magazinelor (%)
săptămânale de combine frigorifice (buc.)
0 1

0-4 100
4-8 93
8-12 73
12-16 41
16-20 15
20-24 5
Se cere:
a) Să se reprezinte grafic distribuţia de frecvenţe absolute;
b) Să se determine numărul mediu de combine frigorifice vândute
săptămânal de un magazin şi să se studieze dacă valoarea obţinută este
reprezentativă;
c) Care este numărul de combine frigorifice peste care se situează vânzările a:
c1) trei sferturi din magazine?
c2) 50% din magazine?
c3) o pătrime din magazine?
d) Să se analizeze asimetria şi excesul distribuţiei.
e) Să se calculeze media şi dispersia magazinelor care au vândut mai mult
de 12 combine frigorifice săptămânal.

2. Pentru 30 de convorbiri telefonice de lungă-distanţă s-au înregistrat


duratele (minute):

11,8; 3,6; 16,6; 13,5; 4,8; 8,3;


8,9; 9,1; 7,7; 2,3; 12,1; 6,1;
10,2; 8,0; 11,4; 6,8; 9,6; 19,5;
15,3; 12,3; 8,5; 15,9; 18,7; 11,7;
6,2; 11,2; 10,4; 7,2; 5,5; 14,5.

126
CAPITOLUL 3

a) Să se grupeze datele pe 6 intervale de mărime egală şi să se reprezinte


grafic rezultatul grupării;
b) Să se determine ponderea cazurilor care se găsesc în intervalul:
(x − s; x + s )
(x − 2s; x + 2s )
(x − 3s; x + 3s )
şi să se stabilească dacă valorile găsite corespund regulii empirice.

3. Pentru 250 de apartamente s-au înregistrat cheltuielile de întreţinere în


luna ianuarie 2001. Apartamentele au fost grupate după numărul de camere
în 4 grupe: garsoniere, apartamente cu două camere, apartamente cu 3
camere şi apartamente cu 4 sau peste 4 camere. Datele sistematizate se
prezintă astfel:
Tabelul 3.2’
Grupe de Cheltuieli de întreţinere (mii lei) Total
apartamente după 750-1000 1000-1250 1250-1500 1500-1750
nr. camerelor
0 1 2 3 4 5

garsoniere 70% 20% 10% - 100%


2 camere 10% 50% 30% 10% 100%
Se mai cunosc datele:
- numărul garsonierelor luate în studiu a fost de 50, iar al apartamentelor
cu 2 camere a fost de 100;
- pentru grupa apartamentelor de 3 camere: cheltuiala medie cu
întreţinerea a unui apartament a fost de 1325 mii lei, valoarea modală a
grupei de 1300 mii lei, iar coeficientul de asimetrie 0,11;
- pentru grupa apartamentelor cu 4 si peste 4 camere: cheltuielile totale de
întreţinere ale celor 25 de apartamente luate în studiu au fost de 36875
mii lei, iar coeficientul de variaţie 13,56%.
Se cere:
a) să se precizeze care grupă de apartamente este mai omogenă din punctul
de vedere al cheltuielilor de întreţinere;
b) să se aplice regula de adunare a dispersiilor;
c) să se stabilească dacă numărul de camere influenţează semnificativ
variaţia cheltuielilor de întreţinere;
d) să se calculeze şi să se reprezinte grafic structura cheltuielilor totale de
întreţinere pe grupe de apartamente după numărul de camere.

127
STATISTICĂ ECONOMICĂ

4. O mare companie producătoare de cosmetice deţine în Bucureşti 100 de


magazine de desfacere a produselor sale. Despre zona de amplasare a
acestor magazine şi despre valoarea medie a vânzărilor zilnice (mld. lei) se
cunosc datele:
Tabelul 3.3’
Zona de Număr de Valoarea medie a vânzărilor Coeficientul de variaţie
amplasare magazine zilnice (mld. lei/magazin) a vânzărilor (%)
0 1 2 3

Centrală 35 20 6,0
Sud-vest 20 12 12,5
Sud-est 15 10 13,0
Nord-vest 10 ... 20,0
Nord-est 20 13 12,3

Ştiind că valoarea modală a vânzărilor pentru zona de Nord-vest a


Bucureştiului a fost de 5,25 mld. lei, iar coeficientul de asimetrie Pearson
(pentru aceeaşi zonă) a fost de -0,25, se cere:

a) să se determine valoarea medie a vânzărilor zilnice pe total Bucureşti;


b) este valoarea calculată la punctul a) reprezentativă? Argumentaţi.
c) în ce măsură zona de amplasare a magazinelor influenţează variaţia
valorii vânzărilor?

5. Un cercetător face un studiu asupra unor firme, privind şansele pe care


acestea le oferă tinerilor angajaţi de a promova repede şi de a avansa în
carieră. Pentru aceasta el a cuprins în studiu un număr de 20 de companii
producătoare de tehnologie de vârf şi a înregistrat timpul scurs de la
angajarea iniţială a unui salariat în firmă până la prima promovare a
acestuia. Firmele au fost grupate după mărime, iar datele înregistrate sunt:
Tabelul 3.4’
Mărimea firmelor Număr de săptămâni de la angajare până la prima
promovare
0 1

Mici 30; 26; 30; 38; 32; 24; 32; 30;


Medii 30; 34; 32; 25; 36;
Mari 49; 42; 43; 48; 40; 49; 40.

Se cere:
a) să se determine numărul mediu de săptămâni până la prima promovare,
pe fiecare grupă de firme, precum şi pe total;

128
CAPITOLUL 3

b) să se arate dacă numărul mediu de săptămâni până la prima promovare,


calculat pe total, la punctul anterior, este o valoare reprezentativă;
c) în ce măsură variaţia timpului scurs până la prima promovare este
influenţată de mărimea firmei?

6. Despre vânzările de carte efectuate de trei librării în lunile octombrie şi


noiembrie 2001 se cunosc datele:
Tabelul 3.5’
Libraria Raportul de Structura valorii Realizarea Numărul de
coordonare al vânzărilor de planului la salariaţi în
valorii vânzărilor carte în octombrie vânzările de carte octombrie
de carte realizate în 2001 în noiembrie 2001 2001
noiembrie 2001 (%) (persoane)
0 1 2 3 4

A 2,0 0,5 120 12


B 1,0 0,3 75 7
C 1,5 ... 180 8

Ştiind că valoarea totală a vânzărilor de carte a celor trei librării în


luna octombrie 2001 a fost de 200 mld. lei şi că pentru librăria B mărimea
relativă de dinamică a vânzărilor de carte realizate în noiembrie faţă de
octombrie 2001 a fost de 150%, se cere să se determine:
a) valoarea vânzărilor de carte realizate în octombrie, a celor realizate şi
propuse în noiembrie, pe fiecare librărie şi pe total;
b) structura valorii vânzărilor de carte propuse pentru noiembrie 2001 şi
reprezentare grafică;
c) mărimile relative de dinamică şi ale sarcinii, pe fiecare librărie şi
reprezentare grafică ;
d) cu câte procente a fost mai mare sau mai mică valoarea totală a
vânzărilor de carte realizate în noiembrie faţă de valoarea totală a
vânzărilor propuse pentru noiembrie 2001;
e) calculaţi o mărime relativă de intensitate pe fiecare librărie şi pe total

7. Pentru cei 20 de salariaţi ai unui atelier din cadrul unei unităţi econo-
mice cu profil industrial s-a înregistrat producţia (în bucăţi) realizată în luna
mai 1999, precum şi echipele din care fac parte aceşti salariaţi (tabelul 3.6’).

129
STATISTICĂ ECONOMICĂ

Tabelul 3.6’
Salariat Producţia Echipa Salariat Producţia Echipa
realizată în realizată în
luna mai luna mai
(bucăţi) (bucăţi)
0 1 2 0 1 2
1 18 A 11 15 C
2 11 A 12 15 A
3 14 B 13 15 C
4 17 A 14 15 C
5 12 A 15 14 B
6 14 B 16 13 D
7 16 A 17 15 C
8 14 D 18 13 D
9 16 B 19 16 A
10 13 B 20 12 B

Se cere:
a) Să se efectueze câte o grupare simplă după variaţia fiecărei carac-
teristici. Pentru variabila numerică se vor forma 4 grupe de mărime egală şi
se vor reprezenta grafic datele grupate.
b) Folosind gruparea simplă după caracteristica nenumerică, să se cen-
tralizeze datele privind valoarea producţiei.
c) Utilizaţi rezultatele de la punctul precedent. Se mai cunosc:
Tabelul 3.7’
Echipa Mărimea relativă de dinamică a Structura
producţiei realizate în mai faţă de producţiei
aprilie (%) planificate în luna
mai
0 1 2
A 105 0,333
B 110,6 0,296
C 120 0,204
D 160 0,167

Ştiind că producţia planificată a lunii mai la nivelul întregului atelier este


cu 8% mai mare decât producţia totală realizată a lunii aprilie, să se cal-
culeze:
c1) producţia realizată în luna aprilie, precum şi cea planificată în luna
mai, pe fiecare echipă şi pe total atelier;
c2) structura producţiei realizate în aprilie, precum şi cea a producţiei
realizate în luna mai. Să se reprezinte grafic una dintre ele;

130
CAPITOLUL 3

c3) mărimile relative de coordonare pentru producţia efectiv realizată în


aprilie şi să se reprezinte grafic;
c4) mărimile relative ale planului pe fiecare echipă şi pe total atelier;
c5) mărimea relativă de dinamică la nivelul întregului atelier;
c6) o mărime relativă de intensitate pe fiecare echipă şi pe total atelier.
Să se reprezinte grafic.

8. Despre activitatea unei societăţi comerciale se cunosc următoarele


date, privind lunile ianuarie-februarie 2001:
Tabelul 3.8’
Secţia Structura Procentul Mărimea Structura
producţiei în sarcinii de plan relativă a personalului
perioada de în februarie realizării în ianuarie
bază (%) faţă de planului în febr.
ianuarie (%) g 0ti
i
(ianuarie) g 0 k1i / pl
k ipl / 0
0 1 2 3 4

I 20 125 1,20 0,18


II 40 175 0,8571 0,41
III 25 100 1,60 0,30
IV 15 200 1,333 0,11

Ştiind că valoarea totală a producţiei în luna ianuarie a fost de 5000 mili-


oane lei, iar numărul total al personalului a fost de 700 persoane, se cere:
a) Să se determine nivelul producţiei din luna ianuarie, ca şi al celei pla-
nificate şi efectiv realizate în februarie, pe fiecare secţie şi pe total societate
comercială.
b) Să se determine structura producţiei planificate şi a celei efectiv reali-
zate în luna februarie, reprezentându-se grafic mărimile relative de structură.
c) Să se calculeze mărimile relative de dinamică pe fiecare secţie.
d) Să se calculeze mărimile relative de dinamică şi ale planului pe
întreaga societate comercială, cu specificarea tipului de medie utilizată de
fiecare dată.
e) Să se reprezinte grafic mărimile relative de dinamică şi ale planului.
f) Să se calculeze o mărime relativă de intensitate şi să se reprezinte
grafic.

9. Fondul de salarizare pentru angajaţii a două filiale ale unei bănci a fost
de 184 mil. lei, iar raportul de coordonare pentru acest fond k1/2 = 1,63.
Ştiind că salariul mediu al angajaţilor din filiala 2 a fost de 3500 mii lei şi că
131
STATISTICĂ ECONOMICĂ

în filiala 1 lucrează 60% din angajaţii băncii, să se afle salariul mediu în


filiala 1 şi pe întreaga bancă.

10. Se cunosc următoarele date privind activitatea unor firme în lunile


ianuarie şi februarie:
Tabelul 3.9’
Firma Structura producţiei Raportul de coordonare Procentul de
realizate în ian. (%) a producţiei planificate realizare a planului
în februarie în februarie (%)
0 1 2 3
1 10 1,4 120
2 20 2,4 80
3 25 2,8 100
4 40 4,0 75
5 5 1,0 150
Total 100 - -

Ştiind că producţia realizată de firma nr. 5 în luna februarie a fost de 750


mil. lei, ceea ce a însemnat o devansare a producţiei din luna ianuarie cu
200%, se cere:
a) Nivelurile producţiei realizate în luna ianuarie şi februarie şi a celei
planificate pe februarie, pentru fiecare firmă şi pe total.
b) Mărimile relative ale planului pe fiecare firmă şi pe total, cu
specificarea tipului de medie utilizată pentru calculul indicatorilor pe total.
c) Să se construiască un grafic pentru reprezentarea mărimilor relative ale
planului.
11. Se cunosc următoarele date:
Tabelul 3.10’
Departa- Procentul sarcinii de Procentul îndeplinirii Structura valorii
mentul plan al valorii planului vânzărilor vânzărilor realizate în
S.C. vânzărilor (%) (%) perioada de bază (%)
A 100 90 15
B 120 100 35
C 105 115 40
D 100 75 10

Se cere:
a) Să se reprezinte grafic gradul îndeplinirii planului la valoarea vânză-
rilor pe departamente şi structura valorii vânzărilor realizate (pentru peri-
oada de bază).

132
CAPITOLUL 3

b) Să se calculeze procentul mediu al sarcinii de plan, al îndeplinirii pla-


nului şi al dinamicii valorii vânzărilor, pe întreaga societate comercială.

12. Se cunosc următoarele date:


Tabelul 3.11’
Firma Structura cifrei de Mărimea relativă a îndeplinirii
afaceri realizată în planului la cifra de afaceri în
perioada curentă (%) perioada curentă
A 20 115
B 50 120
C 30 125

Să se determine procentul mediu al îndeplinirii planului la cifra de afaceri


în perioada curentă.

13. Două grupe de studenţi, cu efective de 25 şi, respectiv, 32 de per-


soane, au susţinut un test de cultură generală. Prima grupă a obţinut media
7,8, iar a doua 8,4. Cercetătorul este interesat în a determina nota medie pe
ansamblul celor două grupe.

14. Consideraţi următoarele valori: 5, 7, 4, 5, 20, 6, 4.

a) Calculaţi media aritmetică şi mediana acestui set de date; ce valoare vi


se pare mai potrivită pentru a caracteriza tendinţa centrală: media sau
mediana?
b) Înlocuiţi valoarea 20 cu valoarea 8 şi recalculaţi cei doi indicatori ai
tendinţei centrale. Explicaţi modificările survenite.
c) Adăugaţi 50 fiecărei valori iniţiale. Cum se va modifica media?

15. Un analist financiar al unei firme este interesat în a determina salariul


mediu acordat angajaţilor celor 4 filiale ale firmei. Pentru aceasta, el culege
date privind salariul mediu pe fiecare filială şi fondurile de salarizare
(tabelul 3.12’)
Tabelul 3.12’
Filiala Salariul mediu (mii UM) Fond de salarizare (mil. UM)
1 540 45,90
2 620 33,48
3 480 16,80
4 700 19,60

133
STATISTICĂ ECONOMICĂ

16. Indicii anuali ai preţurilor de consum la mărfurile alimentare în


perioada 1991-1994 au fost:
Tabelul 3.13’
Anul Indice (anul precedent = 100)
1995 131,9
1996 136,4
1997 251,4
1998 148,4
Sursa: Anuarul statistic al României, 1995, pg. 411.

Să se determine indicele mediu al preţurilor de consum la mărfurile ali-


mentare, în această perioadă.

134
CAPITOLUL 3

Răspunsurile testelor de autoevaluare


1.
a) Se observă că în coloana 1 a tabelului 3.1’. sunt date frecvenţele relative
cumulate descrescător. Pentru a determina frecvenţele absolute,
procedăm astfel:
¾ decumulăm frecvenţele relative cumulate descrescător, obţinând
astfel frecvenţele relative (tabelul 3.14’, col. 1)
Tabelul 3.14’
Grupe de
magazine
Frecvenţe Frecvenţe Centre
relative absolute de x i n *i
xi ni
( ) 2
xi − x xi −x ni Frecvenţe
absolute (xi −x)4ni
după (%) (ni) interva (%) cumulate
vânzări l (xi) crescător
(buc.)
0 1 2 3 4 5 6 7 8 9
0-4 7 14 2 14 28 -9 1134 14 91854
4-8 20 40 6 120 240 -5 1000 54 25000
8-12 32 64 10 320 640 -1 64 118 64
12-16 26 52 14 364 728 +3 468 170 4212
16-20 10 20 18 180 360 +7 980 190 48020
20-24 5 10 22 110 220 +11 1210 200 146410
Total 100 200 - 1108 2216 4856 - 315560

¾ se calculează frecvenţele absolute din frecvenţele relative:


ni n * ⋅ ¦ ni
ni*% = ⋅100 Ÿ ni = i % (tabelul 3.14’, col.2)
¦ ni 100

Distribuţia de frecvenţe absolute este reprezentată grafic în fig. 3.1’, prin


histogramă.
Fig. 3.1’ - Histograma

Distributia magazinelor dupa vanzarile de


combine frigorifice

70
Numar de magazine

60
50
40
30
20
10
0
0-4 4-8 8-12 12-16 16-20 20-24
Vanzari (buc.)
135
STATISTICĂ ECONOMICĂ

b) Se calculează media aritmetică ponderată a vânzărilor săptămânale, pe


baza frecvenţelor relative (tabelul 3.14’, col. 4):
*
¦ x i ni % 1108
x= = = 11,08 ≈ 11 buc.
100 100

fie pe baza frecvenţelor absolute (tabelul 3.14’, col. 5):


¦ x i ni 2216
x= = = 11,08 ≈ 11 buc.
¦ ni 200
Aşadar, un magayin din cele 200 luate în studiu a vândut în medie pe
săptămână 11 combine frigorifice.
Pentru a verifica reprezentativitatea mediei obţinute, trebuie calculat
coeficientul de variaţie:
sx
v= ⋅100
x
s x = s x2

s x2 =
( )2
¦ x i − x n i 4856
= = 24,28
¦ ni 100
Calculele intermediare necesare în determinarea dispersiei sunt prezentate în
coloanele 6 şi 7 din tabelul 3.14’
Abaterea medie pătratică va fi:
s x = 24,28 = 4,93 ≈ 5 buc.
iar coeficientul de variaţie:
sx 5
v= ⋅100 = ⋅100 = 45,45% > 40%, ceea ce înseamnă că media
x 11
calculată nu este reprezentativă, seria nu este omogenă.

c) Se cer calculaţi următorii indicatori medii de poziţie:


c1) prima cuartilă (Q1):
Pentru calculul ei se procedează astfel:

¾ se calculează frecvenţele cumulate (tabelul 3.14’, col. 8);


136
CAPITOLUL 3

¾ se determină locul primei cuartile:

¦ ni + 1 201
locQ1 = = = 50,25
4 4

¾ se găsesşte intervalul în care se află prima cuartilă (primul interval a


cărui frecvenţă cumulată depăşeşte locul primei cuartile), acesta este 4-
8;
¾ se calculează prima cuartilă, cu formula:

loc Q1 − Fc Q1 −1 50,25 − 14
Q1 = x 0 + k = 4+ 4⋅ = 7,6 ≈ 8
n Q1 40
buc.
unde:
x0 = limita inferioară a intervalului cuartilic;
k = mărimea intervalului cuartilic;
FcQ1-1 = frecvenţa cumulată a intervalului anterior celui cuartilic;
nQ1 = frecvenţa intervalului median = 90.
Aşadar, 75% dintre magazine au vândut săptămânal mai mult de 8 combine
frigorifice.

c2) Mediana (Me)

¦ ni + 1 201
locMe = = = 100,5
2 2
Mediana se găseşte în intervalul 8-12.

loc Me − Fc Me −1 100,5 − 54
Me = x 0 + k = 8+ 4⋅ = 10,9 ≈ 11
n Me 64
buc.

50% din magazine au vândut săptămânal mai mult de 11 combine frigorifice


şi 50% mai puţin.

c3) Cuartila a treia (Q3)

137
STATISTICĂ ECONOMICĂ

3(¦ ni + 1)
locQ3 = = 150,75
4
A treia cuartilă se găseşte în intervalul 12-16.

loc Q3 − FcQ3 −1 150,75 − 118


Q3 = x 0 + k = 12 + 4 ⋅ = 14,52 ≈ 15
nQ3 52
buc.
25% din magazine au vândut săptămânal mai mult de 15 combine frigorifice
şi 75% mai puţin.

d) Analizăm asimetria distribuţiei cu ajutorul coeficientului de asimetrie al


lui Pearson.

x − Mo
Cas =
sx

∆1
Mo = x 0 + k
∆1 + ∆ 2

unde:
x0 = limita inferioară a intervalului modal;
k = mărimea intervalului modal;
∆1 = nMo – nMo-1 = frecvenţa intervalului modal minus frecvenţa
intervalului anterior celui modal;
∆2 = nMo - nMo+1 = frecvenţa intervalului modal minus frecvenţa
intervalului următor celui modal;
Se obţine Mo = 10,67 ≈ 11 buc.
Cele mai multe magazine au vândut săptămânal 11 combine frigorifice.

11,08 − 10,67
Cas = = 0,083 > 0 ceea ce arată o asimetrie foarte
4,93
uşoară, pozitivă, în serie predomină uşor valorile mari.
Se poate folosi şi o altă formă a coeficientului de asimetrie al lui
Pearson:

138
CAPITOLUL 3

3( x − Me)
Cas = = 0,11
sx
Oblicitatea poate fi studiată şi cu ajutorul coeficientului lui Bowley:

(Q3 − Me) − (Me − Q1 )


As = = 0,046 , cu aceeaşi interpretare ca cea
Q3 − Q1
arătată înainte.
Excesul unei distribuţii unimodale poate fi studiat cu ajutorul coeficientului lui
Pearson:

µ4
β2 =
µ 22

Cum µ2 = sx2 rezultă că µ 22 = 589,52

µ4 =
( =
)4
¦ x i − x ni 315560
= 1577,8 (tabelul 3.14’, col. 9)
¦ ni 200
1577,8
β2 = = 2,68
589,52

sau γ2 = β2 – 3 = 2,68 – 3 = -0,32

Curba este aşadar platicurtică (aplatizată), deoarece β2 < 3, iar γ2 < 0.

e) Se creează o caracteristică alternativă (w), cu o stare favorabilă (magazinele


care au vândut peste 12 combine săptămânal) şi o stare nefavorabilă
(magazinele care au vândut mai puţin de 12 combine săptămânal).
Media caracteristicii alternative este:

m 82
w= = = 0,41
n 200
iar dispersia:

( )
s w2 = w 1 − w = 0,41 ⋅ 0,59 = 0,242

139
STATISTICĂ ECONOMICĂ

2.
a) Ax = xmax - xmin = 19,1 - 2,3 = 16,8 minute

r=6

h = Ax r = 16,8 6 = 2,8 ≈ 3 minute

Rezultatele grupării sunt prezentate în tabelul 3.15’


Tabelul 3.15’
Intervale de variaţie a duratei Număr de convorbiri telefonice
convorbirilor telefonice (minute)
0 1
2-5 3
5-8 6
8-11 8
11-14 7
14-17 4
17-20 2
Total 30
Notă: limita inferioară inclusă în interval.

Reprezentarea grafică este redată în fig. 3.2’.

Distributia convorbirilor telefonice dupa durata

10

8
Convorbiri

0
0-2 2-5 5-8 8-11 11-14 14-17 17-20
Durata

Fig. 3.2’

140
CAPITOLUL 3

Se observă că distribuţia este aproape normală, simetrică.

b) Valoarea medie, calculată pe baza datelor iniţiale este:

¦ xi
x= = 10,26 minute
n

iar abaterea medie pătratică:

s=
(
¦ xi − x )2 = 4,29 minute
n

(x − s; x + s ) = (10,26-4,29; 10,26 + 4,29) = (5,97; 14,55)


(x − 2s; x + 2s ) = (1,68; 18,84)
Tabelul 3.16’
Interval Ponderea convorbirilor Regula empirică
telefonice pentru distribuţia dată
(x − s; x + s ) = 21/30=0,7 (70%) 68%
(5,97; 14,55)
(x − 2s; x + 2s ) = 29/30 = 0,967 (96,7%) 95%
(1,68; 18,84)

Se observă că procentele calculate pe baza datelor iniţiale sunt foarte


apropiate de cele corespunzătoare regulii empirice. În ultimul interval,
( )
x − 3s; x + 3s se găsesc practic toate convorbirile telefonice.

3.
a) Notăm cu X – caracteristica “număr de camere” – factorul de grupare şi cu Y -
caracteristica “cheltuielile de întreţinere” (yj vor fi centrele de interval: y1 =
875; y2 = 1125; y3 = 1375; y4 = 1625)

i = 1 (grupa garsonierelor).

141
STATISTICĂ ECONOMICĂ

¦ y jn *1j 875 ⋅ 70 + 1125 ⋅ 20 + 1375 ⋅10


y1 = = = 975 mi lei
¦ n *1j 100

¦ (y j − y1 ) n *1 j
2
s12 = =
¦ n *1j
(875 − 975) 2 ⋅ 0,7 + (1125 − 975) 2 ⋅ 0,2 + (1375 − 975) 2 ⋅ 0,1 = 27500

s1= 165,83 mii lei.

s1
v1 = 100 = 17,0%
y1

i = 2 (grupa apartamentelor cu două camere).


¦ y jn *2 j 875 ⋅10 + 1125 ⋅ 50 + 1375 ⋅ 30 + 1624 ⋅10
y2 = = = 1225 mi lei
¦ n *2 j 100

¦ (y j − y 2 ) n *2 j
2
s 22 = =
¦ n *2 j
(875 − 1225) 2 ⋅ 0,1 + (1125 − 1225) 2 ⋅ 0,5 + (1375 − 1225) 2 ⋅ 0,3 + (1625 − 1225) 2 ⋅ 0,1
= 40000

s2= 200 mii lei.

s2
v2 = 100 = 16,3%
y2

i = 3 (grupa apartamentelor cu trei camere.)

y 3 = 1325 mii lei


n3 = 250-50-100-25=75 apartamente
Mo = 1300 mii lei
y 3 − Mo y 3 − Mo
Cas = Ÿ s3 = = 227,27 mii lei
s3 Cas
142
CAPITOLUL 3

s 32 = 51653
s
v 3 = 3 100 = 17,15%
y3

i = 4 (grupa apartamentelor cu 4 şi peste 4 camere.)

36875
y4 = = 1475 mii lei
25
s v ⋅y
v 4 = 4 100 = 13,56% Ÿ s 4 = 4 4 = 200 mii lei
y4 100
s 42 = 40000
Cum v4 < v2 < v1 < v3 rezultă că grupa apartamentelor cu 4 şi peste 4 camere este
cea mai omogenă din punctul de vedere al cheltuielilor de întreţinere.

b) Scriem regula de adunare a dispersiilor:

2
s2 = s + d 2
Media dispersiilor grupelor va fi:

2
2 ∑ s i ni 27500 ⋅ 50 + 40000 ⋅100 + 51653 ⋅ 75 + 40000 ⋅ 25
s = = =
∑ ni 250
= 40996
Media întregii colectivităţi de 250 de apartamente poate fi calculată ca medie a
mediilor parţiale:

¦ y i ni 975 ⋅ 50 + 1225 ⋅100 + 1325 ⋅ 75 + 1475 ⋅ 25


y= = = 1230 mii lei
¦ ni 250

Dispersia dintre grupe care sintetizează influenţa factorului de grupare X asupra


variaţiei variabilei Y este:

143
STATISTICĂ ECONOMICĂ

d 2
=
(
¦ y i − y )n
2
i
=
¦ ni

=
(975−1230)2 ⋅ 50 + (1225−1230)2 ⋅100+ (1325−1230)2 ⋅ 75 + (1475−1230)2 ⋅ 25
=
200
= 21725
2
s 2 = s + d 2 = 40996 + 21725 = 62721
c) Se calculează coeficientul de determinaţie:

d2 21725
R2 = = = 0,346 (34,6%< 50%)
s2 627219

Aşadar, 34,6% din variaţia caracteristicii Y (cheltuielile de întreţinere) este


influenţată de numărul de camere şi influenţa nu este semnificativă.

d) Se calculează cheltuielile totale de întreţinere pentru fiecare grupă de


apartamente, apoi structura acestora.
Tabelul 3.17’
Grupe de apartamente Cheltuieli totale de Structura cheltuielilor
după numărul de camere întreţinere (mii lei) de întreţinere (%)
0 1 2

garsoniere 975•50 = 48.750 15,9


ap. cu 2 camere 1225•100= 122.500 39,8
ap. cu 3 camere 1325•75= 99.375 32,3
ap. cu 4 şi peste 4 camere 1475•25= 36.875 12,0
Total 307.500 100,0

Structura (tabelul 3.17’, col. 2) este reprezentată grafic în fig. 3.3’.

144
CAPITOLUL 3

Structura cheltuielilor de intretinere pe grupe de apartamente

12% 16%

32%
40%
garsoniere ap. cu 2 cam.
ap. cu 3 cam. ap. cu 4 si peste 4 cam.

Fig. 3.3’

4.
a) Gruparea (clasificarea) salariaţilor după caracteristica nenumerică
(echipa) –
Se efectuează o clasificare pe variante, întrucât caracteristica are un
număr mic de variante.
Tabelul 3.18’
Echipa Număr salariaţi (ni)
A 7
B 6
C 4
D 3
Total 20

Gruparea salariaţilor după caracteristica numerică (producţia, în bucăţi) –


Se notează cu X – caracteristica de grupare (producţia, în bucăţi). Se
parcurg următorii paşi:
¾ se calculează amplitudinea variaţiei caracteristicii: (Ax).
Ax = xmax - xmin = 18 – 11 = 7 bucăţi.
¾ se stabileşte numărul de grupe: (r).
r=4
¾ se stabileşte mărimea intervalului de grupare: (h)
h = Ax / r = 7/4 ≈ 1,75 ≈ 2
¾ se stabilesc intervalele de variaţie şi se efectuează gruparea.

145
STATISTICĂ ECONOMICĂ

Tabelul 3.19’
Intervale de variaţie a producţiei (bucăţi) Nr. salariaţi
0 1
11-13 3
13-15 7
15-17 8
17-19 2
Total 20
Notă: limita inferioară inclusă în interval.

Distribuţia salariaţilor după producţia


realizată în luna mai

10
8
Nr. salariaţi

6
4
2
0
11-13 13-15 15-17 17-19
Prod.(buc.)

Fig. 3.4’

Distribuţia salariaţilor după echipe

8
7
6
Nr. salariaţi

5
4
3
2
1
0
A B C D
Echipa

Fig. 3.5’

146
CAPITOLUL 3

b)
Tabelul 3.20’
Echipa Producţia centralizată (buc.)
0 1

A 105
B 83
C 60
D 40
Total 288

c) Se notează:
x0i = producţia realizată de echipa „i“ în luna aprilie;
x1i = producţia realizată de echipa „i“ în luna mai;
xipl = producţia planificată de echipa „i“ în luna mai;
X0 = producţia totală a atelierului realizată în luna aprilie;
X1 = producţia totală a atelierului realizată în luna mai;
Xpl = producţia totală a atelierului planificată în luna mai;

De la punctul precedent se cunoaşte producţia realizată de cele 4 echipe


în luna mai, adică x1i şi X1 = 288 bucăţi.

Tabelul 3.21’
Echipa
k1i / 0 g ipl x1i
(%) (buc.)
0 1 2 3

A 105 0,333 105


B 110,6 0,296 83
C 120 0,204 60
D 160 0,167 40
Total 115,2 1,0 288

xi xi ⋅ 100
c1) k1i / 0 = 1 ⋅ 100 Ÿ x0i = 1 (tabelul 3.22’, col. 1)
x0i k1i / 0
X 0 = ¦ x0i = 250 buc.
i

147
STATISTICĂ ECONOMICĂ

X pl
K pl / 0 = = 1,08 Ÿ X pl = K pl / 0 ⋅ X 0 = 1,08 ⋅ 250 = 270 buc.
X0

xipl xipl
g ipl = = Ÿ xipl = g ipl ⋅ X pl ( tabelul 3.22’, col. 2)
i X pl
¦ x pl
i

x0i x0i
c2) g 0i = ⋅ 100 = ⋅ 100 (tabelul 3.22’, col. 3)
i X0
¦ x0
i
x1 x1i
g1i = ⋅ 100 = ⋅ 100 (tabelul 3.22’, col. 4).
i X1
¦ x1
i

c3) Alegem ca bază de raportare echipa D şi calculăm rapoartele de


coordonare împărţind producţia realizată în ianuarie de fiecare echipă la
producţia realizată în ianuarie de echipa D.

xi
ki / D = 0 (tabelul 3.22’, col. 5)
x0D
c4)
xipl
k ipl / 0 = ⋅ 100 (tabelul 3.22’, col. 6)
x0i
x1i
k1i / pl = ⋅ 100 (tabelul 3.22’, col. 7)
xipl

148
CAPITOLUL 3

Structura producţiei realizate în luna aprilie pe


echipe

10%
20% 40% A
B
C
D
30%

Fig. 3.6’

Pe total:
X1 288
K1 / pl = = = 1,067 (106,7%)
X pl 270
Producţia realizată de întregul atelier în mai este de 1,067 ori mai mare
decât cea planificată în luna mai, adică cu 6,7% mai mare.
X 288
c5) K1 / 0 = 1 = = 1,152 (115,2%)
X 0 250
Producţia realizată în luna mai de întregul atelier este de 1,152 ori mai
mare decât cea realizată în luna aprilie, sau cu 15,2% mai mare.
c6) Se poate determina productivitatea muncii în luna mai, pe fiecare
echipă şi pe total:
xi
w1i = 1 (tabelul 3.22’, col. 8)
ni
La nivel total:

i i
W1 =
∑ x1 = ∑ w1ni = wi g n = 288 = 14,4 buc./salariat
∑ 1 1i
∑ ni ∑ ni 20

149
STATISTICĂ ECONOMICĂ

Tabelul 3.22’
Echipa
x0i xipl g 0i g1i ki0/ D k ipl / 0 k1i / pl w1i
(buc.) (buc.) (%) (%) (%) (%) buc./
pers.
0 1 2 3 4 5 6 7 8

A 100 90 40 36 4 90 116,67 15
B 75 80 30 29 3 106,67 103,75 13,83
C 50 55 20 21 2 110 109,09 15
D 25 45 10 14 1 180 88,89 13,33
Total 250 270 100 100 - 108 106,67 14,4

5.
a) Se notează:
x0i = producţia realizată de echipa “i” în luna ianuarie;
x1i = producţia realizată de echipa “i” în luna februarie;
xipl = producţia planificată de echipa “i” în luna februarie;
X0 = producţia totală a atelierului realizată în luna ianuarie;
X1 = producţia totală a atelierului realizată în luna februarie;
Xpl = producţia totală a atelierului planificată în luna februarie;

x0i xi gi ⋅ X
g 0i = ⋅ 100 = 0 ⋅ 100 Ÿ x0i = 0 0 (tabelul 3.23’, col. 1)
i X0 100
¦ x0
i
Tabelul 3.23’
Secţia
x0i xipl x1i g ipl g1i k1i / 0 t0i w0i
(mil. (mil. (mil. (%) (%) (pers) (mii lei/
lei) lei) lei) pers)
0 1 2 3 4 5 6 7 8
I 1000 1250 1500 16,67 17,65 1,5 126 7930,65
II 2000 3500 3000 46,67 35,29 1,5 287 6960,864
III 1250 1250 2000 16,67 23,53 1,6 210 5950,238
IV 750 1500 2000 20,00 23,53 2,66 77 9740,026
Total 5000 7500 8500 100,0 100,0 700

150
CAPITOLUL 3

xipl k ipl / 0 ⋅ x0i


k ipl / 0 = ⋅ 100 ⇒ xipl = (tabelul 3.23’, col. 2)
x0i 100

X pl = ∑ x ipl = 7500 mil.lei.


i

x1i
k1i / pl = ⇒ x1i = k1i / pl ⋅ xipl (tabelul 3.23’, col. 3).
xipl

X1 = ∑ x 1i = 8500 mil.lei.
i

x ipl x ipl
b) g i
= ⋅100 = ⋅ 100 ( tabelul 3.23’, col. 4)(fig. 3.7’).
∑x
pl i
pl X pl
i

xi xi
g1i = 1 ⋅ 100 = 1 ⋅ 100 (tabelul 3.23’, col. 5) (fig. 3.8’).
i X1
∑ x1
i

Structura producţiei planificate în februarie

46.67%
16.67% Secţia I
Secţia II
Secţia III
Secţia IV
20.00% 16.67%

Fig. 3.7’

i
xi xi x pl
c) k1i / 0 = 1 = 1 ⋅ = k1i / pl ⋅ k ipl / 0 ( tabelul 3.23’, col. 6).
i i i
x0 x pl x0

151
STATISTICĂ ECONOMICĂ

i i i
X pl ¦ x pl ¦ k pl ⋅x0 7500
d) K pl / 0 = = = = = 1,5 (150%) .
X0 i i 5000
¦ x0 ¦ x0

Structura producţiei realizate în februarie

23.53% 17.65%
Secţia I
Secţia II
Secţia III
23.53% 35.29% Secţia IV

Fig. 3.8’

Aceasta înseamnă că în luna februarie s-a planificat o producţie totală la


nivelul întregii societăţi comerciale de 1,5 ori mai mare decât producţia rea-
lizată în luna ianuarie, sau cu 50% mai mare.
Pentru calculul mărimii relative a sarcinii de plan la nivel total se poate
utiliza deci media aritmetică ponderată.
Şi pentru calculul mărimii relative a realizării planului la nivel total se
poate utiliza o medie aritmetică ponderată.

X 1 ¦ x 1i ¦ k 1 ⋅x pl 8500
i i

K 1 / pl = = = = = 1,13 (113%).
X pl ¦ x ipl i
¦ x pl 7500

În luna februarie s-a realizat o producţie totală de 1,13 ori mai mare decât
cea planificată, sau cu 13% mai mare decât cea planificată în februarie.
X X X pl 8500
K1/ 0 = 1 = 1 ⋅ = K1/ pl ⋅ K pl / 0 = = 1,5 ⋅1,13 = 1,7 (170%) e)
X 0 X pl X0 5000
Reprezentarea grafică a mărimilor relative ale planului şi ale dinamicii la
nivelul secţiilor este realizată în fig. 3.9’.

e) T0 = 700 persoane.

152
CAPITOLUL 3

t0i
gti0 = ⇒ t0i = gti0 ⋅ ∑ t0i = gti0 ⋅ T0 (tabelul 3.23’, col. 7)
i
∑ t0

x0i
i
w0 = (tabelul 3.23’, col. 8), unde w0i reprezintă productivitatea
t0i
muncii în perioada de bază – ianuarie, în secţia “i”.
La nivelul societăţii comerciale:

X 0 ¦ x0i i i
¦ w0 ⋅t0 5000
W0 = = = = = 7142,86 mii lei/pes.
T0 i i 700
¦ t0 ¦ t0

Marimile relative ale planului şi de dinamică pe


cele 4 secţii ale societăţii comerciale

300
250
200 Ind.dinamică

150 Sarc.pl.
%

Realiz.pl.
100
50
0
Secţia I Secţia II Secţia III Secţia IV
Secţia

Fig. 3.9’

6.
Notăm:
FS1, FS2 – Fondul de salarii în filiala 1, respectiv, ïn filiala 2 a băncii.
S1, S 2 - salariul mediu în filiala 1, respectiv, ïn filiala 2 a băncii.
T1, T2 – numărul personalului în filiala 1, respectiv, ïn filiala 2 a băncii.

153
STATISTICĂ ECONOMICĂ

gT1, gT2 – Greutatea specifică a personalului în filiala 1, respectiv, ïn


filiala 2 a băncii.
FS – fondul de salarii pe întreaga bancă.
S - salariul mediu pe întreaga bancă.
T – personalul întregii bănci.
FS = 184 mil. lei.

FS1
k1 / 2 = = 1,63 Ÿ FS1 = k 1 / 2 ⋅ FS 2 = 1,63 ⋅ FS 2 .
FS 2
S2 = 8500 mii lei.
g T1 = 0,6 (60%).
FS = FS1 + FS2 = 184 = 1,63 FS2 + FS2 = 447,1.
477,1
Ÿ FS2 = = 170 mil. lei.
2,63
FS1 = 1,63 x1 70 = 277,1 mil. lei.
FS2 FS 170000
S2 = Ÿ T2 = 2 = = 20 persoane.
T2 S2 8500
T 20
gT1 = 0,6 (60%) Ÿ g T = 0,4 = 2 Ÿ T = = 50 persoane.
2
T 0,4

T1 = 50 – 20 = 30 persoane.
FS 277,1
S1 = 1 = = 9237 mii lei.
T1 30
FS1 + FS2 FS 477,1 ⋅ 1000
S= = = = 9542 mii lei.
T1 + T2 T 50

7.
a) Notăm:

x0i = producţia realizată de firma “i” în luna ianuarie;


x1i = producţia realizată de firma “i” în luna februarie;
xipl = producţia planificată de firma “i” în luna februarie;

154
CAPITOLUL 3

X0 = producţia totală (pe ansamblul celor 5 firme) realizată în luna


ianuarie;
X1 = producţia totală (pe ansamblul celor 5 firme) realizată în luna
februarie;
Xpl = producţia totală (pe ansamblul celor 5 firme) planificată în luna
februarie.

x 15 = 750 mil. lei.

x 15 x 15 750
k 15/ 0 = 300% = Ÿ x 5
0
= = = 250 mil. lei.
x 50 3 3
x0i x0i
g 0i = ⋅ 100 = ⋅ 100 , deci pentru firma nr. 5 vom avea:
i X0
¦ x0
i

x 50 x 5 ⋅100 250 ⋅ 100


g 50 = ⋅ 100 Ÿ X 0 = 0
g 50
= = 5000 mil. lei.
X0 5

Pentru celelalte patru firme avem:

i x0i i X 0 ⋅ g 0i
g0 = ⋅ 100 Ÿ x0 = (tabelul 3.24’, col. 4).
X0 100

Pentru firma 5 avem:

x 15 x 15 ⋅ 100 750 ⋅ 100


k 5
1 / pl = 5 100 Ÿ x pl =
5
= = 500 mil. lei.
x pl k 15/ pl 150
Raportul de coordonare al producţiei planificate, luând ca bază de rapor-
tare producţia planificată a firmei 5, va fi:

xipl
kipl/ 5 = Ÿ xipl = kipl/ 5 ⋅ x5pl (tabelul 3.24’, col. 5).
x5pl
X pl = ¦ x ipl = 5800 mil. lei.
i

155
STATISTICĂ ECONOMICĂ

x1i k1i / pl ⋅ xipl


k1i / pl = ⋅ 100 Ÿ x1i = (tabelul 3.24’, col. 6).
xipl 100
X1 = ¦ x 1i = 5450 mil. lei.
i

b) Notăm:
K pl / 0 mărimea relativă a sarcinii de plan pe ansamblul celor 5 firme;
K1 / pl mărimea relativă a realizării planului pe ansamblul celor 5 firme;
K1 / 0 mărimea relativă de dinamică pe ansamblul celor 5 firme.

X1 ¦ x 1i 5450
K 1 / pl = = = = 0,94 (94%).
X pl ¦ x ipl 5800

Producţia totală a celor cinci firme realizată în februarie a reprezentat


doar 94% din cea planificată în această lună, deci cu 6% mai mică.

i xipl
k pl / 0 = ⋅ 100 (tabelul 3.24’, col. 7).
x0i
i
X pl
¦ x pl 5800
K pl / 0 = = = = 1,16 (116%).
X 0 ¦ x i0 5000

Producţia totală propusă pe ansamblul celor cinci firme, în luna februarie,


a fost de 1,16 ori mai mare decât producţia totală realizată în ianuarie, adică
cu 16% mai mare decât aceasta din urmă.
Mărimile relative ale planului pe total se mai pot calcula cu relaţia:

i
X pl
¦ x pl
K pl / 0 = = .
X 0 ¦ x i0
i xipl
Dar k pl / 0 = Ÿ xipl = k ipl / 0 ⋅ x0i .
i
x0

Înlocuind în relaţia sarcinii de plan pe total, găsim:

156
CAPITOLUL 3

( )
i i i
X pl ¦ x pl ¦ k pl / 0 ⋅x0
K pl / 0 = = = = ¦ k ipl / 0 ⋅ g0i ,
X0 i i
¦ x0 ¦ x0

unde g 0i este structura producţiei realizate în luna ianuarie. Aşadar, s-a


folosit o medie aritmetică ponderată.
Asemănător se procedează şi în cazul realizării planului:

X1 ¦ x 1i
K 1 / pl = = .
X pl ¦ x ipl
xi
Dar k1i / pl = 1 Ÿ x1i = k1i / pl ⋅ xipl .
xipl
Înlocuind în relaţia mărimii relative a realizării planului pe total, găsim:

( )
i i i
X1 ¦ x1 ¦ k1 / pl ⋅x pl
K1 / pl = = = = ¦ k1i / pl ⋅ g ipl ,
i
X pl ¦ x pl i
¦ x pl

unde g ipl este structura producţiei planificate în luna februarie. Aşadar, şi în


acest caz s-a folosit o medie aritmetică ponderată.
Tabelul 3.24’
Firma
g 0i kipl/ 5 k1i / pl x0i xipl x1i k ipl / 0
(%) (%) (mil.lei) (mil.lei) (mil.lei) (%)
0 1 2 3 4 5 6 7

1 10 1,4 120 500 700 840 140


2 20 2,4 80 1000 1200 960 120
3 25 2,8 100 1250 1400 1400 112
4 40 4,0 75 2000 2000 1500 100
5 5 1,0 150 250 500 750 200
Total 100 5000 5800 5450

157
STATISTICĂ ECONOMICĂ

Mărimile relative ale planului la nivel total

200

150

% 100
Realiz.plan.
50 Sarc.plan

0
1 2 3 4 5
Firma

Fig.3.10’

8.
a)
Procentul realizării planului la nivelul departamentelor
societăţii comerciale

120
100
80
% 60
40
20
0
A B C D
Departamente

Fig. 3.11’

158
CAPITOLUL 3

Structura valorii vânzărilor realizate în perioada de


bază

35%
A
B
C
40%
15% D
10%

Fig. 3.12’

b) Se folosesc aceleaşi notaţii ca şi la problemele anterioare.

i
X pl ¦ x pl
K pl / 0 = = .
X 0 ¦ x i0
xipl
Dar k ipl / 0 = Ÿ xipl = k ipl / 0 ⋅ x0i .
x0i
Înlocuind în relaţia mărimii relative a sarcinii de plan pe total, găsim:

¦ x pl ¦ k pl / 0 ⋅x 0
i i i
X pl
K pl / 0 = = i
= i
= ¦ (k ipl / 0 ⋅ g i0 ) = 109%,
X0 ¦ x0 ¦ x0

unde g 0i este structura valorii vânzărilor realizate în perioada de bază


(tabelul 3.25’, col. 4).
Deci, la nivelul societăţii comerciale, s-a planificat o valoare a vânzărilor
în perioada curentă cu 9% mai mare decât valoarea realizată a vânzărilor
totale în perioada de bază (sau de 1,09 ori).

X1 ¦ x1i
K1 / 0 = =
X 0 ¦ x0i
xi
Dar k1i / 0 = 1 Ÿ x1i = k1i / 0 ⋅ x0i .
x0i

159
STATISTICĂ ECONOMICĂ

Înlocuind în relaţia realizării planului pe total, găsim:

X 1 ¦ x 1i ¦ k 1i / 0 ⋅x i0
K1/ 0 = = i
= i
= ¦ (k 1i / 0 ⋅ g i0 ) = 111,3%,
X0 ¦ x0 ¦ x0

unde g 0i este structura valorii vânzărilor realizate în perioada de bază.

xi x1i xipl
k1i / 0 = 1 = ⋅ = k1i / pl ⋅ k ipl / 0 (tabelul 3.25’, col. 5).
x0i xipl x0i

Deci, valoarea vânzărilor realizate la nivelul societăţii comerciale în


perioada curentă a fost de 1,113 ori mai mare decât cea efectiv realizată în
periaoda de bază, adică cu 11,3% mai mare.

K 1 / 0 111,3
K 1 / pl = = = 1,021 (102,1%).
K pl / 0 109

Valoarea vânzărilor realizată în perioada curentă pe total societate


comercială a fost de 1,021 ori mai mare decât cea planificată în aceeaşi
perioadă, adică cu 2,1% mai mare.
Tabelul 3.25’
Dep. ki ki gi ki ⋅ gi ki ki ⋅ gi
pl / 0 1 / pl 0 pl / 0 0 1/ 0 1/ 0 0
(%) (%) (%) (%) (%) (%)
0 1 2 3 4 5 6
A 100 90 15 15 90 13,5
B 120 100 35 42 120 42
C 105 115 40 42 120,75 48,3
D 100 75 10 10 75 7,5
Total - - 100 109 - 111,3

160
CAPITOLUL 3

9.
K1 / pl =
¦ x1 = ¦ x1 = 1
=
1
=
¦ x pl ¦ 1 x ¦ g1 20 50
+ +
30
1
k1 / pl k1 / pl 115 120 125
1 1
= = = 1,2 (120%).
0,1733 + 0,4167 + 0,24 0,8306

10.
Nota medie pe ansamblul celor două grupe se poate determina ca o medie
de medii parţiale. Să notăm:

n1 = 25 şi x1 = 7,8
n2 = 32 şi x 2 = 8,4
¦ x i ni
Atunci: x =
¦ ni
x1 ⋅ n1 + x 2 ⋅ n 2 7,8 ⋅ 25 + 8,4 ⋅ 32 195 + 268,8
x= = = = 8,14 puncte.
n1 + n 2 25 + 32 57

11.
a) x=
¦ x i = 51 = 7,28.
n 7
Pentru determinarea medianei, datele se ordonează: 4, 4, 5, 5, 6, 7, 20. Se
determină locul medianei în serie:

Loc Me =
¦ n i + 1 = 7 + 1 = 4.
2 2
Seria având un număr impar de termeni, mediana este egală cu valoarea
termenului central (al patrulea), deci Me = 5.
Mediana este un indicator potrivit pentru a studia tendinţa centrală în
acest set de date, deoarece valoarea 20 este o valoare extremă, ce afectează,
prin magnitudine, nivelul total al variabilei şi deci valoarea mediei. Şase
dintre cele şapte valori se situează sub valoarea mediei aritmetice, ceea ce
face ca indicatorul mediană să exprime mai corect tendinţa centrală.
b) Noile valori sunt: 4, 4, 5, 5, 6, 7, 8.
x = 5,57 , Me = 5.
Valoarea medianei rămâne neschimbată, ea ţinând cont numai de
numărul valorilor mari, nu şi de valoarea lor efectivă.
161
STATISTICĂ ECONOMICĂ

c) Valorile sunt: 55, 57, 54, 55, 70, 56, 54.


'
¦ xi 401
x' = = = 57,28 = x + 50 .
n 7
Se verifică proprietatea mediei aritmetice de a se modifica (±) cu „a“
unităţi, dacă fiecare valoare se modifică (±) cu câte „a“ unităţi.

12.
Cum fondul de salarizare la nivelul unei filiale este:
FSi = Si ⋅ N i ,
iar la nivelul întregii firme este:

FS = ¦ FSi = S ⋅ ¦ N i ,
vom putea calcula salariul mediu S ca o medie armonică ponderată:
¦ ni
xh =
1
¦ ⋅ ni
xi
¦FSi ¦FSi = 45900+ 33480+16800+19600
xh = =
¦ Ni ¦ 1 ⋅ FS 1 1 1 1
i 45900+ 33480+ 16800+ 19600
Si 540 620 480 700
115840
= = 573, 465 mii UM.
202

13.
Pentru calculul indicelui mediu vom utiliza media geometrică, întrucât
între nivelurile variabilei studiate (indice) se află o relaţie de produs.

xg = n ∏ xi .
I p = 4 ∏ I p = 4 I p95 / 94 ⋅ I p96 / 95 ⋅ I p97 / 96 ⋅ I p98 / 97 =
4
1,319⋅1,364⋅ 2,514⋅1,484 = 1,61 = 161%.

162
CAPITOLUL 3

Teste propuse spre rezolvare

1. Pentru 3 magazine, se dau vânzările zilnice de calculatoare, de luni până


sâmbătă:
Magazinul A: 10; 8; 6; 0; 3; 5;
Magazinul B: 6; 3; 6; 5; 3; 5;
Magazinul C: 10; 7; 4; 7; 7; 115.

a) Calculaţi media, mediana şi modulul pentru fiecare nagazin;


b) Pentru care din cele trei cazuri, media nu exprimă adecvat tendinţa
centrală? De ce? Ce alt indicator al tendinţei centrale ar fi mai adecvat?
6
(
c) Arătaţi, pe unul din seturile de date, că ¦ xi − x )2 = 0 . Este această
i =1
egalitate perfect adevărată întotdeauna?

2. Pentru 20 de familii s-a înregistrat numărul de camere locuibile ale


apartamentelor. Datele sistematizate sunt:
Tabelul 3.26’
Număr de camere 1 2 3 4 5
Număr de familii 3 6 8 2 1
Determinaţi numărul mediu, median şi modal de camere, deţinut de o
familie.

3. Presupuneţi că aţi cântărit opt pachete proaspăt achiziţionate şi aţi găsit:


greutatea medie: 3,5 kg./pachet; greutatea mediană: 3,25 kg./pachet;
greutatea modală: 3,1 kg./pachet. Ulterior, descoperiţi că de fapt cântarul
dumneavoastră are o abatere de +0,2 kg. Puteţi determina valorile reale ale
celor trei indicatori ai tendinţei centrale, fără a relua cântărirea fiecărui
pachet în parte?

4. Un student participant la o sesiune de comunicări ştiinţifice, doreşte să


elaboreze o lucrare în cadrul secţiunii "Psihologie". El află însă că anul
trecut punctajul mdiu obţinut de o lucrare la această secţiune a fost de 7,71,
în timp ce punctajul mediu la secţiunea "Ştiinţe politice" a fost de 9,25.
Bazându-se pe aceste informaţii, el decide să-şi elaboreze lucrarea la
secţiunea "Ştiinţe politice", deoarece crede că astfel are şanse mai mari să
obţină un punctaj maxim. Credeţi că decizia studentului, luată pe baza
motivaţiei arătate, a fost cea corectă?

163
STATISTICĂ ECONOMICĂ

5. Într-un magazin de produse electrocasnice, se cunosc următoarele date


referitoare la cei patru vânzători:
¾ vânzătorul A a vândut în medie pe zi 1,75 aspiratoare, în primele patru
zile;
¾ vânzătorul B a vândut în medie pe zi 2,2 aspiratoare, în următoarele
cinci zile;
¾ vânzătorul C a vândut în medie pe zi 3,25 aspiratoare, în următoarele
patru zile;
¾ vânzătorul D a vândut în medie pe zi 3,0 aspiratoare, în următoarele
şapte zile;
Care este numărul mediu de aspiratoare vândut zilnic de un vânzător?

6. Despre cele trei secţii de producţie ale unui agent economic cu profil
industrial, se cunosc datele:
Tabelul 3.27’
Secţia Producţia (bucăţi) Productivitatea muncii (bucăţi/pers.)
A 5000 125
B 4200 70
C 3700 74
Să se determine productivitatea muncii pe ansamblul agentului economic.
Ce tip de medie se utilizează?

7. Indicii anuali ai preţurilor de consum la mărfurile alimentare în perioada


1995-1998 au fost:
Tabelul 3.28’
Anul 1995 1996 1997 1998
Indicele preţurilor faţă de anul precedent (%) 131,9 136,9 251,4 148,4
Sursa: Anuarul statistic al României 1999.
Să se determine indicele mediu al preţurilor de consum la mărfurile
alimentare pe perioada analizată.

8. Producţia totală de castraveţi pe 200 de parcele de mărime egală a fost de


30 tone. Ştiind că pe cele mai multe parcele s-a relizat o producţie de
castraveţi de 125 kg., iar coeficientul de asimetrie al repartiţiei după
producţie a fost de +0,35, să se afle dacă repartiţia este omogenă sau nu.

9. Pentru o colectivitate statistică formată din 10 persoane, s-au cules date


referitoare la vârstă şi venitul salarial:

164
CAPITOLUL 3

¾ pentru vârstă: {x i } = {20;36;35;27;25;22;40;41;3;28};


¾ pentru venit: {y i } = {2,0;2,5;7,0;3,4;3,5;2,8;4,0;4,5;5,0;3,0}
Să se studieze după care din cele două variabile colectivitatea este mai
omogenă.
10. 30 de studenţi ai unei facultăţi economice au susţinut examene la
disciplinele: statistică şi matematică. Fie xi - punctajul obţinut la examenul
de statistică de către studentul "i" şi yi - punctajul obţinut la examenul de
matematică de către studentul "i". Se cunosc datele:
30 30
2
¦ x i = 274,5 ; ¦ xi = 2610
i =1 i =1
30 30
2
¦ y i = 248 ; ¦ y i = 2240
i =1 i =1
Să se studieze dacă colectivitatea celor 30 de studenţi este mai omogenă
după rezultatele la examenul de statistică sau la cel de matematică.
11. Se cunosc datele:
Tabelul 3.29’
Departament Procentul Procentul îndeplinirii Structura producţiei (%)
sarcinii de plan planului producţiei realizate în:
al (%) Perioada de Perioada
producţiei (%) bază curentă
D1 175 105 25 30
D2 190 150 45 50
D3 112 90 30 20
Să se determine procentul mediu al sarcinii de plan, al îndeplinirii
planului şi al dinamicii producţiei pe întreaga societate comercială.
12. Despre un agent economic se ştie că sarcina de plan a producţiei valorice
în luna aprilie faţă de martie 2001 a fost de 112%. Ştiind că valoarea
producţiei realizate de agentul economic în martie 2001 a fost de 200 mld.
lei, putem spune că producţia valorică realizată de agentul economic în luna
aprilie 2001 a depăşit-o pe cea propusă pentru această lună:
a) cu 12%;
b) de 1,12 ori;
12
c) cu ⋅ 200 = 24 mld. lei;
100
112
d) ⋅ 200 = 224 mld. lei.
100

165
CAPITOLUL 4

CAPITOLUL 4

CERCETAREA STATISTICĂ PRIN SONDAJ

Consideraţii preliminare
În capitolele precedente am discutat despre posibilităţile de culegere a
datelor pe baza metodelor de observare totală sau parţială, ca şi despre
modalităţile de descriere a datelor prin indicatori statistici, uzual obţinuţi pe
baza colectivităţilor parţiale. Am văzut, de asemenea, că inferenţa statistică
reprezintă procesul prin care obţinem informaţii şi tragem concluzii
referitoare la colectivităţi generale, pe baza eşantioanelor. Există două
tehnici generale pentru realizarea inferenţei statistice: procesul de estimare
şi cel de testare a ipotezelor statistice.
În capitolul acesta vom urmări să cunoaştem fundamentele procesului de
estimaţie şi ale celui de testare a ipotezelor statistice, vitale pentru
desfăurarea unor cercetări statistice.

Termeni cheie
criteriu de semnificaţie. parametru
distribuţie de eşantionare probabilitatea unei erori de genul I
eroare de estimaţie probabilitatea unei erori de genul II
eroare de genul I selecţie statică
eroare de genul II sondaj aleator simplu
eroare limită admisibilă sondaj aleator tipic
eroare medie de reprezentativitate sondaj cu revenire
eşantion sondaj fără revenire
estimaţie sondaj în cuiburi
estimator test statistic
interval de încredere volum al eşantionului
ipoteză statistică

166
STATISTICĂ ECONOMICĂ

Noţiuni teoretice

4.1. INTRODUCERE

Cercetarea statistică urmăreşte obţinerea informaţiilor ce permit caracte-


rizarea, din punct de vedere cantitativ, a fenomenelor de masă. Există două
modalităţi de obţinere a acestor informaţii şi anume: se pot culege date
despre toate unităţile ce alcătuiesc colectivitatea cercetată sau se poate se-
lecta o subcolectivitate pe care să o analizăm şi pe baza informaţiilor obţi-
nute să tragem concluzii, să generalizăm rezultatele pentru colectivitatea de
ansamblu. Prima cale prezentată este cea a unei cercetări statistice totale,
iar cea de-a doua a cercetării statistice prin sondaj. În condiţiile econo-
mico-sociale de astăzi, când este nevoie de informaţii rapide, multiple şi
complexe, metoda principală de obţinere a informaţiilor statistice tinde să
devină, practic, aceea a sondajului statistic, prin care se obţin date empirice
şi, printr-o interpretare probabilistică, se estimează indicatori pentru popula-
ţia totală.
Metoda sondajului poate aşadar să salveze timp şi bani oferind informaţii
despre seturi largi de date fără ca să fie necesară observarea şi cercetarea
tuturor elementelor ce alcătuiesc colectivitatea. Procesul va cuprinde atunci
două etape:
— etapa descriptivă, în care se culeg date şi se calculează indicatorii ce
caracterizează subcolectivitatea analizată
— etapa inferenţială, în care rezultatele obţinute pentru această subco-
lectivitate se extind, în termeni probabilistici, la colectivitatea generală.
Este de menţionat faptul că, dacă metodele statistice descriptive pot fi
aplicate atât unei colectivităţi totale cât şi uneia parţiale, în schimb etapa de
inferenţă statistică este specifică cercetării prin sondaj.

4.2. NOŢIUNI SPECIFICE

DEFINIŢIE: Selecţia statistică reprezintă operaţia de extragere a unei


părţi dintr-o colectivitate statistică, a unei subcolectivităţi numită şi
eşantion, mostră, colectivitate parţială sau colectivitate de selecţie.

167
CAPITOLUL 4

Vom nota volumul colectivităţii generale cu N şi volumul colectivităţii


de selecţie cu n, 1 ≤ n ≤ N-1. În cazul în care datele au fost sistematizate în r
grupe după variaţia unei caracteristici de grupare, vom avea:
r
N = ¦ Ni (4.1)
i =1

r
n = ¦ ni (4.2)
i =1

Media aritmetică, principalul indicator al tendinţei centrale, va fi notat


cu µ în cazul în care este parametrul colectivităţii totale şi cu x în cazul în
care este un indicator obţinut printr-o cercetare statistică prin sondaj.
Parametrul colectivităţii generale se calculează:

N
¦ xi
i =1
µ= (4.3)
N

sau dacă datele au fost sistematizate în r grupe obţinându-se o serie de dis-


tribuţie de frecvenţe:

r
¦ xi Ni
i −1
µ= r
i = 1, r (4.4)
¦ Ni
i =1

Indicatorul statistic obţinut pentru eşantion – media – estimatorul para-


metrului, este:

n
¦ xi
i =1
x= (4.5)
n

sau în cazul unei serii de distribuţii de frecvenţe:

168
STATISTICĂ ECONOMICĂ

r
¦ xini
i =1
x= r
(4.6)
¦ ni
i =1

Un alt indicator important, dispersia, se va nota cu σ 2 dacă este para-


metru obţinut în colectivitatea generală şi cu s2 dacă este estimatorul para-
metrului, obţinut pe un eşantion.
Astfel, parametrul colectivităţii generale este:

N
¦ ( x i − µ) 2
σ 2x = i =1 (4.7)
N

respectiv în cazul datelor grupate:

r 2
¦ ( x i − µ) N i
σx2
= i =1 (4.8)
r
¦ Ni
i =1

iar estimatorul dispersiei din colectivitatea generală, anume dispersia eşan-


tionului:

2
§ n ·
¨ ¦ xi ¸
n
2 ¨ i =1 ¸
n
¦xi −¨ ¸
i =1 n
¦ (x i − x) 2 ¨ ¸
¨ ¸
s 2x = i =1 = © ¹ (4.9)
n −1 n −1

sau în cazul distribuţiei de frecvenţe:

169
CAPITOLUL 4

2
 r 
 ∑ xini 
r  
∑ x 2 n i −  i =1 
r r
i =1 i  ∑ ni 
∑ (x i − x) 2 n i  
s 2x = i =1 =  i =1  (4.10)
r r
∑ ni −1 ∑ ni −1
i =1 i =1

Atunci când eşantioanele sunt de volum mare (n>30), se poate renunţa la


scăderea lui 1 din numitorul dispersiei.

În cazul caracteristicilor binare (de tip alternativ), simbolurile perechi


utilizate pentru parametrii din populaţia generală şi pentru estimatorii obţi-
nuţi în eşantion vor fi: pentru media aritmetică:
— parametrul colectivităţii generale:

M
p= (4.11)
N

— estimatorul obţinut în eşantion:

m
f= (4.12)
n

Dispersia caracteristicii alternative se va nota în populaţia generală cu:

σ 2 = p(1 − p) (4.13)

iar în eşantion (estimatorul dispersiei din colectivitatea generală):

s 2 = f (1 − f ) (4.14)

170
STATISTICĂ ECONOMICĂ• x

• • •
• • •
• • • •
• •
••
• •

eºantion
Populaþie (colectivitate generalã)

Fig. 4.1 - Procesul inferenţei statistice

4.3. TIPURI DE SONDAJ

În selecţia aleatoare se disting următoarele tipuri de sondaj:


— sondajul simplu aleator;
— sondajul tipic (stratificat);
— sondajul de serii (cuiburi);
— sondajul în mai multe trepte;
— sondaj secvenţial.

4.4. DISTRIBUŢII DE EŞANTIONARE. PROPRIETĂŢI ALE


DISTRIBUŢIILOR DE EŞANTIONARE

Deoarece datele din eşantioane sunt valori observate ale variabilelor alea-
toare, indicatorii statistici calculaţi pentru un eşantion vor varia într-un mod
aleator de la eşantion la eşantion.

Populaţia statistică
(colectivitatea)

Eşantion Eşantion Eşantion

171
Indicator Indicator Indicator

Fig 4.2. Obtinerea unei distributii de esantionare


CAPITOLUL 4

În privinţa mediei de selecţie, indicator statistic obţinut pe eşantion,


trebuie arătat că, indiferent de forma distribuţiei de frecvenţe din colectivi-
tatea generală, media distribuţiei de eşantionare a mediei de selecţie ( x ) este
egală cu µ, media colectivităţii generale (pentru eşantioane mari).

µ (x) = µ

Un alt parametru al distribuţiei de eşantionare, dispersia medie de


sondaj se calculează ca:

σ2
σ x2 = (4.15)
n

Eroarea standard a mediei de sondaj este σ x , adică abaterea medie


pătratică a mediei de selecţie x de la parametrul µ:

σ 2x σx
σx = = (4.16)
n n

Evident, cum σx2 (dispersia colectivităţii generale) şi σ (abaterea medie


pătratică din colectivitatea generală) sunt necunoscute, ele se estimează prin
s2 (dispersia de sondaj) şi s (abaterea mediei pătratice de sondaj). Se obţine,
astfel, estimatorul dispersiei mediei de sondaj ( s 2x ):
s 2x
2
s = (4.17)
x n

şi estimatorul erorii medii a mediei de sondaj (adică eroarea medie de


reprezentativitate):
172
STATISTICĂ ECONOMICĂ

s
sx = x (4.18)
n
În privinţa distribuţiei de eşantionare a mediei de selecţie, să mai notăm
că în cazul populaţiilor normal distribuite (cu distribuţii de probabilitate
normală), distribuţia de eşantionare a mediei de selecţie este normală,
indiferent de numărul elementelor din eşantion (de volumul eşantionu-
lui).

4.5. SONDAJUL ALEATOR SIMPLU REPETAT

4.5.1. Determinarea erorii medii de reprezentativitate

În cazul unei variabile cantitative, de tip nealternativ, pentru estimarea


parametrului media colectivităţii generale (µ) este necesar să calculăm me-
dia de sondaj ( x ) (formulele 4.5 sau 4.6).
Dispersia mediilor de selecţie este:
s 2x
s2 = (4.19)
x n
Eroarea medie de reprezentativitate (abaterea medie pătratică a mediei
de sondaj) se determnină pe baza datelor din eşantion ca:

s 2x s
sx = = x (4.20)
n n

4.5.2. Determinarea erorii limită

Pentru a construi acest interval de încredere vom determina, întâi, eroa-


rea limită maximă admisibilă. Cum media de sondaj ( x ) este variabilă
aleatoare normal distribuită, de medie µ şi abaterea medie pătratică σ x =σx / n ,
înseamnă că variabila normală normată (redusă) corespunzătoare este:

173
CAPITOLUL 4

x−µ
z= (4.21)
σx

x−µ
z= (4.22)
sx

Pentru probabilitatea cu care garantăm rezultatele 100(1-α)%, eroarea


limită (maximă) admisibilă este:

s
∆ x = z α / 2s x = z α / 2 x (4.23)
n

4.5.3. Determinarea intervalului de încredere pentru media µ

Intervalul de încredere calculat pe baza erorii limită maximă admisibilă


este:
s
x ± zα / 2
n

Pentru un eşantion de volum normal sau mare, mărimea relativă a


intervalului de încredere poate să fie prezentată schematic astfel (Fig. 4.3)

Interval de încredere pentru 1-α=0.999

Interval de încredere pentru 1-α=0.99

Interval de încredere pentru 1-α=0.95


Interval de încredere pentru 1-α=0.90

sx sx
x
Media eşantionului

Fig. 4.3 - Mărimea relativă a intervalului de încredere


pentru un eşantion de volum mare

174
STATISTICĂ ECONOMICĂ

x − ∆x < µ < x + ∆x (4.24)

Intervalul de încredere ( x ± ∆ x ) este garantat cu nivelul de încredere


ales, ceea ce face ca această estimare să fie preferabilă estimării punctuale.
Intervalul de încredere pentru nivelul total al caracteristicii este:

N
N ( x − ∆ x ) < ¦ x i < N( x + ∆ x ) (4.25)
i =1

EXEMPLUL 4.1: Să se determine intervalul de încredere, garantat cu o


probabilitate de 99%, pentru media şi nivelul total al unei caracteristici
numerice X, dacă eşantionul selectat aleator repetat de 36 de unităţi, adică
5% din colectivitatea generală este de medie 800 şi abatere medie pătratică
60.
Rezolvare: Eroarea medie de reprezentativitate va fi:
s 2x s 60
sx = = x = = 10
n n 6

Eroarea limită maximă admisibilă:

∆ x = z α / 2 s x = 2.58 ⋅ 10 = 25.8

Intervalul de încredere pentru parametrul colectivităţii generale este dat


de:

x − ∆x < µ < x + ∆x
800-25.8 < m < 800+25.8
774.2 < m < 825.8

iar pentru nivelul total al caracteristicii studiate:

N( x − ∆ x ) < ¦ x i < N( x + ∆ x )
557424 < ¦ x i < 594576

Acest intervale de încredere sunt garantate cu o probabilitate de 99%.

175
CAPITOLUL 4

4.5.4. Determinarea volumului eşantionului

s
zα / 2 ⋅ x = ∆ x (4.26)
n
sau

s L
zα / 2 ⋅ x = (4.27)
n 2

Soluţia poate fi scrisă ca:

(z α / 2 ) 2 ⋅ s 2x
n= (4.28)
∆2
x
sau

4(z α / 2 ) 2 ⋅ s 2x
n= (4.29)
L2

Desigur, şi aici sx2 se foloseşte ca o estimaţie a lui σ 2x , în general necu-


noscută. Valoarea aproximativă a lui sx2 poate fi cunoscută dintr-o cercetare
prin sondaj anterioară. Ca o alternativă, putem aproxima amplitudinea îm-
prăştierii Ax a observaţiilor şi apoi, sub presupunerea tendinţei de norma-
litate a distribuţiei, putem calcula:

sx ≅ Ax / 6 (4.30)

EXEMPLUL 4.2: Să se determine volumul eşantionului necesar pentru a


estima media unei colectivităţi (µ) cu o eroare limită de 0.2 şi o probabilitate
de garantare a rezultatelor de 95%, ştiind dintr-o cercetare anterioară că
dispersia sx2 este aproximativ egală cu 6.1. Aceaşi cerinţă pentru lungimea
intervalului de încredere de 0.2.
Rezolvare: Pentru:
∆ x = 0 .2
100(1-α)% = 95% => zα/2 = z0.025 = 1.96
176
STATISTICĂ ECONOMICĂ

sx2 = 6.1
rezultă:
2 2
zα / 2 ⋅sx (1.96) 2 ⋅ 6.1
n= = = 585.84 ≅ 586 unităţi statistice
∆2 (0.2) 2
x
În cazul în care întreaga lungime a intervalului de încredere este de 0.2
(evident o precizie crescută), vom avea:
2 2
4 ⋅ zα / 2 ⋅ sx 4 ⋅ (1.96) 2 ⋅ 6.1
n= = = 2343.36 ≅ 2344 unităţi statistice
L2 (0.2) 2

4.5.5. Determinarea probabilităţii de garantare a rezultatelor 100(1-α)%

Coeficientul de încredere este 1-α, pentru care P(-zα/2 < Z < zα/2)=1-α.
Atunci, din formula erorii limită (maximă) admisibilă rezultă:

∆x n
zα / 2 = (4.31)
sx

Din tabelele privind distribuţia normală normată se poate determina apoi


probabilitatea 100(1-α)% de garantare a rezultatelor.

EXEMPLUL 4.3: Să se determine nivelul de încredere pentru estimaţia


privind media colectivităţii generale (µ), dacă volumul eşantionului este
n=100 unităţi statistice, media eşantionului x =258600, abaterea medie
pătratică s=8000, iar intervalul de încredere dorit este de 4000.
Rezolvare:
∆ n 2000 100
zα / 2 = x = = 2.5
s 8000
şi
1-α=P(-2.5<z<2.5)=2(0.4938)=0.9876

Probabilitatea cu care garantăm rezultatele este de 98.76%.

177
CAPITOLUL 4

4.5.6. Particularităţi ale sondajului de volum redus

Dacă eşantionul este de volum redus (n<30), iar abaterea medie pă-
tratică din colectivitatea generală (σ) este necunoscută şi înlocuită cu
( x − µ)
cea din eşantion (sx), statistica este o statistică t cu (n-1) grade
sx / n
( x − µ)
de libertate. Distribuţia de eşantionare a statisticii este o
sx / n
distribuţie de probabilitate t cu condiţia ca populaţia generală să fie
normal distribuită.
Intervalul de încredere pentru media m din colectivitatea generală este, în
acest caz:
s s
x − t α / 2, n −1 x < µ < x + t α / 2, n −1 x (4.32)
n n

EXEMPLUL 4.4: Presupunem că un număr de n=15 imprimante sunt


selectate pentru a se calcula media numărului de caractere imprimate până la
terminarea cartuşului de imprimare. Pentru eşantionul selectat se obţin:
x = 1.23 milioane caractere;
sx = 0.27 milioane caractere.
Să se formeze un interval de încredere, garantat cu o probabilitate de
99%, pentru media numărului de caractere imprimate (m), în colectivitatea
generală.
Rezolvare: Dacă presupunem că numărul de caractere imprimate este
normal distribuit, atunci, pentru n=15:
tα/2,n-1=t0.005;14=2.977

Intervalul de încredere este:


s s
x − t α / 2, n −1 x < µ < x + t α / 2, n −1 x
n n
0.27 0.27
1.23 − 2.977 < µ < 1.23 + 2.977
15 15
1.02 < µ < 1.44

178
STATISTICĂ ECONOMICĂ

4.6. SONDAJUL ALEATOR SIMPLU NEREPETAT

4.6.1. Determinarea erorii medii de reprezentativitate

Dispersia mediei de selecţie este dată de relaţia:

σ 2x N−n
σ2 = ⋅ (4.33)
x n N −1

şi estimată (în cazul σ2 necunoscută) prin:

s 2x N−n
s2 = ⋅ (4.34)
x n N −1

Abaterea medie pătratică a mediei de selecţie (măsurător al erorii me-


dii de reprezentativitate) este:

σx N−n
σx = ⋅ (4.35)
n N −1

estimată prin:

s N − n sx n
sx = x ⋅ ≅ ⋅ 1− (4.36)
n N −1 n N

N−n n
Termenul ≅ 1− se numeşte coeficient de corecţie în populaţie
N −1 N
finită sau factor de exhaustivitate, iar raportul n/N reprezintă fracţia de
sondaj.

4.6.2. Determinarea erorii limită

Determinarea erorii limită maximă admisibilă se face, în cazul sonda-


jului fără revenire, ţinând seama de eroarea medie de reprezentativitate:

179
CAPITOLUL 4

§s n ·
∆ x = z α / 2 (s x ) = z α / 2 ¨¨ x ⋅ 1 − ¸¸ (4.37)
© n N¹

4.6.3. Determinarea intervalului de încredere pentru media µ

Intervalul de încredere pentru media µ din colectivitatea generală,


corespunzător probabilităţii 100(1-α)% de garantare a rezultatelor este:

x − ∆x < µ < x + ∆x (4.38)

s n s n
x − zα / 2 1 − < µ < x + zα / 2 1− (4.39)
n N n N

§ s n· N § s n·
N¨¨ x − zα / 2 1 − ¸¸ < ¦ x i < N¨¨ x + zα / 2 1 − ¸¸ (4.40)
© n N ¹ i=1 © n N¹

EXEMPLUL 4.5: Un eşantion aleator de 80 de observaţii a fost selectat


nerepetat dintr-o populaţie normal distribuită de volum N=800 de unităţi. În
urma calculelor a rezultat valoarea medie a caracteristicii în eşantion
x =14.1 şi abaterea medie pătratică sx=2.6. Să se determine intervalul de
încredere, garantat cu o probabilitate de 95%, pentru media colectivităţii
generale (µ) şi pentru valoarea agregată a caracteristicii §¨ ¦ x i ·¸ .
N

© i =1 ¹
Rezolvare:
s n 2.6
sx = x 1− = 0.9 = 0.276
n N 80
∆ x = zα / 2 ⋅ s x = z 0.025 ⋅ s x = 1.96 ⋅ 0.276 = 0.54

14.1-0.54< µ <14.1+0.54
13.56< µ <14.64

180
STATISTICĂ ECONOMICĂ

N
10848 < ¦ x i <11712
i =1

4.6.4. Determinarea volumului eşantionului

z2 s 2x N z2 s2
α/2 α/2
n= = (4.41)
z2 s 2x + ∆2 N z2 s2
x
α/2
∆2 + α/2
x N

4.7. ESTIMAREA PROPORŢIEI ÎN CAZUL SONDAJULUI


ALEATOR SIMPLU

Utilizarea lui f pentru a estima populaţia p este similară cu utilizarea lui


x pentru estimarea parametrului µ.

4.7.1. Determinarea erorii medii de reprezentativitate

Dispersia mediilor de selecţie (adică dispersia proporţiilor eşantioa-


nelor) va fi atunci:
p(1 − p)
σ f2 = (4.42)
n
estimată (pentru că, de obicei, proporţia p din colectivitatea generală este
necunoscută), prin:
f (1 − f )
s f2 = (4.43)
n
Atunci, abaterea medie pătratică a proporţiilor din eşantioane, ce repre-
zintă eroarea medie de reprezentativitate este calculată, pe baza datelor
din eşantion:
f (1 − f )
sf = pentru selecţie repetată (4.44)
n
şi

181
CAPITOLUL 4

f (1 − f )  n
sf = ⋅ 1 −  pentru selecţie nerepetată (4.45)
n  N

4.7.2. Determinarea erorii limită

Înlocuind eroarea medie de reprezentativitate calculată anterior obţinem


eroarea limită (maximă admisibilă):
f (1 − f )
∆ f = z α / 2 s f = zα / 2 pentru selecţie repetată (4.46)
n

şi

f (1 − f ) § n ·
∆ f = zα / 2s f = zα / 2 ⋅ ¨1 − ¸ pentru selecţie nerepetată (4.47)
n © N¹

4.7.3. Determinarea intervalului de încredere pentru proporţia p

Intervalul de încredere pentru proporţia p din colectivitatea generală


este dat de:

f-∆f < p < f+∆f (4.48)


adică:
f (1 − f ) f (1 − f )
f − zα / 2 < p < f + zα / 2 pentru selecţie repetată (4.49)
n n

şi
f (1−f ) § n · f (1−f ) § n ·
f − zα / 2 ⋅¨1− ¸ < p < f + zα / 2 ⋅¨1− ¸ (4.50)
n © N¹ n © N¹
pentru selecţie nerepetată, garantat cu o probabilitate 100(1-α)%.

Pentru estimarea numărului de răspunsuri afirmative, intervalul de


încredere este dat de:

N (f − ∆ f ) < M < N (f + ∆ f ) (4.51)

182
STATISTICĂ ECONOMICĂ

EXEMPLUL 4.6: Presupunem că din 100 de persoane selectate aleator şi


anchetate, 30 au o opinie favorabilă despre un produs nou. Să se estimeze cu
o probabilitate de 90%, intervalul de încredere pentru proporţia opiniilor
favorabile din colectivitatea generală (locuitorii unui oraş).
Rezolvare:
f (1 − f ) 0.21
sf = = = 0.046
n 100
∆ f = zα / 2 s f = z 0.05 s f = 1.64 ⋅ 0.046 = 0.075 (7.5%)
0.3-0.075 < p < 0.3+0.075
0.225 < p < 0.375

4.7.4. Determinarea volumului eşantionului

Pentru selecţia aleatoare repetată volumul eşantionului este dată de


relaţia:

z 2 f (1 − f )
n= (4.52)
∆2f

iar pentru selecţia fără revenire este dată de relaţia:

z 2 f (1 − f ) N z 2 f (1 − f )
n= 2 = (4.53)
∆ f N + z 2 f (1 − f ) z 2 f (1 − f )
∆2f +
N

4.7.5. Determinarea probabilităţii de garantare a rezultatelor 100(1-α)%

Pentru a obţine nivelul de încredere sau probabilitatea de garantare a re-


zultatelor, atunci când folosim proporţia f din eşantion pentru a estima pro-
porţia p din colectivitatea generală, vom rezolva ecuaţia:

∆f n
zα / 2 = (4.54)
f (1 − f )

183
CAPITOLUL 4

şi apoi vom determina:

P(-zα/2 < Z < zα/2) = 1-α

4.8. SONDAJUL ALEATOR TIPIC (STRATIFICAT)

Variaţia între straturi nu influenţează, în cazul selecţiei stratificate, eroa-


rea medie de reprezentativitate, deoarece aeastă variaţie este precis reflectată
în eşantion. Cu alte cuvinte, vom fi siguri că – cel puţin din punctul de ve-
dere al factorului de stratificare – populaţia este corect reprezentată în
eşantion şi criteriul ales nu mai constituie sursă pentru eroarea medie de re-
prezentativitate.
Considerând distribuţia unei colectivităţi după variabila X, putem
reprezenta grafic eficacitatea unei stratificări în cadrul sondajului ca în Fig.
4.4.

x x

• • • •
• • •
• • • • •
• • • • • • •
• • • • •
• • • • • • • •• • • •
•• • • •
• • • • • • •
• • • •• • • • • ••• • • • • •
• • • • • •• •• •
• • •• • • • •• •• • • •
• • •
• • • • • •
• • • •
• • •• • • • • ••
• •• • •• • • •• • •

• • • • • •• • • • •
• • • •
• • • • •• •• •

0 0
a) b)
Fig. 4.4 - Sondaj stratificat: a. sondaj ineficient; b. sondaj eficient

4.8.1. Calcului indicatorilor pentru o variabilă cantitativă


Pentru a calcula un estimator nedeplasat al mediei colectivităţii generale,
vom determina media aritmetică ponderată a mediilor straturilor. Ast-
fel, în colectivitatea generală, vom introduce notaţiile:

184
STATISTICĂ ECONOMICĂ

Ni
¦ x ij
j=1
µi = media stratului i (4.55)
Ni

h
¦ µi Ni
µ = i=1 media generală (4.56)
h
¦ Ni
i =1
Pentru eşantion vom nota:
ni
¦ x ij
j =1
xi = media stratului i (4.57)
ni

h
¦ xini
x = i =1 media eşantionului (4.58)
h
¦ ni
i =1
Putem scrie eroarea medie de reprezentativitate:

2
σx
σx = (4.59)
st n

2
sau, pe baza datelor din eşantion (pentru că σ , în general, este necunos-
cut):
2
sx
s x st = (4.60)
n

Atunci, eroarea limită (maximă admisibilă) este:

∆ x st = zα / 2 s x st (4.61)

pentru probabilitatea 100(1-α)% de garantare a rezultatelor.


185
CAPITOLUL 4

Intervalul de încredere pentru media colectivităţii generale este dat


de:

x st − ∆ xst < µ < x st + ∆ xst (4.62)

Determinarea volumului eşantionului se va efectua şi aici pornind de


la formula erorii limită:

2
sx
∆ x st = zα / 2 ⋅ sx = zα / 2
st n

care prin prelucrare conduce la:

2
zα / 2 sx
n= (4.63)
∆2
x st

În cazul selecţiei aleatoare stratificate fără revenire, se va ţine seama


de coeficientul corecţiei finite în populaţie şi vom avea:
— eroarea medie de reprezentativitate:

2 2
sx § n· 1 n i s xi § n·
s x st = ¨1 − ¸ = ¦ ¨1 − ¸ (4.64)
n © N¹ n n © N¹

— eroarea limită admisibilă la un coeficient de încredere (1-α):

2
sx § n·
∆ x = zα / 2 ¨1 − ¸ (4.65)
st n © N¹

— volumul eşantionului:

186
STATISTICĂ ECONOMICĂ

2 2
zα / 2sx
n= (4.66)
2 2
zα / 2 sx
∆2 +
x st N

EXEMPLUL 4.7: Un cercetător este interesat în determinarea salarului me-


diu pentru angajaţii unei firme. În firmă lucrează 850 de persoane, din care
500 angajaţi permanent şi 350 colaboratori. Se selectează aleator stratificat
proporţional 10% din efectiv: 50 de angajaţi permanent şi 35 colaboratori şi
se doreşte garantarea estimaţiei cu o probabilitate de 95%. În urma prelu-
crării datelor, se obţin următoarele rezultate:

Angajaţi permanent Colaboratori


x1 = 1620 mii lei x 2 = 2100 mii lei
sx1= 235 mii lei sx2= 410 mii lei
n1= 50 n2= 35

Rezolvare:

¦ x i Ni ¦ x i n i
x st = = = 1817.65 mii lei
¦ Ni ¦ ni

2 ¦ s 2xi n i
sx = = 101702.94
¦ ni

Eroarea medie de reprezentativitate (se presupune selecţie nerepetată)


este:

2
s § n· 101702.94
sx = x ¨1 − ¸ = ⋅ 0.9 = 32.82 mii lei
st n © N¹ 85

Eroarea limită pentru α=0.05 este:

∆ xst = zα / 2s xst = z 0.025s xst = 1.96 ⋅ 32.82 = 64.33 mii lei

187
CAPITOLUL 4

Intervalul de încredere pentru salariul mediu din colectivitatea generală:

1817.65 – 64.33 < µ < 1817.65 + 64.33 mii lei


1753.32 < µ < 1881.99 mii lei
garantat cu o probabilitate de 95%.

4.8.2. Alegerea numărului de straturi şi repartizarea volumului eşan-


tionului pe straturi

Alegerea numărului de straturi impune două remarci. Prima este de


ordin teoretic: ideală este stratificarea la maximum, adică alegerea unui nu-
măr cât mai mare de grupe. Cea de-a doua este de ordin practic: rareori se
pot depăşi 10 straturi şi, de obicei, limitele straturilor sunt impuse de infor-
maţiile disponibile din baza de sondaj.
Determinarea volumului eşantionului în cazul selecţiei aleatoare strati-
ficate impune şi alocarea acestuia pe straturi. Există două posibilităţi de re-
partizare a volumului eşantionului (n) pe straturi: o repartiţie proporţio-
nală şi o repartiţie optimă.
Dacă dispersiile din interiorul straturilor sunt egale, pentru un număr dat
de unităţi statistice eşantionate (n), dispersia pe ansamblu este minimă când
fracţiile de sondaj sunt identice (selecţie tipică proporţională). Proporţiile
sunt determinate de ponderile straturilor, adică:

Ni
ni = n (4.67)
N

Cea de-a doua posibilitate de repartizare (selecţie tipică optimă) pre-


supune o fracţie de sondaj variabilă de la un strat la altul.
Pentru o selecţie tipică optimă, fracţiile de sondaj vor fi proporţionale cu
abaterile medii pătratice.Atunci, pentru stratul i volumul subeşantionului
este dat de:

N i s xi
ni = n (4.68)
h
¦ N i s xi
i =1
h
şi evident ¦ n i = n .
i =1

188
STATISTICĂ ECONOMICĂ

4.8.3. Estimarea proporţiei pentru o variabilă alternativă

Eroarea medie de reprezentativitate, calculată pe baza datelor din


eşantion este dată de:
— pentru selecţie stratificată repetată:
f (1 − f )
s fst = (4.69)
n

— pentru selecţie stratificată nerepetată:

f (1 − f ) § n·
s fst = ¨1 − ¸ (4.70)
n © N¹

Eroarea limită (maximă admisibilă), la un prag de semnificaţie α, se


calculează ca:
∆ fst = zα / 2 ⋅ s fst (4.71)

iar intervalul de încredere pentru proporţia p din colectivitatea generală:

f − ∆ fst p < f + ∆ fst (4.72)

De asemenea, se adaptează corespunzător formulele pentru determinarea


volumului eşantionului şi repartizarea acestuia pe straturi.

4.9. SONDAJUL DE SERII (CUIBURI)

În sondajul în cuiburi, populaţia, mai mult sau mai puţin împrăştiată,


este subdivizată în cuiburi. Pentru fiecare astfel de cuib se poate calcula o
madie x i . În fiecare din cuiburile extrase toţi indivizii sunt observaţi şi
atunci media xi , este cunoscută fără eroare (de sondaj, neeliminându-se
posibilitatea erorilor de observaţie).
189
CAPITOLUL 4

Hazardul poate alege un cuib asemănător cu altul, deci în care cele două
medii de cuib să fie egale. De aceea fluctuaţia de eşantionaj depinde de ine-
galitatea mediilor de grup. Dispersia totală σ 2x este egală cu suma dis-
persiilor între cuiburi (grupuri) σ c2 şi intracuiburi. Cum σ 2x este fixă, pre-
cizia unui sondaj în cuiburi este cu atât mai bună cu cât σ c2 este mai mică şi
cu cat varianţa în interiorul cuiburilor este mai mare. (Fig. 4.5).

x x

• •
• •
• • •


• • •
• • • • •
• • •
• •

• • •

• •
• • •
• • • •
• • •

0 0

a. b.

Fig. 4.5 - Eficacitatea unui sondaj în cuiburi: a. cuiburi eficiente: mediile de grup
marcate prin puncte sunt puţin dispersate; b. cuiburi ineficiente: mediile cuiburilor
sunt la fel de dispersate ca şi valorile individuale

Dispersia (varianţa) totală este alcătuită din doi termeni: dispersia inter-
cuiburi şi dispersia intracuiburi:

Ni 2 Ni Ni
σ2 = ¦ (Xi − X) + ¦ σi2 =σ2c + ¦ σi2 , (4.73)
N N N

Dispersia intergrupuri exprimă inegalitatea diverselor medii de grupă


între ele.

4.10. TESTAREA IPOTEZELOR STATISTICE ÎN FUNDAMENTAREA


DECIZIILOR

190
STATISTICĂ ECONOMICĂ

Deseori, managerii trebuie să fie pregătiţi să ia decizii privind acţiunile


viitoare pe baza informaţiilor disponibile. În procesul de luare a deciziilor,
ei emit ipoteze pe care le pot testa ştiinţific utilizând metodele şi tehnicile
statistice.

DEFINIŢIE: Ipoteza statistică este ipoteza care se face cu privire la para-


metrul unei repartiţii sau la legea de repartiţie pe care o urmează anumite
variabile aleatoare.

4.10.1. Concepte şi erori în testarea ipotezelor statistice

În statistică, ipotezele apar întotdeauna în perechi: ipoteza nulă şi ipoteza


alternativă. Ipoteza statistică ce urmează a fi testată se numeşte ipoteză nulă
şi este notată, uzual, H0. Ea constă întotdeauna în admiterea caracterului
întâmplător al deosebirilor, adică în presupunerea că nu există deosebiri
esenţiale. Respingerea ipotezei nule care este testată implică acceptarea unei
alte ipoteze. Această altă ipoteză este numită ipoteză alternativă, notată H1.
Procedeul de verificare a unei ipoteze statistice se numeşte test sau cri-
teriu de semnificaţie. O secvenţă generală de paşi se aplică la toate situa-
ţiile de testare a ipotezelor statistice.

1) Se identifică ipoteza statistică specială despre parametrul


populaţiei sau legea de repartiţie (H0).

2) Întotdeauna ipoteza nulă este însoţită de ipoteza alternativă (de cerce-


tat), H1, ce reprezintă o teorie care contrazice ipoteza nulă. Ea va fi accep-
tată doar când există suficiente dovezi, evidenţe, pentru a se stabili că
este adevărată.

3) Se calculează indicatorii statistici în eşantion, utilizaţi pentru a accepta


sau a respinge ipoteza nulă şi se stabileşte testul statistic ce va fi utilizat
drept criteriu de acceptare sau de respingere a ipotezei nule.

4) Se stabileşte regiunea critică, Rc


Regiunea critică este delimitată de valoarea critică, C – punctul de
tăietură în stabilirea acesteia.

191
CAPITOLUL 4

În baza legii numerelor mari, numai într-un număr foarte mic de cazuri
punctul rezultat din sondaj va cădea în Rc, majoritatea vor cădea în afara
regiunii critice. Nu este însă exclus ca punctul din sondaj să cadă în regiunea
critică, cu toate că ipoteza nulă despre parametrul populaţiei este adevărată.

Eroarea pe care o facem eliminând o ipoteză nulă, deşi este adevărată, se


numeşte eroare de genul întâi. Probabilitatea comiterii unei astfel de erori
reprezintă riscul de genul întâi (α) şi se numeşte nivel sau prag de semni-
ficaţie.
Nivelul de încredere al unui test statistic este (1-α) iar în expresie
procentuală, (1-α)100 reprezintă probabilitatea de garantare a rezultatelor.

Eroarea pe cere o facem acceptând o ipoteză nulă, deşi este falsă, se nu-
meşte eroare de genul al doilea, iar probabilitatea (riscul) comiterii unei
astfel de erori se notează cu β. Puterea testului statistic este (1-β).

f(x)
H0 H1

µ0 C µ1 x

Fig. 4.6 - Legătura dintre probabilităţile α şi β

s
Cum s x = x , o dată cu creşterea volumului n al eşantionului, aba-
n
terile medii pătratice ale distribuţiilor pentru H0 şi H1 devin mai mici şi,
evident, atât α, cât şi β descresc (Fig. 4.7).

192
STATISTICĂ ECONOMICĂ

f(x)
H0 H1

µ0 C µ1 x

Fig. 4.7 - α şi β când volumul eşantionului n' > n

5) După ce am stabilit pragul de semnificaţie şi regiunea critică, trecem la


pasul următor, în care vom face principalele presupuneri despre populaţia
sau populaţiile ce sunt eşantionate (normalitate etc.).

6) Se calculează apoi testul statistic şi se determină valoarea sa nume-


rică, pe baza datelor din eşantion.

7) La ultimul pas, se desprind concluziile: ipoteza nulă este fie acceptată,


fie respinsă, astfel:
a) dacă valoarea numerică a testului statistic cade în regiunea
critică (Rc), respingem ipoteza nulă şi concluzionăm că
ipoteza alternativă este adevărată. Vom şti că această decizie
este incorectă doar în 100 α % din cazuri;
b) dacă valoarea numerică a testului nu cade în regiunea
critică (Rc), se acceptă ipoteza nulă H0.

Ipoteza alternativă poate avea una din trei forme (pe care le vom exem-
plifica pentru testarea egalităţii parametrului „media colectivităţii generale“,
µ cu valoarea µ0):

i) H0: µ = µ0
H1: µ ≠ µ0 (µ < µ0 sau µ > µ0);
şi acest test este un test bilateral;

ii) H0: µ = µ0

193
CAPITOLUL 4

H1: µ > µ0
care este un test unilateral dreapta;

iii) H0: µ = µ0
H1: µ < µ0
care este un test unilateral stânga.

α/2 α/2 α α

µ µ µ
a) b) c)
Fig. 4.8 - Regiunea critică pentru: a) test bilateral; b) test unilateral stânga; c) test
unilateral dreapta

4.10.2. Testarea ipotezei privind media populaţiei generale (µ)


pentru eşantioane de volum mare
i) în cazul testului bilateral, ipotezele sunt:

H0: µ = µ0 (µ - µ0=0)
H1: µ ≠ µ0 (µ - µ0≠0) (adică µ < µ0 sau µ > µ0);

x − µ0 x − µ0 x − µ0
z= = ≈ (4.74)
σx σ x n sx n

Regiunea critică Rc este dată de:


Rc: z< - z α/2 sau z> z α/2

x − µ0
Respingem H0 dacă < − zα / 2
σx n
x − µ0
sau > zα / 2
σx n

194
STATISTICĂ ECONOMICĂ

ii) pentru testul unilateral dreapta, ipotezele sunt:

H0: µ = µ0 (µ - µ0=0)
H1: µ > µ0 (µ - µ0>0);

x − µ0
Respingem ipoteza H0 dacă > zα
σ n

iii) Pentru testul unilateral stânga, ipotezele sunt:

H0: µ = µ0 (µ - µ0=0)
H1: µ < µ0 (µ - µ0<0);

x − µ0
Respingem ipoteza H0 dacă < −z α
σ n

4.10.3. Testarea ipotezei privind diferenţa dintre două medii pentru


eşantioane de volum mare

Un estimator al diferenţei (µ1- µ2) este diferenţa dintre mediile


eşantioanelor ( x 1 − x 2 ).

σ 2x1 σ 2x 2
σ (x − x ) = + (4.75)
1 2 n1 n2
unde σ 2x1 şi σ 2x 2 sunt dispersiile celor două populaţii eşantionate, iar n1
şi n2 sunt volumele eşantioanelor respective.
În cazul în care dispersiile celor două populaţii eşantionate sunt egale,
σ 2x1 = σ 2x 2 = σ 2 :
1 1
σ (x − x ) = σ x + (4.76)
1 2 n1 n 2

În aceste condiţii, ipotezele statistice ce urmează a fi testate vor fi:

i) test bilateral

195
CAPITOLUL 4

H0: (µ1- µ2) = D


H1: (µ1- µ2) ≠ D [(µ1- µ2)>D sau (µ1- µ2)<D]

ii) test unilateral dreapta

H0: (µ1- µ2) = D


H1: (µ1- µ2) > D

iii) test unilateral stânga

H0: (µ1- µ2) = D


H1: (µ1- µ2) < D

Testul statistic utilizat are forma:

z=
(x 1− x2 − D )
σ (x − x 2 )
1

Regiunea critică este dată de:


i) z< - z α/2 sau z> z α/2
ii) z> z α
iii) z< - z α

4.10.4. Testarea ipotezei privind media populaţiei generale (µ)


pentru eşantioane de volum redus

În locul statisticii z care necesită cunoaşterea (sau o bună aproximare) a


lui σ x , vom folosi statistica:

x − µ0 x − µ0
t= = (4.77)
sx sx n

unde: s 2x =
(
¦ xi − x )2
n −1

i) test bilateral

196
STATISTICĂ ECONOMICĂ

H0: µ = µ0
H1: µ ≠ µ0 (µ < µ0 sau µ > µ0);

ii) test unilateral dreapta

H0: µ = µ0
H1: µ > µ0

iii) test unilateral stânga

H0: µ = µ0
H1: µ < µ0

Testul statistic utilizat:


x − µ0 x − µ0
t= =
sx sx n

Presupunerea specială ce trebuie făcută este aceea că populaţia gene-


rală este normal sau aproximativ normal distribuită.

Regiunea critică este dată de:


i) t > t α/2,n-1 sau t < - t α/2,n-1
ii) t > t α,n-1
iii) t < - t α,n-1

4.10.5. Testarea ipotezei privind diferenţa dintre două medii pentru


eşantioane de volum redus

În condiţiile în care presupunem că cele două colectivităţi generale au


dispersii egale ( σ 2x1 = σ 2x 2 = σ 2x ), un estimator al dispersiei (variabilităţii)
totale din cele două populaţii combinate este:

¦ (xi − x1 ) + ¦ (xi − x 2 )
n1 2 2 n 2

i =1 i =1
s c2 = (4.78)
n1 + n 2 − 2
197
CAPITOLUL 4

sau

s c2 =
(n1 − 1)s 2x1 + (n 2 − 1)s 2x 2 =
(n1 − 1)s 2x1 + (n 2 − 1)s 2x 2 (4.79)
(n1 − 1) + (n 2 − 1) n1 + n 2 − 2

Ipotezele statistice vor fi, în aceste condiţii:

i) test bilateral

H0: µ1 = µ2 (µ1- µ2 = D)
H1: µ1 ≠ µ2 (µ1- µ2 ≠ D)

ii) test unilateral dreapta

H0: µ1 = µ2 (µ1- µ2 = D)
H1: µ1 > µ2 (µ1- µ2 > D)

iii) test unilateral stânga

H0: µ1 = µ2 (µ1- µ2 = D)
H1: µ1 < µ2 (µ1- µ2 < D)

Testul statistic t va avea forma:

t=
(x 1 )
− x2 − D
=
(x 1 − x2 − D ) ⋅
n1n 2 (n1 + n 2 − 2)
§ 1 1 · s 2x1 (n1 − 1) + s 2x 2 (n 2 − 1) n1 + n 2
s c2 ¨¨ + ¸¸
© n1 n 2 ¹

Regiunea critică este dată de:


i) t< - t α / 2, n + n sau t> t α / 2, n
1 2 −2 1 +n 2 −2
ii) t> t α , n
1 + n 2 −2
iii)t< – t α , n
1 + n 2 −2

198
STATISTICĂ ECONOMICĂ

Întrebări recapitulative

1. Definiţi conceptul de selecţie statistică.


2. Arătaţi avantajele utilizării selecţiei statistice.
3. Ce este eşantionul?
4. Ce reprezintă noţiunea de „eroare de estimaţie“?
5. Arătaţi principalele noţiuni perechi specifice selecţiei statistice.
6. Care sunt principalele etape ale realizării unui sondaj statistic?
7. Prin ce se caracterizează o distribuţie de eşantionare?
8. Sondajul aleator simplu repetat: caracteristici, eroare de reprezentati-
vitate, eroare limită admisibilă, interval de încredere.
9. Cum se determină volumul eşantionului în cazul sondajului aleator
simplu repetat şi nerepetat. De ce factori depinde?
10. Determinarea erorii de reprezentativitate, a erorii maxim admisibile şi
a intervalului de încredere în cazul utilizării sondajului simplu aleator nere-
petat.
11. Cum se determină probabilitatea de garantare a rezultatelor în cazul
sondajului aleator simplu repetat şi nerepetat?
12. Determinarea intervalului de încredere în cazul sondajului aleator
simplu de volum redus.
13. Determinaţi indicatorii de sondaj, erorile şi intervalul de încredere
pentru caracteristica alternativă în cazul sondajului simplu aleator.
14. Volumul eşantionului şi probabilitatea de garantare a rezultatelor
pentru caracteristica alternativă — sondaj simplu aleator.
15. Ce particularităţi prezintă sondajul stratificat?
16. În ce condiţii se foloseşte şi care sunt avantajele utilizării sondajului
tipic în cercetarea statistică?
17. Calculul indicatorilor de sondaj pentru o caracteristică cantitativă, în
cazul sondajului tipic.
18. Cum se alege numărul de straturi şi cum se repartizează volumul
eşantionului pe straturi?
19. Calculul indicatorilor de sondaj pentru o caracteristică alternativă în
cazul sondajului stratificat.
20. Sondajul de serii — concept, utilizare, particularităţi, avantaje.
21. Ce reprezintă ipoteza nulă într-un proces de testare de ipoteze statis-
tice?
22. Ce reprezintă ipoteza alternativă într-un proces de testare de ipoteze
statistice?

199
CAPITOLUL 4

23. Ce reprezintă testul sau criteriul de semnificaţie?


24. Ce reprezintă regiunea critică?
25. Când comitem o eroare de genul întâi?
26. Când comitem o eroare de genul al doilea?
27. Ce reprezintă α şi β?
28. Care sunt paşii în construirea unui test statistic?
29. Cum se testează ipoteza privind media unei colectivităţi generale în
cazul eşantioanelor mari?
30. Cum se testează ipoteza privind media unei colectivităţi generale în
cazul eşantioanelor de volum redus?
31. Cum se testează ipoteza privind diferenţa dintre mediile a două colec-
tivităţi generale, în cazul eşantioanelor mari?
32. Cum se testează ipoteza privind diferenţa dintre mediile a două colec-
tivităţi generale, în cazul eşantioanelor de volum redus?

200
CAPITOLUL 4

Teste de autoevaluare

1. Managerul unei companii de produse cosmetice doreşte să afle


vârsta medie a femeilor care achiziţionează un produs recent promovat pe
piaţă. Pentru aceasta, se organizează un sondaj pe 100 de cumpărătoare
(reprezentând 10% din populaţia totală) de la care s-a înregistrat vârsta.
Datele sistematizate se prezintă astfel:
Tabelul 4.1’
Grupe de sub 20 20-24 24-28 28-32 32-36 peste
cumpărătoare după 36
vârstă (ani)
Număr de 5 8 20 50 10 7
cumpărătoare
Se cere:
a) Să se estimeze, cu o probabilitate de 90% (z=1,65), vârsta medie a
femeilor care au achiziţionat produsul, în ideea formării eşantionului
prin procedeul:
a1) repetat;
a2) nerepetat.
Comparaţi rezultatele obţinute.
b) În ipoteza sondajului nerepetat, să se estimeze vârsta medie dacă
rezultatele se garantează cu o probabilitate de 99,73% (z=3). Comparaţi
rezultatele obţinute.
c) Dacă dorim să organizăm un nou sondaj, cu o eroare limită mai mică cu
15%, câte cumpărătoare ar trebui să includem în eşantion?
d) Să se estimeze ponderea femeilor în vârstă de peste 32 ani care
achiziţionează produsul.

2. Psihologul unei întreprinderi industriale a observat că odată cu


scurgerea timpului din cadrul programului de lucru, muncitorii produc un
număr tot mai mare de piese defecte, rebuturile atingând un punct de maxim
în intervalul orar 15:00 - 17:00. El împarte un eşantion de 60 de muncitori în
două grupuri egale. Unul dintre grupuri lucrează în conformitate cu
programul de lucru anterior, iar celălalt ia o pauză de 15 minute între orele
13:45 - 14:00. Notăm cu xi numărul de piese defecte realizate de muncitorul
"i" în intervalul orar 15:00 - 17:00. Se cunosc rezultatele:

201
STATISTICĂ ECONOMICĂ

Grupul 1 Grupul 2
30 30
¦ x1i = 189 ¦ x 2i = 99
i =1 i =1

30 30
2 2
¦ x1i = 1326 ¦ x 2i = 120
i =1 i =1

Dacă cei 60 de muncitori reprezintă un eşantion de 10% din


colectivitatea generală, să se estimeze cu o probabilitate de 95,45% (z=2)
numărul mediu al rebuturilor efectuate de un salariat din întreprindere în
intervalul orar 15:00 - 17:00.

3. O companie producătoare de software specializat a creat trei


programe pentru a facilita studenţilor aprofundarea ştiinţelor economice.
Pentru testarea eficacităţii acestor programe, au fost alcătuite trei grupuri de
studenţi, fiecare grup fiind instruit cu ajutorul câte unuia dintre programe.
După două săptămâni de instruire, studenţii au primit un test de verificare a
cunoştinţelor la ştiinţele economice. Rezultatele sistematizate se prezintă
astfel:
Tabelul 4.2’
Grupe de studenţi Număr de Punctajul Abaterea medie Ponderea studenţilor
după programul studenţi mediu pătratică a care au obţinut peste
tutorial (ni) punctajului (sxi)
( xi ) 90 de puncte ( w i )
0 1 2 3 4

Programul 1 20 88 3,5 12
Programul 2 50 60 6,2 10
Programul 3 30 92 5,8 15
Ştiind că cei 100 de studenţi formează un eşantion de 10% din
populaţia generală, se cere:
a) Să se estimeze punctajul mediu al unui student din colectivitatea
generală, cu o probabilitate de 99,73% (z=3), aplicând un sondaj:
a1) simplu;
a2) tipic.
b) Dacă s-ar organiza un nou sondaj tipic, cu o eroare limită mai mică de
1,5 ori, câţi studenţi ar trebui incluşi în eşantion? Repartizaţi-i
proporţional şi optim pe subeşantioane;
c) Să se estimeze ponderea studenţilor din populaţia totală care au obţinut
la test mai mult de 90 de puncte.

202
CAPITOLUL 4

4. 100 de cetăţeni selectaţi aleator sunt rugaţi, în cadrul unui sondaj,


să-şi spună opinia privind un act normativ recent intrat în vigoare.
Rezultatele sistematizate sunt:
Tabelul 4.3’
Sex Opinia
Pro Contra Nu ştiu
Masculin 22 10 3
Feminin 12 45 8
Pentru o probabilitate de 95,45% să se estimeze ponderea cetăţenilor
a căror opinie asupra actului normativ este "Contra" sau "Nu ştiu".

5. Un producător a lansat pe piaţă un nou tip de becuri electrice,


despre care el afirmă că durata lor de funcţionare este mai mare decât a altor
produse similare. Se ştie că durata medie de funcţionare a altor becuri este
de 5000 de ore. Pentru a verifica ipoteza producătorului referitoare la noul
tip de becuri, 100 de astfel de becuri sunt lăsate să funcţioneze până la
ardere şi se constată că durata lor medie de funcţionare este de 5100 de ore.
Pentru un nivel de semnificaţie de α=0,05, există suficiente argumente
pentru a considera că afirmaţia producătorului e adevărată? Se consideră o
abatere standard de σ=500 de ore.

6. În timpul negocierilor patronat-sindicate din industria aeronautică,


preşedintele de sindicat afirmă că muncitorii afiliaţi, al căror salariu mediu
lunar net este de 4 mil. lei, sunt prost plătiţi, deoarece salariul mediu lunar
net al unui muncitor din domeniul respectiv depăşeşte 4 mil. lei. Patronatul
susţine că muncitorii sindicalişti sunt bine plătiţi, întrucât venitul mediu
lunar net al unui muncitor din industria aeronauticii este sub 4 mil. lei.
Pentru rezolvarea acestei dileme, un arbitru realizează un sondaj pe 400 de
muncitori din industria aeronauticii şi determină un venit mediu lunar net de
4050 mii lei. Presupunând că σ=800 mii lei, poate arbitrul afirma, pentru un
nivel de semnificaţie de 5%, că salariul mediu lunar net al unui muncitor din
domeniul amintit este diferit de 4 mil. lei?

7. Aflaţi argumentul funcţiei de probabilitate cu care se garantează


rezultatele ( zα / 2 ) şi nivelul de confidenţă (1-α) · 100 pentru α = 0,25.

203
STATISTICĂ ECONOMICĂ

8. Cu ce probabilitate se garantează rezultatele pentru intervalul de


σ σ
încredere x − 1,645 ⋅ ; x + 1,645 ⋅ , găsit pentru estimarea mediei din
n n
colectivitatea totală?

9. O întreprindere produce piese pentru televizoare. Aici se produc în


medie 100 de bucăţi zilnic. Managerul este de părere că după stabilirea unui
nou regulament de ordine interioară, producţia întreprinderii a scăzut. Pentru
verificarea acestei observaţii, el înregistrează producţiile realizate după
intrarea în vigoare a noului regulament, în 15 zile, alese aleator: 93; 103;
95; 101; 91; 105; 96; 94; 101; 88; 98; 94; 101; 92; 95. Presupunând
că producţia zilnică este normal distribuită, sunt suficiente motive pentru a
considera adevărată presupunerea managerului? (α = 0,05).

10. Pentru a estima salariul mediu al unui salariat din oraşul „A“, un
cercetător a selectat aleator nerepetat 100 din cei 1000 de salariaţi. În urma
cercetării a rezultat că un salariat câştigă în medie 2,5 mil. lei, cu un
coeficient de variaţie de 10%. Dacă dorim să garantăm rezultatele cu o
probabilitate de 95,45%, atunci putem spune că salariul mediul al unui
salariat din întregul oraş se încadrează între:
a) (2405; 2595) mii lei;
b) (2575; 3204) mii lei;
c) (2,575; 3,204) mil. lei;
d( (1,772; 2, 324) mil. lei;
e) nici una dintre variantele de mai sus.

11. În urma unui studiu efectuat pe 500 din cei 2000 de studenţi ai
unei facultăţi din ASE a rezultat că 15% dintre ei provin din licee cu profil
economic. Pentru o probabilitate de 99,73%, se poate afirma că ponderea
studenţilor din întreaga facultate care au absolvit licee economice se si-
tuează în intervalul de încredere:
a) (20%; 25%);
b) (14%; 16%);
c) (0,1%; 2%);
d) (11%; 19%);
e) nici una dintre variantele anterioare.

204
CAPITOLUL 4

12. În urma unei cercetări selective efectuate pe un eşantion ales


dintre salariaţii unei societăţi comerciale a rezultat că vechimea medie în
muncă a unui salariat este de 10,2 ani, cu o dispersie de 0,05 ani.
Pentru a estima vechimea medie a unui salariat pe întreaga societate
comercială, cu o eroare limită de 0,05 ani şi o probabilitate de garantare a
rezultatelor de 95,4%, va trebui să includem în eşantion:
a) 20 de salariaţi;
b) 100 de salariaţi;
c) 80 de salariaţi;
d) 120 de salariaţi;
c) 200 de salariaţi.

13. În urma unui sondaj, aplicat pe un eşantion ales dintre cei 750 de
salariaţi ai unui întreprinderi economice, a rezultat că 20% dintre cei
cercetaţi au efectuat ore suplimentare. Un cercetător doreşte să estimeze cu
o probabilitate de 95,45% şi o eroare medie pătratică de 3% procentul
salariaţilor care au rămas peste program să lucreze. Pentru aceasta, el va
trebui să includă în eşantion:
a) 150 de salariaţi;
b) 200 de salariaţi;
c) 120 de salariaţi;
d) 144 de salariaţi;
e) 500 de salariaţi.

14. Un agent economic cu profil industrial are două secţii de


producţie, în care lucrează 625 de angajaţi. Un cercetător selectează aleator
stratificat nerepetat proporţional 50 de salariaţi din secţia A şi 75 de salariaţi
din secţia B. În urma cercetării rezultă că un muncitor din secţia A lucrează
în medie pe zi 7,2 ore, cu o abatere medie practică de 0,5 ore, în timp ce un
muncitor din secţia B lucrează în medie zilnic 6,8 ore, cu o abatere standard
de 1,2 ore. Timpul medie lucrat zilnic de un angajat, pe total, garantat cu o
probabilitate de 99,73%, va fi:
a) între 5,7 ore şi 7,2 ore;
b) între 6,72 ore şi 7,2 ore;
c) între 8 şi 8,5 ore;
d) între 6,9 şi 8,3 ore;
e) nici una dintre variantele anterioare.

205
STATISTICĂ ECONOMICĂ

Răspunsurile testelor de autoevaluare


1.
¦ xi ni 2892
x= = = 28,92 ≈ 29 ani
¦ ni 100

Tabelul 4.4’
Grupe de cumpărătoare
după vârstă (ani)
ni xi xini xi − x (xi − x)2 ni
0 1 2 3 4 5
sub 20 5 18 90 -11 605
20-24 8 22 176 -7 392
24-28 20 26 520 -3 180
28-32 50 30 1500 +1 50
32-36 10 34 340 +5 250
peste 36 7 38 266 +9 567
Total 100 - 2892 - 2044

s x2 =
( )2
¦ xi − x ni 2044
= = 20,44
¦ ni 100

a1) Sondaj repetat:


s x2
sx = = 0,452 ani
n

∆ x = z ⋅ s x = 1,65 ⋅ 0,452 = 0,75 ani


x − ∆ x ≤ µ0 ≤ x + ∆ x
29 − 0,75 ≤ µ 0 ≤ 29 + 0,75 ani
28,25 ≤ µ 0 ≤ 29,75 ani

a2) Sondaj nerepetat:

s x2 § n·
sx = ¨1 − ¸ = 0,43 ani
n © N¹

206
CAPITOLUL 4

∆ x = z ⋅ s x = 1,65 ⋅ 0,43 = 0,71 ani

x − ∆ x ≤ µ0 ≤ x + ∆ x
29 − 0,71 ≤ µ 0 ≤ 29 + 0,71 ani
28,29 ≤ µ 0 ≤ 29,79 ani

a) z' = 3
∆' x = z'⋅s x = 3 ⋅ 0,43 = 1,29 ani

29 − 1,29 ≤ µ 0 ≤ 29 + 1,29 ani

27,71 ≤ µ 0 ≤ 30,29 ani

85
b) ∆" x = 0,71 ⋅ = 0,6 ani
100

z 2 s x2
n' = = 133,9 ≈ 134 persoane
z 2 s x2
∆"2 +
x N

c) s f2 = f (1 − f ) = 0,17 ⋅ 0,83 = 0,14

f (1 − f ) § n· 0,14
sf = ¨1 − ¸ = ⋅ 0,9 = 0,036 (3,6%)
n © N¹ 100

∆ f = z ⋅ s f = 1,65 ⋅ 0,036 = 0,06 ani (6%)

f − ∆f ≤ p0 ≤ f + ∆f

0,17 − 0,06 ≤ p 0 ≤ 0,17 + 0,06

207
STATISTICĂ ECONOMICĂ

2.
¦ x1i 189
x1 = = = 6,3 rebuturi
n1 30

2
¦ x1i 2 1326
s x21 = − x1 = − 6,3 2 = 4,51
n1 30

¦ x 2i 99
x2 = = = 3,3 rebuturi
n2 30

2
¦ x 2i 2 420
s x22 = − x2 = − 3,3 2 = 3,11
n2 30

¦ x i ni x1 n1 + x 2 n 2 6,3 + 3,3
x= = = = 4,8
¦ ni n1 + n 2 2

2 2
2 ¦ s x1 n1 + s x 2 n 2 4,51 + 3,11
sx = = = 3,81
n 2

2
sx § n·
sx = ¨1 − ¸ = 0,24
n © N¹

∆ x = z ⋅ s x = 2 ⋅ 0,24 = 0,48

x − ∆ x ≤ µ0 ≤ x + ∆ x
4,8 − 0,48 ≤ µ 0 ≤ 4,8 + 0,48
4,32 ≤ µ 0 ≤ 5,28

3.
a1) Sondaj simplu:

208
CAPITOLUL 4

¦ x i ni 88 ⋅ 20 + 60 ⋅ 50 + 92 ⋅ 30
x= = = 75,2 puncte
¦ ni 100

2
s x2 = s x + d x2

2
2 ¦ s xi ni 3,5 2 ⋅ 20 + 6,2 2 ⋅ 50 + 5,8 2 ⋅ 30
sx = = = 31,76
¦ ni 100

dx 2
=
(
¦ xi − x )2 n i =
¦ ni
(88 − 75 , 2 )2 ⋅ 20 + (60 − 75 , 2 )2 ⋅ 50 + (92 − 75 , 2 )2 ⋅ 30
= 232 , 96
100

s x2 = 31,76 + 232,96 = 264,72

s x2 § n·
sx = ¨1 − ¸ = 1,54 puncte
n © N¹

∆ x = z ⋅ s x = 3 ⋅1,54 = 4,63 puncte

x − ∆ x ≤ µ0 ≤ x + ∆ x
75,2 − 4,63 ≤ µ 0 ≤ 75,2 + 4,63 puncte
70,57 ≤ µ 0 ≤ 79,83 puncte
a2) Sondaj stratificat:

2
sx § n·
sx = ¨1 − ¸ = 0,53 puncte
n © N¹

∆ x = z ⋅ s x = 3 ⋅ 0,53 = 1,6 puncte

209
STATISTICĂ ECONOMICĂ

x − ∆ x ≤ µ0 ≤ x + ∆ x
75,2 − 1,6 ≤ µ 0 ≤ 75,2 + 1,6 puncte
73,6 ≤ µ 0 ≤ 76,8 puncte


b) ∆ ' x = x = 1,067 puncte
1,5

2
z2 sx
n' = = 200,7 ≈ 201 studenţi
2
z2 sx
∆'2 +
x N

Repartizarea noului eşantion pe subeşantioane este prezentată în tabelul


4.5’: prin procedeul proporţional (col. 1-3) şi prin procedeul optim (col. 4-
6).
Tabelul 4.5’
Grupe de studenţi Ni Ni N i s xi N i s xi N i s xi N i
după programul n'⋅ n'⋅
tuturial ¦ Ni ¦ Ni ¦ s xi N i ¦ s xi N i
0 1 2 3 4 5 6
Programul 1 200 0,2 40 700 0,13 26
Programul 2 500 0,5 101 3100 0,56 113
Programul 3 300 0,3 60 1740 0,31 62
Total 1000 1,0 201 5540 1,00 201

c)

f=
¦ f i n i = 0,12 ⋅ 20 + 0,1 ⋅ 50 + 0,15 ⋅ 30 = 0,12
¦ ni 100

s f21 = f1 (1 − f1 ) = 0,12 ⋅ 0,88 = 0,1056

s f22 = f 2 (1 − f 2 ) = 0,1 ⋅ 0,9 = 0,09

210
CAPITOLUL 4

s f23 = f 3 (1 − f 3 ) = 0,15 ⋅ 0,85 = 0,1275

2 ¦ s fi2 n i 0,1056 ⋅ 20 + 0,09 ⋅ 50 + 0,1275 ⋅ 30


sf = = = 0,104
¦ ni 100
2
sf § n· 0,104
sf = ¨1 − ¸ = ⋅ 0,9 = 0,03 (3,0%)
n © N¹ 100

∆ f = z ⋅ s f = 3 ⋅ 0,03 = 0,09 (9%)

f − ∆f ≤ p0 ≤ f + ∆f

0,12 − 0,09 ≤ p 0 ≤ 0,12 + 0,09

0,03 ≤ p 0 ≤ 0,21
(3%) (21%)

4.
10 + 3 13
fM = = = 0,37 (37%)
35 35

45 + 8 53
fF = = = 0,82 (82%)
65 65

f=
¦ f i n i = f M n M + f F n F = 0,66
¦ ni nM + nF

2
s fM = f M (1 − f M ) = 0,37 ⋅ 0,63 = 0,23

2
s fF = f F (1 − f F ) = 0,82 ⋅ 0,18 = 0,15

211
STATISTICĂ ECONOMICĂ

2 ¦ s fi2 n i s fM
2 2
n M + s fF nF
sf = = = 0,178
¦ ni nM + nF

2
sf 0,178
sf = = = 0,04 (4%)
n 100

∆ f = z ⋅ s f = 2 ⋅ 0,04 = 0,08 (8%)

f − ∆f ≤ p0 ≤ f + ∆f

0,58 ≤ p 0 ≤ 0,74

5.
H0: µ = 5000 ore
Ha: µ > 5000 ore
Se aplică testul z unilateral dreapta.

x−µ 5100 − 5000


z= = =2
σ/ n 500 / 10

Pragul de semnificaţie: α = 0,05, zα = z 0,05 = 1,645


Regiunea de respingere este:

z calc > z1−α

Cum această relaţie este adevărată, înseamnă că ne aflăm în regiunea


critică, deci respingem H0, acceptăm Ha, aşadar există suficiente motive
pentru care putem considera că durata medie de funcţionare a noului tip de
becuri este superioară altor produse similare.

6.
H0: µ = 4000 mii lei

212
CAPITOLUL 4

Ha: µ ≠ 4000 mii lei ( µ < 4000 sau µ > 4000 )

x−µ 4050 − 4000


z calc = = = 1,25
σ/ n 800 / 20

Regiunea de respingere este:

z calc < − zα / 2 sau z calc > zα / 2


. Nu există suficiente motive să respingem H0.

7.
α/2 = 0,25 / 2 = 0,125

zα / 2 = z0,125 = 1,15

8.
zα / 2 =1,645 deci 0,5 - α/2 = 0,45, deci α/2 =0,05

1 - α = 0,45 · 2 = 0,90

Probabilitatea cu care se garantează rezultatele este (1-α) · 100 = 90%

9.
Se aplică testul t unilateral stânga, deoarece eşantionul este de volum redus,
şi nu se cunoaşte dispersia în colectivitatea generală.

H0: µ = 100
Ha: µ < 100
s = 4,85 buc.

Test statistic este:

x−µ 96,47 − 100


t= = = −2,82
s/ n 4,85 / 15

213
STATISTICĂ ECONOMICĂ

tα ,n −1 = t 0,05;14 = 1,761

Regiunea de respingere este dată de:

t calc < −tα ,n −1

Există motive să concluzionăm că producţia medie zilnică a scăzut după


introducerea noului regulament de ordine interioară.

10.
s2 § x· 0,047 § 100 ·
∆x = z ⋅ ¨1 − ¸ = 2 ⋅ ⋅ ¨1 − ¸ = 0,047 mil. lei .
n © N¹ 100 © 1000 ¹
x − ∆x = 2,5 − 0,047 = 2,453 mil. lei ;
x + ∆x = 2,5 − 0,047 = 2,547 mil. lei .

11.
s f2 § n· 0,1275 § 500 ·
∆f = z ⋅ sf = z ¨1 − ¸ = 3 ⋅ ⋅ ¨1 − ¸ = 0,0415 ≈ 0,04 .
n © N¹ 500 © 2000 ¹

Intervalul de încercare pentru media colectivităţii generale va avea limi-


tele:
f − ∆f = 0,15 − 0,04 = 0,11 (11%) ;
f + ∆f = 0,15 + 0,04 = 0,19 (19%) .

12. Varianta c).

13. Varianta d).

14. Varianta b).

Teste propuse spre rezolvare

1. Repartiţia a 80 de restaurante din cele 800 ale unei zone A, după


numărul clienţilor dintr-o săptămână, este:

214
CAPITOLUL 4

Tabelul 4.6’
Intervale de variaţie a numărului de clienţi Număr de restaurante
(persoane)
0 1

1000-1500 5
1500-2000 15
2000-2500 40
2500-3000 10
3000-3500 7
3500-4000 3
Total 80
a) Pentru o probabilitate de 95,45% (z=2), să se estimeze numărul mediu al
clienţilor dintr-o săptămână, pentru un restaurant din zona A, precum şi
numărul total al clienţilor dintr-o săptămână;
b) Dacă s-ar organiza un nou sondaj, cu o eroare limită mai mică cu 8%,
câte restaurante ar trebui incluse în eşantion?
c) Care este ponderea estimată a restaurantelor care au peste 3000 de
clienţi săptămânal, din zona A?
d) Într-o altă zonă, B, cu 700 de restaurante, se organizează un sondaj pe 70
de restaurante. Rezultatele sondajului sunt: numărul mediu săptămânal
al clienţilor este de 2500 de persoane, cu o abatere standard de 300 de
persoane. Să se estimeze numărul mediu săptămânal al clienţilor dintr-
un restaurant, pe ansamblulu celor două zone.

2. Pentru 200 de magazine de prezentare ale unei fabrici de mobilă, situate


în trei regiuni diferite, se cunosc datele:
Tabelul 4.7’
Zona geografică Încasări zilnice (mld. lei) Total
500-1000 1000-1500 1500-2000 2000-2500
0 1 2 3 4 5
A 35 25 10 - 70
B 5 15 25 5 50
C - 10 20 50 80
Total 40 50 55 55 200

a) Presupunând că datele provin dintr-un eşantion de 10%, să se estimeze


încasarea medie zilnică a unui magazin, dacă rezultatele se garantează
cu o probabilitate de 95,45% (z=2), aplicând un sondaj:
a1) simplu (repetat şi nerepetat);
a2) tipic (repetat şi nerepetat);

215
STATISTICĂ ECONOMICĂ

Comparaţi rezultatele obţinute.


b) Dacă se organizează un nou sondaj, cu o eroare limită mai mică cu 5%,
care ar fi volumul noului eşantion? Repartizaţi-l proporţional şi optim pe
subeşantioane;
c) Estimaţi ponderea magazinelor care au încasări zilnice de peste 1500
mld. lei.

3. Un eşantion aleator de 400 de unităţi are media 550 şi abaterea medie


pătratică de 140. Intervalul de încredere pentru media , garantat cu o pro-
babilitate de 95%, este:
a) (538,52; 561,48);
b) (536,28; 563,72);
c) (-234,1134);
d) (410,690);
e) (234,1334).

4. Presupunem că sunteţi interesaţi în efectuarea testului statistic:


H 0 : m = 200,
H a : m > 200,
şi utilizaţi regula de decizie: „Se respinge H0 dacă media eşantionului de
100 de unităţi este mai mare de 212“. Deviaţia standard în populaţie este de
80. Probabilitatea comiterii unei erori de genul întâi este:
a) 13,36%;
b) 6,68%;
c) 43,32%;
d) 0,4332;
e) 3,34%.

5. O distribuţie de eşantioane este o:


a) distribuţie de frecvenţe a unui parametru;
b) distribuţie de frecvenţe a valorilor aşteptate;
c) distribuţie de probabilitate a unui indicator (ex. x );
d) distribuţie normală a mediilor de selecţie;
e) distribuţie normală a abaterilor medii pătratice.

6. Care dintre următoarele modificări nu determină, uzual, schimbări şi


distribuţia de eşantioane?
a) Modificări în volumul populaţiei;
b) Înlocuirea indicatorului x cu Me;
c) Modificări în distribuţia populaţiei studiate;

216
CAPITOLUL 4

d) Modificări în volumul eşantionului;


e) Oricare dintre modificările anterioare cauzează, uzual, modificări în
distribuţia de eşantionare.

7. Un eşantion aleator:
a) Are o distribuţie similară cu cea din colectivitatea generală;
b) Este eşantionul cel mai simplu de selectat;
c) Se realizează printr-o eşantionare multifazică;
d) Oferă fiecărui element din colectivitatea generală o şansă egală de a
fi inclus;
e) Necesită ca fiecare element din colectivitatea generală să fie re-
prezentat când procesul selecţiei este terminat.

8. Dacă din colectivitatea generală formată din elementele: 1, 2, 4, 5 se


selectează aleator repetat eşantioane de 2 unităţi, valorile posibile ale lui x
sunt:
a) 1; 2; 4; 5;
b) 1; 2; 3; 4; 5;
c) 1; 1,5; 2; 2,5; 3; 3,5; 4; 4,5; 5;
d) 1,5; 2,5; 3,5; 4,5;
e) 2; 3; 4.

9. Dacă notăm xmax valoarea maximă dintr-un eşantion, care dintre urmă-
torii termeni este corect pentru a descrie xmax?
a) valoare aşteptată;
b) mediană;
c) estimator;
d) parametru;
e) abatere medie pătratică.

10. Dacă două sondaje electorale sunt realizate obiectiv, utilizând eşan-
tionarea aleatoare, sunt posibile rezultate diferite, deoarece:
a) sondajele pot fi efectuate în zile diferite;
b) întrebările pot fi formulate diferit şi pot induce răspunsuri diferite
de la aceeaşi persoană;
c) pot fi utilizate mărimi diferite ale eşantioanelor;
d) pot rezulta eşantioane diferite din aceeaşi populaţie;
e) toate de mai sus.

11. Distribuţia de eşantioane a lui x :


a) este un eşantion aleator din toate valorile lui x ;
b) este o distribuţie de probabilitate a lui x ;

217
STATISTICĂ ECONOMICĂ

c) arată relaţia dintre x şi σ ;


d) arată cum se modifică x când se modifică n;
e) este o distribuţie de frecvenţe a lui µ .

12. Care dintre următoarele afirmaţii nu este adevărată despre un interval


de încredere pentru µ :
a) este o cale de a face o interferenţă statistică care evită ca cineva să
creadă că o valoare estimată este valoarea reală;
b) îşi schimbă mărimea după cum componentele σ sau s, φ z şi n îşi
schimbă valorile;
c) se calculează pe baza lui x , dar este aşteptat să includă µ ;
d) îşi schimbă mărimea după cum x se schimbă;
e) toate de mai sus.

218
CAPITOLUL 5

CAPITOLUL 5

ANALIZA LEGĂTURILOR DINTRE


VARIABILELE STATISTICE

Consideraţii preliminare

Prezentul capitol urmăreşte să prezinte metode şi tehnici statistice


folosite în analiza legăturilor, dependenţelor care se manifestă între cele mai
multe fenomene de masă din viaţa reală. Indicatorii statistici pot, astfel, să
rezume şi să prezinte sintetic legăturile dintre două caracteristici statistice
(în cazul datelor bivariate) sau dintre mai multe caracteristici (în cazul
datelor multivariate). Corelaţia va arăta cât de puternică este legătura,
dependenţa dintre variabile, în timp ce regresia va ajuta în explicarea şi
previzionarea unui factor pe baza valorii altuia (altora), ceea ce, evident, va
reduce incertitudinea privitoare la fenomene importante, dar aleatoare.

Termeni cheie

analiză dispresională diagramă de împrăştiere


asociere legătură statistică
coeficient de contingenţă plan de regresie
coeficient de corelaţie raport de corelaţie
coeficient de corelaţie a rangurilor raport de corelaţie multiplă
coeficient de corelaţie parţială regresie
coeficient de determinaţie regresie liniară simplă
coeficient de determinaţie multiplă regresie multiplă
coeficient de regresie regresie neliniară
coeficient de regresie parţială tabel de asociere
corelaţie tabel de corelaţie
corelaţie neparametrică test de independenţă

219
STATISTICĂ ECONOMICĂ

Noţiuni teoretice

5.1. INTRODUCERE

Fenomenele şi procesele social-economice nu sunt în general, fenomene


independente, ci ele se manifestă ca rezultat al acţiunii unor factori de influ-
enţă şi condiţionează, la rândul lor, manifestarea altora. Spunem, aşadar, că
între fenomenele de masă, colective se manifestă legături, dependenţe.
Legăturile statistice sunt specifice fenomenelor de tip colectiv, sistemelor
deschise, complexe, caracterizate de relaţii suple, neunivoce, în care cauzele
interacţionează cu factorii aleatori. Aşadar, unei valori a factorului cauzal îi
corespunde o distribuţie de valori ale factorului dependent, cea ce ne în-
dreptăţeşte să le tratăm ca variabile aleatoare şi să le analizăm utilizând
metode statistice. Legea statistică nu poate fi pusă în evidenţă la nivelul fie-
cărui caz particular, fiecărui element în parte, ci numai la nivelul unei mase
de evenimente cu structură completă.

DEFINIŢIE: Legăturile statistice (stohastice) sunt relaţii prin care se reali-


zează procesul de determinare, apariţie şi dezvoltare a fenomenelor de masă.

Trebuie subliniat că metodele şi tehnicile statistice utilizate în studiul


legăturilor dintre fenomenele de masă sunt cuprinse într-o categorie numită
„analiza corelaţiei“. Trebuie să facem, însă, distincţia dintre un model de
corelaţie — care ne arată cât de puternic sunt legate cele două variabile, cât
de mult tind să se modifice împreună — şi un model de regresie — care
examinează schimbările unei variabile ca o funcţie de schimbările sau
nivelurile altei (altor) variabile.
Modelul de regresie permite previzionarea uneia dintre variabile pe baza
informaţiilor despre alte variabile.
Totodată, analiza corelaţiei (în sens larg) este specifică variabilelor can-
titative, numerice, măsurate pe scale de intervale şi de rapoarte. Printr-o
extensie a semnificaţiei, putem efectua analiza bivariată şi multivariată a
caracteristicilor calitative (nominale şi ordinale) prin studiul asocierii (sau
contingenţei) luând în considerare distribuţia simultană a unităţilor statistice
după două sau mai multe variabile calitative.

220
CAPITOLUL 5

5.2. CLASIFICAREA LEGĂTURILOR STATISTICE

1. după tipul variabilelor luate în consideraţie şi scala pe care sunt


măsurate datele bi(multi)variate, legăturile pot fi clasificate — aşa cum am
văzut în paragraful precedent — în asocieri şi corelaţii statistice.

2. după numărul variabilelor statistice luate în consideraţie, putem avea


legături simple şi legături multiple.

3. după sensul legăturilor dintre variabile, putem avea legături directe


şi legături inverse.

4. după forma ecuaţiei menită să descrie relaţia dintre variabile (adică


modelul matematic propriu dependenţei studiate) putem avea legături lini-
are şi legături neliniare.

5. după modul de manifestare în timp a legăturii dintre variabile, avem


legături sincrone şi legături asincrone.

În cele ce urmează, în analiza statistică a legăturilor dintre variabilele


social-economice cu ajutorul metodelor regresiei şi corelaţiei, vom nota cu:
X — variabila cauzală, numită şi independentă sau exogenă, explicativă;
Y — variabila efect, numită şi dependentă sau endogenă, explicată, care
poate fi, aşadar, cunoscută când se cunoaşte variabila explicativă (sau când
se cunosc variabilele explicative).

5.3. DIAGRAMA DE ÎMPRĂŞTIERE ŞI TABELUL BIDIMENSIONAL

a) Diagrama de împrăştiere indică, în sistemul de coordonate


rectangulare, fiecare unitate statistică (fiecare caz individual) printr-un
punct. Variabila studiată drept factor cauzal, de influenţă (X) este
reprezentată pe axa orizontală (a absciselor). Variabila de răspuns, care
poate fi influenţată (Y) defineşte axa verticală (a ordonatelor). Forma de
distribuire a punctelor pe grafic (adică norul de puncte) ne dă informaţii
privind:
1. existenţa legăturii dintre variabile

221
STATISTICĂ ECONOMICĂ

2. sensul legăturii dintre variabile

a) b)

Figura nr. 5.2


a) legătură directă şi b) legătură inversă

3. forma legăturii dintre variabile.

b) Metoda tabelului de corelaţie se utilizează în cazul grupării combi-


nate după două variabile numerice. Frecvenţele din interiorul tabelului
permit, la fel ca şi în cazul diagramei de împrăştiere, identificarea existenţei,
sensului şi chiar a formei dependenţei statistice.

5.4. ELEMENTE DE ANALIZĂ DISPERSIONALĂ (ANOVA)

Pentru a înţelege conţinutul şi modul de utilizare a analizei dispersionale


sunt necesare trei observaţii preliminare:
1. Este firesc , după aplicarea metodelor elementare prin care am
constatat logic ce se pot stabili relaţii de dependenţă între variabile, să
testăm ipoteza statistică privitoare la semnificaţia acestei dependenţe;
2. pentru fiecare nivel/variantă/interval de variaţie al factorului cauzal, se
înregistrează o distribuţie de valori ale factorului efect, distribuţie pe care o
putem caracteriza prin nivelul mediu.

222
CAPITOLUL 5

y
y
yr
y2
y1=y2= =yr
y1

o x1 x2 ...... xr x o x1 x2 ..... xr x
a) b)

Fig. 5.3 - a) medii de grupă egale; b) mediile de grupă inegale


Analiza dispersională va urmări, deci, să testeze semnificaţia diferenţei
dintre mediile de grupă în populaţia generală (estimate prin mediile de grupă
din eşantion).

3. să mai notăm că, în general, în analiza dispersională, nivelurile


x1, x2, ..., xr sunt niveluri ale unei variabile categoriale (numite şi trata-
mente), dar, cum ceea ce este valabil pentru o scală inferioară (nominală)
este valabil şi pentru orice altă scală superioară (ordinală, de intervale, de ra-
poarte), analiza se poate extinde.

În modelul de analiză dispersională unifactorială se testează ipoteza


nulă:

H0: µy1 = µy2 = ... = µyr

cu ipoteza alternativă cel puţin două medii din populaţie nu sunt egale:

H1 : µyi ≠ µyi (i ≠ j)

Setul de date pentru analiza dispersională unifactorială constă în valorile


variabilei Y pentru cele r grupe independente. Volumele grupelor pot fi
diferite n1 ≠ n2 ≠ ... ≠ nr (Tabelul 5.1):

223
STATISTICĂ ECONOMICĂ

Tabelul 5.1
Sistematizarea datelor pentru ANOVA
Grupe după factorul cauză
Gr. 1 Gr. 2 ... . Gr.r
y11 y21 ..... yr1
y12 y22 ..... yr2
. .
. .
y1n1 y 2n 2 ..... y rn r

Media y1 y2 ..... yr
Vol. grupă
n1 n2 ..... nr

Testul statistic F pentru analiza dispersională unifactorială este raportul


indicatorilor de variabilitate pentru cele două surse de variaţie: variabilitatea
dintre grupe împărţită la variabilitatea din interiorul grupelor Pentru testarea
ipotezei nule, vom estima mediile de grupă şi media totală din colectivitatea
generală pe baza datelor din eşantion.
ni
¦ y ij
j=1
yi = , i = 1, r (5.1)
ni
r ni r
¦ ¦ y ij ¦ yi n i
i =1 j=1 i =1
y= = (5.2)
n n
r
n = ¦ ni (5.3)
i =1

Varianţa dintre grupe, dată de influenţa factorului cauzal, numită şi vari-


anţa factorială este:
r
(
S1 = ¦ y i − y n i
i =1
) 2
(5.4)
iar varianţa din interiorul grupelor, numită şi varianţa reziduală, este:
r ni
S 2 = ¦ ¦ y ij − y i
i =1 j=1
( ) 2
(5.5)

Împrăştierea totală a valorilor individuale faţă de media generală y este


dată de varianţa totală:

224
CAPITOLUL 5

r ni
S = ¦ ¦ y ij − y
i =1 j=1
( )
2
(5.6)

Pentru a face comparabile aceste măsuri ale variabilităţii, le vom raporta


pe fiecare la gradele de libertate, transformând astfel suma de pătrate în me-
dia pătratele abaterilor.
Obţinem astfel:

S1
r
(
¦ yi − y n i
i =1
)
2

s12 = = (5.7)
r −1 r −1

S2
r ni
¦ ¦ y ij − y i
i =1 j=1
( )
2

s 22 = = (5.8)
n−r n−r

Statistica F pentru analiza dispersională unifactorială are forma:


s12 var iabilitatea dintre grupe
F= = (5.9)
s 22 variabilitatea din interiorul grupelor
Tabelul 5.2
Calculul statisticii F pentru analiza dispersională unifactorială
Sursa Gradele Varianţa Dispersia Statistica F
variaţiei de (suma corectată (media
libertate pătratelor) pătratelor)
Factorul X r–1 S1 s12 s12
Reziduală n–r S2 F=
s22 s 22
Totală r–1 S = S1 + S2 s2 ≠ s12 + s22 –

Rezultatul este semnificativ dacă:


Fcalc(r-1) > Ftab(r- 1),(n- r),α
deoarece acest lucru indică diferenţe mai mari între mediile grupelor
decât cele datorate întâmplării..

5.5. REGRESIA ŞI CORELAŢIA SIMPLĂ LINIARĂ

Deşi diagrama de împrăştiere poate fi extrem de utilă în determinarea


formei legăturii dintre variabilele statistice, sunt disponibile şi metode mai
exacte pentru a stabili modelul de legătură.

225
STATISTICĂ ECONOMICĂ

5.5.1. Regresia simplă liniară

Relaţia dintre variabila efect (Y) şi variabila cauză (X) studiată de re-
gresia simplă liniară într-o populaţie statistică poate fi descrisă prin modelul
liniar matematic general:
Yi = α + βXi + εi (5.10)
Valoarea parametrului α arată punctul în care linia interceptează (taie)
axa OY (fig. 5.4), iar εi reprezintă componenta reziduală (eroarea aleatoare)
pentru fiecare unitate, adică partea din valoarea variabilei Y care nu poate fi
măsurată prin relaţia sistematică existentă cu variabila X.

y
3 0,5 { {
{
2 1

o
{
1 2 3 4 x
Fig. 5.4 - Modelul liniar unifactorial

Dacă datele disponibile provin dintr-un eşantion, modelul de regresie


liniară în eşantion este
yi = a + bxi + ei (5.11)
cu componenta predictibilă:
ŷ i = a + bx i (5.12)
ei = yi – (a + bxi) (5.13)
Un criteriu pentru determinarea valorilor a şi b este metoda minimizării
sumei pătratelor deviaţiilor (abaterilor sau reziduurilor) ei. Metoda,
cunoscută ca metoda celor mai mici pătrate, înseamnă minimizarea
relaţiei:

n n n
¦ e i2 = ¦ (y i − ŷ i ) = ¦ (y i − a − bx i )
2 2
(5.14)
i =1 i =1 i =1

226
CAPITOLUL 5

Se obţine astfel:

n n
na + b ¦ x i = ¦ y i (5.15a)
i =1 i =1
n n n
a ¦ x i + b ¦ x i2 = ¦ x i y i (5.15b)
i =1 i =1 i =1

Estimatorii a (intercepţia) şi b (panta) ai parametrilor α şi β sunt daţi,


atunci de:

n n
2 § n ·§ n ·
¦ y i ¦ x i − ¨ ¦ x i ¸¨ ¦ x i y i ¸
a=
i =1 i =1 © i=1 ¹© i =1 ¹ (5.16)
2
n §n ·
n ¦ x i2 − ¨ ¦ x i ¸
i =1 © i =1 ¹

n ¦ x i y i − §¨ ¦ x i ·¸§¨ ¦ y i ·¸ ¦ x i y i − n x ⋅ y
n n n n

=
b= i 1 © i=1 ¹© i =1 ¹ = i =1 (5.17)
2 n
n
2 §n · ¦ x i2 − n x 2
n¦ xi − ¨ ¦ xi ¸
=
i =1 © i =1 ¹ i 1

Se observă, totodată, că:

n
(
¦ x i − x yi − y
i =1
)( )
n s xy
b= = (5.18)

i =1
n
(
¦ xi − x )
2 s 2x

Estimatorul a (intercepţia) poate lua valori negative sau pozitive, în


funcţie de semnul numărătorului din relaţia (5.16). Estimatorul b (panta
liniei drepte) numit şi coeficient de regresie are întotdeauna semnul indica-
torului sxy, numit şi covarianţa între x şi y (asupra căruia vom reveni în
paragrafele următoare).

227
STATISTICĂ ECONOMICĂ

y y y

ÿ=a+bx
ÿ=a+bx
ÿ=a+bx b<0
b>0 b=0

o x o x o x
a) b) c)

Fig. 5.5 - Linii de regresie cu: a) pantă pozitivă b) pantă negativă c) pantă egală
cu zero

Vom obţine astfel:


n n
¦ y i = ¦ ŷ i (5.19)
i =1 i =1
în condiţiile respectării ipotezelor modelului de regresie liniară.
Dacă datele au fost sistematizate utilizând metoda grupării, iar valorile xi
şi yi se întâlnesc cu frecvenţele ni, atunci:

r r r
a ¦ n i + b ¦ x i n i = ¦ yi n i (5.20a)
i =1 i =1 i =1

r r r
a ¦ x i n i + b ¦ x i2 n i = ¦ x i y i n i (5.20b)
i =1 i =1 i =1
r r
¦ y i n i = ¦ ŷ i n i (5.21)
i =1 i =1

În cazul în care datele au fost sistematizate într-un tabel cu dublă intrare,


iar valorile xi şi yj se întâlnesc cu frecvenţele nij:
r m r m
a ¦ ¦ n ij + b ¦ x i n i. = ¦ y j n. j (5.22a)
i =1 j=1 i =1 j=1
r r r m
a ¦ x i n i. + b ¦ x i2 n i. = ¦ ¦ x i y j n ij (5.22b)
i =1 i =1 i =1 j=1

m m
¦ y j n. j = ¦ ŷ j n. j (5.23)
j=1 j=1

228
CAPITOLUL 5

EXEMPLUL 5.1. Numărul de copii înscrişi şi numărul de cadre didactice


din 10 unităţi preşcolare este (Tabelul 5.3):
Tabelul 5.3
Nr. crt. al unităţii Nr. copii înscrişi Nr cadre didactice
preşcolare (xi) (persoane) (yi) (persoane)
1 20 2
2 323 21
3 156 18
4 180 14
5 98 11
6 73 6
7 334 21
8 20 1
9 52 2
10 203 17
Total 1459 113

­na + b ¦ x i = ¦ y i
® 2
¯a ¦ x i + b ¦ x i = ¦ x i y i
2
¦ y i ⋅ ¦ x i − ¦ x i ¦ x i y i 113 ⋅ 332.267 − 1459 ⋅ 24.256 2.156.667
a= = = =
n ¦ x i2 − (¦ x i )2 10 ⋅ 332.267 − 1459 2 1.193.989
= 1,80627
n ¦ x i y i − ¦ x i ¦ y i 10 ⋅ 24.256 − 1459 ⋅ 113 77693
b= = = = 0,06507
n ¦ x i2 − (¦ x i )2 10 ⋅ 332.267 − (1459)2 1193989

Modelul de regresie va fi:


ŷ i = 1,80627 + 0,06507 ⋅ x i
Calculele intermediare necesare sunt prezentate în tabelul 5.4 col. 3,4,5.

Tabelul 5.4
Nr.
crt.
xi yi x i2 y i2 xiyi ŷ i (y i − ŷ i )
2
(y i −y )
2

0 1 2 3 4 5 6 7 8
1 20 2 400 4 40 3 1 86,43
2 323 21 104.329 441 6.783 23 4 94,09
3 156 18 24.336 324 2.808 12 36 44,89
4 180 14 32.400 196 2.520 14 0 7,29

229
STATISTICĂ ECONOMICĂ

5 98 11 9.604 121 1.078 8 9 0,09


6 73 6 5.329 36 438 7 1 28,09
7 334 21 111.556 441 7.014 24 9 94,09
8 20 1 400 1 20 3 4 106,09
9 52 2 2.704 4 104 5 9 86,43
10 203 17 41.209 289 3.451 15 4 32,49
Total 1459 113 332.267 1857 24256 113 77 579,98

Valorile ajustate ale numărului de cadre didactice în funcţie de


numărul de copii înscrişi sunt calculate în coloana 6 a tabelului 5.4.

5.5.2. Indicatori ai calităţii ajustării

Abaterea medie pătratică (eroarea standard) a reziduurilor este o


măsură absolută a calităţii ajustării pe baza regresiei în eşantion, iar
coeficientul de determinaţie este un indicator relativ. Se observă
că(fig.5.6):
y i − y = ( y i − ŷ i ) + ( ŷ i − y) (5.24)

y
ÿ=a+bx
yi–ÿi
y
yi–y { ÿ –y
{ i {

o x
Fig. 5.6 - Abaterea valorilor individuale yi de la medie

n n n
2 2 2
¦ ( y i − y) = ¦ ( y i − ŷ i ) + ¦ ( ŷ i − y) (5.25)
i =1 i =1 i =1

230
CAPITOLUL 5

Putem nota:
n
2 2
¦ ( y i − y) = ∆ y = varianţa totală, suma pătratelor abaterilor totale.
i =1
n
2 2
¦ ( y i − ŷ i ) = ∆ e = varianţa neexplicată, suma pătratelor erorilor.
i =1
n
2 2
¦ ( ŷ i − y) = ∆ y / x = varianţa explicată, suma pătratelor abaterilor dato-
i =1
rate regresiei.

∆2y = ∆2y / x + ∆2e (5.26)

Tabelul ANOVA este (Tabelul 5.5)


Tabelul 5.5
Tabelul ANOVA pentru testarea calităţii ajustării
Sursa variaţiei Suma pătratelor Grade de Media pătratelor
libertate (dispersia corectată)
Datorată
regresiei
n
∆2y / x = ¦ ŷ i − y
2

i =1
( k
) 2
sy/x =
∆2y / x
k
Reziduală n n–k–1 ∆2e
∆2e = ¦ (y i − ŷ i )
2
s e2 =
i =1 n − k −1
Totală n
∆2y = ¦ y i − y( )2 n–1
s2y =
∆2y
i =1 n −1

În tabelul ANOVA, k reprezintă numărul variabilelor independente


luate în consideraţie. În analiza regresiei liniare simple, k = 1.
Pentru analiza calităţii ajustării în regresia simplă liniară, abaterea
medie pătratică a erorilor în eşantion este:
n
¦ (y i − ŷ i )
2
∆2e i =1
se = = (5.27)
n−2 n−2
Alternativ, putem calcula:
∆2y ∆2y / x ∆2e
= 1,00 = 2 + 2 (5.28)
∆2y ∆y ∆y

231
STATISTICĂ ECONOMICĂ

Coeficientul de determinaţie este:

∆2y / x ∆2e
n
(
¦ ŷ i − y
i =1
)
2

R2 = = 1− = (5.29)
∆2y ∆2y ¦ (y − y)
n 2
i
i =1

Raportul ∆2y / x / ∆2y reprezintă proporţia variaţiei totală care este explicată
de linia de regresie. Cu cât raportul R2 are o valoare mai apropiată de 1 (sau
de 100% într-o exprimare procentuală), cu atât putem aprecia că variabila
independentă X explică mai bine variaţia variabilei efect Y.

Dacă β = 0, înseamnă că linia de regresie este orizontală, adică Ŷ = Y ,


atunci valoarea lui X nu este de nici un ajutor în previzionarea variabilei Y:
nu contează cât de mult se modifică X, deoarece nu implică nici o
modificare în Y (în medie).
Vom testa, prin urmare dacă panta (β) este diferită de zero. Ipoteza nulă
(H0) va fi atunci aceea că panta (β) este egală cu zero, cu ipoteza alternativă
(H1) că panta (β) este diferită de zero (pozitivă sau negativă, test bilateral):
H0 : β = 0 (µb = β = 0)
H1 : β ≠ 0
Dacă volumul eşantionului este mare, vom utiliza testul Z:
b − µb b − 0
Z= =
sb sb
unde sb reprezintă abaterea medie pătratică obţinută din distribuţia de
eşantionare a coeficientului b:
s b = s 2b (5.30)
1
s 2b = s e2 (5.31)
n
2
¦ (x i − x )
i =1
Pentru un prag de semnificaţie α, vom respinge ipoteza nulă (H0), când
Z > Zα/2 sau Z < – Zα/2 şi vom concluziona că este foarte improbabil ca
estimatorul b să provină dintr-o populaţie cu β = 0.
Dacă volumul eşantionului este mic, vom utiliza testul t:
b − µb b − 0
t n −2 = =
sb sb

232
CAPITOLUL 5

statistică ce urmează o distribuţie t cu (n – 2) grade de libertate.


Intervalul de încredere pentru coeficientul de regresie b este dat de:

b – t(α/2, n -2) ⋅ sb ≤ β ≤ b + t(α/2, n-2) ⋅ sb (5.32)

5.5.3. Corelaţia simplă liniară

. Plecând de la reprezentarea grafică prin intermediul diagramei de


împrăştiere, putem calcula un indicator care să măsoare legătura dintre cele
două variabile.

5.5.3.1. Covarianţa

Astfel, vom începe cu împărţirea planului diagramei în patru cadrane, în


raport cu nivelurile medii din eşantion, x şi y (fig. 5.7):

y
cadranul II cadranul I

y cadranul III cadranul IV

o x x

Fig. 5.7 - Diagrama de împrăştiere cu cadranele separate de medii

Pentru punctele de pe grafic, produselor lor de la medii pot fi pozitive sau


negative, astfel (Tabelul 5.6):

Tabelul 5.6
Semnele produselor devierilor (abaterilor)
Cadranul xi – x yi – y (xi – x )(yi – y )
I + + +
II – + –
III – – +
IV + – –

233
STATISTICĂ ECONOMICĂ

Este firesc atunci să calculăm media acestor produse ale abaterilor, medie
care ne va oferi un indicator absolut al legăturii dintre variabile. Acest
indicator, numit covarianţa între X şi Y, ne arată cât de mult se modifică
împreună cele două variabile:
n n n n
¦ (xi - x )(yi - y ) n ¦ x i yi − ¦ x i ¦ yi
i =1 i =1 i =1 i =1
cov(x , y) = s xy = = xy − x ⋅ y = 2
(5.33)
n n

Covarianţa are valoare pozitivă dacă legătura dintre variabile este directă
şi negativă, dacă legătura dintre variabile este inversă. Dacă valoarea covari-
anţei este egală cu zero, acest lucru implică lipsa legăturii între variabile,
sau, cel puţin, lipsa legăturii liniare.

5.5.3.2. Coeficientul de corelaţie liniară

Coeficientul de corelaţie standardizează media produselor abaterilor:


semnul coeficientului indică direcţia legăturii, iar valoarea lui indică intensi-
tatea legăturii.
n
s xy ¦ ( x i − x )( y i − y)
cov(x, y) i =1
rxy = = = (5.34)
sxs y sx ⋅ sy ª ( x − x ) 2 º ª n ( y − y) 2 º
n
«¬i¦
=1
i »¼ «¬i¦
=1
i »¼
sau, prin transformări elementare:
n n n
n ¦ x i yi − ¦ xi ¦ yi
i =1 i =1 i =1
rxy = (5.35)
2 ºª
ª n 2 §n · §ny · º
n 2
2
n x − x n
« ¦ i ¨ ¦ i ¸ »« ¦ i ¨ ¦ i ¸ » y −
«¬ i =1 © i =1 ¹ »¼ «¬ i =1 © i =1 ¹ »¼

Dacă perechile de valori (xi, yi) apar cu frecvenţa ni; §¨ ¦ n i = n ·¸ , formula


r

© i =1 ¹
devine:
r r r r
¦ n i ¦ x i yin i − ¦ x in i ¦ yin i
i =1 i =1 i =1 i =1
rxy = (5.36)
ªr 2 ºª r 2º
r
2 § r
· r
2 § r ·
«¦ n i ¦ x i n i − ¨ ¦ x i n i ¸ »«¦ n i ¦ yi n i − ¨ ¦ yi n i ¸ »
¬«i =1 i =1 © i =1 ¹ »¼ «¬i =1 i =1 © i =1 ¹ ¼»

234
CAPITOLUL 5

iar dacă datele au fost sistematizate într-un tabel cu dublă intrare, în care
§ r m ·
perechile (xi, yi) apar cu frecvenţele nij ¨¨ ¦ ¦ n ij = n ¸¸ , atunci:
© i =1 j=1 ¹
r m r m r m
¦ ¦ n ij ¦ ¦ x i y i n ij − ¦ x i n i ¦ y j n j
i =1 j=1 i =1 j=1 i =1 j=1
rxy = (5.37)
ªr m r § ·
2
º ª r m m §m ·

« ¦ ¦ n ij ¦ x i2 n i − ¨¨ ¦ x i n i ¸¸ » « ¦ ¦ n ij ¦ y 2j n j − ¨¨ ¦ y j n j ¸¸ »
«¬i =1 j=1 i =1 © ¹ »¼ «¬i =1 j=1 j=1 © j=1 ¹ »¼
Valoarea coeficientului de corelaţie (rxy sau simplu, r) este situată între
–1 şi 1. O valoare 1 indică o corelaţie liniară directă şi perfectă (funcţio-
nală), iar o valoare –1 indică o corelaţie liniară inversă perfectă. Interpreta-
rea uzuală a lui r este aceea că semnul indică direcţia legăturii, iar valoarea
indică intensitatea ei. O valoarea O arată (de obicei) lipsa legăturii între
variabile.
Aşadar, coeficientul de corelaţie, r, este un indicator ce caracterizează
direcţia şi intensitatea legăturii liniare. Se observă că:
s
r=b x (5.38)
sy
EXEMPLUL 5.2. Considerăm datele din Exemplul 5.1. Pe baza lor se
determină coeficientul corelaţiei rxy, folosindu-se datele intermediare din
Tabelul 5.4.:

n¦ x i yi − ¦ x i ¦ yi 77693
rxy = = =
[n ¦ x i2 − (¦ x i ) 2
][
n ¦ y i2 − (¦ y i )
2
] 1193989 ⋅ (18570 − 12769)
77693 77693 77693
= = = = 0,93
1193989 ⋅ 5801 1092,698 ⋅ 76,1643 83224,578

Rezultă deci că între cele două variabile există o legătură directă şi foarte
puternică.

Semnificaţia coeficientului de corelaţie (r) poate fi testată utilizând testul


t:
r n−2
t n −2 = (5.39)
2
1− r

235
STATISTICĂ ECONOMICĂ

Ipoteza nulă se respinge dacă valoarea calculată tn-2 este mai mare decât
valoarea tabelată tα/2,n-2 pentru testul bilateral şi tcalc. >tα,n-2 sau tcalc. < -tα,n-2
pentru testul unilateral dreapta, respectiv, stânga.

EXEMPLUL 5.3. Vom testa semnificaţia coeficientului de corelaţie cal-


culat în Exemplul 5.1:
rxy 0,93
t= ⋅ n−2 = ⋅ 8 = 7,158
2
1 − rxy 1 − 0,932
tcalc. = 7,158 se compară cu valoarea tabelară a lui t, din tabelul repartiţiei
Student (anexa) pentru un nivel de semnificaţie de 5% (α = 0,05) şi n – 2 = 8
grade de libertate:
tα,n-2 = t0,05;8 = 2,306
Cum tcalc. > ttab rezultă că coeficientul de corelaţie liniară simplă deter-
minat este semnificativ statistic (semnificativ diferit de zero).

5.5.3.3. Raportul de corelaţie

Un alt indicator relativ pentru măsurarea intensităţii legăturii dintre va-


riabile este raportul de corelaţie, rădăcina pătrată a coeficientului de
determinaţie (5.29), adică:
n
(
¦ ŷ i − y
i =1
)
2 n
¦ (y i − ŷ )
2

R= = 1 − i =n1 (5.40)
¦ (y − y) ( )
n 2 2
i ¦ yi − y
i =1 i =1
Raportul de corelaţie ia valori cuprinse între 0 şi 1. Cu cât valoarea
indicatorului este mai apropiată de 1, cu atât legătura dintre variabile este
mai puternică. Valori apropiate de 0 ne indică legături de intensitate slabă
între variabile.
În analiza corelaţiei simple liniare se observă că:
r2 = R2 (5.41)
şi
r= R (5.42)

EXEMPLUL 5.4. Pentru calculul raportului de corelaţie vom lua în consi-


derare datele din Exemplul 5.1:

236
CAPITOLUL 5

∑ (y i − ŷ i )
2
R = 1−
(
∑ yi − y )2

77
R = 1− = 0,93
579,98
Rezultă că legătura dintre cele două variabile este foarte puternică.

5.6. REGRESIA ŞI CORELAŢIA MULTIPLĂ LINIARĂ

În numeroase situaţii, însă, variabila rezultativă supusă studiului poate fi


afectată (determinată) de mai mulţi factori de influenţă.

5.6.1. Regresia multiplă liniară

Regresia multiplă liniară extinde analiza regresiei, utilizând două sau mai
multe variabile independente. Astfel, dacă luăm în consideraţie o variabilă
dependentă (Y) şi două variabile independente (X1 şi X2), modelul de
regresie multiplă liniară în colectivitatea generală devine:
Yi = α + β1X1i + β 2 X 2i + ε i (5.43)
iar în eşantionul cu care lucrăm, linia de regresie multiplă este:
yi = a + b1x1i + b2x2i + ei (5.44)

În eşantion, coeficienţii b1 şi b2 sunt numiţi coeficienţi de regresie


parţiali şi ei ne arată doar influenţa parţială a fiecărei variabile
independente, atunci când influenţa tuturor celorlalte variabile independente
este considerată constantă.
ŷ i = a + b1 x 1i + b 2 x 2i (5.45)
Aplicând metoda celor mai mici pătrate, sistemul de 3 ecuaţii simultane
cu 3 necunoscute, pentru determinarea estimatorilor a, b1 şi b2 este:

237
STATISTICĂ ECONOMICĂ

­na b n x n n
° + 1 ¦ 1i + b 2 ¦ x 2i = ¦ yi
i =1 i =1 i =1
° n
° n
2
n n
®a ¦ x 1i + b1 ¦ x 1i + b 2 ¦ x 1i x 2i = ¦ x 1i y i (5.46)
° i =1 i =1 i =1 i =1
° n n n
2
n
a ¦ x + b ¦
°¯ i =1 2i 1 i =1 1i 2ix x + b 2 ¦ x 2i = ¦ x 2i y i
i =1 i =1

Dacă luăm în considerare k variabile independente, atunci modelul poate fi


generalizat la:
Yi = α + β1X1i + β 2 X 2i + ... + β k X ki + ε i (5.47)

În acest caz apare o ipoteză specială, şi anume aceea că o variabilă


independentă nu poate să fie exprimată ca o combinaţie liniară perfectă
a celorlalte variabile independente. Cu alte cuvinte, nu este posibil să
găsim un set de numere d0, d1, d2, ..., dk, astfel încât:
d 0 + d1X1i + d 2 X 2i + ... + d k X ki = 0 , i =1, n (5.48)
În practică, deşi situaţia aceasta, numită multicoliniaritate perfectă, este
rar întâlnită, sunt mai frecvente cazurile de multicoliniaritate ridicată
Ecuaţia de regresie multiplă în eşantion este:
ŷ i = a + b1 x 1i + b 2 x 2i + ... + b k x ki (5.49)

5.6.2. Corelaţia multiplă liniară

Pentru a studia intensitatea legăturii dintre o caracteristică dependentă


(Y) şi mai multe caracteristici independente utilizând metoda corelaţiei,
calculăm raportul de corelaţie multiplă:
n n
¦ (ŷ i − y ) ¦ (y i − ŷ i )
2 2
i =1
Ry, x 1 , x 2 , ..., x k = n
= 1 − i =n1 (5.50)
¦ (y i − y ) ¦ (y i − y )
2 2

i =1 i =1
Raportul (coeficientul) de corelaţie multiplă are valori cuprinse între 0
(dacă nu există legătură între variabilă dependentă şi variabilele indepen-
dente) şi 1 (dacă există legătură perfectă).
Ry, x 1 , x 2 , ..., x k > | ryx j | j = 1, k (5.51)

238
CAPITOLUL 5

Pătratul raportului de corelaţie multiplă este coeficientul de determina-


ţie multiplă (R2). El arată proporţia din variaţia totală a variabilei Y, care
este explicată de variabilele independente X1, X2, ..., Xk.
Testarea semnificaţiei raportului de corelaţie multiplă se poate face
utilizând statistica F:
n − k −1 R 2
F= ⋅ (5.52)
k 1− R 2
unde k reprezintă numărul variabilelor independente. Dacă:
Fcalc. > Fα, k, n-k-1 se acceptă ipoteza conform căreia variabilele X1, X2, ...,
Xk au o influenţă semnificativă asupra variabilei rezultative, Y.
În afara coeficienţilor de corelaţie simplă şi multiplă, în analiza corelaţiei
dintre variabile se mai pot calcula şi coeficienţii de corelaţie parţială, ce
caracterizează intensitatea legăturii dintre două variabile, în ipoteza că cele-
lalte variabile rămân constante. De pildă, în cazul a două variabile
independente, coeficientul de corelaţie parţială între Y şi X1, eliminând
influenţa variabilei X2 este:
ryx1 − ryx 2 ⋅ rx1x 2
ryx1 ⋅ x 2 = (5.53)
( )(
2
1 − ryx 2
⋅ 1 − r)2
x1x 2
şi coeficientul de corelaţie parţială între Y şi X2, eliminând influenţa
variabilei X1 este:
ryx2 − ryx1 ⋅ rx1x 2
ryx2 ⋅x1 = (5.54)
( 2
1 − ryx1
)(1 − r 2
)
x1x 2

5.7. REGRESIA ŞI CORELAŢIA NELINIARĂ

Când — din consideraţii teoretice ori din studierea diagramei de împrăştiere


— observăm că dependenţa nu este de tip liniar, o funcţie neliniară trebuie să
fie utilizată pentru a descrie legătura dintre caracteristici.

5.7.1. Regresia neliniară

1°. Modelele polinominale reprezintă o categorie des întâlnită printre


modelele neliniare ce descriu relaţiile dintre caracteristicile social-econo-
mice. Modelul de regresie în eşantion are forma generală:

239
STATISTICĂ ECONOMICĂ

ŷ i = a + b1 x i + b 2 x i2 + ... + b k x ik (5.55)

unde k reprezintă gradul funcţiei.


În general, regresia polinomială (5.55) poate să fie studiată ca un caz
special de regresie multiplă:
ŷ i = a + b1 x1i + b 2 x 2i + ... + b k x ki

2°. Modelele ce necesită transformarea variabilelor în vederea linia-


rizării sunt cele în care aplicarea regresiei presupune o schimbare de varia-
bilă, astfel încât relaţia între transformată şi cealaltă variabilă să fie de tip
liniar.
De pildă, în cazul unui model exponenţial
ŷ i = a ⋅ b xi (5.56)
logaritmând expresia funcţională exponenţială, obţinem:
log ŷ i = log a + (log b ) ⋅ x i (5.57)
O altă situaţie este cea a dependenţei invers proporţionale:
1
ŷ i = a + b (5.58)
xi
1
când, utilizând variabila transformată x ,i = , modelul se liniarizează.
xi

5.7.2. Corelaţia neliniară

Pentru analiza intensităţii legăturii dintre variabile cu ajutorul indicato-


rilor corelaţiei, am arătat, deja, în paragraful 5.5.3 că indicatori precum
covarianţa sau coeficientul de corelaţie liniară nu sunt potriviţi în cazul
legăturii neliniare. Calculăm, deci, raportul de corelaţie R (5.40).
n n
¦ (ŷ i − y ) ¦ (y i − ŷ i )
2 2
i =1
R= 2
= 1 − i =n1
¦ (y i − y )
n
¦ (y i − y )
2

i =1 i =1

indicator care ia valori între 0 şi 1 şi arată o corelaţie cu atât mai puternică


între variabile, cu cât valoarea sa este mai apropiată de 1.

240
CAPITOLUL 5

5.8. ANALIZA STATISTICĂ A LEGĂTURII DINTRE VARIABILELE CALITATIVE

Metodele neparametrice de analiză a corelaţiei se folosesc îndeosebi


pentru studierea asocierii dintre variabilele calitative, dar, cum metodele va-
labile pentru o scală inferioară (nominală sau ordinală) sunt valabile şi
pentru o scală superioară (numerică) vom putea folosi corelaţia nepara-
metrică (sau liberă de distribuţie) şi pentru variabilele numerice.

5.8.1. Asocierea variabilelor alternative


În cazul variabilelor alternative (dihotomice), datele se sistematizează într-
un tabel „2 x 2“, care are forma (Tabelul 5.7):
Tabelul 5.7
Tabelul „2x2“
Clasele lui x Clasele lui Y Total
Y(y1) non Y(y2)
X(x1) n11 n12 n1.
nonX(x2) n21 n22 n2.
Total n.1 n.2 n..

O asociere puternică înntre variabile se remarcă în cazul concentrării frec-


venţelor pe una dintre diagonalele tabelului.
Coeficientul ϕ de măsurare a asocierii dintre variabilele alternative, sis-
tematizate într-un tabel „2 x 2“ este:
n n − n 21 n 12
ϕ = 11 22 (5.59)
n.1 n.2 n 1 .n 2 .
Coeficientul ϕ ia valori în intervalul [-1, 1]. O valoare apropiată de 0, ne
arată o independenţă între aceste clasificări. O valoare apropiată de +1 sau
de –1, ne arată o dependenţă între variabile.
Coeficientul Q (al lui Yule) care măsoară şi el intensitatea asocierii
dintre variabile alternative, are formula:
n n − n 21 n 12
Q = 11 22 (5.60)
n 11 n 22 + n 21n 12
Acest indicator ia valori cuprinse între –1 şi +1. O valoare apropiată de
+1 ne arată o asociere pozitivă; iar o valoare apropiată de –1, o asociere
negativă.

241
STATISTICĂ ECONOMICĂ

5.8.2. Asocierea variabilelor nominale

Aceasta este situaţia în care variabilele sunt nealternative şi au o structură


constituită dintr-un sistem de clase (categorii), în număr mai mare de 2. Cla-
sele reprezintă stări calitative, pe care le putem obţine chiar şi pentru varia-
bilele numerice, printr-o reducţie de scală. Într-o astfel de situaţie, tabelul de
contingenţă în care se sistematizează datele are r rânduri (r clase pentru
variabila X) şi c coloane (c clase pentru variabila Y) (Tabelul 5.8)

Tabelul 5.8
Tabel de contingenţă
Clase Clase pentru Y Total
pentru X Y1 Y2 .......... Yj .......... Yc
X1 n11 n12 .......... n1j .......... n1c n1.
X2 n21 n22 .......... n2j .......... n2c n2.
. . .
. . .
Xi ni1 ni2 .......... nij .......... nic ni.
. . .
. . .
Xr nr1 nr2 .......... nrj .......... nrc nr.
Total n.1 n.2 .......... n.j .......... n.c n..

Testul χ2 de independenţă pentru tabelul „r x c“ de contingenţă (aso-


ciere) se aplică sub presupunerea că fiecare observaţie (unitate statistică)
este clasificată independent de orice altă observaţie. Vom determina atunci
frecvenţele teoretice (aşteptate) în rândul i şi coloana j:
n i. ⋅ n . j
f ij = (5.61)
n..
şi vom calcula testul statistic:

χ2 = ¦¦
( )
r c n ij − f ij
2
= ¦¦
n c n ij
2
−n (5.62)
i =1 j=1 f ij i =1 j=1 f ij

Ipoteza nulă se respinge (şi deci se acceptă ipoteza alternativă, aceea că


există dependenţă între clasificarea pe linii şi cea pe coloane), la un nivel de
semnificaţie α, dacă χ calc
2 2
. > χ α, (r-1)(c-1), unde (r-1)(c-1) reprezintă gradele
de libertate.

242
CAPITOLUL 5

5.8.3. Asocierea variabilelor ordinale (corelaţia rangurilor)

Variabilele social-economice măsurate pe o scală ordinală presupun acor-


darea unor numere de ordine (ranguri) tuturor unităţilor, astfel încât unităţile
să poată fi ordonate în funcţie de criteriile studiate. Rangurile sunt de la 1,
până la n.
Coeficientul de corelaţie a rangurilor Spearman (rs) se determină ca:
6¦ d i2
rs = 1 −
( )
n n 2 −1
(5.63)

unde di = rxi – ryi reprezintă diferenţa dintre rangurile perechi acordate


aceleiaşi unităţi statistice.
Coeficientul de corelaţie a rangurilor Spearman ia valori cuprinse în
intervalul [-1, 1]. Valori (în modul) apropiate de unitate indică o asociere
puternică între variabile, iar valori apropiate de zero indică o asociere slabă
între variabile.
EXEMPLUL 5.5. Pentru 6 studenţi dintr-o grupă se cunosc: calificativele
pentru nivelul de pregătire al studenţilor la matematică, obţinute în timpul
anului şi notele obţinute la examenul de statistică:

Tabelul 5.9
Student Calificativ la matematică Notă la statistică
1 bun 9
2 slab 3
3 excepţional 10
4 satisfăcător 6
5 foarte slab 5
6 foarte bun 8

Se acordă ranguri valorilor celor două variabile (Tabelul 5.10, col. 1, 2)

243
STATISTICĂ ECONOMICĂ

Tabelul 5.10
Student Rang pt. x Rang pt. y Diferenţa între ranguri di2
rxi ryi di = rxi - ryi
0 1 2 3 4
1 4 5 -1 1
2 2 1 +1 1
3 6 6 0 0
4 3 3 0 0
5 1 2 -1 1
6 5 4 +1 1
Total 4

6⋅4
rs = 1 − = 0,89 indică o asociere puternică între cele 2 varia-
6 ⋅ (36 − 1)
bile.
Coeficientul de corelaţie a rangurilor Kendall (τ),necesită ordonarea —
crescător — a unităţilor după rangurile acordate variabilei X şi înscrierea în
paralel, a rangurilor acordate după variabila Y. Atunci
2S
τ= (5.64)
n (n − 1)
unde: S = P – Q, P = ¦pi, Q = qi
pi = numărul rangurilor superioare fiecărui rang ryi, acordat după
variabila Y, de la el în jos;
qi = numărul rangurilor inferioare fiecărui rang ryi, acordat după
variabila Y, de la el în jos.

Acest indicator ia valori cuprinse în intervalul [-1, 1], iar interpretarea


este similară cu cea a coeficientului de corelaţie a rangurilor Spearman. În
general, coeficientul rangurilor Kendall are o valoare mai mică decât coefi-
cientul rangurilor Spearman şi, pentru un număr mare de unităţi statistice (n)
avem relaţia
2
τ ≅ rs (5.65)
3

EXEMPLUL 5.6. Folosim datele din Tabelul 5.9. Ordonăm studenţii (cres-
cător) după rangurile acordate variabilei: „Calificativul pentru pregătirea la
matematică“.

244
CAPITOLUL 5

Tabelul 5.11
Student rxi ryi Pi Qi
5 1 2 4 1
2 2 1 4 1
4 3 3 3 0
1 4 5 1 0
6 5 4 1 1
3 6 6 0 1
Total 13=P 2=Q

S = P − Q = 13 − 2 = 11
2⋅S 2 ⋅ 11 22
rk = = = = 0,73
n (n − 1) 6 ⋅ 5 30

Între cele două variabile există o asociere destul de puternică şi directă.

245
Analiza legăturii dintre variabile

Diagrama de împrăştiere

Analiza dispersională

Se studiază cauzalitatea
DA NU

Analiza regresiei Analiza corelaţiei

Date numerice din eşantioane mari


Nr. variabile independente sau povenite din populaţii normale
Mai multe
O variabilă DA
variabile NU
Corelaţie parametrică
Regresie simplă Regresie multiplă

Legătură între două


Legătură liniară Legătură liniară variabile
DA NU
DA NU DA NU
Legătură liniară • Raportul de
Model de Model de Model de Model de corelaţie multiplă
regresie simplă regresie regresie multiplă regresie
liniară simplă liniară multiplă R = R2

• Covarianţa • Coeficientul de
neliniară ∧ neliniară • Raportul de
y i = a + bx i yi = a + b1x1i + Σ( x i − x )( yi − y) corelaţie parţială
s xy = corelaţie
... + b k x ki n
R = R2
• Coeficientul de
corelaţie
Calitatea ajustării s xy
rxy =
s xs y
• Raportul de corelaţie Corelaţie neparametrică
Eroarea standard a Coeficientul de 2
R= R
reziduurilor determinaţie
∧ ∧
Σ( y i − y ) 2 Σ( yi − y) 2
se = R2 = = Variabile alternative Variabile nominale Variabile ordinale
n − k −1 Σ( yi − y) 2 • coeficientul ϕ • testul χ2 • Coeficientul de
∧ corelaţie a rangurilor
Σ ( y i − yi ) 2 n11n 22 − n 21n12
= 1− ϕ= r c (n ij − fij ) 2 Spearman
2 n.1 ⋅ n .2 ⋅ n1. ⋅ n 2. χ2 = ¦¦
Σ( yi − y) f ij
i =1 j=1 6Σd i2
• coeficientul Q rS = 1 −
n i.n . j n ( n 2 − 1)
n n − n 21n12 unde fij =
ϕ = 11 22 n.. • Coeficientul de
n11n 22 + n 21n12 246corelaţie a
rangurilor Kendall
2S
τ=
n (n − 1)
STATISTICĂ ECONOMICĂ

Întrebări recapitulative

1. Definiţi conceptul de legătură statistică.


2. Cum clasificaţi legăturile statistice? Exemplificaţi.
3. Ce este şi cum se alcătuieşte o diagramă de împrăştiere? Ce infor-
maţii oferă?
4. Analiza dispersională (ANOVA) — conţinut, mod de utilizare.
5. Prezentaţi modelul de analiză dispersională unifactorială.
6. În ce constă metoda regresiei?
7. Descrieţi metoda regresiei simple liniare.
8. Ce reprezintă coeficienţii a şi b ai liniei de regresie?
9. Cum se apreciază calitatea ajustării? Indicatori.
10. Testarea semnificaţiei parametrului b al modelului de ajustare.
11. Cum se defineşte corelaţia liniară simplă?
12. Ce reprezintă covarianţa?
13. Coeficientul de corelaţie: concept, mod de calcul, interpretare.
14. Testarea semnificaţiei coeficientului de corelaţie.
15. Ce reprezintă raportul de corelaţie? Cum se determină? Ce semnifica-
ţie prezintă valoarea lui?
16. Regresia şi corelaţia multiplă liniară.
17. În ce condiţii se aplică regresia şi corelaţia neliniară?
18. Daţi exemple de modele polinomiale utilizate în studiul legăturilor
neliniare.
19. Ce este corelaţia neparametrică şi în ce condiţii se foloseşte?
20. Prezentaţi asocierea variabilelor alternative.
21. Prin ce modalităţi, se studiază asocierea variabilelor nominale?
22. Care sunt indicatorii prin care se măsoară asocierea variabilelor ordinale?
23. Coeficientul lui Spearman de corelaţie a rangurilor, definiţie, mod de
calcul, interpretare.
24. Coeficientul de corelaţie a rangurilor Kendall — definiţie, mod de cal-
cul, interpretare.

247
CAPITOLUL 5

Teste de autoevaluare

1. Pentru un magazin alimentar s-au cules date privind vânzările (mil. lei)
şi profitul (mil. lei) realizate în 12 zile, în scopul de a determina ecuaţia de
regresie şi de a previziona profitul, presupunând un nivel al vânzărilor de 10
milioane lei.
Datele sunt prezentate în tabelul 5.1’.

Tabelul 5.1’
Nr. Vânzări Profit
crt. (mil. lei) (mil. lei)
0 1 2
1 7 0.15
2 2 0.10
3 6 0.13
4 4 0.15
5 14 0.25
6 15 0.27
7 16 0.24
8 12 0.20
9 14 0.27
10 20 0.44
11 15 0.34
12 7 0.17
Total 132 2.71

2. Managerul unei companii naţionale doreşte să afle de ce unele


departamente ale companiei realizează venituri din vânzări superioare altor
departamente. El a considerat doi factori determinanţi ai vânzărilor anuale:
cheltuielile cu reclama şi publicitatea şi numărul vânzătorilor. Pentru 15
departamente, datele sunt:
Tabelul 5.2’
Departament Venituri anuale din Cheltuieli cu reclama Număr de vânzători
vânzări (mil. $) şi publicitatea (mii $) (persoane)
0 1 2 3
1 32 249 15
2 47 292 18
3 18 183 14
4 25 201 16
5 49 310 21
6 41 248 20
7 52 246 18

248
STATISTICĂ ECONOMICĂ

8 38 241 14
9 36 288 13
10 29 191 15

În ipoteza unei dependenţe liniare între cele trei variabile, se cere:


a) Să se estimeze parametrii modelului de regresie;
b) Să se determine erorile reziduale;
c) Să se măsoare intensitatea legăturii dintre cele trei variabile folosind un
indicator de corelaţie adecvat;
d) Să se testeze validitatea modelului de regresie folosit, ştiind că F0,05;2;7 =
4,74.

3. 200 de utilaje din dotarea unei fabrici sunt grupate după vechime (ani) şi
după costul de întreţinere (mii lei):
Tabelul 5.3’
Vechime (ani) Costul de întreţinere (mii lei) Total
1000-1400 1400-1800 1800-2200 2200-2600
0 1 2 3 4 5
6 45 10 5 - 60
9 - 45 40 15 100
12 - 5 5 30 40
Total 45 60 50 45 200
Se cere:
a) Ajustaţi costul de întreţinere în funcţie de vechime, folosind funcţia de
regresie liniară;
b) Măsuraţi intensitatea legăturii dintre cele două variabile, folosind un
indicator de corelaţie adecvat. Testaţi semnificaţia acestuia;
c) Verificaţi validitatea modelului de regresie folosit.

4. Pentru variabilele statistice:cheltuielile cu reclama şi valoarea vânzărilor,


înregistrate la n magazine, s-au calculat:
¾ abaterea standard a cheltuielilor cu reclama: 52 u.m.;
¾ valoarea medie a vânzărilor unui magazin: 7787,5 u.m.;
¾ cheltuielile medii cu reclama ale unui magazin: 365 u.m.;
¾ covarianţa dintre cele două variabile: 55837,6.
În ipoteza unei dependenţe liniare, ecuaţia de regresie ce modelează legătura
dintre cele două variabile este:
a) ŷ = 10,75 + 20,65x ;
b) ŷ = 20,65 + 250,25x ;

249
CAPITOLUL 5

c) ŷ = 250,25 + 20,6 x ;
d) ŷ = 100,75 − 20,65x ;
e) nici una din variantele de mai sus.

5. Un funcţionar al departamentului de sănătate doreşte să stabilească


factorii determinanţi care influenţează cheltuielile medicale ale familiilor. În
acest scop, pentru 13 familii el înregistrează numărul de membri ai familiei
şi cheltuielile lunare cu îngrijirea sănătăţii ($):
Tabelul 5.4’
Familia Mărimea familiei Cheltuieli medicale
(persoane) lunare ($)
0 1 2

1 2 20
2 2 28
3 4 52
4 5 50
5 7 78
6 3 35
7 8 102
8 10 88
9 5 51
10 2 22
11 3 29
12 5 48
13 2 25
a) Să se alcătuiască tabelul de asociere în raport cu mediile celor două
variabile şi să se determine coeficientul de asociere;
b) Să se măsorare intensitatea legăturii dintre variabile folosind coeficienţii
de corelaţie a rangurilor ai lui Spearman şi Kendall.

6. Să se precizeze care dintre următoarele metode de analiză a legăturilor


dintre variabilele statistice nu se încadrează în categoria metodelor simple:
a) metoda seriilor interdependente;
b) metoda grupărilor;
c) metoda regresiei;
d) metoda tabelului de corelaţie;
e) metoda corelaţiei.

7. Prin "numărul gradelor de libertate" înţelegem:


a) numărul de elemente dintr-o colectivitate;

250
STATISTICĂ ECONOMICĂ

b) numărul de elemente dintr-o colectivitate minus 1;


c) numărul de elemente necesare pentru a defini starea unui ansamblu;
d) numărul de elemente independente necesare pentru a defini starea unui
ansamblu;
e) numărul de relaţii independente care leagă elementele unui ansamblu.

8. Diagrama de împrăştiere este utilă pentru:


a) a determina intervalul de încredere pentru coeficientul de corelaţie;
b) a aprecia vizual legătura dintre două variabile;
c) a determina valoarea critică în testarea semnificaţiei coeficientului de
corelaţie;
d) a determina valaorea raportului de corelaţie, ca fiind punctul cel mai
aproape de origine;
e) a determina abaterea medie pătratică a setului de date.

251
CAPITOLUL 5

Răspunsurile testelor de autoevaluare

1. Diagrama de împrăştiere pentru datele disponibile este:


y
Profit
(mil. lei)

0,4

0,3

0,2

0,1

x Vânzãri
0 5 10 15 20 (cheltuieli)

Fig. 5.1’ - Diagrama de împrăştiere

Legătura dintre variabile este directă şi liniară, iar ecuaţia de regresie va


avea forma ŷ i = a + bx i

Folosind datele din tabelul de lucru 5.5’:

Tabelul 5.5’
xi yi xi2 xiyi yi2
0 1 2 3 4

7 0,15 49 1,05 0,0225


2 0,10 4 0,20 0,0100
6 0,13 36 0,78 0,0169
4 0,15 16 0,60 0,0225
14 0,25 196 3,50 0,0625
15 0,27 225 4,05 0,0729
16 0,24 256 3,84 0,0576
12 0,20 144 2,40 0,0400
14 0,27 196 3,78 0,0729
20 0,44 400 8,80 0,1936
15 0,34 225 5,10 0,1156
7 0,17 49 1,19 0,0289
132 2,71 1796 35,29 0,7159

252
STATISTICĂ ECONOMICĂ

­12a + 132b = 2,71


®
¯132a + 1796b = 35,29
371 ⋅ 1796 − 35,29 ⋅ 132 208,88
a= = = 0,0506.
12 ⋅ 1796 − (132 )
2
4128
12 ⋅ 35,29 − 132 ⋅ 2,71 65,76
b= = = 0,01593.
4128 4128

Ecuaţia de regresie este:


ŷ i = 0,0506 + 0,01593x i
Pentru xi=10 mil. lei, obţinem:

y = 0,2099 mil. lei
2.
a) Y x1, x 2 = a 0 + a1 x1 + a 2 x 2 , unde X1 = cheltuielile cu reclama şi publicitatea,
X2 = numărul vânzătorilor, iar Yx1,x2 = veniturile din vânzări.
Se obţine sistemul de ecuaţii:
­na 0 + a1 ¦ x1 + a 2 ¦ x 2 = ¦ y i
°°
2
®a 0 ¦ x1 + a1 ¦ x1 + a 2 ¦ x1 x 2 = ¦ x1 y i
° 2
°¯a 0 ¦ x 2 + a1 ¦ x1 x 2 + a 2 ¦ x 2 = ¦ x 2 y i
Calculele intermediare se găsesc în tabelul 5.6’, col. 1-8.
Tabelul 5.6’
Departa yi x1 x2 x1x2 x1yi x2yi
x12 x 22
ment
0 1 2 3 4 5 6 7 8

1 32 249 15 62.001 225 3735 7968 480


2 47 292 18 85.264 324 5256 13724 846
3 18 183 14 33.489 196 2562 3294 252
4 25 201 16 40.401 256 3216 5025 400
5 49 310 21 96.100 441 6510 15190 1029
6 41 248 20 61.504 400 4960 10168 820
7 52 246 18 60.516 324 4428 12792 936
8 38 241 14 58.081 196 3374 9158 532
9 36 288 13 82.944 169 3744 10368 468
10 29 191 15 36.481 225 2865 5539 435
Total 367 2449 164 616.781 2756 40.650 93.226 6198

253
CAPITOLUL 5

Tabelul 5.6’-continuare
Yxi,x2 εi 2
εi = (y i − y ) (yi − y )2 (Yx1,x2 − y )2
(yi − Yx1, x2 )
2

9 10 11 12 13 14
35 -3 9 -4,7 22,09 2,89
46 +1 1 10,3 106,09 86,49
24 -6 36 -18,7 349,69 161,29
29 -4 16 -11,7 136,89 59,29
54 -5 25 12,3 151,29 299,29
43 -2 4 4,3 18,49 39,69
39 +13 169 15,3 234,09 5,29
32 +6 36 1,3 1,69 22,09
38 -2 4 -0.7 0,49 1,69
26 +3 9 -7,7 59,29 114,49
367 309 - 1080,1 792,5

Sistemul este:
10a 0 + 2449a1 + 164a 2 = 367

2449a 0 + 616.781a1 + 40.650a 2 = 93.226
164a + 40.650a + 2756a = 6198
 0 1 2

Se rezolvă sistemul şi se găseşte:


a0 = -26,4
a1 = 0,1512
a2 = 1,59

Y x1, x 2 = −26,4 + 0,1512 ⋅ x1 + 1,59 ⋅ x 2

Dacă cheltuielile cu reclama ar creşte cu o mie $, atunci veniturile


din vânzări ar creşte cu 0,1512 mil. $, iar dacă numărul vânzătorilor ar
creşte cu o persoană, atunci veniturile din vânzări ar creşte cu 1,59 mil. $.

b) ε = y i − Y x1, x 2 (tabelul 5.6’, col. 10-11).

c) Pentru măsurarea intensităţii legăturii dintre variabile folosim raportul


de corelaţie multiplă:

254
STATISTICĂ ECONOMICĂ

¦ ( y i − Y x 1x 2 )
2
309
R y / x1, x 2 = 1 − = 1− = 0,84
(
¦ yi − y )2 1080,1

Valoarea lui Ry/x1,x2 arată o dependenţă puternică între cele trei variabile.

d) Pentru testarea validităţii modelului de regresie se foloseşte testul F de


analiză dispersională.
s12
Fcalc =
s 22

s12
S
= 1 =
(
¦ Y x1x 2 − y
=
)2
792,5
= 396,25
r −1 r −1 3 −1
¦ ( y i − Y x1x 2 )
2
S 309
s 22 = 2 = = = 44,14
n−r n−r 7
396,25
Fcalc = = 8,98 > Ftab = 4,74
44,14
Aşadar, modelul de regresie multifactorială este bine ales.

3. a) Y x i = a + bx i , unde Yxi – valorile teoretice, ajustate ale lui Y.

Se obţine sistemul:
­a ¦ ¦ nij + b ¦ xi ni = ¦ y j n j
°° i j i j
® 2
°a ¦ xi ni + b¦ xi ni = ¦ ¦ xi y j nij
°¯ i i i j

Calculele intermediare se găsesc în tabelul 5.7’.

“b” este coeficientul de regresie (panta dreptei). Cum b > 0, avem o legătură directă
între variabile.

Dacă vechimea creşte cu un an, costurile de întreţinere cresc în medie cu 155,78


mii lei

255
CAPITOLUL 5

Y xi = 434,7 + 155,78 ⋅ x i

Tabelul 5.7’
Vechime Cost de întreţinere (mii lei) Yxi
xi2 ni ¦j i j ij
ni xi ni x y n
(ani)
1200 1600 2000 2400
0 1 2 3 4 5 6 7 8 9
6 45 10 5 - 60 360 2160 480.000 1369,38
9 - 45 40 15 100 900 8100 1.692.000 1836,72
12 - 5 5 30 40 480 5760 1.080.000 2304,06
nj 45 60 50 45 200 1740 16.020 3.252.000

y jn j 54000 96.000 100.000 108.000 358.000


64.800*103 153.600*103 200.000*103 259.200*103 677.600*103
y 2j n j

b) Se calculează coeficientul de corelaţie.

cov( x, y ) n¦ ¦ xi y j nij − ¦ xi ni ¦ y j n j
r yx = =
σ xσ y [n¦ x n ][
i i − (¦ xi ni ) n ¦ y j n j −
2 2 2
(¦ y j n j )2 ]
ryx = 0,76 , deci există o legătură destul de puternică, directă, între cele două
variabile.

Se poate utiliza şi raportul de corelaţie:

s 2y / Y s2
Y/y (
¦ ¦ y j − Y xi )2 nij
R y / x = 1− = = 1−
s 2y s 2y ¦ (y j − y ) n j
2

(
¦ yj − y nj )2 ¦ yjnj
2
2
( )2 2
s 2y = = − y Ÿ ¦ y j − y n j = ¦ y 2j n j − n y = 36.780.000
¦nj ¦nj

¦ y jn j 358000
y= = = 1790 mii lei
¦nj 200

256
STATISTICĂ ECONOMICĂ

15.375.508
Ry / x = 1 − = 0,76
36.780.000

Calculele intermediare se găsesc în tabelul 5.8’


Tabelul 5.8’
¦ (Yxi − y j )2 n ij
Yxi yj
j
1200 1600 2000 2400
0 1 2 3 4 5

1369,38 1.291.031,2 531.855,84 1.988.407,9 - 3.811.294,9


1836,72 - 2.521.636,1 1.066.414,3 4.759.265,2 8.347.315,6
2304,06 - 2.478.502,4 462.262,41 276.134,5 3.216.899,3
Total 15.375.508,0

Testarea semnificaţiei coeficientului de corelaţie “r” se face cu ajutorul


testului t:
r 0,76
t= n−2= 14,07 = 16,45
2 2
1− r 1 − 0,76
t calc > t 0,05;198 = 1,972 , deci “r” este semnificativ.

s12
c) F =
s 22

s12
S
= 1 =
(
=
)2
¦ Y x i − y ni 36.780.000 − 15.375.508
= 21.404.492
r −1 r −1 2 −1

S ¦ ¦ y j − Yx i ( )2 nij 15.375.508
s 22 = 2 = = = 77654
n−r n−r 200 − 2

Fcalc = 275,64

Fα,r-1,n-r = F0,05, 1,198 = 4,84

Cum Fcalc > Ftab înseamnă că modelul de regresie este bine ales (este semnificativ
statistic).
257
CAPITOLUL 5

4.
cov( x, y ) s cov( x, y ) 55837,6
rxy = =b⋅ x Ÿb= = = 20,65
sx s y sy s x2 52 2

a + b ⋅ x = y Ÿ a = y − b ⋅ x = 7787,5 − 20,65 ⋅ 365 = 250,25

Aşadar, ecuaţia de regresie va fi:

ŷ = 250,25 + 20,65x , deci varianta c) este adevărată.

5.
Notăm cu X - mărimea familei şi cu Y - cheltuielile medicale.

¦ x i 58
x= = = 4,46 pers.
n 13

¦ y i 628
y= = = 48,31 $
n 13

Tabelul 5.9’
Mărimea familiei (X) Cheltuieli medicale (Y) Total (ni)
(persoane) y ≤ 48,31 y > 48,31
x ≤ 4,46 n11 = 6 n12 = 1 7
x > 4,46 n21 = 1 n22 = 5 6
Total (nj) 7 6 13

n11 ⋅ n 22 − n12 ⋅ n 21 36 − 1
Qa = = = 0,95
n11 ⋅ n 22 + n12 ⋅ n 21 36 + 1

b) Se acordă ranguri celor două variabile.

Tabelul 5.10’
x
Familia Ri Riy di di2 Pi Qi
0 1 2 3 4 5 6
1 2,5 1 1,5 2,25 12 -
258
STATISTICĂ ECONOMICĂ

10 2,5 2 0,5 0,25 11 -


13 2,5 3 -0,5 0,25 10 -
2 2,5 4 -1,5 2,25 9 -
11 5,5 5 0,5 0,25 8 -
6 5,5 6 -0,5 0,25 7 -
3 7 10 -3 9 3 3
12 9 7 2 4 5 -
4 9 8 1 1 4 -
9 9 9 0 0 3 -
5 11 11 0 0 2 -
7 12 13 -1 1 - 1
8 13 12 1 1 - -
Total - - 21,5 74 4

6¦ d i2 6 ⋅ 21,5
rs = 1 − =1− = 0,94
(
n n 2 −1 ) 13 ⋅ 168

Valoarea obţinută a coeficientului arată că legătura dintre cele două


variabile este foarte puternică şi directă.

2S 2 ⋅ (74 − 4)
rk = , rk = = 0,89
n(n − 1) 13 ⋅12

6. c) şi e)

7. d)

8. b)

259
CAPITOLUL 5

Teste propuse spre rezolvare

1. Numărătorul coeficientului de corelaţie (r) este covarianţa (covxy). De ce


este preferat coeficientul de corelaţie?
a) Pentru că trebuie calculată media produselor abaterilor individuale;
b) Deoarece numărătorul nu indică direcţia pantei sau a legăturii;
c) Deoarece numărătorul nu indică intensitatea legăturii;
d) Deoarece suma produselor abaterilor individuale este întotdeauna
egală cu 0;
e) Pentru a evita utilizarea valorilor luate în modul.

2. În care dintre următoarele diagrame de împrăştiere coeficientul de co-


relaţie va avea valoare apropiată de 1?

y y
a) b)

o x o x

y y
c) d)

o x o x
y
e)

o x

Fig. 5.2’

260
STATISTICĂ ECONOMICĂ

3. Semnul coeficientului de corelaţie:


a) este minus când legătura dintre variabile este slabă;
b) este determinat de abaterile medii pătratice ale variabilelor x şi y;
c) indică direcţia schimbării unei variabile când cealaltă variabilă se
modifică;
d) este minus când descreşterea lui x este însoţită de descreşterea lui y;
e) este plus când valorile lui y sunt mai mari decât media.

4. Dacă valoarea coeficientului de corelaţie este 0, atunci:


a) y descreşte când x creşte;
b) schimbările variabile y explică schimbările variabilei x;
c) toate perechile (xi, yi) se află pe o linie dreaptă;
d) nu există legătură între x şi y;
e) legătura dintre x şi y, dacă există vreuna, nu este liniară.

5. Să se determine coeficientul de corelaţie pentru următorul set de date


bivariate:
xi 1 5 6 5
yi 10 8 9 7

a) –7,2;
b) 7,2;
c) –0,93;
d) 0,64;
e) –0,64.

6. Dacă, utilizând date de la diferite firme, am determinat valoarea coefi-


cientului de corelaţie dintre preţul unui produs şi numărul produselor defec-
te, r = 0,05, atunci:
a) în 5% din cazuri vom face o eroare de genul I, dacă utilizăm coefi-
cientul de corelaţie;
b) în 95% din cazuri valoarea este cuprinsă într-un interval dat de o
abatere medie pătratică de la valoarea adevărată;
c) eroarea de estimaţie în procesul de estimaţie este 0,05;
d) numărul produselor defecte = 0,05 x preţ;
e) preţul nu este un indicator bun pentru calitatea produselor.

261
CAPITOLUL 5

7. Pentru mai multe familii din mediul rural s-au cules şi prelucrat date
privind consumul de gaze naturale şi consumul de energie electrică. În urma
prelucrării datelor, s-a obţinut r = 0,883. Atunci, concluzia este:
a) utilizatorii tind să substituie o formă de energie cu alta;
b) legătura dintre cele două variabile nu este de tip liniar;
c) nu există legătură statistică între cele două variabile;
d) familiile care au consumuri mici de energie electrică, au şi consu-
muri mici de gaze naturale;
e) dacă am construi diagrama de împrăştiere, am constata o împrăş-
tiere a punctelor pe întregul grafic.

8. Dacă pentru variabilele „nota la disciplina: Filosofie“ şi „nota la disci-


plina: Informatică“ se obţine r = -1, este variabila „nota la disciplina: Filo-
sofie“ un predictor bun pentru pregătirea în informatică? Explicaţi.

9. a) Construiţi diagrama de împrăştiere pentru setul de date bivariate (1,1);


(1,2); (2,1); (2,2);
b) Ce tip de legătură se evidenţiază în urma construcţiei graficului? Ce
valoare a coeficientului de corelaţie vă aşteptaţi să obţineţi din
acest set de date?
c) Calculaţi coeficientul de corelaţie şi verificaţi răspunsul de la punc-
tul anterior.

10. Care dintre următoarele afirmaţii nu este adevărată pentru următorul set
de date?
xi 5 0 1 10 0
yi 26 26 26 26 26

a) Ecuaţia de regresie este ŷ i = 26 ;


b) Modificări de variabile x nu determină modificări ale variabilei y;
c) a = 26, b = 0;
d) Presupunerea că y = f(x) este susţinută şi întărită de date;
e) Valorile previzionate ale lui y sunt constante.

11. Un set de date statistice bivariate a fost reprezentat într-o diagramă de


împrăştiere astfel:

262
STATISTICĂ ECONOMICĂ

o x

Fig. 5.3’

Care dintre următoarele presupuneri nu este adevărată?


a) Media abaterilor ei este zero;
b) ŷ i = f (x i ) ;
c) y este o funcţie liniară de x;
d) Abaterile medii pătratice ale lui ei sunt constante;
e) Valorile variabilei x sunt exacte.

12. Dacă producţia (Q) este o funcţie liniară de cantitatea de îngrăşăminte


(F), care dintre următoarele diagrame este cea mai plauzibilă, pentru a
reprezenta producţia în funcţie de cantitatea de îngrăşăminte?

Q Q Q
a) b) c)

o F o F o F

Q Q
d) e)

o F o F

Fig. 5.4’

263
CAPITOLUL 5

13. Un set de 10 observaţii trebuie analizate printr-un model de regresie,


care să arate legătura dintre variabilele X şi Y. Se cunosc:
2 2
¦ x = 31 ; ¦ x = 103 ; ¦ y = 37 ; ¦ y = 445 ; ¦ xy = 75
Să se găsească modelul liniar de regresie.

14. Pentru 10 studenţi dintr-o grupă, s-au înregistrat: timpul afectat


săptămânal studiului individual (ore) şi punctajul obţinut la un test de
verificare a cunoştinţelor:
Tabelul 5.11’
Ore de studiu 25 12 18 26 19 20 23 15 22 8
individual (X)
Punctaj la test (Y) 93 57 55 90 82 95 95 80 85 61

a) Să se reprezinte grafic datele şi să se interpreteze graficul;


b) Să se găsească ecuaţia de regresie care modelează legătura dintre
variabile şi să se interpreteze valorile parametrilor;
c) Să se previzioneze punctajul pe care l-ar obţine un student care alocă
studiului individual 21 de ore pe săptămână;
d) Să se măsoare intensitatea legăturii dintre variabile cu ajutorul unui
indicator adecvat şi să se interpreteze valoarea acestuia;
e) Să se testeze validitatea modelului de regresie folosit;
f) Să se analizeze legătura dintre variabile folosind metode neparametrice.

15. Managerul unei întreprinderi industriale este interesat să afle în ce


măsură numărul anilor pe care un muncitor îl petrece în producţie îi
influenţează productivitatea. Pentru 10 muncitori aleşi aleator se cunosc
datele:
Tabelul 5.12’
Muncitorul 1 2 3 4 5 6 7 8 9 10
Număr de ani în 15 7 19 24 11 16 6 15 20 10
producţie
Număr de piese 110 105 115 127 98 103 87 108 112 106
realizate zilnic

Care dintre următoarele afirmaţii sunt adevărate şi care sunt false:


a) legătura dintre cele două variabile poate fi modelată prin ecuaţia de
regresie: ŷ = 83,15 + 1,63x ;
b) covarianţa dintre X şi Y arată o legătură puternică inversă între ele;

264
STATISTICĂ ECONOMICĂ

c) panta liniei drepte de regresie este 1,63 iar punctul de intersecţie cu Oy


este -83,15;
d) coeficientul de corelaţie este semnificativ pentru o probabilitate de 95%;
e) aproximativ 70% din variaţia numărului zilnic de piese fabricate este
datorată anilor petrecuţi în producţie.

16. Pentru două variabile statistice, între care există o legătură liniară, se
cunosc:
s x2 = 8204 ; cov(x,y) = -3252; y = 40 ; x = 365 .
Să se determine ecuaţia de regresie care modelează legătura dintre cele două
variabile.

17. Pentru variabilele: producţia la hectar şi suprafaţa însămânţată se


cunosc dispersiile: 2424 şi respectiv 3724. Dependenţa dintre cele două
variabile a fost modelată cu ecuaţia de regresie: ŷ = 45 + 0,75x . Coeficientul
de corelaţie are valoarea:
a) 0,93;
b) -0,93;
c) -0,76;
d) +0,76;
e) +0,45.

265
CAPITOLUL 6

CAPITOLUL 6

ANALIZA STATISTICĂ A SERIILOR


CRONOLOGICE
Consideraţii preliminare
În prezentul capitol vom studia conceptul de „serie de timp“, tipurile
acestora, vom învăţa să determinăm principalii indicatori statistici ce carac-
terizează aceste serii. Şi pentru că majoritatea fenomenelor economico-so-
ciale sunt influenţate, în dinamica lor, de o multitudine de factori, vom ve-
dea cum putem modela diversele componente ale unei serii cronologice. În
sfârşit, pe baza dezvoltării trecute şi prezente a fenomenelor, vom putea
estima (prognoza) evoluţia viitoare a acestora.

Termeni cheie
- abateri (devieri) sezoniere brute şi - metoda mediilor mobile
corectate - metoda modificării absolute
- componenta aleatoare - metode analitice de ajustare
- componenta ciclică - metode mecanice de ajustare
- covariaţie - modificare absolută
- covariaţie cu decalaj. - modificare medie absolută
- indicatori absoluţi - nivel mediu
- indicatori medii - prognozare
- indicatori relativi - ritm de dinamică
- indice de dinamică - ritm mediu
- indice mediu - serie cronologică
- indici de sezonalitate bruţi şi - sezonalitate
corectaţi - trend
- medie cronologică - valoarea absolută a unui procent
- metoda indicelui mediu din ritm

266
STATISTICĂ ECONOMICĂ

Noţiuni teoretice

6.1. INTRODUCERE

Dacă nivelurile unei variabile statistice sunt măsurate şi ordonate de-a


lungul timpului, în ordine secvenţială, ele formează o serie cronologică.
Analiza unei serii cronologice urmăreşte să identifice particularităţile
evoluţiei în timp a fenomenelor economico-sociale, astfel încât să ne
permită previzionarea valorilor viitoare ale acestora. În mod practic, există
un număr nelimitat de aplicaţii de acest tip în domeniul economic. Astfel,
guvernul doreşte să cunoască valorile viitoare ale ratei dobânzii, ratei
şomajului şi evoluţia viitoare a costului vieţii; un economist din industria
construcţiilor doreşte să cunoască evoluţia preţurilor la materiale de
construcţii, precum şi a cererii de locuinţe; multe companii doresc să
previzioneze cererea pentru produsele fabricate, precum şi cota lor de piaţă
etc.

Există două tipuri fundamentale de abordări ale procesului de


previzionare: de natură calitativă şi cantitativă. Modele calitative sunt
folosite în special când nu avem la dispoziţie date pentru o perioadă de timp
din trecut, cum ar fi, de pildă, cazul în care departamentul de marketing al
unei firme doreşte să previzioneze vânzările unui produs nou. Metodele
calitative de previzionare (de ex. tehnica Delphi), sunt considerate a avea un
grad ridicat de subiectivism.

Pe de altă parte, metodele cantitative utilizează datele înregistrate de-a


lungul timpului. Scopul utilizării acestor modele este ca, pe baza cunoa]terii
a ceea ce s-a întâmplat până în prezent, să putem previziona forma evoluţiei
viitoare a fenomenelor. Modelele cantitative pot fi divizate la rândul lor [n
modele cauzale – care studiază legătura dintre variabila studiată şi una sau
mai multe variabile independente, ca de pildă analiza regresiei multiple,
modelarea econometrică etc. – şi modele bazate pe serii cronologice – care
se bazează în întregime pe analiza trecută şi prezentă doar a variabilei de
interes. Asupra acestei ultime categorii de metode ne vom îndrepta atenţia în
paragrafele următoare.

267
CAPITOLUL 6

6.2. PARTICULARITĂŢILE ŞI PREZENTAREA SERIILOR CRONOLOGICE

DEFINIŢIE: Seria cronologică (numită şi serie de timp, sau serie dina-


mică) este formată dintr-un şir ordonat de valori ale unei variabile,
înregistrate pentru momente sau intervale de timp succesive.
Simbolic, o serie cronologică se poate scrie:

§1 2 ............. n − 1 n ·
¨ ¸
¨ y y ............ y ¸
© 1 2 n −1 y n ¹

6.2.1. Noţiuni specifice

Dacă termenii unei SCR caracterizează intervale de timp, spunem că ei


sunt mărimi de flux, iar seria cronologică se numeşte SCR de intervale
Dacă termenii unei SCR caracterizează momente de timp, atunci ei sunt
mărimi de stoc, iar seria cronologică este o SCR de momente
Termenii unei SCR de intervale sunt însumabili, ei constituind rezultatul
unei observări statistice continue (pe zile, săptămâni, luni etc.), în timp ce
termenii unei SCR de momente (mărimile de stoc) nu sunt însumabili,
deoarece ei pot conţine elemente (înregistrări) repetate, adică elemente ce se
regăsesc la mai multe momente de timp.
Când intervalele dintre două momente succesive au lungime egală, atunci
vom avea o SCR de momente cu intervale egale între momente, iar atunci
când intervalele dintre două momente vecine au lungime neegală avem o
SCR de momente, cu intervale neegale între momente.

SCR se distinge printr-o serie de particularităţi, trăsături specifice ei,


între care menţionăm:
a) variabilitatea termenilor SCR ;
b) omogenitatea termenilor unei SCR;
c) comparabilitatea termenilor unei SCR ;
d) interdependenţa în timp a termenilor unei SCR.

6.2.2. Reprezentări grafice ale seriilor de timp

Modalităţile de reprezentare grafică ale seriilor cronologice sunt


numeroase şi variate, dintre ele menţionăm:

268
STATISTICĂ ECONOMICĂ

a) CRONOGRAMA (historiograma) – este, aşa cum îi arată şi numele,


reprezentarea grafică tipică, specifică a SCR. Ea se trasează într-un sistem
de axe rectangulare, de obicei în cadranul întâi al acestuia. Pe cele două axe
se vor reprezenta: timpul – pe abscisă (se marchează momentele sau inter-
valele – după cum seria este formată din mărimi de stoc sau de flux), iar
termenii SCR – pe ordonată (fig. 6.1.).

140

120

100
Vanzari (mil.lei)

80
60

40

20

0
1995. 1996. 1997. 1998. 1999. 2000.

Ani

Fig. 6.1 - Cronograma

Termenii seriei cronologice se figurează ca puncte în plan, care se unesc,


de regulă, prin segmente de dreaptă
Diferenţele între SCR de momente şi SCR de intervale se observă şi din
modul de reprezentare grafică (fig. nr. 6.2).

yt yt

yn yn *
*
y3 y3 *
*

y2 y2 *
*
y1 y1 *
*
0 t1 t2 t3 ... tn t 0 t
t1 t2 t3 ... tn
a) b)
Fig. 6.2 - Tipurile unei serii cronologice: a) SCR de momente; b) SCR de intervale

269
CAPITOLUL 6

b) DIAGRAMA PRIN COLOANE – în care timpul se reprezintă pe abscisă,


iar termenii SCR pe ordonată (fig. 6.3).

140
120
100
Vanzari (mil. lei)

80
60
40
20

0
1995. 1996. 1997. 1998. 1999. 2000.
Ani

Fig. 6.3 - Diagramă prin coloane

c) DIAGRAMA PRIN BENZI - este recomandată a se folosi atunci când se


reprezintă (simultan) termenii unor SCR, termeni care constituie nişte indicatori
strâns legaţi între ei (exemplu: venituri-cheltuieli, profit-pierderi, import-
export, etc.) (fig. 6.4).

2000.
1999.

1998.
Ani

1997.

1996.

1995.

-100 -50 0 50 100 150 200


Profit/Pierderi (mil. lei)

Fig. 6.4 – Diagrama prin benzi

270
STATISTICĂ ECONOMICĂ

d. DIAGRAME POLARE (numite şi diagrame radiale sau diagrame în


spirală) se construiesc cu ajutorul reţelelor radiale şi se utilizează în special
în reprezentarea SCR afectate de fluctuaţii sezoniere.

6.3. INDICATORII SERIILOR CRONOLOGICE

Pentru caracterizarea unei SCR, se calculează, pe baza termenilor aces-


teia, un sistem de indicatori statistici, analitici şi sintetici care, după modul
de calcul şi exprimare, pot fi structuraţi astfel:
a) indicatori absoluţi;
b) indicatori relativi;
c) indicatori medii.

Atunci când compararea se face cu primul termen al seriei (y1) vom vorbi
de indicatori cu bază fixă, iar atunci când compararea unui termen (yt) se
face cu termenul imediat anterior (yt-1), vom vorbi de indicatori cu bază în
lanţ (mobilă).

6.3.1. Indicatori absoluţi

Indicatorii absoluţi ai seriilor cronologice sunt:


a) indicatori de nivel – sunt reprezentaţi de fapt de termenii SCR
(valorile individuale ale caracteristicii) şi redau nivelul fenomenului la
intervalele sau momentele de timp considerate {y t }, t = 1, n .
b) modificarea absolută (numită şi creştere/descreştere absolută) se
calculează prin compararea – sub formă de diferenţă – a doi termeni ai
seriei.

După modul de alegere a bazei de comparaţie, putem calcula:


− modificările absolute cu bază fixă:
∆ t / 1 = y t − y1 , t = 2, n (6.1)
− modificările absolute cu bază în lanţ (mobilă):
∆ t / t −1 = y t − y t −1 , t = 2, n (6.2)

Modificarea absolută arată cu câte unităţi s-a modificat (în sensul creş-
terii sau descreşterii) termenul comparat faţă de termenul bază de compa-

271
CAPITOLUL 6

raţie: dacă ∆ > 0, a avut loc o creştere, un spor; dacă ∆ < 0, a avut loc o
descreştere, o scădere.

Între modificările absolute cu bază fixă şi cele cu bază în lanţ există o


serie de relaţii:
k
1) ¦ ∆ t / t −1 = ∆ k / 1 , unde k = 2, 3, ..., n (6.3)
t =2

2) ∆ t / 1 − ∆ t −1 / 1 = ∆ t / t −1 , t = 2, n (6.4)

6.3.2. Indicatori relativi

Indicatorii relativi sunt:


a) indicele de dinamică (indice de modificare, de creştere sau de
scădere), se calculează prin raportarea termenului comparat (curent – yt) la
termenul bază de comparaţie.

— cu bază fixă:
y yt
I t / 1 = t , t = 2, n sau I %
t /1 = ⋅ 100 (6.5)
y1 y1

— cu bază mobilă:
y yt
I t / t −1 = t , t = 2, n sau I %
t / t −1 = ⋅ 100 (6.6)
y t −1 y t −1

Dacă indicele de dinamică are valori supraunitare, atunci spunem că a


avut loc o creştere; dacă ei au valori subunitare, s-a înregistrat o scădere a
fenomenului.

Între indicii cu bază fixă şi cei cu bază mobilă există următoarele relaţii:
1)
k
∏ I t / t −1 = I k / 1 , k = 2, n (6.7)
t =2

272
STATISTICĂ ECONOMICĂ

I t /1
2) = I t / t −1 , t = 2, n (6.8)
I t −1 / 1

b) ritmul de dinamică (ritmul modificării relative, ritmul sporului) se


determină scăzând 100 % din indicele de dinamică exprimat procentual. El
arată cu câte procente s-a modificat (a crescut sau a scăzut) termenul com-
parat faţă de termenul bază de comparaţie.

— cu bază fixă:
∆ t/1
t/1 − 100 = (I t/1 − 1)100 = y ⋅ 100
R t/1 = I % (6.9)
1

— cu bază mobilă:
∆ t / t −1
t/t -1 − 100 = (I t/t -1 − 1)100 = y
R t/t −1 = I % ⋅100 (6.10)
t −1

c) valoarea absolută a unui procent din ritmul de dinamică.A= (6.11)
R%
— cu bază fixă:
∆ ∆ t/1 y
A t/1 = t/1 = = 1 = constant (6.12)
R t/1 ∆ t/1 100 100
%
y1
— cu bază mobilă:
∆ ∆ t/t −1 y
A t/t −1 = t/t −1 = = t −1 (6.13)
R% ∆ t/t −1 100
t/t −1 100
y t −1

EXEMPLUL 6.1. Se consideră evoluţia numărului de personal dintr-o


firmă în perioada 1992-1999 (Tabelul 6.1., col. 1):

273
CAPITOLUL 6

Tabelul 6.1.

Nr. ∆ t/1 ∆ t/t − 1 % %


Ani It/1 It/t-1 R t/1 R t/t − 1 At/1 At/t-1
personal

0 1 2 3 4 5 6 7 8 9
1992 50 0 - 1,0 - 0 - 0,5 -
1993 47 -3 -3 0,94 0,94 -6 -6 0,5 0,5
1994 45 -5 -2 0,9 0,96 -10 -4 0,5 0,47
1995 55 +5 +10 1,1 1,22 +10 +22 0,5 0,45
1996 61 +11 +6 1,22 1,11 +22 +11 0,5 0,55
1997 68 +18 +7 1,36 1,11 +36 +11 0,5 0,61
1998 70 +20 +2 1,4 1,03 +40 +3 0,5 0,68
1999 80 +30 +10 1,6 1,14 +60 +14 0,5 0,70

Folosind datele din Tabelul 6.1, col. 0 şi col. 1, s-au calculat indicatorii
absoluţi şi relativi înscrişi în coloanele 2-9 ale aceluiaşi tabel.

6.3.3. Indicatori medii

a) Nivelul mediu al SCR ( y ) se determină în mod diferit, în funcţie de


tipul acesteia (fig. 6.5).

Tipul seriei
cronologice

momente

Fig. 6.5 - Tipurile de medii utilizate în cazul SCR

• pentru SCR de intervale, nivelul mediu se calculează ca medie


aritmetică simplă,
n

¦y t
y= t =1
(6.14)
n
274
STATISTICĂ ECONOMICĂ

• pentru seriile cronologice de momente, ai căror termeni nu sunt


însumabili, nivelul mediu se calculează ca medie cronologică
¾ pentru cazul seriei cronologice de momente, cu intervale
neegale între momente, considerăm reprezentarea grafică
din fig. 6.6
Nivelul
fenomen. (yt)
yn
yn-1
*
*
y3 *
y4 *

y2 *
y1 *
0 t1 t2 t3 t4 ... tn-1 tn timp (t)
h1 h2 h3 ... hn-1

Fig. 6.6 - Calculul nivelului mediu al unei SCR de momente

Nivelul mediu, ca medie cronologică ponderată, se calculează ca raport


între aria de sub curba graficului şi suma lungimii intervalelor dintre mo-
mente. Aşa cum se observă, aria haşurată din fig. 6.6. se compune ariile a
(n-1) trapeze dreptunghice.
(y + y i+1 ) ⋅ h i
Ai = i (6.15)
2

n −1
¦ Ai (y1 + y 2 )h1 (y 2 + y 3 )h 2 (y 3 + y 4 )h 3 (y n −1 + y n )h n −1
+ + +Λ +
y cr = i =1 = 2 2 2 2 =
n −1 h1 + h 2 + Κ + h n −1
¦ hi
i =1
h h + h2 h + h3 h + h n −1 h
y1 1 + y 2 1 + y3 2 + Λ + y n −1 n − 2 + y n n −1
= 2 2 2 2 2
h1 + h 2 + Κ + h n −1
(6.16)
unde hi = lungimea intervalului dintre momentele ti şi ti+1, i = 1, n − 1 ,
exprimată în unităţi de timp.

275
CAPITOLUL 6

EXEMPLUL 6.2. Se cunosc valorile stocului dintr-un produs, din magazia


unei societăţi comerciale în primele trei trimestre ale anului 1998:

Tabelul 6.2.
Momentul Valoarea stocului
înregistrării stocului (mld. lei)
1.01 10
31.03 15
15.04 7
30.06 20
30.09 25

Valoarea medie a stocului, pe perioada analizată, va fi calculată ca o me-


die cronologică ponderată, deoarece SCR este formată din mărimi de stoc,
iar intervalele dintre momente sunt de lungimi diferite şi anume:
h1 = 3 luni
h2 = 0,5 luni
h3 = 2,5 luni
h4 = 3 luni
S-a considerat că toate lunile au aceeaşi lungime (30 de zile).

3 3,5 3 5,5 3
10 ⋅ + 15 ⋅ + 7 ⋅ + 20 ⋅ + 25 ⋅
y cr = 2 2 2 2 2 = 133,75 = 14,86 mld. lei
9 9
¾ În cazul seriei cronologice de momente, cu intervale egale între
momente, nivelul mediu se calculează ca medie cronologică simplă, ce
reprezintă un caz particular al mediei cronologice ponderate,

h h y1 y
y1 + y 2 h + y3h + Λ + y n −1h + y n + y 2 + Λ + y n −1 + n
ycr = 2 2 = 2 2 (6.17)
(n − 1)h n −1

b) Modificarea medie absolută ( ∆ ) (spor mediu absolut), se determină


ca medie aritmetică simplă a modificărilor absolute cu baza în lanţ, cu rela-
ţia:
n
¦ ∆ t/t −1
∆ n/1 y n − y1
∆ = t =2 = = (6.18)
n −1 n −1 n −1

276
STATISTICĂ ECONOMICĂ

c) Indicele mediu de dinamică ( I ) (de creştere sau de scădere):


n y
I = n −1 ∏ I t/t -1 = n −1 I n/1 = n −1 yn (6.19)
t=2 1

Indicatorul arată, printr-o valoare sintetică, de câte ori s-a modificat, în


medie, nivelul fenomenului analizat, de la un termen la altul, pe orizontul de
timp luat în calcul.

d) Ritmul de dinamică ( R ) (modificare medie relativă, sau spor mediu


relativ, sau rată medie de creştere sau scădere) se calculează scăzând 100 %
din indicele mediu de dinamică exprimat procentual:
( )
R = I % − 100 = I - 1 ⋅ 100 (6.20)

Indicatorul arată cu câte procente creşte sau scade, în medie, nivelul fe-
nomenului analizat, de la o perioadă la alta, pe întregul orizont de timp.

EXEMPLUL 6.3. Pentru SCR din tabelul 6.1., s-au calculat următorii indi-
catori medii:
y − y 92 80 − 50 30
∆ = 99 = = = 4,3 ≈ 4 persoane/an
7 7 7
80
I=7 = 1,07 (107% )
50
R = +7%
Numărul de personal a crescut în perioada analizată, în medie cu 4
persoane pe an, adică de 1,07 ori, ceea ce înseamnă o creştere cu 7 % în
medie, anual.

6.4. COMPONENTELE UNEI SERII CRONOLOGICE

O serie cronologică se poate descompune în una sau mai multe din


următoarele componente:

a) Trendul ( ŷ t ) – reprezintă tendinţa generală, de lungă durată, sau


seculară, ce corespunde unei evoluţii, mişcări generale sistematice,
fundamentale, sesizabile pe perioade lungi de timp, generate de acţiunea

277
CAPITOLUL 6

unor factori cu acţiune de lungă durată (tendinţa de creştere a populaţiei,


tendinţa de creştere a producţiei).

b) Oscilaţiile periodice sezoniere (St) reprezintă fluctuaţii regulate, care


se repetă în cadrul unei perioade complete mai mică sau egală cu un an de
zile.

c) Oscilaţiile periodice ciclice (C) reprezintă fluctuaţii regulate, pe ter-


men mai lung, care pot deveni complete în decursul câtorva ani.

d) Abaterile aleatoare (sau reziduale) (ε t ) , accidentale faţă de linia de


trend, ce apar sub influenţa unor factori imprevizibili, accidentali.
Pentru a reconstitui termenii seriei cronologice, cele patru componente se
pot combina după două modele: aditiv şi multiplicativ.

1) Modelul aditiv de combinare a componentelor unei SCR.


y t = ŷ t + S t + C + ε t t = timpul (6.21)
Dacă nu se dispune de date suficiente pentru identificarea elementului
ciclic, modelul va fi redus la forma:
y t = ŷ t + S t + ε t (6.21’)
Problematica modelării componentei ciclice nu este acoperită de prezenta
lucrare.
Întrucât oscilaţiile sezoniere se repetă identic în fiecare subperioadă j din
cadrul perioadei i (de exemplu: perioada poate fi anul, iar subperioada –
trimestrul), modelul devine:
y ij = ŷ ij + S j + ε ij i = 1, m
(6.21”)
j = 1, p

2) Modelul multiplicativ de combinare a componentelor unei SCR.

y ij = ŷ ij * S′j * ε ij’ i = 1, m
(6.22)
j = 1, p

Alegerea modelului cel mai adecvat de combinare a componentelor ter-


menilor seriei cronologice se face după ce s-a efectuat în prealabil o analiză
complexă a fenomenului în cauză şi a SCR care îl descrie.

278
STATISTICĂ ECONOMICĂ

6.5. ANALIZA STATISTICĂ A TENDINŢEI DE LUNGĂ DURATĂ

Analiza unei SCR debutează cu determinarea trendului (a tendinţei de


lungă durată, sau a tendinţei centrale) a seriei.

DEFINIŢIE: Identificarea trendului ca o serie de valori şi înlocuirea


termenilor reali ai seriei cu valorile trendului obţinute prin diferite modele
se numeşte ajustare (sau netezire a SCR).

Metodele de determinare a trendului SCR se împart în două mari cate-


gorii: metode simple (elementare sau mecanice) şi metode analitice.

6.5.1. Metode mecanice de determinare a trendului

Metodele elementare de determinare a trendului SCR sunt:


a) metoda grafică;
b) metoda mediilor mobile;
c) metoda modificării medii absolute;
d) metoda indicelui mediu de dinamică.

6.5.1.1. Metoda grafică

Metoda grafică de determinare a trendului este o metodă mecanică de


ajustare, prin care se realizează o ajustarea vizuală. Aplicarea ei constă în
unirea – printr-o dreaptă sau curbă – a punctelor extreme ale SCR, astfel
încât abaterile, diferenţele între valorile de pe dreaptă şi valorile reale să fie
minime.

6.5.1.2. Metoda mediilor mobile

Această metodă mecanică constă în înlocuirea termenilor reali ai SCR cu


valori teoretice, numite medii mobile (medii glisante sau alunecătoare).
Mediile mobile se calculează ca medii aritmetice parţiale dintr-un anumit
număr de termeni succesivi ai seriei. Acest număr (p) depinde de periodici-
tatea oscilaţiilor şi este ales astfel încât fiecare medie să cuprindă toţi
termenii la care se manifestă o oscilaţie completă.

279
CAPITOLUL 6

¾ Dacă media mobilă se calculează dintr-un număr impar (de


exemplu, p = 3 de termeni), schema de calcul a mediilor mobile
este următoarea (vezi tab. nr. 6.3.):
Tabelul 6.3.
Calculul mediilor mobile dintr-un număr impar de termeni
Termenii reali ai Medii mobile (MMi)
Valori ajustate
SCR i = 1, n − 2

y1 ½
°
°° y + y 2 + y3
y2 ¾ ½ MM1 = 1
° ° 3 ŷ1 = MM1
° °°
y3 °¿ ¾ ½ y + y3 + y 4
° ° MM 2 = 2 ŷ 2 = MM 2
° °° 3
y4 ¿° ¾
y + y 4 + y5
° MM 3 = 3 ŷ 3 = MM 3
° 3
y5 °¿

yn−2 ½
°
y + y n −1 + y n ŷ n -2 = MM n -2
y n −1
°° MM n − 2 = n − 2
¾ 3
°
°
yn °¿

Numărul de medii mobile obţinut este mai mic decât numărul de termeni
reali ai seriei. Primul şi ultimul termen real nu vor avea corespondent o
valoare ajustată, adică o medie mobilă.
Pentru cazul general, prin această metodă se vor obţine k = n-(p-1) medii
mobile.
¾ Dacă mediile mobile se calculează dintr-un număr par de termeni,
mediile mobile determinate nu se vor plasa în dreptul unor ter-
meni reali ai seriei, deci nu-i pot înlocui, de aceea se impune o
operaţie suplimentară, de centrare a mediilor mobile. Schema de
280
STATISTICĂ ECONOMICĂ

calcul a mediilor mobile în acest ultim caz (pentru p = 4) este


prezentată în tabelul 6.4.:

Tabelul 6.4.
Calculul mediilor mobile dintr-un număr par de termeni
Termenii Medii mobile parţiale (MM) Medii mobile centrate
reali ai SCR (Valori ajustate)
y1 MM1 + MM 2
ŷ1 = =
2
y2 y1 y
y + y2 + y3 + y4 + y 2 + y3 + y 4 + 5
MM 1 = 1 2
y3 4 = 2
4
y + y3 + y4 + y5
MM 2 = 2 MM 2 + MM 3
y4 4 ŷ 2 = =
2
y + y4 + y5 + y6
MM 3 = 3 y2 y
y5 4 + y3 + y 4 + y5 + 6
= 2 2
y + y5 + y6 + y7
MM 4 = 4 4
y6 4 MM 3 + MM 4
ŷ 3 = =
2
y7
y3 y
+ y 4 + y5 + y 6 + 7
= 2 2
.. .. 4
.. .. .
.. ..
.. ..
.

Şi în acest caz, numărul de medii mobile obţinute este mai mic decât
numărul de termeni reali ai seriei. Prima medie mobilă se va plasa în dreptul
p+2
celui de-al -lea termen al seriei. Prin această metodă se vor pierde un
2
număr de „p“ termeni reali.
Metoda mediilor mobile se foloseşte în ajustarea îndeosebi a SCR afec-
tate de factori sezonieri.

EXEMPLUL 6.4. Vânzările trimestriale realizate de o fabrică de jucării


electronice în perioada 1998-2001 se prezintă astfel: (Tabelul 6.5.) (preţuri
comparabile – mld.lei):

281
CAPITOLUL 6

Tabelul 6.5.
Vânzările trimestriale în perioada 1996-1999
Anul
Trimestrul
1998 1999 2000 2001
I 10 11 14 13
II 14 16 18 16
III 11 10 13 9
IV 21 22 22 25

Datele fiind trimestriale, se vor calcula medii mobile din număr par de
termeni (p = 4). Mecanismul de calcul şi mediile mobile parţiale şi finale
sunt prezentate în tabelul 6.6.

Tabelul 6.6.
Termenii Medii mobile Medii mobile
Anul şi trimestrul
SCR parţiale centrate
I 10 –
II 14 –
1996 14
III 11 14,125
14,25
IV 21 14,5
14,75
I 11 14,625
14,5
II 16 14,625
1997 14,75
III 10 15,125
15,5
IV 22 15,75
16
I 14 16,375
16,75
1998 II 18 16,75
16,75
III 13 16,625
16,5
IV 22 16,25
16
I 13 15,5
1999 15
II 16 15,375
15,75
III 9 –
IV 25 –

6.5.1.3. Metoda modificării medii absolute

Foloseşte pentru ajustare, aşa cum îi arată şi numele, un model mecanic


de calcul ce include modificarea medie absolută:
ŷ t = y1 + (t − 1)∆ , t = 2, n (6.23)

282
STATISTICĂ ECONOMICĂ

unde y1 = primul termen al seriei (termenul de bază)


ŷt = valoarea ajustată la momentul „t“.

ŷ1 = y1 + (1 − 1) ⋅ ∆ = y1
y − y1
ŷ n = y1 + (n − 1)∆ = y1 + (n − 1) ⋅ n = yn
n −1

Metoda înseamnă netezirea evoluţiei fenomenului după a linie dreaptă,


care uneşte primul şi ultimul termen observat al seriei cronologice.

6.5.1.4. Metoda indicelui mediu de dinamică

()
ŷ t = y1 I
t −1
, t = 2, n (6.24)

(1−1)
ŷ1 = y1 ⋅ I = y1
n -1
n −1 § y · y
ŷ n = y1 ⋅ I = y1 ¨ n −1 n ¸ = y1 ⋅ n = y n
¨ y1 ¸ y1
© ¹

EXEMPLUL 6.5. Pentru SCR prezentată în tabelul 6.1., s-a calculat


∆ = 4,3 pers şi I = 1,07 . Relaţiile pe baza cărora se efectuează ajustările cu
metoda modificării medii absolute şi cu metoda indicelui mediu de dinamică
sunt:
ŷ t = 50 + 4,3(t − 1), t = 2, n
ŷ t = 50 ⋅ 1,07 ( t −1) , t = 2, n

iar valorile ajustate obţinute sunt prezentate în Tabelul 6.7, coloana 2 şi


respectiv coloana 3.

283
CAPITOLUL 6

Tabelul 6.7.
Determinarea trendului prin metode mecanice

ŷ t ŷ t (y t − ŷ t )2 (y t − ŷ t )2
Anii yt
(∆ ) (I) (∆ ) (I)
0 1 2 3 4 5
1992 50 50 50 0 0
1993 47 54,3 53,5 53,29 42,25
1994 45 58,6 57,24 184,96 149,82
1995 55 62,9 61,25 62,41 39,06
1996 61 67,2 65,54 38,44 20,61
1997 68 71,5 70,13 12,25 4,54
1998 70 75,8 75,04 33,64 25,40
1999 80 80,0 80,0 0 0
TOTAL 384,99 281,68

6.5.2. Metode analitice de determinare a trendului

Metodele analitice oferă o ajustarea mai exactă a SCR decât cele meca-
nice.Funcţiile utilizate mai des în practică pentru ajustarea SCR sunt
funcţiile matematice uzuale: liniară, polinomială, hiperbolă, parabolă,
exponenţială, logistică.
Exemple de funcţii de ajustare se prezintă în fig. 6.7.

y(t) y(t) y(t)

0 t 0 t 0 t
Trend liniar Trend exponenţial Trend parabolic
grad 2
ŷ t = a + bt ŷ t = a ⋅ b t ŷ t = a + bt + ct 2
t

284
STATISTICĂ ECONOMICĂ

Trend hiperbolic Trend logistic


b k
ŷ t = a + ŷ t =
t 1 + e a + bt

Fig. 6.7 - Funcţiile de ajustare a SCR

O dată aleasă funcţia de ajustare, trebuie estimaţi, în continuare, para-


metrii. Estimarea se efectuează prin mai multe metode, dintre care cea mai
utilizată este metoda celor mai mici pătrate (MCMMP)
¦ (y t − ŷ t ) → minim
2
(6.25)
Valorile variabilei timp (t) se măsoară cu ajutorul scalei de interval, ce
prezintă următoarele proprietăţi: originea scalei şi unitatea de măsură pot fi
alese în mod arbitrar. De aceea, pentru a uşura procesul de calcul, valorile
lui „t“ se pot alege convenabil, fie t=1,...,n, fie astfel încât suma lor să fie
zero (Σt = 0). Dacă t se aleg astfel încât Σt = 0, se disting două cazuri:
• SCR este formată dintr-un număr impar de termeni. În acest caz,
originea (t = 0) va fi considerată termenul central, restul termenilor vor avea
valori simetrice faţă de acesta (descrescătoare la stânga termenului central şi
crescătoare la dreapta), astfel:

1995 1996 1997 1998 1999


t
–2 –1 0 +1 +2
• SCR este formată dintr-un număr par de termeni. În acest caz, originea
(t = 0) va fi între cei doi termeni centrali; aceştia vor primi valorile –1 şi
respectiv +1, restul termenilor vor avea valori simetrice faţă de cei centrali
la distanţă de două unităţi, astfel:

1994 1995 1996 1997 1998 1999


t
285
–5 –3 –1 +1 +3 +5
CAPITOLUL 6

6.5.2.1. Modelul liniar

ŷ = a + bt (6.26)

Metoda celor mai mici pătrate pentru estimarea parametrilor modelului


duce la următorul sistem de două ecuaţii normale cu două necunoscute:

­na + b ¦ t = ¦ y t
® 2
(6.27)
¯a ¦ t + b ¦ t = ¦ ty t

Cum ¦ t = 0 , sistemul devine:


­ ¦ yt
° a= =y
­ na = y
¦ t ° n
® Ÿ® (6.28)
°b = ¦ ty t
2
¯b ¦ t = ¦ ty t
°¯ ¦t
2

Se observă că a= y , ceea ce înseamnă că linia de trend trece prin nivelul


mediu. Coeficientul b are valori pozitive dacă trendul este crescător şi valori
negative dacă trendul este descrescător. În cazul în care b=0, avem de-a face

cu o serie cronologică staţionară. În urma ajustării, ¦ y t = ¦ y t .

6.5.2.2. Modelul polinomial

În cazul în care din grafic se observă o tendinţă de evoluţie ce urmează


aproximativ forma parabolei, modelul teoretic este:
ŷ = a + bt + ct 2 (6.29)
şi folosind criteriul de minimizare a sumei pătratelor abaterilor valorilor
ajustate de la valorile observate, rezultă următorul sistem de 3 ecuaţii cu 3
necunoscute (a, b, c):
­na + b ¦ t + c¦ t 2 = ¦ y t
°° 2 3
®a ¦ t + b ¦ t + c¦ t = ¦ ty t
° 2 3 4 2
°¯a ¦ t + b ¦ t + c¦ t = ¦ t y t

286
STATISTICĂ ECONOMICĂ

Prin alegerea convenabilă a valorilor de pe axa timpului avem ¦ t = 0,


3
¦ t = 0 , iar sistemul devine:
­na + c¦ t 2 = ¦ y t
°° 2
®b¦ t = ¦ ty t
° 2 4 2
°¯a ¦ t + c¦ t = ¦ t y t

Prin rezolvarea sistemului se găsesc valorile parametrilor a, b şi c şi


funcţia de ajustare.

Parabola are un singur punct de inflexiune (de maxim sau de minim).


Dacă linia de evoluţie a SCR are mai multe puncte de inflexiune, se poate
folosi, pentru ajustare, o funcţie polinomială de grad superior.

6.5.2.3. Modelul exponenţial

Utilizează modelul teortic de ajustare:


ŷ = a ⋅ b t (6.30)

Pentru estimarea parametrilor modelului, relaţia se logaritmează, obţi-


nându-se o liniarizare a modelului:

log ŷ t = log a + t log b (6.31)

Aplicarea metodei celor mai mici pătrate duce la următorul sistem:

­n log a + log b ¦ t = ¦ log y t


® 2
(6.32)
¯log a ¦ t + log b ¦ t = ¦ t log y t

Cum ¦ t = 0 , sistemul devine:


­ ¦ logy t
° log a =
­n log a = ¦ log y t ° n
® Ÿ ® (6.33)
t log y t
°log b = ¦
2
¯log b ¦ t = ¦ t log y t
¯°
2
¦t
Prin antilogaritmare se determină a şi b.

287
CAPITOLUL 6

Funcţia exponenţială este recomandată a fi utilizată în ajustarea SCR


atunci când termenii acesteia alcătuiesc aproximativ o progresie geometrică.
EXEMPLUL 6.6. Pentru seria cronologică din tabelul 6.1. se va efectua
ajustarea pe baza modelului liniar şi exponenţial. Calculele se prezintă în
tabelul 6.8.

Tabelul 6.8.
Determinarea trendului prin metode analitice
Ani ŷt ŷt
yt t t2 tyt (yt-ŷt)2 lg yt t lg yt (y -ŷ )2
(lin.) (exp.) t t
0 1 2 3 4 5 6 7 8 9 10
1992 50 –7 49 –350 42,84 51,26 1,69897 -11,89 44,36 31,81
1993 47 –5 25 –235 47,6 0,36 1,672 - 8,36 47,98 0,96
1994 45 –3 9 –135 52,36 54,17 1,6532 - 4,96 51,90 47,61
1995 55 –1 1 –55 57,12 4,5 1,74036 - 1,74 56,13 1,27
1996 61 +1 1 +61 61,88 0,77 1,7853 + 1,78 60,71 0,08
1997 68 +3 9 +204 66,64 1,85 1,8325 + 5,50 65,67 5,43
1998 70 +5 25 +350 71,4 1,96 1,8451 + 9,23 71,02 1,04
1999 80 +7 49 +560 76,16 14,74 1,9031 +13,32 76,82 10,11
Total 476 0 168 400 476 129,61 14,13 2,88 98,31

Asupra acestui exemplu sunt de făcut două precizări. Primul vizează


numărul de termeni ai seriei cronologice şi trebuie subliniat că ajustarea se
realizează, în practică, pe baza unei serii cronologice cu un număr mare de
termeni (cel puţin 15). Pentru a uşura exemplificarea metodei de calcul, am
folosit însă un număr mai mic de termni. Cea de-a doua precizare vizează
interpretarea rezultatelor. Cum în acest exemplu este vorba despre număr de
persoane, rezultatele ajustării se vor rotunji la numre întregi.

Pentru modelul liniar:

­ ¦ y t 476
°°a = n = 8 = 59,5 ≈ 60 pers.
®
°b = ¦ ty t = 400 = 2,38
°¯ ¦t
2
168
ŷ t = 59,5 + 2,38t

În medie, numărul anagajaţilor creşte cu 2,38×2=4,76≈5 persoane pe an.

288
STATISTICĂ ECONOMICĂ

Valorile ajustate pe baza modelului liniar se regăsesc în coloana 5 a


tabelului 6.8.
Pentru modelul exponenţial:
¦ lg y t 14,13
lg a = = = 1,76625 Ÿ a = 58,378
n 8
¦ t lg y t 2,88
lg b = 2
= = 0,017 Ÿ b = 1,04
¦t 168
ŷ t = 58,378 ⋅ 1,04 t

În medie numărul angajaţilor creşte de (1,04)2=1,08 ori pe an.


Valorile ajustate pe baza modelului exponenţial sunt calculate în coloana
9 a tabelului 6.8.

6.5.3. Criterii de alegere a celui mai bun model de determinare a


tendinţei seculare

Alegerea celei mai potrivite metode de ajustare ce va fi folosită pentru


previzionare, se face pe baza următoarelor criterii:
a) se alege pe reprezentarea grafică a evoluţiei SCR acea dreaptă (curbă)
trasată pe baza funcţiei de ajustare care este cea mai apropiată de valorile
reale ale SCR
b) se alege drept optimă acea funcţie de ajustare pentru care suma pă-
tratelor diferenţelor dintre valorile ajustate şi cele reale are valoarea minimă
¦ (y t − ŷ t ) → minim
2
(6.34)
c) se alege drept optimă pentru ajustarea SCR acea funcţie pentru care
¦ (y t − ŷ t )
2
→ minim (6.35)
n
sau
¦ yt − ŷ t
→ minim (6.35’)
n

6.6. ANALIZA STATISTICĂ A COMPONENTEI SEZONIERE

De cele mai multe ori, oscilaţiile sezoniere apar ca urmare a influenţei


(succesiunii) anotimpurilor asupra fenomenelor. Factorul sezonier afectează
într-o mai mare măsură nivelul fenomenelor din sfera turismului, industriei

289
CAPITOLUL 6

de conservare, de energie electrică, industria confecţiilor şi încălţămintei, de


rechizite şcolare etc.

6.6.1. Calculul devierilor sezoniere

Dacă influenţa factorului sezonier se manifestă aditiv, atunci


componenta sezonieră se determină sub forma devierilor sezoniere (Sj).

Algoritmul pentru determinarea devierilor sezoniere cuprinde următorii


paşi:
● se elimină din termenii reali ai SCR trendul (prin scădere):

( )
y ij − ŷ ij = ŷ ij + S j + ε ij − ŷ ij = S j + ε ij (6.36)
unde i = 1, n (nr. curent al perioadei)
j = 1, m (nr. curent al subperioadei – sezonului)
● se elimină şi influenţa factorului aleator:

( ) ( )
n n n
¦ y ij − ŷ ij ¦ S j + ε ij ¦ ε ij
i =1 i =1
S′j = = = S j + i =1 ≈ Sj (6.37)
n n n

Valorile „ S’j “ determinate reprezintă estimatori bruţi ai componentei


sezoniere. Dacă trendul a fost determinat cu MCMMP, suma abaterilor
§m ·
sezoniere este nulă ¨¨ ¦ S′j = 0 ¸¸ (abaterile sezoniere se compensează).
© j=1 ¹
n m n m
¦ ¦ y ij = ¦ ¦ ŷ ij (6.38)
i =1 j=1 i =1 j=1

Dacă însă trendul a fost determinat cu metoda mediilor mobile, compen-


sarea abaterilor sezoniere nu are loc în mod obligatoriu şi se trece la pasul
următor.
● din estimatorii bruţi ai devierilor sezoniere se calculează media
acestora

290
STATISTICĂ ECONOMICĂ

m
¦ s′j
j =1
S' = (6.39)
m
● mediile obţinute la pasul anterior se scad din devierile sezoniere brute,
obţinându-se devierile sezoniere corectate (Sj):

S j = S′j − S' (6.40)

● se determină termenii seriei cronologice corectate (adică din care s-a


eliminat influenţa factorului sezonier):
y ij − S j , j = 1, m (6.41)
Seria corectată de sezonalitate va include doar trendul şi abaterile
aleatoare
y ij − S j = ŷ ij + ε ij , i = 1, n
(6.42)
j = 1, m

6.6.2. Calculul indicilor de sezonalitate

Dacă influenţa factorului sezonier se manifestă multiplicativ, atunci


componenta sezonieră ce se va determina îmbracă forma indicilor de sezo-
nalitate ( S*j ).
● se elimină trendul:
y ij
= S*j ⋅ ε ij* (6.43)
ŷ ij
● se calculează medii geometrice pe subperioade (sezoane) ale acestor
rapoarte, eliminându-se astfel influenţa factorului aleator, mărimilor
obţinute numindu-se indici de sezonalitate „bruţi“.

′ n n
S*j = n ∏ S*j ⋅ ε *ij = S*j ⋅ n ∏ ε *ij ≈ S*j (6.44)
i =1 i =1

● dacă produsul indicilor bruţi de sezonalitate diferă de 1 (sau 100 %),


atunci se determină indici de sezonalitate corectaţi

291
CAPITOLUL 6

′ ′
S*j S*j
S*j = = (6.45.)
m *
Sg
m ∏ S*j
j=1

Se obţin, astfel, „m“ indici de sezonalitate. Semnificaţia lui S*j este aceea
că, în fiecare sezon, factorul sezonier deviază valorile reale ale termenilor
SCR de S*j ori de la linia de trend, sau cu ( S*j − 1 )100 procente.

SCR corectată de sezonalitate (desezonalizată) se obţine împărţind terme-


nii reali ai seriei la indicii de sezonalitate.

y ij
= ŷ ij ⋅ ε ij* (6.46)
S*j

EXEMPLUL 6.7. Se vor folosi datele din tabelul 6.5., pentru care s-au
calculat mediile mobile din tabelul 6.6. Pentru analiza sezonalităţii vom
aplica, pe rând, modelul aditiv şi cel multiplicativ.

a) Modelul aditiv
● se elimină din termenii reali yt valorile de trend (ŷt), determinate prin
metoda mediilor mobile. Rezultatele se găsesc în coloana 3 a tabelului 6.9,
începând cu trimestrul III/1996:
(yt- ŷt)III/’96 = 11–14,125 = –3,125 mld. lei
(yt- ŷt)IV/’96 = 21–14,5 = 6,5 mld. lei
etc.
● aceste diferenţe se trec în tabelul 6.10, în care se calculează devierile
sezoniere brute ( S’j ) – coloana 5 – şi corectate (sj) – coloana 6 –.
Devierile sezoniere brute :

292
STATISTICĂ ECONOMICĂ

− 3,125 − 2,375 − 2,5


SI′ = = −2,667 mld.lei
3
1,375 + 1,25 + 0,625
S II′ = = 1,083 mld.lei
3
− 3,125 − 5,125 − 3,625
S III′ = = −3,958 mld.lei
3
6,5 + 6,25 + 5,75
S’IV = = 6,167 mld.lei
3
Media devierilor sezoniere brute:
S’ + S’II + S’III + S’IV − 2,667 + 1,083 − 3,958 + 6,167
S’ = I = = 0,15625
4 4
Devierile sezoniere corectate:

S I = S’I − S = −2,667 − 0,15625 = −2,824 ≅ −3 mld.lei

S II = S’II − S = 1,083 − 0,15625 = 0,927 ≅ 1 mld.lei

S III = S’III − S = −3,958 − 0,15625 = −4,114 ≅ −4 mld.lei

S IV = S’IV − S = 6,167 − 0,15625 = 6,011 ≅ 6 mld.lei
● se calculează termenii SCR desezonalizate, eliminându-se din valorile
termenilor reali devierile sezoniere corectate (coloana 4/tabelul 6.9):
(yt- SI)I/’96 = 10–(–3) = 13 mld. lei
(yt- SII)II/’96 = 14–1 = 13 mld. lei
etc.

Tabelul 6.9.
Trendul SCR corectată
Anul şi
yt (medii yt–ŷt yt–sj
trimestrul
mobile) ŷt (mld. lei)
0 1 2 3 4

I 10 – – 13
II 14 – – 13
1996
III 11 14,125 –3,125 15
IV 21 14,5 6,5 15
I 11 14,625 –3,125 14
II 16 14,625 1,375 15
1997
III 10 15,125 –5,125 14
IV 22 15,75 6,25 16
1998 I 14 16,375 –2,375 17
II 18 16,75 1,25 17

293
CAPITOLUL 6

III 13 16,625 –3,625 17


IV 22 16,25 5,75 16
I 13 15,5 –2,5 16
II 16 15,375 0,625 15
1999
III 9 – – 13
IV 25 – – 19

Tabelul 6.10.
Devieri Devieri
Diferenţe sezoniere
sezoniere sezoniere
Trim.
corectate
1996 1997 1998 1999 brute Sj’
(Sj)
0 1 2 3 4 5 6

I – –3,125 –2,375 –2,5 –2,667 –2,823 ~


–3
II – 1,375 1,25 0,625 1,083 0,927 ~ 1
III –3,125 –5,125 –3,625 – –3,958 –4,114 ~
–4
IV 6,5 6,25 5,75 – 6,167 6,011 ~ 6
Total
S’ = 0,15625

b) Model multiplicativ

• se împart termenii reali (yt) la trend (ŷt) (coloana 3/tabelul


6.11.)
(yt- ŷt)III/’96 = 11: 14,125 = 0,779
(yt- ŷt)IV/’96 = 21: 14,5 = 1,448
etc.
• rapoartele rezultate la pasul anterior se trec în tabelul 6.12, în care se
calculează indicii de sezonalitate bruţi (coloana 5) şi cei corectaţi (coloana
6).
Indicii de sezonalitate bruţi:


S*I = 3 0,779 ⋅ 0,855 ⋅ 0,839 = 0,824

S*II = 3 1,094 ⋅ 1,075 ⋅ 1,041 = 1,07

S*III = 3 0,779 ⋅ 0,661 ⋅ 0,792 = 0,742

S*IV = 3 1,448 ⋅ 1,397 ⋅ 1,354 = 1,399

294
STATISTICĂ ECONOMICĂ

Media indicilor de sezonalitate bruţi:

*
S = 3 0,824 ⋅ 1,07 ⋅ 0,742 ⋅ 1,399 = 0,98

Indicii de sezonalitate corectaţi:

*′
* SI
SI = = 0,84
*
Sg

* S*II
S II = = 1,09
*
Sg

* S*III
S III = = 0,76
*
Sg

* S*IV
S IV = = 1,43
*
Sg
• se calculează termenii SCR corectate, împărţindu-se termenii reali la
indicii de sezonalitate bruţi (coloana 4/tabelul 6.11.);

Tabelul 6.11.
yt Trendul (medii SCR corectată
Anul şi
(mld. mobile) yt / ŷt yt / sj*
trim.
lei.) ŷt (mld. lei)
0 1 2 3 4
I 10 – – 11,9
II 14 – – 12,8
1996
III 11 14,125 0,779 14,5
IV 21 14,5 1,448 14,7
I 11 14,625 0,779 13,1
II 16 14,625 1,094 14,7
1997
III 10 15,125 0,661 13,2
IV 22 15,75 1,397 15,4
I 14 16,375 0,855 16,7
II 18 16,75 1,075 16,5
1998
III 13 16,625 0,782 17,1
IV 22 16,25 1,354 15,4

295
CAPITOLUL 6

I 13 15,5 0,839 15,5


II 16 15,375 1,041 14,7
1999
III 9 – – 12,04
IV 25 – – 17,5

Tabelul 6.12.
Indici de Indici de
Indici de sezonalitate sezonalitate sezonalitate
Trim.
bruţi Sj*’ corectaţi
1996 1997 1998 1999 (Sj*)
0 1 2 3 4 5 6

I – 0,779 0,855 0,839 0,824 0,817


II – 1,094 1,075 1,041 1,07 1,061
III 0,779 0,661 0,782 – 0,742 0,734
IV 1,448 1,397 1,354 – 1,399 1,388
T o t a l *'
S g =0,98

6.7. ANALIZA COMPONENTEI ALEATOARE

În paragraful 6.3. s-au făcut o serie de presupuneri asupra oscilaţiilor de-


terminate de factorii aleatori, în calitatea lor de componente ale seriilor cro-
nologice: media componentei sezoniere este zero în cazul modelului aditiv
şi unu în cazul modelului multiplicativ.
Pe termen lung, ar fi necesară şi observarea valorilor pozitive şi negative
ale componentei sezoniere (în cazul modelului aditiv), respectiv observarea
valorilor sub şi supraunitare (în cazul modelului multiplicativ), întrucât
acestea pot indica existenţa influenţei unor factori ciclici în cadrul mode-
lului.

6.8. COVARIAŢIE. COVARIAŢIE CU ÎNTÂRZIERE

Dintre evoluţiile numeroaselor fenomene economico-sociale, unele pre-


zintă un interes suplimentar atunci când sunt analizate comparativ – două
sau mai multe serii cronologice. Putem exemplifica, astfel: evoluţia preţului
unui produs – privită comparativ cu evoluţia cantităţii vândute; evoluţia im-
portului în paralel cu cea a exportului etc. Altfel spus, este necesară analiza

296
STATISTICĂ ECONOMICĂ

dependenţei, a legăturii dintre evoluţiile în timp a două fenomene. În acest


caz, variabilele luate în studiu sunt:
— variabila cauzală, exogenă, factorială (Xt);
— variabila rezultativă, endogenă, dependentă (Yt);
— variabila timp (t).
Spre deosebire de cele studiate în capitolul 5, aici, între variabila „cauză“
şi variabila „efect“ nu există, de fapt, o legătură reală, ci una care ar putea fi
considerată, mai degrabă, „artificială“. Măsurarea intensităţii unei astfel de
legături se realizează prin indicatorul numit „covariaţie“.
O modalitate de exprimare a covariaţiei este coeficientul de covariaţie
liniară, ce se calculează asemănător cu coeficientul de corelaţie, însă cu con-
ţinut diferit. Relaţia de calcul este:

X t − X Yt − Y
¦ ⋅
C=
sx sy
=
¦ (X t )(
− X Yt − Y ) (6.47)
¦ (X t − X ) (Yt − Y )
n 2 2

Xt − X Yt − Y
unde şi sunt variabilele centrate şi reduse.
sx sy

Coeficientul de covariaţie liniară măsoară intensitatea legăturii variaţiilor


în timp dintre fenomene, luând valori între –1 şi +1. Dacă valorile sale sunt
apropiate de ± 1, atunci legătura liniară dintre variaţiile temporale ale celor
două fenomene este puternică, iar dacă valorile coeficientului tind spre (0),
legătura este slabă.
În anumite cazuri, poate exista legătură între evoluţiile în timp a două
variabile (cauză şi efect), dar între aceste evoluţii să existe din decalaj, un
interval. Altfel spus, cele două evoluţii „se corelează“, dar după un interval
de timp (fig. 6.8).

297
CAPITOLUL 6

x(t)
y(t)
y(t) decalaj (întârziere)
x(t)

Fig. 6.8 - Decalajul dintre evoluţiile a două variabile în timp

6.9. PREVIZIONAREA PE BAZA SERIILOR CRONOLOGICE

Pentru efectuarea previziunilor fenomenului reflectat de SCR, se impune


recombinarea componentelor SCR, după ce acestea au fost în prealabil iden-
tificate şi măsurate, aşa cum s-a arătat în paragrafele anterioare.
În funcţie de modelele de ajustare, extrapolarea se poate face pe seama
următoarelor relaţii:
— în cazul ajustării cu metode mecanice:
∧’
Y t = y1 + (t'−1)∆ (metoda modificării medii absolute) (6.48)
t ' = n + 1, n + k = orizont de previzionare
∧'
Yt = y(I )t'−1 (metoda indicelui mediu ) , (6.49)
t' = n + 1, n + k

— în cazul ajustării cu metode analitice:


∧’
Y t = a + bt ' pentru trend liniar (6.50)
∧’
2
Y t = a + bt '+ct ' pentru trend parabolic (6.51)

298
STATISTICĂ ECONOMICĂ

În cazul SCR afectate de oscilaţii sezoniere (care cuprind date trimes-


triale, lunare etc.), valoarea extrapolată pentru anul „k“ şi sezonul „j“ se de-
termină corectând trendul previzionat cu devierile sezoniere sau cu indicii
de sezonalitate.

299
Serii cronologice

Reprezentare grafică

Cronogramă Diagramă prin coloane Diagramă prin benzi Diagramă polară

Indicatori ai seriilor cronologice

Indicatori absoluţi Indicatori relativi Indicatori medii


• Nivelul seriei • Indice de dinamică • Nivelul mediu al seriei
yt , t= 1, n It/1=yt/y1 Σy t
- serie de intervale y =
• Modificarea absolută It/t-1=yt/yt-1, t= 2, n n
∆t/1=yt-y1 • Ritm de dinamică - serie de momente
∆t/t-1=yt-yt-1, t= 2, n R% h1 h + h2 h + h n −1 h
t / 1 =(It/1-1)100 y1 + y2 1 + ... + y n −1 n − 2 + y n n −1
ycr = 2 2 2 2
R%
t / t −1 =(It/t-1-1)100, t= 2, n h1 + h 2 + ... + h n −1
• valoarea absolută a 1% din • Modificarea medie absolută
ritm n
At/1=y1/100 ¦ ∆ t / t −1
t =2 ∆n / 1
∆= =
At/t-1=yt-1/100, t= 2, n n −1 n −1
• Indicele mediu de dinamică
n
I = n −1 ∏ I t / t −1 = n −1 I n / 1
t =2
• Ritm mediu de modificare
%
R = (I − 1)100

Componente

Denumire Trend Componentă sezonieră Componentă ciclică Componentă reziduală


Tip Sistematică Sistematică Sistematică Nesistematică
Definiţie Tendinţa de Fluctuaţii regulate ce apar Fluctuaţii aproximativ Fluctuaţii reziduale
modificare pe În interiorul unei perioade regulate ce apar la (întâmplătoare), care
termen lung de 12 luni şi se repetă an intervale de timp mai mari rămân după evidnţierea
de an de 1 an de zile celorlalte componente
Factori de Schimbări în Condiţii climaterice, Interacţiunea unor factori Evenimente neprevăzute
influenţă populaţie, obiceiuri religioase, ce influenţează economia (greve, inundaţii, războaie,
tehnologie, sociale etc. etc.) sau variaţii aleatoare
educaţie, nivel ale datelor
de trai, etc.
Durată Un număr mare Mai mică sau egală cu 12 De obicei 2-10 ani Durată scurtă şi care nu se
d t i l i tă

Modelare

Previzionare

300
Seria are componentă sezonieră

Modelare componentă sezonieră

Model aditiv Model multiplicativ


∧ ∧
y t = y t + St + C t + ε t y t = y t ⋅ St ⋅ C t ⋅ ε t

Devieri sezoniere Indici de sezonalitate


Sj Sj*

Desezonalizare Desezonalizare
∧ ∧
y t + ε t = y t − St y t ⋅ ε t = y t / St

Modelare trend

Metode mecanice Metode analitice


• Metoda grafică
• Metoda mediilor glisante
• Metoda modificării medii absolute

301
CAPITOLUL 6

Întrebări recapitulative

1. Cum definiţi o serie cronologică?


2. Care sunt particularităţile şi tipologia seriilor cronologice?
3. Cum se reprezintă grafic o serie cronologică?
4. Cum se calculează o medie cronologică?
5. Care sunt componentele unei serii cronologice?
6. Prezentaţi indicatorii absoluţi ce caracterizează o serie cronologică.
7. Indicatorii relativi ai seriei cronologice: definiţie, mod de calcul, sem-
nificaţie.
8. Cum se determină indicele de modificare a unei variabile statistice?
9. Cum se determină ritmul de modificare a unei variabile statistice?
10. Ce reprezintă tendinţa seculară a unei serii cronologice?
11. Ce indicatori medii ai unei serii cronologice cunoaşteţi? Cum se cal-
culează şi ce semnificaţie au valorile obţinute?
12. Modelul aditiv şi modelul multiplicativ de combinare a componen-
telor unei serii cronologice.
13. Ce reprezintă ajustarea seriei cronologice?
14. Cum se determină trendul unei SCR, folosind metode mecanice?
15. Utilizarea metodelor analitice de determinare a trendului SCR.
16. Care sunt criteriile de apreciere a calităţii ajustării?
17. Descrieţi metoda mediilor mobile.
18. Cum se studiază sezonalitatea unei SCR? Particularizaţi pentru un
model aditiv şi pentru unul multiplicativ.
19. Metodele de extrapolare pe baza datelor unei SCR.
20. Definiţi conceptul de autocovariaţie şi autocovariaţie cu decalaj.

302
STATISTICĂ ECONOMICĂ

Teste de autoevaluare

1. Se cunosc următoarele date privind producţia lunară de lapte de vacă


obţinută la o fermă în primele trei luni ale anului 2000:
Tabelul 6.1’
Luna Modificarea producţiei de lapte faţă de luna
anterioară (litri)
0 1

februarie +1889
martie +2000
aprilie +1102
mai -500
iunie 0
iulie +1203
august +1000
septembrie +1150

Ştiind că în luna septembrie faţă de luna ianuarie 2000 producţia de


lapte a crescut cu 94,62%, se cere:
a) Să se reconstituie seria cronologică de valori absolute;
b) Să se reprezinte grafic seria reconstituită;
c) Să se calculeze sistemul de indicatori ce caracterizează seria;
d) Să se ajusteze seria cronologică folosind metode mecanice şi analitice;
e) Pe baza celei mai bune metode de ajustare, să se previzioneze producţia
de lapte pentru lunile octombrie, noiembrie şi decembrie 2000.

2. Despre numărul spitalelor din sectorul public în România, în perioada


1990-1998, se cunosc datele:
Tabelul 6.2’
Anul 1991 1992 1993 1994 1995 1996 1997 1998
Modificarea numărului +0,95 +0,70 +0,70 -4,20 -0,70 +0,24 +0,73 -0,48
de spitale faţă de anul
precedent (%)

Ştiind că în 1996 faţă de 1995 valoarea absolută a unui procent din


ritm a fost de 4,12 spitale, se cere:
a) Să se calculeze indicii de dinamică cu bază fixă şi cu bază în lanţ;
b) Să se reconstituie seria de valori absolute şi să se reprezinte grafic;
c) Să se calculeze şi interpreteze indicatorii medii ai seriei cronologice.

303
CAPITOLUL 6

3. Se dă producţia realizată de o fabrică de încălţăminte în perioada 1993-


2001 (mii perechi):

Tabelul 6.3’
Anul 1993 1994 1995 1996 1997 1998 1999 2000 2001
Producţie de încălţăminte 10 12 18 20 30 25 21 16 14
(mii perechi)

a) Să se reprezinte grafic datele şi să se identifice tipul seriei;


b) Să se ajusteze seria, folosind o metodă adecvată;
c) Să se previzioneze nivelul producţiei de încălţăminte din anul 2002.

4. Într-o întreprindere producătoare de televizoare, în perioada 1996-2000


numărul televizoarelor fabricate a crescut în medie pe an cu 25%. Ştiind că
în 2000 producţia de televizoare a devansat-o cu 75% pe cea din 1998 şi că
în 1996 ea a fost cu 1200 bucăţi mai mică decât cea din 1998, să se afle cu
câte bucăţi s-a modificat în medie pe an producţia de televizoare a
întreprinderii, în perioada analizată.

5. Într-o fabrică de conserve producţia de conserve de legume a crescut de la


40 mii tone în 1992 la 120 mii tone în 2000. În ipoteza că evoluţia
producţiei de conserve de legume se poate ajusta prin metoda indicelui
mediu de dinamică şi că în perioada următoare se va menţine aceeaşi
tendinţă de evoluţie, să se determine în ce an producţia de conserve de
legume va fi cu 200% mai mare decât în anul 2000.

6. Situaţia numărului de blocuri aflate în construcţie şi neterminate dintr-un


oraş mare, în decursul anului 2001 este:
Tabelul 6.4’
Data Număr de blocuri în construcţie
0 1
1.01.2000 120
20.03.2000 115
10.05.2000 110
25.07.2000 102
1.10.2000 114
31.12.2000 108

Să se determine numărul mediu de blocuri aflate în construcţie în anul 2001.

304
STATISTICĂ ECONOMICĂ

7. Termenii unei serii cronologice de momente:


a) sunt mărimi de stoc;
b) sunt însumabili;
c) sunt mărimi de flux;
d) nu sunt însumabili;
e) admit doar relaţia de produs.

8. Nivelul mediu al unei serii cronologice de momente inegal distanţate


unele de altele se calculează:
a) ca medie aritmetică ponderată;
b) ca medie geometrică simplă sau ponderată;
c) ca medie cronologică simplă;
d) ca medie aritmetică simplă;
e) ca medie cronologică ponderată.

9. Fie următoarele proprietăţi:


I: variabilitate;
II: omogenitate;
III: normalitate;
IV: comparabilitate;
V: independenţă;
VI: interdependenţă.
O serie cronologică se caracterizează prin proprietăţile:
a) I, II, IV, VI;
b) I, II, III, IV, V;
c) I, III, IV, VI;
d) II, III, IV, VI;
e) nici o combinaţie anterioară nu este corectă.

10. Prin însumarea modificărilor absolute cu bază în lanţ a primilor k ter-


meni ai unei serii cronologice se obţine:
a) indicele de dinamică cu bază fixă a ultimului termen (k) faţă de primul;
b) un indice de dinamică cu bază în lanţ;
c) modificarea absolută cu bază fixă a termenului k faţă de primul;
d) modificarea relativă cu bază fixă a termenului k faţă de primul;
e) nivelul mediu al seriei cronologice.

11. Prin raportarea a doi indici de dinamică cu bază fixă, pentru două peri-
oade succesive, se obţine:

305
CAPITOLUL 6

a) indicele de dinamică cu baza în lanţ;


b) modificarea absolută cu bază fixă;
c) modificarea relativă cu bază în lanţ;
d) ritmul cu bază în lanţ;
e) modificarea absolută cu bază în lanţ.

12. Valoarea absolută a unui procent din ritmul de dinamică cu bază fixă:
a) se calculează ca raport între modificarea absolută şi cea relativă
procentuală cu bază fixă;
b) se calculează ca raport între modificarea absolută cu bază în lanţ şi cea cu
bază fixă;
c) este o valoare constantă, şi anume egală cu a suta parte a primului termen
al seriei cronologice;
d) este o valoare constată, şi anume egală cu a suta parte a ultimului termen
al seriei cronologice;
e) notă cu câte procente s-a modificat fenomenul la momentul/intervalul de
timp curent faţă de cel bază de comparaţie.

13. În cazul metodei mediilor mobile aplicate unei serii cronologice din n
termeni medii, mobile calculate dintr-un număr impar (p) de termeni ai
seriei, se pierd:
a) p termeni reali;
b) p-1 termeni reali;
c) n-p termeni reali;
p +1
d) termeni reali;
2
n +1
e) termeni reali.
2

14. Care dintre următoarele afirmaţii privind metoda modificării medii absolute
nu este adevărată:
a) primul şi ultimul termen ajustat cu această metodă diferă de primul şi
ultimul termen real al seriei cronologice;
b) se aplică în orice situaţie, indiferent de valorile pe care le iau termenii
seriei;
c) se aplică atunci când modificările absolute cu bază în lanţ sunt apro-
ximativ egale;
d) se aplică atunci când seria cronologică formează o progresie aritmetică;

306
STATISTICĂ ECONOMICĂ

e) se aplică atunci când modificările absolute cu bază fixă sunt aproximativ


egale între ele.

15. Despre valoarea câştigurilor salariale medii dintr-o unitate economică se


cunosc datele:
Tabelul 6.5’
Ani Modificarea relativă faţă de anul precedent
(%)
0 1

1995 +4,2
1996 -1,2
1997 +22,4
1998 +5,8
1999 -9,1
2000 +5,0

Ştiind că în anul 1999, câştigul medie salarial a fost cu 30 mii lei mai mare
decât în anul 1996 (preţuri constante), atunci creşterea medie anuală a fost
de:
a) 4%;
b) 10,35 mii lei;
c) 7,47 mii lei;
d) 1,75%;
e) 2,5%

16. Numărul personalului unei întreprinderi din domeniul aviaţiei a evoluat


astfel:
Tabelul 6.6’
Data Nr. personal (pers.)
01.01.2000 1500
15.03.2000 1250
01.04.2000 975
15.05.2000 1000
01.07.2000 925

Numărul mediu al personalului pe semestrul I 2000 a fost:


a) 1000 persoane;
b) 1153 persoane;
c) 998 persoane;
d) 1125 persoane;
e) 1200 persoane.
307
CAPITOLUL 6

Observaţie: Se consideră luna de 30 zile.

17. Cifra de afaceri a unei societăţi comerciale a evoluat în perioada 1991-


2000 conform funcţiei de trend ŷ t = 12 ⋅1,25 t (în condiţiile în care ¦ t = 0 ).
Previziunile cifrei de afaceri pentru anii 2001, 2002 şi 2003 sunt:
a) 120, 150, 187,5;
b) 139,7; 218,3; 341,06;
c) 242,15; 302,7; 378,36;
d) 150,2; 203,9; 220,0;
e) nici una dintre variantele anterioare.

308
STATISTICĂ ECONOMICĂ

Răspunsurile testelor de autoevaluare

1.
∆ ∆ 9 / 1 ⋅100 7844 ⋅100
a) R9%/ 1 = 9 / 1 ⋅100 = 94,62 Ÿ y1 = = = 8290 lit
y1 R9%/ 1 94,62
ri
9
¦ ∆ t / t −1 = ∆ 9 / 1 = 7844 litri
t =2

∆ 2 / 1 = y 2 − y1 Ÿ y 2 = y1 + ∆ 2 / 1 = 8290 + 1889 = 10179 litri


etc.

b) Reprezentarea grafică (cronograma) este redată în fig. 6.1’.

Evolutia productiei de lapte in primele trei trimestre ale


anului 2000

18000
16000
14000
Productie (litri)

12000
10000
8000
6000
4000
2000
0
ian. feb. mar apr mai iun iul aug sept
Luna

Fig. 6.1’

c) Sistemul de indicatori
c1) Indicatorii absoluţi

• modificarea absolută cu bază fixă


∆ t / 1 = y t − y1 (col. 2 tabelul 6.7’)

309
CAPITOLUL 6

• modificarea absolută cu bază în lanţ


∆ t / t −1 = y t − y t −1 (col. 1 tabelul 6.7’)

c2) Indicatorii relativi

• indicele de dinamică cu bază fixă


y
I t%/ 1 = t ⋅100 (col. 3 tabelul 6.7’)
y1

• indicele de dinamică cu bază în lanţ


y
I t%/ t −1 = t ⋅ 100 (col. 4 tabelul 6.7’)
y t −1

• ritmul de modificare (modificarea relativă) cu bază fixă


Rt / 1 = (I t / 1 − 1)100 = I t%/1 − 100 (col. 5 tabelul 6.7’)

• ritmul de modificare (modificarea relativă) cu bază în lanţ


Rt / t −1 = ( I t / t −1 − 1)100 = I t%/ t −1 − 100 (col. 6 tabelul 6.7’)

• valoarea absolută a unui procent din ritmul de modificare cu bază


fixă
∆ y
At / 1 = t / 1 = 1 =82,9 litri
R % 100
t /1

• valoarea absolută a unui procent din ritmul de modificare cu bază


în lanţ

∆ t / t −1 y
At / t −1 == = t −1 (col. 7 tabelul 6.7’)
Rt%/ t −1 100

310
STATISTICĂ ECONOMICĂ

c3) Indicatorii medii

• nivelul mediu al seriei cronologice:

¦ y t 114593
y= = = 12732,5 litri
n 9
În medie, în perioada analizată, producţia lunară de lapte a fost de
12732,5 litri.

• modificarea medie absolută:

∆ n / 1 7844
∆= = = 980,5 litri
n −1 8

În medie, în perioada analizată, producţia de lapte a crescut pe lună


cu 980,5 litri.

• indicele mediu de modificare

I = n −1 I n / 1 = 8 1,9462 = 1,087 (108,7%)

Producţia de lapte a crescut în medie de la o lună la alta de 1,087.

• ritmul mediu de modificare

( )
R = I − 1 ⋅100 = (1,087 − 1)100 = +8,7%

Producţia de lapte a crescut în medie de la o lună la alta cu 8,7%.


Tabelul 6.7’
Luna Producţia de ∆ t /1 I t%/ 1 I t%/ t −1 Rt%/ 1 Rt%/ t −1 At/t−1
lapte (yt) (litri)
(litri)
0 1 2 3 4 5 6 7
ian. 8290 0 1,0 - 0 - -
feb. 10179 1889 1,23 1,23 23 23 82,9
mar. 12179 3889 1,47 1,20 47 20 101,79
apr. 13281 4991 1,60 1,09 60 9 121,79
311
CAPITOLUL 6

mai 12781 4491 1,54 0,96 54 -4 132,81


iun. 12781 4491 1,54 1,00 54 0 127,81
iul. 13984 5694 1,69 1,09 69 9 127,81
aug. 14984 6694 1,81 1,07 81 7 139,84
sept. 16134 7844 1,95 1,08 95 8 149,84
Total 114.593 - - - - - -

d)
d1) Ajustarea prin metode mecanice

Metoda modificării medii absolute

yˆ t = y1 + (t − 1) ⋅ ∆
yˆ t = 8290 + 980,5(t − 1) ; t = 1,9

Metode indicelui mediu de dinamică

yˆ t = y1 ⋅ I ( )t −1
ŷ t = 8290 ⋅ (1,087 )t −1 ; t = 1,9

Valorile ajustate se găsesc în col. 2 şi col. 4, tabelul 6.8’.


Pentru alegerea celei mai bune metode de ajustare s-a ales criteriul:
(
¦ y t − ŷ t )
2
→ min im

Se compară valorile criteriului corespunzătoare celor două metode


de ajustare, din coloanele 3 şi 5 ale tabelului 6.8’ şi se obţine că mai
potrivită este metoda modificării medii absolute.

Tabelul 6.8’
Luna yt ŷ t (metoda
modificării
(yt- ŷ t ) 2
ŷ t (metoda
indicelui mediu)
(y t − yˆ t )
2

medii abs.)
0 1 2 3 4 5
ian. 8290 8290,0 0 8290,00 0
feb. 10179 9270,5 825.372,25 9011,23 1.363.686,70

312
STATISTICĂ ECONOMICĂ

mar. 12179 10251,0 3.717.184,00 9795,21 5.682.454,70


apr. 13281 11231,5 4.200.450,20 10647,40 6.935.848,90
mai 12781 12212,0 323.761,00 11573,71 1.457.549,10
iun. 12781 13192,5 169.332,25 12580,62 40.152,14
iul. 13984 14173,0 35.721,00 13675,14 95.394,50
aug. 14984 15153,5 28.730,25 14864,87 14.191,96
sept. 16134 16134,0 0 16134,00 0
Total 114.593 9.300.550,80 15.589.276,00

d2) Ajustarea prin metode analitice

Metoda trendului liniar

yˆ t = a + bt Cum Σ t = 0
­ ¦y
° a = = y = 12732,5
­°na + b ¦ t = ¦ y ° n
® Ÿ® litri
°̄a ¦ t + b ¦ t 2 = ¦ ty °b = ¦ ty 48901
= = 815,0
°¯ 2 60
¦t

Calculele intermediare se găsesc în tabelul 6.9’


Tabelul 6.9’
Luna
0
yt
1
t
2
tyt
3
t2
4
ŷ t
5
(y t − yˆ t
6
)
2

ian. 8290 -4 -33.160 16 9472,5 1.398.306,20


feb. 10179 -3 -30.537 9 10.287,5 11.772,25
mar. 12179 -2 -24.358 4 11.102,5 1.158.852,20
apr. 13281 -1 -13.281 1 11.917,5 1.859.132,20
mai 12781 0 0 0 12.732,5 2.352,25
iun. 12781 1 12.781 1 13.547,5 587.522,25
iul. 13984 2 27.968 4 14.362,5 143.262,25
aug. 14984 3 44.952 9 15.177,5 37.442,25
sept. 16134 4 64.536 16 15.992,5 20.093,06
Total 114.59 0 48.901 60 5.218.734,60
3

yˆ t = 12732,5 + 815 ⋅ t

313
CAPITOLUL 6

Valorile ajustate se găsesc în coloana 5, tabelul 6.9’, iar valoarea criteriului


în coloana 6, tabelul 6.9’.
Dintre toate metodele de ajustare, metoda trendului liniar este cea mai
adecvată, deoarece pentru această metodă valoarea criteriului este minimă.

e) Vom efectua previzionarea producţiei de lapte pentru lunile octombrie,


noiembrie şi decembrie 2000 prin metoda modificării medii absolute şi
metoda trendului liniar.

- prin metoda modificării medii absolute:


yˆ1 0 = yˆ 9 + 980,5 = 16134 + 980,5 = 17114,5 litri
yˆ11 = yˆ10 + 980,5 = 17114,5 + 980,5 = 18095 litri
yˆ1 2 = yˆ11 + 980,5 = 18095 + 980,5 = 19075,5 litri

- prin metoda trendului liniar:


yˆ10 = 12732,5 + 980,5 ⋅ 5 = 16807,5 litri (pentru t = 5)
yˆ11 = 12732,5 + 980,5 ⋅ 6 = 17622,5 litri (pentru t = 6)
yˆ1 2 = 12732,5 + 980,5 ⋅ 7 = 18437,5 litri (pentru t = 7)

2.
a) În tabelul 6.2’ este dat ritmul cu bază în lanţ (Rt/t-1). De aici rezultă indicii
de dinamică cu bază în lanţ:

I t%/ t −1 = Rt%/ t −1 + 100 (col. 2, tabelul 6.10’)

Pentru calculul indicilor cu bază fixă, se foloseşte relaţia:

k
∏ I t / t −1 = I k / 1
t =2

I 91 / 90 ⋅ I 92 / 91 = I 92 / 90

I 91 / 90 ⋅ I 92 / 91 ⋅ I 93 / 92 = I 93 / 90
etc.

314
STATISTICĂ ECONOMICĂ

Aceşti indici sunt calculaţi în col. 3, tabelul 6.10’.

Tabelul 6.10’
Ani
Rt%/ t −1 It/t-1 It/1 yt
0 1 2 3 4

1990 - - 1,0 423


1991 +0,95 1,0095 1,0095 427
1992 +0,70 1,0070 1,0166 430
1993 +0,70 1,0070 1,0237 433
1994 -4,20 0,9580 0,9807 415
1995 -0,70 0,9930 0,9738 412
1996 +0,24 1,0024 0,9762 413
1997 +0,73 1,0073 0,9833 416
1998 -0,48 0,9952 0,9786 414
Total - - - 3783
y
b) A96 / 95 = 95 = 4,12 Ÿ y 95 = 412 spitale
100
y 95 y 412
I 95 / 94 = Ÿ y 94 = 95 = = 415 spitale
y 94 I 95 / 94 0,993
etc.

Valorile absolute sunt redate în col. 4, tabelul 6.10’.


Reprezentarea grafică (cronograma) este redată în fig. 6.2’.

Evolutia numarului de spitale din Romania in perioada 1990-


1998

440
430
Spitale

420
410
400
1990. 1991. 1992. 1993. 1994. 1995. 1996. 1997. 1998.

Ani

Fig. 6.2’

315
CAPITOLUL 6

c) Indicatorii medii

• nivelul mediu al seriei cronologice:

y1 y
+ y 2 + ... + y 8 + 9
y= 2 2 = 3364,5 = 420,56 ≈ 421 spitale
9 −1 8

În medie, în perioada analizată, există un număr de 421 spitale pe an.

• modificarea medie absolută:

∆ n / 1 y 9 − y1
∆= = = −1,125 spitale/an
n −1 9 −1

Numărul de spitale s-a redus în medie de la un an la altul cu 1,125,


în perioada analizată.

• indicele mediu de dinamică

y9
I = n −1 I n / 1 = 8 = 0,9973 (99,73%)
y1

Numărul spitalelor s-a redus în medie de la un an la altul de 0,9973 ori.

• ritmul mediu de dinamică

( )
R = I − 1 ⋅ 100 = (0,973 − 1)100 = −0,27%

Numărul spitalelor a scăzut în medie de la un an la altul cu 0,27%, în


perioada studiată.

3.
a) Seria cronologică prezentată în tabelul 6.3’ este o serie de flux (de
intervale). Ea se va reprezenta grafic prin cronogramă (fig. 6.3’)

316
STATISTICĂ ECONOMICĂ

Evolutia productiei de incaltaminte in perioada 1993-2001

35

30
Productie (mii perechi)

25

20

15

10

0
1993. 1994. 1995. 1996. 1997. 1998. 1999. 2000. 2001.

Anul

Fig. 6.3’

b) Aşa cum se observă din grafic, se poate folosi pentru ajustare un trend
parabolic (polinom de gradul doi).

yˆ t = a + bt + ct 2

3
Cum ¦ t = 0 , şi ¦ t = 0 , sistemul devine:

­9a + 60c = 166


°
®60b = 39
°60a + 708c = 837
¯

În urma rezolvării sistemului, rezultă: a = 24,28; b = 0,65; c =- 0,875.


Ecuaţia de ajustare este:

yˆ t = 24,28 + 0,65t − 0,875t 2

Calculele intermediare şi valorile ajustate sunt redate în tabelul 6.11’.

¦ ( y t − yˆ t ) = 62,77 (col. 8 tabelul 6.11’)


2

317
CAPITOLUL 6

Tabelul 6.11’
Ani yt t t2 t4 ty t2y ŷ t (y t − ŷ t )2
0 1 2 3 4 5 6 7 8

1993 10 -4 16 256 -40 160 7,680 5,38


1994 12 -3 9 81 -36 108 14,455 6,03
1995 18 -2 4 16 -36 72 19,480 2,19
1996 20 -1 1 1 -20 20 22,755 7,59
1997 30 0 0 0 0 0 24,280 32,72
1998 25 1 1 1 25 25 24,055 0,89
1999 21 2 4 16 42 84 22,080 1,17
2000 16 3 9 81 48 144 18,355 5,55
2001 14 4 16 256 56 224 12,880 1,25
Total 166 0 60 708 39 837 62,77

c) Pentru anul 2002, t = 5

yˆ t = 24,28 + 0,65 ⋅ 5 − 0,875 ⋅ 5 2 = 5,655 mii perechi

4.
y 00 y
R = +25% Ÿ I = 1,25 = 4 Ÿ 00 = 1,25 4 = 2,44
y 96 y 96

­ y 00 = 2,44 ⋅ y 96
°
® y 00 = 1,75 ⋅ y 98
° y = y − 1200
¯ 96 98

Din rezolvarea sistemului rezultă:

y 96 = 3000 bucati
y 98 = 4200 bucati
y 00 = 7320 bucati

318
STATISTICĂ ECONOMICĂ

y 00 − y 96 7320 − 3000
∆= = = +1080 bucati/an
4 4

5.
y 92 = 40 mii tone
y 00 = 120 mii tone
y 00 120
I =8 =8 = 1,1472
y 92 40

Fie t anul în care producţia va fi de trei ori mai mare decât în anul 2000, şi yt
- producţia în anul t.

t t
y t = 3 ⋅ y 00 = y 00 ⋅ I Ÿ I = 3

t lg 3 0,477
lg I = lg 3 Ÿ t = = =8
lg 1,1472 0,0596

Aşadar, anul în care producţia va fi de trei ori mai mare decât în anul 2000
este anul 2008.

6.
Deoarece seria cronologică din tabelul 6.4’ este o serie de momente
cu intervalele neegale între momente, nivelul mediu se va calcula ca medie
cronologică ponderată.

t1 t +t t +t t +t t +t t
y1 + y 2 1 2 + + y3 2 3 + + y 4 3 4 + + y5 4 5 + y 6 5
y cr 2001 = 2 2 2 2 2 2
t1 + t 2 + t 3 + t 4 + t 5

unde yi sunt termenii seriei şi ti sunt lungimile intervalelor (în zile) dintre
două momente succesive.

319
CAPITOLUL 6

t1 = 78 zile
t2 = 51 zile
t3 = 76 zile
t4 = 68 zile
t5 = 92 zile

5
∑ t i = 365 zile
i =1

78 78+51 51+ 76 76+ 68 68+92 92


120⋅ +115⋅ +110⋅ +102⋅ +114⋅ +108⋅
ycr2001= 2 2 2 2 2 2 =111
365
blocuri

7. a), d)

8. e)

9. a)

10. c)

11. a)

12. a), c)

13. d)

14. a), b), e)

15. a), c)

16. b)

17. b)

320
STATISTICĂ ECONOMICĂ

Teste propuse spre rezolvare

1. Lungimea drumurilor judeţene modernizate din România, în perioada


1996-2001 este următoare:
Tabelul 6.13’
Anul 1996 1997 1998 1999 2000 2001
Lungimea drumurilor 4109 4212 4325 4416 4491 4633
judeţene modernizate (km)

a) Să se identifice tipul seriei şi să se reprezinte grafic;


b) Să se calculeze sistemul de indicatori ai seriei;
c) Să se ajusteze seria cronologică folosind metode mecanice şi analitice;
d) Pe baza celei mai bune metode de ajustare, să se previzioneze lungimea
drumurilor judeţene modernizate în anul 2003.

2. Despre producţia de ţesături a unei fabrici textile, în perioada 1994-2001


se cunosc datele:
Tabelul 6.14’
Anul 1995 1996 1997 1998 1999 2000 2001
Sporul producţiei de ţesături 88 102 115 100 90 111 120
faţă de anul 1994 (mil. mp)

Ştiind că în anul 1998 faţă de 1997 valoarea absolută a unui procent din
ritmul de modificare a producţiei a fost 2,5 mil. mp, se cere:
a) Să se calculeze modificările absolute cu bază în lanţ;
b) Să se reconstituie seria de valori absolute şi să se reprezinte grafic;
c) Cu câte milioane mp şi respectiv cu câte procente s-a modificat
producţia de ţesături în medie pe an, în perioada analizată?
d) Să se ajusteze evoluţia producţiei de ţesături folosind metode mecanice
şi analitice adecvate. Alegeţi-o pe cea mai potrivită.
e) Să se previzioneze nivelul producţiei de ţesături în anul 2002 şi 2003,
dacă ea va evolua în continuare conform aceleiaşi tendinţe.

3. Situaţia cărţilor existente într-o bibliotecă în decursul semestrului I al


anului 2001 este următoarea:

321
CAPITOLUL 6

Tabelul 6.15’
Data Număr de cărţi din bibliotecă (mii exemplare)
0 1
1.01.2001 10
15.03.2001 12
20.04.2001 20
12.05.2001 19
30.06.2001 25

a) Determinaţi tipul seriei;


b) Reprezentaţi grafic datele;
c) Calculaţi numărul mediu de cărţi existente în bibliotecă în semestrul I
2001.

4. În perioada ianuarie 2000 - august 2000 producţia de celuloză şi hârtie a


unei fabrici a crescut în medie pe lună de 1,65 ori, iar în perioada august
2000 - februarie 2001 ea s-a modificat în medie de la o lună la alta cu 20%.
Cu câte procente s-a modificat în medie pe lună producţia de celuloză şi
hârtie a fabricii, pe întreaga perioadă ianuarie 2000 - februarie 2001?

5. O companie petrolieră a vândut în perioada 1998-2001 următoarele


cantităţi trimestriale de benzină (mii tone):
Tabelul 6.16’
Anul Cantităţi de benzină (mii tone)
Trim. I Trim. II Trim. III Trim. IV
1998 39 37 61 58
1999 18 56 82 27
2000 41 69 75 66
2001 54 42 90 66

a) Să se reprezinte grafic datele;


b) Să se determine abaterile sezoniere şi coeficienţii sezonieri;
c) Să se previzioneze cantitatea de benzină ce va fi vândută în trimestrul III
2002, dacă seria va păstra aceeaşi evoluţie ca în perioada 1998-2001.

6. Despre turiştii cazaţi într-un hotel montan în perioada 1992-2000 se


cunosc datele:

322
STATISTICĂ ECONOMICĂ

Tabelul 6.17’
Anul 1992 1993 1994 1995 1996 1997 1998 1999 2000
Procentul de modificare 0 +2 +3 +10 +7 +12 +15 +20 +20
a numărului de turişti
faţă de 1992 (%)

Ştiind că în anul 1998 s-au cazat în hotel un număr de turişti mai mare cu 8
sute persoane faţă de anul 1995, se cere:
a) Să se determine indicii cu bază fixă şi mobilă;
b) Să se reconstituie seria de valori absolute şi să se reprezinte grafic;
c) Să se calculeze şi interpreteze indicatorii medii ai seriei;
d) Să se ajusteze evoluţia numărului de turişti folosind metode mecanice şi
analitice;
e) Care dintre metodele de ajustare folosite este mai potrivită şi de ce?
f) Pe baza metodei identificate la punctul e), să se previzioneze numărul de
turişti care se vor caza în hotel în anul 2002.

7. Producţia de mase plastice a unei întreprinderi a evoluat în perioada


1993-2001 conform funcţiei de trend: yˆ t = 50 + 12,5t (în condiţiile în care
¦ t = 0 ). Să se previzioneze nivelul producţiei de mase plastice pentru anii
2002, 2003 şi 2004.

8. Alegeţi relaţiile corecte între indicatorii unei serii cronologice:


I t /1
a) = y t − y t −1 = ∆ t / t −1 , t = 2, n;
I t −1/ 1
∆ t / t −1 y
b) A t / t −1 = = 1 , t = 2, n;
R t % / t −1 100
n
c) ¦ ∆ t / t −1 = ∆ n / 1 = y n − y1 ;
t =2
n y
d) ¦ I t / t −1 = I n / 1 = n .
t =2 y1
9. Dacă ritmul cu bază fixă este negativ, atunci:
a) fenomenul a înregistrat o creştere, în perioada curentă faţă de cea de
bază;
b) modificarea absolută cu bază fixă este negativă;
c) indicele de dinamică cu bază fixă este negativ;

323
CAPITOLUL 6

d) fenomenul a înregistrat o scădere în perioada curentă faţă de cea de


bază;
e) nivelul fenomenului a înregistrat o scădere de un anumit număr de
ori în perioada curentă faţă de cea de bază.

10. Modificarea medie absolută:


a) se determină ca medie aritmetică simplă a modificărilor absolute cu
bază în lanţ;
b) se determină ca medie geometrică a modificărilor absolute cu bază
în lanţ;
c) arată de câte ori s-a modificat în medie nivelul fenomenului pe o
unitate de timp;
d) arată cu câte procente s-a modificat fenomenul în medie pe unitate
de timp;
e) arată cu câte unităţi de măsură a crescut sau a scăzut nivelul feno-
menului, în medie pe unitate de timp din orizontul analizat.

11. Una dintre componentele seriei cronologice o constituie oscilaţiile peri-


odice ciclice.
Acestea:
a) arată mişcarea generală, sistematică, generată de acţiunea unor
factori de lungă durată;
b) arată o mişcare fluctuantă, regulată, cu o periodicitate constantă de
până la un an;
c) arată fluctuaţii regulate care devin complete în decursul câtorva ani;
d) arată oscilaţii accidentale faţă de linia de trend cauzate de factori
imprevizibili;
e) nu există oscilaţii periodice ciclice.

12. Modelul multiplicativ de combinare a componentelor unei serii crono-


logice se utilizează atunci când:
a) amplitudinea oscilaţiilor faţă de linia de trend este aproximativ con-
stantă pentru aceeaşi subperioadă a fiecărei perioade;
b) fenomenul redat de seria cronologică are aproximativ o evoluţie
liniară;
c) oscilaţiile faţă de linia de trend se amplifică sau se reduc;
d) avem o serie cronologică staţionară;
e) în nici unul dintre cazurile menţionate au keriêr.

13. În reprezentările grafice ale seriilor cronologice, scara semilogaritmică


se foloseşte:
a) când termenii seriei se dispun aproximativ într-o progresie geome-
trică;

324
STATISTICĂ ECONOMICĂ

b) când termenii seriei se dispun aproximativ într-o progresie arit-


metică;
c) când variaţia termenilor seriei prezintă valori mari şi foarte mari
de-a lungul orizontului de timp analizat;
d) când se compară, cu ajutorul graficului, evoluţiile unor indicatori ce
prezintă diferenţe mari de mărime între ei;
e) niciodată.

14. Metoda mediilor mobile utilizată pentru determinarea trendului unei


serii cronologice are următoarele dezavantaje:
a) presupune calcule complicate;
b) nu este foarte flexibilă;
c) nu se poate utiliza în cazul seriilor cronologice afectate de factori
sezonieri;
d) prin aplicarea ei se pierde informaţie;
e) nu permite prognozarea unor valori viitoare ale fenomenului anali-
zat.

15. Metoda indicelui mediu de dinamică se foloseşte pentru determinarea


trendului unei serii cronologice atunci când:
a) seria cronologică formează aproximativ o progresie aritmetică;
b) seria cronologică formează aproximativ o progresie geometrică;
c) seria cronologică urmează o evoluţie exponenţială;
d) indicii de dinamică cu baza în lanţ sunt aproximativ egali;
e) modificările absolute cu bază în lanţ au valori aproximativ egale.

325
CAPITOLUL 7

CAPITOLUL 7

INDICI STATISTICI

Consideraţii prelimina