Documente Academic
Documente Profesional
Documente Cultură
STATISTICĂ ECONOMICĂ
ISBN: (10) 973-687-472-9
(13) 978-973-687-472-7
Editura Eurostampa
Timiºoara, bd. Revoluþiei nr. 26
Tel./fax: 0256-204816
E-mail: estampa@upcnet.ro
2
UNIVERSITATEA TIBISCUS TIMIŞOARA
Facultatea de Ştiinţe Economice
STATISTICĂ ECONOMICĂ
Note de curs pentru uzul studenţilor de la ÎFR
Timişoara 2006
3
4
CUPRINS
5
6
TEMA I. NOŢIUNI INTRODUCTIVE
CONŢINUT
REZUMAT
OBIECTIVE
7
sens, recensămintele populaţiei, efectuate de chinezi, greci, egipteni, romani,
cu 4-5 milenii î.e.n. Recensămintele efectuate de romani (din 5 în 5 ani, apoi
din 10 în 10 ani) erau cunoscute sub denumirea de „cens”. În Dacia, ocupată
de romani, evidenţele, care se făceau asupra populaţiei, producţiei şi
consumului, purtau denumirea de „tabularium”.
Apariţia statelor feudale a dus la o dezvoltare continuă şi mai
complexă a evidenţei, în special în secolele al XVI-lea şi al XVII-lea când
se elaborează un mare număr de lucrări în care se descrie detaliat situaţia
social-economică folosind datele statistice. Apare astfel „statistica
descriptivă” şi, odată cu ea, o serie de lucrări între care şi strălucita
monografie de talie europeană a lui Dimitrie Cantemir „Descriptio
Moldaviae”, apărută în anul 1716. Fondatorul şcolii descriptive a fost
Herman Conring (1606-1681), profesor la Universitatea din Helmstedt, care
a scris şi primul curs de statistică. Merită să amintim şi de Gottfried
Achenwall (1719-1772), considerat părintele statisticii.
Termenul de statistică derivă din cuvântul latin status, ceea ce
înseamnă poziţie, stare, situaţie şi din cuvântul italian stato, cu înţeles
limitat de „stat”.
Formele de evidenţă şi, cu acest prilej, şi statistica evoluează
permanent pe măsură ce evoluează şi societatea omenească. Dezvoltarea
modului de producţie capitalist a condus la apariţia unor noi concepte şi
metode statistice de investigaţie. Englezul William Petty (1623-1687), prin
lucrarea sa „Aritmetica politică”, contribuie substanţial la afirmarea
statisticii ca ştiinţă. Se conturează astfel o nouă şcoală, cea a aritmeticii
politice, care utilizează expresia numerică în studiul fenomenelor sociale,
punând bazele statisticii moderne. Încep să fie aplicate şi metode
matematice, în special în lucrările lui L.A.I. Quetelet (1796-1874), care a
efectuat numeroase cercetări în domeniul demografiei şi criminalităţii.
Începând cu a doua jumătate a secolului al XVIII-lea, rolul metodelor
statistico-matematice în investigarea şi interpretarea rezultatelor feno-
menelor şi proceselor economico-sociale se amplifică odată cu apariţia
calculului probabilităţilor. Se cuvine să amintim numele lui J. Bernoulli, cel
care a pus bazele legii numerelor mari, ale lui K. F. Gauss şi P.S. Laplace
care au definit legea normală de repartiţie, ale lui R.A.Fisher, G.U. Yule,
K.Pearson, Cebasev, Liapunov, Marcov şi alţii. Combinând metoda
deductivă (matematică sau logică) cu cea inductivă (empirică sau statistică)
statisticienii acestei perioade stabilesc şi principiile teoriei selecţiei. Apare
astfel o nouă şcoală statistică, respectiv cea a calculului probabilităţilor.
Dezvoltarea continuă a vieţii social-economice a făcut ca statistica să
capete, atât pe plan naţional cât şi internaţional, un cadru instituţional. Apar,
începând cu sfârşitul secolului al XVIII-lea, şi cu deosebire în secolul al
XIX-lea, birouri oficiale de statistică, care s-au transformat cu timpul în
organisme naţionale centrale de statistică.
În ţara noastră, în anul Unirii Principatelor Române, domnitorul
Alexandru loan Cuza înfiinţează:
- Biroul de statistică al Ţării Româneşti (la 28 aprilie 1859 în Bucureşti) sub
conducerea lui Dionisie Pop Marţian;
- Direcţia de statistică din Moldova (la 1 iulie 1859 la Iaşi) sub conducerea
lui Ion Ionescu dela Brad.
8
Începând cu 4 august 1862, cele două organe de statistică devin
Oficiul statistic pentru Principatele Unite, condus de Dionisie Pop Marţian.
Se cuvine să precizăm faptul că statistica a figurat de timpuriu ca
obiect de învăţământ în şcolile medii şi superioare. În ţara noastră, cea mai
veche menţiune datează din 1835, unde statistica se preda studenţilor din
anul I de la facultatea Juridică a Academiei Mihăileanu din Iaşi.
Evident, statistica s-a dezvoltat şi s-a perfecţionat odată cu dezvoltarea
societăţii omeneşti şi în deplină concordanţă cu alte ştiinţe cu care se află în
permanentă legătură (Contabilitatea, Finanţele, Econometria, Informatica
etc.).
În finalul acestui scurt istoric al apariţiei şi dezvoltării statisticii,
putem concluziona că rădăcinile statisticii moderne sunt:
- statistica practică; Rădăcinile
- statistica descriptivă; statisticii
- aritmetica politică; moderne
- calculul probabilităţilor.
Istoria statisticii nu se va opri aici. Ea va înceta odată cu dispariţia
societăţii omeneşti, însă, până atunci, mai este mult, mult timp, şi nu ştim
încă, pe ce planetă vom continua să folosim statistica.
9
- studiază fenomenele sociale şi economice de masă în cadrul cărora
acţionează legile statistice;
- studiază aspectul cantitativ, concret al fenomenelor social-economice de
masă, stabilindu-se astfel mărimea, volumul, intensitatea, raporturile de
interdependenţă în condiţii specifice de timp, spaţiu şi organizatorice.
Facem precizarea că latura cantitativă a fenomenelor nu se prezintă
separat de calitate, cantitate neexistând decât ca o cantitate a unei calităţi
date. Aceasta presupune că, studiind statistic fenomenele, accentul trebuie să
cadă pe analiza laturii cantitative, fără a ignora însă aspectul lor calitativ.
Urmărind etapele oricărui proces de cunoaştere, pentru rezolvarea
problemelor care fac obiectul său de studiu, statistica, ca orice ştiinţă, şi-a
elaborat procedee şi metode speciale de cercetare cum sunt cele ale
observării de masă, ale centralizării şi grupării, procedee şi modele de
analiză şi interpretare statistică. Putem spune că metoda statisticii este
Metoda constituită din „totalitatea operaţiilor, tehnicilor, procedeelor şi metodelor
statisticii de investigare statistică a fenomenelor ce aparţin unor procese de tip
aleator” .
Statistica se poate subdivide în:
a) Teoria statisticii sau statistica generală, care are ca obiect de studiu
elaborarea principiilor, tehnicilor şi metodelor folosite în procesul
cercetării statistice şi constituie fundamentul metodologic pentru
disciplinele statistice de la punctele b) şi c),
b) Statistica de ramură (industrială, agricolă, financiar-bancară etc.), care
studiază conţinutul particular al fiecărei ramuri,
c) Statistica macroeconomică, care se ocupă de măsurarea variabilelor
macroeconomice.
De reţinut faptul că metodele statisticii sunt folosite de multe alte
discipline, în special de cele ce caracterizează aspecte ale economiilor de
ramură.
10
Exemple de colectivităţi statistice: populaţia compusă din persoane,
având trăsături esenţiale comune, turismul compus din unităţi hoteliere,
producţia (cu produsele sale specifice) realizată de un agent economic într-o
anumită perioadă de timp, etc.
Statistica abordează colectivităţile fie static, fie dinamic. O
colectivitate statică exprimă o stare, un nivel, la un moment dat, în timp ce o
colectivitate dinamică concretizează un proces, o devenire în timp.
Unităţile (elementele) statistice reprezintă mulţimea numărabilă de
elemente care compun colectivitatea statistică. Fiecare element al Unitatea
colectivităţii este purtătorul unui anumit nivel al fiecărei trăsături statistică
(caracteristici) supuse observării statistice.
Statistica operează atât cu unităţi simple (studentul, pensionarul,
produsul, etc.) cât şi cu unităţi complexe (grupe de studenţi, familia etc.).
Caracteristica statistică constituie acea proprietate care este comună
Caracteristica
tuturor unităţilor unei colectivităţi statistice. Deoarece variază de la o unitate
statistică
a colectivităţii la alta, caracteristica statistică mai poartă denumirea de
variabilă statistică sau variabilă aleatoare.
Caracteristicile statistice se diferenţiază după mai multe criterii, şi
anume:
a) după conţinutul caracteristicii:
- caracteristici de timp (anul înfiinţării unei unităţi de alimentaţie publică);
- caracteristici de spaţiu sau teritoriale (judeţul de care aparţine societatea pe
acţiuni X);
- caracteristici atributive - orice caracteristică care se poate exprima numeric
sau prin cuvinte (salariul unui angajat, culoarea unei maşini);
b) după modul de exprimare:
- caracteristici calitative exprimate prin cuvinte;
- caracteristici cantitative sau numerice ale căror valori se stabilesc prin
numărare, măsurare sau calcul;
c) după natura variaţiei caracteristicilor numerice:
- caracteristici cu variaţie continuă (cele care pot lua orice valoare într-un
interval dat ca temperatura, diametrul unei piese etc.). În statistica
matematică sunt denumite variabile de tip continuu şi sunt studiate
folosind legile de repartiţie normală, Student, F, χ 2 (hi pătrat) etc.;
- caracteristici cu variaţie discontinuă sau discretă (cele care pot lua valori
numărabile sau valori dispuse la anumite intervale ca vârsta în ani
împliniţi, talia, pulsul în bătăi pe minut etc.). Matematic, sunt denumite
variabile de tip discret şi se analizează cu legile de repartiţie
hipergeometrică, binomială, Poisson etc.
d) după modul de obţinere şi caracterizare a fenomenului:
- caracteristici primare întâlnite la toate unităţile simple ale colectivităţii
statistice;
- caracteristici derivate sau secundare determinate prin compararea
indicatorilor primari;
e) după forma de manifestare la nivelul unităţilor simple:
- caracteristici alternative sau binare - cele care au două valori sau variante.
De exemplu, rebut sau nonrebut, bun sau rău;
11
- caracteristici nealternative - toate celelalte caracteristici, atât calitative cât
şi cantitative.
În cercetarea statistică o problemă importantă o reprezintă stabilirea
listei de caracteristici, în funcţie de care se analizează colectivitatea studiată.
De aceea se vor selecta numai acele caracteristici care răspund direct
obiectivului propus. Această operaţiune, extrem de importantă şi delicată, se
face prin intermediul programului de cercetare statistică.
Datele Datele statistice reprezintă caracterizarea numerică obţinută de
statistice statistică în legătură cu unităţile, grupele sau colectivitatea studiată. Ele sunt
mărimi concrete rezultate din studiile efectuate pe bază de numărare,
Frecvenţa măsurare sau calcul statistic. Numărul de apariţii (înregistrări) ale unei date
absolută şi statistice într-o colectivitate statistică reprezintă frecvenţa absolută a datei.
relativă Numărul da apariţii ale unei date raportat la numărul total de date culese se
numeşte frecvenţă relativă a datei.
Elementele datelor statistice sunt: noţiunea, (care precizează
fenomenul, procesul etc. la care se referă), identificatorii (care pot fi de
timp, spaţiu etc.), unitatea de măsură şi valoarea numerică. De exemplu:
valoarea încasărilor la 31 iulie 1996 la hotelul X din Bucureşti de 5 milioane
lei reprezintă o dată statistică în care valoarea încasărilor este noţiunea,
hotelul X din Bucureşti este identificatorul de spaţiu, ziua de 31 iulie 1996
este identificatorul de timp, milioane lei este unitatea de măsura, 5.000.000
lei este valoarea numerică.
Datele statistice pot fi primare - rezultate direct din observarea şi
înregistrarea statistică, prelucrate, publicate sau stocate în baze sau bănci de
date.
Orice dată statistică este purtătoare de informaţii.
Informaţia Informaţia este aşadar semnificaţia, conţinutul specific al datei sau
altfel spus constituie mesajul datelor statistice.
Indicatorii statistici reprezintă expresia numerică a unor fenomene,
Indicatorii procese, activităţi sau categorii economice şi sociale, definite în timp, spaţiu
statistici şi structură organizatorică .
Cunoaşterea statistică a evoluţiei fenomenelor şi proceselor
economico-sociale depinde de existenţa unor informaţii pe baza cărora se
face o analiză profundă a realităţii şi se fundamentează programele de
dezvoltare ce urmează a fi luate de către factorii de decizie.
Datele şi informaţiile culese de la furnizorii de date prin intermediul
sistemului informaţional statistic (S.I.S.) sunt prelucrate de către Comisia
Naţională pentru Statistică (C.N.S.) care, în final, le prezintă beneficiarilor
de informaţii.
În Legea nr. 11/1994 sunt precizate principiile fundamentale de
funcţionare a statisticii publice româneşti, asemănătoare cu cele existente pe
plan internaţional. Ele au în vedere autonomia metodologică,
confidenţialitatea, transparenţa, specializarea, proporţionalitatea şi
deontologia statistică.
Culegerea datelor şi valorificarea informaţiilor obţinute din acestea
prin mulţimea operaţiilor de prelucrare şi analiză se numeşte cercetare
statistică sau investigaţie statistică. Putem spune că cercetarea statistică
reprezintă procesul de cunoaştere a fenomenelor de masă cu ajutorul
metodelor statistice.
12
Cercetarea statistică se desfăşoară în trei faze sau etape succesive, şi
anume: Cercetarea
- observarea statistică sau culegerea datelor individuale de masă; statistică
- prelucrarea datelor primare şi obţinerea indicatorilor sintetici şi
derivaţi;
- analiza şi interpretarea rezultatelor prelucrării.
Aceste etape ale cercetării statistice constituie un tot unitar şi trebuie
organizate în aşa fel încât să se reducă la minimum riscul unor erori de
culegere, prelucrare sau analiză. În acest scop se elaborează un program al
cercetării statistice care cuprinde principiile şi problemele ce trebuie
rezolvate în fiecare etapă. El are la bază programul analizei, programul
prelucrării şi programul observării. Se observă că ordinea în care se
elaborează fiecare secvenţă cuprinsă în programul cercetării statistice este
inversă succesiunii etapelor acesteia.
DICŢIONAR
13
TEST DE EVALUARE
14
TEMA II. OBSERVAREA STATISTICĂ
CONŢINUT
REZUMAT
OBIECTIVE
Observarea statistică este, după cum a rezultat mai sus, prima etapă a
cercetării statistice. Observarea
Observarea statistică constă în culegerea, după criterii bine stabilite, statistică
pentru toate unităţile colectivităţii studiate, a valorilor caracteristicilor
prevăzute în programul cercetării.
Datele rezultate în procesul observării statistice trebuie să
îndeplinească următoarele condiţii:
- condiţia de volum care presupune culegerea datelor de la toate unităţile
colectivităţii studiate;
- condiţia de calitate care impune înregistrarea unor date autentice, reale,
care să nu prezinte erori.
Observarea statistică este o operaţie de mare amploare care necesită
importante forţe umane, cheltuieli băneşti şi materiale. Având în vedere
acest lucru şi ţinând cont şi de condiţiile pe care trebuie să le îndeplinească o
corectă observare a fenomenelor şi proceselor de masă supuse studiului,
statisticii îi revine o sarcină extrem de importantă în organizarea şi
realizarea primei etape a cercetării. Metode de
Metode de observare statistică. Corespunzător obiectivelor cercetării observare
statistice, orice observare (înregistrare) se face în funcţie de modul de statistică
organizare a activităţii social-economice, de timpul la care se referă datele
şi de numărul unităţilor înregistrate.
15
a) După modul de organizare a activităţii social-economice, deosebim:
- observări permanente care se efectuează prin intermediul sistemului
informaţional statistic;
- observări special organizate ca: recensăminte, anchete, monografii.
b) După timpul la care se referă datele, observările statistice pot fi:
- curente - de exemplu, rapoartele statistice;
- periodice - se efectuează la un anumit interval de timp (recensământul);
- unice (aşa zisele observări speciale), care se fac pentru consemnarea
statistică a unui eveniment nerepetabil.
c) După numărul unităţilor înregistrate, observările se subdivid în:
- totale (exhaustive) - cele în care se culeg date de la toate unităţile
colectivităţii (recensămintele, rapoartele statistice);
- parţiale (observările prin sondaj sau selective), adică cele care se realizează
numai asupra unei părţi a colectivităţii.
Observarea Metode de observare totală
totală 1) Recensământul este cea mai veche metodă de observare statistică şi
Recensă- constă într-o „fotografiere” a fenomenului la un moment dat, prin care se
mântul realizează culegerea datelor după criterii unitare şi simultan de la toate
unităţile populaţiei cercetate. Recensământul este o observare totală ce
caracterizează statistic fenomenul, cu o periodicitate corespunzătoare
obiectivului stabilit (în domeniul populaţiei este în jurul a 10 ani şi în
domeniul economic, 5 ani).
2) Sistemul raportărilor statistice, cunoscut şi sub denumirea de sistemul
Raportările dărilor de seamă statistice, constituie metoda de înregistrare prin care se
statistice asigură datele necesare pentru caracterizarea mersului procesului economic.
O dare de seamă statistică reprezintă un document oficial (tipizat) prin care
fiecare este obligat să raporteze periodic forurilor în drept rezultatele
obţinute în activitatea sa, într-o anumită perioadă de timp.
Observarea Metodele de observare parţială
parţială 1) Selecţia sau sondajul statistic reprezintă o înregistrare parţială care se
organizează în cazurile când nu se poate organiza o observare totală. În
Sondajul condiţiile economiei de piaţă metoda selecţiei devine una din metodele de
statistic bază ale observării statistice şi este justificată prin operativitate,
economicitate şi condiţii specifice de realizare.
Dată fiind importanţa acestei metode, faptul că în marea majoritate a
cazurilor nu se lucrează cu întreaga colectivitate, ci numai cu o parte
reprezentativă a acesteia, problematica sondajului este amplă şi complexă.
Ancheta 2) Ancheta statistică este o observare parţială, special organizată, care, de
statistică regulă, se bazează pe o completare benevolă a formularelor care se transmit
direct (de regulă populaţiei) sau prin corespondenţă.
Spre deosebire de metoda sondajului sau selecţiei, anchetele în rândul
consumatorilor iau în considerare un anumit segment al pieţei, fără a putea
verifica reprezentativitatea părţii observate în raport cu întreaga
colectivitate. Astfel de anchete se organizează, de exemplu, pentru a
cunoaşte părerea consumatorilor referitoare la un anumit produs ce urmează
a fi lansat pe piaţă.
Monografia 3) Monografia este o metodă de observare statistică care se utilizează pentru
caracterizarea multilaterală a unei unităţi statistice complexe. De regulă, se
16
analizează care sunt elementele noi apărute în modul de organizare a
activităţii economice şi sociale a unităţii supuse studiului.
4) Observarea părţii principale se utilizează pentru obţinerea de date
privind unităţile din categoriile mai importante ale unei colectivităţi, Observarea
neglijându-se unităţile din categoriile mai puţin importante. Se utilizează în părţii
cazurile în care se cere mare operativitate în obţinerea de informaţii privind principale
colectivitatea.
În funcţie de obiectivele cercetării statistice şi de modul în care se pot
obţine informaţiile, metodele de observare statistică prezentate se pot utiliza
fie separat, fie împreună.
17
Într-o fază următoare datele se supun prelucrării bazate pe metode mai
complexe, de o mare fineţe, cu scopul de a se obţine informaţii
suplimentare, calitativ superiore din punct de vedere al semnificaţiei
economice. Ne vom referi la indicatorii statistici primari şi derivaţi, la
calculul mărimilor medii, şi vom încheia cu prelucrarea seriilor de repartiţie
de frecvenţe.
Frecvenţa (ni)
Caracteristica de SAU
grupare (xi) altă caracteristică de
grupare (yi)
x1 n1
x2 n2
….. ….
xk nk
18
Din aceste motive seriile statistice au fost considerate „materia primă”
a analizelor statistice.
Prezentarea tabelară este cea mai raţională şi adecvată formă de
prezentare a datelor statistice. În tabelul statistic datele sau indicatorii Tabelul
statistici se prezintă într-un sistem corelat, format dintr-una, două sau mai statistic
multe serii statistice (enumerarea datelor statistice într-o anumită ordine se
numeşte serie statistică).
Tabelele statistice se folosesc în toate fazele şi operaţiile cercetării
statistice: în procesul culegerii şi înregistrării datelor, pe parcursul întregii
prelucrări, la analiza şi interpretarea informaţiilor elaborate, la prezentarea şi
publicarea indicatorilor statistici elaboraţi.
Într-un tabel statistic se pot identifica subiectul (populaţia şi grupele ei
prezente) şi predicatul (sistemul de indicatori care caracterizează populaţia).
Se deosebesc mai multe feluri de tabele statistice:
a) Tabelul statistic simplu sau cu simplă intrare prezintă repartiţia unei
populaţii după o singură caracteristică distributivă, de timp sau de spaţiu.
Este format din două coloane, în care se înregistrează valorile caracteristicii
şi frecvenţa sau nivelul fiecărei valori (la nevoie se adaugă coloane care
înregistrează frecvenţe relative, frecvenţe cumulate, valori globale, abateri,
etc.)
c) Tabelul statistic combinat este acela care oferă grupări combinate după
două sau mai multe caracteristici, cu prelucrare sau nu.
19
Grupa de vârstă Masculin Feminin Total
0-9 ani 1.579.670 1.513.341 3.093.011
10-19 ani 1.891.261 1.807.791 3.699.052
20-29 ani 1.793.406 1.740.805 3.534.211
30-39 ani 1.540.239 1.521.382 3.061.621
40-49 ani 1.440.141 1.456.696 2.896.837
50-59 ani 1.222.543 1.321.990 2.544.533
60-69 ani 1.064.023 1.246.294 2.310.317
70-79 ani 447.684 670.366 1.118.050
peste 80 ani 117.840 295.150 412.990
Populaţia pe grupe de vârstă şi sexe la 1 iulie 1994
Sursa :Anuarul statistic al României 1995 pag. 85
Tipul de bere
Sex blondă neagră normală Total
Masc. 20(13,3%) 20(13,3%) 40(26,7%) 80(53,3%)
Fem. 30(20,0%) 10(6,7%) 30(20,0%) 70(46,7%)
Total 50(33,3%) 30(20,0%) 70(46,7%) 150(100%)
Rezultatele testului privind preferinţele de bere
20
Reprezentările grafice asociate nu înlocuiesc tabelele statistice ci le
completează, oferind în plus un mijloc de popularizare şi de analiză a
datelor statistice. Ele pot permite şi descoperirea unor omisiuni sau anomalii
în datele statistice asociate fenomenului studiat.
Elementele unei reprezentări grafice sunt: titlul, reţeaua, scara de
reprezentare, legenda, graficul propriu-zis, sursa datelor şi notele
explicative.
Principalele tipuri de grafice statistice. În funcţie de o serie de
cerinţe de natură obiectivă, marea varietate a graficelor se grupează în două
mari categorii, şi anume:
- reprezentări bazate pe figuri geometrice, în care nivelul indicatorului este
exprimat de lungimea unei drepte, suprafaţa unui dreptunghi, pătrat sau
cerc, etc.;
- reprezentări bazate pe figuri naturale sau figuri simbolice.
Principiul care trebuie respectat constă în faptul că dimensiunea
figurii geometrice sau naturale trebuie să fie proporţională cu mărimea
indicatorului reprezentat.
Redăm în continuare principalele tipuri de grafice:
a) Diagrama prin coloane - grafic în care datele statistice sunt
reprezentate prin dreptunghiuri, construite cu bazele egale pe axa absciselor,
care poate fi axa timpului şi înălţimile (deci şi suprafeţele) proporţionate cu
mărimea (frecvenţele) indicatorilor reprezentaţi. Se foloseşte pentru
reprezentarea în timp a unui fenomen.
b) Diagrama prin benzi - grafic în care datele statistice sunt
reprezentate prin ariile unor dreptunghiuri construite cu bazele pe axa
ordonatelor şi despărţite prin spaţii egale. Lungimea benzilor este direct
proporţională cu mărimea indicatorilor reprezentaţi, iar lăţimile sunt egale.
Se foloseşte pentru reprezentarea indicatorilor de lungime sau când
indicatorii prezintă între ei variaţii foarte mari sau când datele sunt
distribuite cronologic neegal.
c) Diagrama de structură - reflectă structura unei colectivităţi,
evidenţiind raportul care există între părţile componente ale acesteia şi
întreaga colectivitate. Pentru reprezentarea grafică se foloseşte de regulă
dreptunghiul, pătratul sau cercul. Suprafeţele acestora trebuie să fie direct
proporţionale cu volumul colectivităţilor, iar părţile componente ale
acestora să fie reprezentate prin porţiuni din suprafaţă.
d) Diagrama polară (radială) - se utilizează de regulă pentru a ilustra
sezonalitatea. Se construieşte folosind o reţea radială.
e) Diagrama în batoane (bare) - grafic în care fiecărei valori a
variabilei înscrise pe abscisă i se asociază o ordonată (baton sau bară) de
lungime proporţională cu frecvenţa valorii. Lungimile batoanelor însumate
pot fi egale cu 1 sau 100.
f) Diagramele prin suprafeţe - se recomandă în cazurile în care datele se
referă la modificări privind nivelul unor variabile care sugerează
cantităţi, volume, suprafeţe. Sunt reprezentate prin figuri geometrice ale
căror arii sunt direct proporţionale cu mărimile indicatorilor respectivi.
21
g) Cartogramele şi cartodiagramele - grafice care redau deosebirea dintre
unităţile administrativ-teritoriale. Ele se trec direct pe hărţi şi se folosesc
în cadrul seriilor teritoriale.
Statistica foloseşte şi alte tipuri de reprezentări grafice ca: histograme,
poligonul frecvenţelor, corelograma etc. Ele vor fi prezentate în curs, la
capitolele care le utilizează.
„Păcăleli” Graficele, în mod accidental sau intenţionat, pot oferi imagini ce
prin grafice ascund sau exagerează anumite tendinţe. Aceasta se datorează alegerii
greşite a lăţimii intervalelor şi a scalei de măsură (a unităţii de măsură). De
aceea, este bine să se considere reprezentările grafice ca o cale de a sugera o
tendinţă ce urmează a fi studiată mai cu atenţie, pe baza tabelelor de date
statistice şi a altor instrumente.
Exemplu: înregistrarea diferitelor coliziuni produse între avioanele de pe un
mare aeroport conduce la următoarele date statistice : 13, 14, 14, 15, 15.
Reprezentările lor cu două unităţi de măsură sunt:
15 --
15 -- 14 --
14 --
13 -- 13 --
| | | | | | | | | |
13 14 14 15 15 13 14 14 15 15
ian feb mar apr mai ian feb mar apr mai
DICŢIONAR
22
TEST DE EVALUARE
23
TEMA III. PARAMETRII TENDINŢEI CENTRALE
CONŢINUT
REZUMAT
OBIECTIVE
24
Indicatorii primari se obţin în cadrul prelucrării primare a datelor
statistice ca urmare a procesului de centralizare a datelor unei observări Indicatori
statistice. Ei au conţinut concret şi formă concretă de exprimare. De primari
exemplu, volumul producţiei la nivelul unei întreprinderi se exprimă fie în
unităţi naturale, natural-convenţionale, de timp de muncă sau valorice şi
dimensionează din acest punct de vedere întreprinderea pe o anumită
perioadă de timp. Din această cauză indicatorii primari se mai numesc şi
indicatori absoluţi şi constituie baza informaţională a cunoaşterii statistice.
Indicatorii derivaţi se obţin în faza de prelucrare statistică a mărimilor
Indicatori
absolute prin aplicarea variatelor metode şi procedee de calcul statistic
derivaţi
(comparaţii, abstractizări, generalizări).
Indicatorii derivaţi au menirea de a pune în lumină şi de a face posibilă
analiza aspectelor calitative ale fenomenelor şi proceselor cercetate. În acest
scop, ei exprimă: relaţii cantitative dintre diferitele caracteristici statistice,
dintre diferitele părţi ale unei colectivităţi sau dintre fenomenele ce se
găsesc într-un anumit grad de interdependenţă; valorile tipice care se
formează în mod obiectiv în cadrul aceleaşi perioade de timp sau în
dinamică; gradul şi forma de variaţie a caracteristicilor cercetate; legăturile
de interdependenţă dintre fenomene; tendinţa obiectivă de manifestare a
fenomenelor; rolul şi contribuţia diferiţilor factori la formarea şi modificarea
mărimii unui fenomen complex etc.
Analiza seriilor de repartiţie pe baza frecvenţelor şi a graficelor ne
oferă o imagine sumară asupra modului în care variază valorile unei
caracteristici statistice. În această fază nu putem să formulăm nici o ipoteză
privind tendinţa generală determinată de acţiunea concomitentă a cauzelor
esenţiale şi a cauzelor întâmplătoare.
Indicatorii tendinţei centrale ce caracterizează seriile de repartiţie
unidimensionale sunt: mărimile medii şi indicatorii medii de poziţie (medii Indicatorii
de structură). Un loc important în categoria de indicatori derivaţi şi de tendinţei
indicatori sintetici generalizatori îl ocupă mărimile medii utilizate pe scară centrale
largă atât în activitatea de planificare şi conducere, cât şi în cercetări
statistice diverse. Mărimile medii constituie instrumente principale de Mărimile
cunoaştere a fenomenelor de masă şi au un grad mare de aplicabilitate în medii
activitatea practică. Ele redau ceea ce este tipic, comun şi general în
evoluţia fenomenelor.
25
Evoluţia în timp şi în spaţiu a unui fenomen social-economic este
influenţată de intensitatea cu care acţionează cele două categorii de cauze:
esenţiale (obiective) şi întâmplătoare (subiective).
Media Prin definiţie, media valorilor individuale ale unei variabile
(caracteristici) statistice este expresia sintetizării într-un singur nivel
reprezentativ a tot ceea ce este esenţial, tipic şi obiectiv în apariţia,
manifestarea şi dezvoltarea acesteia. Media măsoară influenţa cauzelor
esenţiale, făcând abstracţie de cauzele întâmplătoare. În statistică, media
poate fi interpretată ca nivelul la care ar fi ajuns caracteristica înregistrată,
dacă, în toate cazurile, toţi factorii esenţiali şi neesenţiali ar fi acţionat
constant, deci s-ar fi obţinut o valoare identică. În acest sens, putem
considera şi ipoteza că media este „speranţa matematică” spre care tind toate
valorile, variaţia dintre ele nefiind altceva decât influenţa factorilor aleatori.
Dată fiind diversitatea largă a fenomenelor social-economice, precum
şi complexitatea variabilităţii acestor fenomene, în practică trebuie să se
aleagă tipul de medie adecvat. Mediile cel mai frecvent întâlnite sunt:
aritmetică, armonică, pătratică, geometrică, calculate ca medii simple sau
ponderate.
Media aritmetică se foloseşte în general când fenomenul supus
Media cercetării înregistrează modificări aproximativ constante în progresie
aritmetică aritmetică.
Media aritmetică simplă se foloseşte pentru seriile simple, adică în cazul în
care numărul variantelor caracteristicii studiate este egal cu numărul
unităţilor sau când se cunoaşte nivelul total al caracteristicii şi numărul
unităţilor
Formula de calcul a mediei aritmetice simple este :
n
∑x i
x= i =1
n
Într-o colectivitate statistică însă se întâlnesc foarte rar cazuri în care
numărul valorilor coincide cu numărul unităţilor. De regulă, fenomenele de
masă sunt numeroase şi aceeaşi valoare individuală poate fi întâlnită de mai
multe ori, caz în care se foloseşte media aritmetică ponderată.
Formula mediei aritmetice ponderate este :
k
∑x n i i
x= i =1
k
∑n
i =1
i
26
Grupe de muncitori Nr. Centrul de Produsele
după procentul muncitorilor interval de frecvenţe
de îndeplinire ni xi xini
a normelor
90,0 - 95,0 3 92,5 277,5
95,0 - 100,0 1 97,5 97,5
100,0 - 105,0 42 102,5 4305,0
105,0 - 110,0 23 107,5 2472,5
110,0 - 115,0 9 112,5 1012,5
115,0 - 120,0 1 117,5 117,5
120,0 - 125,0 1 112,5 122,5
80 - 8405,0
∑ ni ∑ xini
x=
∑x ni i
=
8405,0
= 105,0625% = 105,06% / muncitor.
∑n i 80
27
Fiind o mărime cu caracter de mărime relativă de structură, ea se
exprimă de regulă sub formă de procente.
Exemplu: Se presupune că într-un lot de 10000 produse s-au înregistrat 200
rebuturi şi se cere să se afle care este media rebuturilor pe întregul lot.
Deci N =10000; M=200; media va fi :
M 200
p= = = 0,02 sau 2%.
N 10000
Aceasta înseamnă că în medie la fiecare 100 de produse recepţionate, pot să
apară câte 2 rebuturi.
Principalul dezavantaj al folosirii mediei aritmetice constă în
sensibilitatea sa faţă de valorile extreme. Ea devine nereprezentativă dacă
termenii seriei sunt prea împrăştiaţi, iar dacă, în colectivitatea statistică se
observă manifestări distincte din punct de vedere calitativ, media tinde să
devină o mărime lipsită de conţinut. În acest caz, este indicat să se calculeze
medii parţiale pentru fiecare tip calitativ al colectivităţii şi, în final, să se
determine media generală.
Omogenitatea colectivităţii pentru care se determină media este, de
fapt, o condiţie a reprezentativităţii pentru orice tip de mărime medie.
Media armonică se calculează din valorile inverse ale termenilor:
Media n
armonică x= n
1
∑x
i =1 i
∑n i
x= i =1
k
ni
∑x
i =1 i
Media armonică ponderată se foloseşte pentru calculul preţului mediu şi al
indicelui mediu al preţurilor (când lipsesc informaţii privind volumul fizic al
mărfurilor).
Media Media geometrică se bazează pe relaţia de produs a termenilor seriei,
geometrică adică:
x = n Πx in i
Media geometrică se foloseşte când termenii seriei nu permit o relaţie
de aditivitate, ci un produs. Denumită şi medie de ritm, se foloseşte pentru a
calcula ritmul mediu de creştere (scădere) a unui fenomen în evoluţia lui în
timp.
Alături de mediile prezentate se mai pot folosi şi alte tipuri ca: media
pătratică, cubică şi parabolică.
În aplicaţii concrete, mărimile medii nu se folosesc la întâmplare, ci în
funcţie de specificul şi de proprietăţile fenomenului. Media trebuie aleasă
astfel încât să reflecte cât mai fidel realitatea obiectivă.
28
3.3. MEDIILE DE STRUCTURĂ
29
Într-o serie cu grad mare de variaţie se calculează şi alţi indicatori
medii de poziţie: cuartilele, decilele, percentilele.
Cuartilele sunt acele valori ale caracteristicii care împart seria în patru
părţi egale. Ele se calculează prin analogie cu modul de calcul al medianei,
dar ţinând seama de locul pe care-l ocupă cuartila inferioară (Q1 ) sau
superioară (Q 3 ) în serie. Valorile se calculează după formulele :
Q1 −1
1
4
[(∑ n ) + 1] − ∑ n
i i
Q1 = x o + h i =1
n Q1
Q 2 = Me
Q 3 −1
3
4
[(∑ n ) + 1] − ∑ n
i i
Q3 = x 0 + h i =1
n Q3
Decidele (în număr de 9) sunt valorile caracteristicii care împart seria
în zece părţi, a cincea fiind egală cu mediana.
Percentilele sunt valorile caracteristicii care împart seria în 100 de
părţi, deci vor fi 99 de percentile. De obicei acestea se determină numai
pentru serii cu variaţie foarte mare şi numai pe grafic.
Modul Modul (Mo, x o ), valoarea modală sau dominanta unei variabile
aleatoare este valoarea cea mai des întâlnită, căreia îi corespunde frecvenţa
maximă.
Aplicabilitate: valoarea modală poate înlocui media atunci când cea în
cauză nu se poate calcula sau nu are sens să fie calculată ca, de exemplu:
talia medie în industria confecţiilor, numărul mediu la încălţăminte etc. În
acest caz se stabilesc ca valori modale talia cea mai des solicitată şi numărul
la pantofi cel mai căutat. De asemenea modul este util când seria de
repartiţie este asimetrică. Mediana şi modul se exprimă în aceleaşi unităţi de
măsură ca şi variabila studiată, iar după mărimea abaterilor dintre ele se
poate aprecia forma de repartiţie a frecvenţelor în seria analizată.
Calculul modului în cazul datelor grupate pe intervale este următorul:
Δ1
x o = lo + ⋅ ho
Δ1 + Δ 2
unde: lo este limita inferioară a intervalului modal
Δ 1 este diferenţa între frecvenţa intervalului modal şi cel anterior lui
Δ 2 este diferenţa între frecvenţa intervalului modal şi cel următor lui
ho este lungimea intervalului modal.
Intervalul modal este acela cu cea mai mare frecvenţă.
DICŢIONAR
Indicatorul
- este expresia numerică a unor fenomene, procese, activităţi
statistic
sau categorii economice şi sociale, definite în timp şi spaţiu
Indicatori - se obţin în cadrul prelucrării primare a datelor statistice ca
primari urmare a procesului de centralizare a datelor unei observări
30
statistice, ei au conţinut concret şi formă concretă de
exprimare
- se obţin în faza de prelucrare statistică a mărimilor absolute
Indicatori prin aplicarea variatelor metode şi procedee de calcul
derivaţi statistic (comparaţii, abstractizări, generalizări)
Indicatorii - care caracterizează seriile de repartiţie unidimensionale
tendinţei sunt: mărimile medii şi indicatorii medii de poziţie (medii
centrale de structură)
- instrumente principale de cunoaştere a fenomenelor de
masă şi au un grad mare de aplicabilitate în activitatea
Mărimile
practică, ele redau ceea ce este tipic, comun şi general în
medii
evoluţia fenomenelor
Media - media valorilor individuale ale unei variabile (caracteristici)
statistice este expresia sintetizării într-un singur nivel
reprezentativ a tot ceea ce este esenţial, tipic şi obiectiv în
apariţia, manifestarea şi dezvoltarea acesteia, măsoară
influenţa cauzelor esenţiale, făcând abstracţie de cauzele
întâmplătoare
Caracte- - sunt acelea la care pentru fiecare unitate apare fie forma sa
ristici de manifestare directă, fie opusul ei
alternative - sunt valori concrete ale seriei care o împart în părţi egale:
mediana (în două parţi), quartilele (patru părţi), decilele
Quantilele (zece părţi), centilele (în 100 părţi) etc
- prin mediana unei serii de distribuţie de frecvenţe se
Mediana înţelege acea valoare a datelor statistice care împarte seria
(ordonată crescător sau descrescător) în două părţi egale
- sau valoarea modală sau dominanta unei variabile aleatoare
Modul este valoarea cea mai des întâlnită, căreia îi corespunde
frecvenţa maximă
TEST DE EVALUARE
31
TEMA IV. PARAMETRII VARIAŢIEI
CONŢINUT
REZUMAT
OBIECTIVE
32
Nu este suficient să calculăm valorile tipice ale unei serii (de
exemplu media), ci este necesar să verificăm gradul lor de reprezentativitate. Necesita-
Problemele care se rezolvă prin studiul variaţiei şi calculul indicatorilor de tea
variaţie sunt: studierii
- verificarea reprezentativităţii mediei ca valoare tipică a unei serii de variaţiei
repartiţie; seriilor
- verificarea gradului de omogenitate a seriei; statistice
- verificarea sistematizării informaţiilor prin gruparea statistică;
- caracterizarea gradului şi a formei de variaţie a unei variabile statistice;
- cunoaşterea gradului de influenţă a cauzelor după care s-a făcut gruparea
unităţilor statistice înregistrate.
Indicatorii de variaţie permit separarea acţiunii cauzelor esenţiale de
cea a cauzelor întâmplătoare şi dau posibilitatea identificării modului în care
acţionează factorii esenţiali de la o grupă la alta.
Se pot folosi indicatori simpli şi sintetici.
33
A
A% = ∗ 100
x
Amplitudinea relativă permite aprecierea şi compararea gradului de
variaţie pentru două colectivităţi statistice în care caracteristica de grupare
se exprimă în unităţi de măsură diferite.
Amplitudinea variaţiei nu este însă un indicator suficient de
semnificativ, deoarece nu ţine seama decât de valorile extreme ale
carcteristicii, or asupra variaţiei unui fenomen influenţează toate valorile
individuale şi frecvenţele lor de apariţie. Uneori se întâlnesc cazuri când
valorile extreme sunt foarte departate de celalalte valori intermediare şi în
acest caz a măsura variaţia numai în funcţie de amplitudinea ei constituie o
greşeală.
Amplitudinea variaţiei se foloseşte în prelucrarea statistică la alegerea
numărului de grupe şi a mărimii intervalului de grupare. În controlul calităţii
produselor, amplitudinea variaţiei este un indicator care se interpretează în
raport cu limitele de toleranţă admise.
Abaterile individuale absolute (di) se calculează ca diferenţă între
fiecare variantă înregistrată şi media artimetică a acesteia, respectiv:
di = xi − x
Abaterile individuale relative (di%) se calculează ca raport între
abaterea absolută şi nivelul mediu al caracteristicii studiate.
di x −x
∗100 = i ∗100
x x
Abaterile individuale pot fi pozitive sau negative în funcţie de mărimea
fiecărui termen faţă de media lor.
În practică se calculează, de regulă, numai abaterea individuală
minimă şi abaterea individuală maximă. Gradul de variaţie al unei
caracteristici nu depinde însă numai de abaterile maxime care apar într-un
sens sau altul, ci de toate abaterile variantelor înregistrate şi de frecvenţele
lor de apariţie.
Indicatorii simpli ai variaţiei fiind calculaţi pe baza relaţiilor dintre doi
termeni ai seriei sau între fiecare termen şi media lor, nu pot exprima
întreaga variaţie a unei caracteristici înregistrate. De aceea este necesar să
se calculeze şi indicatorii sintetici ai variaţiei care iau în consideraţie toate
abaterile caracteristicii.
Indicatorii Indicatorii sintetici ai variaţiei caracterizează gradul de variaţie,
sintetici ai luând în consideraţie toţi termenii seriei. Ca indicatori sintetici, statistica
variaţiei calculează abaterea medie liniară (d), dispersia ( σ 2 ), abaterea medie
pătratică ( σ ) şi coeficientul de variaţie (v).
Abaterea medie liniară (d) se calculează ca o medie aritmetică simplă
Abaterea
sau ponderată a abaterilor termenilor seriei de la media lor, luate în valoare
medie
absolută, (deoarece suma algebrică a tuturor abaterilor este egală cu zero
liniară
∑ (x i − x ) ⋅n i = 0 ), adică:
k
∑x i − x ⋅n i
1 k
d= i =1
n
= k ∑x i − x ⋅ ni
∑n
i =1
i ∑n
i =1
i
i =1
34
Abaterea medie liniară arată în medie cu cât se abat termenii seriei de
la media lor. Prezintă dezavantajul că nu ţine seama de semnul algebric şi
acordă aceeaşi importanţă atât abaterilor mici cât şi abaterilor mari, deşi cele
din urmă influenţează în mai mare măsura gradul de variaţie a unei
caracteristici. Abaterea medie liniară poate fi un indicator concludent numai
dacă seria prezintă un grad mare de omogenitate. Aceste neajunsuri se
înlătura prin calculul dispersiei şi a abaterii medii pătratice.
Dispersia ( σ 2 ) se calculează ca o medie aritmetică simplă sau
ponderată a pătratelor abaterilor termenilor seriei de la media lor şi mai Dispersia
poartă denumirea de moment centrat de ordinul doi. Relaţia de calcul este:
k
∑ (x i − x) 2 ⋅ n i
σ2 = i =1
k
∑n
i =1
i
35
Coeficientul de variaţie arată câte unităţi din abaterea medie pătratică
revin la 100 de unităţi de medie.
Coeficientul de variaţie, indiferent de relaţia cu care se calculează, ia
Coeficien- valori între 0% şi 100%.
tul de -dacă v = 0%, înseamnă lipsă de variaţie, toate valorile caracteristicii fiind
variaţie egale între ele şi respectiv egale cu media,
-dacă v—>0% înseamnă că variaţia caracteristicii este mică, colectivitatea
cercetată este omogenă, media este reprezentativă pentru serie, iar
gruparea este bine executată,
-se admite că seria prezintă un grad de omogenitate ridicat, dacă v < 35%,
-dacă v > 70-75%, se afirmă că variaţia este foarte mare, media nu este
semnificativă şi ascunde o structură eterogenă a colectivităţii care necesită
repetarea operaţiei de grupare cu respectarea strictă a principiilor teoretice
care condiţionează reuşita acestei operaţii de omogenizare a grupelor. De
cele mai multe ori, în asemenea cazuri este necesară împărţirea seriei
iniţiale în serii componente pentru a spori gradul de omogenitate a datelor.
Coeficientul de variaţie ne oferă cea mai exactă caracterizare sintetică
a variaţiei.
Observaţie importantă: pentru o distribuţie normală intervalul:
- (μ ± σ ) conţine aproximativ 68% din măsurători
Distribuţia
măsurăto- - (μ ± 2σ ) conţine aproximativ 95% din măsurători
rilor - (μ ± 3σ ) conţine toate sau aproape toate măsurătorile
unde μ este media populaţiei iar σ este abaterea medie a populaţiei.
Exemplu pentru calcularea indicatorilor sintetici de variaţie:
îndeplinire al (n i ) (x i )
normelor
90- 95 3 92,5 -12,6 - 37,8 476,28
95-100 1 97,5 - 7,6 - 7,6 57,76
100-105 42 102,5 - 2,6 -109,2 283,92
105-110 23 107,5 2,4 55,2 132,48
110-115 9 112,5 7,4 66,6 492,84
115-120 1 117,5 12,4 12,4 153,76
120-125 1 122,5 17,4 17,4 302,76
200 - - 306,2 1899,80
∑n i ∑x i − x ni ∑ (x i − x) n i
2
∑x i − x ⋅ ni
306, 2
d= i =1
k
= = 3,83
80
∑n
i =1
i
36
Dispersia:
k
∑ (x i − x) ⋅ n i
2
1899,80
σ2 = i =1
k
= = 23,75
80
∑n
i =1
i
∑ (x 1 − x) ni
2
σ= i =1
k
= 23,75 ≈ 4,87
∑n
i =1
i
Coeficientul de variaţie:
σ 4,87
v = ∗ 100 = ∗ 100 = 4,63%
x 105,1
Pe baza rezultatelor obţinute se poate afirma că media este o valoare
foarte reprezentativă pentru seria din care s-a calculat, deoarece s-a obţinut
un coeficient foarte mic de variaţie (sub 5%), iar cele mai multe valori (65
din 80) se concentrează în intervalul 100% - 110%. Tendinţa de normalitate
a distribuţiei se poate constata şi pe baza relaţiei dintre abaterea medie
pătratică şi abaterea medie liniară. În exemplul luat 4/5 din abaterea medie
⎛ 4 × 4,87 ⎞
pătratică a seriei sunt egale cu 3,896 = ⎜ ⎟ , ceea ce prezintă o
⎝ 5 ⎠
diferenţă minimă faţă de valoarea reală a abaterii medii liniare (d=3,83).
37
- cu cât este mai mic în valoare absolută, cu atât asimetria este mai mică,
- într-o serie perfect simetrică, coeficientul de asimetrie este egal cu zero,
- dacă media este mai mare decât valoarea modală a seriei atunci
coeficientul de asimetrie este cuprins între 0 şi 1, deci există o asimetrie
pozitivă,
- dacă valoarea modală este mai mare decât media, coeficientul de asimetrie
este cuprins între -1 şi 0, adică există o asimetrie negativă.
În cazul când se cunoaşte mediana seriei, coeficientul de asimetrie
(C as ) se poate calcula raportând abaterea dintre medie şi mediană luată de
/
38
laborioase, aşa că se folosesc mai rar în caracterizarea asimetriei şi excesului
(boltirii).
În următoarele grafice sunt exemplificate tipurile de asimetrie şi
boltire:
39
40
DICŢIONAR
41
TEST DE EVALUARE
42
TEMA V. SONDAJUL STATISTIC ŞI UTILIZAREA LUI
ÎN ECONOMIE
CONŢINUT
REZUMAT
OBIECTIVE
43
enumerarea unităţilor elementare, sub forma: P = {1, 2, ..., i, ..., N}, unde
prin i s-a simbolizat o unitate elementară a populaţiei studiate.
Populaţia observată reprezintă ansamblul unităţilor elementare asupra
Populaţia cărora sunt înregistrate caracteristicile din planul cercetării statistice. Se
observată simbolizează prin:
PO = {i1,i2, ..., in}, unde: {i1, i2, ..., in} ⊆ {1, 2, ...N}.
Dacă n = N, atunci observarea este exhaustivă, iar în cazul n < N, avem o
observare parţială.
Se defineşte sondajul ca fiind o formă de cercetare statistică realizată
Sondajul pe baza unei părţi reprezentative din populaţia studiată. În cazul acestei
forme a cercetării statistice, populaţia observată constituie eşantionul ce se
va simboliza prin
Eşantionul E = {i1,i2,..., in}
iar n reprezintă volumul eşantionului.
Sondajul statistic, după scopul urmărit, este descriptiv sau analitic.
Obiectivul principal al sondajului descriptiv este acela al estimării unui
Sondajul anumit număr de caracteristici sau de atribute ale unei populaţii. Putem
descriptiv menţiona în acest sens anchetele pentru determinarea ponderii şomerilor în
populaţia activă dintr-o anumită regiune sau analiza modalităţii de cheltuire a
veniturilor populaţiei pentru produse alimentare, nealimentare şi servicii, etc.
Sondajele analitice sunt realizate în general pentru verificarea unor
ipoteze statistice sau analizarea legăturii dintre diverse variabile statistice. Se
Sondajul poate da ca exemplu de sondaj analitic cercetarea întreprinsă asupra unui
analitic eşantion pentru stabilirea unei legături între apariţia unei boli în rândul
populaţiei şi regiunea geografică în care locuieşte populaţia respectivă. De
cele mai multe ori, în cadrul unui sondaj se regăsesc, într-o măsură mai mare
sau mai mică, atât caracteristici ale sondajului descriptiv, cât şi ale celui
analitic.
Avantajele cercetării prin sondaj.
Utilizarea sondajului statistic, ca alternativă a observării totale, este un
Avantajele rezultat firesc al avantajelor majore pe care le aduce această formă de
cercetării cercetare statistică. În general, sondajul se utilizează întrucât asigură
prin reducerea costului de obţinere a informaţiei statistice. Prezentăm în
sondaj continuare câteva elemente care recomandă cercetarea prin sondaj.
1) Costul: costurile de obţinere a datelor statistice asupra cărora se vor
efectua prelucrările statistice sunt cu mult mai mici decât în cazul observării
exhaustive. Aceasta întrucât se înregistrează numai o parte a populaţiei de
referinţă. Astfel, este posibil ca pe baza unui eşantion relativ mic să obţinem
date ce caracterizează suficient de bine populaţia de referinţă. De exemplu,
cercetarea gradului de instruire a populaţiei României se poate efectua pe
baza unui recensământ sau considerând un eşantion reprezentativ format din
2000 de persoane.
2) Rapiditatea: reprezintă unul din argumentele importante ce a dus la
utilizarea cu preponderenţă a cercetărilor selective în studiul fenomenelor
socio-economice. Adesea, în studierea unui fenomen, se dispune de puţin
timp între momentul la care se stabilesc datele necesare cercetării şi acela în
care să se utilizeze rezultatele. Astfel, dacă se efectuează o anchetă statistică
pentru măsurarea eficacităţii unei campanii publicitare, observarea şi
44
culegerea datelor trebuie să fie realizate cât mai aproape de debutul acestei
campanii.
Cum eşantioanele sunt cu mult mai mici decât populaţia de referinţă,
are loc reducerea timpului de culegere şi prelucrare a datelor, în aceeaşi
măsură reducându-se timpul alocat pregătirii observării.
3) Exactitatea: în general, orice proces de observare statistică este
susceptibil de a fi afectat de erori, dar sondajul permite obţinerea de date
mai exacte decât cele dobândite în cadrul recensămintelor. Aceasta se
datorează, în principal, utilizării în procesul de culegere a datelor a unor
persoane competente, organizării riguroase a controlului în teren, etc.
4) Cerinţe speciale: există anumite domenii în care observările
exhaustive nu pot fi utilizate. Exemplul tipic în acest caz este analiza
calităţii unui lot de produse, caz în care, în mod frecvent, aceasta
presupune distrugerea totală sau parţială a produselor.
Limitele cercetării prin sondaj.
Limitele acestei forme de cercetare statistice sunt date, în general, de
apariţia, într-o măsură mai mare sau mai mică, a erorilor de eşantionare şi a
dificultăţilor legate de desemnarea eşantionului din populaţia de referinţă.
În contextul anchetelor statistice, conceptul de eroare desemnează
abaterea care se constată între rezultatul furnizat prin anchetă şi valoarea Eroarea
reală a unei caracteristici pentru populaţia studiată. În concluzie, precizia
este o măsura a abaterii între un estimator, obţinut plecând de la un
eşantion şi rezultatul ce s-ar fi determinat dacă se organiza o observare
totală.
Sondajele generează două tipuri de erori:
1) Eroarea de eşantionare se datorează observării numai a unei părţi
din populaţie, în locul unei observări exhaustive. Mărimea acestei erori este Eoarea de
dată de o multitudine de factori. Se observă, de exemplu, că eroarea de eşantio-
eşantionare se diminuează, în general, în măsura în care mărimea eşantionului nare
creşte.
Dar mărimea eşantionului nu este singurul element care influenţează
eroarea de eşantionare, aceasta fiind determinată în egală măsură şi de gradul
de variaţie al caracteristicilor studiate, de planul de eşantionare utilizat şi de
metodele de estimare a parametrilor. Într-o măsură considerabilă, eroarea de
eşantionare este determinată şi de caracteristicile populaţiei de referinţă din
care se extrage eşantionul. Metoda sondajului se aplică numai în măsura în
care populaţia de referinţă este suficient de mare, iar unităţile elementare care
o compun sunt suficient de omogene. În caz contrar, se va proceda la o
observare exhaustivă.
2) Erorile de observare sunt prezente în egală măsură atât în observările
parţiale, cât şi în observările exhaustive, din cele mai diverse cauze. Aceste erori Eroarea de
pot proveni din dificultăţile întâlnite în construirea şi actualizarea bazei de observare
sondaj sau a confuziilor generate prin maniera de formulare a întrebărilor în
cadrul chestionarelor elaborate. De altfel, în cadrul sondajelor are loc reducerea
acestei categorii de erori.
Cum aceste două tipuri de erori afectează exactitatea rezultatelor, sondajul
trebuie să le limiteze pe cât posibil.
45
5.2. PRECIZIA ESTIMAŢIEI, PROBABILITATEA DE
ÎNCREDERE, INTERVALUL DE ÎNCREDERE
46
Parametrii de selecţie folosiţi pentru estimarea celor din colectivitatea
generală trebuie să îndeplinească unele condiţii printre care:
- să ofere estimări nedeplasate, adică fără distrosiune, pentru orice volum
finit al colectivităţii de selecţie;
- să ofere estimări consistente, adică parametrii de selecţie să conveargă în
probabilitate către parametrii colectivităţii generale;
- să ofere estimări eficiente, adică dispersia parametrilor de selecţie să fie
cât mai mică.
În funcţie de măsura în care sunt îndeplinite aceste condiţii, se disting
două feluri de estimaţii:
- estimaţii absolut corecte;
- estimaţii corecte.
Estimarea absolut corectă are loc dacă:
- media estimărilor a mai multor eşantioane este egală cu estimatorul întregii
populaţii
m[θ SI ] = θ
- dispersia estimărilor a mai multor eşantioane tinde spre 0 când volumul
selecţiei tinde spre infinit
s[θ SI ] → 0
n→∞
Estimarea corectă are loc dacă:
- media estimărilor a mai multor eşantioane tinde spre estimatorul întregii
populaţii
m[θ SI ] → θ
- dispersia estimărilor a mai multor eşantioane tinde spre 0 când volumul
selecţiei tinde spre infinit;
s[θ SI ] → 0
n→∞
47
s s
P(m ∈ [ x − t ⋅ ;x + t ⋅ ]) = p
n n
unde m = media populaţiei
x = media eşantionului
σ 2 = dispersia populaţiei
s2 = dispersia eşantionului
48
Mărimea unui eşantion este dată de următoarele elemente: gradul de
variaţie a populaţiei de referinţă, forma de organizare a populaţiei, şi de aici tipul
de sondaj utilizat, de importanţa cercetării efectuate, de unde nivelul de
probabilitate acceptat pentru garantarea estimării, etc. Dimensiunea minimă a
eşantionului trebuie să asigure o reprezentativitate acceptabilă în procesul
cercetării statistice, care să nu ducă la distorsionarea rezultatelor.
În dimensionarea volumului unui eşantion mărimea populaţiei este
puţin importantă. Nu este corect raţionamentul potrivit căruia un spor al
ponderii eşantionului în volumul populaţiei totale va duce la o creştere a
reprezentativităţii. Aceasta este influenţată în mod direct de mărimea
absolută a eşantionului. De aceea, un eşantion format din 1200 de
persoane va crea acelaşi nivel de reprezentativitate pentru o populaţie
formată din 10 milioane sau 20 milioane persoane. O altă precizare în
dimensionarea eşantionului este următoarea: există un prag optim al
volumului eşantionului ce asigură reprezentativitatea la nivelul întregii
populaţii, dar nu pe diverse subpopulaţii constituite după unul sau mai
multe criterii de partiţionare. Nivelul optim este stabilit la 500-600 persoane.
Dacă însă populaţia de referinţă este constituită din două subpopulaţii, iar
eşantionul se repartizează proporţional pe cele două straturi, atunci cele
două subeşantioane nu sunt reprezentative pentru cele doua subpopulaţii.
De aceea, de exemplu, în acest caz, vom stabili un eşantion de 1000-1200
de persoane. Vom asigura astfel reprezentativitatea atât la nivelul
întregii populaţii, cât şi pe fiecare strat, permiţând compararea
parametrilor între cele două straturi.
Daca reprezentativitatea eşantionului este judecată după mărimea
erorii relative
m−x
Δx =
m
atunci dependenţa dintre mărimea eşantionului şi reprezentativitate va
avea reprezentarea grafică din figura următoare:
Δx
Δ x
Δx ’
| | | | |
n1 n2 n n3 n4 n
optim
49
După cum se observă şi în graficul anterior, dacă volumul
eşantionului creşte de la n1 la n2, unde n2 este o valoare mai mică decât cea
optimă, atunci creşterea reprezentativităţii este substanţială. În caz contrar,
daca n3 şi n4 sunt valori superioare celei optime, atunci creşterea
reprezentativităţii este practic nesemnificativă.
În stabilirea dimensiunii eşantionului, dacă se stabileşte apriori un prag de
semnificaţie α, se impune ca abaterile dintre media populaţiei de referinţă şi
mediile eşantioanelor ce se pot genera să respecte inegalitatea:
m−x ≤α , α ∈ ℜ+
unde α reprezintă eroarea limită admisă, sub forma absolută sau relativă.
Pentru determinarea volumului selecţiei se pleacă de la valoarea maximă
a erorii de reprezentativitate garantată cu probabilitatea p:
s 2 s2
Δx = t ⋅ de unde Δ x = t 2 ⋅
n n
şi rezultă volumul eşantionului de selecţie
t 2 ⋅ s2
n=
Δ2x
Se observă cei trei factori care determină volumul selecţiei:
- variaţia caracteristicii redată prin dispersia ei,
- garanţia care se acordă intervalului de încredere redată prin valoarea t din
tabelul Student, valoare care depinde de probabilitatea p,
- precizia selecţiei redată prin valoarea maximă a erorii de reprezentativitate
DICŢIONAR
50
Intervale de - sunt intervalele calculate cu ajutorul parametrilor cunoscuţi
încredere ai selecţiei şi cu ajutorul tabelelor statistice, prin care
estimăm parametrii întregii populaţii
TEST DE EVALUARE
51
TEMA VI. CORELAŢIE ŞI REGRESIE, SERII
CRONOLOGICE
CONŢINUT
REZUMAT
OBIECTIVE
Ştiinţa a dovedit că toate fenomenele – atât cele din natură cât şi cele
din societate – nu sunt izolate unele de altele, ci se află într-o strânsă
interdependenţă şi se condiţionează reciproc, producerea fiecărui fenomen
fiind efectul acţiunii unor fenomene şi în acelaşi timp cauză pentru
producerea altor fenomene.
Cercetarea statistică a legăturilor dintre fenomene prezintă o
importanţă deosebită, deoarece evidenţiază cauzele producerii fenomenelor
şi modul de acţiune a acestora asupra fenomenului cercetat; metodele
statistice de studiere a legăturilor reprezentând un instrument indispensabil
în procesul de luare a deciziilor.
Legăturile existente între fenomene sunt foarte variate. Astfel, se pot
întâlni:
- legături cauzale, în cazul în care un fenomen reprezintă cauza producerii
Tipuri de
altui fenomen;
legături între
- legături reciproce, în cazul în care nici unul din cele două fenomene nu
fenomene
poate fi considerat cauză sau efect, ele condiţionându-se reciproc;
- se pot întâlni cazuri în care între două fenomene nu există nici o legătură,
ele fiind independente.
52
În cazul legăturilor cauzale, caracteristica prin care se exprimă
fenomenul cauză poartă denumirea de caracteristică factorială sau Caracte-
determinantă şi se notează prin x. Dacă sunt mai mulţi factori care ristica
determină un efect, caracteristicile factoriale respective se notează cu x1, x2, factorială
x3, şi aşa mai departe.
Caracte-
Caracteristica prin care se exprimă manifestarea fenomenului efect se
ristica
numeşte caracteristică rezultativă sau determinată şi se notează prin y.
rezultativă
Legătura între caracteristicile exprimate numeric poartă numele de
corelaţie.
Corelaţie
După numărul caracteristicilor între care se studiază legătura
deosebim:
- legături simple, când se caracterizează legătura dintre caracteristica
rezultativă şi o singură caracteristică factorială;
- legături multiple, când se caracterizează legătura dintre caracteristica
rezultativă şi mai multe caracteristici factoriale. Tipuri de
După direcţia legăturilor, acestea pot fi: legături
- legături directe, când creşterea valorilor caracteristicii factoriale atrage între
creşterea valorilor caracteristicii rezultative; fenomene
- legături inverse, când creşterea valorilor caracteristicii factoriale atrage
după sine scăderea valorilor caracteristicii rezultative.
După expresia analitică a legăturilor deosebim:
- legături liniare, adică legături care pot fi exprimate printr-o funcţie liniară;
- legături neliniare sau curbilinii, care pot fi exprimate analitic prin funcţii
neliniare: parabola de diferite grade, hiperbola, exponenţiala, etc.
53
6.3. METODE ANALITICE DE CARACTERIZARE A CORELAŢIEI
Funcţie de
regresie
liniară
simplă
54
- funcţii de regresie neliniară
- funcţie de gradul doi y = a + b ⋅ x + c ⋅ x 2
Funcţii de
regresie
neliniară
simplă
c>0 c<0
1
- hiperbolă y=a+ ⋅b
x
- funcţia exponenţială y = a ⋅ b x
55
- funcţia logaritmică y = a + b ⋅ lg x
Estimarea ⎪
⎪
n ⋅ a + b ⋅ ∑
i =1
x i = ∑
i =1
yi
parame- ⎨ n n n
⎪a x + b x 2 = x ⋅ y
⎪⎩ ∑ ∑ ∑
trilor i i i i
funcţiilor i =1 i =1 i =1
multiplă ⎪ n ⋅ a + b ⋅ ∑ x 1 i + c ⋅ ∑ x 2 i = ∑ yi
⎪ i =1 i =1 i =1
⎪ n n n n
⎨ ∑ 1i
⋅ + ⋅ ∑ + ⋅ ∑ ⋅ = ∑ x 1i ⋅ y i
2
a x b x 1i c x 1i x 2i
⎪ i =1 i = 1 i = 1 i = 1
⎪ n n n n
⎪ ∑ 2i
⋅ + ⋅ ∑ ⋅ + ⋅ ∑ = ∑ x 2i ⋅ y i
2
a x b x 1i x 2i c x 2i
⎩ i =1 i =1 i =1 i =1
56
negative (în cazul corelaţiei indirecte, adică dacă x creşte y va descreşte).
Dacă b are valoarea zero, nu există corelaţie între cele două caracteristici.
Funcţia de regresie exprimă modul în care caracteristica factorială
determină schimbarea valorilor. Cu ajutorul funcţiei de regresie se poate
determina influenţa exercitată asupra caracteristicii rezultative şi pentru
valori ale caracteristicii factoriale care nu se găsesc în colectivitate. Această
operaţie nu este însă indicată să se facă pentru valori ale caracteristicii
factoriale prea îndepărtate de valorile existente în colectivitate.
Datorită naturii nedeterministe a relaţiei de independenţă, este
necesară introducerea unei măsuri a gradului de dependenţă liniară. Această
măsură poartă numele de coeficient de corelaţie, se notează cu r şi e dat de
relaţia: Coeficien-
n ⋅ ∑ xy − ∑ x ⋅ ∑ y tul de
r=
[ ][
n ⋅ ∑ y 2 − (∑ y ) ⋅ n ⋅ ∑ x 2 − (∑ x )
2 2
] corelaţie
(∑ y) 2
a ⋅ ∑ y + b ⋅ ∑ x1y + c ⋅ ∑ x 2 y−
R= n
(∑ y)
2
∑y n
2
−
R ∈ (0,1) cu următoarea semnificaţie: arată cât la sută din variaţia lui y este
datorată variaţiei globale a celor două variabile x1 şi x2.
57
6.4. SERII CRONOLOGICE SAU DE TIMP
Numărul locuitorilor
Anii
la sfârşitul anului
2000 15.240
2001 15.324
2002 15.455
2003 15.625
2004 15.794
58
Studiul unei serii dinamice poate fi considerat şi în sensul evidenţierii
unor aspecte care ţin de memoria fenomenului. Este posibil ca o reacţie să
persiste în fenomen o perioadă de timp, după care o altă reacţie să o
înlocuiască, prima dispărând. În acest scop, este important să putem estima
cât de mult timp un fenomen reţine o astfel de reacţie. Un alt aspect
important al seriilor dinamice este cel legat de faptul că reacţii succesive pot
să aibe efect pe perioade diferite de timp şi ca atare punerea lor în evidenţă
poate asigura o mai facilă previziune a evoluţiilor ulterioare a fenomenului.
De exemplu, anumite reacţii pot persista una, două perioade de timp,
pe când altele mai mult. Dacă avem de a face cu fenomene pentru care Fenomene
întreaga evoluţie anterioară este înmagazinată în ultima stare cunoscută, de tip
acestea poartă numele de fenomene de tip Markov. Markov
Pentru analiza unei serii dinamice se procedează astfel: se încearcă o
estimaţie a dinamicii fenomenului, pe baza unor date cunoscute, urmând ca
evoluţia ulterioară a fenomenului să fie prevăzută utilizând estimaţia astfel
determinată. În fapt, se determină o funcţie care să descrie evoluţia
trendului, care este principala componentă a oricărei serii dinamice.
Tendinţa cea mai adecvată se alege printr-o analiză a reprezentării grafice a
fenomenului respectiv (ca la alegerea funcţiei de regresie).
Există şi fenomene a căror tendinţă este bine cunoscută şi nu mai e
necesară reprezentarea grafică. Cea mai simplă reprezentare este funcţia
liniară de timp:
f(t) = a + bt Funcţia
în care f(t) reprezintă trendul. trend
Să considerăm o serie dinamică de forma y1, y2, ... yn, adică valori ale
aceluiaşi fenomen la momente succesive de timp. Vom presupune că seria
dinamică nu are decât cele două componente de bază (trendul şi cea
aleatoare). În aceste condiţii putem scrie:
y t = a + bt + ε t
Ne propunem să exprimăm funcţia trendului pe baza datelor
cunoscute. Pentru a estima parametrii a şi b se pune condiţia ca efectul
componentei aleatoare să fie minim posibil. Rezolvarea se face cu ajutorul
metodei celor mai mici pătrate, minimizând funcţia:
n
F(a , b ) = min ∑ (y t - a − bt )
2
t =1 Estimarea
În final se ajunge la rezolvarea următorului sistem de ecuaţii. parame-
⎧ na + b∑ t = ∑ y t trilor
⎨ funcţiei
⎩a ∑ t + b∑ t = ∑ ty t
2
trend
a şi b vor fi soluţia acestui sistem. Prin urmare, rezultă că trendul estimat liniară
este:
y t = a + bt
Pe baza acestei relaţii poate fi prezentată evoluţia ulterioară a
dinamicii fenomenului, dar numai pe componenta principală, adică pe trend,
şi numai pentru una sau două perioade ulterioare. Poziţia precisă viitoare a
fenomenului nu este previzibilă decât prezicându-se un interval probabil în
care aceasta se va afla. Trendul estimat pentru momentul următor va fi
y t +1 = a + b(t + 1) .
59
DICŢIONAR
TEST DE EVALUARE
60
TEMA VII. INDICII STATISTICE
CONŢINUT
REZUMAT
OBIECTIVE
61
Trebuie remarcat faptul că fenomenele supuse analizei cu ajutorul
metodei indicilor pot reprezenta mărimi de stoc (indicatori de nivel la un
moment în timp) sau mărimi de flux.
Metoda indicilor presupune o bună cunoaştere atât a esenţei
Metoda fenomenului economico-social care este analizat, cât şi a tipurilor şi
indicilor formelor indicilor ce pot fi folosiţi în cercetarea statistică.
62
caracteristici, unele sunt de natură complexă (notate mai jos cu „y”), variaţia
lor fiind determinată de modificarea a două sau mai multe caracteristici
factoriale de natură calitativă/intensivă (notate cu „x”) şi
cantitativă/extensivă (notate cu „f”). De exemplu, volumul valoric al
desfacerilor dintr-un magazin se obţine însumând vânzările realizate în
perioada cercetată pentru toate produsele existente în magazin, factorii
desfacerii fiind preţul (factor intensiv sau calitativ) şi cantitatea (factor
extensiv). Dată fiind variabilitatea factorilor, este necesară observarea şi
consemnarea lor la nivelul fiecărui element constitutiv al colectivităţii.
La rândul său, fiecare element apare ca o însumare a tuturor
evenimentelor care păstrează factorii intensivi şi extensivi constanţi. Astfel,
nu se va înregistra fiecare vânzare de marfă „A” la preţul „x”, elementul
constitutiv al ansamblului va fi format prin cumularea tuturor vânzărilor de
marfă „A” la preţul „x” realizate în perioada cercetată. Cantitatea vândută
apare ca factor extensiv şi se comportă ca frecvenţa de apariţie „f” a
factorului „x”. Notând cu „y” nivelul (volumul) valoric al elementului „A”
al colectivităţii, rezultă că:
y = x ⋅f
Trecând, în continuare, de la un element „A” la ansamblul de
elemente care ne interesează, se obţine:
∑y = ∑x ⋅f
Relaţia dintre volumul valoric al vânzărilor, preţ şi cantitate,
reprezintă cazul cel mai simplu de descompunere a unei caracteristici
complexe pe factorii săi determinanţi un singur factor calitativ/intensiv,
însoţit de factorul cantitativ/extensiv corespunzător.
Aplicarea metodei indicilor în studiul influenţei factorilor asupra
variaţiei unui fenomen complex necesită exprimarea relaţiilor dintre
caracteristicile factoriale sub formă multiplicativă, produsul lor Sistem de
constituindu-l variabila complexă. În acest context, aplicarea metodei indici
indicilor conduce la determinarea unui sistem de indici, a cărui menire este
descompunerea variaţiei caracteristicii complexe pe factori de influenţă.
Pentru fiecare element al ansamblului, variaţia nivelului absolut al
caracteristicii complexe se descompune cu uşurinţă în variaţia factorilor,
folosind indicii individuali:
y xf x f
i ly/ 0 = 1 = l l = l ⋅ l = i lx/ 0 ⋅ i fl / 0
y0 x 0f 0 x 0 f 0
xl fl
unde i lx/ 0 = şi i fl / 0 =
x0 f0
fiind indicii individuali ai factorilor care alcătuiesc sistemul ce determină Indicii de
modificarea fenomenului complex y. grup ai
Indicii de grup ai unei variabile statistice caracterizează variaţia medie unei
a fenomenului studiat la nivelul unei grupe sau pe total colectivitate. variabile
Cunoaşterea indicilor de grup ridică cele mai multe probleme care în
principal se referă la:
- posibilitatea însumării elementelor componente;
- alegerea bazei de raportare;
- alegerea formulei de calcul în funcţie de natura datelor de care se
63
dispune;
- alegerea sistemului de ponderare în funcţie de conţinutul indicatorului de
comparat şi relaţiile de sistem utilizate în aşa fel încât variaţia
fenomenului complex să poată fi descompusă în produsul influenţei
factorilor săi.
În practica statistică se folosesc mai multe tipuri de indici de grup.
După modul de calcul, indicii de grup se împart în: indici agregaţi,
indici sub formă de medie şi indici calculaţi ca raport de medii.
Indicii agregaţi sunt obţinuţi prin raportarea unor sume ale
Indici elementelor de agregare. Pe întreaga colectivitate, nivelul absolut al
agregaţi caracteristicii complexe rezultă prin însumarea observaţiilor făcute pe
fiecare element al ansamblului cercetat în perioada raportată ( ∑ y1 ),
respectiv, în perioada de bază ( ∑ y 0 ).
Indicele de grup al acestei caracteristici este:
I1y/ 0 =
∑ y1 = ∑ x 1f 1
∑ y0 ∑ x 0f 0
Cum fenomenele economico-sociale sunt alcătuite, de obicei, din
elemente eterogene, însumarea lor în expresie naturală nu este posibilă. Nu
se pot aduna, de pildă, cantităţile comercializate ale diferitelor mărfuri, după
cum nu are sens să cumulăm preţurile.
Pentru a putea stabili nivelurile totalizatoare ale factorilor ce
determină variaţia în timp, în spaţiu sau faţă de plan, a unui ansamblu de
elemente eterogene, nu se va recurge la stabilirea unor sume simple de tipul
∑ x şi respectiv ∑ f , deoarece logica economică le respinge. Este
necesară introducerea în calcul a unui comăsurător care să permită
însumarea. Acest comăsurător denumit şi pondere este factorul pereche,
pentru fiecare element al ansamblului, obţinându-se câte un produs x ⋅ f care
permite însumarea.
Agregatul x ⋅ f caracterizează nivelul absolut al întregului ansamblu.
Toţi indicii de grup care se bazează pe determinarea prealabilă a unor astfel
de agregate poartă numele generic de indici agregaţi.
Contribuţia fiecărui factor la schimbarea nivelului absolut al întregului
ansamblu de elemente se obţine lăsând liberă variaţia sa, dar considerând
comăsurătorul constant (de aceea comăsurătorul se mai numeşte şi pondere)
la nivelul fiecărui element al colectivităţii.
Contribuţia factorului intensiv la variaţia nivelului absolut al
ansamblului de elemente poate fi descrisă astfel:
I1x/ 0 =
∑x f
1
∑x f
0
I1f / 0 =
∑x ⋅f 1
∑x ⋅f 0
64
caracteristicilor înregistrate fie în condiţii concrete de timp şi spaţiu, fie sub
forma normativelor, ceea ce ridică problema alegerii elementelor de
pondere (vezi paragraful următor).
Indicii de grup agregaţi sunt aplicabili numai dacă informaţiile sunt
disponibile pentru fiecare variabilă cuprinsă în analiză până la nivel de
element constitutiv al colectivităţii cercetate. Folosind în mod combinat
unele mărimi absolute cu privire la variabila complexă şi indicii individuali
ai caracteristicilor analizate, indicii de grup pot fi determinaţi şi sub forma
de indici medii de grup, fie ca medie aritmetică ponderată, fie ca medie
armonică ponderată a indicilor individuali. Pentru o reflectare corectă a Indici sub
variaţiei fenomenului, media aritmetica se aplică, de obicei, atunci când se formă de
cunosc nivelurile de bază ale factorului de ponderare, iar media armonică a medie
indicilor individuali se foloseşte în situaţia înregistrărilor nivelurilor curente
ale factorului de ponderare.
Astfel, pentru indicele de grup al fenomenului complex y,
I1y/ 0 =
∑y 1
∑y 0
I1 / 0 y =
∑y 1
1
∑y i 1 y
1/ 0
(medie armonică ponderată a indicilor individuali ai fenomenului
complex).
În cazul în care colectivităţile sunt alcătuite din elemente
asemănătoare, omogene din punct de vedere statistic (de exemplu,
sortimentele unei aceleiaşi mărfi sau diferitele clasificări ale personalului
muncitor din reţeaua comercială, de turism şi alimentaţie publică etc.),
însumarea elementelor se poate face nu numai la variabila complexă ( ∑ y ),
ci şi la factorul cantitativ ( ∑ f ), iar factorul calitativ apare ca o mărime
medie, caracteristică pentru ansamblul de elemente cercetate:
∑y = ∑x ⋅f = x f
∑ f =x
∑f ∑f ∑
65
Acest nivel mediu al factorului calitativ/intensiv depinde, aşa cum se
poate vedea şi din relaţia de mai sus, pe de o parte, de nivelurile concrete
x i constatate la fiecare element „i” al colectivităţii, iar pe de altă parte şi de
fi
ponderea a fiecărui element sau, altfel spus, de structura
∑ fi
colectivităţii cercetate.
Variaţia factorului calitativ/intensiv se studiază în aceste condiţii
Indici aplicând indicii de grup calculaţi ca raport de medii cu structură
calculaţi variabilă, cu structură fixă şi de modificare a structurii.
ca raport Indicii calculaţi ca raport a două medii se folosesc pentru măsurarea
de medii variaţiei unei caracteristici calitative care se formează ca mărime medie la
nivelul unei grupe de unităţi sau pe total colectivitate. Ponderile folosite pot
fi absolute (f) sau relative (f*). Pentru simplificarea formulelor de calcul
vom folosi ponderile absolute (f).
Dacă notăm cu:
x = nivelul mediu al caracteristicii calitative;
x = nivelurile individuale ale caracteristicii derivate (factor calitativ),
atunci sistemul de indici va fi:
- indicele de structură variabilă I1x/(0x ,f ) :
x1 ∑x f : ∑x f
1 1 0 0
. var iab. = =
x ( x ,f )
Indice de I str
structură
x0 ∑f ∑f 1 0
66
Δxstr( xf. var) iab. = Δxstr( x.fixa
)
+ Δxm( f.str) .
∑x f − ∑x f
Δxstr( xf. var) iab. =
1 1 0 0
∑f ∑f 1 0
Δxstr( x.fixa
)
=
∑x f − ∑x f
1 1 0 1
∑f ∑f1 1
Δxm( f.str) . =
∑x f − ∑x f
0 1 0 0
∑f ∑f1 0
67
posibilităţii de trecere dintr-o bază de calcul în alta. Dacă se
consideră perioadele analizate „t”, „p”, „r” şi se calculează un indice al
perioadei „p” cu baza în perioada „t” şi un alt indice al perioadei „r” cu
baza în „p”, atunci produsul lor trebuie să fie egal cu indicele perioadei „r”
cu baza perioadei „t”, adică:
Ip / t ⋅ Ir / p = Ir / t
f) testul de comensurabilitate care presupune că valoarea indicelui trebuie
să fie independentă de schimbările unităţii de măsură.
Baza de Baza de raportare trebuie astfel stabilită încât indicele să reflecte
variaţia reală a fenomenului/activităţii. Această cerinţă este îndeplinită dacă
raportare
mărimea luată în considerare este un nivel obişnuit al caracteristicii, în
sensul că nu reprezintă o situaţie de excepţie pentru colectivitatea cercetată.
Formula Formula de calcul se alege în funcţie de datele disponibile şi de
de calcul natura elementelor din colectivitatea care alcătuieşte fenomenul sau
activitatea supusă analizei, existând posibilitatea de a utiliza indicii agregaţi
sau indicii medii de grup, respectiv indicii obţinuţi ca valori de medii.
Sistemul de ponderare folosit la construirea indicilor de grup a
Sistemul ridicat cele mai multe probleme în teoria şi practica statistică. De-a lungul
de timpului au fost concepute câteva sute de posibilităţi de ponderare a
ponderare indicilor, dintre acestea teoria şi practica statistică reţinând câteva
propuneri, prezentate în cele ce urmează, împreună cu principalele avantaje
şi/sau dezavantaje ale utilizării lor.
Ponderare Ponderea constantă (fixă), propusă de E. Laspeyres în 1864
constantă pentru calculul unui indice de grup al preţurilor, conduce la scrierea
indicilor factoriali potrivit relaţiilor ce urmează, variaţia fiecărui factor fiind
ponderată cu nivelurile de bază f 0 şi respectiv x 0 ale comăsurătorului.
Rezultă:
I1x/ 0 =
∑ x 1f 0 pentru factorul intensiv,
∑ x 0f 0
respectiv,
I1f / 0 =
∑ x 0 f1 pentru factorul extensiv.
∑ x 0f 0
Ponderare Ponderarea variabilă (curentă) propusă de H. Paasche în 1874 pentru
variabilă calculul unui indice de grup al preţurilor (de fapt, cotaţii de bursă) are în
vedere nivelurile curente ale comăsurătorului. În aceste condiţii, variaţia
factorului intensiv se ponderează cu f1 , potrivit relaţiei:
I1x/ 0 =
∑x f
1 1
∑x f
1 0
I1f / 0 =
∑x f
1 1
∑x f
1 0
68
de altfel, sub forma testului de reversibilitate a factorilor. Într-adevăr, nici
formulele Laspeyres, dar nici formulele Paasche nu alcătuiesc un sistem
compatibil de relaţii de calcul, întrucât produsul variaţiei factorilor ( I x I f ) nu
conduce la obţinerea nivelului relativ al variabilei complexe ( I y ).
Cu toate acestea, în unele ţări se aplică în diferite variante fie sistemul
de ponderare fixă, fie ponderea variabilă.
În activitatea practică, atât variabila de tip intensiv, cat şi cea de tip
extensiv sunt în continuă schimbare, ceea ce înseamnă că indicii calculaţi
pentru aceeaşi variabilă cu sisteme de ponderare diferite numai întâmplător
pot sa aibă aceeaşi valoare. Din experienţa practică a folosirii indicilor a
rezultat că pentru indicele variabilei cantitative să se folosească sistemul de
ponderare al lui Laspeyres, iar pentru indicele variabilei calitative să se
utilizeze sistemul de ponderare al lui Paasche.
Mai există şi alte sisteme de ponderare printre care cel mai utilizat
este cel propus de Fischer denumit „indice ideal” şi calculat ca o medie
geometrică a indicilor Paasche şi Laspeyres, după formula:
- pentru variabila cantitativă (f):
I1f / 0 =
∑f x ⋅ ∑f x
1 0 1 1
∑f x ∑f x
0 0 0 1
I1x/ 0 =
∑f x ⋅ ∑f x
0 1 1 1
∑f x ∑f x
0 0 1 0
DICŢIONAR
69
- dacă la baza comparaţiei stă nivelul unei colectivităţi
Indice similare, localizate într-o altă unitate administrativă
teritorial sau într-o altă zonă geografică, indicele calculat se
numeşte indice teritorial
- se calculează prin raportarea nivelului planificat la
Indicii realizările precedente, obţinându-se astfel un indice al
planului sarcinii de plan, sau, prin compararea nivelului
realizărilor curente cu nivelul planificat, indicele obţinut
reflectând - în expresie relativă - realizarea/îndeplinirea
planului
Calculul - ca modalitate de calcul statistic, indicele se determină sub
indicilor formă de raport între două niveluri referitoare la aceleaşi
caracteristici
Indici - indici simpli (individuali sau elementari) sunt calculaţi
simpli ca un raport între două valori situate la un nivel
elementar
Sistem de - are ca menire descompunerea variaţiei caracteristicii
indici complexe pe factori de influenţă.
- indicii de grup ai unei variabile statistice caracterizează
Indici de
variaţia medie a fenomenului studiat la nivelul unei grupe
grup
sau pe total colectivitate
- toţi indicii de grup care se bazează pe determinarea
Indici prealabilă a unor agregate care caracterizează nivelul
agregaţi absolut al întregului ansamblu poartă numele generic de
indici agregaţi
TEST DE EVALUARE
70
BIBLIOGRAFIE
1. Andrei T., Stancu S., Pele D. T., Statistică, teorie şi aplicaţii, Ediţia
II, Editura Economică, Bucureşti 2002
2. Baron T., Anghelache C., Ţiţan E., Statistică, Editura Economică,
Bucureşti 1996
3. Bădiţă M., Cristache S. E., Statistică, aplicaţii practice, Editura
Mondan, Bucureşti 1998
4. Constantin Gh., Surulescu N., Zaharie D., Lecţii de statistică
descriptivă, Tipografia Universităţii de Vest, Timişoara 1997
5. Goleţ I., Statistică, teorie şi aplicaţii în economie, Editura
Politehnica, Timişoara 1998
6. Isaic-Maniu A., Mitruţ C., Voineagu V., Statistica pentru
managementul afacerilor, Editura Economică, Bucureşti 1999
7. Mendenhall W., Reinmuth J., Beaver R., Duhan D., Statistics for
Management and Economics, Ediţia V, Editura Duxbury, Boston
1986
8. Negoescu Gh., Radu R. I., Statistică economică, studii de caz,
Editura Evrika, Brăila, 1999
71