Documente Academic
Documente Profesional
Documente Cultură
Curs Complet Statistica
Curs Complet Statistica
Cuprins:
Introducere
Cursul de “Statistică” se adresează tuturor studenţilor înscrişi la programul de
studiu CU FRECVENŢĂ, organizat de toate facultăţile Academiei de Studii
Economice şi face parte din planul de învăţământ aferent anului I sau II, după caz.
Dacă unii dintre voi aţi venit cu temerea că veţi avea de înfruntat o disciplină
dificilă şi prea puţin prietenoasă, e timpul să va eliberaţi de astfel de temeri. Şi –
mergând cu gândul la final, sunt convins că atunci veţi fi bucuroşi că aţi parcurs
cursul de Statistică, pentru că:
ceea ce vă învaţă statistica vă va fi foarte util, chiar necesar în practicarea
profesiei pe care v-aţi ales-o;
veţi deprinde “modul de gândire statistic”, care vă va ajuta să rezolvaţi în
mod eficient diferite sarcini profesionale;
veţi primi un bagaj de cunoştinţe de bază în statistică, a căror aplicare este
absolut necesară şi utilă în întâmpinarea aspiraţiilor voastre de înaintare pe
scara ierarhiei profesionale;
deprinderea metodelor statistice de bază vă va fi utilă şi în plan personal,
în viaţa de zi cu zi, vă va ajuta să vă extindeţi orizontul intelectual, să
elaboraţi analize critice ale informaţiilor statistice pe care le veţi găsi în
ziare sau reviste de medicină, sănătate, finanţe şi alte domenii;
veţi realiza că a cunoaşte statistica a devenit, în zilele noastre, o parte
integrantă a unei persoane cu o educaţie completă;
şi, nu în ultimul rând, veţi găsi, poate, ceva captivant în provocările pe care
vi le adresează autorii cursului sub forma testelor de autoevaluare şi de
verificare a cunoştinţelor, ca şi prin indicaţiile primite în aplicarea softurilor
statistice (Excel – Modulul Data Analysis).
2. Evaluarea cunoştinţelor
4. Structura cursului
Cuprinsul cursului:
Software statistic
EXCEL - Modulul Data Analysis.
Cuprins:
1
“arta” de mânuire corectă a acestor instrumente. În viaţa de zi cu zi, statistica ne oferă o paletă
largă de tehnici cu aplicabilitate în cele mai variate câmpuri de interes care ne ajută să
rezolvăm problemele practice şi ne învaţă să raţionăm corect. Pentru unii, statistica înseamnă
numărul de goluri, de lovituri libere sau de kornere înscrise într-un meci de fotbal, pentru alţii
înseamnă nivelul Produsului Intern Brut, numărul şomerilor, rata de ocupare a forţei de
muncă, indicele preţurilor sau rata inflaţiei, alături de alte asemenea date regăsite într-o
publicaţie de specialitate, aşa cum pentru alţii statistica poate însemna o ramură a ştiinţei, o
ştiinţă de sine stătătoare sau o disciplină de învăţământ. “Instrumentarul” acestei ştiinţe se
poate aplica, practic în toate celelalte ştiinţe, fie că este vorba de psihologie, de medicină,
fizică, chimie, meteorologie sau istorie.
Aşadar, statistica reprezintă ştiinţa colectării datelor, a prezentării lor într-o formă
sistematică, a analizării acestora şi a interpretării informaţiilor numerice obţinute.
2
inferenţiale, ei pot formula concluzii valabile, în anumiţi termeni probabilistici, pentru
întreaga colectivitate.
3
Putem spune că metoda statisticii este constituită din „totalitatea operaţiilor, tehnicilor,
procedeelor şi metodelor de investigare statistică a fenomenelor ce aparţin unor procese
de tip stochastic”.
În ideea obţinerii tuturor informaţiilor de care avem nevoie şi a realizării unei economii
de resurse materiale, financiare şi umane este foarte importantă definirea corectă a populaţiei
statistice de interes, cu specificarea dimensiunii temporale, spaţiale şi organizatorice în care se
înscrie populaţia. În trecut, prin populaţie se înţelegea o mulţime (o colectivitate) de persoane
(indivizi), astăzi, însă, ea şi-a extins sensul, sfera de cuprindere, putându-se vorbi de populaţii
de animale, obiecte, opinii, păreri, evenimente, măsurători etc. O populaţie se consideră
integral definită, specificată dacă s-a elaborat lista completă a unităţilor care o compun. Unele
populaţii statistice, având foarte multe elemente şi fiind, deci, foarte numeroase, pot fi
considerate cu caracter infinit.
Cu cât este mai numeroasă o colectivitate, cu atât devine mai dificilă cercetarea tuturor
elementelor ei. O astfel de cercetare poate fi consumatoare de timp şi costisitoare. În acest caz,
soluţia poate fi extragerea unei subcolectivităţi din colectivitatea generală (numită şi colectivitate
parţială, eşantion sau colectivitate de selecţie).
b. Unitatea statistică
Este elementul, entitatea de sine stătătoare a unei populaţii statistice, care posedă o serie
de trăsături caracteristice ce-i conferă apartenenţa la populaţia studiată.
4
Se pot întâlni două tipuri de unităţi statistice:
- simple (un salariat, un agent economic, un obiect, o părere);
- complexe (o grupă de studenţi sau o echipă de salariaţi, o familie sau o gospodărie, o
categorie de mărfuri)
variabile cantitative sau numerice (exprimate prin numere, adică descriu prin
numere rezultatul unei numărători sau măsurători; de exemplu: profitul unor firme,
vârsta în ani împliniţi a unor persoane etc.);
variabile calitative sau nenumerice (exprimate prin cuvinte, care descriu prin
cuvinte un anumit tip calitativ al unităţii de la care s-a înregistrat; de exemplu:
liceul absolvit, limba străină cunoscută cel mai bine de nişte persoane etc.)
III. după tipul variaţiei, variabilele numerice pot fi:
5
cu variaţie continuă, atunci când pot lua, practic, orice valoare într-un interval din
domeniul lor de valori;
cu variaţie discontinuă (discrete), atunci când pot lua doar anumite valori, strict
determinate într-un interval din domeniul lor de valori.
În cele mai multe cazuri, deosebirea, diferenţa între variabilele cu variaţie continuă şi
cele cu variaţie discretă se poate face stabilind dacă datele provin dintr-o numărătoare sau
dintr-o măsurătoare (primele sunt discrete, cele din urmă continue).
Multe variabile continue pot lua valori aparent discrete (de exemplu: vârsta se
exprimă, de regulă, în ani împliniţi), dar acest lucru se întâmplă deoarece în practică se
limitează, uneori, precizia datelor înregistrate.
variabile primare (sunt variabilele care se obţin, de obicei, direct din procesul de
culegere a datelor, de la unităţile colectivităţii statistice);
variabile derivate (sunt variabilele rezultate în urma aplicării unui model de calcul
asupra caracteristicilor primare).
6
variabile independente – reprezintă variabile ce pot fi utilizate pentru a descrie sau
a explica variaţiile, diferenţele (modificările) survenite în alte variabile, pe care le
influenţează;
variabile dependente – un rezultat ce prezintă un anumit interes, observat şi
măsurat pentru a evalua efectele unei variabile independente (exemplu: dacă
pentru 30 de magazine s-au înregistrat: suprafaţa comercială şi valoarea vânzărilor,
atunci suprafaţa comercială este variabila independentă, cauzală, iar valoarea
vânzărilor reprezintă variabila dependentă, rezultativă).
d. Varianta statistică
Nivelul sau valoarea unei variabile, indiferent de natura/tipul acestei variabile, întâlnită
la o anumită unitate se numeşte variantă.
f. Date statistice
7
date univariate, atunci când datele statistice analizate se referă la o singură
variabilă sau caracteristică statistică (exemplu: profitul fiecărui agent economic
dintr-o ramură de activitate);
date bivariate, atunci când datele statistice se referă la două variabile; în acest caz,
se poate studia separat fiecare caracteristică în parte, sau se poate analiza una
dintre variabile, în relaţie cu cealaltă variabilă, punându-se în evidenţă posibila
legătură dintre ele (exemplu: profitul şi forma de proprietate a fiecărui agent
economic dintr-o ramură de activitate);
date multivariate, atuci când datele statistice se referă la trei sau mai multe
variabile statistice; şi în acest caz se pot analiza separat datele, pentru fiecare
variabilă statistică în parte, sau interdependenţa dintre mai multe caracteristici
(exemplu: profitul, forma de proprietate, numărul de ani de activitate, numărul de
angajaţi, numărul de oraşe în care au filiale fiecare dintre agenţii economici ce
activează într-o ramură). În acest ultim exemplu, întâlnim date cantitative (profitul,
numărul de ani de activitate etc. şi date calitative (forma de proprietate); cele
numerice pot fi continue (profitul) sau discrete (numărul de angajaţi, sau numărul
oraşelor în care agenţii economici au filiale).
După momentul sau perioada de timp la care se referă datele înregistrate, putem
întâlni:
date dinamice, atunci când datele se referă la mai multe momente sau perioade de
timp succesive (exemplu: profitul trimestrial şi numărul mediu trimestrial al
angajaţilor unui agent economic din construcţii, înregistrate pentru opt trimestre
consecutive );
date statice, atunci când ele se referă la acelaşi moment / perioadă de timp
(exemplu: profitul şi numărul angajaţilor pentru 10 agenţi economici, la sfârşitul
semestrului I 2005).
Pentru ca datele statistice să poată fi supuse prelucrării prin metode statistice, ele
trebuie măsurate, adică exprimate cantitativ, cu ajutorul numerelor.
Măsurarea este operaţia prin care fiecărei observaţii, fiecărui aspect cantitativ sau
calitativ al unităţilor statistice (obiectelor, evenimentelor etc.) li se atribuie în mod
sistematic numere.
8
Modalitatea prin care se atribuie această valoare numerică, precum şi semnificaţia ei
depinde de nivelul de măsurare. Fiecărui nivel de măsurare îi corespunde o anumită scală de
măsurare, care poate fi identificată în funcţie de operaţiile matematice ce pot fi efectuate cu
datele statistice. Toate operaţiile matematice permise pentru o anumită scală sunt valabile şi
pentru toate scalele inferioare ei, dar nu şi pentru cele următoare.
Cele patru scale de măsurare, în ordinea crescătoare a preciziei, sunt:
a. Scala nominală (categorială)
Este scala cu cel mai scăzut nivel al preciziei, utilizată pentru a atribui variantelor
caracteristicii măsurate „însuşiri”, cu scopul de a stabili diferenţe calitative între
observaţii.
În acest caz, valorile numerice atribuite pe această scală pot avea nişte numere de
ordine (numite şi „ranguri”), între care se pot scrie relaţii în termenii unor „inegalităţi”: a<b
sau a>b. Astfel, relaţiile de ordine întâlnite între categoriile acestei scale pot fi: mai mare sau
mai mic, mai rapid sau mai lent, mai mult sau mai puţin inteligent, mai mult sau mai puţin
important etc.
9
Aceste expresii numerice sau nenumerice, ce constituie categoriile scalei conţin mai
multă informaţie cantitativă decât în cazul scalei nominale, dar mai puţină decât informaţia
numerică inclusă în cazul scalelor următoare. Scala ordinală indică poziţia unui element într-o
serie ordonată, nu şi magnitudinea sau mărimea diferenţei existente între două poziţii ale
scalei (această scală nu ne permite să afirmăm cu câte „unităţi de măsură” diferă o categorie
de categoria învecinată).
c. Scala de interval (cardinală)
Caracteristici:
- este prima scală numerică (se aplică variabilelor numerice);
- permite, pe lângă stabilirea unei relaţii de ordine între variantele numerice ale
acestei scale şi determinarea şi interpretarea diferenţelor dintre acestea;
- valorile numerice acordate pe această scală au semnificaţie cantitativă, de aceea
este permisă însumarea sau scăderea lor;
- fixarea punctului de origine (zero) poate fi făcută arbitrar (originea nu este fixă);
- unitatea de măsură poate fi aleasă arbitrar.
Caracteristici:
- se aplică variabilelor numerice, având cel mai înalt nivel de precizie;
- două valori, măsurate pe această scală se află, indiferent de unitatea de măsură
folosită, în acelaşi raport una faţă de alta;
- pe această scală sunt permise şi operaţiile de multiplicare şi de divizare;
- punctul de origine (zero) este unul fix, rigid, este zero absolut, matematic şi
reprezintă absenţa caracteristicii;
- unitatea de măsură poate fi aleasă arbitrar.
10
mediu”, „egal cu salariul mediu”, „peste salariul mediu”, atunci vom utiliza o scală calitativă:
scala ordinală.
11
Procesul de cercetare statistică presupune parcurgerea următoarelor etape, succesive şi
distincte, în funcţie de scopul şi obiectivele urmărite:
În această unitate de învăţare aţi făcut cunoştinţă cu ceea ce înseamnă STATISTICA, adică
ştiinţa colectării datelor, a prezentării lor într-o formă sistematică, a analizării acestora şi a
interpretării informaţiilor numerice obţinute.
Obiectul de studiu al statisticii îl reprezintă fenomenele de masă – adică fenomenele şi procesele care
prezintă următoarele particularităţi:
- se întâlnesc la un număr mare de unităţi;
- variază ca nivel de la o unitate la alta;
- sunt definite, circumscrise în timp, în spaţiu şi ca structură organizatorică (adică sunt entităţi
distincte circumscrise în timp, spaţiu şi organizatoric);
Principalele concepte de bază cu care opereză statistica sunt:
- populaţia statistică - totalitatea elementelor de acelaşi fel, cu trăsături esenţiale comune,
supuse studiului statistic;
- unitatea statistică – elementul unei populaţii statistice;
- variabila statistică – o trăsătură, o însuşire a unităţii statistice;
- varianta unei variabile – nivelul pe care-l înregistrează variabila la o unitate statistică;
- frecvenţa unei variante – numărul de apariţii al unei variante;
- date statistice – ansamblul valorilor colectate în urma unei cercetări statistice.
Pentru măsurarea datelor statistice se folosesc patru scale de măsurare:
12
- scala nominală – destinată variabilelor calitative
- scala ordinală - destinată variabilelor calitative
- scala de inverval - destinată variabilelor numerice
- scala de raport - destinată variabilelor numerice
Efectuarea unui proces de investigaţie statistică presupune parcurgerea a trei etape distincte,
succesive:
- etapa de culege şi înregistrare a datelor (observarea statistică);
- etapa de prelucrare a datelor;
- etapa de analiză şi interpretare a rezultatelor.
13
CURS STATISTICĂ - Lecţia nr. 3
Cuprins:
1. Obiectivele Lecţiei.
2. Surse de date statistice.
3. Observarea statistică: conţinut, necesitate, obiective.
4. Planul observării statistice.
5. Metode de observare statistică
5.1. Recensământul statistic.
5.2. Sondajul statistic.
5.3. Ancheta statistică.
5.4. Alte metode de observare statistică.
6. Erori de observare.
7. Rezumatul Lecţiei.
1. Obiectivele lecţiei
1
fidelă a situaţiei existente. Acest lucru se realizează prin strângerea, colectarea datelor care să
exprime starea de fapt, adică prin observarea statistică.
Datele necesare se pot obţine din diferite surse:
a) din investigaţii statistice special organizate, atunci când datele nu există iniţial sub forma
necesară – acestea sunt datele primare (de exemplu prin recensământ statistic sau sondaj
statistic);
b) din sistemul informaţional existent (de exemplu: din evidenţele curente ale agenţilor
economici, bănci şi baze de date pe suport de hârtie sau electronic al unor instituţii ale
administraţiei centrale şi locale etc.) şi se numesc date secundare.
Datele statistice sunt necesare pentru a face posibilă desfăşurarea procesului cercetării
statistice, pentru a măsura performanţele proceselor social-economice, pentru a formula căi
alternative de acţiune într-un proces de luare a deciziilor etc. Datele pot fi privite, astfel, ca
informaţii necesare pentru a conferi rigoare ştiinţifică deciziilor, în situaţii specifice. Pentru ca
analiza statistică să fie utilă şi folositoare actului decizional, datele de intrare trebuie să fie
corecte şi adecvate scopului. De aceea, identificarea datelor necesare şi modul de colectare a
acestora sunt extrem de importante. Dacă datele sunt afectate de erori, dacă sunt ambigue şi
denaturate, chiar şi cele mai rafinate şi sofisticate metode de prelucrare sunt ineficiente pentru
a compensa deficienţele; rezultatele, evident, nu vor fi corecte şi utile.
Observarea statistică este prima etapă a investigaţiei statistice, care constă în culegerea
şi înregistrarea în mod sistematic şi unitar a datelor statistice, de la unităţile
colectivităţii, referitoare la toate caracteristicile incluse în programul cercetării.
2
- îndeplinirea condiţiei de calitate presupune asigurarea autenticităţii, a caracterului real
al datelor, astfel încât rezultatele obţinute prin prelucrarea acestor date să fie cât mai
exacte şi să ducă la adoptarea unor decizii cât mai pertinente.
În cazul în care pentru obţinerea datelor statistice este necesară organizarea unei
investigaţii statistice, atunci ea trebuie făcută în conformitate cu un anumit plan, pentru a ne
asigura că obţinem, cu un minim de resurse materiale şi financiare, rezultate cât mai exacte şi
mai pertinente.
3
Acest lucru se realizează cu ajutorul nomenclatoarelor, al clasificărilor existente, sau
se apelează la studiile anterioare efectuate în domeniul de interes (dacă există). Gradul de
întindere a colectivităţii de observare este în funcţie de metoda de observare ce va fi utilizată:
- dacă este vorba de o metodă de observare totală, atunci obiectul observării va fi
format din toate unităţile colectivităţii,
- dacă va fi aplicată o metodă de observare parţială, vor fi înregistrate date doar de la
o parte a unităţilor colectivităţii şi doar ele vor forma obiectul observării.
În ambele cazuri însă, pentru identificarea corectă şi completă a colectivităţii ce va fi
supusă observării este necesară determinarea coordonatelor de spaţiu, timp şi de organizare
ale colectivităţii de interes.
C. Unitatea de observare
Este unitatea la care se referă caracteristicile înregistrate, simplă (dacă este vorba de un
salariat, un obiect etc.) sau complexă (dacă se are în vedere o echipă sau o familie).
Locul observării este, de regulă, locul unde se produce, unde are loc fenomenul
urmărit şi studiat.
E. Lista caracteristicilor urmărite,
Formează, aşa cum am văzut, programul (planul) observării în sens restrâns; presupune
stabilirea tuturor variabilelor care trebuie înregistrate, astfel încât să se asigure
studierea fenomenului de interes sub toate aspectele prevăzute în scopul cercetării,
evitând, în acelaşi timp, redundanţa informaţiilor.
4
Caracteristicile pot apare sub diferite forme:
- sub forma unor indicatori – în raportările statistice pe care le completează agenţii
economici;
- sub forma răspunsurilor la întrebările dintr-un chestionar – în cazul investigaţiilor
statistice special organizate.
Pentru a obţine toate datele necesare cercetării şi a îndeplini cu succes scopul
observării, proiectarea chestionarelor trebuie făcută astfel încât să se asigure o structură logică
şi o formulare bine gândită a întrebărilor. Prin structura sa, chestionarul trebuie să realizeze o
trecere firească, o succesiune logică de la o întrebare la alta, de la un subiect de discuţie la
altul, deoarece dacă s-ar trece brusc şi în mod contrar logicii fireşti de la un subiect la altul,
intervievatul (respondentul) ar fi dezorientat şi ar fi influenţat în acordarea răspunsului.
Deseori, se foloseşte ca tehnică generală trecerea de la întrebările generale către cele specifice
sau referitoare la un anumit subiect.
Într-un chestionar putem întâlni întrebări deschise (în care respondentul poate da orice
răspuns, de tipul: “Ce profesie aveţi?”) sau întrebări închise (în care respondentului îi sunt
indicate o serie de posibile răspunsuri, din care poate alege unul sau mai multe, de genul:
“Câte persoane are familia dumneavoastră?” cu variantele: 1, 2, 3, 4, 5 sau mai multe).
Întrebările mai pot fi, de asemenea, factuale (de tipul: “Ce număr purtaţi la pantofi?”)
sau de opinie (de tipul: “ce părere aveţi de intenţia Guvernului de a majora TVA-ul?”, cu
variantele de răspuns: “Nu sunt de acord”, “Sunt de acord”, “Nu ştiu”).
F. Formularele de înregistrare
Formularele pot fi de două tipuri: formulare tip fişă sau formulare tip listă.
În formularul tip fişă:
- se înregistrează datele referitoare la o singură unitate statistică (de aceea fişa
este un formular individual);
- se utilizează atunci când unităţile statistice de la care se înregistrează sunt mai
răspândite, mai dispersate în profil teritorial,
- se utilizează atunci când programul observării este mai bogat (cuprinde mai
multe caracteristici ce vor fi înregistrate de la fiecare unitate statistică);
În formularul tip listă :
5
- se vor înregistra date pentru mai multe unităţi de observare (formular
colectiv);
- se foloseşte cu precădere atunci când unităţile statistice sunt mai concentrate
teritorial (când se regăsesc multe unităţi statistice într-o arie teritorială restrânsă)
- se utilizează atunci când programul observării este mai sumar (cuprinde mai
puţine caracteristici ce trebuie înregistrate de la fiecare unitate statistică).
Pentru asigurarea clarităţii întrebărilor dintr-un formular, acesta poate fi însoţit de
instrucţiuni (tipărite direct pe formular sau într-o anexă a acestuia), astfel încât respondenţii să
completeze formularul cu răspunsuri cât mai reale şi mai fidele realităţii. Pentru ca datele
oferite ca răspuns să fie prelucrate în mod automat, se utilizează formulare tipizate, iar
răspunsurile vor fi codificate.
G. Măsuri organizatorice.
Există o gamă variată de metode de observare, utilizate împreună sau separat, pentru a
obţine o informaţie statistică cât mai reală, completă şi neredundantă. Metodele de observare
se clasifică după următoarele criterii:
I. după frecvenţa înregistrării în timp a datelor despre fenomenele şi procesele
economico-sociale, putem avea:
6
a. observări curente, atunci când fenomenele şi procesele sunt urmăriate în mod
continuu, iar datele ce le caracterizează sunt înregistrate permanent (de
exemplu: fenomenele demografice: natalitatea, mortalitatea, nupţialitatea,
divorţialitatea care se regăsesc în „statistica stării civile”; rezultatele obţinute
de agenţii economici etc.);
b. observări periodice, atunci când datele referitoare la fenomene sau procese
economico-sociale se înregistrează cu o frecvenţă aproximativ regulată, la
intervale egale de timp (de exemplu: recensăminte ale populaţiei, recensăminte
agricole etc.);
c. observări ocazionale, atunci când datele referitoare la fenomenele sau
procesele economico-sociale se înregistrează discontinuu, ocazional, cu un
prilej sau scop special, în mod unic, motiv pentru care se mai numesc „special
organizate” (de exemplu: o anchetă de opinie privind atitudinea cetăţenilor
referitoare la un nou act normativ recent intrat în vigoare; o anchetă de opinie
privind preferinţele participanţilor la o expoziţie de modă etc.).
II. după gradul de cuprindere a populaţiei de observare delimitate, întâlnim:
a. observări totale, atunci când vor fi supuse observării toate unităţile populaţiei
statistice (de exemplu: recensământul populaţiei şi locuinţelor);
b. observări parţiale – atunci când vor fi supuse observării doar o parte a
unităţilor populaţiei statistice (de exemplu: anchete, sondaje statistice);
III. după modul de obţinere a datelor, avem:
a. observări primare (directe), în care datele se obţin prin culegerea,
înregistrarea lor direct de la unităţile statistice (de exemplu: recensământul
populaţiei, o anchetă de opinie);
b. observări secundare (indirecte) – în care se obţin datele secundare, care se
preiau din documentele existente (de exemplu: datele preluate din evidenţele
contabile).
5.1. Recensământul statistic
7
Recensământul este întâlnit din timpuri străvechi, încă din antichitate, când romanii,
egiptenii efectuau recensăminte ale populaţiei; din sfera populaţiei, recensământul s-a extins
şi în sfera locuinţelor, animalelor, unităţilor din industrie, agricultură, comerţ („recensământ
economic”). În domeniul populaţiei recensământul are o periodicitate de 10 ani, iar în
domeniul economic de 5 ani. Recensământul este un tip de înregistrare foarte laborios,
necesitând un volum mare de cheltuieli, personal numeros, măsuri organizatorice detaliate,
precum şi o prelucrare complexă a informaţiilor înregistrate.
Recensământul populaţiei este una din principalele surse de date în statistica
demografică şi asigură informaţii privind numărul şi structura populaţiei de pe teritoriul unei
ţări la un moment dat. El este iniţiat de către stat, fiind reglementat printr-un act normativ,
însă responsabilitatea pentru organizarea şi punerea sa în practică revine Institutului Naţional
de Statistică, care asigură şi prelucrarea datelor înregistrate. Recensământul populaţiei se
efectuează în baza respectării principiilor universalităţii, simultaneităţii şi comparabilităţii.
Respectarea principiului universalităţii presupune înregistrarea, cu ocazia
Recensământului populaţiei, în mod obligatoriu, a tuturor persoanelor aflate în jurisdicţia
statului respectiv. Astfel, la Recensământul populaţiei şi locuinţelor din martie 2002 au fost
înregistraţi toţi cetăţenii români cu domiciliul în ţară, indiferent dacă la momentul de referinţă
se aflau pe teritoriul ţării sau erau plecaţi temporar în străinătate, precum şi persoanele de altă
cetăţenie sau fără cetăţenie, care aveau domiciliul sau reşedinţa temporară în România.
Conform principiului simultaneităţii, informaţiile culese reflectă situaţia existentă la
un acelaşi moment de timp pentru toate persoanele recenzate (momentul critic), deşi
înregistrarea datelor durează un anumit interval de timp. Momentul critic este ales, de obicei,
iarna, atunci când populaţia observată se află într-un moment de stabilitate, uniformitate, nu
este supusă unor fluctuaţii, unor mişcări accidentale (în acest sens, se evită vacanţele şcolare
sau concediile de odihnă).
Pe baza Recensământului populaţiei obţinem indicatori de volum şi structură statici,
aferenţi momentului critic. O cercetare în domeniul populaţiei are însă, ca obiectiv şi
surprinderea, determinarea modificărilor de volum şi a mutaţiilor de structură de la un
Recensământ la altul, impunându-se a fi respectat principiul comparabilităţii datelor atât în
plan temporal, cât şi în plan teritorial (armonizarea sferei de cuprindere a indicatorilor, a
definiţiilor, nomenclatoarelor, clasificărilor utilizate la mai multe recensăminte succesive,
precum şi între ţări, ţinându-se seama şi de recomandările organismelor internaţionale de
specialitate).
8
Perioada de pregătire a recensământului este de mare amploare şi răspundere, fiind
necesară o investigare a modalităţilor de pregătire a recensămintelor din perioadele trecute,
atât în România, cât şi în alte ţări, o mediatizare puternică a acţiunii, uneori chiar şi
organizarea unui recensământ de probă.
În cazul cercetării statistice prin sondaj, se selectează un eşantion, format dintr-o parte
a unităţilor populaţiei totale. Eşantionul poate fi selectat aleator sau non-aleator.
Selectarea aleatoare a unităţilor în eşantion presupune că fiecare unitate statistică are
o şansă determinabilă (calculabilă), egală şi nenulă de a fi inclusă în eşantion, că nu există
deci nici o unitate care să nu poată fi supusă procedeului de selecţie şi că nici o unitate nu
poate fi aleasă preferenţial. Eşantioanele alese aleator sunt reprezentative pentru întreaga
populaţie, adică întrunesc aceleaşi trăsături esenţiale ca şi populaţia totală.
Selectarea non-aleatoare (dirijată) se referă la orice metodă de alegere, pe baza unui
criteriu preferenţial, a unităţilor statistice în eşantion. O dată format eşantionul, se
înregistrează nivelurile tuturor caracteristicilor incluse în programul observării, de la toate
unităţile acestuia, se prelucrează şi se obţin indicatori statistici la nivelul eşantionului (etapa
descriptivă), pentru ca apoi să se extindă, cu o anumită probabilitate, rezultatele de la nivelul
eşantionului pentru întreaga colectivitate (etapa inferenţială). Diferenţa între nivelul estimat la
indicatorului în urma sondajului şi nivelul real (eroarea de sondaj) va fi cu atât mai mică cu
cât eşantionul este mai reprezentativ, iar reprezentativitatea, la rândul ei, va fi asigurată dacă
se respectă principiile selecţiei aleatoare în formarea eşantionului.
Ancheta statistică este o metodă de observare parţială, cu caracter mai mult ocazional.
9
- neobligativitatea îndeplinirii condiţiei de reprezentativitate a eşantionului.
- admiterea unei rate mai mari a non-răspunsurilor la formularele înmânate direct,
telefonic, prin e-mail sau prin poştă, întrucât completarea chestionarelor este benevolă.
Ancheta statistică va conduce, din aceste motive, la erori mai mari decât sondajul
statistic. În cazul acestuia din urmă, neobţinerea datelor solicitate de la unităţile incluse în
eşantion (persoane, de regulă), din diferite motive, precum: nu cunosc limba oficială, şi-au
schimbat domiciliul, nu sunt acasă atunci când sunt căutaţi, refuză să coopereze etc. – pot
duce la afectarea reprezentativităţii eşantionului.
O categorie deosebit de întâlnită a anchetelor statistice o formează anchetele de
opinie, ce au drept scop studierea preferinţelor, atitudinii oamenilor faţă de diferite probleme
(anchete în sfera sociologiei, marketingului, politicii, culturii etc.).
Panelul
Panelul este o metodă de observare parţială, realizată pe baza unui eşantion fix, stabil,
format din aceleaşi unităţi care răspund la aceleaşi întrebări, la mai multe momente
succesive, diferite de timp (tehnica longitudinală). În acest fel cercetarea se concentrează
pe identificarea, pe determinarea modificărilor survenite de-a lungul timpului asupra
fenomenului studiat.
6. Erori de observare
Deoarece statistica operează cu seturi mari de date, este posibilă apariţia, după fiecare
etapă a procesului de investigaţie statistică, a unor erori. Putem întâlni, aşadar, erori de
observare (de înregistrare), erori de prelucrare, erori de analiză şi de interpretare.
În accepţiune largă, eroarea statistică reprezintă diferenţa dintre nivelul real al unui
indicator şi nivelul
Eroarea obţinut
statistică în urma
se poate procesului
determina de investigaţie
în expresie absolutăstatistică.
sau relativă.
a) Eroarea în expresie absolută se determină în sensul definit mai sus, conform
relaţiei:
ex x x0 ,
11
a) Erori de observare (sau de înregistrare).
Apar în etapa de observare statistică şi sunt definite ca diferenţele care apar între
valorile reale ale caracteristicilor urmărite (studiate) şi cele înregistrate (culese). Erorile de
observare sunt de două tipuri:
a1) erori întâmplătoare – sunt, în general, erorile produse din neatenţie, sau din alte
cauze accidentale, independent de voinţa anchetatorului sau a respondentului. Ele determină,
de regulă, abateri în ambele sensuri faţă de valorile reale ale fenomenului şi se pot compensa
reciproc.
a2) erori sistematice - au caracter premeditat, se realizează, de regulă, cu bună ştiinţă,
uneori chiar cu voinţa anchetatorului sau a respondentului. Provoacă devieri faţă de valorile
reale într-un singur sens.
b) Erori de reprezentativitate.
Se întâlnesc în cazul utilizării sondajului statistic, atunci când selectarea unităţilor în
eşantion nu se face în mod aleator, ci după un criteriu subiectiv, preferenţial şi, la rândul lor,
se împart în sistematice şi aleatoare. Ele nu pot fi total eliminate, ci doar diminuate şi
controlate.
c) Erori de prelucrare
Apar în etapa de prelucrare a datelor statistice, datorită utilizării greşite a unor
metodolgii -erori metodologice, (de exemplu: reprezentarea datelor statistice cu ajutorul unor
tipuri neadecvate de grafice, gruparea sau clasificarea greşită, utilizarea unor formule de
calcul nepotrivite, care vor duce la obţinerea unor rezultate eronate etc.), utilizarea greşită a
unor modele statistice (erori de modelare – apar în procesul de elaborare, de alegerea greşită a
modelelor).
Pentru obţinerea unor rezultate corecte ale cercetării, este bine ca după fiecare etapă a
investigaţiei statistice, datele statistice să fie supuse unor operaţii de control, în vederea
identificării şi eliminării (sau măcar a minimizării) unor eventuale erori. În etapa de
observare, se poate aplica asupra datelor culese un control cantitativ şi calitativ.
Controlul cantitativ al datelor presupune verificarea completitudinii datelor culese şi
înregistrate, prin:
- verificarea primirii tuturor chestionarelor la centrul de prelucrare;
- verificarea completării tuturor rubricilor din chestionare.
12
Controlul calitativ al datelor se referă la asigurarea unui nivel calitativ corespunzător
al datelor culese. Poate îmbrăca două forme:
- controlul aritmetic, care presupune aplicarea prin sondaj, a unor relaţii de calcul între
diferiţii indicatori înscrişi în chestionare, de tipul egalităţilor de balanţă sau a altor chei
de verificare;
- controlul logic presupune verificarea corectitudinii datelor înregistrate pe baza unor
legături, identităţi logice între mai multe valori ale aceleiaşi caracteristici sau între
valorile unor caracteristici diferite.
7. Rezumatul Lecţiei
În această unitate de învăţare aţi demarat procesul de investigaţie statistică, cu prima etapă a
acestuia: etapa de observare. Această etapă presupune culegerea şi înregistrarea în mod sistematic şi
unitar a datelor statistice.
Observarea statistică nu se desfăşoară la întâmplare, întrucât de modul în care ea este
organizată depinde în continuare calitatea celorlalte etape ale procesului de cercetare statistică.
Observarea se desfăşoară după un plan (program), ce cuprinde următoarele elemente:
- scopul observării;
- colectivitatea observată;
- unitatea de observare;
- timpul şi locul observării;
- lista caracteristicilor urmărite;
- formularele de înregistrare a datelor;
- măsuri organizatorice.
Există o gamă variată de metode de observare, utilizate împreună sau separat, pentru a
obţine o informaţie statistică cât mai reală, completă şi neredundantă. Metodele de observare pot fi:
- observări curente/periodice/ocazionale;
- observări totale/parţiale;
- observări primare/secundare.
Principalele metode de observare sunt:
- recensământul (ca metodă totală de observare)
- sondajul şi ancheta statistică (metode parţiale)
13
CURS STATISTICĂ - Lecţia nr. 4
Cuprins:
1. Obiectivele Lecţiei.
2. Sistematizarea datelor statistice (gruparea/clasificarea).
2.1. Clasificarea datelor statistice.
2.2. Gruparea datelor statistice
3. Modalităţi de prezentare şi reprezentare a datelor statistice.
3.1. Serii statistice.
3.2. Tabele statistice.
3.3. Grafice statistice.
4. Rezumatul Lecţiei.
1. Obiectivele lecţiei
1
Am văzut că statistica operează cu volume mari de date. Dacă aceste date sunt
prezentate într-o formă aleatoare neregulată, este dificil, investigând vizual setul de date, să-l
caracterizăm prin trăsăturile sale esenţiale, prin valorile extreme, tendinţa centrală sau gradul
de dispersare. De aceea, putem întâi supune setul de date unor operaţii de prezentare
sistematică, de organizare, de ordonare a acestor date după unul sau mai multe criterii, într-
un cuvânt de sistematizare.
Această operaţie face trecerea de la observarea statistică (în urma căreia s-au obţinut
datele necesare realizării obiectivelor investigaţiei statistice, verificate sub aspectul volumului
şi calităţii) şi prelucrarea propriuzisă.
Sistematizarea este parte a prelucrării primare a datelor statistice.
Sistematizarea datelor se realizează prin gruparea şi clasificarea datelor statistice.
Atunci când criteriul (caracteristica) după care se realizează această operaţie este unul
numeric, cantitativ, ea se numeşte grupare, iar când operaţia se realizează după un criteriu
(caracteristic) calitativ, nenumeric, ea se numeşte clasificare.
La realizarea unei grupări/clasificări, trebuie, pe cât posibil, să îndeplinim următoarele
condiţii:
a) omogenitate (în sensul că unităţile statistice care au aceeaşi valoare sau valori
apropiate, asemănătoare, ale caracteristicii după care se efectuează sistematizarea vor
fi incluse în aceeaşi clasă; în felul acesta, se doreşte ca variaţia valorilor caracteristicii
incluse în aceeaşi grupă/clasă să fie cât mai mică);
b) unicitate (în sensul că o unitate statistică trebuie inclusă într-o singură clasă sau grupă,
ea nu se poate regăsi simultan în două sau mai multe clase/grupe);
c) completitudine (în sensul că toate unităţile statistice să fie incluse în grupe/clase, să nu
fie exclusă vreo unitate din operaţia de sistematizare).
Sunt cazuri în care nu este posibilă îndeplinirea simultană a tuturor acestor condiţii (de
exemplu: dacă sunt unităţi la care s-au înregistrat valori extreme, aberante, ale caracteristicii
după care se face sistematizarea, este de dorit, uneori, să se evidenţieze separat aceste cazuri,
2
să se scoată în afara grupării aceste unităţi şi să se sistematizeze restul unităţilor, la care s-au
înregistrat valori mai apropiate ale variabilei).
- pe variante (atunci când grupăm datele după o variabilă discretă sau când plaja
valorilor pe care le poate lua caracteristica nu este foarte mare);
3
B). Gruparea pe intervale de variaţie.
Se poate efectua pe intervale de mărime egală sau diferită. În continuare vom trata
numai cazul grupării datelor statistice pe intervale egale de variaţie.
Pentru realizarea grupării pe intervale egale de variaţie se recomandă parcurgerea
următorilor paşi:
a) se determină amplitudinea variaţiei caracteristicii, ca diferenţă între valoarea
maximă şi valoarea minimă a caracteristicii.
A xmax xmin
b) se stabileşte numărul de grupe. În acest caz pot exista două situaţii:
- numărul de grupe (r) este prestabilit, pe baza experienţei căpătate din studii anterioare
asupra domeniului de interes.
- numărul de grupe (r) nu este prestabilit; în acest caz, dacă unităţile se repartizează
aproximati normal după caracteristica studiată, se poate utiliza pentru determinarea
numărul de grupe relaţia lui Sturges:
r 1 3,322 lg n
unde n este numărul total de unităţi ale colectivităţii.
Este recomandat a se folosi un număr potrivit de grupe (de regulă între 4 şi 10).
Utilizarea unui număr prea mare de grupe ar duce la fărâmiţarea excesivă a colectivităţii
(putând apare, în acest caz şi grupe cu frecvenţe nule, iar gruparea ar trebui refăcută);
utilizarea, dimpotrivă, a unui număr prea mic de grupe ar putea să nu pună în evidenţă
principalele tipuri calitative ale populaţiei după variabila urmărită).
c) se determină mărimea intervalului de grupare (h), ca raport între amplitudinea
caracteristicii şi numărul de grupe:
A
h
r
Pentru uşurarea calculelor, se recomandă a se folosi mărimi rotunjite de interval, de
aceea, dacă valoarea reieşită din calcul este fracţionară, cu mai multe zecimale, ea se poate
rotunji prin adaos la o valoare imediat superioară, aleasă în mod convenabil.
De exemplu: dacă h = 4,4225, se poate rotunji valoarea la h = 4,5 sau chiar la h = 5.
d) se formează intervalele de grupare, prin precizarea limitelor exacte ale acestora.
xmin xmin+h
xmin+h xmin+2h
.....................................................
xmin + (r — 1).h xmin + r h
4
Limitele intervalelor vor avea acelaşi grad de precizie ca şi datele grupate (acelaşi
număr de zecimale), primul interval putând începe chiar de la valoarea minimă a
caracteristicii, sau de la o valoare uşor inferioară acesteia, aleasă în mod convenabil. Este bine
să nu existe suprapuneri de limite, astfel încât la efectuarea grupării să poată fi respectată
condiţia de unicitate.
- Dacă limita superioară a unui interval coincide cu limita inferioară a intervalului
următor, intervalele se numesc continue;
- Dacă între limita superioară a unui interval şi limita inferioară a intervalului următor
există o diferenţă de o unitate întreagă sau zecimală, intervalele se numesc
discontinue sau discrete.
Seria statistică reprezintă un mod organizat de prezentare a datelor, sub forma a două
şiruri: primul se referă la criteriul de sistematizare iar al doilea cuprinde datele numerice
sau frecvenţele de apariţie şi depinde de ordinea de apariţie din primul şir.
5
c) după numărul variantelor, distribuţiile pot fi:
i. distribuţii pe variante sau valori;
ii. distribuţii pe grupe de variante (în cazul distribuţiilor homograde) sau pe
intervale de valori (în cazul distribuţiilor heterograde).
6
Serii de repartiţie de frecvenţe pe intervale de variaţie
Se prezintă sub forma:
Intervale de variaţie ale caracteristicii de grupare Număr de unităţi statistice (ni)
x1inf x1sup n1
x2inf x2sup n2
... ...
xiinf xisup ni
... ...
x rinf x rsup nr
r
Total n ni
i 1
unde: xiinf , xisup reprezintă limita inferioară, respectiv superioară, a intervalului de variaţie „i”.
Vom considera doar cazul intervalelor egale şi continue.
Centrul intervalului este determinat ca medie aritmetică simplă a limitelor intervalului
şi este considerat reprezentativ pentru datele din acel interval. Se determină cu una din
relaţiile:
xiinf xisup hi
xi sau xi xiinf , unde hi este mărimea intervalului.
2 2
Frecvenţa absolută a grupei (ni) este egală cu numărul de unităţi statistice care au
valoarea caracteristicii mai mare (sau egală) cu limita inferioară a intervalului şi mai mică
(sau egală) cu limita superioară a acesteia. Suma frecvenţelor absolute este notată cu n şi
r
reprezintă numărul total de unităţi sau volumul eşantionului. n ni
i 1
sau
ni ni
ni*% r
100 100 şi se exprimă în procente.
n
ni
i 1
7
Suma frecvenţelor relative este 1 sau 100, după cum sunt exprimate în coeficienţi sau
în procente.
r r
ni* 1 sau ni*% 100
i 1 i 1
Frecvenţele cumulate.
Sunt de două tipuri: cumulate crescător şi cumulate descrescător.
Frecvenţa absolută cumulată crescător a unei grupe este egală cu numărul unităţilor
care au valoarea variabilei mai mică (sau egală) cu limita superioară a grupei (mai exact între
x1inf şi xisup ).
i
Fci nk
k 1
Frecvenţa absolută cumulată crescător a ultimei grupe este egală cu volumul colectivităţii (cu
n).
Frecvenţa absolută cumulată descrescător a unei grupe este egală cu numărul
unităţilor pentru care valoarea caracteristicii este mai mare (sau egală) cu limita inferioară a
Frecvenţa absolută cumulată descrescător a primei grupe este egală cu numărul total de unităţi
statistice (cu n):
Asemănător se determină şi frecvenţele relative cumulate crescător şi descrescător,
conform relaţiilor:
i r
Fci* nk* , Fd i* nk*
k 1 k i
8
xi ni
... ...
xr nr
r
Total n ni
i 1
unde: ni reprezintă numărul unităţilor care prezintă valoarea xi a caracteristicii de grupare (se
mai numesc frecvenţe absolute);
Prin însumarea frecvenţelor grupelor (ni) se obţine volumul total al colectivităţii (n).
Şi pentru această serie se determină toate tipurile de frecvenţe prezentate anterior.
9
yj, j 1, p este varianta sau centrul de interval al grupei „j”, formată după valorile variabilei
Y;
nij, i 1, r ; j 1, p reprezintă numărul unităţilor statistice la care întâlnim simultan valoarea
xi a caracteristicii X şi valoarea yj a caracteristicii Y;
p
ni. nij este numărul de unităţi statistice care au valoarea xi a caracteristicii X, indiferent
j 1
de valoarea caracteristicii Y;
r
n. j nij este numărul de unităţi statistice care au valoarea yj a caracteristicii Y, indiferent
i 1
de valoarea caracteristicii X;
r p r p
n.. n nij ni. n. j este volumul total al colectivităţii.
i 1 j 1 i 1 j 1
Aşa cum am arătat, alături de grafice, şi tabelele statistice joacă un rol important în
prezentarea dateor, căci ele pot releva anumite aspecte pe care graficele nu le pot pune în
valoare. În unele situaţii, este mai importantă prezentarea valorilor numerice ale datelor, decât
o vizualizare grafică a acestora. În felul acesta, tabelele reprezintă un instrument
complementar graficelor, de prezentare rapidă şi eficientă a datelor, dar şi de sistematizare a
acestora.
Tabelul statistic cuprinde una sau mai multe serii statistice, ai căror termeni sunt înscrişi
într-o reţea de linii şi coloane.
Pentru ca un tabel statistic să fie corect elaborat şi să-şi atingă scopul, trebuie să
conţină un set de elemente obligatorii sau opţionale şi să respecte unele reguli:
- titlul tabelului este un element obligatoriu plasat înaintea tabelului, care descrie clar şi
concis conţinutul datelor pe care le cuprinde;
- macheta tabelului este o reţea de linii ce alcătuiesc rubricile tabelului;
- subiectul tabelului este format din populaţia la care se referă datele înscrise în tabel;
- predicatul tabelului este format din sistemul de indicatori redaţi în tabel;
- rubricile tabelului sunt spaţiile create la întretăierea liniilor orizontale cu cele verticale,
în care sunt înscrise datele;
10
- datele statistice înscrise în tabel pot fi sub formă numerică sau textuală;
- unitatea de măsură trebuie precizată pentru fiecare din indicatorii înscrişi în tabel; dacă
toţi sunt exprimaţi în aceeaşi unitate de măsură, atunci aceasta se poate trece deasupra
tabelului;
- sursa datelor;
- numărul tabelului – este necesar mai ales atunci când se folosesc mai multe tabele,
pentru identificarea lor;
- note explicative, metodologice
1. Histograma:
Histograma conţine o succesiune de dreptunghiuri, cu bazele corespunzătoare lungimii
in-tervalelor şi înălţimile egale cu numărul de observaţii din fiecare interval (sau cu ponderea
lor). Dacă intervalele au mărime egală, atunci şi coloanele vor avea lăţime egală.
Permite vizualizarea distribuţiei de frecvenţe absolute sau relative, după o variabilă
numerică continuă (pe intervale).
11
2. Poligonul frecvenţelor:
Poligonul frecvenţelor este şi el utilizat pentru reprezentarea grafică a distribuţiilor de
frecvenţe absolute sau relative, atunci când sistematizarea datelor s-a făcut după o
caracteristică numerică continuă sau discontinuă. Pentru construirea lui, din fiecare valoare a
caracteristicii sau din fiecare centru de interval se ridică câte o perpendiculară şi se marchează
pe ea punctul aflat la o distanţă egală cu frecvenţa variantei sau intervalului respectiv. Unind
toate punctele astfel găsite rezultă un poligon numit „poligonul frecvenţelor”.
Poligonul frecvenţelor se poate suprapune peste histogramă în cadrul aceluiaşi grafic,
sau se poate trasa într-un grafic separat.
12
sunt răsturnate cu 90% (şi au baza situată pe axa verticală) atunci reprezentarea grafică este o
diagramă prin benzi, cu axele inversate faţă de diagrama prin coloane.
Pentru o distribuţie de frecvenţe, obţinută după o variabilă calitativă, diagrama prin
coloane şi cea prin benzi se prezintă astfel:
100 Manag.
Domeniu
80
Finanţe
Persoane
60
40 Market.
20
Contab.
0
Contabilitate Marketing Finanţe Management Altele
ec. 0 20 40 60 80 100
Domeniul Persoane
5. Diagrama de structură.
13
Structura magazinelor dupa valoarea facturilor
Structura absolvenţilor după domeniul de ocupare emise zilnic
5,0 – 6,0
11,0 – 12,0 8%
6,0 – 7,0
12% 8%
18%
18%
8,0 – 9,0
24% 18%
4. Rezumatul Lecţiei
În acest capitol am învăţat să supunem setul de date unor operaţii de prezentare sistematică,
de organizare, de ordonare după unul sau mai multe criterii, într-un cuvânt de sistematizare.
Includem aici operaţiile de grpare/clasificare.
Gruparea / clasificarea datelor statistice presupune împărţirea unităţilor populaţiei statistice
observate în grupe sau clase distincte omogene, după unul sau mai multe criterii. Dacă efectuăm
sistematizarea datelor după o variabilă nenumerică, spunem că efectuăm o clasificare, iar dacă
sistematizăm datele după o variabilă numerică, spunem că realizăm o grupare.
Clasificarea datelor se poate face:
- pe variante (dacă sunt puţine variante)
- pe grupe de variante (în cazul existenţei mai multor variante).
Gruparea după o variabilă numerică se poate face:
- pe variante (atunci când grupăm datele după o variabilă discretă sau când plaja
valorilor pe care le poate lua caracteristica nu este foarte mare);
- pe intervale de variaţie (atunci când sistematizăm datele după o variabilă continuă,
care are o plajă largă de valori). Intervalele de variaţie pot fi egale sau neegale.
Modalităţile de prezentare şi reprezentare a datelor statistice sunt:
- seriile statistice.
- tabelele statistice
- graficele statistice.
14
CURS STATISTICĂ - Lecţia nr. 5
Cuprins:
În urma parcurgerii acestei unităţi de învăţare studentul va înţelege care este tipul de
medie adecvat în fiecare situaţie, precum şi modalitatea de calcul a acesteia.
1
1. După modul de determinare distingem:
Indicatorii primari – se obţin în etapa de sistematizare a datelor statistice
prin centralizarea acestora.
Ex.: - numărul total al studenţilor unei facultăţi, numărul studenţilor pe fiecare an
de studiu (volumul total sau pe grupe al unei colectivităţi).
- veniturile salariaţilor unei firme (nivelul total al valorilor individuale al unei
caracteristici)
Indicatori derivaţi – reprezintă rezultatul prelucrării indicatorilor
primari prin diferite modele de calcul statistic. În categoria indicatorilor derivaţi pac
parte: mărimile relative, indicatorii tendinţei centrale, indicatorii variaţiei şi asimetriei,
indicatorii de concentrare, etc.
Pentru caracterizarea fenomenelor de masă se utilizează atât indicatori primari cât şi
derivaţi.
2. După gradul de cuprindere se disting:
Indicatori sintetici care reprezintă expresii numerice ale
categoriilor economice de sinteză ce caracterizează rezultatele economice la nivel
macroeconomic.
Ex.: Produsul intern brut. Modelul de calcul al acestor indicatori se bazează pe
Sistemul Conturilor Naţionale.
Indicatorii analitici – care exprimă structura unei colectivităţi şi influenţa
factorilor care acţionează asupra acesteia.
3. După forma de exprimare se disting:
Indicatori exprimaţi în mărimi absolute adică în unităţi concrete de
măsură aceleaşi cu ale caracteristicii analizate şi cu acelaşi conţinut ca şi
caracteristica analizată.
Indicatori exprimaţi sub formă de mărimi relative adică exprimaţi în
coeficienţi, procente, promile, prodecimile, etc. şi care s-au obţinut prin raportarea a
doi indicatori cu acelaşi conţinut sau cu conţinut diferit, dar aflaţi în relaţie de
interdependenţă.
2
Indicatorii tendinţei centrale sunt:
mărimile medii;
indicatorii medii de poziţie.
Toţi indicatorii tendinţei centrale au unitatea de măsură a caracteristicii studiate.
Indicatorii tendinţei centrale, pentru a reda corect nivelul în jurul căruia tind
valorile individuale, trebuie să îndeplinească următoarele condiţii:
să fie definiţi în mod precis printr-o definiţie sau formulă;
să poată fi calculaţi cu uşurinţă şi rapiditate şi să se preteze calculelor
algebrice;
să nu fie afectaţi prea tare de fluctuaţiile de selecţie în cazul în care datele
provin dintr-un sondaj statistic (adică mediile diferitelor eşantioane de volum
egal provenite din aceeaşi colectivitate să nu fie sensibil diferite);
să nu aibă caracter matematic prea abstract;
să fie expresia tuturor observaţiilor făcute.
Cei mai importanţi şi mai utilizaţi indicatori ai tendinţei centrale sunt: media,
mediana, modul.
3. Marimile medii
Media aritmetică x , numită adeseori “medie” este indicatorul cel mai utilizat
pentru caracterizarea tendinţei centrale.
Media se calculează însumând toate valorile individuale şi împărţind suma la
3
numărul lor, ea reprezentând acea valoare care înlocuind toţi termenii unei serii nu
modifică nivelul lor totalizator.
Media aritmetică calculată pentru o colectivitate statistică este acea valoare
care s-ar fi obţinut dacă toţi factorii ar fi exercitat o influenţă constantă asupra tuturor
unităţilor înregistrate.
Media aritmetică simplă se calculează raportând nivelul totalizat al caracteristicii
la numărul total al unităţilor:
n
xi
x i 1
n
xi = valorile individuale ale caracteristicii;
n = numărul unităţilor;
n
x i = valoarea centralizată (nivelul totalizat) al caracteristicii.
i 1
☺ Exemplul 1
Pentru 5 sucursale ale unei bănci comerciale au fost înregistrate valorile creditelor în
luna decembrie 2006 şi anume: 200.000 Euro; 240.000 Euro; 250.000 Euro; 180.000
Euro; 160.000 Euro. Care este valoarea medie a creditelor acordate în luna
decembrie 2019?
5
xi
i 1 200.000 240.000 250.000 180.000 160.000
x 206.000 Euro/sucursală
5 5
4
mijlocul (centrul) de interval:
k
x x i n *i
i 1
☺ Exemplul 2
Media aritmetică ponderată pentru o serie de repartiţie pe variante.
Repartiţia gospodăriilor dintr-o localitate în funcţie de numărul de copii este
prezentată în tabelul următor:
Nr. copii (xi) 0 1 2 3 4 5 6 7 8
Nr. gospodării (ni) 286 380 416 258 112 62 47 12 7
k
xi ni
i 1 0 286 1 380 ... 8 7 3166
Media = 1580 2,00 copii/gospodărie
k 286 380 ... 7
ni
i 1
☺ Exemplul 3
Repartiţia salariaţilor unei firme în funcţie de valoarea primei acordate la sfârşitul
anului 2006 este:
Media:
poate să nu aibă o valoare egală cu o valoare individuală înregistrată;
se poate determina cunoscând doar valoarea totală centralizată a caracteristicii
(nivelul totalizator) şi numărul unităţilor;
5
are unitatea de măsură a caracteristicii analizate.
6
k k
x i a n i xi ni a
x ' i1 i1 xa
k k
ni ni
i 1 i 1
6) Dacă toţi termenii unei serii statistice se înmulţesc sau se împart cu o constantă “h”,
atunci şi media se va multiplica sau se va reduce de “h” ori:
- pentru o serie simplă:
n n
xi h xi
x ' i 1 h i 1 hx h 0,1
n n
- pentru o serie de frecvenţe:
k k
xi ni h h xi ni
x ' i 1 i 1
hx
k k
ni ni
i 1 i 1
k
Dacă a n i adică este volumul total al colectivităţii, atunci:
i 1
k ni
xi k k
i 1
ni x i n *i k
i 1
x i 1 x i n *i
k ni k
i 1
k n *i
i 1 i 1
ni
i 1
n *i = frecvenţele relative
sau
k
x i n *i
x i 1 ,
100
dacă frecvenţele relative sunt exprimate în procente.
8) Media aritmetică este sensibilă la valorile extreme, care pot afecta semnificaţia şi
7
reprezentativitatea mediei ca valoare centrală. Pentru ca media să fie reprezentativă
trebuie ca datele din care se calculează să fie cât mai omogene;
9) Media generală calculată pentru o serie de repartiţie de frecvenţă corespunzătoare
colectivităţii generale este egală cu media aritmetică ponderată a mediilor parţiale
calculate pe baza seriilor de repartiţie componente:
m
xj nj
j1
x
m
n j
j1
☺ Exemplul 4
Sucursala din Alba a unei bănci comerciale are 40 de angajaţi, dintre care 15 sunt femei, iar
25 bărbaţi. Salariul mediu al femeilor este de 1.370 RON, iar al bărbaţilor de 1.520 RON.
Care este salariul mediu al unui angajat al sucursalei?
m
x j n j
j 1 1.370 15 1.520 25
x 1.463,75 RON
m 40
n j
j 1
10) Media aritmetică calculată pentru o serie simplă şi media aritmetică calculată pentru
aceeaşi serie cu datele grupate pe intervale (utilizând centrul de interval), pot să fie
sau nu egale. Cele două medii sunt egale dacă frecvenţele din seria de repartiţie de
frecvenţe sunt normal distribuite pe fiecare interval.
11) Pentru o variabilă alternativă (binară) media aritmetică se calculează astfel:
Varianta de răspuns xi Frecvenţa (ni) Frecvenţe relative (ni*)
DA 1 m m
w
n
NU 0 n–m 1–w
Total - n 1
2
xi ni
i 1 1 m 0 n m m
x w
2 n n
ni
i 1
8
3.2. Media armonică
Media armonică se calculează împărţind frecvenţa absolută totală (numărul
total al unităţilor) la suma inverselor valorilor caracteristicii:
- media armonică simplă:
n
xh pentru o serie simplă
n 1
x
i 1 i
9
n
x i2
x p i1
n
- pentru o serie de frecvenţe:
k
x i2 n i
x p i 1
k
ni
i 1
4. Rezumatul temei
10
Lecţia nr. 6
Cuprins:
Mediana face parte din categoria cuantilelor alături de quartile, decile. Cuvântul mediană
provine din cuvântul latin “medius” care înseamnă “mijloc”.
Mediana reprezintă acea valoare a unei serii ordonate crescător sau descrescător care
împarte seria în două părţi egale, aşa încât 50% din termenii seriei au valori mai mici decât
mediana, iar 50% mai mari decât mediana.
Un avantaj al medianei faţă de medie este acela că poate fi utilizată în caracterizarea
tendinţei centrale pentru o serie de date măsurate pe o scară ordinală. Mediana ia în consideraţie
doar poziţia termenilor în serie, nu şi mărimea acestor valori, deci mediana nu este supusă
influenţei valorilor foarte mari sau foarte mici care sunt lăsate în afara seriei.
Valoarea medianei este invariabilă faţă de convenţia cu care se închid intervalele extreme,
spre deosebire de medie care este influenţată atât de valori cât şi de frecvenţa lor.
Dacă seria prezintă o repartiţie normală atunci mediana poate să înlocuiască valoarea
medie deoarece se calculează mai uşor.
Mediana este un indicator utilizat în cercetările medicale, în studiul mortalităţii, la
determinarea duratei medii de viaţă, la determinarea duratei medii de funcţionare a unui produs.
Calculul medianei:
pentru o serie simplă (pentru date negrupate), întâlnim două situaţii:
- seria are un număr impar de termeni – atunci mediana este egală cu termenul central
al seriei ordonate crescător sau descrescător.
Se cunoaşte următorul set de valori ale unei caracteristici:
5 7 4 9 12 3 10
Ordonăm seria crescător:
3 4 5 7 9 10 12
Me
Pentru date ordinale mediana este varianta situată în centrul seriei.
- seria are un număr par de termeni, atunci mediana este egală cu media aritmetică
simplă a celor 2 termeni centrali ai seriei ordonate crescător sau descrescător.
Fie următorul set de valori:
3 1 5 7 9 4
1 3 4 5 7 9
45
Me 4,5
2
Pentru un şir de date ordinale format din număr par de termeni, mediana este egală cu una
din cele două variante din centrul seriei dacă aceste variante sunt egale, iar dacă variantele nu
sunt egale mediana ia 2 valori deoarece nu se poate face media lor.
pentru o serie de distribuţie de frecvenţe pe variante calculul medianei comportă
următoarele etape:
Etapa 1: se determină locul medianei în cadrul seriei:
1 k
L Me n i 1
2 i1
Etapa 2: se cumulează crescător frecvenţele absolute şi se determină acea frecvenţă
cumulată crescător care este imediat mai mare sau egală cu locul medianei (LMe). Varianta care
corespunde frecvenţei absolute cumulate ce îndeplineşte condiţia de mai sus este mediana.
pentru o serie de frecvenţe pe intervale de variaţie, mediana se poate determina
numai în ipoteza în care valorile sunt distribuite uniform în cadrul intervalului de
grupare.
Etape:
- se determină locul medianei în cadrul seriei:
1 k
L Me
2 i1
n i 1
- se cumulează crescător frecvenţele absolute şi se determină acea frecvenţă cumulată
crescător care este imediat mai mare sau egală cu Lme. Intervalul care corespunde frecvenţei
absolute cumulate ce îndeplineşte condiţia de mai sus este intervalul median.
- se calculează mediana cu relaţia:
L Me n pMe
Me x 0 h
n Me
2.2. Modul
Modul (dominanta unei serii) este valoarea cea mai des întâlnită sau căreia îi corespunde
cea mai mare frecvenţă de apariţie.
Calculul algebric al modului:
- pentru o serie simplă:
☺ Exemplul 1
La un magazin de pantofi s-au vândut într-o oră pantofi având următoarele mărimi:
Caz 1: 35 37 39 40 42
Această serie nu are mod.
Caz 2: 35 37 35 40 42
Mo = 35 deoarece este valoarea cea mai des întâlnită
Caz 3: 35 37 35 40 40
Mo1 = 35 Mo2 = 40
Această serie este bimodală.
Există şi serii plurimodale.
☺ Exemplu 2
Nr. camere (xi) Nr. apartamente(ni)
1 13
2 25
3 28
4 14
Mo = 3 camere deoarece variantei 3 îi corespunde frecvenţa absolută maximă.
ni
xi
în cazul seriilor de distribuţie
Mo pe intervale de variaţie, determinarea grafică a
modului se face cu ajutorul histogramei. Se determină punctul de intersecţie al
segmentului ce uneşte capătul din stânga al blocului cel mai înalt cu capătul din stânga
blocului următor cu segmentul ce uneşte capătul din dreapta al blocului cel mai înalt cu
capătul din dreapta al blocului anterior. Corespondenţa pe abscisă a acestui punct de
intersecţie este modul.
ni
xi
Mo
Media este indicatorul cel mai utilizat în analiza tendinţei centrale. Calculul mediei se
bazează pe ansamblul valorilor caracteristicii xi, de aceea ea este influenţată de valorile extreme.
Mediana este un indicator care, spre deosebire de medie, se calculează în funcţie de poziţia
termenilor în serie şi nu este influenţată de valorile termenilor.
Modul se determină foarte uşor, dar este indicatorul cel mai sensibil la modul de grupare a
datelor. Două grupări diferite ale aceleiaşi serii vor conduce la două valori modale diferite.
Pentru o serie perfect simetrică cei trei indicatori ai tendinţei centrale sunt egali:
x Me Mo
4. Rezumatul Lecţiei
Cuprins:
1.Obiectivele temei.
2.Clasificarea indicatorilor variatiei.
2.1. Indicatorii simpli ai variaţiei.
2.2. Indicatorii sintetici ai variaţiei.
3.Indicatorii asimetriei.
4. Rezumatul lecţiei.
☺ Exemplul 1
Fie următoarele seturi de date:
2 4 6 8 10 12 14
x1 Me1
5 6 7 8 9 10 11
x 2 Me 2
Se observă că deşi cele două serii au aceeaşi medie şi mediană
x1 x 2 Me1 Me2 , ele diferă prin modul de împrăştiere a valorilor. De aceea, pe
lângă indicatorii tendinţei centrale se impune şi calculul indicatorilor de variaţie.
d min x min x 0
d i x i x 0
n n
i 1 i 1
Dacă în cazul unei serii, abaterea maximă absolută diferă mult de valoarea
abaterii minime absolute luată în modul, atunci pentru seria respectivă trebuie
calculaţi pe lângă indicatorii variaţiei şi indicatorii de asimetrie.
Într-o serie simetrică:
d min d max
x i x
n 2
2 i 1
n
- pentru o serie de frecvenţe absolute:
x i x
k 2
ni
i 1
2
k
ni
i 1
x i x
k 2
n *i
2 i 1
100
sau
2 n *i
k
2 xi x
i 1
Dacă datele provin din eşantioane de volum redus şi le folosim pentru extinderea
rezultatelor la nivelul colectivităţii generale (le folosim pentru o inferenţă statistică),
atunci în calculul dispersiei la numitor se va folosi (n-1) şi nu “n” fiind astfel dispersia
eşantionului un estimator mai bun al dispersiei în colectivitatea generală:
x i x
n 2
s 2 i 1
n 1
Dispersia prezintă dezavantajul că este un indicator abstract care nu are o
unitate concretă de măsură. Ea arată modul în care gravitează termenii seriei în jurul
tendinţei centrale (de obicei media). Dacă dispersia unei serii este egală cu 0, atunci
acea serie nu prezintă variaţie, toţi termenii ei fiind egali. Cu cât valoarea dispersiei
creşte faţă de zero, cu atât împrăştierea termenilor seriei creşte şi ea.
Este un indicator deosebit de util în studiile statistice, fiind utilizată în calculul
asimetriei, excesului, boltirii unei serii, precum şi în calculul altor indicatori statistici.
Abaterea medie pătratică (abatere standard, abatere tip sau ecart tip) se
calculează ca o medie pătratică a abaterilor termenilor seriei de la media lor sau ca
radical din dispersie.
Abaterea medie pătratică ne arată cu cât în medie se abat termenii unei serii de
la tendinţa centrală (de obicei media):
- pentru o serie simplă:
x i x
n 2
2 i1
n
- pentru o serie de frecvenţe absolute:
x i x
k 2
ni
i 1
2
k
ni
i 1
- pentru o serie de frecvenţe relative:
x i x
k 2
n *i
2 i1
100
Este foarte dificil să comparăm serii de date după caracteristici exprimate prin
aceeaşi unitate de măsură deoarece variabilitatea depinde de ordinul de mărime.
Abaterea medie pătratică are aceeaşi semnificaţie ca şi abaterea medie liniară,
dar ea obţinându-se prin ridicarea la pătrat a abaterilor individuale de la tendinţa
centrală (medie) înlătură dezavantajul acordării aceleiaşi importanţe atât abaterilor
mari cât şi celor mici.
Abaterea medie pătratică are aceeaşi unitate de măsură cu a caracteristicii
studiate, de aici provenind dezavantajul că nu pot fi comparate colectivităţi după
caracteristici exprimate prin unităţi de măsură diferite.
Deoarece x x p rezultă că d .
Coeficientul de variaţie este cel mai utilizat şi mai semnificativ indicator pentru
analiza variaţiei. Se calculează ca raport între abaterea medie pătratică sau liniară şi
medie.
d
v 100 sau v' 100
x x
v v’
Coeficientul de variaţie se exprimă procentual, deci putem aprecia că el
reprezintă exprimarea relativă a lui sau a lui d .
Dacă v = 0 seria este perfect omogenă, toţi termenii seriei sunt egali între ei şi
sunt egali cu media: în acest caz nu există variaţie.
Dacă v 35%, seria este foarte omogenă, variaţia este foarte mică, media este
foarte reprezentativă, iar gruparea a fost foarte bine executată (în cazul seriilor de
distribuţie de frecvenţe).
Dacă v 35%, seria este omogenă.
Dacă v 35%, seria este eterogenă, variaţia este foarte mare, media nu este
reprezentativă, iar gruparea trebuie refăcută.
3. Indicatorii de asimetrie
Asimetria unei serii de distribuţie empirice poate fi determinată atât prin metoda
grafică cât şi prin calculul indicatorilor de asimetrie.
Reprezentarea grafică cea mai utilizată pentru aprecierea asimetriei este
poligonul frecvenţelor, dar graficul ne oferă doar o imagine sugestivă asupra gradului
de asimetrie, fără a putea să-l măsoare printr-o valoare exactă.
ni ni ni
x
x Me Mo xi Mo Me x xi x Me Mo xi
ni ni
0 xi 0 xi
Repartiţii în formă de J se întâlnesc în cazul în care frecvenţele sunt maxime la
un capăt sau altul al intervalului de variaţie.
ni
0 xi
ni
0
xi
Repartiţie complexă obţinută prin suprapunerea a trei repartiţii: una în formă de
J şi două moderat asimetrice. Acest tip de repartiţii apare frecvent când gruparea nu
a fost executată corect.
Indicatorii asimetriei sunt:
- asimetrie absolută:
As x Mo sau
As 3 x Me
Aceşti indicatori au unitatea de măsură a caracteristicii analizate, deci prezintă
dezavantajul că nu pot fi comparate din punct de vedere al asimetriei serii după
caracteristici exprimate prin unităţi de măsură diferite.
Aceşti indicatori pot fi pozitivi (în cazul asimetriei de stânga) sau negativi (în
cazul asimetriei de dreapta).
Datorită faptului că o distribuţie se caracterizează şi prin variabilitate, pentru
aceeaşi asimetrie absolută, o serie care are variabilitatea mai mică va fi mai
pronunţat oblică, iar pentru una cu variabilitatea mai mare, oblicitatea se va atenua.
- asimetrie relativă:
De aceea se calculează coeficientul de asimetrie propus de Pearson
(statistician englez 1857-1936):
x Mo
Cas 1, 1
Dacă Cas = 0 seria este perfect simetrică:
x Me Mo
Dacă Cas 0 seria prezintă asimetrie pozitivă sau de stânga:
x Me Mo (predomină valorile mici)
Dacă Cas 0 seria prezintă asimetrie negativă sau de dreapta:
x Me Mo (predomină valorile mari)
Cu cât Cas este mai apropiată de 1 seria este mai asimetrică.
Dacă Cas [-0,3; 0,3] seria este uşor sau moderat asimetrică.
Acest coeficient este recomandat numai pentru serii de repartiţie uşor
asimetrice.
Dacă se cunoaşte mediana seriei, coeficientul de asimetrie se poate calcula cu
relaţia:
Cas
3 x Me
3, 3
Acest indicator este recomandat numai pentru serii de repartiţie uşor asimetrice
când între cei trei indicatori ai tendinţei centrale există relaţia:
Mo x 3 Me x
Cu cât Cas este mai apropiat de 0 cu atât seria este mai simetrică, iar cu cât se
apropie de extremităţile intervalului, asimetria devine mai pronunţată.
Aceşti doi indicatori ai asimetriei sunt cei mai utilizaţi în practică, dar în afară de
aceştia se mai utilizează şi alţi indicatori.
4. Rezumatul lecţiei
Cuprins:
1. Importanţa sondajului.
2. Avantajele şi dezavantajele utilizării sondajului.
3. Tipuri de sondaj.
4. Principii de bază ale inferenţei statistice. Eşantionarea.
5. Procedee de eşantionare.
6. Erori întâlnite în sondaj.
7. Conceptele estimaţiei. Construcţia intervalelor de încredere.
8. Rezumatul lectiei.
1. Importanţa sondajului
1
Răspunsul la acest tip de întrebări poate fi găsit prin aplicarea unei tehnici de
cercetare şi studiu al pieţei denumită sondaj.
Sondajul reprezintă o cercetare parţială, al cărei scop este de estimare a
caracteristicilor populaţiei generale pe baza rezultatelor obţinute de la un eşantion
riguros prelevat. Acestă metodă de investigaţie statistică parţială se bazează pe
principiile teoriei probabilităţilor, statisticii matematice şi legii numerelor mari. Teoria
sondajului are ca obiect principal elaborarea metodelor ştiinţifice de modelare a
problemelor legate de culegerea şi analiza datelor., reprezentativitate, preferând
informaţii sintetice în locul detaliilor ce pot descrie situaţii netipice.
Sondajul se utilizeaza frecvent pentru luarea deciziilor in mediul economic si
social nefiind doar un concept promovat de statisticieni. Scopul sondajului este sa
ofere suficiente informatii despre esantion astfel incat sa permita inferenta cu un nivel
de incredere acceptat. Mijlocul prin care realizeaza scopul este selectia unei parti
reprezentative din populatia mama (“normally representative”), parte denumita
ESANTION.
2
Principalele avantaje ale utilizarii sondajului sunt costul redus, timp mai mic
decat in cazul efectuarii unui recensamant si obtinerea unei acurateti sporite a
rezultatelor. Alte avantaje sunt:
Posibilitatea aplicării sondajului şi în cazul efectuării de teste
distructive.
Utilizarea în situaţii în care natura populaţiei nu permite enumerarea
unităţilor statistice: mulţimea consumatorilor vs. mulţimea clienţilor
permanenţi.
Dezavantajul principal este posibilitatea obţinerii de date nereprezentative,
datele statistice culese prin sondaj inducând în mod inevitabil erori. Un alt dezavantaj
al acestei metode îl constituie imposibilitatea de a urmări fenomenele în dinamică,
sondajul surprinde static caracteristicile unităţilor observate, ceea ce poate fi corectat
prin organizarea de observări selective periodice, cu periodicitate constantă.
3. Tipuri de sondaje
3
Foloseşte numere aleatoare după schema cu bila revenită
(sondaj cu ÎNLOCUIRE) sau cu bila nerevenită (sondaj FĂRĂ
ÎNLOCUIRE)
SONDAJUL STRATIFICAT
Eşantionul aleator stratificat este obţinut prin separarea populaţiei pe straturi,
grupe, ce se exclud reciproc, doar după această operaţiune se extrage un eşantion
aleator din fiecare strat.
Criterii de separe a populaţiei pe straturi, variabile independente sunt de
exemplu:
Gen
Varsta
Ocupatie
Venitul gospodariei
Religie
Numar de copii sub 18 ani din gospodarie
Locatia
Brand-ul
SONDAJUL CLUSTER
Eşantionul cluster eşantion aleator de grupuri sau elemente
Se utilizează când nu se poate produce lista membrilor populatiei datorita
necunoasterii tuturor sau a dispersiei teritoriale, de exemplu se formeaza clustere de
ACTIONARI
4
răspunsuri, finite sau infinite ca număr, ce formează spaţiul de sondaj. De exemplu
o firmă poate obţine profit negativ , deci pierdere, profit zero, sau proft pozitiv, deci
beneficiu, categorii ce reprezintă rezultate. Seturile formate din aceleaşi categorii
formează evenimente. Posibilitatea ca firmele să fie solvabile deci să obţină profit
zero sau pozitiv, reprezintă un eveniment.
În teoria sondajului rezultatele unui număr mare de experimente sunt datele
primare. În anumite cazuri putem presupune că fiecare rezultat este independent de
cel precedent, aşa cum un număr al zarului este independent de celelalte aruncări. În
condiţiile în care cunoaştem mecanismul de probabilitate, putem calcula
probabilitatea de apariţie a fiecărui rezultat. Teoria sondajului se preocupă cu
aplicarea teoriei probabiltăţilor pentru seturi de date primare.
Dacă în urma unei cercetări se înregistrează doar informaţii parţiale, este
posibil ca datele înregistrate să fie utilizate pentru obţinerea intervalelor de încredere
cu o anumită probabilitate dacă setul de date respectă condiţiile de
reprezentativitate pentru populaţia din care a fost extras.
Pentru a se putea estima corect parametrii colectivităţii de selecţie pe baza
rezultatelor prelucrării datelor de sondaj, estimaţie garantată cu o anumită
probabilitate, este necesar ca eşantionul pe baza căruia se culeg datele primare să
fie reprezentativ.
Un eşantion este reprezentativ dacă structura sa reproduce cât mai exact
structura populaţiei de referinţă din care a fost prelevat.
Pentru asigurarea reprezentativităţii eşantionului este necesar să se respecte
anumite reguli dintre care amintim:
a. includerea unităţilor în eşantion să se realizeze în manieră cât mai
obiectivă, toate unităţile trebuie să aibe acceaşi şansă de a participa la
formarea eşantionului - extragerea unităţilor să se realizeze conform
principiilor hazardului cu o probabilitate egală şi diferită de zero.
b. mărimea eşantionului să fie suficientă pentru a reda caracteristicile
esenţiale ale populaţiei generale
c. includerea fiecărei unităţi în eşantion trebuie să se facă independent de
cuprinderea altor unităţi
Determinarea gradului de reprezentativitate a populaţiei studiate la un moment
dat ridică probleme deosebit de dificile în calea evaluării cercetărilor, aceasta
deoarece, de cele mai multe ori, nu pot fi cunoscute în prealabil caracteristicile
5
relevante ale populaţiei ce urmează a fi cercetată şi se procedează la estimări mai
mult sau mai puţin corecte; se ajunge la identificarea acestor caracteristici numai în
urma studiului, când de fapt nu se mai poate interveni pentru alegerea “populaţiei
adecvate”.
Cu excepţia cazurilor, rare dealtfel, în care ne pot ajuta evidenţele, numai
efectuarea unor înregistrări prealabile cercetării propriu-zise ne permite să ne fixăm,
în cunoştinţă de cauză, la o anumită populaţie relevantă pentru tema şi obiectivele
cercetării.
Studiile statistice exhaustive prealabile, deşi necesare, sunt puţin practicate
totuşi datorită împovărării costurilor de cercetare, a creşterii timpului afectat şi a
muncii depuse. Determinarea cu maximă precizie a caracteristicilor economice, de
piaţă, politice şi de altă natură ale colectivităţii studiate, ca şi dispunerea ei spaţială
se înscriu drept cerinţe elementare, obligatorii pentru o cercetare concretă.
5. Procedee de eşantionare
Eşantionare aleatoare
Pentru a respecta caracterul aleator al formării eşantionului, procedeul de
eşantionare nu trebuie să fie influenţat de analist. Un eşantion este aleator dacă
6
toate unităţile extrase din colectivitatea generală au avut aceeaşi şansă (probabilitate
egală şi diferită de zero) de a participa la eşantion. Rezultatele unui sondaj efectuat
pe baza unui eşantion aleator pot fi interpretate probabilistic.
7
Eşantionare dirijată şi mixtă
8
sau nu rezultatele sondajului. Asemănarea dintre eşantionarea stratificată aleatoare
şi cea pe cote constă în stratificarea iniţială a populaţiei de referinţă pe straturi
omogene.
Diferenţa dintre stratificarea aleatoare şi eşantionarea pe cote constă în
procedeul de selecţie al unităţilor din fiecare strat, selecţia în cazul eşantionarii pe
cote fiind lăsată pe seama operatorilor. Deci metoda se bazează pe definirea
caracteristicilor de structurare a populaţiei de referinţă. Astfel pentru fiecare
caracteristică, structura eşantionului trebuie să fie identică cu cea a populaţiei din
care este prelevat. Se definesc variabilele de control , că ansamblul caracteristicilor
reţinute pentru a asigura identitatea între eşantion şi populaţia de referinţă. Stabilirea
variabilelor de control are în vedere obiectivul studiului şi tipul populaţiei de referinţă.
Pentru alegerea criteriilor de cotă, de structurare este recomandabil să se ţină
seama de următoarele îndrumări : definirea varibilelor pe baza întrebărilor cuprinse
în eşantion, folosirea ca variabile de control doar acelea pentru care se poate defini o
distribuţie statistică pentru populatia de referinţă, limitarea numărului de criterii de
cotă, ce trebuie să fie independente, fără să cuprindă conotaţii psihologice şi formate
din unităţi statistice cu un grad cât mai mare de omogenitate. Dacă se respectă
aceste condiţii se poate obţine un eşantion sensibil apropiat de un eşantion extras pe
baza procedeelor aleatoare.
De exemplu, într-un sondaj statistic organizat la nivelul Municipiului
Bucureşti, cu scopul identificării preferinţelor cursanţilor pentru calculatoarelor
personale şi produse program, pentru identificarea segmentelor ţintă pe diferite tipuri
şi categorii de cursanţi pot fi alese ca variabile de control categoria - socio
profesională, vârsta, gradul de educaţie, structura populaţiei după aceste variabile de
segmentare fiind publicate în urma ultimului recensământ.
Această metodă este de departe cea mai utilizată metodă în studiile de piaţă,
deoarece necesită un buget redus de cheltuieli, fiind mai puţin costisitoare decât
orice metodă de eşantionare aleatoare, proiectarea nu este laborioasă, rezultatele se
obţin operativ, într-un timp scurt şi de fapt este singura metodă posibilă dacă nu
există bază de sondaj.
9
ce în ce mai des utilizată în studiile de marketing. Includerea în eşantion se
realizează pe baza opţiunii voluntare a persoanelor de a participa la eşantion.
Anchetele desfăşurate pe baza metodei voluntariatului se aplică studiului
opiniilor ascultătorilor radioului, cititorilor ziarelor, ”navigatorilor” pe INTERNET.
Metoda constă în publicarea chestionarului în presă, sau afişarea sa într-o pagina de
Web, însoţită de rugămintea de a răspunde. Deşi aceste anchete furnizează un
volum mare de date se pune problema posibilităţii extrapolării rezulatelor, imposibil
de realizat datorită necunoaşterii reprezentativităţii eşantionului celor ce au răspuns.
10
grosolane şi aleatoare Erorile sistematice sunt determinate de acţiunea unor factori
ale căror cauze de apariţie pot fi stabilite, iar apoi eliminate. Apariţia erorilor
grosolane este legată de încălcarea condiţiilor de efectuare a experimentului sau a
observaţiei. În teoria erorilor se dau criterii de depistare a erorilor grosolane. Obiectul
teoriei erorilor îl constituie numai erorile aleatoare, care sunt determinate de acţiunea
unor factori greu de depistat, din care cauză efectul acţiunii lor este inevitabil. Erorile
de sondaj mai sunt clasificate în erori de înregistrare, comune tuturor tipurilor de
observare, şi erori de reprezentativitate, specifice sondajului. Erorile de
reprezentativitate sunt la rândul lor: sistematice şi întâmplătoare.
Din punctul de vedere al posibilităţii controlului erorilor, în literatura americană
de studiu al pieţei, erorile mai sunt clasificate în două mari grupe:
1. Erori ce pot fi previzionate: acestea sunt controlabile şi au drept cauze
măsurările statistice ale datelor continue şi rotunjirile efectuate pentru a obţine
rezultate discrete conform conţinutului caracteristicii statistice, deci ele sunt
probabile - sau de sondaj şi de calcul - ambele tipuri putând fi estimate şi efectele
lor controlate. Prin operaţiunea matematică de rotunjire a valorilor înregistrate se
induc erori ce se amplifică dacă rotunjirea continuă în faza de analiză.
Drept urmare putem afirma că datele sunt rotunjite din următoarele motive:
Dacă caracteristica observată este continuă în anumite cazuri este necesară
rotunjirea pentru a putea exprima magnitudinea datei (de obicei se păstrează
doar două zecimale)
Pentru caracteristicle discrete rotunjirea are drept scop respectarea
caracterului întreg al acestora.
2. Erori ce nu pot fi previzionate: acestea sunt necontrolabile şi se datorează:
înregistrărilor incomplete sau incorecte, definirii ambigue a caracteristiclor sau
unităţilor statistice ce sunt studiate.
Identificam doua tipuri de erori de sondaj din punctul de vedere al utilizarii
tehnicilor de esantionare:
11
Greseli
Non-raspunsuri
Imposibilitatea selectarii unor elemente ale populatiei mama
Inducerea/influentarea raspunsurilor
Necunoasterea raspunsurilor
Principalele cauze ale erorilor sistematice sunt alegerea deliberată a unor date
considerate în mod greşit ca fiind reprezentative, alegerea la “întâmplare” ce diferă
esenţial de alegerea după principiile probabilistice, dorinţa voită a cercetătorului de a
demonstra o anumită concluzie, substituirea unei unităţi de cercetare cu altă unitate,
în mod voit şi cuprinderea incompletă în sondaj a unităţilor de cercetare.
Spre deosebire, erorile aleatoare de selecţie apar din procesul de sondaj.
Aceste erori se produc chiar dacă se respectă principiile probabilistice, deoarece
eşantionul nu reproduce perfect distribuţia populaţiei generale. Dacă sondajul este
probabilistic, aceste erori pot fi calculate cu anticipaţie. Estimarea parametrilor din
populaţia generală se va efectua pe baza indicatorilor de sondaj, corectaţi cu o
eroare de reprezentativitate ce se găseşte într-un anumit interval probabilistic.
Aceste analize de perspectivă şi aceste proiecţii ale rezultatelor sondajului asupra
populaţiei de referinţă, fac din metoda sondajului un puternic instrument în procesul
luării deciziilor în mediul economico-de piaţă.
12
Intervalul de estimare denumit şi intervalul de încredere realizează
inferenţa despre populaţie prin estimarea valorii parametrului într-un interval
determinat pentru un anumit nivel de incredere (probabilitate)
Conceptul estimării punctuale trebuie lărgit cu cel al estimării unui interval de
variaţie pentru parametrul populaţiei totale, garantat cu o anumită probabilitate. Într-o
viziune mai largă, dacă parametrul ar fi fost un vector, prin estimarea intervalului s-ar
stabili regiunea critică a acestuia. Un exemplu îl constituie intervalele de încredere.
În cazul unui eşantion de volum n, extras dintr-o populaţie normal distribuită cu
media necunoscută şi deviaţia standard cunoscută, probabilitatea 1 – α este
probabilitatea ca media de sondaj să varieze cu o mărime denumită eroare limită,
±zα/2 .σ √n, utilizată pentru a estima intervalul de variaţie a mediei, şi z α/2este
parametrul corespunzător punctului procentual α/2 al distribuţiei normale standard.
x
Dacă z este: Z
n
P( x za 2 x za 2 ) 1a
n n
Niveluride
Niveluri de
incredere
incredere aa a/22
a/
za/2
0.90
0.90 0.10
0.10 0.05
0.05 1.645
1.645
0.95
0.95 0.05
0.05 0.025
0.025 1.96
1.96
0.98
0.98 0.02
0.02 0.01
0.01 2.33
2.33
.
13
Construcţia intervalelor de încredere pentru media aritmetică
Unde
n = volumul eşantionului
σ = dispersia variabilei în populaţia mama din care a fost extras eşantionul.
14
parametru = valoarea estimatorului ± eroarea de sondaj,
adică:
x e
Dimensiunea eşantionului – sondaj simplu aleator, s cunoscut, procedeul de
selecţie cu bila revenită este:
za 2
2
n
e
x
p unde
n
x numarul _ cazurilor _ de _ succes.
n volumul _ esantionului.
În anumite condiţii, proporţia în eşantion este normal distribuită cu media m =
π (proporţia din populaţie) şi dispersia = p(1 - p). Dacă procentul din populaţie este
π, valoarea z va fi:
15
În acest caz, dispersia din populaţie nu este cunoscută, fiind π (1 - π). Pentru
caracteristica alternativă se va putea estima nivelul lor absolut în carul colectivităţii
totale, ca un produs între limitele intervalului de încredere şi volumul întregului
fenomen, adică:
N (w w ) . In acest caz volumul esantionului va fi:
2
z p(1 p)
n a /2
e
n
e
16
În anumite condiţii, proporţia în eşantion este normal distribuită cu media m = π
(proporţia din populaţie) şi dispersia = p(1 - p). Dacă procentul din populaţie este π, valoarea
z va fi:
Greutatea specifică a unităţilor din cadrul colectivităţii totale, care posedă o anumită
caracteristică (luată în considerare în momentul formării eşantionului) poate fi estimată, cu o
precizie antecalculată, astfel încât ea poate lua valori într-un interval de forma:
p w w , adica
In acest caz, dispersia din populatie nu este cunoscuta, fiind π (1 - π). Pentru
caracteristica alternativă se va putea estima nivelul lor absolut în carul colectivităţii totale, ca
un produs între limitele intervalului de încredere şi volumul întregului fenomen,
adică: N (w w ) . In acest caz volumul
2
z p(1 p)
n a /2
e
17
Lecţia nr. 9
Cuprins:
Seriile cronologice sunt formate din două şiruri de date, în care primul şir ne arată
variaţia timpului, iar cel de-al doilea şir cuprinde valorile fenomenului sau procesului
economic analizat la momentele sau pe intervalele de timp respective.
Forma generală a unei serii cronologice este:
t1 t 2 ... t i ... t n
i 1, n
y1 y 2 ... y i ... y n
Trendul sau tendinţa generală a unei serii cronologice poate fi descris prin relaţia:
y f t i i 1, n
t
y1 y2 yn
1.2. serii cronologice de momente în care fiecare termen al seriei arată nivelul la
care a ajuns fenomenul sau procesul analizat la un anumit moment de timp.
Forma generală a unei astfel de serii este:
t1 t2 tn
t
yn
y1 y2
Exemplu:
stocurile de materii prime la sfârşitul fiecărei luni
- yt = stocurile de materii prime;
capitalul fix la sfârşit de an:
- yt = capitalul fix:
depozitele sau creditele bancare la data de 1 a fiecărei luni:
- yt = depozite sau credite bancare.
Caracteristica principală a unei serii de momente este aceea că termenii seriei nu se pot
însuma pentru că s-ar produce multiple înregistrări.
Exemplu:
Dacă avem depozitele bancare la data de întâi a fiecărei luni, nu putem însuma aceste
depozite deoarece un depozit care este valabil la 1 ianuarie poate să fie valabil şi la 1
februarie etc., şi am înregistra valoarea lui de mai multe ori.
☺ Exemplul 1
Fie următoarea serie cronologică de intervale:
☺ Exemplul 2
Fie următoarea serie cronologică de intervale:
☺ Exemplul 3
Numărul de turişti care au sosit într-o staţiune montană în fiecare trimestru al anului 2006 a
fost:
y y 2 y3 y 4
y 1 2875 turişti/trimestru
4
Trim. II
Legenda
Trim. I
Trim. I
Trim. II
Trim. III
Trim. IV Trim. IV
Trim. III
Trim. I
1 cm OX, OY = 2000 turişti
Trim. II
☺ Exemplul 4
Populaţia unui judeţ la: 01.01.98 : 364.500 y1
01.04.98: 365.000 y2
01.07.98: 367.800 y3
01.10.98: 370.100 y4
31.12.98: 372.200 y5
y 367.813
t1 t2 t3 t4 tn-1 tn
d1 d2 d3 dn-1
d d d2 d d3 d d n 1 d
y1 1 y 2 1 y3 2 ... y n 1 n 2 y n n 1
y 2 2 2 2 2
d1 d 2 ... d n 1
☺ Exemplu 5
Populaţia unui judeţ la: 01.01.98: 364.500
01.03.98: 364.900
10.04.98: 365.300
15.05.98: 366.000
01.07.98: 367.800
01.08.98: 368.000
15.09.98: 370.000
31.12.98: 372.200
y 367.784
Schema pentru calculul mediilor:
Nivelul
mediu cu intervale media cronologică
egale între simplă
momente
- pentru serii
de momente
modificarea absolută:
cu bază fixă;
cu bază în lanţ;
valoarea absolută a unui procent de modificare:
cu bază fixă;
cu bază în lanţ;
indicatori relativi:
indicele:
cu bază fixă;
cu bază în lanţ;
ritmul:
cu bază fixă;
cu bază în lanţ;
indicatori medii:
modificarea absolută medie;
indicele mediu;
ritmul mediu;
nivelul mediu.
Indicatorii seriilor cronologice sunt indicatori primari (nivelul absolut) sau indicatori
derivaţi (obţinuţi prin raportare sau diferenţă).
Dacă compararea se face cu primul termen din serie, atunci indicatorii derivaţi obţinuţi
se numesc indicatori cu bază fixă.
Dacă compararea se face cu termenul precedent din serie atunci indicatorii derivaţi
obţinuţi se numesc indicatori cu bază în lanţ (mobilă).
Indicatorii cu ajutorul cărora se caracterizează seriile cronologice de intervale sunt:
a) indicatori absoluţi;
b) indicatori relativi;
c) indicatori medii.
Indicatori absoluţi:
nivelurile individuale ale seriei cronologice: y t , t 1, n
n
nivelul totalizat al seriei cronologice: y t
t 1
cu bază în lanţ:
t / t 1 y t y t 1 t 2, n
n
t / t 1 n /1
t 2
Dacă y t y t 1 A t / t 1 0
Indicatori relativi:
indicele – se calculează ca raport între doi termeni ai seriei cronologice şi ne arată
de câte ori s-a modificat fenomenul analizat de la o perioadă la alta:
yt
cu bază fixă: I t / 1 , t 2, n
y1
cu bază în lanţ:
yt
I t / t 1 , t 2, n
y t 1
n
I t / t 1 I n / 1
t 2
Indicele şi ritmul mediu sunt foarte sensibili la valorile extreme ale seriei (y1 şi yn).
Dacă una din cele două valori (y1 sau yn) este nereprezentativă pentru evoluţia fenomenului
analizat este suficient pentru a nu obţine indicatori medii.
yt
OY
t OX
ŷ1 y1 ŷ n y n
t 1 ;
ŷ t y1 I t 1, n
ŷ1 y1 ŷ n y n
Metoda celor mai mici pătrate a mai fost utilizată la estimarea parametrilor funcţiilor de
regresie, numai că în cazul seriilor cronologice în locul variabilei independente X de la
regresie utilizăm variabila timp (t).
Valorile variabilei timp (t) se măsoară cu ajutorul scalei de interval, în cadrul căreia
originea scalei şi unitatea de măsură pot fi alese arbitrar.
Pentru uşurinţa calculelor valorile lui t se aleg astfel încât t i 0 .
i
t
-3 -2 -1 0 1 2 3
- dacă seria cronologică are un număr par de termeni, atunci originea scalei (t = 0) se va
găsi între cei doi termeni centrali ai seriei. Cei doi termeni centrali vor primi valorile –1 şi
respectiv 1, iar ceilalţi termeni ai seriei cronologice vor fi distribuiţi simetric faţă de cei doi
termeni centrali la distanţă de două unităţi (pentru că distanţa dintre fiecare doi termeni
succesivi trebuie să fie egală):
2000 2001 2002 2003 2004 2005 2006 2007
-7 -5 -3 -1 1 3 5 7
y t Yt 2 min y t a bt 2 min
na b t y t
a t b t 2 ty
t
Deoarece t 0 :
a
yt y ; b
ty t
n t2
a – reprezintă media variabilei yt calculată ca o medie aritmetică simplă a termenilor
seriei;
b – reprezintă panta dreptei de tendinţa (de trend), iar valoarea sa arată cu cât se
modifică în medie fenomenul analizat dacă variabila timp se modifică cu o
unitate (an, lună, trimestru).
Atunci când se utilizează mai multe procedee diferite pentru ajustarea aceleiaşi serii
cronologice, în final trebuie să alegem cea mai bună metodă de ajustare comparând rezultatele
teoretice cu valorile reale:
1) se reprezintă pe acelaşi grafic valorile reale şi valorile teoretice obţinute prin
diferite procedee de ajustare. Comparând valorile de pe grafic alegem valorile
teoretice cele mai apropiate de valorile reale;
2) compararea sumei valorilor reale cu suma valorilor teoretice:
n n
yi Yi
i 1 i 1
Cuprins:
Legăturile ce se pot forma sunt legături stohastice, în care un fenomen este factor de
influenta, iar celălalt este efect. Statistica, printr-o gamă largă de procedee şi metode
1
specifice, poate studia manifestarea concretă a acestor legături, le poate exprima cantitativ şi
măsura intensitatea cu care se produc. Legătura (dependenţa) statistică se caracterizează prin
faptul că, la modificarea unui factor de influenţă, factorul influenţat răspunde cu o distribuţie
de valori.
Legăturile statistice se pot clasifica astfel:
1) După natura relaţiei de cauzalitate distingem:
a) legături funcţionale. Acestea se manifestă între două fenomene în care unul este cauza iar
celălalt efectul. Se întâlnesc în natură, tehnică etc. Dacă se notează fenomenul cauză cu “x” şi
fenomenul efect cu “y” atunci relaţia matematică este: y = f(x)
b) legături statistice (stohastice) apar atunci când fenomenul efect este rezultatul combinării
influenţei mai multor cauze, care pot acţiona în condiţii egale sau diferite. Relaţia matematică
este: y = f(x1,x2,………..,xn), unde: x1, x2, ..., xn – sunt valorile fenomenelor cauză care au
fost înregistrate; y = valorile fenomenului efect.
2
5) După forma de realizare a legăturii distingem:
a) legăturile liniare exprimate printr-o funcţie liniară, de gradul intai;
b) legăturile neliniare exprimate printr-o curbă (exponenţială, parabolă, hiperbolă etc.);
6) După timpul în care se realizează:
a) legături sincrone: au loc în acelaşi timp şi se pot urmări în dinamică pentru aceeaşi
perioadă.
b) legături asincrone: influenţa caracteristicilor factoriale asupra variaţiei caracteristicii
rezultative apare după trecerea unei perioade de timp. Forma de realizare a legăturii
corespunde funcţiei matematice de regresie (de estimare) care se alege pe baza graficului de
corelaţie (corelogramei).
Pentru a caracteriza legătura dintre fenomene, se pot folosi mai multe procedee ce se
încadrează în categoria metodelor simple de caracterizare a legăturilor. Aceste metode sunt
uşor de aplicat şi se bazează pe analiza calitativă a variabilelor corelate, oferind informaţii
asupra naturii şi trăsăturilor esenţiale ale legăturii cercetate.
Metodele simple de caracterizare a legaturilor stohastice sunt urmatoarele:
1) Metoda seriilor paralele interdependente are la bază serii paralele de date, obţinute prin
operaţia de centralizare la nivelul unităţilor simple sau complexe, fără a fi grupate. Se pot
folosi serii: de timp, de spaţiu şi atributive. Această metodă ne oferă posibilitatea de a stabili
existenţa legăturii şi direcţia de realizare a acesteia, prin analiza valorilor perechii x, y.
Această metodă este mai puţin sugestivă în cazul seriilor formate dintr-un număr foarte mare
de termeni şi implică într-o măsură importantă subiectivismul cercetătorului.
2) Metoda grupărilor este o metodă de sistematizare a datelor pe baza căreia se pot cerceta
legăturile (conexiunile) statistice. Se poate folosi gruparea simplă sau gruparea combinată.
☺ Exemplu
Despre 22 de salariaţi ce activează în ramura comerţului se cunosc datele:
3
15 - 20 5 87
> 20 3 89
Gruparea simplă presupune gruparea unităţilor statistice după o caracteristică
principală de grupare şi calculul şi interpretarea mediilor parţiale sau a mărimilor relative
parţiale pentru caracteristica rezultativă. Gruparea combinată se bazează pe împărţirea
unităţilor statistice în grupe concomitente după variaţia a două caracteristici de grupare (x,y),
iar rezultatele grupării se prezintă într-un tabelul combinat cu dublă intrare (vezi capitolul II).
Metoda grupării trebuie utilizată doar în cazul unui număr mare de observaţii statistice, când
aplicarea metodelor analitice de calcul nu se poate face fără o grupare prealabilă a datelor
înregistrate.
3) Metoda tabelului de corelaţie presupune utilizarea unui tabel combinat cu dublă
intrare care ne sugerează existenţa legăturii, direcţia de realizare a ei şi unele aprecieri
empirice privind intensitatea legăturii prin analiza modului în care frecvenţele comune (nij) se
distribuie în rubricile interioare ale tabelului. Dacă frecvenţele nij tind a se concentra către
cele două diagonale trasate în tabelul următor, legătura între xi şi yj va fi intensă. În schimb,
dacă se împrăştie la întâmplare în reţeaua tabelului, legătura este slabă sau poate lipsi. În
concluzie, procedeul tabelului de corelaţie este o combinare a metodei grupării cu
principiile de construire şi interpretare a unei reprezentări grafice.
4
acestea se trasează vizual o dreaptă sau o curbă ale cărei ecuaţii se cunosc. În cazul în care
curba sau dreapta se trasează pe prima diagonală, legătura este directă, dacă se trasează pe cea
de a doua diagonală, legătura este inversă. Metoda grafică se utilizează ca metodă empirică
pentru alegerea funcţiei matematice ce se analizează în cazul regresiei şi corelaţiei statistice.
Metodele analitice iau în consideraţie valorile reale ale varibilelor corelate şi parametrii
corespunzători acestora. Acestea poartă denumirea de metode parametrice şi sunt:
1) metoda regresiei;
2) metoda covarianţei;
3) metoda raportului de corelaţie;
4) metoda coeficientului de corelaţie.
1) Metoda regresiei reprezintă o metodă statistică de analiză a legăturii dintre variabile cu ajutorul
unor funcţii, numite funcţii de regresie. Funcţia de regresie se alege printr-o modalitate empirică
folosind graficul de corelaţie (corelograma) si prin aplicarea testelor de semnificaţie (de exemplu:
testul “F” de analiză dispersională). În funcţie de numărul de variabile incluse în model,
distingem: regresie unifactorială (o varibilă factorială xi şi o variabilă rezultativă yi) şi
regresie multifactorială (mai multe variabile factoriale şi o singură variabilă rezultativă).
a) Regresia unifactorială liniară are la bază ecuaţia dreptei (funcţia de gradul întâi):
y x i a bx i
5
(yi) dacă variabila factorială (xi) se modifică cu o unitate (semnul lui “b” ne indică direcţia
legăturii). Parametrii a şi b se determină din sistemul de ecuaţii normale obţinut prin metoda
celor mai mici pătrate, care se bazează pe minimizarea pătratelor abaterilor dintre valorile
individuale înregistrate şi valorile teoretice (corespunzătoare funcţiei). Această funcţie
obiectiv presupune identificarea punctului de extrem (are în vedere determinarea parametrilor
funcţiei) si verificarea dacă punctul de extrem este minim sau maxim (se realizează prin
semnul derivatei de ordinul II dacă este pozitiv (semnifică minim) dacă este negativ
(semnifică maxim). Relaţia de minimizare este: ( y i y x i ) 2 = minim. Pentru tendinţa liniară
na b x i y i
; i = 1, n . Rezolvand sistemul se calculeaza termenul liber, a, si panta
a x i b x i2 x i y i
yi xi
dreptei, b, dupa metoda determinantilor, astfel: a x i y i x i2 y i x i2 x i x i y i ;i= 1, n
a
n xi n x i2 ( x i ) 2
xi x i2
n yi
b x i x i yi n x i yi x i yi ; i = 1, n
b
n xi n x i2 ( x i ) 2
xi x i yi
Interpretarea pantei: daca b > 0 legătura de corelaţie este directă (pe măsură ce
cresc valorile lui xi cresc şi valorile ecuaţiei de regresie calculate); daca b < 0 legătura de
corelaţie este inversă (pe măsură ce creşte valoarea caracteristicii factoriale (xi) scade valoarea
caracteristicii rezultative (yi) si daca b = 0 cele două variabile sunt independente şi yxi = 0.
Funcţia de regresie exprimă statistic modul în care caracteristica rezultativă (yi) se modifică,
dacă ar influenţa numai caracteristica factorială (xi), iar ceilalţi factori sunt consideraţi cu
acţiune constantă.
a) y b) y
tgα x tgα x
6
a < 0 şi b > 0 legătură directă a > 0 şi b < 0 legătură inversă
figura 1.1 figura 1.2
c) y d) y
n i x i yi n i x i n i yi n i
b
n i x i2 n i ( x i n i ) 2
Pentru cazul (2) (grupare combinată) rezultatele se prezintă într-un tabel combinat cu
dublă intrare, iar sistemul de ecuaţii se determină prin analogie cu cel de la cazul (1):
K m K m
a n ij b x n
i i y jn j
i j i j
K K K m
a x i n i b x i2 n i x i y j n ij
i i i j
7
produselor abaterilor variabilelor faţă de media lor conform relaţiei:
1 n
cov( x, y) ( x i x )( y i y) .
n i 1 Semnul indicatorului arată direcţia legăturii: plus (legătura
cov( x, y) x y
directă), minus (legătura indirectă), iar covarianţa nulă ne indică lipsa legăturii de corelaţie
(variabilele sunt independente). Covarianţa are ca neajuns faptul că depinde de unităţile în
care se măsoară variabilele aleatoare.
3) Metoda raportului de corelatie
Pentru stabilirea intensităţii legăturii dintre două varibile (xi, yi) se calculează un
indicator sintetic de corelaţie numit “raport de corelaţie” simbolizat cu Rx/y. Acesta permite
măsurarea gradului de intensitate a realizării legăturii dintre caracteristica considerată factor
de influenţă (xi) şi caracteristica rezultativă (yi), indiferent de forma legăturii: liniară sau
neliniară. Calculul se bazează pe descompunerea variaţiei totale (dispersiei) a caracteristicii
rezultative “y” astfel:
(yi y 0 ) = ( y i y xi ) + ( y xi y 0 )
abaterea întâmplătoare abaterea sistematică
Prin însumare şi ridicare la pătrat se obţine:
( y i y 0 ) 2 [( y i y x i ) ( y xi y 0 )] 2
(y y
i xi )2 2 ( yi yxi )( yxi y 0 ) ( yxi y 0 )2
0
(y i y0 )2 (y i y xi ) 2 ( y xi y 0 ) 2
( yi y0 ) 2
(y i y xi ) 2
( y xi y 0 ) 2
n n n
2y = 2y + 2y
r x
Dispersia totală: arată
influenţa tuturor factorilor Dispersia reziduală: arată Dispersia sistematică:
esenţiali şi întâmplători acea parte din variaţia arată influenţa factorului
care determină variabilei rezultative “yi” “xi” asupra variaţiei
variaţia totală a variabilei datorată acţiunii factorilor caracteristicii
rezultative “yi” întâmplători rezultative “yi”
8
2y / x 2y / r
nedeterminaţie ( K 2y / x ): R 2y / x 100 si K 2y / r 100 . Raportul de corelaţie se
2y 2y
( y i y xi ) 2
R y / x R 2y / x
2y / x
2y 2y / r
1
2y / r
1
n
1
( yi yxi ) 2
; i = 1, n
(1)
2y 2y
2y i 0
( y y ) 2
( yi y0 )2
(2) n (3)
R y/x 1
y i2 a y i b x i y i ; i = 1, n . Raportul de corelaţie ia valori în intervalul [0,1]
2
( y i )
y i2
n
( y i y xi ) 2 n i
R y/x 1 ; i = 1, n
( y i y) 2 n i
y i2 n i a y i n i b x i y i n i
1 ; i = 1, r
( y i n i ) 2
yi n i
2
ni
b) se dau valorile lui xi, frecvenţele după variabila xi (ni), frecvenţele după variabila
yj (nj) şi frecvenţa comună nij:
( y j y x i ) 2 n ij
R y/x 1
(y j y 0 ) 2 n j
y 2j n j a y j n j b x i y j n ij
= 1 ; j = 1, m ; i = 1, K
( y j n j ) 2
y 2j n j
nj
9
4) Metoda coeficientului de corelaţie
Coeficientul de corelaţie este un indicator sintetic prin care se măsoară legătura dintre
două variabile (xi, yi) statistice a căror distribuţie este asimptotic normală sau normală.
Calculul coeficientului de corelaţie se bazează în forma iniţială pe produsul abaterilor normale
normate (pentru un număr de date individuale negrupate):
xi x
Zx
x
yi y
Zy
y
( y i y) 2 n x i yi x i yi
y se obţine relaţia: ry/x = ; i = 1, n (2)
n [n x i2 ( x i ) 2 ][n y i2 ( y i ) 2 ]
cov( x i , y i )
Folosind covarianţa: ry/x =
x i yi
Interpretare:
1) ry/x [-1,1] apreciem din punct de vedere al semnului direcţia legăturii şi din
punct de vedere al mărimii intensitatea legăturii.
Dacă: ry/x = 0 legătura lipseşte şi variabilele xi şi yi sunt independente;
ry/x 0 legătura dintre cele două varibile este slabă;
ry/x = 1 legătură de tip funcţional (fie directă dacă semnul coeficientului este
pozitiv, fie inversă dacă semnul coeficientului este negativ);
ry/x 1 variabilele sunt puternic corelate, legătura fiind intensă.
2) ry/x = Ry/x se apreciează că legătura de corelaţie este de forma liniară, ceea ce
înseamnă că se poate folosi fie coeficientul, fie raportul de corelaţie.
3) Valoarea coeficientului de corelaţie depinde de forma liniei de regresie, motiv pentru
care acest indicator este semnificativ pentru corelaţiile de tip liniar şi mai puţin semnificativ
pentru corelaţiile de tip neliniar (în cazul din urmă folosindu-se raportul de corelaţie).
10
4) În cazul legăturii liniare se mai poate calcula ca o medie geometrică a coeficienţilor
de regresie (b) astfel:
ry / x b y / x b x / y
n x i yi x i yi
by/x
n x i2 ( x i ) 2
unde: ; i = 1, n
n x i yi x i yi
bx / y
n y i2 ( y i ) 2
( x i x )( y i y)n i
ry / x ; i = 1, n
nix y
xini yi n i (x i x) 2 n i ( y i y) 2 n i
unde: x ;y ;x ;y ; i = 1, n
ni ni ni ni
Înlocuind în formula (1) a lui ry/x se obţine:
ry / x
n x y n x n y n i i i i i i i i
; i = 1, n
[ n x n ( x n ) ][ n y n ( y n ) ]
i
2
i i i i
2
i
2
i i i i
2
c) se cunosc valorile lui xi, yj, ni, nj, nij, obţinute prin gruparea combinată, rezultatul
fiind prezentat într-un tabel combinat cu dublă intrare şi atunci relaţia de calcul devine:
n x y n x n y n
ij i j ij i i j j i 1, n
ry / x
i j
;
n x n x n ) ][ n y n y n ) ] j 1, m
2
[ i
2
i i ( i i
2
j
2
j j ( j j
Aceste metode, pe lângă faptul că pot stabili intensitatea legăturii făcând abstracţie de
tipul de distribuţie, permit măsurarea intensităţii legăturii nu numai pentru caracteristicile
cantitative, dar şi pentru cele calitative. Poartă denumirea de metode neparametrice deoarece
nu iau în calcul întotdeauna valorile variabilelor corelate şi nici parametrii lor corespunzatori.
În concluzie, se folosesc în următoarele situaţii: când distribuţia variabilelor corelate nu e
normală sau asimptotic normală; când nu este cunoscută forma de distribuţie a variabilelor;
11
când variabilele corelate sunt asimetrice, deci prezintă asimetrie pronunţată si când avem de-a
face cu variabile calitative şi cantitative care în prealabil necesită o anumită cuantificare.
Metodele neparametrice uzuale sunt:
1) Coeficientul de asociere a lui Yule presupune întocmirea tabelului de asociere, care
este un tabel combinat cu dublă intrare utilizat pentru variabilele de tip alternativ (DA/NU;
F/M; etc.). Tabelulul de asociere este format din două rânduri şi două coloane:
n11 n12
n21 n22
în care în capătul rândurilor se trec valorile celor două caracteristici asociate, iar în interiorul
tabelulului se trec frecvenţele corespunzătoare lor.
Exemplu: Dacă avem în vedere două variabile statistice “xi” şi “yi” şi considerăm că
sunt variabile de tip alternativ, atunci asocierea dintre “xi” şi “yi” se prezintă astfel:
yi
DA NU Total
xi
DA n11 n12 n11 + n12
NU n21 n22 n21 + n22
(în interiorul tabelului se consemnează concomitent răspunsurile privind cele două variabile
corelate “xi” şi “yi”). Pentru stabilirea valorii numerice a coeficientului de asociere care să
indice existenţa şi intensitatea legăturii, se calculează coeficientul lui Yule conform relaţiei:
n 11 n 22 n 21 n 12
Q ; unde Q [-1,1]
n 11 n 22 n 21 n 12
12
datele individuale ale celor două variabile în ordine crescătoare, astfel încât va trebui să
vedem dacă există concordanţă între rangurile caracteristicii factoriale de la 1 n şi rangurile
caracteristicii rezultative de la 1 n. Avantajul utilizării acestora:
1) pot fi utilizaţi cu succes şi în cazul unor distribuţii asimetrice;
2) pot fi utilizaţi pentru un număr restrâns de unităţi pentru care nu se poate verifica
reprezentativitatea datelor parţiale.
a) Coeficientul de corelaţie a rangurilor Spearman este o aplicaţie a coeficientului de
corelaţie liniară simplă la distribuţiile celor două şiruri de ranguri. [3]
Acesta se calculează parcurgând următoarele etape:
1) se identifică cele două variabile corelate xi şi yi;
2) se acordă ranguri de regulă crescătoare în aceeaşi manieră atât pentru variabila “xi” cât şi
pentru variabila “yi”;
Rangurile sunt numere de ordine care evoluează în progresie aritmetică cu raţia egală cu 1.
3) se determină diferenţa dintre ranguri (di) şi se ridică la pătrat;
13
Concordanţa (P) este mereu pozitivă şi reprezintă numărul de ranguri superioare fiecarui
rang considerat al variabilei yi. Discordanţa (Q) este mereu negativă şi reprezintă numărul de
ranguri inferioare fiecărui rang considerat al variabilei yi. Coeficientul rangurilor calculat
după formula lui Kendall este de obicei mai mic decât cel calculat după formula lui
Spearman, având aceeaşi interpretare.
14
Lecţia nr. 11
INDICII STATISTICI
Cuprins:
1. Obiectivele lecţiei.
2. Conţinutul, funcţiile şi clasificarea indicilor.
3. Indici individuali (elementari).
4. Indici sintetici (de grup).
4.1. Indici sintetici construiţi ca indici agregaţi. Sisteme de ponderare folosite în
construirea indicilor sintetici.
4.2. Indici sintetici calculaţi ca medie a indicilor individuali.
5. Indicii valorii, volumului fizic şi preţurilor.
6. Indicele preţurilor de consum (IPC).
7. Rezumatul lecţiei.
1. Obiectivele lecţiei
1
Metoda indicilor, ca metodă de analiză factorială permite studiul variaţiei fenomenelor
complexe în funcţie de modificările factorilor săi de influenţă.
Definiţie:
Indicele statistic este o mărime relativă, ce compară, sub formă de raport, mărimea
aceluiaşi fenomen înregistrat în două unităţi de timp, de spaţiu sau de program diferite, la
o unitate statistică, la o grupă sau la nivelul întregii colectivităţi..
2
c) După natura variabilelor indexate:
indici ai variabilelor cantitative
indici ai variabilelor calitative.
3. Indici individuali.
3
y0 – nivelul variabilei complexe în perioada de bază.
yk
Pentru o perioadă curentă „k”, faţă de perioada de bază, indicele devine: iky 0
y0
Pentru cele două variabile factoriale (x şi f) se pot scrie doi indici individuali conform
relaţiilor:
x1 xk
i1x0 , iar pentru o perioadă curentă “k”: ikx 0
x0 x0
f1 fk
i1f 0 , iar pentru o perioadă curentă “k”: ikf 0
f0 f0
Indicele individual al variabilei complexe y se mai scrie:
y1 x f x f
i1y0 1 1 1 1 i1x0 i1f 0
y 0 x0 f 0 x0 f 0
Sau, mai general:
y k xk f k x f
iky 0 k k ikx 0 ikf 0
y 0 x0 f 0 x0 f 0
Au ca rol reflectarea variaţiei medii relative la nivelul întregii colectivităţi sau al unei
grupe a acesteia. Se notează de regulă cu litere mari (I).
4
Indici sintetici sunt calculaţi ca indici agregaţi. La nivelul întregii colectivităţi,
volumul total al variabilei complexe se obţine prin însumarea (agregarea) valorilor înregistrate
la nivelul fiecărei unităţi statistice.
y0 x0 f 0
Indicele de grup al caracteristicii complexe y este:
j y1 j x1 f1
I1 0
y
y0 x0 f 0
j j
y k x k fk
j j
Pentru o perioadă curentă “k": I y
y x
k 0
0 0 f0
j j
Pentru a determina nivelul agregat al valorilor celor doi factori identificaţi ai variabilei
complexe (factorul cantitativ şi calitativ) se pune problema însumabilităţii valorilor lor
individuale.
De cele mai multe ori, elementele din care se compun fenomenele din natură şi
societate sunt eterogene, de aceea ele nu pot fi însumate direct. Pentru a face însumabile
aceste elemente se apelează la un comăsurător, etalon, numit şi pondere Ponderea este
întâlnită atât în numărătorul cât şi numitorul indicelui de grup, cu aceeaşi valoare.
Pentru variabila calitativă (x) – în majoritatea cazurilor aceasta are valori neaditiv – se
aplică ponderea.
5
Există mai multe sisteme de ponderare în funcţie de perioada de referinţă a factorului ce
joacă rolul de pondere. Astfel, identificăm următoarele sisteme de ponderare utilizate în
construcţia indicilor de grup.
x 1f 0
— indicele variabilei calitative: I1x 0
x 0 f 0
xk f 0
- pentru o perioadă curentă „k”: I kx 0
x0 f 0
b) Sistemul de pondere propus de statisticianul german Hermann Paasche în 1874 are la
bază utilizarea ponderilor din perioada curentă.
x 1f 1
— pentru variabila calitativă: I1x 0
x 0 f 1
xk f k
- pentru o perioadă curentă „k”: I kx 0
x0 f k
Nici unul dintre cele două sisteme de ponderare uzual întrebuinţate (Laspeyres şi
Paasche) nu respectă testul de reversibilitate a factorilor. Din acest motiv în practică se
foloseşte un sistem de pondere încrucişată. Pentru îndeplinirea acestei condiţii, va trebui
aleasă una din variantele: indicele caracteristicii cantitative să fie construit ca indice
Laspeyres iar indicele caracteristicii calitative — în sistem Paasche invers. Există, însă şi
unele ţări care utilizează în construirea ambilor indici factoriali acelaşi sistem de ponderare (ori
6
pe cel Laspeyres, ori pe cel Paasche). Fiecare variantă aleasă prezintă deopotrivă avantaje şi
dezavantaje.
În practica statistică, cel mai adesea se utilizează cea de-a doua variantă de ponderare
încrucişată, adică I şi I , ceea ce înseamnă că, în general, pentru factorul cantitativ
y( x ) y(f )
P1 / 0 L1 / 0
se folosesc ponderi din perioada de bază (0) – sistem Laspeyres, iar pentru factorul
calitativ se folosesc ponderi din perioada curentă (1) – sistem Paasche.
Calculul indicelui Laspeyres este uşor, odată ce au fost determinate ponderile. Această
determinare necesită, în general, o anchetă dificilă, dar ea este necesară doar în
perioada de bază. Din contră, pentru indicele Paasche, trebuie determinate bugetele de
consum pentru fiecare an de calcul, ceea ce este mai dificil.
7
3) Indicele propus de Edgeworth
Foloseşte ca pondere pentru variabila calitativă (preţul) fie suma ponderilor din cele două
perioade, fie media aritmetică simplă a acestor ponderi. Are următoarea formă:
f f
x 1 1 0
x f f 2
I1x 0 1 1 0
x 0 f 1 f 0 f f
x 0 1 0
2
Acest sistem de ponderare prezintă dezavantajul că el se poate aplica numai la con-
struirea indicelui de grup al factorului calitativ.
Această metodă se aplică în calculul indicilor de grup ori de câte ori nu există
suficiente informaţii pentru calculul indicilor agregaţi. Dacă ar exista posibilitatea aplicării
ambelor metode, ar trebui ca valoarea indicelui de grup calculat ca medie a indicilor
individuali să fie egală cu valoarea indicelui de grup calculat sub formă agregată. Indicii de
grup se pot forma fie ca medie aritmetică ponderată, fie ca medie armonică ponderată a
indicilor individuali, în funcţie de datele iniţiale cunoscute.
I1
y i y y
i y
g 0y (%)
i1y/ 0 g 0y
/0
y 1 1/ 0 0 1/ 0
y 0 y 0 100
(cunoaştem nivelurile individuale ale variabilei complexe –însumabile- din perioada de bază
(y0) şi indicii individuali ai variabilei însumabile)
Este un indice calculat sub formă de medie aritmetică din indicii individuali, ponderaţi cu
nivelul din perioada de bază y0. Se observă că indicele agregat sub formă de medie se poate
calcula şi folosind mărimea relativă de structură a variabilei complexe în perioada de bază:
y0
g 0y (%) 100
y 0
— pentru variabila cantitativă aditivă
I f
I 10
f f 1
i 1f/ 0 f 0 f
(dacă se cunosc i 1 / 0 şi f0)
f 0 f 0
10
8
— pentru variabila cantitativă non-aditivă, ponderată Laspeyres:
I1f0 I10
y f
x f
0 1
i1f/ 0 x0 f 0 i1f/ 0 y0
i1f/ 0 g 0y (dacă se cunosc i1f/ 0 şi y0)
x0 f 0 x0 f 0 y0
I1x0 I10
yx
x 1 0 f
i1x/ 0 x0 f 0 i1x/ 0 y0
i1x/ 0 g 0y (dacă se cunosc i1x/ 0 şi y0)
x0 f 0 x0 f 0 y0
I 1
y y 1
/0
y 1 1
(dacă se cunosc i1y/ 0 şi y1 )
y 0
1
i yy 1 i y
1
g1y
1/ 0 1/ 0
Reprezintă o medie armonică din indicii individuali, ponderaţi cu nivelurile din perioada
curentă (y1) sau cu structura variabilei complexe (însumabile) din perioada curentă.
y1
unde g1y
y1
— pentru variabila cantitativă — aditivă
I 1f0 I10
f f 1
f1 f
(dacă se cunosc i 1 / 0 şi f1)
f 0
1
f f1
i1 / 0
i1 / 0 i1 / 0 i1 / 0
9
Pentru a studia dinamica la nivelul fiecărui produs, se calculează indicii individuali ai
valorii:
v1 q1 p1 q p
i1v/ 0 i i
v0 q0 p0
q1
unde: iq = = indicele individual al cantităţilor produse (sau vândute)
q0
p1
ip = = indicele individual al preţurilor unitare ale produselor.
p0
Indicii agregati, construiti pentru grupul marfurilor sau categoriilor de marfuri:
Pentru o viziune de ansamblu sintetică a variaţiei relative a valorii producţiei (la nivelul
tuturor produselor), se calculează indicele de grup al valorii producţiei:
v
I1 / 0
v q p 1 1 1
care este un indice în formă agregată.
v q p 0 0 0
I 1
v q
p q 0 1
p q 0 1
p q v
/0
0 0 0
I 1/ 0v p
pq 1 1
v 1
p q 0 1 p q0 1
v p
Condiţia de reversibilitate: I 1/ 0v q I 1 / 0 I 1 / 0
v
I v
1/ 0
1 100 R1 / 0
v
I v
1/ 0
q
1 100 R 1/ 0v q
I v p
1/ 0
1 100 R1/ 0v p
vq p 0 q1 p 0 q 0
vp p1q1 p 0 q1
Cumulând modificările absolute ale valorii datorate influenţei factorilor obţinem mo-
dificarea absolută totală a valorii.
10
v vq vp
Daca calculam indicii de grup ai valorii, volumului fizic si preturilor ca medie aritmetica si
armonica, formulele acestora devin:
I1
v i v v
i v
g 0v (%)
i1v/ 0 g 0v
/0
v 1 1/ 0 0 1/ 0
v 0 v 0 100
ca medie aritmetică ponderată
I 1
v v 1
/0
v 1 1
ca medie armonică ponderată
v 0
1
i v
v 1 i
v
1
g v
1
1/ 0 1/ 0
I q
I10
v q
p q
0 1
i1q/ 0 p0 q0 i1q/ 0 v0
i1q/ 0 g 0v ca medie aritmetică ponderată
p0 q0 p0 q0 v0
10
11
deflatarea unor indicatori valorici din domeniile comerţului cu amănuntul,
serviciilor, al agregatelor macroeconomice utilizate la calculul Produsului
Intern Brut (consumul final individual efectiv al gospodăriei populaţiei);
negocierea salariilor, pensiilor, alocaţiilor; realizarea de comparaţii
internaţionale şi altele.
Mod de calcul: IPC este un indice sintetic de tip Laspeyres care măsoară media
schimbărilor de preţ plătite de consumatori pentru un coş fix de bunuri şi servicii, utilizând
ponderi din perioada de bază a indicelui. (Este un indice ‘pur’ de preţ). Determinarea IPC sub
forma unui indice agregat de tip Laspeyres, cu bază fixă, are raţionamente de ordin practic.
Indicele preţurilor de consum se calculează numai pentru elementele care intră în consumul
direct al populaţiei, fiind excluse: consumul din resurse proprii, cheltuielile cu caracter de
investiţii şi acumulare, dobânzile plătite la credite, ratele de asigurare, amenzile, impozitele
etc., precum şi cheltuielile aferente plăţii muncii pentru producţia agricolă a gospodăriilor
individuale“.
IPC se determina cu formula:
p1
pq p p q 0 0
i c i
p
IPC 1 0
0
1/ 0 0 p
g 0c
p q p q c
1/ 0
0 0 0 0 0
ch0i
g c 0i n
ch
i 1
0i
12
utilizează ponderile rezultate din structura cheltuielilor medii efectuate de o gospodărie în
anul 2006.
7. Rezumatul Lecţiei
Metoda indicilor, ca metodă de analiză factorială permite studiul variaţiei fenomenelor
complexe în funcţie de modificările factorilor săi de influenţă.
Indicele statistic este o mărime relativă, ce compară, sub formă de raport, mărimea aceluiaşi
fenomen înregistrat în două unităţi de timp, de spaţiu sau de program diferite, la o unitate statistică,
la o grupă sau la nivelul întregii colectivităţi.
După nivelul la care se calculează, indicii pot fi: individuali (sau elementari) şi respectiv
sintetici (sau de grup). Indicii de grup, la rândul lor, se pot calcula în trei moduri, în prezentul curs
fiind abordate doar două metode: calculul indicilor sintetici ca indici agregaţi şi calculul indicilor
sintetici ca medie a indicilor individuali.
La construirea indicilor sintetici se pot folosi două sisteme principale de ponderare: sistemul
Laspeyres (ce foloseşte ponderi în perioada de bază) şi sistemul Paasche (cu ponderi în perioada
curentă). Indicii sintetici se determină atât pentru variabila complexă, cât şi pentru factorii săi de
influenţă (indici factoriali), după un model multiplicativ. Pentru îndeplinirea condiţieide
reversibilitate a factorilor (produsul indicilor factoriali să fie egal cu indicele variabilei complexe)
este necesară – la construirea indicilor sintetici ai factorilor – folosirea unui sistem de ponderare
încrucişat.
13