Sunteți pe pagina 1din 27

Tema 2.

Cercetarea
statistică
1. Noțiunea de cercetare statistică
2. Colectarea datelor. Erorile. Controlul
3. Sistematizarea şi prelucrarea datelor statistice

1
1. Noțiunea de cercetare statistică

Cercetarea statistică este un proces de cunoaștere a fenomenelor de


masă realizat cu ajutorul metodelor statistice. Efectuarea unei cercetări
statistice implică parcurgerea următoarelor etape statistice:
 observarea statistică,
 prelucrarea datelor obținute prin observare,
 interpretarea rezultatelor.
Observarea statistică este etapa de culegere a informaţiilor referitoare la
aspectele sub care se prezintă fenomenele (înregistrarea datelor).
Principiile care stau la baza observării statistice
1. Datele culese să fie reale;
2. Datele să se refere la caracteristicile care răspund cel mai bine scopului
observării propus;
3. Culegerea datelor să se realizeze în condiţii obiective, fără preferinţe din
partea cercetătorilor. 2
Procedeele statistice prin care se realizează observarea statistică sunt:
Observarea pe bază de documente, care au fost elaborate de sistemul de
evidență (de exemplu evidența tehnico-operativă, contabilitatea etc.);
Observarea directă a unităților, care compun colectivitatea statistică, prin:
 Măsurare, cântărire etc.,
 Interviu
 Aplicarea unui chestionar.
Observarea trebuie să fie corespunzătoare sub aspect cantitativ şi calitativ.
- îndeplinirea condiţiei de cantitate (de volum) înseamnă obţinerea în timpul
prestabilit a întregului volum de date necesar pentru atingerea tuturor
obiectivelor investigaţiei statistice;
- îndeplinirea condiţiei de calitate presupune asigurarea autenticităţii, a
caracterului real al datelor, astfel încât rezultatele obţinute prin prelucrarea
acestor date să fie cât mai exacte şi să ducă la adoptarea unor decizii cât mai
pertinente. 3
În cazul în care pentru obţinerea datelor statistice
este necesară organizarea unei investigaţii statistice,
atunci ea trebuie făcută în conformitate cu un anumit plan,
pentru a ne asigura că obţinem, cu un minim de resurse
materiale şi financiare, rezultate cât mai exacte şi mai pertinente.
Clasificarea observărilor statistice
I. După periodicitate:
1. Observările statistice curente
2. Observările statistice periodice
3. Observările statistice unice
II. Numărul unităților înregistrate:
1. Observările statistice totale
(recensăminte, rapoarte statistice obligatorii)
2. Observările statistice parțiale (sondajul, ancheta)
III. Modul de caracterizare a fenomenelor:
1. Observările statice
4
2. Observările dinamice.
Recensământul statistic, este o metodă de observare totală,
periodică, prin care un fenomen este surprins în mod static,
înregistrându-se valorile caracteristicilor din programul observării
referitoare la un moment de referinţă numit „moment critic”, de la
toate unităţile populaţiei statistice.
Sondajul statistic (selecţia statistică) este o metodă de observare
parţială, special organizată, una din cele mai des utilizate metode de
observare statistice moderne, deoarece realizează o economie de
resurse materiale, financiare şi umane, înlocuind o observare totală, de
mare extindere, mai dificil de organizat şi efectuat, cu cheltuieli
considerabile.
În cazul cercetării statistice prin sondaj, se selectează un eşantion,
format dintr-o parte a unităţilor populaţiei totale. Eşantionul poate fi
selectat aleator sau non-aleator.
5
Selectarea aleatoare a unităţilor în eşantion presupune că fiecare unitate
statistică are o şansă determinabilă (calculabilă), egală şi nenulă de a fi inclusă
în eşantion, că nu există deci nici o unitate care să nu poată fi supusă
procedeului de selecţie şi că nici o unitate nu poate fi aleasă preferenţial.
Eşantioanele alese aleator sunt reprezentative pentru întreaga populaţie, adică
întrunesc aceleaşi trăsături esenţiale ca şi populaţia totală.
Selectarea non-aleatoare (dirijată) se referă la orice metodă de alegere, pe
baza unui criteriu preferenţial, a unităţilor statistice în eşantion. O dată format
eşantionul, se înregistrează nivelurile tuturor caracteristicilor incluse în
programul observării, de la toate unităţile acestuia, se prelucrează şi se obţin
indicatori statistici la nivelul eşantionului (etapa descriptivă), pentru ca apoi să
se extindă, cu o anumită probabilitate, rezultatele de la nivelul eşantionului
pentru întreaga colectivitate (etapa inferenţială). Diferenţa între nivelul estimat
la indicatorului în urma sondajului şi nivelul real (eroarea de sondaj) va fi cu
atât mai mică cu cât eşantionul este mai reprezentativ, iar reprezentativitatea,
la rândul ei, va fi asigurată dacă se respectă principiile selecţiei aleatoare în
formarea eşantionului.
6
Ancheta statistică este o metodă de observare parţială, cu
caracter mai mult ocazional.
Este asemănătoare sondajului statistic, însă diferă de
acesta prin:
 neobligativitatea îndeplinirii condiţiei de
reprezentativitate a eşantionului.
 admiterea unei rate mai mari a non-răspunsurilor la
formularele înmânate direct, telefonic, prin e-mail sau
prin poştă, întrucât completarea chestionarelor este
benevolă.

7
Ancheta statistică va conduce, din aceste motive, la erori mai mari
decât sondajul statistic. În cazul acestuia din urmă, neobţinerea
datelor solicitate de la unităţile incluse în eşantion
Exemple: persoane, de regulă), din diferite motive, precum: nu
cunosc limba oficială, şi-au schimbat domiciliul, nu sunt acasă atunci
când sunt căutaţi, refuză să coopereze etc. – pot duce la afectarea
reprezentativităţii eşantionului.

O categorie deosebit de întâlnită a anchetelor statistice o formează


anchetele de opinie, ce au drept scop studierea preferinţelor,
atitudinii oamenilor faţă de diferite probleme.
Exemple: anchete în sfera sociologiei, marketingului, politicii,
culturii etc.
8
Panelul este o metodă de observare
parţială, realizată pe baza unui eşantion fix, stabil, format
din aceleaşi unităţi care răspund la aceleaşi întrebări, la mai multe
momente succesive, diferite de timp (tehnica longitudinală). În acest fel
cercetarea se concentrează pe identificarea, pe determinarea
modificărilor survenite de-a lungul timpului asupra fenomenului studiat.
Principalul dezavantaj al această metodă este că respondenţii se implică,
treptat, în cercetare şi, ştiindu-se vizaţi, sub observaţie, şi-ar putea
schimba comportamentul şi răspunsurile lor ar putea fi influențate.
Observarea părţii principale (metoda masivului principal de date). Este o
metodă de observare parţială, special organizată (cu caracter ocazional),
ce presupune formarea unui eşantion nereprezentativ, prin selectarea,
dintr-o populaţie împărţită pe grupe de importanţă diferită, a unităţilor
mai semnificative (din grupele cu pondere mai însemnată).
Monografia. Este o metodă de observare parţială, special organizată, care
presupune caracterizarea detaliată, sub multiple aspecte, ale unei singure
unităţi statistice complexe (se elaborează monografia unui unei
întreprinderi, a unui judeţ, a unei localităţi etc.).
9
2. Colectarea datelor.
Erorile. Controlul
Planul sau Programul observării presupune rezolvarea unor probleme
metodologice şi organizatorice.
Problemele metodologice se referă la:
a) Stabilirea scopului observării,
b) Obiectul observării,
c) Unitatea de observare (unitatea statistică) trebuie stabilită foarte
precis pentru a se obţine date exacte, comparabile în timp şi spaţiu, și
presupune identificarea și stabilirea tuturor unităţilor statistice ce vor fi
incluse în cercetare si de la care se vor înregistra valorile caracteristicilor.
d) Formularele şi instrucţiunile de înregistrare, include Lista
caracteristicilor urmărite – presupune stabilirea tuturor variabilelor care
trebuie înregistrate, astfel încât să se asigure studierea fenomenului de
interes sub toate aspectele prevăzute în scopul cercetării.
10
Caracteristicile pot apare sub diferite forme:
- sub forma unor indicatori
de exemplu - raportările statistice pe care le completează agenţii
economici;
- sub forma răspunsurilor la întrebările dintr-un chestionar – în cazul
investigaţiilor statistice special organizate.
Formularele de înregistrare reprezintă suportul material pe care vor fi
înregistrate datele culese.
e) Timpul observării vizează două aspecte:
♦ timpul la care se referă datele înregistrate (care poate fi un moment,
numit „moment critic”, sau o perioadă, un interval de timp; în primul
caz fenomenul este surprins static, iar în cel de-al doilea caz - dinamic).
♦ timpul când se efectuează înregistrarea datelor – care este, de regulă,
un interval de timp, bine precizat; este de dorit ca acesta să fie cât mai
scurt, astfel încât înregistrarea datelor să se realizeze cu o cât mai mare
operativitate.
11
f) Locul observării şi unitatea care raportează.
Problemele organizatorice se referă la asigurarea celor mai bune condiţii
pentru desfăşurarea observării.
Buna organizare poate preîntâmpina si rezolva diversele obstacole,
dificultăţi ce s-ar putea ivi în realizarea observării. Aceste măsuri pot
cuprinde:
 întocmirea unor liste ale unităţilor ce vor fi supuse observării,
 folosirea hărţilor si planurilor cu localizarea unităţilor statistice,
 sectorizarea teritoriului,
 recrutarea si instruirea personalului participant la colectarea datelor,
 proiectarea, elaborarea si tipărirea formularelor de înregistrare,
 popularizarea cercetării statistice (prin mass-media, presă, afise etc.).

12
Erorile observării statistice
Principiul de bază al efectuării unei observări statistice
este acela al asigurării autenticității datelor.
Erorile de observare sunt abateri ale datelor înregistrate de la mărimea reală
(concretă) a caracteristicilor studiate.
După locul apariției lor erorile pot influența rezultatele cercetării statistice.
Tipologia erorilor:
 Erori de înregistrare sau de observare sunt definite ca diferenţele care apar între
valorile reale ale caracteristicilor urmărite (studiate) si cele înregistrate (culese).
 Erori de reprezentativitate se întâlnesc în cazul utilizării sondajului statistic, atunci când
selectarea unităţilor în esantion nu se face în mod aleator, ci după un criteriu subiectiv,
preferenţial si, la rândul lor. Ele nu pot fi total eliminate, ci doar diminuate și controlate.
 Erori de prelucrare sau de calcul apar în etapa de prelucrare a datelor statistice,
datorită utilizării gresite a unor metodolgii - erori metodologice, (de exemplu:
reprezentarea datelor statistice cu ajutorul unor tipuri neadecvate de grafice, gruparea
sau clasificarea gresită, utilizarea unor formule de calcul nepotrivite, care vor duce la
obţinerea unor rezultate eronate etc.), utilizarea gresită a unor modele statistice (erori
de modelare – apar în procesul de elaborare, de alegerea gresită a modelelor).
 Erori de interpretare.
13
Erori de înregistrare sau de observare și cele de
reprezentativitate pot fi:
Erorile de observare întâmplătoare - Abaterile de la realitate ce se produc, de
regulă, în ambele sensuri se numesc erori de observare întâmplătoare
Erorile de observare sistematice - Erorile care denaturează realitatea într-un
singur sens influențând rezultatele cercetării, respectiv indicatorii de ansamblu.
Eroarea statistică se poate determina în expresie absolută sau relativă.
Eroarea în expresie absolută se determină în sensul definit mai sus, conform
relaţiei:
ex = x – x0
ex - mărimea absolută a erorii statistice;
x - nivelul indicatorului determinat în urma investigaţiei statistice;
x0 - nivelul real al indicatorului.
Eroarea în expresie absolută are unitate de măsură concretă, aceeași cu cea a
indicatorului/caracteristicii pentru care se calculează, de aceea nu este permisă
compararea mai multor erori absolute, decât dacă ele sunt determinate pentru 14
un același indicator/caracteristică.
De cele mai multe ori, însă, nivelul real al
indicatorului nu este cunoscut, deci nu se poate calcula eroarea absolută.
Ea se poate interpreta, însă, cu ajutorul teoriei probabilităţilor.
Pentru a elimina dependenţa de unitatea de măsură, se calculează
eroarea în expresie relativă.
Eroarea în expresie relativă se determină ca raport între eroarea absolută
și nivelul real al indicatorului și se măsoară în procente:

- mărimea relativă a erorii statistice;


x - nivelul indicatorului determinat în urma investigaţiei statistice;
x0 - nivelul real al indicatorului.

Prevenirea erorilor are ca scop asigurarea autenticității datelor.


15
Controlul datelor statistice

1. Controlul statistic (cantitativ) de volum urmărește primirea și


completarea integrală a tuturor formularelor.
2. Controlul aritmetic (calitativ) presupune
 efectuarea unor operaţii aritmetice prin care se verifică selectiv
indicatorii numerici din formulare (totalurile, diferențele) și
 aplicarea prin sondaj, a unor relaţii de calcul între diferiţii indicatori
înscrisi în chestionare, de tipul egalităţilor de balanţă sau a altor chei
de verificare.
3. Controlul logic (calitativ) constă în compararea răspunsurilor primite la
două sau mai multe întrebări între care există relaţii de interdependenţă,
deci o legătură logică.

16
3. Sistematizarea şi
prelucrarea datelor statistice
Prelucrarea datelor statistice este a doua etapă a cercetării
statistice şi are ca scop:
• centralizarea şi sistematizarea datelor culese în etapa
observării statistice;
• calculul sistemului de indicatori statistici ce caracterizează
numeric fenomenele şi procesele studiate cu ajutorul
metodelor statistice complexe;
• prezentarea rezultatelor prelucrării sub formă de repartiţii,
serii, tabele şi grafice.

17
Pentru obţinerea unei imagini de
ansamblu asupra fenomenului studiat este necesară sintetizarea
datelor individuale prin centralizarea şi gruparea lor.
Centralizarea datelor constă în strângerea la locul prelucrării a tuturor
informaţiilor şi apoi în determinarea indicatorilor totalizatori pentru
toate caracteristicile însumabile direct sau care admit un coeficient de
echivalenţă.
Centralizarea simplă presupune agregarea valorilor individuale ale
caracteristicilor pentru toate unităţile colectivităţii, ce permit
însumarea din punct de vedere al conţinutului indicatorului.
Centralizarea pe grupe constă în gruparea datelor şi calcularea
indicatorilor totalizatori parţiali pe fiecare grupă, iar pe baza lor a
indicatorilor totalizatori generali pe întreaga colectivitate.

18
Metoda grupării
La realizarea unei grupări/clasificări, trebuie, pe cât posibil, să
îndeplinim următoarele condiţii:
a) omogenitate (unităţile statistice care au aceeasi valoare sau valori
apropiate, asemănătoare, ale caracteristicii după care se efectuează
sistematizarea vor fi incluse în aceeasi clasă) – variaţia valorilor
caracteristicii incluse în aceeași grupă/clasă să fie cât mai mică);
b) unicitate (o unitate statistică trebuie inclusă într-o singură clasă sau
grupă, ea nu se poate regăsi simultan în două sau mai multe clase/grupe);
c) completitudine (toate unităţile statistice să fie incluse în grupe/clase, să
nu fie exclusă vreo unitate din operaţia de sistematizare).
Sunt cazuri în care nu este posibilă îndeplinirea simultană a tuturor acestor
condiţii (de exemplu: dacă sunt unităţi la care s-au înregistrat valori
extreme, aberante, ale caracteristicii după care se face sistematizarea, este
de dorit, uneori, să se evidenţieze separat aceste cazuri, să se scoată în
afara grupării aceste unităţi si să se sistematizeze restul unităţilor, la care s-
au înregistrat valori mai apropiate ale variabilei).
19
Metoda grupării este metoda de bază în
prelucrarea datelor statistice:
Caracteristica de grupare este acea variabilă faţă de care unităţile
colectivităţii sunt repartizate în grupe distincte, cât mai omogene.
Grupa omogenă este clasa de unităţi în interiorul căreia variaţia
caracteristicii este minimă, adică are caracter stabil şi determină în mod
hotărâtor fenomenul.
Variaţia este proprietatea/însuşirea/capacitatea caracteristicii statistice
de a înregistra mai multe valori numerice (pentru cazul caracteristicilor
cantitative) sau forme de manifestare (pentru cazul caracteristicilor
calitative).
Amplitudinea variaţiei reprezintă câmpul de variaţie a tuturor valorilor
individuale ale unei caracteristici în cadrul unei observări statistice.
Amplitudinea variaţiei se calculează conform relaţiei:
A = xmax - xmin
20
Funcţiile grupării statistice

i. sistematizare şi omogenizare a datelor observării;


ii. grupările evidenţiază structura unei colectivităţi la un moment dat
sau într-o anumită perioadă, precum şi mutaţiile produse în timp şi/sau
spaţiu;
iii. stabilirea interdependenţelor şi a formei legaturii dintre fenomene;
iv. permite evidenţierea relaţiilor dintre factorii de efort şi efecte
(rezultate).

21
Clasificarea grupărilor

1. după numărul caracteristicilor


• grupări simple
• grupări combinate
2. după conţinutul caracteristicilor
• grupări cronologice
• grupări teritoriale
• grupări după o caracteristică atributivă
3. după forma de exprimare a caracteristicii atributive
• grupări calitative (exprimate prin cuvinte)
• grupări cantitative (exprimate numeric)
după tipul variaţiei caracteristicii cantitative
• grupări pe variante (atunci când grupăm datele după o variabilă discretă)
• grupări pe intervale (atunci când sistematizăm datele după o variabilă continuă)
după amplitudinea variaţiei caracteristicii de grupare
• grupări pe intervale egale
• grupări pe intervale neegale
22
Gruparea datelor statistice pe variante
În acest caz, se va forma un număr de grupe egal cu numărul
de variante. Prin numărarea unităţilor incluse în fiecare grupă se obţine
frecvenţa grupei (numită si frecvenţă absolută).
 
Exemplu. Pentru 20 de familii s-a înregistrat numărul de copii: 1, 2, 3, 0, 2, 0,
1, 2, 1, 3, 2, 2, 0, 2, 1, 3, 1, 2, 4, 2. Să se realizeze o sistematizare a datelor.
Număr de copii (xi) Număr de familii (ni)
0 3
1 5
2 8
3 3
4 1
Total 20

Variabila de grupare este numărul de copii, variabilă discretă cu puţine


variante (cinci variante), deci s-a realizat o grupare pe variante.

23
Gruparea pe intervale de variaţie
se poate efectua pe intervale de mărime egală sau diferită. Vom analiza
numai cazul grupării datelor statistice pe intervale egale de variaţie.
Pentru realizarea grupării pe intervale egale de variaţie se recomandă parcurgerea
următorilor pasi:
 a) se determină amplitudinea variaţiei caracteristicii
A = xmax − xmin
 b) se stabileste numărul de grupe.
- numărul de grupe (r) este prestabilit, pe baza experienţei căpătate din studii anterioare
asupra domeniului de interes.
- numărul de grupe (r) nu este prestabilit; în acest caz, dacă unităţile se repartizează
aproximati normal după caracteristica studiată, se poate utiliza pentru determinarea numărul
de grupe relaţia lui Sturges:
r = 1+ 3,322 ⋅ lg n n - numărul total de unităţi ale colectivităţii.
 Este recomandat a se folosi un număr potrivit de grupe (de regulă între 4 si 10). Utilizarea
unui număr prea mare de grupe ar duce la fărâmiţarea excesivă a colectivităţii (putând apare,
în acest caz si grupe cu frecvenţe nule, iar gruparea ar trebui refăcută); utilizarea, dimpotrivă,
a unui număr prea mic de grupe ar putea să nu pună în evidenţă principalele tipuri calitative
24
ale populaţiei după variabila urmărită).
Limitele intervalelor vor avea același grad de precizie ca si
datele grupate (același număr de zecimale), primul interval
putând începe chiar de la valoarea minimă a caracteristicii, sau de
la o valoare usor inferioară acesteia, aleasă în mod convenabil.
Este bine să nu existe suprapuneri de limite, astfel încât la
efectuarea grupării să poată fi respectată condiţia de unicitate.
- Dacă limita superioară a unui interval coincide cu limita
inferioară a intervalului următor, intervalele se numesc continue;
- Dacă între limita superioară a unui interval si limita inferioară
a intervalului următor există o diferenţă de o unitate întreagă sau
zecimală, intervalele se numesc discontinue sau discrete.

25
Exemplu. În vederea analizei oportunităţii deschiderii unui magazin ce
vinde aparatură electrocasnică, un analist financiar este interesat în
cunoașterea nivelului vânzărilor zilnice ale magazinelor de profil. Pentru 50
de astfel de magazine alese întâmplător, înregistrează valoarea facturilor
emise zilnic. Să se sistematizeze datele, grupându-se pe intervale egale de
variație.
  Valoarea facturilor emise zilnic (mii lei)
10,5 8,0 8,2 9.6 7,1
8,4 7,9 8,0 7,2 5,2
10,5 6,8 7,7 8,8 7,7
9,0 9,5 7,4 11,3 5,9
9,2 8,1 6,5 8,5 5,2
9,7 11,5 9,5 9,4 5,6
6,6 9,9 8,2 10,5 11,7
10,6 6,9 6,9 6,9 6,0
10,1 7,5 7,2 6,5 7,8
7,1 11,1 8,2 7,5 6,5

26
Rezolvare: Se notează cu X – caracteristica de
grupare (valoarea facturilor emise zilnic). Se parcurg următorii
pasi:
• se calculează amplitudinea variaţiei caracteristicii (Ax):
Ax = xmax - xmin =11,7–5,2=6,5 mii lei;
• se stabileste numărul de grupe (r):
r = 1+3,32 lg n = 1+3,322 lg50 =6,64≈7 (formula lui Sturges);
• se stabileste mărimea intervalului de grupare (h): h = Ax / r =6,5/7≈1 mii lei;
• se stabilesc intervalele de variaţie si se efectuează gruparea.
Varianta I Varianta II Varianta III
limita inferioară inclusă în interval limita superioară inclusă în interval intervale discontinue
Intervale de variaţie a Nr. Intervale de variaţie a Nr. Intervale de variaţie a Nr.
valorii facturilor emise magazine valorii facturilor magazine valorii facturilor emise magazine
zilnic (mii lei) (ni) emise zilnic (mii lei) (ni) zilnic (mii lei) (ni)
5,0 – 6,0 4 5,0 – 6,0 5 5,0 – 5,9 4
6,0 – 7,0 9 6,0 – 7,0 8 6,0 – 6,9 9
7,0 – 8,0 11 7,0 – 8,0 13 7,0 – 7,9 11
8,0 – 9,0 9 8,0 – 9,0 8 8,0 – 8,9 9
9,0 – 10,0 8 9,0 – 10,0 7 9,0 – 9,9 8
10,0 – 11,0 5 10,0 – 11,0 5 10,0 – 10,9 5
11,0 – 12,0 4 11,0 – 12,0 4 11,0 – 11,9 4
Total 50 Total 50 Total 50

27

S-ar putea să vă placă și