Documente Academic
Documente Profesional
Documente Cultură
Cercetarea
statistică
1. Noțiunea de cercetare statistică
2. Colectarea datelor. Erorile. Controlul
3. Sistematizarea şi prelucrarea datelor statistice
1
1. Noțiunea de cercetare statistică
7
Ancheta statistică va conduce, din aceste motive, la erori mai mari
decât sondajul statistic. În cazul acestuia din urmă, neobţinerea
datelor solicitate de la unităţile incluse în eşantion
Exemple: persoane, de regulă), din diferite motive, precum: nu
cunosc limba oficială, şi-au schimbat domiciliul, nu sunt acasă atunci
când sunt căutaţi, refuză să coopereze etc. – pot duce la afectarea
reprezentativităţii eşantionului.
12
Erorile observării statistice
Principiul de bază al efectuării unei observări statistice
este acela al asigurării autenticității datelor.
Erorile de observare sunt abateri ale datelor înregistrate de la mărimea reală
(concretă) a caracteristicilor studiate.
După locul apariției lor erorile pot influența rezultatele cercetării statistice.
Tipologia erorilor:
Erori de înregistrare sau de observare sunt definite ca diferenţele care apar între
valorile reale ale caracteristicilor urmărite (studiate) si cele înregistrate (culese).
Erori de reprezentativitate se întâlnesc în cazul utilizării sondajului statistic, atunci când
selectarea unităţilor în esantion nu se face în mod aleator, ci după un criteriu subiectiv,
preferenţial si, la rândul lor. Ele nu pot fi total eliminate, ci doar diminuate și controlate.
Erori de prelucrare sau de calcul apar în etapa de prelucrare a datelor statistice,
datorită utilizării gresite a unor metodolgii - erori metodologice, (de exemplu:
reprezentarea datelor statistice cu ajutorul unor tipuri neadecvate de grafice, gruparea
sau clasificarea gresită, utilizarea unor formule de calcul nepotrivite, care vor duce la
obţinerea unor rezultate eronate etc.), utilizarea gresită a unor modele statistice (erori
de modelare – apar în procesul de elaborare, de alegerea gresită a modelelor).
Erori de interpretare.
13
Erori de înregistrare sau de observare și cele de
reprezentativitate pot fi:
Erorile de observare întâmplătoare - Abaterile de la realitate ce se produc, de
regulă, în ambele sensuri se numesc erori de observare întâmplătoare
Erorile de observare sistematice - Erorile care denaturează realitatea într-un
singur sens influențând rezultatele cercetării, respectiv indicatorii de ansamblu.
Eroarea statistică se poate determina în expresie absolută sau relativă.
Eroarea în expresie absolută se determină în sensul definit mai sus, conform
relaţiei:
ex = x – x0
ex - mărimea absolută a erorii statistice;
x - nivelul indicatorului determinat în urma investigaţiei statistice;
x0 - nivelul real al indicatorului.
Eroarea în expresie absolută are unitate de măsură concretă, aceeași cu cea a
indicatorului/caracteristicii pentru care se calculează, de aceea nu este permisă
compararea mai multor erori absolute, decât dacă ele sunt determinate pentru 14
un același indicator/caracteristică.
De cele mai multe ori, însă, nivelul real al
indicatorului nu este cunoscut, deci nu se poate calcula eroarea absolută.
Ea se poate interpreta, însă, cu ajutorul teoriei probabilităţilor.
Pentru a elimina dependenţa de unitatea de măsură, se calculează
eroarea în expresie relativă.
Eroarea în expresie relativă se determină ca raport între eroarea absolută
și nivelul real al indicatorului și se măsoară în procente:
16
3. Sistematizarea şi
prelucrarea datelor statistice
Prelucrarea datelor statistice este a doua etapă a cercetării
statistice şi are ca scop:
• centralizarea şi sistematizarea datelor culese în etapa
observării statistice;
• calculul sistemului de indicatori statistici ce caracterizează
numeric fenomenele şi procesele studiate cu ajutorul
metodelor statistice complexe;
• prezentarea rezultatelor prelucrării sub formă de repartiţii,
serii, tabele şi grafice.
17
Pentru obţinerea unei imagini de
ansamblu asupra fenomenului studiat este necesară sintetizarea
datelor individuale prin centralizarea şi gruparea lor.
Centralizarea datelor constă în strângerea la locul prelucrării a tuturor
informaţiilor şi apoi în determinarea indicatorilor totalizatori pentru
toate caracteristicile însumabile direct sau care admit un coeficient de
echivalenţă.
Centralizarea simplă presupune agregarea valorilor individuale ale
caracteristicilor pentru toate unităţile colectivităţii, ce permit
însumarea din punct de vedere al conţinutului indicatorului.
Centralizarea pe grupe constă în gruparea datelor şi calcularea
indicatorilor totalizatori parţiali pe fiecare grupă, iar pe baza lor a
indicatorilor totalizatori generali pe întreaga colectivitate.
18
Metoda grupării
La realizarea unei grupări/clasificări, trebuie, pe cât posibil, să
îndeplinim următoarele condiţii:
a) omogenitate (unităţile statistice care au aceeasi valoare sau valori
apropiate, asemănătoare, ale caracteristicii după care se efectuează
sistematizarea vor fi incluse în aceeasi clasă) – variaţia valorilor
caracteristicii incluse în aceeași grupă/clasă să fie cât mai mică);
b) unicitate (o unitate statistică trebuie inclusă într-o singură clasă sau
grupă, ea nu se poate regăsi simultan în două sau mai multe clase/grupe);
c) completitudine (toate unităţile statistice să fie incluse în grupe/clase, să
nu fie exclusă vreo unitate din operaţia de sistematizare).
Sunt cazuri în care nu este posibilă îndeplinirea simultană a tuturor acestor
condiţii (de exemplu: dacă sunt unităţi la care s-au înregistrat valori
extreme, aberante, ale caracteristicii după care se face sistematizarea, este
de dorit, uneori, să se evidenţieze separat aceste cazuri, să se scoată în
afara grupării aceste unităţi si să se sistematizeze restul unităţilor, la care s-
au înregistrat valori mai apropiate ale variabilei).
19
Metoda grupării este metoda de bază în
prelucrarea datelor statistice:
Caracteristica de grupare este acea variabilă faţă de care unităţile
colectivităţii sunt repartizate în grupe distincte, cât mai omogene.
Grupa omogenă este clasa de unităţi în interiorul căreia variaţia
caracteristicii este minimă, adică are caracter stabil şi determină în mod
hotărâtor fenomenul.
Variaţia este proprietatea/însuşirea/capacitatea caracteristicii statistice
de a înregistra mai multe valori numerice (pentru cazul caracteristicilor
cantitative) sau forme de manifestare (pentru cazul caracteristicilor
calitative).
Amplitudinea variaţiei reprezintă câmpul de variaţie a tuturor valorilor
individuale ale unei caracteristici în cadrul unei observări statistice.
Amplitudinea variaţiei se calculează conform relaţiei:
A = xmax - xmin
20
Funcţiile grupării statistice
21
Clasificarea grupărilor
23
Gruparea pe intervale de variaţie
se poate efectua pe intervale de mărime egală sau diferită. Vom analiza
numai cazul grupării datelor statistice pe intervale egale de variaţie.
Pentru realizarea grupării pe intervale egale de variaţie se recomandă parcurgerea
următorilor pasi:
a) se determină amplitudinea variaţiei caracteristicii
A = xmax − xmin
b) se stabileste numărul de grupe.
- numărul de grupe (r) este prestabilit, pe baza experienţei căpătate din studii anterioare
asupra domeniului de interes.
- numărul de grupe (r) nu este prestabilit; în acest caz, dacă unităţile se repartizează
aproximati normal după caracteristica studiată, se poate utiliza pentru determinarea numărul
de grupe relaţia lui Sturges:
r = 1+ 3,322 ⋅ lg n n - numărul total de unităţi ale colectivităţii.
Este recomandat a se folosi un număr potrivit de grupe (de regulă între 4 si 10). Utilizarea
unui număr prea mare de grupe ar duce la fărâmiţarea excesivă a colectivităţii (putând apare,
în acest caz si grupe cu frecvenţe nule, iar gruparea ar trebui refăcută); utilizarea, dimpotrivă,
a unui număr prea mic de grupe ar putea să nu pună în evidenţă principalele tipuri calitative
24
ale populaţiei după variabila urmărită).
Limitele intervalelor vor avea același grad de precizie ca si
datele grupate (același număr de zecimale), primul interval
putând începe chiar de la valoarea minimă a caracteristicii, sau de
la o valoare usor inferioară acesteia, aleasă în mod convenabil.
Este bine să nu existe suprapuneri de limite, astfel încât la
efectuarea grupării să poată fi respectată condiţia de unicitate.
- Dacă limita superioară a unui interval coincide cu limita
inferioară a intervalului următor, intervalele se numesc continue;
- Dacă între limita superioară a unui interval si limita inferioară
a intervalului următor există o diferenţă de o unitate întreagă sau
zecimală, intervalele se numesc discontinue sau discrete.
25
Exemplu. În vederea analizei oportunităţii deschiderii unui magazin ce
vinde aparatură electrocasnică, un analist financiar este interesat în
cunoașterea nivelului vânzărilor zilnice ale magazinelor de profil. Pentru 50
de astfel de magazine alese întâmplător, înregistrează valoarea facturilor
emise zilnic. Să se sistematizeze datele, grupându-se pe intervale egale de
variație.
Valoarea facturilor emise zilnic (mii lei)
10,5 8,0 8,2 9.6 7,1
8,4 7,9 8,0 7,2 5,2
10,5 6,8 7,7 8,8 7,7
9,0 9,5 7,4 11,3 5,9
9,2 8,1 6,5 8,5 5,2
9,7 11,5 9,5 9,4 5,6
6,6 9,9 8,2 10,5 11,7
10,6 6,9 6,9 6,9 6,0
10,1 7,5 7,2 6,5 7,8
7,1 11,1 8,2 7,5 6,5
26
Rezolvare: Se notează cu X – caracteristica de
grupare (valoarea facturilor emise zilnic). Se parcurg următorii
pasi:
• se calculează amplitudinea variaţiei caracteristicii (Ax):
Ax = xmax - xmin =11,7–5,2=6,5 mii lei;
• se stabileste numărul de grupe (r):
r = 1+3,32 lg n = 1+3,322 lg50 =6,64≈7 (formula lui Sturges);
• se stabileste mărimea intervalului de grupare (h): h = Ax / r =6,5/7≈1 mii lei;
• se stabilesc intervalele de variaţie si se efectuează gruparea.
Varianta I Varianta II Varianta III
limita inferioară inclusă în interval limita superioară inclusă în interval intervale discontinue
Intervale de variaţie a Nr. Intervale de variaţie a Nr. Intervale de variaţie a Nr.
valorii facturilor emise magazine valorii facturilor magazine valorii facturilor emise magazine
zilnic (mii lei) (ni) emise zilnic (mii lei) (ni) zilnic (mii lei) (ni)
5,0 – 6,0 4 5,0 – 6,0 5 5,0 – 5,9 4
6,0 – 7,0 9 6,0 – 7,0 8 6,0 – 6,9 9
7,0 – 8,0 11 7,0 – 8,0 13 7,0 – 7,9 11
8,0 – 9,0 9 8,0 – 9,0 8 8,0 – 8,9 9
9,0 – 10,0 8 9,0 – 10,0 7 9,0 – 9,9 8
10,0 – 11,0 5 10,0 – 11,0 5 10,0 – 10,9 5
11,0 – 12,0 4 11,0 – 12,0 4 11,0 – 11,9 4
Total 50 Total 50 Total 50
27