Sunteți pe pagina 1din 16

Bazele Statisticii

Curs 3

Colectarea datelor

Bazele statisticii
Departamentul de Statistică şi
Econometrie
Etapele cercetării statistice

• Procesul cunoaşterii statistice presupune organizarea şi parcurgerea unor etape distincte şi succesive
care includ operaţiile de observare sau culegere a datelor, de sistematizare şi prelucrare, de analiză şi
interpretare a rezultatelor.
• Etapele cercetării statistice sunt:
 observarea statistică - etapă în care se culeg date de la unităţile
colectivităţii studiate, pentru toate caracteristicile urmărite;
 prelucrarea statistică - etapă în care datele culese sunt
sistematizate şi sunt calculaţi indicatorii statistici primari şi derivaţi,
absoluţi şi sintetici ce caracterizează fenomenul studiat;
 analiza şi interpretarea rezultatelor - etapă în care sunt verificate
ipotezele, formulate concluziile şi fundamentate procesele
decizionale.

Bazele statisticii
Departamentul de Statistică şi
Econometrie
Observarea statistică

• Observarea statistică reprezintă acţiunea de culegere, de la unităţile


statistice, a valorilor referitoare la caracteristicile urmărite, după criterii
riguros stabilite.

• Observarea trebuie să îndeplinească anumite condiţii: de cantitate (volum)


şi calitate
 satisfacerea condiţiei de cantitate presupune obţinerea, în timpul stabilit, a tuturor datelor
necesare pentru efectuarea studiului statistic;
 satisfacerea condiţiei de calitate presupune asigurarea conţinutului veridic al datelor culese, în
vederea obţinerii unor rezultate cât mai exacte, afectate de erori cât mai mici.

 Planul observării statistice cuprinde:


1. scopul observării
2. delimitarea colectivităţii şi unităţii de observare
3. stabilirea caracteristicilor ce vor fi înregistrate
4. alegerea formularelor de înregistrare
5. delimitarea timpului şi locului observării
6. stabilirea măsurilor organizatorice.

Bazele statisticii
Departamentul de Statistică şi
Econometrie
Surse de date statistice

• În scopul aplicării metodelor statistice de analiză a fenomenelor şi proceselor social-


economice este necesar să avem la dispoziţie date statistice.
• Sursele de date statistice se pot clasifica în: surse primare şi surse
secundare de date.
• Dacă datele statistice sunt obţinute direct prin organizarea unei observări statistice (totale
sau parţiale), atunci persoana sau instituţia care a realizat o astfel de observare este o
sursă primară de date statistice.
• Dacă datele sunt deja prelucrate în tabele şi grafice (în scopuri publice sau private) şi
publicate de persoane sau instituţii specializate, ele vor fi surse secundare de date.
• Datele primare sunt obţinute prin observări totale sau parţiale
• Dacă înregistrarea valorilor caracteristicilor urmărite se face pentru toate unităţile statistice
din colectivitatea generală (de ex. recensământul populaţiei)vorbim de observare totală.
• Dacă înregistrarea valorilor caracteristicilor urmărite se face de la o parte a colectivităţii
generale vorbim de observări parţiale, (de ex. sondajul statistic).

Bazele statisticii
Departamentul de Statistică şi
Econometrie
Surse de date statistice
• Indiferent de amploarea observării (totale sau parţiale) culegerea datelor se poate
face prin:
A) După periodicitate
1. Observări curente (înregistrare permanentă, de ex. evenimentele demografice: natalitate,
mortalitate etc.)

2. Observări periodice (datele se înregistrează la intervale de timp precizate)


3. Observări special organizate

B) După modul de obţinere a datelor


1. Observări directe (datele sunt înregistrate de către operator sau cercetător direct de la
unităţile statistice)

2. Observări indirecte (datele se înregistrează din diverse surse care au consemnat anterior
fenomenul studiat, de ex. documentele contabile)

Bazele statisticii
Departamentul de Statistică şi
Econometrie
Planul observării statistice

1. Scopul observării se formulează în momentul declanşării procesului


cercetării şi depinde de scopul general al investigaţiei statistice.

2. Delimitarea colectivităţii şi unităţilor de observare – depinde de


modul de utilizare a metodelor de observare.
- constă în localizarea în timp, spaţiu şi dpvd organizatoric a colectivităţii
studiate
- alegerea unităţii de observare în conformitate cu scopul urmărit şi modul de
organizare a colectivităţii.

3. Stabilirea caracteristicilor ce urmează a fi înregistrate formează programul


observării şi reprezintă partea cea mai importantă a planului observării.
Selectarea variabilelor din programul observării se va realiza astfel încât să permită
studierea sub aspectele de interes, a fenomenului analizat, evitându-se redundanţa
de informaţii.

Bazele statisticii
Departamentul de Statistică şi
Econometrie
Planul observării statistice

4. Formularele de înregistrare reprezintă suportul material pe care se vor


înregistra datele culese. Pot fi de două tipuri: fişă sau listă.
Formularele sunt însoţite de instrucţiuni, pentru a se asigura înţelegerea clară a conţinutului lor şi
furnizarea de răspunsuri corecte şi reale.
• Fişa este un formular individual, completat de către o singură unitate de observare.
Se foloseşte când programul observării este amplu (cuprinde mai multe caracteristici ale căror valori
urmează a fi înregistrate) sau când unităţile de observare sunt împrăştiate teritorial.
• Lista este un formular colectiv, completat cu date pentru mai multe unităţi de observare.
Se utilizează atunci când programul observării este mai sumar (cuprinde mai puţine caracteristici) sau
când unităţile statistice sunt mai concentrate teritorial.
5. Timpul observării indică două aspecte:
 timpul la care se referă datele (poate fi un singur moment, numit „moment critic” sau un
interval de timp, în funcţie de tipul fenomenului analizat (static sau dinamic))
 timpul când se efectuează înregistrarea datelor (este, de regulă, un interval, cu o dată
limită precisă)
6. Măsurile organizatorice cuprind toate elementele care asigură buna
organizare şi desfăşurare a observării statistice.

Bazele statisticii
Departamentul de Statistică şi
Econometrie
Sondajul statistic

• Sondajul sau selecţia statistică este o metodă de cercetare frecvent utilizată,


care se bazează pe observarea parţială
Observarea prin Sondaj se foloseşte pentru a înlocui o observare totală, de mare
amploare, mai dificil de realizat, care presupune angajarea unor cheltuieli ridicate de
resurse materiale, financiare şi umane.
 Avantaje ale utilizării sondajului statistic:
 Este o metodă aplicabilă în toate cazurile în care se urmăreşte realizarea unei economii de resurse
băneşti, de muncă şi de timp pentru obţinerea unui volum de date necesar şi suficient, cu un grad de
exactitate acceptabil.
 Programul cercetării poate fi mai amplu, iar datele detaliate pot fi culese doar de la unităţile statistice
selectate în eşantion. Acest lucru permite o caracterizare mai profundă a fenomenelor studiate prin
metode statistice.
 sondajul statistic devine absolut necesar când prin cercetarea statistică se distrug unităţile statistice
supuse analizei, ca de pildă în controlul statistic al calităţii producţiei
 sondajul statistic poate fi utilizat pentru verificarea programului unei observări totale şi pentru
verificarea şi testarea unei ipoteze statistice.

Bazele statisticii
Departamentul de Statistică şi
Econometrie
Sondajul statistic

 Sondajul statistic implică un grad de incertitudine referitor la cunoaşterea


situaţiei din colectivitatea generală
 Nu vom fi niciodată 100% siguri că eşantionul selectat oglindeşte perfect situaţia
din colectivitatea generală.
 Dacă se respectă anumite reguli în privinţa procedeului de selecţie aleatoare şi
a mărimii eşantionului, se poate asigura, cu un anumit nivel prestabilit de
încredere, reprezentativitatea eşantionului.
 Există două categorii de sondaj: sondaj aleator (probabilist) şi sondaj
nealeator.
Folosirea selecţiei aleatoare (eşantionarea probabilistă), în care fiecare unitate statistică din colectivitatea
generală are şansa calculabilă şi diferită de zero să fie selecţionată în eşantion, permite calcularea
mărimii erorii şi stabilirea prealabilă a acestei mărimi.
În analiza statistică, singura cale pentru a putea folosi corect inferenţa
statistică, de la eşantion la colectivitatea generală, este să utilizăm un sondaj
probabilist.
Pentru multe studii este posibilă doar realizarea unei eşantionări nealeatoare (cum ar fi ancheta statistică
care oferă informaţii orientative).

Bazele statisticii
Departamentul de Statistică şi
Econometrie
Sondajul aleator simplu

 Un eşantion probabilist este acela în care unităţile din eşantion au fost alese pe
baza unor probabilităţi cunoscute.
• Un eşantion simplu aleator este selectat astfel încât:
- fiecare unitate statistică are aceeaşi şansă de a fi aleasă în eşantion
- alegerea unei unităţi nu este influenţată de alegerea unei alte unităţi statistice
Alcătuirea bazei de sondaj implică sistematizarea unităţilor statistice din colectivitatea generală în liste,
hărţi etc, astfel încât să permită alegerea întâmplătoare a unităţilor ce vor fi selectate în eşantion.
Unităţile de eşantionare pot fi simple sau complexe: oraşe, gospodării, persoane, firme, piese pentru
controlul calităţii etc.
 Sondajele pot fi repetate (selecţie bernoulliană) sau nerepetate (selecţie
nebernoulliană), după cum există posibilitatea revenirii aceleaşi unităţi în cadrul
aceluiaşi eşantion.
Pentru populaţiile de volum foarte mare, considerate populaţii infinite, deosebirea dintre sondajul repetat şi
sondajul nerepetat dispare.

Bazele statisticii
Departamentul de Statistică şi
Econometrie
Procedee de selecţie

1. Procedeul „urnei cu bile”


- este un procedeu de selecţie aleatoare realizat în varianta cu revenire sau fără revenire.
- fiecărei unităţi statistice din colectivitatea generală, de volum N, i se asociază un număr de la 1 la N.
- funcţia de selecţie aleatoare permite obţinerea unui eşantion de volum n, adică o submulţime de n numere cuprinse între 1 şi N, numere ce
identifică unităţile statistice alese să constituie eşantionul.
 Dacă selecţia se face cu revenire eşantionul se numeşte eşantion aleator repetat.
La fiecare extragere, probabilitatea ca o unitate să fie extrasă este 1/N, iar după ultima extragere, în baza de
seleţie rămân N-1 unităţi statistice. Numărul eşantioanelor distincte, de volum n, ce pot fi extrase în sondajul cu
revenire este N n .
Procedeul selecţiei aleatoare cu revenire este implementat în EXCEL.
 Dacă selecţia se face fără revenire eşantionul se numeşte eşantion aleator nerepetat.
După extragerea primei unităţi în baza de selecţie rămân (N-1) unităţi, după a doua extragere (N-2) unităţi,
astfel încât după ultima extragere, în urnă rămân N-n unităţi statistice.
La fiecare extragere, probabilitatea unei unităţi (încă neextrase) de a fi aleasă în eşantion creşte, astfel încât la
extragerea cu numărul i (1  i  n), probabilitatea unei unităţi de a fi selectată în eşantion este 1 .
N  (i  1)
n
Numărul eşantioanelor distincte, de volum n, ce pot fi extrase în sondajul aleator simplu fără revenire este C N.
De exemplu, pot fi alese 17 310 309 456 440 eşantioane diferite, de volum n=10 unităţi dintr-o colectivitate generală de doar N=100 unităţi.

Procedeul selecţiei aleatoare fără revenire este implementat în SPSS.

Bazele statisticii
Departamentul de Statistică şi
Econometrie
Procedee de selecţie

• Procedeul mecanic de selecţie a eşantionului presupune prelevarea unităţilor


din colectivitatea generală după un interval predeterminat, denumit
N frecvent pas
k
de numărare aplicat bazei de sondaj. n

• Pasul de numărare se calculează după formula de exemplu, pentru a selecta


50 de unităţi dintr-o colectivitate generală de 1000 unităţi, se va alege tot a 20-a
unitate).
• Asigurarea caracterului aleator al eşantionului este dependentă de caracterul
întâmplător al includerii unităţilor colectivităţii generale în baza de sondaj, după
un criteriu ce nu are legătură cu cercetarea efectuată.
• Numărul iniţial de la care se începe citirea se alege aleator între 1 şi k, după care
se selectează tot a k-a unitate, până la completarea eşantionului de n unităţi
statistice.

Procedeul selecţiei mecanice este implementat în EXCEL.

Bazele statisticii
Departamentul de Statistică şi
Econometrie
Eroarea statistică
• Orice măsurare statistică conţine erori
• Eroarea = diferenţa dintre rezultatul obţinut prin înregistrare/calculare şi
mărimea reală a caracteristicii/indicatorului de interes
• Erorile pot fi de înregistrare şi de calcul
• Clasificarea erorilor:
1. Erori de observare statistică
2. Erori de prelucrare
3. Erori de reprezentativitate
4. Erori de modelare

• Erorile de observare sunt:


1. Erori sistematice
2. Erori întâmplătoare
3. Erori grosiere (greşeli)

Bazele statisticii
Departamentul de Statistică şi
Econometrie
Erori de observare

1. Erori sistematice
- rezultă din acţiunea unui factor ce determină devierea variabilei studiate întotdeauna în acelaşi sens
- surse de astfel de erori: încălcarea regulilor de delimitare a colectivităţii, a unităţii statistice, de
construire a chestionarelor, de selecţie a eşantionului
- distorsiunile pot fi introduse de răspunsuri incorecte ale persoanelor anchetate din motive
psihologice, economice etc. (de ex. dorinţa de a face impresie, de a răspunde pe placul anchetatorului
sau de a ascunde anumite aspecte - întrebări cu incidenţă fiscală sau ce implică interese economice)

2. Erori întâmplătoare
- se produc în ambele sensuri şi diferă ca mărime
- influenţele lor se compenseză reciproc pe total şi nu afectează rezultatele
- sunt generate de cauze obiective şi nu pot fi evitate ci doar minimizate

3. Erori grosiere
- sunt cauzate de lipsa de experienţă, incompetenţă etc.
- trebuie depistate şi eliminate

Bazele statisticii
Departamentul de Statistică şi
Econometrie
Erori de observare

• Concluzii
 Orice măsurare statistică implică erori

 Ceea ce interesează este ordinul de mărime al erorii pentru a se


cunoaşte între ce limite de acceptabilitate se găseşte afirmaţia unei
investigaţii statistice

 Erorile generate în procesul de observare statistică pot fi


determinate

Bazele statisticii
Departamentul de Statistică şi
Econometrie
Bibliografie

• A. ISAIC-MANIU, C. MITRUŢ, V. VOINEAGU, STATISTICĂ, Ed.


Universitară, Buc., 2004, pag. 32-39

• E. ŢIŢAN, STATISTICĂ. TEORIE ŞI APLICAŢII ÎN SECTORUL TERŢIAR, Ed.


Meteor Press, Buc., 2005, pag. 23-40

Bazele statisticii
Departamentul de Statistică şi
Econometrie

S-ar putea să vă placă și