Sunteți pe pagina 1din 16

BAZELE STATISTICII

CURS 2b

Culegerea datelor statistice (Colectarea


datelor )

1
Surse de date statistice
 În scopul aplicării metodelor statistice de analiză a fenomenelor şi proceselor
social-economice este necesar să avem la dispoziţie date statistice.
 Sursele de date statistice se pot clasifica în: surse primare şi
surse secundare de date.
 Dacă datele statistice sunt obţinute direct prin organizarea unei observări
statistice (totale sau parţiale), atunci persoana sau instituţia care a realizat o
astfel de observare este o sursă primară de date statistice.
 Dacă datele sunt deja prelucrate în tabele şi grafice (în scopuri publice sau
private) şi publicate de persoane sau instituţii specializate, ele vor fi surse
secundare de date.
 Datele primare sunt obţinute prin observări totale sau
parţiale
 Dacă înregistrarea valorilor caracteristicilor urmărite se face pentru toate
unităţile statistice din colectivitatea generală (de ex. recensământul
populaţiei)vorbim de observare totală.
 Dacă înregistrarea valorilor caracteristicilor urmărite se face de la o parte a
colectivităţii generale vorbim de observări parţiale, (de ex. sondajul statistic).

2
Surse de date statistice
 Indiferent de amploarea observării (totale sau parţiale)
culegerea datelor se poate face prin:
1. Observări curente (înregistrare permanentă, de ex.
evenimentele demografice: natalitate, mortalitate etc.)

2. Observări periodice (datele se înregistrează la intervale de


timp precizate)

3. Observări directe (datele sunt înregistrate de către operator


sau cercetător direct de la unităţile statistice)

4. Observări indirecte (datele se înregistrează din diverse surse


care au consemnat anterior fenomenul studiat, de ex. documentele
contabile)

3
Etapele cercetării statistice
 Procesul cunoaşterii statistice presupune organizarea şi parcurgerea unor etape distincte
şi succesive care includ operaţiile de observare sau culegere a datelor, de sistematizare şi
prelucrare, de analiză şi interpretare a rezultatelor.
 Etapele cercetării statistice sunt:
 observarea statistică - etapă în care se culeg date de la
unităţile colectivităţii studiate, pentru toate caracteristicile
urmărite;
 prelucrarea statistică - etapă în care datele culese sunt
sistematizate şi sunt calculaţi indicatorii statistici primari şi
derivaţi, absoluţi şi sintetici ce caracterizează fenomenul
studiat;
 analiza şi interpretarea rezultatelor - etapă în care sunt
verificate ipotezele, formulate concluziile şi fundamentate
procesele decizionale.

4
Observarea statistică
 Observarea statistică reprezintă acţiunea de culegere, de la
unităţile statistice, a valorilor referitoare la caracteristicile
urmărite, după criterii riguros stabilite.

 Observarea trebuie să îndeplinească anumite condiţii: de


cantitate (volum) şi calitate
 satisfacerea condiţiei de cantitate presupune obţinerea, în timpul stabilit, a tuturor
datelor necesare pentru efectuarea studiului statistic;
 satisfacerea condiţiei de calitate presupune asigurarea conţinutului veridic al datelor
culese, în vederea obţinerii unor rezultate cât mai exacte, afectate de erori cât mai
mici.

 Planul observării statistice cuprinde:


1. scopul observării
2. delimitarea colectivităţii şi unităţii de observare
3. stabilirea caracteristicilor ce vor fi înregistrate
4. alegerea formularelor de înregistrare
5. delimitarea timpului şi locului observării
6. stabilirea măsurilor organizatorice.

5
Planul observării statistice
1. Scopul observării se formulează în momentul declanşării
procesului cercetării şi depinde de scopul general al
investigaţiei statistice.

2. Delimitarea colectivităţii şi unităţilor de observare –


depinde de modul de utilizare a metodelor de observare.
- constă în localizarea în timp, spaţiu şi dpvd organizatoric a
colectivităţii studiate
- alegerea unităţii de observare în conformitate cu scopul urmărit şi
modul de organizare a colectivităţii.

3. Stabilirea caracteristicilor ce urmează a fi înregistrate formează


programul observării şi reprezintă partea cea mai importantă a
planului observării.
Selectarea variabilelor din programul observării se va realiza astfel încât să
permită studierea sub aspectele de interes, a fenomenului analizat,
evitându-se redundanţa de informaţii.

6
Planul observării statistice
4. Formularele de înregistrare reprezintă suportul material pe
care se vor înregistra datele culese. Pot fi de două tipuri: fişă
sau listă.
Formularele sunt însoţite de instrucţiuni, pentru a se asigura înţelegerea clară a
conţinutului lor şi furnizarea de răspunsuri corecte şi reale.
 Fişa este un formular individual, completat de către o singură unitate de
observare.
Se foloseşte când programul observării este amplu (cuprinde mai multe caracteristici ale
căror valori urmează a fi înregistrate) sau când unităţile de observare sunt împrăştiate
teritorial.
 Lista este un formular colectiv, completat cu date pentru mai multe unităţi de
observare.
Se utilizează atunci când programul observării este mai sumar (cuprinde mai puţine
caracteristici) sau când unităţile statistice sunt mai concentrate teritorial.
5. Timpul observării indică două aspecte:
 timpul la care se referă datele (poate fi un singur moment, numit „moment
critic” sau un interval de timp, în funcţie de tipul fenomenului analizat (static
sau dinamic))
 timpul când se efectuează înregistrarea datelor (este, de regulă, un interval,
cu o dată limită precisă)
6. Măsurile organizatorice cuprind toate elementele care asigură
buna organizare şi desfăşurare a observării statistice.
7
Sondajul statistic
 Sondajul sau selecţia statistică este o metodă de observare
statistică parţială frecvent utilizată.
Sondajul se foloseşte pentru a înlocui o observare totală, de mare amploare, mai dificil
de realizat, care presupune angajarea unor cheltuieli ridicate de resurse materiale,
financiare şi umane.
 Avantaje ale utilizării sondajului statistic:
 Este o metodă este aplicabilă în toate cazurile în care se urmăreşte realizarea unei
economii de resurse băneşti, de muncă şi de timp pentru obţinerea unui volum de date
necesar şi suficient, cu un grad de exactitate acceptabil.
 Programul cercetării poate fi mai amplu, iar datele detaliate pot fi culese doar de la
unităţile statistice selectate în eşantion. Acest lucru permite o caracterizare mai
profundă a fenomenelor studiate prin metode statistice.
 sondajul statistic devine absolut necesar când prin cercetarea statistică se distrug
unităţile statistice supuse analizei, ca de pildă în controlul statistic al calităţii producţiei
 sondajul statistic poate fi utilizat pentru verificarea programului unei observări totale şi
pentru verificarea şi testarea unei ipoteze statistice.

8
Sondajul statistic
 Sondajul statistic implică un grad de incertitudine referitor la
cunoaşterea situaţiei din colectivitatea generală
 Nu vom fi niciodată 100% siguri că eşantionul selectat oglindeşte
perfect situaţia din colectivitatea generală.
 Dacă se respectă anumite reguli în privinţa procedeului de selecţie
aleatoare şi a mărimii eşantionului, se poate garanta, cu un anumit
nivel prestabilit de încredere, reprezentativitatea eşantionului.
 Există două categorii de sondaj: sondaj aleator (probabilist) şi
sondaj nealeator.
Folosirea selecţiei aleatoare (eşantionarea probabilistă), în care fiecare unitate statistică din
colectivitatea generală are şansa calculabilă şi diferită de zero să fie selecţionată în
eşantion, permite calcularea mărimii erorii şi stabilirea prealabilă a acestei mărimi.
În analiza statistică, singura cale pentru a putea folosi corect
inferenţa statistică, de la eşantion la colectivitatea generală, este să
utilizăm un sondaj probabilist.
Pentru multe studii este posibilă doar realizarea unei eşantionări nealeatoare (cum ar fi
ancheta statistică care oferă informaţii orientative).

9
Sondajul aleator simplu
 Un eşantion probabilist este acela în care unităţile din eşantion au fost
alese pe baza unor probabilităţi cunoscute.
 Un eşantion simplu aleator este selectat astfel încât:
- fiecare unitate statistică are aceeaşi şansă de a fi aleasă în eşantion
- alegerea unei unităţi nu este influenţată de alegerea unei alte unităţi
statistice
Alcătuirea bazei de sondaj implică sistematizarea unităţilor statistice din colectivitatea
generală în liste, hărţi etc, astfel încât să permită alegerea întâmplătoare a unităţilor ce vor fi
selectate în eşantion.
Unităţile de eşantionare pot fi simple sau complexe: oraşe, gospodării, persoane, firme, piese
pentru controlul calităţii etc.
 Sondajele pot fi repetate (selecţie bernoulliană) sau nerepetate
(selecţie nebernoulliană), după cum există posibilitatea revenirii unei
aceleaşi unităţi în cadrul aceluiaşi eşantion.
Pentru populaţiile de volum foarte mare, considerate populaţii infinite, deosebirea dintre
sondajul repetat şi sondajul nerepetat dispare.

10
Procedee de selecţie
1. Procedeul „urnei cu bile”
- este un procedeu de selecţie aleatoare realizat în varianta cu revenire sau fără revenire.
- fiecărei unităţi statistice din colectivitatea generală, de volum N, i se asociază un număr de la 1 la N.
- funcţia de selecţie aleatoare permite obţinerea unui eşantion de volum n, adică o submulţime de n numere cuprinse între 1
şi N, numere ce identifică unităţile statistice alese să constituie eşantionul.
 Dacă selecţia se face cu revenire eşantionul se numeşte eşantion aleator repetat.
La fiecare extragere, probabilitatea ca o unitate să fie extrasă este 1/N, iar după ultima extragere,
în baza de seleţie rămân N unităţi statistice. Numărul eşantioanelor distincte, de volum n, ce pot fi
extrase în sondajul cu revenire este . n
N
Procedeul selecţiei aleatoare cu revenire este implementat în EXCEL.
 Dacă selecţia se face fără revenire eşantionul se numeşte eşantion aleator nerepetat.
După extragerea primei unităţi în baza de selecţie rămân (N-1) unităţi, după a doua extragere (N-
2) unităţi, astfel încât după ultima extragere, în urnă rămân N-n unităţi statistice.
La fiecare extragere, probabilitatea unei unităţi (încă neextrase) de a fi aleasă în eşantion creşte,
astfel încât la extragerea cu numărul i (1  i  n), probabilitatea unei unităţi de a fi selectată în
eşantion este .
1
N  (i  1)
Numărul eşantioanelor distincte, de volum n, ce pot fi extrase în sondajul aleator simplu fără
revenire este n.
CN
De exemplu, pot fi alese 17 310 309 456 440 eşantioane diferite, de volum n=10 unităţi dintr-o colectivitate generală de doar
N=100 unităţi.
Procedeul selecţiei aleatoare fără revenire este implementat în SPSS.

11
Procedee de selecţie
 Procedeul mecanic de selecţie a eşantionului presupune prelevarea
unităţilor din colectivitatea generală după un interval predeterminat,
denumit frecvent pas de numărare aplicat bazei de sondaj.
N
 Pasul de numărare se calculează după formula kde
 exemplu, pentru
n
a selecta 50 de unităţi dintr-o colectivitate generală de 1000 unităţi, se
va alege tot a 20-a unitate).
 Asigurarea caracterului aleator al eşantionului este dependentă de
caracterul întâmplător al includerii unităţilor colectivităţii generale în
baza de sondaj, după un criteriu ce nu are legătură cu cercetarea
efectuată.
 Numărul iniţial de la care se începe citirea se alege aleator între 1 şi k,
după care se selectează tot a k-a unitate, până la completarea
eşantionului de n unităţi statistice.

Procedeul selecţiei mecanice este implementat în EXCEL.

12
Eroarea statistică
 Orice măsurare statistică conţine erori
 Eroarea = diferenţa dintre rezultatul obţinut prin înregistrare şi
mărimea reală a caracteristicilor observate
 Erorile pot fi de înregistrare şi de calcul
 Clasificarea erorilor:
1. Erori de observare statistică
2. Erori de prelucrare
3. Erori de reprezentativitate
4. Erori de modelare
 În calculele statistice erorile se propagă pas cu pas fără nicio garanţie că ele se vor anula
 Dacă eroarea statistică este cunoscută atunci rezultatul poate fi corectat

 Erorile de observare sunt:


1. Erori sistematice
2. Erori întâmplătoare
3. Erori grosiere (greşeli)

13
Erori de observare
1. Erori sistematice
- rezultă din acţiunea unui factor ce determină devierea variabilei studiate întotdeauna în
acelaşi sens
- surse de astfel de erori: încălcarea regulilor de delimitare a colectivităţii, a unităţii
statistice, de construire a chestionarelor, de selecţie a eşantionului
- distorsiunile pot fi introduse de răspunsuri incorecte ale persoanelor anchetate din
motive psihologice, economice etc. (de ex. dorinţa de a face impresie, de a răspunde pe
placul anchetatorului sau de a ascunde anumite aspecte - întrebări cu incidenţă fiscală sau ce
implică interese economice)

2. Erori întâmplătoare
- se produc în ambele sensuri şi diferă ca mărime
- influenţele lor se compenseză reciproc pe total şi nu afectează rezultatele
- sunt generate de cauze obiective şi nu pot fi evitate ci doar minimizate

3. Erori grosiere
- sunt cauzate de lipsa de experienţă, incompetenţă etc.
- trebuie depistate şi eliminate

14
Erori de observare

 Concluzii
 Orice măsurare statistică implică erori

 Ceea ce interesează este ordinul de mărime al erorii


pentru a se cunoaşte între ce limite de acceptabilitate se
găseşte afirmaţia unei investigaţii statistice

 Erorile generate în procesul de observare statistică pot fi


determinate

15
Bibliografie

 A. ISAIC-MANIU, C. MITRUŢ, V. VOINEAGU, STATISTICĂ, Ed.


Universitară, Buc., 2004, pag. 32-39

 E. ŢIŢAN, STATISTICĂ. TEORIE ŞI APLICAŢII ÎN SECTORUL


TERŢIAR, Ed. Meteor Press, Buc., 2005, pag. 23-40

16

S-ar putea să vă placă și