Sunteți pe pagina 1din 19

CAPITOLUL 1

CAPITOLUL 1

NOŢ IUNI INTRODUCTIVE Ş I CULEGEREA DATELOR STATISTICE

Considera ţii preliminare

În acest capitol vom face primii paş i în înţ elegerea statisticii ca ş tiinţă ş i disciplină de studiu. Cele mai multe întrebări din domeniul afacerilor, din domeniul economic ori social nu au răspunsuri simple; ele necesit ă clarificare ş i discuţ ii, fundament ări ale deciziilor. Vom vedea cum statistica poate fi folositoare în luarea deciziilor, în acceptarea sau respingerea unor solu ţ ii posibile. Statistica vine, astfel, s ă aducă un plus de rigoare ş tiinţ ifică, s ă po- tenţ eze abilitatea de a lua decizii, să suplimenteze calit ăţ ile unui bun manager: experienţă, intui ţ ie etc. Pentru a înţ elege statistica este, însă, mai întâi, nevoie să ne familiariz ăm cu limbajul statistic, s ă cunoaş tem conceptele de baz ă, etapele cercet ării statistice ş i rolul statisticii în procesul decizional. În m ăsura în care am înţ eles că statistica este ş tiinţ a culegerii ş i prelucr ării, analizei datelor, este potrivit să continuăm cu studierea diferitelor tipuri de date ce pot fi culese ş i a celor mai des utilizate metode de colectare a datelor statistice.

Termeni cheie

caracteristică (variabil ă statistică) caracteristică nenumeric ă caracteristică numerică colectivitate generală colectivitate parţ ial ă (eş antion) control statistic date bivariate date continue

legea stabilit ăţ ii frecvenţ elor observ ări parţ iale observări totale parametru scal ă de interval scală de raport scal ă nominal ă scal ă ordinal ă

STATISTICĂ ECONOMICĂ

date discrete date multivariate date statistice date univariate eroare statistică eş antion estimator fenomen de mas ă indicator inferenţă statistică, lege statistică

sondaj aleator simplu sondaj în cuiburi sondaj nealeator sondaj probabilist sondaj stratificat statistică descriptivă statistică inferenţ ial ă surse primare de date surse secundare de date unitate statistică

CAPITOLUL 1

No ţ iuni teoretice

1.1. ARGUMENTE ÎN FAVOAREA CUNOA Ş TERII STATISTICII

Printre motivele ş i argumentele în favoarea cunoaş terii statisticii se num ără urm ătoarele:

- factorii decizionali au nevoie s ă ş tie cum s ă descrie ş i s ă prezinte în modul cel mai potrivit informaţ iile;

- factorii decizionali au nevoie să ş tie cum s ă ob ţ ină previziuni credibile privind variabilele de interes;

- factorii decizionali au nevoie să ş tie cum s ă îmbun ăt ăţ ească

desfăş urarea activit ăţ ilor de care sunt r ăspunz ători;

- factorii decizionali au nevoie să ş tie cum s ă tragă concluzii despre

colectivit ăţ i numeroase, doar pe baza informaţ iilor ob ţ inute din eş antioane.

1.2. SEMNIFICA Ţ II ALE CUVÂNTULUI STATISTICĂ

Cuvântul statistică are o semnificaţ ie multiplă pentru cercet ători, speciali ş ti, studenţ i ş i populaţ ie în general. Astfel, acest cuvânt poate să ducă cu gândul la indicele preţ urilor de consum, la cifra medie de afaceri a unor firme, la rata ş omajului, la datele publicate într-o revistă sau într-un buletin oficial, ori, evident, la o disciplin ă de studiu din cadrul învăţământului superior de specialitate.

Statistica este, aş adar, o activitate practic ă, dar ş i mul ţ imea datelor

ob

ţ inute prin aceast ă activitate, publicaţ iile de date ale diferitelor organisme

de

specialitate, metodologia statistică, o ramură a ş tiinţ ei ş i cunoaş terii, ori o

disciplină ş tiinţ ifică ş i de înv ăţământ.

1.3. DEZVOLTAREA STATISTICII MODERNE

Pentru a pune în eviden ţă rolul statisticii ca instrument de cunoaş tere

a particularităţ ilor de volum, structură ş i dinamică a fenomenelor ş i

STATISTICĂ ECONOMICĂ

proceselor economico-sociale, este necesar s ă subliniem că din punct de vedere istoric, apari ţ ia ş i dezvoltarea statisticii moderne î ş i are răd ăcinile în trei fenomene separate: nevoile guvernelor ţărilor de a calcula date privind cet ăţ enii ş i activit ăţ ile ţărilor, dezvoltarea teoriei probabilit ăţ ilor ş i apari ţ ia ş i extinderea utiliz ării calculatoarelor. De-a lungul istoriei, datele au fost permanent colectate; în timpul civilizaţ iei egiptene, greci ş i romane, datele erau obţ inute în scopul primar al tax ării ş i înrol ării în armat ă. În Evul Mediu, instituţ iile bisericii strângeau adesea ş i p ăstrau informaţ ii, înregistrări privind naş terile, decesele ş i căs ătoriile. Necesitatea prelucr ării datelor din ce în ce mai numeroase, a ajutat într-un fel sau altul – la dezvoltarea maş inilor de calcul ş i implicit, la revoluţ ia calculatoarelor personale, la începutul secolului XX. Aceste progrese au determinat schimbări profunde ale domeniului de studiu al statisticii în ultimii 30 de ani.

1.4. OBIECT Ş I METODĂ ÎN STATISTICĂ

Obiectul de studiu al statisticii îl constituie fenomenele ş i procesele care prezint ă urm ătoarele particularităţ i: se produc într-un număr mare de cazuri (sunt fenomene de mas ă); variaz ă de la un element la altul, de la un caz la altul; sunt forme individuale de manifestare în timp, în spaţ iu ş i ca form ă organizatoric ă. Urm ărind etapele oricărui proces de cunoaş tere, pentru rezolvarea problemelor care fac obiectul s ău de studiu, statistica, ca orice ş tiinţă, ş i-a elaborat procedee ş i metode speciale de cercetare, cum sunt cele ale observării de mas ă, ale centraliz ării ş i grupă rii, procedee ş i modele de analiz ă ş i interpretare statistică. Putem spune că metoda statisticii este constituit ă din „totalitatea operaţ iilor, tehnicilor, procedeelor ş i metodelor de investigare statistică a fenomenelor ce aparţ in unor procese de tip stochastic“. Complexitatea ş i amploarea cercetării statistice fac imperios necesară perfecţ ionarea continuă a metodelor de observare, prelucrare, analiz ă. În acelaş i timp, dezvoltarea metodelor statisticii este strâns legată de progresele înregistrate de teoria probabilităţ ilor ş i statistica matematică, precum ş i de cele din domeniul informaticii economice.

CAPITOLUL 1

DEFINI Ţ IE: Statistica este ş tiinţ a care studiaz ă aspectele cantitative ale determină rilor calitative ale fenomenelor de masă, fenomene care sunt supuse ac ţ iunii legilor statistice ce se manifestă în condi ţ ii concrete, variabile în timp ş i spaţ iu.

1.5. STATISTICA DESCRIPTIV Ă VERSUS STATISTICA INFERENŢ IAL Ă

Necesitatea culegerii datelor pentru cunoaş terea unor întregi naţ iuni a constituit practic, punctul de plecare în dezvoltarea statisticii descriptive.

DEFINI Ţ IE: Statistica descriptivă poate fi definit ă ca totalitatea metodelor de culegere, prezentare ş i caracterizare a unui set de date, în scopul de a descrie diferitele trăs ături principale ale acestui set de date.

DEFINI Ţ IE: Statistica inferenţ ial ă poate fi definit ă ca totalitatea metodelor ce fac posibilă estimarea caracteristicilor unei popula ţ ii sau luarea unor decizii privind o populaţ ie, pe baza rezultatelor obţ inute pe un eş antion.

Pentru a clarifica distincţ ia între statistica descriptivă ş i cea inferenţ ial ă sunt necesare câteva preciz ări, defini ţ ii şi explicaţ ii privind unele noţ iuni ş i concepte de baz ă ale statisticii.

1.6. NOŢ IUNI Ş I CONCEPTE DE BAZĂ FOLOSITE ÎN STATISTICĂ

O prim ă noţ iune de baz ă din statistică o reprezint ă populaţia (colectivitatea) statistic ă .

DEFINI Ţ IE: Populaţ ia statistică , denumită ş i colectivitate statistică , reprezintă totalitatea elementelor de aceeaş i natură, care au tr ăs ături esen ţ iale comune ş i care sunt supuse unui studiu statistic.

Termenul de populaţ ie nu se refer ă doar la un grup de persoane. Deş i, iniţ ial, conceptul a fost utilizat în acest sens restrâns (la recensăminte),

STATISTICĂ ECONOMICĂ

ast ăzi în ţ elesul s ău este l ărgit, prin populaţ ie putându-se înţ elege o colectivitate de obiecte, persoane, p ăreri, gânduri, evenimente, opinii etc. Cu cât este mai numeroasă o colectivitate, cu atât devine mai dificilă cercetarea tuturor elementelor ei. O astfel de cercetare poate fi consumatoare de timp ş i costisitoare. Soluţ ia poate să fie, atunci, s ă extra- gem o subcolectivitate din colectivitatea general ă (numit ă ş i colectivitate parţial ă , eş antion sau colectivitate de selec ţie).

DEFINI Ţ IE: Eş antionul reprezint ă un subset de elemente selectate dintr-o colectivitate statistică.

În felul acesta, se vor estima parametrii colectivităţ ii totale pe baza rezultatelor obţ inute în colectivitatea de selecţ ie, iar ceea ce a fost deter- minat ca fiind tipic, esenţ ial ş i caracteristic în eş antion, se presupune c ă ar fi fost găsit dacă s-ar fi cercetat colectivitatea generală. Soliditatea acestei pre- supuneri depinde de modul cum a fost extras eş antionul, iar de acurateţ ea acestui proces depinde succesul demersului statistic. Reprezentativitatea eşan- tionului este, aş adar, aspectul crucial al oric ărui proces de cercetare pe baz ă de sondaj statistic.

DEFINI Ţ IE: Inferenţ a statistică reprezint ă o decizie, o estimaţ ie, o predicţ ie sau o generalizare privitoare la o colectivitate generală, bazat ă pe informaţ iile statistice ob ţ inute pe un eş antion.

Statistica abordeaz ă colectivităţi statice (care exprim ă o stare, un nivel, la un moment dat) ş i colectivităţi dinamice (care caracterizeaz ă un proces, o devenire în timp).

Un alt concept de bază al statisticii îl reprezint ă unitatea statistică .

DEFINI Ţ IE: Unitatea statistică reprezint ă elementul constitutiv al unei colectivit ăţ i statistice ş i care este purt ătorul unui nivel al fiec ărei trăs ături supuse observ ării ş i cercet ării statistice.

Unit ăţ ile statistice pot fi simple sau complexe. Unităţile complexe sunt rezultate ale organiz ării sociale ori economice a colectivit ăţ ii statistice (exemplu: familia).

CAPITOLUL 1

DEFINI Ţ IE: Caracteristica statistică reprezint ă trăs ătura, proprie- tatea, însuş irea comun ă tuturor unit ăţ ilor unei colectivităţ i ş i care variaz ă ca nivel, variant ă sau valoare, de la o unitate a colectivităţ ii la alta. Este denumită ş i variabil ă statistică ori variabilă aleatoare.

DEFINI Ţ IE: Varianta/valoarea reprezint ă nivelul concret pe care îl poate lua o variabilă la nivelul unei unităţ i sau grup de unităţ i statistice.

DEFINI Ţ IE: Frecven ţ a de apari ţ ie a unei variante/valori reprezint ă num ărul de apariţ ii al acestei variante/valori în colectivitate.

DEFINI Ţ IE: Datele statistice reprezint ă caracterizarea numerică ob ţ i- nut ă de statistică în leg ătură cu unit ăţ ile, grupele sau colectivitatea studiată.

Datele statistice sunt m ărimi concrete, rezultate din studiile efectuate prin num ărare, măsurare sau calcul statistic. Ele pot fi primare, prelucrate, publicate sau stocate în baze sau b ănci de date. Mesajul datelor statistice este informaţia statistic ă .

DEFINI Ţ IE: Indicatorul statistic reprezint ă expresia numerică a unor fenomene, procese, activităţ i sau categorii economice ş i sociale, definite în timp, spaţ iu ş i structură organizatorică.

EXEMPLUL 1.1. Pentru a ne referi la toate aceste noţ iuni într-un exemplu, s ă presupunem că primarul unei localităţ i este interesat în cunoaş terea percepţ iei locuitorilor privind nivelul de trai. Colectivitatea sau populaţ ia statistică, în acest caz, poate fi alcătuit ă din totalitatea cetăţ enilor cu domiciliul în localitatea respectivă, în timp ce eş antionul este alc ătuit din acele persoane care sunt selectate s ă participe la anchet ă. Scopul anchetei este de a descrie diverse caracteristici ale colectivit ăţ ii generale (parametrii:

venitul mediu etc.). Acest scop poate fi atins folosind indicatorii statistici (estimatorii) obţ inuţ i pe baza eş antionului de locuitori, pentru a estima diferitele caracteristici ale populaţ iei de interes. Observăm astfel că scopul major al statisticii inferenţ iale este de atrage concluzii asupra parametrilor colectivit ăţ ii generale, folosind estimatorii calculaţ i pentru eş antion.

STATISTICĂ ECONOMICĂ

1.7. ETAPELE CERCET ĂRII STATISTICE

Procesul cunoaş terii statistice presupune organizarea ş i parcurgerea unor etape distincte ş i succesive care includ operaţ iile de observare sau culegere a datelor, de sistematizare ş i prelucrare, de analiză ş i interpretare a rezultatelor. Etapele cercetă rii statistice sunt:

observarea statistică etapă în care se culeg date ş i informaţ ii

statistice de la unit ăţ ile colectivit ăţ ii, pentru toate caracteristicile urmă rite; prelucrarea statistică etapă în care datele sunt sistematizate şi

sunt calculaţ i indicatorii statistici primari ş i derivaţ i, absoluţ i ş i sintetici ce caracterizeaz ă fenomenul studiat;

analiza ş i interpretarea rezultatelor etapă în care sunt verificate

ipotezele, formulate concluziile ş i fundamentate procesele decizionale.

1.8. TIPURI DE DATE Ş I SCALE DE M ĂSURARE A DATELOR

O prim ă posibilitate de a lua în considerare complexitatea datelor statistice este în funcţ ie de num ărul de caracteristici (variabile) la care se referă aceste date. Astfel, datele univariate sunt cele care se referă la o singură variabilă statistică. Avem deci o singur ă informaţ ie pentru fiecare unitate statistică. Metodele statistice vor fi folosite pentru a rezuma, a analiza caracterele ş i tr ăs ăturile esenţ iale ale acestui set de date, r ăspunzând la întrebări precum: care sunt valorile tipice ce caracterizează setul de date, cât de variate sunt ele, există unit ăţ i sau grupuri care necesită o atenţ ie special ă etc.

Datele bivariate sunt cele care se refer ă la două variabile statistice ş i avem, aş adar, exact câte două informaţ ii pentru fiecare unitate statistică din colectivitate. În plus, faţă de caracterizarea separat ă a datelor pentru fiecare variabilă ca în cazul datelor univariate metodele statistice pot să fie folosite ş i pentru a studia legătura, dependenţ a dintre cele două variabile considerate.

CAPITOLUL 1

Datele multivariate sunt cele care se referă la trei sau mai multe va- riabile statistice, obţ inând deci câte trei sau mai multe informaţ ii pentru fiecare unitate statistică din colectivitatea studiat ă. Deş i sunt multivariate, datele pot fi analizate separat (pentru fiecare variabilă), sau în interdepen- denţă unele cu altele. Putem observa că exist ă dou ă tipuri de baz ă de variabile aleatoare (caracteristici) care pot fi studiate ca oferind niveluri observate sau date statistice: caracteristici nenumerice (calitative), care ofer ă răspunsuri categoriale ş i caracteristici numerice (cantitative), care ofer ă r ăspunsuri sub form ă de valori numerice. Datele discrete sunt ră spunsuri numerice care apar în urma unui proces de num ărare, în timp ce datele continue sunt răspunsuri numerice care apar în urma unui proces de măsurare. Aş adar. caracteristicile statistice se pot clasifica dup ă mai multe criterii, astfel:

a) în funcţ ie de modul de exprimare, în:

caracteristici calitative (nominative), exprimate în cuvinte:

profesie, culoarea părului, localitatea de domiciliu etc.;

caracteristici cantitative (numerice), exprimate în cifre: salariu,

înăl ţ ime, greutate, cifră de afaceri etc. Sunt caracteristici măsurabile.

b) în funcţ ie de numă rul variantelor/valorilor de ră spuns pe care le

pot lua, în:

caracteristici alternative (binare sau dihotomice), acelea care pot

lua doar dou ă variante de răspuns, dup ă modelul adevă rat/fals din logică:

sex (M/F), stagiul militar (efectuat/neefectuat), starea civilă (căs ătorit/nec ă-

s ătorit);

caracteristici nealternative cele care pot lua mai multe

valori/variante de răspuns: salariu, profesie, cifr ă de afaceri, localitate de domiciliu etc.

c) în funcţ ie de natura varia ţ iei caracteristicilor numerice, în:

caracteristici continue (cu variaţie continu ă ), cele care pot lua

orice valoare din scara lor de varia ţ ie: greutatea unei persoane, cifra de afaceri a unei firme etc.;

caracteristici discrete sau discontinue, cele a c ăror variaţ ie se

manifest ă prin salturi; ele nu pot lua decât anumite valori pe scara lor de variaţ ie (de regul ă numere întregi): numărul de copii pe care îi are o familie, num ărul de oraş e dintr-un judeţ etc.

STATISTICĂ ECONOMICĂ

d) în funcţ ie de conţ inutul caracteristicii, în:

caracteristici de timp (exemplu: anul naş terii, anul înfiinţării unei

firme);

caracteristici de spa ţiu (exemplu: localitatea de domiciliu);

caracteristici atributive, în care variabila reprezintă un atribut, altul decât spaţ iul ori timpul.

e) în funcţ ie de modul de obţ inere ş i caracterizare a fenomenului:

caracteristici primare (ob ţ inute, de regul ă, în etapa de culegere a

datelor statistice);

caracteristici derivate, ob ţ inute în procesul prelucrării variabilelor

primare.

Putem, de asemenea, studia tipul datelor statistice în concordanţă cu nivelul sau scala de m ăsurare folosit ă. Într-un sens larg, toate datele statistice colecate sunt “m ăsurate” sau transpuse pe o scal ă de m ăsurare, într-o form ă sau alta.

Patru niveluri de m ăsurare sunt utilizate – de la cea mai slab ă la cea mai puternică - scala nominal ă, ordinal ă, de interval ş i de raport, iar prelucrarea datelor statistice se va face în mod distinct, în func ţ ie de gradul de “rafinament” al scalei.

Forma cea mai elementară este scala nominal ă (de clasificare sau scala denumirilor), când numerele sunt atribuite observa ţ iilor pentru a face doar judec ăţ i despre identităţ i sau diferenţ ieri de categorie. Cu ajutorul scalei nominale numerele repartizate unor observaţ ii servesc drept numele lor. Numerele sunt atribuite fiecă rei categorii doar pentru a identifica unităţ i similare din interiorul unei categorii ş i pentru a diferenţ ia aceste unit ăţ i similare de elementele unei alte categorii diferite. Se face, astfel, o diferenţ iere de specie, dar nu ş i de grad.

Urm ătoarea scal ă este scala ordinal ă , pe care sunt m ăsurate tot varibile de tip nenumeric (calitativ), dar care pot fi, de această dat ă,

ordonate. Unităţ ile pot fi înş iruite una reltiv cu celaltă ş i se poate realiza astfel, o ierarhizare, dar distanţ a între numerele acordate nu este obligatoriu egal ă. Numerele pe scala ordinal ă nu reprezint ă intervale egale pe scala de

m ăsurare.

CAPITOLUL 1

În continuare putem distinge scala de intervale (sau cardinal ă ) practic prima scal ă cu adev ărat numeric ă, ce foloseş te unit ăţ i de măsurare egale. Se face astfel posibil ă nu numai interpretarea ordinii not ărilor pe scal ă, dar ş i a diferenţ elor dintre ele. În plus faţă de scala nominal ă ş i cea ordinal ă , intervalele între categoriile de pe scal ă sunt presupuse a fi egale. O caracteristică a scalei de interval este absen ţa unui punct zero absolut. Judecăţ i comparative ca „de două ori mai mult“, „de patru ori mai pu ţ in“ etc. nu pot fi fă cute pentru compararea valorilor specifice m ăsurate pe o scal ă de interval. Ca atare, multiplicarea sau divizarea valorilor nu are sens.

Pentru ca afirmaţ iile comparative pe baza multiplicării ori diviz ării s ă aibă sens, este necesar ă o scal ă proporţional ă (de raport), în care exist ă un punct zero fix ş i absolut (cum este cazul scalei pe care se măsoar ă greutatea ori a celei pentru lungime).

1.9. CULEGEREA DATELOR STATISTICE

1.9.1. Surse de date statistice

În scopul aplicării metodelor statistice de analiz ă a fenomenelor ş i proceselor social-economice este necesar s ă avem la dispozi ţie date statistice. Putem să ob ţ inem aceste informaţ ii din datele deja publicate (de instituţ ii specializate, de exemplu), sau putem s ă construim un experiment, o anchet ă, un sondaj. Deci, o clasificare a surselor de date statistice poate fi:

surse primare ş i surse secundare de date. Dacă datele statistice sunt obţ inute direct prin organizarea unei observ ări statistice (totale sau parţ iale), atunci persoana sau institu ţ ia care a realizat o astfel de observare este o surs ă primară de date statistice. Dacă datele sunt prelucrate în tabele ş i grafice, în scopuri publice sau private, ele vor fi surse secundare de date.

Datele primare sunt ob ţ inute prin observ ă ri totale, când înregistrarea valorilor sau variantelor caracteristicilor urmărite se face pentru toate unit ăţ ile statistice din colectivitatea generală (de exemplu,

STATISTICĂ ECONOMICĂ

recens ământul populaţ iei), sau prin observ ă ri parţiale, când se culeg date de la o parte a colectivit ăţ ii generale (de exemplu, sondajul statistic).

1.9.2. Planul observ ă rii statistice

DEFINI Ţ IE: Observarea statistică reprezint ă acţ iunea de culegere de la unit ăţ ile statistice a informaţ iilor referitoare la caracteristicile urm ă rite, dup ă criterii riguros stabilite.

Observarea trebuie s ă îndeplinească anumite condi ţ ii: de cantitate (volum) ş i calitate, astfel:

• satisfacerea condi ţiei de cantitate presupune obţ inerea în timpul

stabilit a tuturor datelor necesare pentru efectuarea studiului statistic;

• satisfacerea condi ţiei de calitate presupune asigurarea conţ inutului

veridic al datelor culese, în vederea ob ţ inerii unor rezultate cât mai exacte, afectate de erori cât mai mici. Observarea se efectueaz ă dup ă un plan riguros, care trebuie să cuprindă:

• scopul observării;

• delimitarea colectivit ăţ ii ş i unit ăţ ii de observare;

• stabilirea caracteristicilor ce vor fi înregistrate;

• alegerea formularelor de înregistrare;

• delimitarea timpului ş i locului observării;

• stabilirea m ăsurilor organizatorice.

1.9.3. Recens ă mântul statistic

Recens ă mântul este o metodă de observare total ă, cu caracter periodic care surprinde un fenomen în mod static. Este una din cele mai vechi metode de observare, întâlnită încă din antichitate (recens ăminte ale populaţ iei la romani). Recens ământul asigur ă o fotografiere, o surprindere a unui fenomen la un anumit moment de timp (moment critic).

DEFINI Ţ IE: În mod oficial, recens ă mântul populaţ iei este „un proces de culegere, prelucrare ş i publicare a datelor demografice, economice ş i sociale, la un timp specificat ş i valabile pentru toate persoanele din ţ ara respectivă sau de pe un teritoriu delimitat“.

CAPITOLUL 1

Recens ământul populaţ iei este reglementat de c ătre stat, prin acte legislative, ş i respect ă principiile universalităţii, simultaneităţii ş i comparabilităţii. Din domeniul populaţ iei, recens ământul s-a extins ş i asupra altor do- menii: există recens ământ al locuinţ elor, al animalelor, al unit ăţ ilor din in- dustrie, comerţ , transport, agricultură (într-un cuvânt, recens ământ econo- mic).

1.9.4. Culegerea datelor utilizând sondajul statistic

Sondajul sau selecţia statistică este o metod ă parţ ial ă de observare statistică, din ce în ce mai larg utilizată în cercet ările statistice moderne. Sondajul se foloseş te pentru a înlocui o observare totală, de mare amploare, mai dificil de realizat, care presupune angajarea unor cheltuieli ridicate de resurse materiale, financiare ş i umane.

Exist ă două categorii esenţ iale de sondaj: sondaj aleator (probabilist) ş i sondaj nealeator. Pentru multe studii este posibilă doar realizarea unei eş antionări nealeatoare (cum ar fi ancheta statistică - care ofer ă informaţ ii orientative, eş antionarea pe cote, observarea p ărţ ii principale etc.). Îns ă, în analiza statistică, singura cale pentru a putea folosi corect inferen ţ a statistică, de la eş antion la colectivitatea general ă, este s ă utiliz ăm un sondaj probabilist. Un eş antion probabilist este acela în care unităţ ile din eş antion au fost alese pe baza unor probabilităţ i cunoscute. Tipurile de eş antionări probabiliste cel mai des utilizate sunt: eş antionarea aleatoare simplă, eş antionarea stratificat ă ş i eş antionarea în cuiburi (cluster). În sondajul aleator simplu ş ansa de selecţ ie în eş antion a fiecărei unit ăţ i statistice din colectivitatea generală trebuie s ă fie egal ă. Acesta este un sondaj cu un singur grad, în care unit ăţ ile sunt extrase din întreaga populaţ ie, care constituie baza de sondaj. Pentru efectuarea unei selecţ ii simple aleatoare corecte, este esen ţ ial s ă eliminăm elementele preferenţ iale ale alegerii umane care ar putea duce la formarea „arbitrară“ a eş antionului. Un eş antion simplu aleator este aş adar selectat astfel încât:

fiecare unitate statistică are o probabilitate egală de a fi aleas ă în eş antion ş i

unit ăţ ile sunt alese independent, f ără legătură una cu cealaltă.

STATISTICĂ ECONOMICĂ

Sondajele pot fi repetate sau nerepetate, după cum exist ă posibilitatea revenirii unei aceleaş i unit ăţ i în cadrul aceluiaş i eş antion. În prima situaţ ie, a sondajului repetat (cu revenire), fiecare unitate statistică extras ă din colectivitatea generală este reintrodusă în baza de sondaj, după ce a fost citit ă ş i caracteristicile au fost înregistrate. În varianta sondajului nerepetat (f ă ră revenire), unit ăţ ile sunt extrase din colectivitatea general ă, iar după înregistrarea caracteristicilor lor, ele nu mai sunt reintroduse în colectivitatea de baz ă; selecţ ia se face după modelul urnei din care se fac extrageri succesive fă ră a pune bila extras ă înapoi, iar o unitate nu poate s ă apar ă în ş irul succesiv al probelor decât o singură dat ă.

Extragerea

întâmplătoare

a

unit ăţ ilor

ş i

alcătuirea

eş antioanelor

aleatoare se poate realiza prin unul din următoarele procedee de selec ţie:

1 . Procedeul urnei cu bile (procedeul loteriei), este un procedeu de

selecţ ie aleatoare care poate fi realizat în varianta cu revenire sau fă ră re- venire. Se stabileş te un cadru de identificare, astfel încât fiecare unitate din colectivitatea generală este numerotat ă de la 1 la N. Numerele sunt notate pe cartonaş e, bileţ ele sau bile iar acestea sunt amestecate atent. Se extrage apoi, la întâmplare, un cartona ş (bil ă) iar num ă rul citit identifică unitatea ce este considerat ă ca f ăcând parte din eş antion. Pentru aceast ă unitate se înregis- treaz ă toate caracteristicile ce fac parte din programul cercet ării. În continuare, în varianta cu revenire (sondaj repetat), cartonaş ul (bila) este reintrodus în urnă, se repet ă amestecarea iar extragerea se repet ă până când se obţ ine eş antionul de volum n.

În varianta sondajului fără revenire (sondaj nerepetat), cartonaşul (bila) nu este reintrodusă în urnă, ceea ce înseamnă că o unitate statistică, o dat ă extras ă în eş antion nu mai are ş anse s ă mai reintre în colectivitatea de origine ş i s ă fie extras ă din nou.

2. Procedeul tabelului cu numere întâmplă toare este o alt ă modalitate utilizată pentru alegerea unui eş antion aleator printr-o selecţ ie probabilist ă. Utilizarea tabelelor cu numere aleatoare constă în prelevarea din cadrul populaţ iei a unit ăţ ilor ale c ăror numere de ordine stabilite printr-o num ără toare prealabil ă, au fost citite dup ă un anumit criteriu din „tabelul numerelor întâmpl ătoare“.

CAPITOLUL 1

Tabelul cu numere aleatoare este o listă de numere în care fiecare cifră – de la 0 la 9 – apare cu o probabilitate de 1 / 1 0, independent una de alta (vezi Anexa)

EXEMPLUL 1.2. S ă alegem un eş antion aleator de n=9 unităţ i, dintr-o colectivitate de 38 unit ăţ i, începând din rândul 1 5, coloana 3 din tabelul cu numere aleatoare. Numerele citite din tabel vor fi:

7295; 2925; 1 5 1 8; 2568; 4892; 87 1 6; 7843; 1 747; 3375; 87 1 5; 1 523; 1 379. Cum N=38 are 2 cifre, se rearanjeaz ă secven ţ a citit ă în grupuri de câte 2 cifre, astfel:

72; 95; 29; 25; 1 5; 1 8; 25; 68; 48; 92; 87; 1 6; 78; 43; 1 7; 47; 33; 75; 87; 1 5; 23; 1 3; 79. Se elimină numerele mai mari de 38 ş i vor r ămâne urm ătoarele numere ce identifică unit ăţ ile care sunt selectate în eş antion:

29; 25; 1 5; 1 8; 25; 1 6; 1 7; 33; 1 5; 1 5; 23; 1 3. Dacă selecţ ia este fă ră revenire se vor elimina numerele ce reapar în list ă ş i vor rămâne atunci numerele:

29; 25; 1 5; 1 8; 1 6; 1 7; 33; 23; 1 3.

3. Procedeul mecanic de selecţ ie a eş antionului presupune prelevarea unit ăţ ilor din colectivitatea generală dup ă un interval predeterminat, denumit frecvent pas de num ărare aplicat bazei de sondaj. Pasul de num ărare se calculeaz ă ca N/n=k Num ărul ini ţ ial de la care se începe citirea se alege aleator între 1 ş i k, dup ă care se citeş te tot a k-a unitate până la completarea eş antionului de n unit ăţ i statistice.

Stratificarea const ă în divizarea colectivităţ ii generale de studiat în „straturi“, clase tipice cât mai omogene, cu caracteristici cât mai asemăn ă- toare, astfel încât unit ăţ ile statistice din interiorul fiecărui strat să prezinte, cel puţ in din punct de vedere teoretic, caracteristici comune specifice fie- cărei clase. Straturile pot fi constituite din regiuni, judeţ e, localit ăţ i, medii, sexe, subdiviziuni economice, grupe de vârst ă etc. Cel mai frecvent, stratifi- carea se foloseş te în studiul populaţ iei care se separă folosind clasificările oficiale sau, în funcţ ie de scop, cercet ătorul î ş i va face propria sa grupare, ca de exemplu, după profesie sau vechimea în produc ţ ie. Uneori, unit ăţ ile colectivit ăţ ii generale se prezint ă, ca urmare a orga- niz ării economico-sociale, sub forma unit ăţ ilor complexe (ex: persoanele alcă tuiesc familii etc). În asemenea cazuri, sondajul poate fi organizat astfel

STATISTICĂ ECONOMICĂ

încât sa se extrag ă spre studiu unit ăţ i complexe, urmând ca toate unităţ ile simple din cadrul unităţ ilor complexe extrase s ă se cerceteze făr ă nici o ex- cepţ ie (sondaj în cuiburi). Mai mult, nu întotdeauna se dispune, ca bază de sondaj, de o listă complet ă a unit ăţ ilor statistice simple. Dar, se poate dispune de o list ă a grupurilor de unit ăţ i. Fiecare din aceste grupuri, unit ăţ i de ordin superior, numite cuiburi, conţ ine unul sau mai multe unităţ i statistice ce intereseaz ă investigaţ ia statistică. Prin cuib (grappe în francez ă, cluster în englez ă) se înţ elege o grupare de unit ăţ i statistice concentrate ş i strict delimitate În loc de a distinge în popula ţ ie două niveluri: unităţ ile ş i populaţ ia în ansamblu, aici se consider ă trei niveluri: unit ăţ ile statistice, cuiburile (grupurile) ş i populaţ ia în ansamblu. Un sondaj în cuiburi const ă în alegerea (întâmplătoare) a unui e ş antion din aceste unităţ i colective, sau cuiburi, pentru ca apoi s ă se studieze to ţ i indivizii pe care îi conţ ine fiecare din aceste cuiburi alese (f ără excepţ ie).

În practic ă, într-o serie de cazuri, din diferite motive extracţ ia se face nealeator sau pseudoaleator (ex: sondaj pe cote, sondaj multifazic etc). Un asemenea procedeu de extracţ ie este eş antionarea concentrată , care constă în includerea în eş antion numai a acelei părţ i ce reprezintă majoritatea cazurilor individuale. Această metodă se confundă cu observarea p ă rţii principale.

Sondajul multifazic este un tip de schem ă în care unele informaţ ii sunt colectate de la întregul eş antion, iar un alt grup de informa ţ ii (am ănunte, informaţ ii mai puţ in importante pentru scopul cercetarii sau informaţ ii care vizeaz ă un studiu colateral) sunt strânse de la un subeş antion al aceluiaş i eş antion. În eş antionarea pe cote (spre deosebire de celelalte tipuri de scheme de eş antionare caracterizate prin a fi aleatoare ş i în care se garanteaz ă fiecă rei unităţ i statistice ş ansa calculabil ă de a fi inclusă in eş antion), alegerea unit ăţ ilor statistice reale ce urmeaz ă a fi incluse este l ăsat ă pe seama operatorilor.

În sondajele pseudo-aleatoare trebuie s ă se dispun ă de o baz ă de sondaj, după care se decide alegerea persoanelor (unit ăţ ilor statistice) ce se afla într-o situaţ ie dat ă privind un criteriu care nu este aleator, dar care se consideră a fi independent de fenomenul studiat.

CAPITOLUL 1

Metoda de sondaj pe bază de eş antioane fixe este destul de utilizat ă în cadrul cercet ării statistice. Ideea de baz ă a acestei metode este aceea că se obţ in informaţ ii repetate de pe acelaş i eş antion. Informaţ iile care se obţ in se pot referi la aceleaş i unitaţ i statistice sau la unit ăţ i mai mult sau mai puţ in diferite. Informaţ iile culese se pot referi la acelaş i subiect de cercetat sau la subiecte conexe.

Ancheta de opinie face parte, ca ş i sondajul statistic din rândul metodelor parţ iale de observare, făr ă ca eş antionul pe baza căruia se realizeaz ă ancheta, s ă fie obligatoriu reprezentativ faţă de colectivitatea general ă. Ancheta de opinie are drept scop cunoaş terea părerilor persoanelor asupra diferitelor probleme (se efectueaz ă anchete sociologice, demografice, psihosociale, de marketing). Este posibilă folosirea, deopotriv ă, a sondajului statistic, cât ş i a anchetei statistice (exemplu: în studiul cererii de mărfuri a populaţ iei).

Panelul este, de asemenea, o metodă de observare parţ ial ă, bazat ă pe un eş antion stabil (fix), format dintr-un număr de persoane de la care se ob ţ in date conform metodei longitudinale, prin chestionare la diferite momente de timp.

Monografia statistică face parte din categoria observ ărilor parţ iale, special organizate, având ca obiect cunoaş terea multilaterală ş i în profunzime a unei singure unit ăţ i complexe. Are, de regul ă, un caracter multidisciplinar (exemplu: monografia unei întreprinderi, a unei localităţ i, sau judeţ ).

1.10. ERORI STATISTICE Ş I CONTROLUL DATELOR STATISTICE

Datorit ă volumului foarte mare de date cu care opereaz ă statistica, este firesc s ă apar ă, uneori, ş i erori. De aceea, în urma culegerii datelor, informa ţ iile obţ inute sunt supuse unui proces de control ş i corectare, în scopul depist ării ş i eliminării, pe cât posibil, a erorilor statistice.

DEFINI Ţ IE: Prin eroare statistică înţ elegem, în sens larg, diferen ţ a dintre nivelul real al unui indicator ş i cel rezultat din investigaţ ia statistică.

STATISTICĂ ECONOMICĂ

Erorile de observare (înregistrare) se întâlnesc în procesul de culegere a datelor statistice ş i se pot datora obiectului observării, anchetatorului, mijloacelor de înregistrare, metodei de culegere a datelor sau condi ţ iilor externe. Aceste erori pot fi de două feluri: întâmplătoare ş i sistematice. Erorile de observare pot fi înl ăturate prin controlul statistic.

DEFINI Ţ IE: Controlul datelor statistice este o operaţ ie intermediară, prin care se trece de la observarea de masă la prelucrarea datelor statistice.

Controlul datelor în etapa observă rii poate fi:

cantitativ;

calitativ

Controlul cantitativ este un control de volum al datelor, prin care se verifică completitudinea acestora. Acest control presupune:

verificarea primirii tuturor formularelor la centrul de prelucrare;

verificarea completării rubricilor.

Controlul calitativ presupune verificarea naturii calitative a datelor culese. Acesta poate fi:

control aritmetic;

control logic.

CAPITOLUL 1

Întrebă ri recapitulative

1.

Care sunt semnificaţ iile cuvântului statistică?

2.

Care sunt principalele momente în dezvoltarea statisticii moderne?

3.

Ce reprezint ă statistica descriptivă? Dar statistica inferenţ ial ă?

4.

Ce este statistica?

5.

Care este obiectul de studiu al statisticii?

6.

Care este principiul fundamental al statisticii?

7.

Care sunt principalele concepte folosite în statistică?

8.

Ce este colectivitatea statistică?

9.

Ce reprezint ă inferenţ a statistică?

10.

Ce este caracteristica statistică?

11.

Principalele clasific ări ale variabilelor statistice

12.

Ce sunt datele statistice?

13.

Care este diferenţ a dintre variabilă statistică ş i variantă statistică?

14.

Cum se stabileş te frecvenţ a de apari ţ ie a unei variante?

15.

Ce reprezint ă parametrul statistic?

16.

Ce reprezint ă estimatorul statistic?

17.

Care sunt principalele etape ale cercetării statistice?

18.

Ce tipuri de date statistice cunoaş teţ i? Exemplificaţ i.

19.

Ce semnificaţ ie are scala de m ăsurare?

20.

Arătaţ i principalele tipuri de scale de măsurare.

21.

Când se utilizeaz ă scala nominal ă în m ăsurarea valorilor caracteristicilor

statistice?

22. Prezentaţ i proprietăţ ile scalei ordinale.

23. Defini ţ i scala de interval ş i scala de raport. Exemple de utilizare.

24. Ce reprezint ă observarea statistică? În ce const ă importanţ a ei?

25. Care sunt elementele planului de observare?

26. Prezentaţ i recens ământul statistic.

27. Care sunt principalele procedee de eş antionare aleatoare?

28. Ce reprezint ă stratificarea?

29. Cum se realizeaz ă un sondaj în cuiburi?

30. Care sunt principalele metode de sondaj nealeator?

31. Defini ţ i conceptul de eroare statistică.

32. Arătaţ i principalele tipuri de erori statistice.

33. Cum se efectueaz ă controlul datelor statistice?

34. Cum se realizeaz ă controlul automat al datelor statistice?