Sunteți pe pagina 1din 44

Capitolul 2

CULEGEREA ŞI PRELUCRAREA PRIMARĂ A DATELOR STATISTICE

2.1 ETAPELE CERCETĂRII STATISTICE

Activitatea statistică este orientată în sensul cunoaşterii fenome- nelor de masă din economie şi societate, răspunzând nevoii de informaţii la nivel micro şi macroeconomic. Pentru a satisface aceste cerinţe, cercetarea (investigaţia) statistică este organizată după un program riguros, cuprinzând mai multe etape, într-o succesiune logică. Astfel, cercetarea statistică cuprinde totalitatea operaţiilor de culegere, sistema- tizare, grupare, prelucrare, analiză şi interpretare a datelor şi informaţiilor necesare pentru cunoaşterea fenomenelor şi proceselor economico- sociale. Acest proces amplu şi complex poate fi structurat în trei etape succesive: observare, prelucrare şi analiză. Observarea este prima fază a demersului statistic şi are rolul de a asigura datele necesare investigaţiei. Observarea presupune o analiză teoretică prealabilă, prin care este definită şi delimitată colectivitatea statistică supusă analizei, se identifică unităţile statistice şi sunt selectate caracteristicile de înregistrare care satisfac cel mai bine cerinţele analizei. în continuare este elaborat programul observării, care clarifică problemele metodologice şi organizatorice, apoi se trece la culegerea propriu-zisă a datelor.

Prelucrarea statistică începe cu centralizarea, gruparea datelor observării ca etapă pregătitoare în vederea aplicării metodelor şi tehnicilor specifice statisticii. În urma prelucrării se obţin indicatorii statistici. Mijloacele electronice de calcul permit în prezent prelucrarea unui mare volum de date individuale, care este concentrat în indicatori sintetici, mărimi ce evidenţiază esenţa proceselor şi fenomenelor analizate. Datele statistice sunt prezentate sub formă de tabele, serii şi grafice. Analiza şi interpretarea rezultatelor reprezintă ultima etapă a demersului statistic şi, totodată, încununarea eforturilor din etapele

STATISTICA

anterioare, de regulă, laborioase şi îndelungate. Comparând rezultatele prelucrării şi verificând ipotezele, se pot formula în final concluzii şi explicaţii asupra obiectului cercetării. Totodată, se fundamentează calculele de prognoză privind fenomenul analizat. Deşi separate în timp şi spaţiu, cele trei etape ale cercetării statis- tice sunt legate logic prin obiectul cercetării. Observarea trebuie să furnizeze un volum suficient de date de calitate corespunzătoare, care să asigure conţinut real indicatorilor obţinuţi în etapa prelucrării. Alegerea celor mai potrivite metode de prelucrare şi utilizarea lor în funcţie de particularităţile domeniului respectiv permit calcularea unor indicatori care surprind esenţa fenomenului investigat. Corectitudinea concluziilor finale se bazează pe autenticitatea datelor şi precizia prelucrării.

2.2 PROIECTAREA OBSERVĂRII STATISTICE

Observarea este prima fază a cercetării statistice şi constă în înregistrarea, după criterii unitare, a datelor individuale cu privire la fenomenul studiat. Reuşita acestei etape depinde de înregistrarea corectă a unui volum suficient de date relevante pentru studiul respectiv. Culegerea datelor trebuie să se realizeze la nivelul fiecărei unităţi a colectivităţii. Pentru a asigura buna desfăşurare a acestei activităţi, observarea statistică trebuie organizată după un program care cuprinde o serie de elemente metodologice şi organizatorice. a) Stabilirea scopului observării, care precizează aspectele ce trebuie clarificate în urma studiului. Scopul observării este subordonat scopului general al cercetării statistice şi formularea sa exactă orientează întregul demers statistic, care este format dintr-o succesiune de operaţiuni intercondiţionate. Din această perspectivă vor fi selectate doar informaţiile cu adevărat necesare, care vor fi supuse prelucrărilor ulterioare. b) Obiectul observării este reprezentat de colectivitatea statistică despre care urmează să se culeagă date. Aceasta coincide cu colectivitatea statistică generală, în cazul observărilor totale, sau este o subcolectivitate a acesteia, în cazul observărilor parţiale. Colectivitatea supusă observării trebuie definită şi delimitată în timp şi spaţiu. Colectivităţile complexe şi de volum mare pot fi observate pe subcolectivităţi.

Culegerea şi prelucrarea primară a datelor statistice

c) Unităţile de observare sunt componentele individuale distincte ale colectivităţii generale. Unităţile de observare pot fi simple sau complexe, statice sau dinamice. Definirea lor clară şi concisă asigură înregistrarea corectă a datelor.

d) Timpul observării este momentul sau perioada producerii fenomenului analizat. Pentru observările statice este un "moment critic", care este bine să corespundă unei maxime stabilităţi a colectivităţii analizate. Pentru înregistrările dinamice, timpul observării reprezintă o perioadă de timp.

e) Momentul în care se face înregistrarea datelor este ulterior timpului observării, dar poate să coincidă cu acesta dacă înregistrarea se face odată cu producerea fenomenului. În prelucrarea datelor se reţine numai timpul observării.

f) Caracteristicile observării sunt acele trăsături, proprietăţi esenţiale ale colectivităţii care au fost selectate pentru a fi înregistrate în formulare. Este important să fie înregistrate caracteristicile relevante din punctul de vedere al scopului cercetării. Deseori, caracteristicile se trec în programul observării sub formă de întrebări. Acestea pot fi cu răspunsuri deschise (se admite orice variantă de răspuns) sau închise (răspunsuri listate).

g) Formularele observării, însoţite de instrucţiuni de completare, asigură culegerea datelor într-o formă unitară, sistematizată, facilitând prelucrările ulterioare.

h) Locul observării este de regulă chiar locul producerii feno-

menului. Diferă de acesta atunci când datele sunt preluate din diferite publicaţii, din evidenţe contabile etc. Buna desfăşurare a observării impune şi rezolvarea unor probleme organizatorice cum sunt: elaborarea listei unităţilor care vor fi supuse observării, instruirea persoanelor care vor efectua înregistrarea datelor, tipărirea şi difuzarea formularelor, operaţiuni de îndrumare şi control, popularizarea operaţiunilor etc.

STATISTICA

2.3 METODE DE OBSERVARE STATISTICĂ

Observarea se poate realiza prin înregistrarea directă a datelor sau indirect, fie prin interogare (pe bază de chestionar), fie prin preluarea datelor deja existente în documente contabile.

Observarea poate fi totală, dacă se includ toate unităţile colectivi- tăţii statistice (este cazul recensământului şi al raportărilor statistice) sau parţială, atunci când datele se înregistrează doar pentru un număr mai redus de unităţi statistice (sondaj). Observarea poate fi curentă, dacă datele se înregistrează permanent, pe măsură ce se produc evenimentele vizate, periodică, atunci când survine la anumite intervale de timp bine stabilite, şi special organizată, dacă se efectuează la intervale mari, neregulate, de timp. În practica statistică, metodele de observare folosite frecvent sunt:

rapoartele statistice;

cercetarea selectivă (sondajul);

recensământul;

ancheta statistică;

observarea părţii principale;

monografia.

Rapoartele statistice sunt documente oficiale, tipizate, prin care se obţin date referitoare la activitatea curentă a unităţilor economice. Ele cuprind informaţii privind cifra de afaceri, profit, capital fix, forţă de muncă, costuri de producţie etc. Agenţii economici sunt obligaţi să întocmească rapoartele statistice în forma analitică stabilită, folosind o metodologie unitară de calcul al indicatorilor. Numărul şi conţinutul rapoartelor statistice diferă de la un domeniu de activitate la altul. Reprezintă observări totale (sunt completate de toate unităţile economico- sociale) şi permanente (se completează în tot timpul anului, la termene fixe). Sistemul raportărilor statistice tinde să se restrângă în prezent, în favoarea sondajului statistic. Sondajul statistic reprezintă o înregistrare parţială, selectivă, care se aplică atunci când observarea totală fie nu este posibilă (de ex., la controlul calităţii produselor), fie nu este justificată economic (din cauza costurilor sau a duratei). Sondajul statistic presupune culegerea efectivă a datelor doar pentru o parte a colectivităţii totale (eşantion) aleasă astfel

Culegerea şi prelucrarea primară a datelor statistice

încât să fie reprezentativă faţă de colectivitatea de ansamblu, să prezinte aceleaşi trăsături esenţiale. Deşi implică o marjă de eroare, procedeul este larg răspândit în ţările cu economie de piaţă, unde există instituţii specializate în sondaj.

Recensământul este o observare totală, special organizată la intervale mari de timp (5-10 ani). Cea mai veche şi mai răspândită formă a sa o reprezintă studiul populaţiei; ulterior procedeul a fost folosit şi pentru industrie (de ex., recensământul capitalului fix), agricultură (recensământul animalelor), comerţ, alte domenii de activitate. Este un tip de observare statică, care se efectuează simultan la toate unităţile colectivităţii, consemnând situaţia existentă la un moment dat. Pentru a avea o imagine a dinamicii fenomenelor şi proceselor economice este necesară compararea datelor provenite de la mai multe recensăminte. În acest scop trebuie să se asigure metodologii unitare de înregistrare şi este necesar să fie respectate recomandările organismelor statistice internaţionale. Costul ridicat al recensământului, perioada îndelungată de pregătire necesară şi dificultăţile organizatorice explică tendinţa de creştere a intervalului de timp de la un recensământ la altul. În etapele intermediare, sondajul statistic asigură reactualizarea datelor. Ancheta statistică constă în culegerea datelor pe baza unor chestionare. La fel ca sondajul statistic, este o observare parţială, dar, bazându-se pe o completare benevolă a chestionarelor, nu asigură reprezentativitatea. Este o observare special organizată, de regulă cu ocazia unor târguri şi expoziţii, având o valoare orientativă privind tendinţa generală a fenomenelor. Observarea părţii principale este o metodă care se poate utiliza cu succes în colectivităţile inegal structurate pe grupe, care prezintă predominanţa uneia sau mai multor grupe. Observarea se limitează la această parte cu rol decisiv. Deşi mai puţin riguroasă, rapiditatea metodei o recomandă atunci când este suficientă o informare orientativă asupra colectivităţii generale. De exemplu, estimarea preliminată a producţiei industriale se poate baza doar pe rezultatele obţinute de întreprinderile semnificative din ramură. Monografia asigură o caracterizare multilaterală a unor unităţi statistice complexe. Programul observării este foarte amănunţit, permiţând o cunoaştere aprofundată a fenomenului analizat. De regulă,

STATISTICA

obiectul unei monografii îl constituie un oraş sau o regiune, o unitate sau o problemă economică.

2.4 ERORILE DE OBSERVARE ŞI CONTROLUL DATELOR

Eroarea, inerentă oricărei activităţi umane, survine şi în procesul înregistrării datelor observării, îndeosebi atunci când colectivitatea statistică este de dimensiuni mari şi sistemul de caracteristici diversificat. În funcţie de cauza care le produce şi după gravitatea lor, erorile au fost grupate în două categorii: sistematice şi întâmplătoare. 1. Erorile sistematice au o incidenţă redusă, dar afectează într-o măsură însemnată autenticitatea datelor culese. Ele provin, de regulă, din interpretarea incorectă a instrucţiunilor de culegere a datelor, neînţele- gerea scopului observării sau necunoaşterea unor noţiuni; acestea conduc la înscrierea repetată în formularele observării a unor informaţii neconforme cu realitatea. Amploarea erorilor sistematice este direct proporţională cu volumul colectivităţii observate. Erorile sistematice pot fi prevenite printr-o mai bună instruire a personalului care efectuează observarea şi pot fi diminuate prin aplicarea riguroasă a controlului aritmetic şi logic. 2. Erorile întâmplătoare au caracter aleator şi survin, de regulă, datorită lipsei de concentrare a persoanei care efectuează înregistrarea, copierea sau codificarea datelor. Deşi apare relativ frecvent, acest tip de eroare influenţează doar în mică măsură acurateţea rezultatelor de ansamblu; explicaţia acestui efect redus este dată de faptul că erorile întâmplătoare se manifestă sub forma unor abateri (atât pozitive, cât şi negative) de la valorile reale, compensându-se pentru colectivităţi de dimensiuni mari. Operaţiunile de control al datelor urmăresc depistarea şi înlăturarea eventualelor erori. Controlul vizează aspectul cantitativ şi pe cel calitativ. Controlul cantitativ se referă la completitudinea datelor. Se urmăreşte dacă s-au strâns formularele de la toate unităţile supuse observării şi se verifică dacă au fost completate toate rubricile din formulare.

Culegerea şi prelucrarea primară a datelor statistice

Controlul calitativ vizează verificarea relaţiilor cantitative exis- tente între mărimile economice, a marjei de valori admisibile pentru anumiţi indicatori şi concordanţa între valorile acelor fenomene între care există legături de interdependenţă.

2.5 PRELUCRAREA PRIMARĂ A DATELOR STATISTICE

Datele statistice obţinute în timpul observării sunt, de regulă,

variate şi de volum mare. Ele trebuie sistematizate, centralizate şi grupate pentru a fi pregătite în vederea prelucrării. Numai în urma prelucrării statistice pot fi evidenţiate trăsăturile şi tendinţele esenţiale din evoluţia fenomenelor şi proceselor economico-sociale. Prelucrarea primară a datelor statistice culese cuprinde operaţiile de clasificare, grupare, centralizare, agregare, calcul de caracteristici derivate, precum şi construirea de tabele, serii şi grafice statistice. Prima fază a prelucrării primare o reprezintă sistematizarea datelor sub formă matriceală (tabelul 2.5.1), astfel:

- pe fiecare linie sunt evidenţiate variantele tuturor caracteristicilor

înregistrate (X 1 , …, X j , …, X m ) referitoare la o unitate statistică (U i ) a colectivităţii supuse observării: x i1 , …, x ij , …, x im ;

- fiecare coloană surprinde variantele unei anumite caracteristici

X j , înregistrate pentru toate unităţile (U 1 , …, U i , …, U n ) colectivităţii statistice: x 1j , …, x ij , … x nj . Elementele matricei pot lua valori pozitive sau negative; de asemenea, se pot întâlni valori nule.

Tabelul 2.5.1

Unităţi

 

Caracteristici statistice

 

statistice

X

1

X

j

X

m

U

1

x

11

x

1j

x

1m

 

 

   

U

j

x

i1

 

x

ij

 

x

im

 

 

   

U

n

x

n1

 

x

nj

 

x

nm

STATISTICA

Datele primare sunt prelucrate în continuare, obţinându-se caracteristici derivate. Calcularea mărimilor derivate se realizează prin operaţiuni diferite:

ca produs între două caracteristici primare (de exemplu, valoarea producţiei calculată ca produs între preţ şi producţia fizică);

ca sumă sau diferenţă între două sau mai multe caracteristici primare (de exemplu, formarea brută de capital fix plus variaţia stocurilor dă formarea brută de capital, iar produsul naţional brut minus amortizarea dă produsul naţional net);

ca raport între două caracteristici primare (mărimile relative).

Datele statistice diferă între ele şi în funcţie de modul de măsurare. În teoria statistică au fost evidenţiate mai multe procedee de măsurare a datelor:

a) Scala nominală se referă la caracteristicile cu formă calitativă exprimată prin cuvinte (de exemplu: meserii, stare civilă, ramuri şi subramuri ale economiei naţionale, domenii de activitate etc.). Pentru aceste caracteristici se poate atribui o valoare numerică fiecărei variante, cu sensul de codificare (de exemplu: codificarea ramurilor economiei naţionale, codificarea activităţilor economice sau codificarea stării civile în cadrul codului numeric personal din buletinul de identitate). Nu sunt posibile operaţii matematice cu aceste valori numerice asociate variantelor.

b) Scala ordinală se utilizează tot pentru caracteristici necuantifi- cabile, dar care permit ierarhizarea variantelor. Aceste caracteristici sunt ordonate crescător sau descrescător, acordându-i-se fiecăreia un număr (rang) care reflectă poziţia sa în şir. Exemple: clasele de calitate ale produselor, calificativele acordate elevilor din ciclul primar (nesatisfăcător, satisfăcător, bine şi foarte bine), numărul de stele atribuite unităţilor de alimentaţie publică şi hoteliere (de la 1 la 5 stele). Rangurile pot fi folosite în unele modele de calcul statistic, respectându-se anumite restricţii.

c) Scala de interval este folosită pentru caracteristici numerice cărora le corespund anumite valori, în funcţie de intervalul

Culegerea şi prelucrarea primară a datelor statistice

dintre variante. Originea scalei şi unitatea de măsură se aleg arbitrar. Admisibile pentru acest tip de caracteristici sunt numai operaţii de diferenţă între valori, precum şi calcule cu aceste diferenţe. Exemple: timpul calendaristic, temperatura etc. d) Scala de raport, ca şi cea de interval, este folosită pentru caracteristici numerice. Două valori măsurate prin intermediul acestei scale se află în acelaşi raport, indiferent de unitatea de măsură utilizată (de exemplu raportul salariilor pentru doi angajaţi între care se face comparaţie este acelaşi indiferent de moneda folosită) . Pentru acest tip de caracteristici sunt permise toate operaţiile matematice. Punctul zero al scalei este dat în mod natural. Unitatea de măsură se alege arbitrar (de exemplu, cifra de afaceri se poate exprima în mii, milioane sau miliarde de lei, în monedă naţională sau în diferite valute) . Operaţiile de prelucrare primară sunt permanent însoţite de analiza datelor statistice, în scopul identificării trăsăturilor definitorii ale datelor primare, al orientării procesului de prelucrare statistică, al alegerii celor mai potrivite metode şi tehnici statistice. Caracterul ei cuprinzător, varietatea aspectelor implicate şi multitudinea cunoştinţelor ştiinţifice şi practice solicitate în acest proces justifică denumirea sa de “analiză multidimensională”. Prima fază a acestei analize este reprezentată de ordonarea, crescătoare sau descrescătoare, a valorilor distincte ale caracteristicii. Aceste valori sunt însoţite, în cazul seriilor de frecvenţe, de mărimi care arată numărul de apariţii al fiecărei variante a caracteristicii. Următoarea fază constă în clasificarea şi/sau gruparea datelor statistice, operaţii care permit ordonarea materialului statistic.

2.6 CLASIFICAREA ŞI GRUPAREA DATELOR STATISTICE

Pornind de la trăsăturile comune ale unităţilor colectivităţii obser- vate, acestea sunt repartizate în clase bine definite, cu caracter omogen. Această operaţie permite restrângerea volumului mare de date iniţiale şi evidenţiază structura colectivităţii analizate. Prin grupare se pierde o parte din informaţia iniţială, în schimb se înlesneşte cunoaşterea proprietăţilor

STATISTICA

esenţiale ale colectivităţii şi înţelegerea legăturilor dintre caracteristicile utilizate. Prin clasificare şi grupare, datele observării sunt sistematizate în funcţie de variaţia uneia sau mai multor caracteristici. Clasificarea trebuie să respecte mai multe reguli:

a) completitudinea se referă la cerinţa ca toate unităţile statistice să fie incluse în clasele formate în urma clasificării;

b) omogenitatea reprezintă condiţia de a include într-o clasă numai elemente de acelaşi tip;

c) unicitatea clasificării impune ca fiecare element să aparţină unei singure clase;

d) continuitatea variaţiei cere să nu existe clase cu frecvenţă nulă în cazul variabilelor cu variaţie continuă.

Există mai multe tipuri de clasificări:

a) clasificare ierarhică, pe două sau mai multe niveluri de agre- gare;

b) repartizarea unităţilor colectivităţii într-un număr prestabilit de clase;

c) clasificare geometrică.

Statistica naţională utilizează un sistem standardizat de clasificări şi nomenclatoare economico-sociale. Acesta cuprinde:

clasificarea ramurilor economiei naţionale: agricultură, industrie, construcţii, comerţ etc.;

clasificarea unitară a produselor şi serviciilor;

clasificarea ocupaţiilor: profesii, funcţii, meserii;

clasificarea mijloacelor fixe;

nomenclatorul unitar al indicatorilor economico-sociali;

sistemul informatic registru al unităţilor teritorial- administrative. Gruparea datelor statistice constă în împărţirea unităţilor colec- tivităţii în ansambluri omogene, bine definite, după variaţia uneia sau mai multor caracteristici (numite factori de grupare). O grupă omogenă este formată din ansamblul unităţilor statistice care prezintă cel puţin o proprietate comună. Omogenitatea grupelor este asigurată şi de o variaţie redusă a valorilor individuale în cadrul fiecărei grupe. Pentru a asigura o grupare corectă şi semnificativă se impune selecţionarea caracteristicilor esenţiale, cu caracter stabil. Alegerea

Culegerea şi prelucrarea primară a datelor statistice

caracteristicilor diferă în funcţie de scopul analizei. De exemplu, dacă se analizează productivitatea muncitorilor dintr-o secţie, vom urmări vechi- mea, calificarea, vârsta, dotarea tehnică etc., iar dacă se studiază poten- ţialul unei unităţi economice, vom alege caracteristicile cifră de afaceri, profit, număr de personal, capital fix etc. Există numeroase tipuri de grupări statistice, diferenţiate după mai multe criterii.

1. În funcţie de numărul caracteristicilor utilizate, grupările pot fi simple sau combinate.

Grupările simple sunt cele realizate după o singură caracte- ristică de grupare. De exemplu: gruparea salariaţilor după venitul realizat sau gruparea judeţelor după numărul populaţiei.

Grupările combinate vizează simultan două sau mai multe caracteristici de grupare, simultan (tabelul 2.6.1). Gruparea se realizează etapizat: se alege o primă caracteristică după care se efectuează gruparea unităţilor colectivităţii şi fiecare grupă astfel obţinută se împarte la rândul ei în subgrupe după variaţia celei de a doua caracteristici, apoi se repetă procedeul pentru cea de a treia caracteristică de grupare ş.a.m.d.

Gruparea combinată după două caracteristici de grupare

Tabelul 2.6.1

Caracteristica X

Caracteristica Y

Frecvenţe combinate

 

y

11

n

11

y

12

n

12

x

1

 

y

1j

n

1j

y

1m

n

1m

Total grupa 1

 

-

n .=

1

m

n

 
 

1 j

 

j= 1

 

 

 

y

i1

n

i1

y

i2

n

i2

x

i

STATISTICA

Caracteristica X

Caracteristica Y

Frecvenţe combinate

 

y

ij

 

n

ij

 

y

im

n

im

Total grupa i

-

 

m

 
 

n

i.

=

n

ij

   

j= 1

 

 

 
 

y

k1

 

n

k1

 

y

k2

n

k2

x

k

 

y

kj

n

kj

 

y

km

n

km

 

Total grupa k

-

 

m

 

n

k .

=

n

kj

   

j= 1

 

Total general

 

k

m

k

-

∑∑ ∑

n

ij

=

n

i.

=

n

 

i= 1

j=

1

i

= 1

Deoarece o fărâmiţare excesivă a colectivităţii ar anula semnificaţia grupării şi ar face imposibilă analiza, în practică se utilizează maximum trei caracteristici pentru gruparea combinată. De exemplu, gruparea populaţiei după vârstă, stare civilă şi sex. 2. După conţinutul caracteristicii de grupare deosebim grupări cronologice, teritoriale şi atributive. Grupările cronologice se referă la variaţia în timp a fenomenului analizat. În funcţie de scopul analizei, mărimea intervalului de timp utilizat în grupare diferă: zi, lună, trimestru, an etc. De exemplu: producţia zilnică realizată de muncitorii dintr-o secţie, cheltuieli lunare de producţie, profitul anual. Grupările teritoriale oglindesc variaţia în spaţiu a unităţilor colectivităţii. De regulă, aceste grupări corespund unităţilor teritorial-ad-ministrative. Exemple: gruparea producţiei agricole pe judeţe, desfaceri cu amănuntul pe principalele oraşe ale ţării, relaţii de import/export pe zone geografice şi ţări.

Culegerea şi prelucrarea primară a datelor statistice

Gruparea după o caracteristică atributivă prezintă două variante:

- caracteristică exprimată prin cuvinte: gruparea producţiei pe ramuri economice, gruparea salariaţilor unei unităţi economice pe meserii etc. - caracteristică exprimată numeric: gruparea societăţilor comer- ciale după cifra de afaceri, gruparea familiilor după numărul de copii etc.

3. După modul de variaţie a caracteristicii, gruparea se poate face pe variante, pe intervale egale de variaţie sau pe intervale inegale de variaţie.

Gruparea pe variante presupune stabilirea unei grupe pentru fiecare valoare luată de caracteristica de grupare. Acest lucru este posibil atunci când numărul variantelor este redus. De exemplu: gruparea apartamentelor după numărul de camere, gruparea populaţiei după starea civilă, gruparea salariaţilor după sex, gruparea studenţilor după tipul liceului absolvit etc.

Gruparea pe intervale de variaţie se utilizează în cazul caracteristicilor numerice care înregistrează un număr mare de valori individuale diferite. Pentru a facilita analiza statistică, aceste valori sunt restrânse, sistematizate într-un număr redus de grupe. Fiecare grupă astfel constituită include unităţile colectivităţii pentru care valoarea caracteristicii se încadrează într-un anumit interval de valori. Aceste intervale de variaţie pot fi de mărimi egale (de exemplu, gruparea după vârstă pe intervale de câte cinci ani, gruparea secţiilor după producţie pe intervale de câte 10 milioane lei etc.) sau nu. Gruparea în intervale de mărimi inegale este justificată numai atunci când repartiţia valorilor individuale în cadrul colectivităţii este neuniformă sau atunci când o parte a colectivităţii statistice prezintă un interes deosebit, fiind necesară o analiză mai detaliată a acesteia. Gruparea pe intervale neegale permite evidenţierea tipurilor calitative care se conturează în cadrul colectivităţii.

STATISTICA

O importanţă deosebită o are problema alegerii mărimii intervalului de grupare şi stabilirea numărului de grupe. Alegerea numărului de grupe trebuie să evite două erori frecvente:

stabilirea unui număr prea mare de grupe, ceea ce conduce la fărâmiţarea colectivităţii, cu consecinţe negative atât pe planul identificării trăsăturilor esenţiale ale fenomenului analizat, cât şi pe planul calculelor statistice ulterioare, care devin mai laborioase;

stabilirea unui număr prea mic de grupe prezintă pericolul estompării deosebirilor calitative din cadrul structurii colecti- vităţii, alterând concluziile analizei. Aşadar, alegerea numărului de grupe este o decizie dificilă care implică experienţa şi talentul statisticianului. Acesta trebuie să aibă în vedere natura caracteristicii, amplitudinea variaţiei valorilor înregistrate, scopul analizei statistice etc. Fiecare interval de grupare trebuie să cuprindă un număr suficient de mare de valori individuale. Gruparea pe intervale egale presupune următoarele opera-

ţiuni:

stabilirea caracteristicii de grupare;

calcularea amplitudinii variaţiei;

stabilirea mărimii intervalului de grupare;

precizarea limitelor superioare şi inferioare ale intervalelor de grupare;

determinarea numărului unităţilor statistice care sunt incluse în fiecare interval. Amplitudinea variaţiei (A) se stabileşte ca diferenţă între valoarea maximă (x max ) şi valoarea minimă (x min ) înregistrată de caracteristica respectivă:

A = x max - x min

Mărimea intervalului de grupare (h) se determină pe baza raportului dintre amplitudinea variaţiei (A) şi numărul de grupe (h) ales:

x

A

h =

x

max

min

=

k

k

Culegerea şi prelucrarea primară a datelor statistice

Atunci când câtul împărţirii nu este un număr întreg se rotunjeşte în plus pentru a nu rămâne valori în afara ultimului interval de grupare. Pentru determinarea mărimii intervalului de grupare se poate utiliza şi formula lui Sturges, recomandată în literatura de specialitate pentru colectivităţile de dimensiuni relativ mari, urmărind o distribuţie apropiată de cea normală. Astfel:

unde:

h

x

max

x

min

= 1

+

3 322

,

lg n

n - numărul unităţilor statistice din colectivitatea analizată.

Intervalele de grupare se definesc prin precizarea limitei inferioare şi superioare. Determinarea primului interval de grupare porneşte de la valoarea minimă a caracteristicii (limita inferioară) la care se adaugă mărimea intervalului de grupare, obţinându-se limita superioară. În cazul caracteristicilor cu variaţie continuă, limita superioară a primului interval devine limita inferioară a celui de-al doilea interval. Limita superioară a intervalului al doilea se obţine adăugând mărimea intervalului la limita inferioară. Limita superioară a intervalului al doilea devine limita inferioară pentru al treilea interval şi procedeul continuă până când se precizează limitele tuturor celor k intervale (vezi tabelul 2.6.2, prima coloană). Întrucât gruparea are variaţie continuă, este necesar să se precizeze care din cele două limite (inferioară sau superioară) este inclusă în interval. În acest fel ne asigurăm că o valoare situată la graniţa dintre două intervale va fi inclusă într-un singur interval, respectându-se unicitatea grupării. În cazul caracteristicilor cu variaţie discretă, limita superioară a unui interval se diferenţiază de limita inferioară a intervalului următor (tabelul 2.6.2, coloana a treia).

STATISTICA

Gruparea cu variaţie continuă şi discretă

Tabelul 2.6.2

Grupare continuă

 

Grupare discretă

 

1

 

2

3

4

Intervale

Nr. unităţi

Intervale

Nr. unităţi

(L i < x i L i+1 )

(l i x i l i+1 )

L 1 - L 2 L 2 - L 3

 

f

1

l 1 - l 2

n

1

f

2

l 3 - l 4

n

2

 

L i - L i+1 L i+1 - L i+2

f

i

l i - l i+1

n

i

f

i+1

l i+2 - l i+3

n

i+1

 

L k-1 - L k

f

k

l k-1 - l k

n

k

Total

k

Total

k

f

i

n

i

i = 1

i = 1

În practica statistică se întâlnesc deseori situaţii în care valorile extreme ale caracteristicii (x min şi x max ) sunt foarte îndepărtate de restul valorilor. În acest caz valorile extreme pot fi omise, iar primul şi ultimul interval devin intervale deschise (nu este precizată limita inferioară a primului interval şi nici limita superioară a ultimului interval). Atunci când prelucrările ulterioare o impun, aceste intervale pot fi închise, fiind considerate de lungime egală cu intervalele vecine. Lungimea fiecărui interval este dată de diferenţa dintre cele două limite. Se recomandă ca limitele de interval să se exprime prin numere

întregi.

Gruparea pe intervale neegale este preferabilă în cazul colectivi- tăţilor de dimensiuni mari, cu structură neomogenă şi cu o amplitudine a variaţiei foarte mare. O bună grupare pe intervale neegale depinde de acurateţea analizei calitative asupra structurii şi particularităţilor colectivităţii. Gruparea tipologică este o grupare pe intervale neegale care pune în evidenţă tipurile calitative reprezentative pentru colectivitatea analizată. Această operaţiune poate fi precedată de o grupare pe mai multe intervale egale. Intervalele egale sunt reunite apoi pe baza unui anumit

Culegerea şi prelucrarea primară a datelor statistice

criteriu. De exemplu, folosind criteriul mediei, vom defini tipul "mediu" unind intervalul în care se află media cu cele două intervale alăturate. În cele ce urmează, vom ilustra modalităţile de grupare a datelor pe intervale egale şi neegale folosind următoarele mărimi ale producţiei realizate (număr bucăţi) într-o lună de către cei 65 de muncitori ai unei unităţi industriale:

61, 66, 56, 71, 73, 67, 76, 69, 66, 77, 81, 69, 58, 50, 59, 74, 64, 71, 76, 63, 51, 73, 61, 64, 67, 64, 66, 69, 63, 72, 78, 82, 67, 57, 71, 83, 61, 73, 64, 58, 68, 62, 67, 63, 67, 69, 61, 79, 62, 68, 63, 67, 62, 68, 69, 66, 58, 72, 78, 67, 84, 66, 59, 73, 66.

Gruparea pe intervale egale

Producţia cea mai mică realizată în întreprindere a fost de 50 de bucăţi, iar cea mai mare de 84 de bucăţi. Amplitudinea variaţiei (A) este:

A = x max - x min = 84 - 50 = 34 bucăţi

Având în vedere amplitudinea variaţiei şi volumul colectivităţii, am stabilit un număr de 7 grupe. Împărţind amplitudinea variaţiei la numărul de grupe ales (k), determinăm mărimea intervalelor egale de variaţie (h):

h

=

A

k

=

34

7

=

4 857

,

5

bucăţi

Natura datelor ne indică să folosim intervale de variaţie discrete. Limitele intervalelor de grupare şi numărul muncitorilor din fiecare grupă (frecvenţele absolute) sunt prezentate în tabelul 2.6.3.

STATISTICA

Gruparea muncitorilor după producţia lunară realizată

Tabelul 2.6.3

- intervale egale -

Grupe de muncitori după producţie (bucăţi)

Nr. muncitori

Producţie cumulată (bucăţi)

50

- 54

2

101

55

- 59

7

405

60

- 64

15

913

65

- 69

21

1407

70

- 74

10

754

75

- 79

6

462

80

- 84

4

328

Total

65

4370

Date convenţionale.

Gruparea pe intervale neegale În continuare vom regrupa muncitorii astfel încât să evidenţiem trei tipuri calitative din punct de vedere al producţiei realizate: mic, mijlociu, mare. Folosind criteriul mediei, definim tipul mijlociu prin reunirea a trei intervale: intervalul care conţine media (65 - 69) şi cele două intervale alăturate (60 - 64 şi 70 - 74). Noua grupare este prezentată în tabelul 2.6.4.

Gruparea muncitorilor după producţia realizată

Tabelul 2.6.4.

- intervale neegale -

 

Producţia lunară

Intervale

Nr. muncitori

Producţia cumulată (bucăţi)

 

(bucăţi)

-

mică

50

- 59

9

506

-

mijlocie

60

- 74

46

3074

-

mare

75

- 84

10

790

Total

 

-

65

4370

Culegerea şi prelucrarea primară a datelor statistice

2.7 PREZENTAREA DATELOR STATISTICE

2.7.1 Tabele statistice

În scopul unei prezentări ordonate, sugestive a informaţiilor şi

pentru sistematizarea datelor în vederea prelucrării, în statistică sunt frecvent utilizate tabelele. Tabelele sunt formate dintr-o reţea de rubrici conţinând date numerice şi text care permit caracterizarea statistică a fenomenului studiat

în condiţii specifice de timp şi spaţiu.

În continuare sunt prezentate elementele obligatorii de conţinut şi

de formă pe care le regăsim într-un tabel, cu exemplificare pe tabelul

2.7.1.

Titlul tabelului precizează caracteristica sau caracteristicile principale la care se referă datele prezentate; pe lângă acest titlu general, în interiorul tabelului pot exista subtitluri, care se referă la elementele componente ale subiectului şi predicatului.

Subiectul este reprezentat de colectivitatea statistică supusă analizei şi se înscrie în capetele rândurilor; în exemplul consi- derat subiectul este reprezentat de grupele de ţări în care exportă România.

Predicatul este format din sistemul de caracteristici pentru care s-a făcut centralizarea datelor. Acestea se înscriu în capetele coloanelor. În tabelul 2.7.1 predicatul este valoarea exportului.

Unitatea de măsură se înscrie distinct pentru fiecare caracte- ristică în coloana respectivă. Dacă este comună tuturor datelor se trece deasupra tabelului, în dreapta.

Sursa de date.

Notele explicative sunt utilizate atunci când este necesar să se clarifice unele abordări metodologice sau noţiuni mai puţin cunoscute. Deoarece în tabel nu pot exista rubrici necompletate, atunci când

nu se cunosc anumite date, în locul lor se înscrie semnul “…”, iar dacă valoarea respectivă nu poate exista, rubrica conţine semnul “ - “.

O altă regulă de întocmire a tabelelor se referă la alegerea

unităţilor de măsură în funcţie de tipul şi gradul de variaţie a mărimii datelor, astfel încât înscrierea lor în tabel să fie convenabilă. De exemplu,

STATISTICA

producţia se va exprima în mii sau milioane lei la nivelul unei societăţi comerciale, dar în miliarde lei la nivelul ramurii sau al ansamblului economiei; personalul unei unităţi economice poate fi exprimat în unităţi

sau

zeci, dar populaţia ocupată pe ramuri şi pe economie se măsoară în

mii

sau milioane de persoane. Corespunzător varietăţii de grupări posibile, există mai multe

tipuri de tabele statistice.

Tabelul descriptiv este utilizat pentru înregistrarea şi prezentarea datelor primare în etapa culegerii datelor. Tabelul simplu înscrie indicatori statistici ordonaţi din punct de vedere cronologic, teritorial sau organizatoric. Exemplu: tabelul 2.7.1.

Exportul României pe grupe de ţări în luna ianuarie 2002

Tabelul 2.7.1

Exporturi FOB

(mil. dolari)

Uniunea Europeană Ţări din Europa Centrală şi de Est Alte ţări

559,3

85,6

266,8

Total

911,7

Sursa: Buletin statistic lunar, Institutul Naţional de Statistică, nr. 1,2002.

Tabelul pe grupe prezintă rezultatele unei grupări simple cu centralizarea numărului unităţilor pe grupe (frecvenţe, vezi col. 1 a tab. 2.7.2.). Totodată, se centralizează pe grupe valorile unor caracteristici dependente de caracteristica de grupare (vezi tab. 2.7.2., col.2 şi col.3). Acest tip de tabel poate fi utilizat în analiza corelaţiei statistice întrucât evidenţiază legăturile dintre variaţia caracteristicii de grupare şi caracteristicile dependente. Exemplu: tabelul 2.7.2.

Principalii indicatori ai unităţilor de cercetare-dezvoltare în anul 2000

Tabelul 2.7.2

 

Număr unităţi

Număr

Cheltuieli

salariaţi *)

(mld. lei)

0

1

2

3

Sectorul întreprinderi Sectorul guvernamental Sectorul învăţământ superior

439

22541

5680

110

7571

1981

52

3780

349

Total

601

33892

8010

*) număr persoane în echivalent normă întreagă. Sursa: Anuarul statistic al României, anul 2001, p. 228 şi 232.

Culegerea şi prelucrarea primară a datelor statistice

Tabelul combinat reflectă o grupare a datelor după cel puţin două caracteristici. Acest tip de tabel permite atât analiza separată a formei de variaţie a celor două caracteristici luate independent, cât şi analiza legăturilor dintre ele. Oferă o bună sistematizare a datelor în vederea aplicării metodelor de calcul a corelaţiei. Exemplu: tabelul 2.7.3.

Situaţia şomerilor înregistraţi, pe categorii de personal, la sfârşitul lunii ianuarie 2002 Tabelul 2.7.3

Categorii de şomeri

Sex

Număr persoane

Muncitori

M

544584

F

378715

Total 1

923299

Cu studii medii

M

104864

F

135288

Total 2

240152

Cu studii superioare

M

14257

F

16013

Total 3

30270

Total general

1193721

Sursa: Buletin statistic lunar, Institutul Naţional de Statistică, nr. 1,2002.

Tabelul cu dublă intrare este o variantă a tabelului combinat care prezintă variaţia simultană a colectivităţii după două caracteristici:

una cauzală (factor de influenţă) şi cealaltă rezultativă (dependentă). Exemplificare: tabelul 2.7.4.

Distribuţia elevilor unei şcoli generale după vârstă şi înălţime Tabelul 2.7.4

Vârstă (ani) Total după 6-9 10-12 13-15 înălţime Înălţime (cm) 120-130 30 5 - 35
Vârstă (ani)
Total după
6-9
10-12
13-15
înălţime
Înălţime (cm)
120-130
30
5
-
35
130-140
50
120
-
170
140-150
28
180
50
258
150-160
-
75
175
250
160-170
-
40
210
250
Total după vârstă
108
420
435
963

Date convenţionale.

STATISTICA

Conţinutul acestui tabel îl formează frecvenţele exprimate pentru una din caracteristici (totalurile parţiale pe linii şi pe coloane) sau în funcţie de ambele caracteristici de grupare simultan (interiorul tabelului). De exemplu, numărul elevilor cu vârsta între 6 şi 9 ani, având înălţimea cuprinsă în intervalul 120-130 cm este de 30. Acest tabel permite să se evidenţieze atât variaţia celor două caracteristici analizate separat, cât şi legătura de interdependenţă dintre ele; din acest motiv este util pentru analiza legăturilor dintre variabile. O formă particulară a acestui tip de tabel o reprezintă tabelul de asociere (vezi tabelul 2.7.5), care se utilizează în cazul caracteristicilor alternative. Acestea sunt variabile care nu admit decât două forme de manifestare (candidat admis-respins, norme îndeplinite-neîndeplinite, produs bun-rebutat, familii cu copii-fără copii etc.).

Populaţia masculină şi feminină pe medii la 1 iulie 2000

Tabelul 2.7.5

Mediul

Populaţie

Total

feminină

masculină

(mii persoane)

urban

6.336,7

5.907,9

12.244,6

rural

5.129,6

5061,0

10.190,6

Total

11.466,3

10968,9

22.435,2

Sursa: Calcule pe baza Anuarului statistic al României, anul 2001, p.49,50 şi 52.

2.7.2 Serii statistice

În cadrul analizelor statistice datele se utilizează sub o formă ordonată, ca serii statistice. Seriile statistice pot fi formate din mărimi absolute sau mărimi derivate. Seria statistică se prezintă sub forma a două şiruri paralele, între care există o corespondenţă. Primul şir arată variaţia caracteristicii de grupare: valori, variante, intervale de variaţie. Al doilea şir reflectă frec- venţele de apariţie a valorilor precedente sau valorile unei alte caracteristici interdependente. Seria statistică se obţine prin operaţii de grupare sau clasificare sau prin descrierea evoluţiei unui fenomen în timp sau în spaţiu. Natura caracteristicii de grupare determină încadrarea seriei statistice într-una din

Culegerea şi prelucrarea primară a datelor statistice

următoarele categorii:

serii de timp;

serii teritoriale;

serii de distribuţie.

1. Seriile de timp (cronologice, dinamice) arată evoluţia în dinamică a fenomenului analizat. Forma lor generală de prezentare este ilustrată în tabelul 2.7.6.

Seria cronologică

Tabelul 2.7.6

Variabila timp (t i )

Caracteristica (y i )

t

1

y

1

t

2

y

2

t

n

y

n

Seriile cronologice pot fi de două tipuri: serii de intervale şi serii de momente. Seriile de intervale exprimă rezultatele activităţii depuse pe parcursul unei perioade de timp. De exemplu: producţ