Sunteți pe pagina 1din 52

CURSUL 2

Cercetarea statistic

Prin cercetare statistic, n funcie de scopul urmrit, se
culeg date care apoi se prelucreaz, pentru ca n final s
se obin, ntr-o form statistic, informaiile necesare
desfurrii procesului de conducere.
Pentru a obine aceste informaii, cercetarea statistic este
organizat dup un program riguros, amplu i complex
care cuprinde mai multe etape, ntr-o succesiune logic.
Aceste etape pot fi separate n timp i, de regul, se
efectueaz n locuri diferite i cu personal de diferite
specialiti.

Realizarea fiecrei etape impune o bun cunoatere a
fenomenelor i proceselor investigate, a modului de
organizare a colectivitii supuse cercetrii, a
posibilitilor concrete de folosire a surselor de informaii.
Deosebit de important este asigurarea autenticitii
datelor statistice n toate etapele cercetrii.
Schematic cele trei etape ale cercetrii statistice:
observarea statistic,
prelucrarea statistic
analiza i interpretarea statistic
i operaiile specifice fiecreia dintre ele pot fi prezentate
ca n figura 1 .
Adesea etapa prelucrrii datelor se mbin cu cea de
analiz, dat fiind c prelucrarea pe o treapt superioar
se efectueaz numai dup analiza rezultatelor obinute
n urma prelucrrii anterioare.
Figura 1 : Etapele i operaiile cercetrii statistice
1. Observarea statistic (culegerea datelor
statistice)
n scopul aplicrii metodelor statistice de analiz a
fenomenelor/proceselor este necesar s avem la dispoziie
date statistice. Putem s obinem aceste informaii din
datele deja publicate (de instituii specializate, de exemplu
Institutul Naional de Statistic), sau putem s construim un
experiment, o anchet, un sondaj etc.
Deci, o clasificare a surselor de date statistice poate fi: surse
secundare i respectiv surse primare de date.
Dac datele sunt preluate din documente sau publicaii
existente, prelucrate deja n scopuri publice sau private, ele
vor fi surse secundare.
Dac datele statistice sunt obinute direct prin organizarea
unei observri statistice, atunci persoana sau instituia la
care s-a realizat o astfel de observare este o surs primar
de date statistice.
Observarea statistic poate fi direct, prin observare n teren
i indirect prin observare documentar.

Observri directe. Acest tip de observare se realizeaz
prin nregistrarea nemijlocit a datelor de ctre operator
(cercettor) la unitile statistice ale colectivitii;
Observarea direct intervine n cazul nregistrrilor special
organizate, cnd se culeg / nregistreaz date pentru
fiecare unitate i pentru toate caracteristicile programului
observrii.
Observarea direct se poate realiza prin:
metoda interviului (scris si/sau oral).
Interviul n scris presupune ca unitile statistice investigate s
rspund n scris la caracteristicile statistice cuprinse n
programul observrii. Se remarc dou situaii:
- dac observarea este organizat de ctre statistica oficial
(public), unitile statistice sunt obligate prin lege s
raspund la chestionar;
- dac observarea este organizat de ctre statistica privat
(asociaii profesionale, institute de cercetare, camere de
comer, etc.), unitile statistice nu au obligaia legal de a
completa chestionarul. n acest caz rata de nonrspuns
poate fi destul de mare.
Interviul verbal se realizeaz n prezena unei persoane care
consemneaz rspunsurile unitilor n chestionar. Un
exemplu tipic pentru acest caz este recensamntul
populaiei.

observarea se folosete n situaiile cnd este necesar
numrarea (de ctre o persoan sau un aparat) anumitor
cantiti. Msurarea intensitii traficului, de exemplu,
presupune numrarea autoturismelor care trec printr-un
anumit punct de observare intr-un interval de timp.

metoda experimentului, ca modalitate de observare
statistic se aplic mai rar. Aceasta datorit faptului c
fenomenele i procesele economice i sociale nu sunt
fenomene certe.

Observri indirecte. Astfel de observri se ntlnesc
atunci cnd nregistrarea datelor se realizeaz pe baza
unor surse care au consemnat anterior fenomenul studiat.
Observarea indirect presupune deci preluarea datelor
nregistrate n diferite documente (contabile, de regul),
lucrri publicate anterior (cari, publicaii periodice de
specialitate, pagini web).
Observarea indirecta are dou avantaje principale fa de cea
direct: costuri semnificativ mai reduse i operativitatea
obinerii datelor.
n funcie de gradul de cuprindere a colectivitii se disting:
Observri totale (exhaustive) cnd nregistrarea valorilor
sau variantelor caracteristicilor urmrite se face pentru
toate unitile statistice (fr excepie) din colectivitatea
general; ca exemple se pot da rapoartele
statistice/nregistrarea mrfurilor exportate i importate,
recensmintele populaiei i a animalelor etc;
Observri pariale, cnd se culeg date doar de la o parte a
colectivitii generale (eantion, colectivitate de selecie).
Datele nregistrate la nivelul eantionului se extind apoi, pe
baza inferenei statistice, la ntreaga colectivitate cruia i
aparine. Un exemplu de acest gen este sondajul statistic;
ancheta statistic etc.
Observarea total are un singur avantaj comparativ cu
observarea parial: datele primare nregistrate corespund
obiectivului cercetrii.
n schimb, observarea parial prezint cteva avantaje
majore: numrul mai mic de uniti care se nregistreaz
determin costuri semnificativ mai reduse; rezultatele se
obin mult mai repede; programul de nregistrare poate fi
mult mai amplu; este singura modalitate de obinere a
datelor n condiiile n care o nregistrare total conduce la
distrugerea unitilor.
n funcie de natura colectivitii i timpul nregistrrii se
disting:
Observri curente. Acestea constau n nregistrarea
sistematic, permanent, pe msur ce se produc, a
caracteristicilor fenomenelor analizate la nivelul unitilor
statistice a colectivitii; se folosete pentru nregistrarea
colectivitilor de micare (fapte i evenimente). Volumul
colectivitii se determin prin cumularea unitilor
nregistrate pe o perioad stabilit. nregistrarea curent
folosete, n special, rapoartele sau drile de seam
statistice. Exemplu de observare curent este nregistrarea
evenimentelor demografice: natalitate, mortalitate etc.;
Observri periodice. Ele se folosesc pentru nregistrarea
colectivitilor de stri (fiine i lucruri). nregistrarea
unitilor colectivitii se face la anumite momente stabilite,
iar volumul colectivitii se determin prin numrarea
unitilor nregistrate la momentele respective. nregistrarea
periodic poate fi total (cazul recensmntului) sau
parial (cazul sondajului, anchetei statistice);
Observri ocazionale (unice), care se refer la
fenomene cu caracter de discontinuitate.

n figura 2 sunt prezentate metodele i lucrrile practicate
n observarea statistic.

Rapoartele statistice i recensmntul sunt lucrri de
observare total (prima curent, iar a doua periodic), iar
lucrri de observare parial, special organizate sunt
sondajul, ancheta, observarea prii principale i
monografia statistic (acestea pot fi periodice sau
ocazionale).

Rapoartele
statistice
Sondajul
statistic
Ancheta
statistic
Observarea prii
principale
Monografia
statistic
Recensminte
Observri
pariale
Observri
totale
Observri permanente
Observri special
organizate
Curente
Periodice
n funcie de
necesiti:
- periodice
- unice
Figura 2: Metode i lucrri practicate n observarea statistic
Principalele metode de culegere a datelor sunt:

(A) Recensmntul este o metod de observare total - se culeg
simultan datele de la toate unitile colectivitii, care asigur o
fotografiere, o surprindere a unui fenomen la un anumit moment de
timp - deci este o observare static. Aceasta este cea mai veche i
mai rspndit metod de observare statistic ntlnit nc din
antichitate (la romani) sub forma recensmntului populaiei; ulterior
procedeul s-a extins i asupra altor domenii: exist recensmnt al
locuinelor, al animalelor, al unitilor din industrie, comer, transport,
agricultur (deci, recensmnt economic).
Date fiind cheltuielile mari de materiale i de timp pe care le implic
organizarea lor, precum i dificultile organizatorice,
recensmintele au un caracter periodic (de exemplu din 10 n 10 ani
n cazul populaiei, anual n cazul populaiei colare etc.). n etapele
intermediare, sondajul statistic asigur reactualizarea datelor.
Recensmintele sunt aciuni de mare amploare, care necesit mari
resurse umane, materiale i financiare, dar n urma acestora se
obin indicatori deosebit de importani privind caracterizarea
populaiei i a forei de munc, n general a situaiei economico
sociale a unei ri.
(B) Raportul statistic (darea de seam statistic) reprezint o
observare total (rapoartele sunt completate de toate unitile
economico sociale) i permanent (se completeaz n tot timpul
anului, la termene fixe).
Ele sunt documente oficiale, tipizate, prin care se obin date referitoare
la activitatea curent a unitilor economice. Din aceast cauz se
vorbete de un nomenclator al rapoartelor statistice pe care trebuie
s le completeze fiecare agent economic. Exist rapoarte statistice
referitoare la capitalul fix, fora de munc, timpul de lucru, rezultatele
activitilor, materiilor prime i materialele, cifra de afaceri, profit,
costuri de producie etc. Agenii economici sunt obligai s
ntocmeasc rapoartele statistice n forma analitic stabilit, folosind
o metodologie unitar de calcul al indicatorilor. Numrul i coninutul
rapoartelor statistice difer de la un domeniu de activitate la altul.
Cele mai cunoscute tipuri de astfel de nregistrri sunt cele cu caracter
fiscal (bilanul contabil, declaraiile vamale de export / import etc.).
Raportul statistic se caracterizeaz prin obligativitatea ntocmirii, prin
metodologia unitar de calcul a indicatorilor raportai i prin
elemente comune, cuprinse n fiecare formular tipizat, i anume:
elemente de form (de identificare) i elemente de fond (de
coninut). Sistemul raportrilor statistice tinde s se restrng n
prezent, n favoarea sondajului statistic.
(C) Sondajul (selecia, eantionarea) statistic reprezint o
nregistrare parial, selectiv, care se aplic atunci cnd
observarea total fie nu este posibil (de ex., la controlul calitii
produselor), fie nu este justificat economic deoarece presupune
angajarea unor cheltuieli ridicate de resurse materiale,
financiare, timp i umane.
Sondajul statistic presupune culegerea efectiv a datelor doar
pentru o parte a colectivitii totale (numit eantion) aleas
astfel nct s fie reprezentativ fa de colectivitatea de
ansamblu, s prezinte aceleai trsturi eseniale. Utilitatea
datelor obinute prin sondajele statistice este condiionat de
reprezentativitatea eantioanelor extrase, de msura n care
trsturile eseniale ale structurii colectivitii generale se
regsesc n structura eantioanelor extrase etc.
Dei implic o marj de eroare, procedeul este larg rspndit n
rile cu economie de pia, unde exist instituii specializate n
sondaj.
Sondajul statistic are o arie larg de rspndire, fiind frecvent folosit
n cercetarea bugetelor de familie, nregistrarea preurilor pe
piaa liber, controlul calitii produselor, sondarea opiniei
publice.
(D) Ancheta statistic (de opinie) este tot o observare
special organizat, parial. Ea presupune culegerea datelor
pe baza unor chestionare la care indivizii rspund benevol.
De regul cei care intr n posesia chestionarelor nu formeaz
un eantion reprezentativ i ca atare, rezultatele anchetei sunt
orientative, fr pretenia de rigurozitate tiinific.
Prin anchete se urmrete obinerea unor informaii referitoare la
tendinele ce se manifest n colectivitatea care intereseaz.
Cele mai des ntlnite sunt anchetele privind cercetarea pieei i
a opiniei publice, referitor la preferinele consumatorilor, iar
mai recent, anchetele se utilizeaz n demografie, privind:
mortalitatea pe grupe socio-profesionale, pe vrste, fertilitatea
populaiei.
n ara noastr, n anul 1990 a fost nfiinat o instituie
specializat n studierea opiniei publice, Institutul Romn
pentru Studierea Opiniei Publice (I.R.S.O.P.), care lucreaz
prin intermediul sondajelor i anchetelor statistice.
(E) Observarea prii principale sau observarea
masivului principal de date sau panelul, ca form de
observare parial special organizat, este folosit pentru
studierea unor colectiviti structurate pe grupe de mrimi i
importan diferit.
Se nregistreaz date doar pentru grupele cu o pondere sau
importan mare (masivul principal) n colectivitatea total, iar
rezultatele obinute se extind la ntreaga populaie.
De exemplu, pentru cunoaterea ctigului salarial mediu i a
efectivului de salariai se organizeaz lunar de ctre INS o
cercetare statistic selectiv prin metoda observrii prii
principale. Astfel, se includ n cercetare toate unitile cu 4
salariai i peste, n timp ce unitile cu 0 3 salariai sunt
excluse.
(F) Monografia statistic face parte din categoria
observrilor pariale, special organizate, avnd ca obiect
cunoaterea multilateral i n profunzime a unei uniti
statistice complexe.
Programul observrii este foarte amnunit, permind o
cunoatere aprofundat a fenomenului analizat. Monografia
fcut asupra unei colectiviti sau a unei uniti de
nregistrare presupune nu numai culegerea datelor ci i
interpretarea acestora.
Obiectul de studiu al unei monografii l poate constitui o un ora
sau o regiune, o unitate economic sau un proces social-
economic (industrializarea, colectivizarea, privatizarea etc.).
Se efectueaz monografii pentru studierea fenomenelor
demografice, ce din punct de vedere al sferei de cuprindere
pot fi:
- monografii ce studiaz un singur fenomen demografic
(natalitate, mortalitate) n cadrul ntregii populaii sau a unei
pri a acesteia, n corelaie cu toi factorii sociali-economici
care l determin;
- monografii ce studiaz un ansamblu de fenomene demografice
interdependente, n cadrul unei uniti teritoriale sau zone
geografice, la nivelul crora fenomenele demografice se
difereniaz cel mai mult, n plus sau n minus fa de media
lor pe ar.
Monografia necesit colaborarea i conlucrarea unor cercettori
din mai multe domenii. Rezultatele obinute n cercetrile
monografice, spre deosebire de restul cercetrilor prin sondaj,
nu se extind asupra ntregii colectiviti, ci caracterizeaz doar
obiectul studiat.
n ultima perioad exist tendina de utilizare pe o scar destul
de mare a observrilor pariale. Aceast nclinaie este legat
de nevoia rapid de cunoatere (de culegere a datelor), de
posibilitile largi de aplicare (cu costuri dintre cele mai
reduse) etc.
Studii statistice arat c, la nceputul ultimului deceniu al sec.
XX, sumele alocate de ntreprinderile europene activitii de
culegere i prelucrare a informaiei se situau undeva ntre 0,1
i 0,8 % din cifra lor de afaceri, firmele japoneze alocau 1,5 %
din C.A.


2. PRELUCRAREA DATELOR STATISTICE
2.1. PRELUCRAREA PRIMAR A DATELOR STATISTICE

n urma observrii statistice, de regul special organizat, se
obine un ansamblu de date statistice individuale referitoare
la fenomenul sau procesul observat. Aceste date statistice
(valorile/variantele individuale ale caracteristicilor statistice
analizate) caracterizeaz fiecare unitate statistic n parte
i prezint variaii de la o unitate statistic la alta, crend n
mod aparent impresia c ele ar fi independente ntre ele.
Din aceast cauz ansamblul datelor nregistrate nu permite
cunoaterea esenei din forma de manifestare a
fenomenelor investigate i nu ofer o imagine a existenei
unor posibile legturi ntre unitile observate sau ntre
anumite caracteristici statistice ale acestora. Pentru ca
datele statistice nregistrate s fie utile n procesul de
cunoatere i pregtire a deciziilor trebuie supuse unui
proces de prelucrare statistic.
Prelucrarea statistic poate fi primar sau secundar.
Prelucrarea primar cuprinde operaii de sistematizare
(prin centralizare i grupare/clasificare) i de
prezentare a datelor statistice - ntr-o manier n care
s le fac mai uor de analizat i interpretat - sub form
de tabele, serii statistice i/sau grafice.
Rezultatele operaiilor de prelucrare primar sunt
elementele de intrare pentru prelucrarea secundar n
urma creia se obin o serie de date statistice derivate:
valori tipice sintetice (indicatori statistici),
omogenitatea i asimetria distribuiilor,
intensitatea legturilor dintre fenomenul analizat i
factorii si de influen etc.
A. Centralizarea datelor statistice presupune totalizarea
(nsumarea) unitilor statistice sau a valorilor unei
caracteristici la nivelul colectivitii observate. n urma
centralizrii se obin indicatori statistici totalizatori ce au un
coninut concret i o form specific de exprimare, motiv
pentru care sunt denumii indicatori absolui, de exemplu:
numrul de autoturisme dintr-un jude la un moment dat,
numrul de cstorii dintr-un jude ntr-o anumit perioad.
S presupunem c ntr-o colectivitate s-au observat
caracteristicile X
1
, X
2
, ..., X
m
. Datele culese de la cele "n"
uniti (U
n
) din colectivitatea investigat sunt sistematizate
sub forma unei matrici n care, pe coloane, apar
caracteristicile nregistrate (X
j
), iar pe rnduri, unitaile la
care s-au nregistrat caracteristicile respective. Intersecia
dintre fiecare rnd i o coloan indic varianta sau valoarea
caracteristicii j nregistrata la unitatea i, x
ij
.
Prin urmare, prima faz a prelucrrii primare o reprezint deci
sistematizarea datelor sub form matriceal.
Pentru a putea sesiza ceva semnificativ pe baza acestei mase
de date (tendina de evoluie, legturile dintre variabile etc)
este necesar, ntr-o prima faz, s se introduc ordine n
aceste date.
O prim posibilitate const n ordonarea cresctoare sau
descresctoare a valorilor nregistrate pentru o caracteristic,
la toate unitile colectivitii. Rezult o ordonare a valorilor
dup rangul pe care l au valorile n cazul caracteristicii
respective. De exemplu, pentru caracteristica X
1
:
X
2,1
< X
5,1
< ... < X
20,1
< ...
Tabelul 1
Atand fiecarei valori distincte nregistrat pentru caracteristica
X frecvena absolut corespunzatoare (n), se obine o
repartiie de frecvene (tabelul 2).

Suma valorilor nregistrate este egal cu suma produselor
dintre fiecare valoare distinct i frecvena de apariie

=
n
1 i
i
x

=

n
1 i
i i
n x
Tabelul 2
B. Gruparea/clasificarea statistic

Deoarece, n cercetrile statistice, intereseaz nu doar
indicatorii totalizatori, de ansamblu ai unei colectiviti, ci
i structura acesteia, mutaiile de structur i contribuia
factorilor la aceste modificri, se apeleaz la
structurarea colectivitilor dup una sau mai multe
caracteristici statistice i anume la
gruparea/clasificarea statistic.
Gruparea / clasificarea statistic reprezint o metod de
sistematizare a datelor, prin care se comprim volumul
datelor nregistrate dup una sau mai multe caracteristici
statistice.
Gruparea/clasificarea datelor presupune separarea
unitilor unei colectiviti n grupe omogene dup
variaia uneia sau a mai multor caracteristici de grupare.

Dac sistematizarea datelor se face dup o caracteristic
numeric ea se numete grupare, iar dac se face dup
o caracteristic calitativ (nenumeric), procesul se
numete clasificare.
Caracteristica (variabila) statistic n funcie de care
sistematizm datele se mai numete i criteriul de
grupare/clasificare.
Criteriul de grupare/clasificare se alege n funcie de scopul
cercetrii astfel nct s conduc la structurarea
colectivitii n grupe/clase omogene.
Prin grup sau clas (interval) omogen nelegem acea
grup sau clas n care sunt incluse acele uniti din
colectivitate la care valorile individuale ale caracteristicii
(lor) urmrit(e) prezint variaii (abateri) minime,
explicate prin influena factorilor ntmpltori.

n esen, clasificarea ca metod statistic, presupune
operaii complexe de sistematizare a unui ansamblu de
uniti pe baza caracteristicilor lor comune, n clase de
uniti, a claselor de uniti n clase de clase de uniti
.a.m.d., cu scopul ca fiecare clas astfel obinut s ocupe
un loc precis i stabil ntr-o structur sau ierarhie.
Menionm n acest sens sistemele standardizate de
clasificri i nomenclatoare utilizate n statistica public, i
care cuprind, printre altele:
clasificarea ramurilor din economia naional (CREN):
agricultur, industrie, construcii, comer etc.;
clasificarea activitilor din economia naional (CAEN);
clasificarea produselor i serviciilor asociate activitilor
(CPSA);
nomenclatorul profesiilor (NP);
nomenclatorul indicatorilor economico-sociali (NIES) etc.
n ceea ce privete gruprile statistice, n practica statistic se
utilizeaz o mare diversitate de tipuri de grupri statistice, n
funcie de diferite criterii i anume:
n funcie de numrul caracteristicilor utilizate sunt:
1) grupri simple, care presupune separarea unitilor
colectivitii dup variaia unei singure caracteristici (tabelul 3).
De exemplu: gruparea studenilor dintr-un an de studiu dup
caracteristica media notelor obinute la sesiune, gruparea
agenilor economici dintr-un jude dup cifra de afaceri sau
dup numrul de salariai.
Acestea sunt utile pentru determinarea tendinei de concentrare a
fenomenelor.
Tabelul 3
2) grupri combinate sau complexe (tabelul 4), presupun
separarea unitilor unei colectiviti dup variaia simultan a
dou sau mai multe caracteristici de grupare, de exemplu,
gruparea populaiei dup vrst, stare civil i sex sau
studierea ntreprinderilor industriale dintr-un jude dup
mrime presupune gruparea lor dup mai multe caracteristici
ntre care: capitalul fix investit, numrul angajailor, cifra de
afaceri.
Aceste grupri sunt utilizate n vederea interpretrii
interdependenei statistice dintre fenomene.
Deoarece o frmiare excesiv a colectivitii ar anula
semnificaia gruprii i ar face imposibil analiza, n practic
se utilizeaz maximum trei caracteristici pentru gruparea
combinat.
Gruprile combinate se pot realiza att pentru caracteristici
nenumerice ct i numerice. De exemplu, ntreprinderile
industriale pot fi grupate pe ramuri de activitate, iar n cadrul
acestor grupe dup cifra de afaceri sau dup capitalul fix .
Dup coninutul caracteristicii de grupare deosebim:
1) Gruprile cronologice se refer la variaia n timp a
fenomenului analizat. n funcie de scopul analizei, mrimea
intervalului de timp utilizat n grupare difer: zi, lun, trimestru,
an etc. De exemplu: producia zilnic realizat de muncitorii
dintr-o secie, cheltuieli lunare de producie, profitul annual,
sistematizarea agenilor economici dintr-un jude dup anul
nfiinrii etc. Rezultatele unei astfel de grupri conduc la o
serie cronologic (de timp).
Tabelul 4
2) Gruprile teritoriale oglindesc variaia n spaiu a unitilor
colectivitii. De regul, aceste grupri corespund unitilor
teritorial-administrative. Cele mai ntlnite sunt gruprile pe
judee sau regiuni n statistica naional i gruprile pe ri
n statistica internaional. Exemple: gruparea produciei
agricole pe judee, desfaceri cu amnuntul pe principalele
orae ale rii, relaii de import/export pe zone geografice i
ri. Rezultatele unei astfel de grupri conduc la o serie
teritorial (de spaiu).
3) Gruparea dup o caracteristic atributiv prezint dou
variante:
Grupare calitativ (tipologic) cnd caracteristica este
exprimat prin cuvinte. Exemple: gruparea produciei pe
ramuri economice, gruparea salariailor unei uniti
economice pe meserii etc.
Grupare cantitativ cnd caracteristica este exprimat
numeric. Exemple: gruparea societilor comerciale dup
cifra de afaceri, gruparea familiilor dup numrul de copii
etc.
Dup modul de variaie a caracteristicii numerice, adic
variaie discret (discontinu) i variaie continu, exist:
1) Gruparea pe variante/valori (la caracteristicile discrete)
presupune stabilirea unei grupe pentru fiecare valoare luat
de caracteristica de grupare. Acest lucru este posibil atunci
cnd numrul variantelor este redus (cel mult 10-12 valori), iar
fiecrei variante i corespune o grup. De exemplu: gruparea
apartamentelor dintr-un bloc dup numrul de camere,
gruparea populaiei dup starea civil, gruparea salariailor
dup sex, gruparea studenilor dintr-un an dup tipul liceului
absolvit sau dup nota obinut la examen etc.
Aceast operaiune de prelucrare const n identificarea prin
numrare a unitilor (frecvenelor absolute) la care se
nregistreaz aceeai variant a caracteristicii.
n continuare este prezentat un exemplu de grupare pe variante.
La finalul lanului de asamblare a aspiratoarelor se preleveaz
un eantion de 20 aparate. n urma controlului de calitate s-a
constatat numrul de piese care prezint o defeciune minor,
la fiecare aparat prelevat. Datele nregistrate sunt prezentate
n tabelul 5.
n urma gruprii datelor pe variante (tabelul 6) se obine
urmtoarea distribuie a aparatelor dup numrul
pieselor defecte:
2) Gruparea pe intervale de variaie/grupare (la
caracteristicile continue) se utilizeaz n cazul caracteristicilor
numerice care nregistreaz un numr mare de valori
individuale diferite. Pentru a facilita analiza statistic, aceste
valori sunt restrnse, sistematizate ntr-un numr redus de
grupe. Fiecare grup astfel constituit include unitile
colectivitii pentru care valoarea caracteristicii se ncadreaz
ntr-un anumit interval de valori.
O importan deosebit o are problema stabilirii numrului de
grupe i alegerii mrimii intervalului de grupare.
Alegerea numrului de grupe trebuie s evite dou erori
frecvente:
stabilirea unui numr prea mare de grupe, ceea ce conduce
la frmiarea colectivitii, cu consecine negative att pe
planul identificrii trsturilor eseniale ale fenomenului
analizat, ct i pe planul calculelor statistice ulterioare, care
devin mai laborioase;
stabilirea unui numr prea mic de grupe prezint pericolul
estomprii deosebirilor calitative din cadrul structurii
colectivitii, alternd concluziile analizei.
Se recomand utilizarea unui numr moderat de grupe. Deseori, un
numr de 4 pn la 10 grupe este recomandat, dar felul datelor
poate necesita un alt numr de grupe.
La stabilirea numarului de grupe (k, r) se pot aplica urmtoarele
reguli generale:
dac numrul datelor observate nu depeste 100, numrul
grupelor s nu fie mai mare dect rdcina ptrat din numrul
observaiilor. De exemplu, daca n=64 atunci k s 8;
dup Sturges, dac numrul valorilor observate este n, atunci
numrul grupelor poate fi cel mult egal cu
Brooks i Carruthers propun relaia k < 5 log n
Croxton i Cowden propun ca numrul de grupe s fie cuprins
ntre 6 i 16.
n unele ri se aplica urmatoarele reguli: cel puin 10 grupe dac
s-au nregistrat circa 100 de valori; 13 grupe n cazul cnd
numarul valorilor observate se apropie de 1.000 si cel puin 16
grupe dac numrul datelor se apropie de 10.000. n cazul
acestor reguli se presupune ca s-au nregistrat numai valori
distincte. Deci, aceste reguli nu pot fi aplicate dac numrul
valorilor distincte este mic.
n log 322 , 3 1 k
10
+ =
n ceea ce privete mrimea intervalelor de variaie,
acestea pot fi intervale (de mrimi) egale i respectiv
intervale (de mrimi) inegale.
O grupare pe intervale egale se recomand dac se
urmrete sistematizarea datelor n vederea prelucrrii,
respectiv obinerea indicatorilor derivai.
Dac ns se urmrete cunoaterea tipurilor calitative
existente n colectivitate se recomand o grupare pe
intervale neegale.
De exemplu, populaia unei ari sau a unui jude se grupeaz
frecvent pe intervale, fiecare clasa cuprinznd 5 valori
distincte: pna la 4 ani; 4 9 ani; 10 14 ani; 15 19 ani;
...; 60 64 ani; 65 69 ani; etc..
Dac ns ne intereseaz cunoaterea posibilitilor de
participare la activitatea economic i social, se recurge la
o grupare pe intervale neegale: pn la 14 ani; 15 64 ani;
65 ani i peste.
Pentru sistematizarea datelor pe intervale de variaie se
recomand utilizarea intervalelor de mrime egal.
Se recurge la o grupare pe intervale neegale dac este nevoie
de a acoperi intervalele egale vide (fr uniti), sau cnd
unui cmp mare de variaie al valorilor de observaie i
corespunde un numar restrns de unitai (frecvente). Prin
urmare, alegerea intervalelor de mrime neegal este
justificat numai atunci cnd repartiia valorilor n cadrul
colectivitii este neuniform sau atunci cnd o parte a
colectivitii statistice prezint un interes deosebit, fiind
necesar o analiz mai detaliat.

Gruparea pe intervale egale presupune urmtoarele operaiuni:
calculul amplitudinii variaiei;
determinarea numrului de grupe;
stabilirea mrimii intervalului de grupare;
precizarea limitelor superioare i inferioare ale intervalelor de
grupare;
determinarea numrului unitilor statistice (frecvenelor
absolute) care sunt incluse n fiecare interval.
Amplitudinea variaiei (A, R) se stabilete ca diferen
ntre valoarea maxim (x
max
) i valoarea minim (x
min
)
nregistrat de caracteristica respectiv, X:
A = x
max
- x
min
Pentru determinarea numrului de grupe (k, r) se poate
utiliza formula lui Sturges, recomandat n literatura de
specialitate pentru colectivitile de dimensiuni relativ
mari, urmrind o distribuie apropiat de cea normal.

unde "n" este numrul unitilor statistice din colectivitate.
Mrimea intervalului de grupare (h) se determin pe
baza raportului dintre amplitudinea variaiei (A) i
numrul de grupe (k) ales:
n log 322 , 3 1 k
10
+ =
k
x x
k
A
h
mi n max

= =
Atunci cnd ctul mpririi nu este un numr ntreg se
rotunjete n plus pentru a nu rmne valori n afara
ultimului interval de grupare.

Intervalul de grupare (variaie) reprezint un ir de valori
ale caracteristicii studiate, delimitat de intervalele vecine
prin limita inferioar i limita superioar.
- n cazul caracteristicilor cu variaie discret, limita
superioar a unui interval se difereniaz de limita
inferioar a intervalului urmtor, fiind mai mare dect
aceasta.


unde A este o unitate de discretizare
A + =
+
x x
sup i inf ) 1 i (
- n cazul caracteristicilor cu variaie continu, limita
superioar a primului interval devine limita inferioar a
celui de-al doilea interval.


ntruct gruparea are variaie continu, este necesar s se
precizeze care din cele dou limite (inferioar sau
superioar) este inclus n interval.
Mrimea intervalului de grupare se calculeaz astfel:
n cazul caracteristicilor cu variaie continu :


n cazul caracteristicilor cu variaie discret;
sup i inf ) 1 i (
x x =
+
r 1, i , x x h
inf i sup i i
= =
r 1, i , x - x h
inf i sup i i
= A + =
att n cazul seriilor de variaie pe intervale ct i pe
variante, cu una din formulele:




n practica statistic se ntlnesc deseori situaii n care
valorile extreme ale caracteristicii (x
min
i x
max
) sunt
foarte ndeprtate de restul valorilor. n acest caz valorile
extreme pot fi omise, iar primul i ultimul interval devin
intervale deschise (nu este precizat limita inferioar a
primului interval i nici limita superioar a ultimului
interval).

r 1, i , x x h
inf i inf ) 1 i ( i
= =
+
r 2, i , x x h
sup 1) - (i sup i i
= =
Se obin, astfel, "k" grupe, pentru care vom stabili
frecvenele absolute (n
i
) prin numrarea unitilor care se
ncadreaz n fiecare grup sau frecvenele relative, care
indic proporia din numrul total de uniti, care se
ncadreaz n grup:(n
i
* sau f
i
).


unde n reprezint volumul total al colectivitii investigate.
Exprimat n procente, frecvena relativ a grupei i este:


Dac exist grupe cu frecven nul, ori multe grupe cu o
singur observaie, poate fi necesar revizuirea mrimii
intervalelor sau a numrului de intervale.

n
n
n
n
n
i
r
1 i
i
i
*
i
= =

=
| | % , 100
n
n
100
n
n
n
i
r
1 i
i
i % *
i
= =

=
APLICAII

(1) n cele ce urmeaz, vom ilustra modalitile de
grupare a datelor pe intervale egale i neegale folosind
urmtoarele mrimi ale produciei realizate (numr
buci) ntr-o lun de ctre cei 65 de muncitori ai unei
uniti industriale:
61, 66, 56, 71, 73, 67, 76, 69, 66, 77, 81, 69, 58, 50, 59, 74,
64, 71, 76, 63, 51, 73, 61, 64, 67, 64, 66, 69, 63, 72, 78,
82, 67, 57, 71, 83, 61, 73, 64, 58, 68, 62, 67, 63, 67, 69,
61, 79, 62, 68, 63, 67, 62, 68, 69, 66, 58, 72, 78, 67, 84,
66, 59, 73, 66.
a) Gruparea pe intervale egale
Producia cea mai mic realizat n ntreprindere a fost de
50 de buci, iar cea mai mare de 84 de buci.
Amplitudinea variaiei (A) este:
A = x
max
- x
min
= 84 - 50 = 34 buci
Avnd n vedere amplitudinea variaiei i volumul
colectivitii, am stabilit un numr de 7 grupe.
mprind amplitudinea variaiei la numrul de grupe ales
(k), determinm mrimea intervalelor egale de variaie
(h):


Natura datelor ne indic s folosim intervale de variaie
discrete.
Limitele intervalelor de grupare i numrul muncitorilor din
fiecare grup (frecvenele absolute) sunt prezentate n
tabelul 7, unde s-a realizat gruparea muncitorilor dup
producia lunar.
bucati 5 857 , 4
7
34
k
A
h ~ = = =
b) Gruparea pe intervale neegale
n continuare vom regrupa muncitorii astfel nct s
evideniem trei tipuri calitative din punct de vedere al
produciei realizate: mic, mijlociu, mare.
Tabelul 7
Folosind criteriul mediei, definim tipul mijlociu prin
reunirea a trei intervale: intervalul care conine media
(65 - 69) i cele dou intervale alturate (60 - 64 i 70 -
74). Noua grupare este prezentat n tabelul 8, unde s-
a realizat gruparea muncitorilor dup producia
realizat.

Tabelul 8
(2) Pentru un eantion de 50 de angajai s-au nregistrat
datele privind cstigul salarial nominal brut realizat n
luna ianuarie 2003 (tabelul 9).

Tabelul 9







Grupare acestor date pe variante conduce la prea multe
grupe deoarece numarul valorilor distincte este mare.
Comprimare datelor individuale presupune gruparea pe
intervale de variaie.
Numarul de grupe (k) poate fi egal cu 7 deoarece ,
deci marimea intervalului (h) este:


Aplicarea formulei lui Sturges conduce la:



Intervalele de grupare i numrul muncitorilor (frecvena
absolut) corespunztor fiecarei grupe se prezint n
tabelul 10.
Limita inferioara este inclus n interval. Dac valoarea
observat cea mai mic se alege drept limit inferioar a
primului interval, atunci toate intervalele sunt nchise
inferior.
7 50 =
lei . mil 8 , 0 77 , 0
7
4 , 5
7
2 , 2 6 , 7
k
x x
k
A
h
mi n max
~ = =

= =
lei . mil 809 , 0
67 , 6
4 , 5
50 log 322 , 3 1
2 , 2 6 , 7
n log 322 , 3 1
x x
h
mi n max
= =
+

=
+

=
(3) Asupra unui eantion de 60 de muncitori care
lucreaz ntr-o ntreprindere industrial s-au nregistrat
urmtoarele date cu privire la vechimea n munc, n ani
mplinii (date convenionale):

Tabelul 10
21 25 26 19 25 22 20 28 27 35 10 15 17 19 19 26
7 13 15 7 7 10 12 7 10 13 13 16 16 16 21 23
21 23 23 39 30 7 12 12 2 1 16 19 23 32 15 22
19 23 32 22 27 17 21 19 22 27 17 17
Se cere s se sistematizeze datele prin grupare pe variante
de variaie i pe 7 intervale de variaie egale.
a) Gruparea pe variante de variaie (x
i
) presupune
ordonarea datelor n sens cresctor sau descresctor i
obinerea frecvenei de apariie a fiecrei variante.
Rezultatele obinute sunt prezentate n tabelul 11.
b) Gruparea pe intervale egale de variaie, n cazul n
care se cunoate numrul de grupe (k=7),
presupune aflarea, mai nti, a mrimii intervalului
de variaie (h):
h = A / k = (x
max
x
min
) / k = (39-1) / 7 = 5,43 6 ani
Dac nu se cunoate numrul de grupe, mrimea
intervalului se determin conform formulei lui Sturges:
h = A / (1+3,322log60) = 38 / (1+3,322log60) = 5,5 6
ani
Deoarece mrimea intervalului determinat prin cele dou
metode este aproximativ egal, se apreciaz c numrul
de grupe (k=7) este stabilit corect, n concordan cu
amplitudinea de variaie a caracteristicii i cu volumul
eantionului.

Urmeaz apoi delimitarea grupelor de variaie i
determinarea frecvenei pe fiecare interval. Rezultatele
obinute sunt prezentate n tabelele 12 15 i reprezint
distribuia muncitorilor din eantionul observat dup
caracteristica vechime n munc.

S-ar putea să vă placă și