Sunteți pe pagina 1din 26

EAM 2022-2023

STATISTICĂ
curs 2
COLECTAREA DATELOR
1. Scale de măsurare a datelor statistice
Pentru ca datele statistice să poată fi supuse
prelucrării prin metode statistice, ele trebuie
măsurate, adică exprimate cantitativ, cu ajutorul
numerelor.
Măsurarea este operaţia prin care fiecărei observaţii,
fiecărui aspect cantitativ sau calitativ al unităţilor
statistice (obiectelor, evenimentelor etc.) li se atribuie
în mod sistematic numere.
Modalitatea prin care se atribuie această valoare
numerică, precum şi semnificaţia ei depinde de
nivelul de măsurare. Fiecărui nivel de măsurare îi
corespunde o anumită scală de măsurare.
!!!!! Toate operaţiile matematice permise pentru o
anumită scală sunt valabile şi pentru toate scalele
inferioare ei, dar nu şi pentru cele următoare.
a. Scala nominală
Este scala cu cel mai scăzut nivel al preciziei,
utilizată pentru a atribui variantelor caracteristicii
măsurate „însuşiri”, cu scopul de a stabili diferenţe
calitative între observaţii.

Rolul scalei nominale: de a încadra unităţile


statistice în grupe/clase/categorii diferite, după un
anumit criteriu, fără a indica dacă o categorie este
mai bună sau mai puţin bună decât alta, dacă o
categorie este mai largă sau mai restrânsă decât
alta.
Operaţii admise pe scala nominală: singurele
relaţii matematice permise pe scala nominală sunt
echivalenţa şi non-echivalenţa. Astfel, o unitate
statistică poate avea caracteristica definitorie pentru
o anumită clasă (=) sau nu (≠). Putem spune, de
exemplu, „masculin” (≠) „feminin”, dar nu şi
„masculin” > „feminin”.
☺ Exemplul nr. 1
Clasificarea persoanelor intervievate în cadrul unui
studiu statistic, după statutul civil
(căsătorit/necăsătorit), după gen (masculin/feminin),
după profesie (inginer/economist/arhitect/avocat
etc.).

☺ Exemplul nr. 2
Pentru uşurarea procesului de prelucrare a datelor,
variantele/categoriile nominative se pot codifica
numeric, sub forma: (0 = masculin, 1 = feminin); (1
= inginer, 2 = economist, 3 = arhitect etc.). Aceste
numere nu sunt purtătoare ale vreunei informaţii
cantitative, ci doar separă subiecţii în
clase/categorii distincte din punctul de vedere al
statutului civil, al sexului, al profesiei etc. Cu aceste
coduri numerice nu se pot determina medii sau alţi
indicatori statistici, nu se pot efectua comparaţii.
Putem însă să determinăm frecvenţele de apariţie
ale ficărei categorii.
b. Scala ordinală (categorială)

Oferă un plus de precizie în „măsurare”, faţă de


scala nominală, deoarece ea nu numai că împarte
unităţile colectivităţii studiate în clase/grupe
omogene diferite, din punct de vedere al unei
caracteristici, ci permite şi stabilirea unei relaţii de
ordine între aceste clase/grupe.

☺ Exemplul nr. 3
Nu putem afirma cu câte grade Celsius diferă
temperatura „scăzută” de cea „normală”, sau cu
câte kilograme este mai grea o persoană din
categoria „peste greutatea normală” decât una din
categoria „cu greutatea normală”.
c. Scala de raport (proporţională)

Caracteristici:

▪ se aplică variabilelor numerice, având cel mai înalt


nivel de precizie;

▪ două valori, măsurate pe această scală se află,


indiferent de unitatea de măsură folosită, în acelaşi
raport una faţă de alta;

▪ pe această scală sunt permise şi operaţiile de


multiplicare şi de divizare;

▪ punctul de origine (zero) este unul fix, rigid, este


zero absolut, matematic şi reprezintă absenţa
caracteristicii;

▪ unitatea de măsură poate fi aleasă arbitrar.


☺ Exemplul nr. 7
Dacă un agent economic are 20 de angajaţi şi un
altul are 10 angajaţi, putem afirma că primul are de
2 ori mai mulţi angajaţi decât cel de-al doilea, sau
dacă o persoană cântăreşte 90 de kg. şi o alta doar
30 de kg., se poate spune că a doua persoană
cântăreşte de 3 ori mai puţin decât prima
persoană.

☺ Exemplul nr. 8
Deşi pe scala de raport valoarea zero a unei
variabile înseamnă „absenţă”, nu este necesar ca
această valoare să se fi înregistrat, în practică, la
una din unităţile statistice. De exemplu, vârsta se
măsoară cu scala de raport, deşi nu există nici o
persoană care să aibă 0 ani (adică 0 ani, 0 luni, 0
zile etc.). Timpul după care participanţii la un
concurs de atletism parcurg distanţa de 400 m se
măsoară pe scala de raport, deşi nu există nici o
persoană care să străbată această distanţă în 0,00
minute.
1. Scale de măsurare a datelor statistice

DENUMIREA SCALEI CARACTERISTICI ALE SCALEI EXEMPLE DE UTILIZARE

Sex, stare civilă, stagiul


NOMINALĂ Absenţa relaţiei de ordine militar, profesia, culoarea
părului,

Calificative pentru activitatea


şcolară, ordinea sosirii
ORDINALĂ Relaţie de ordine alergătorilor dintr-o cursă,
preferinţele consumatorilor
pentru un produs,

Relaţie de ordine
Diferenţe (intervale)
semnificative Vârsta, greutatea corporală,
RAPORT
Origine fixă, valoarea 0 salariul, profitul, cifra de
(PROPORŢIONALĂ)
înseamnă absenţă afaceri, număr de angajaţi
Operaţii de multiplicare /
divizare
TEST 1
1. Precizaţi care din următoarele asocieri între
variabilele statistice şi scalele de măsurare nu este
adevărată:
a) marca de calculator cumpărat cel mai de curând de
către 20 de oameni de afaceri – scală nominală.
b) salariul mediu pe ramuri ale economiei naţionale –
scală de raport.
c) luna din anul 2000 în care 41 de firme selectate
aleator au realizat cele mai mari vânzări – scală
nominală.
d) punctajul obţinut de către 10 concurenţi la un
concurs de cultură generală – scală nominală.
e) afilierea la un partid politic a 50 de directori
executivi selectaţi aleator – scală nominală.
TEST 1
2. O companie de produse alimentare doreşte să
comercializeze un nou produs de snack-food. Pentru a
vedea cum reacţionează cumpărătorii la acest produs,
compania organizează o testare a gusturilor pentru
100 de cumpărători selectaţi întâmplător la un
magazin suburban. Cumpărătorii sunt rugaţi să guste
produsul şi apoi să completeze un chestionar cu
următoarele întrebări:

a) Care este vârsta dumneavoastră?


b) Sunteţi persoana care face de obicei cumpărături
pentru familia dumneavoastră?
c) Câte persoane sunt în familia dumneavoastră?
TEST 1

d) Cum notaţi, pe o scală de la 1 la 10, gustul


produsului, dacă 1 este cel mai puţin gustos?
e) Veţi cumpăra acest produs dacă va fi disponibil în
magazine?
f) Dacă răspunsul la e) este “Da”, cât de des veţi
cumpăra produsul?

Clasificaţi datele oferite de răspunsuri în cantitative şi


calitative şi indicaţi scala de măsurare pentru fiecare
dintre ele.
TEST 1
3. Ordinea în care sosesc alergătorii dintr-o cursă
reprezintă o variabilă statistică ale cărei valori pot fi
măsurate pe o scală:

a) nominală;
b) ordinală
c) raport.
2. Surse de date statistice
În scopul aplicării metodelor statistice de analiză a
fenomenelor și proceselor social-economice este
necesar să avem la dispoziție date statistice. Datele
necesare se pot obţine din diferite surse:
▪ din investigaţii statistice special organizate, atunci
când datele nu există iniţial sub forma necesară –
acestea sunt datele primare (de exemplu prin
recensământ statistic sau sondaj statistic);
▪ din sistemul informaţional existent (de exemplu: din
evidenţele curente ale agenţilor economici, bănci şi
baze de date pe suport de hârtie sau electronic al
unor instituţii ale administraţiei centrale şi locale etc.)
şi se numesc date secundare.
Clasificarea datelor statistice

I. În funcţie de numărul de variabile:


▪ Date univariate – caracterizate de o singură
variabilă statistică, înregistrându-se o singură
valoare pentru fiecare unitate statistică;
▪ Datele bivariate – caracterizate prin intermediul
a două variabile statistice înregistrându-se câte
două valori pentru fiecare unitate statistică;
• Datele multivariate – se referă la trei sau mai
multe variabile statistice, obţinând aşadar câte
trei sau mai multe valori pentru fiecare unitate
statistică.
Clasificarea datelor statistice

II. În funcţie de dimensiunea temporală:


▪ Date transversale (de tip profil, secvenţă sau secţiune)
ce reprezintă rezultatul unor măsurători efectuate la un
anumit moment dat de timp asupra uneia sau mai
multor variabile de interes pentru populaţia studiată.
▪ Date longitudinale (de tip serii de timp sau serii
cronologice) ce reprezintă rezultate ale unor măsurători
efectuate asupra caracteristicilor unităţilor populaţiei
studiate, la momente succesive sau la anumite intervale
de timp;
▪ Date de tip panel – combinaţii ale datelor de tip profil şi
serii de timp şi reprezintă rezultate ale măsurătorilor
efectuate asupra caracteristicilor unităţilor statistice
dintr-un panel (eşantion fix), la anumite momente
succesive de timp.
2. Surse de date statistice
☺ Exemplul nr. 9
Spre exemplu, Direcţia Generală de Statistică
Regională Bucureşti a publicat, în septembrie 2012,
în Buletinul statistic pentru trimestrul II al anului
2012, mişcarea naturală a populaţiei oraşului în
semestrul I al anului 2012, veniturile personalului
salariat, numărul şomerilor la 30 iunie 2012,
producţia principalelor produse industriale fabricate
în Municipiul Bucureşti, dinamica cifrei de afaceri
pentru întreprinderile cu activitate principală de
comerţ cu amănuntul şi servicii de piaţă etc.
Toate aceste informaţii publicate se constituie în
surse secundare de date statistice.
3. Observarea statistică: conţinut,
necesitate, obiective.

Observarea datelor primare presupune parcurgerea


etapei de observare statistică. Orice proces de
investigaţie statistică începe cu observarea
statistică, modul în care este ea organizată şi
realizată influenţează, în continuare celelalte etape
ale procesului de cercetare statistică, deoarece
obţinerea unor date autentice, reale, exacte
determină calitatea etapelor de prelucrare, analiză şi
intepretare a rezultatelor.

Observarea statistică este prima etapă a


investigaţiei statistice, care constă în culegerea şi
înregistrarea în mod sistematic şi unitar a datelor
statistice, de la unităţile colectivităţii, referitoare la
toate caracteristicile include în programul cercetării.
3. Observarea statistică: conţinut,
necesitate, obiective.
Observarea trebuie fie corespunzătoare sub aspect
cantitativ şi calitativ.
▪ îndeplinirea condiţiei de cantitate (de volum)
înseamnă obţinerea în timpul prestabilit a întregului
volum de date necesar pentru atingerea tuturor
obiectivelor investigaţiei statistice;
▪ îndeplinirea condiţiei de calitate presupune
asigurarea autenticităţii, a caracterului real al
datelor, astfel încât rezultatele obţinute prin
prelucrarea acestor date să fie cât mai exacte şi să
ducă la adoptarea unor decizii cât mai pertinente.
În cazul în care pentru obţinerea datelor statistice
este necesară organizarea unei investigaţii statistice,
atunci ea trebuie făcută în conformitate cu un anumit
plan, pentru a ne asigura că obţinem, cu un minim de
resurse materiale şi financiare, rezultate cât mai
exacte şi mai pertinente.
4. Planul observării statistice
Planul sau Programul observării (în accepţiune mai
largă) cuprinde următoarele elemente:
▪ scopul observării;
▪ colectivitatea observată;
▪ unitatea de observare;
▪ timpul şi locul observării;
▪ lista caracteristicilor urmărite;
▪ formularele de înregistrare a datelor;
▪ măsuri organizatorice.
Programul observării, într-o accepţiune restrânsă,
cuprinde doar o listă a tuturor caracteristicilor ce vor fi
înregistrate, a indicatorilor necesari etc.
5. Metode de observare statistică -
clasificare
I. după frecvenţa înregistrării în timp a datelor
despre fenomenele şi procesele economico-sociale:
▪ observări curente;
▪ observări periodice;
▪ observări ocazionale.
II. după gradul de cuprindere a populaţiei de
observare delimitate:
▪ observări totale;
▪ observări parţiale;
III. după modul de obţinere a datelor:
▪ observări primare (directe);
▪ observări secundare (indirecte);
5.1 Recensământul statistic
Recensământul statistic, este o metodă de
observare totală, periodică, prin care un fenomen
este surprins în mod static, înregistrându-se valorile
caracteristicilor din programul observării referitoare la
un moment de referinţă numit „moment critic”, de la
toate unităţile populaţiei statistice.

5.2 Sondajul statistic


Sondajul statistic (selecţia statistică) este o metodă
de observare parţială, special organizată, una din
cele mai des utilizate metode de observare statistice
moderne, deoarece realizează o economie de
resurse materiale, financiare şi umane, înlocuind o
observare totală, de mare extindere, mai dificil de
organizat şi efectuat, cu cheltuieli considerabile.

5.3 Ancheta statistică


Ancheta statistică este o metodă de observare
parţială, cu caracter mai mult ocazional.
5.4 Panelul
Panelul este o metodă de observare parţială, realizată
pe baza unui eşantion fix, stabil, format din aceleaşi
unităţi care răspund la aceleaşi întrebări, la mai multe
momente succesive, diferite de timp (tehnica
longitudinală). În acest fel cercetarea se concentrează
pe identificarea, pe determinarea modificărilor
survenite de-a lungul timpului asupra fenomenului
studiat.

5.5 Monografia

Este o metodă de observare parţială, special


organizată, care presupune caracterizarea detaliată,
sub multiple aspecte, ale unei singure unităţi statistice
complexe (se elaborează monografia unui unei
întreprinderi, a unui judeţ, a unei localităţi etc.).
6. Erori de observare
Deoarece statistica operează cu seturi mari de date,
este posibilă apariţia, după fiecare etapă a procesului
de investigaţie statistică, a unor erori. Putem întâlni,
aşadar, erori de observare (de înregistrare), erori de
prelucrare, erori de analiză şi de interpretare.
În accepţiune largă, eroarea statistică reprezintă
diferenţa dintre nivelul real al unui indicator şi nivelul
obţinut în urma procesului de investigaţie statistică.
Clasificarea erorilor:
1. Erori de observare statistică
2. Erori de prelucrare
3. Erori de reprezentativitate
4. Erori de modelare
Erori de observare
Erori sistematice
▪ rezultă din acţiunea unui factor ce determină devierea
variabilei studiate întotdeauna în acelaşi sens;
▪ surse de astfel de erori: încălcarea regulilor de
delimitare a colectivităţii, a unităţii statistice, de
construire a chestionarelor, de selecţie a eşantionului;
▪ distorsiunile pot fi introduse de răspunsuri
incorecte ale persoanelor anchetate din motive
psihologice, economice etc.
Erori întâmplătoare
▪ se produc în ambele sensuri şi diferă ca mărime;
▪ influenţele lor se compenseză reciproc pe total şi nu
afectează rezultatele;
▪ sunt generate de cauze obiective şi nu pot fi evitate ci
doar minimizate.
Erori grosiere
▪ sunt cauzate de lipsa de experienţă, incompetenţă etc.
▪ trebuie depistate şi eliminate.
Concluzii

• Orice măsurare statistică implică erori


• Ceea ce interesează este ordinul de mărime al
erorii pentru a se cunoaşte între ce limite de
acceptabilitate se găseşte afirmaţia unei
investigaţii statistice
• Erorile generate în procesul de observare
statistică pot fi determinate
TEST 2
1. Erorile de înregistrare sistematice sunt acelea care:

a) se produc în urma unor accidente;


b) determină, de regulă, abateri în ambele în ambele
sensuri faţă de valorile reale ale fenomenului;
c) determină, de regulă, abateri într-un singur sens
faţă de valorile reale;
d) pot apărea datorită neînţelegerii şi neaplicării
corecte a instrucţiunilor datorită comodităţii sau relei-
credinţe;
e) nu pot fi înlăturate prin control statistic.

S-ar putea să vă placă și