Sunteți pe pagina 1din 29

STATISTICĂ

CURS 1

Concepte de bază utilizate în statistică

Prof.univ.dr. Emilia ŢIŢAN 1


Bibliografie

 E. Ţiţan, STATISTICĂ. TEORIE ŞI APLICAŢII ÎN


SECTORUL TERŢIAR, Ed. Meteor Press, Buc., 2005

 V. Voineagu, E. Ţiţan, S. Ghiţă, C. Boboc, D. Todose,


STATISTICĂ. BAZE TEORETICE ŞI APLICAŢII, Ed.
Economică, Buc., 2007

 M. Fernandes, STATISTICS FOR BUSINESS AND


ECONOMICS,
http://bookboon.com/int/student/statistics/statistics-for-
business-and-economics

2
Ce este statistica?
 Statistica este ştiinţa care se ocupă cu colectarea,
sistematizarea, analiza şi interpretarea datelor şi a
informaţiilor
 Statistica este o ştiinţă utilă cu aplicabilitate atât pentru
mediul de afaceri (la nivel microeconomic), cât şi pentru
guvern (la nivel macroeconomic) etc.
 Statistica nu poate fi evitată deoarece se regăseşte la
orice nivel şi stă la baza oricărei decizii

3
Concepte de bază
1. POPULAŢIA STATISTICĂ = totalitatea elementelor de aceeaşi
natură care au trăsături esenţiale comune şi care sunt supuse
unui studiu statistic.

 Termenul de populaţie se referă o colectivitate de obiecte, persoane,


păreri, gânduri, evenimente, opinii etc.
 O colectivitate devine, în general, finită, prin delimitarea sa în timp, spaţiu
şi ca formă organizatorică.
 Unele colectivităţi, deşi finite, sunt atât de numeroase, încât pot fi
considerate infinite.

2. EŞANTIONUL= submulţimea de elemente, selectate printr-o


anumită procedură, dintr-o colectivitate statistică.

4
Concepte de bază
3. UNITATEA STATISTICĂ = elementul unei populaţii
statistice, purtător al unui nivel al fiecărei caracteristici
supuse observării statistice.

 Unitatea statistică trebuie definită clar pentru a face posibilă atât


identificarea ei exactă, cât şi înregistrarea datelor.
 Unităţile statistice pot fi simple sau complexe.
 Unităţile complexe sunt rezultate ale organizării sociale ori economice
a colectivităţii statistice (exemplu: familia).

5
Concepte de bază
4. VARIABILA (CARACTERISTICA) STATISTICĂ = trăsătura, proprietatea,
însuşirea comună tuturor unităţilor unei colectivităţi şi care variază, ca nivel
sau valoare, de la o unitate a colectivităţii la alta.

Variabilele statistice pot fi clasificate după:


a) Modul de exprimare în:

 Variabilele CALITATIVE
- oferă răspunsuri categoriale la întrebari de tipul:
„Aveţi asigurare de viaţă?” (variantele de răspuns sunt limitate la „da” şi „nu”)
„Ce profesie aveţi?” (sunt mai multe variante de răspuns)

 Variabilele CANTITATIVE
- oferă răspunsuri sub formă numerică la întrebări de tipul
„Ce vârstă aveţi?”
„ Ce sumă de bani cheltuiţi lunar pentru petrecerea timpului liber?”

6
Concepte de bază
b) În funcţie de modul de variaţie variabilele numerice pot fi:

 de tip discret
Datele discrete sunt răspunsuri numerice care apar în urma unui proces de
numărare, pot lua doar anumite valori pe scara lor de variaţie care este o
submulţime a mulţimii numerelor întregi
Ex.: numărul de copii pe care îi are o familie, numărul de oraşe dintr-un judeţ, vârsta

 de tip continuu
Datele continue sunt răspunsuri numerice care apar în urma unui proces de
măsurare, pot lua orice valoare din scara lor de variaţie, care este un interval
de numere reale
Ex.: greutatea unei persoane, cifra de afaceri a unei firme, venitul unei persoane

7
Concepte de bază

c) În funcţie de numărul variantelor de răspuns în:

 Variabilele alternative (binare)


- pot avea două variante de răspuns, după modelul adevărat/fals din logică:
Ex: sex (M/F), stagiul militar (efectuat/neefectuat), mediul de rezidenţă (urban/rural);

 Variabilele nealternative
- pot lua mai multe valori/variante de răspuns:
Ex. salariu, profesie, cifră de afaceri, categorie de confort hotelieră

O caracteristică nealternativă poate fi transformată într-una alternativă,


printr-un proces de dihotomizare: salariul până la 4000 lei/peste 4000 lei.

8
Concepte de bază
5. DATELE STATISTICE pot fi clasificate:

a) După numărul de variabile cu care caracterizăm o unitate statistică:

 Datele univariate se referă la o singură variabilă statistică, adică înregistrăm o


singură valoare pentru fiecare unitate statistică.

 Datele bivariate sunt cele care se referă la două variabile statistice şi pentru
fiecare unitate statistică din colectivitate avem exact câte două valori.

 Datele multivariate sunt cele care se referă la trei sau mai multe variabile
statistice, obţinând deci câte trei sau mai multe valori pentru fiecare unitate
statistică din colectivitatea studiată.

Pentru angajaţii unei firme, salariul, sexul, vechimea, profesia reprezintă un set de
date multivariate, ce pot fi folosite în explicarea diferenţelor dintre venituri.

9
Concepte de bază
b) Din punct de vedere cronologic în:

 Datele de tip profil (secvenţă sau secţiune) = rezultatul unor măsurători


efectuate la un anumit moment dat de timp asupra uneia sau mai multor
variabile de interes pentru populaţia studiată.
Acest tip de date constituie „tăieturi informaţionale” transversale în raport cu axa timpului,
adică nu includ influenţa timpului asupra caracteristicilor studiate.

 Datele de tip serii de timp (serii cronologice) = rezultate ale unor


măsurători efectuate asupra caracteristicilor unităţilor populaţiei studiate, la
momente succesive sau la anumite intervale de timp.
Aceste date sunt clasificate în date de tip stoc sau de tip flux şi reprezintă secţiuni
informaţionale longitudinale în raport cu axa timpului.

 Datele de tip panel sunt combinaţii ale datelor de tip profil şi serii de timp.
Aceste date reprezintă rezultate ale măsurătorilor efectuate asupra caracteristicilor unităţilor
statistice dintr-un panel (eşantion fix), la anumite momente succesive de timp.

10
Concepte de bază
6. FRECVENŢA DE APARIŢIE a unei valori = numărul de apariţii al acestei valori
în populaţie.

7. STATISTICA DESCRIPTIVĂ = totalitatea metodelor de culegere, prezentare şi


caracterizare a unui set de date, în scopul de a descrie principalele trăsături ale
setului de date.

8. STATISTICA INFERENŢIALĂ = totalitatea metodelor ce permit estimări, luarea


unor decizii, realizarea unor previziuni sau alte generalizări pentru populaţia
statistică, pe baza rezultatelor obţinute pe un eşantion.

9. PARAMETRUL STATISTIC = un indicator statistic descriptiv calculat pentru o


populaţie statistică.

10. ESTIMATORUL = un indicator statistic calculat pe un eşantion şi care reprezintă


aproximarea valorii adevărate şi necunoscute a unui parametru ce caracterizează
populaţia statistică.

11
Măsurarea datelor. Tipuri de scale
 Toate datele statistice colectate sunt transpuse pe o scală de măsurare

 În funcţie de tipul datelor se utilizează o anumită scală de măsurare

 Prelucrarea statistică ţine cont de scala pe care datele sunt măsurate.

 Măsurarea presupune, uneori, asocierea unor etichete numerice variantelor variabilei

 Indicatorii statistici calculaţi pentru o variabilă depind de nivelul de scalare


utilizat.

 Patru niveluri de măsurare sunt utilizate (de la cea mai slabă la cea mai
puternică:

1. Scala nominală,

2. Scala ordinală

3. Scala de interval

4. Scala de raport.

12
SCALA NOMINALĂ
1. SCALA NOMINALĂ
 este utilizată pentru măsurarea variabilelor calitative
 clasifică unităţile statistice în grupe ai căror membri diferă după varianta de
răspuns
 oferă cea mai slabă formă de măsurare, deoarece nu se pot determina diferenţe
între clase şi nici nu se poate face o ordonare între categorii
Ex: ocupaţia, sexul, statutul marital, tipul de asigurare

 Numerele ataşate unor observaţii reprezintă eticheta categoriei respective.


Presupunem că pentru variabila „ocupaţia”, s-au stabilit variantele de răspuns codificate:
actor – 1, muncitor – 2, inginer – 3, economist – 4
10 persoane au fost întrebate ce ocupaţie au, înregistrându-se variantele: 3; 1; 3; 4; 4; 2; 4; 3; 2; 2.
Media acestor valori este 2,8 – valoare lipsită complet de semnificaţie.
Tot ceea ce putem face cu aceste date este să numărăm de câte ori apare fiecare variantă de
răspuns şi să calculăm proporţia persoanelor din fiecare categorie ocupaţională.

13
SCALA ORDINALĂ

2. SCALA ORDINALĂ
 este utilizată pentru măsurarea variabilelor calitative ale căror
variante de răspuns pot fi ordonate.
 Unităţile pot fi înşiruite una relativ cu cealaltă şi se poate realiza o
ierarhizare, dar distanţa între numerele acordate nu este obligatoriu
egală.
Variabilă Clase Clase
Variabilă ordinală
ordinală ordonate ordonate
*
Primare
**
Gimnaziale Categorii ale
Studii ***
Liceale hotelurilor
****
Universitare
*****

14
SCALA DE INTERVALE

3. SCALA DE INTERVALE (sau cardinală)

 este prima scală numerică


 permite interpretarea ordinii notărilor pe scală şi a diferenţelor dintre ele.
 intervalele dintre categoriile de pe scală sunt presupuse a fi egale
 o particularitate a scalei de interval este absenţa unui punct zero absolut.
 numerele stabilite pe scală sunt arbitrare; chiar dacă unui punct de pe scală i se
atribuie valoarea „0“, acest lucru nu reprezintă absenţa absolută a caracteristicii
măsurate.
Ex. Punctul „0“ pe scala de temperatură Celsius sau Fahrenheit
 Judecăţi comparative ca „de două ori mai mult”, „de patru ori mai puţin” etc. nu
pot fi făcute pentru compararea valorilor specifice măsurate pe o scală de
interval.
 Nu are sens multiplicarea sau divizarea valorilor.

15
SCALA DE RAPORT
4. SCALA DE RAPORT (proporţională)

 se utilizează pentru măsurarea variabilelor numerice


 este scala care permite ca afirmaţiile făcute pe baza operaţiilor de
adunare, diferenţă, multiplicare sau divizare să aibă sens.
 Un punct zero absolut sugerează absenţa totală a caracteristicii sau însuşirii
care este studiată.

Variabilă numerică Nivel de măsurare


Greutatea (în kg) Raport
Vârsta (în ani sau zile) Raport
Salariul (în lei, EUR etc.) Raport

16
Surse de date statistice
 Sursele de date statistice se pot clasifica în: surse primare şi
surse secundare de date.
 Dacă datele statistice sunt obţinute direct prin organizarea unei observări
statistice (totale sau parţiale), atunci persoana sau instituţia care a realizat o
astfel de observare este o sursă primară de date statistice.
 Dacă datele sunt deja prelucrate în tabele şi grafice (în scopuri publice sau
private) şi publicate de persoane sau instituţii specializate, ele vor fi surse
secundare de date.

 Datele primare sunt obţinute prin observări totale sau


parţiale
 Dacă înregistrarea valorilor caracteristicilor urmărite se face pentru toate
unităţile statistice din colectivitatea generală (de ex. recensământul
populaţiei)vorbim de observare totală.
 Dacă înregistrarea valorilor caracteristicilor urmărite se face de la o parte a
colectivităţii generale vorbim de observări parţiale, (de ex. sondajul statistic).

17
Surse de date statistice
 Indiferent de amploarea observării (totale sau parţiale)
culegerea datelor se poate face prin:
1. Observări curente (înregistrare permanentă, de ex.
evenimentele demografice: natalitate, mortalitate etc.)

2. Observări periodice (datele se înregistrează la intervale de


timp precizate)

3. Observări directe (datele sunt înregistrate de către operator


sau cercetător direct de la unităţile statistice)

4. Observări indirecte (datele se înregistrează din diverse surse


care au consemnat anterior fenomenul studiat, de ex. documentele
contabile)

18
Etapele cercetării statistice
 Etapele cercetării statistice sunt:
 OBSERVAREA STATISTICĂ - etapă în care se culeg date de la
unităţile colectivităţii studiate, pentru toate caracteristicile
urmărite;
 PRELUCRAREA STATISTICĂ - etapă în care datele culese sunt
sistematizate şi sunt calculaţi indicatorii statistici primari şi
derivaţi, absoluţi şi sintetici ce caracterizează fenomenul studiat;
 ANALIZA ŞI INTERPRETAREA REZULTATELOR - etapă în care
sunt verificate ipotezele, formulate concluziile şi fundamentate
procesele decizionale.

19
Observarea statistică
 Observarea statistică reprezintă acţiunea de culegere, de la
unităţile statistice, a valorilor referitoare la caracteristicile
urmărite, după criterii riguros stabilite.

 Observarea trebuie să îndeplinească anumite condiţii: de


cantitate (volum) şi calitate
 satisfacerea condiţiei de cantitate presupune obţinerea, în timpul stabilit, a tuturor
datelor necesare pentru efectuarea studiului statistic;
 satisfacerea condiţiei de calitate presupune asigurarea conţinutului veridic al datelor
culese, în vederea obţinerii unor rezultate cât mai exacte, afectate de erori cât mai
mici.

 Planul observării statistice cuprinde:


1. scopul observării
2. delimitarea colectivităţii şi unităţii de observare
3. stabilirea caracteristicilor ce vor fi înregistrate
4. alegerea formularelor de înregistrare
5. delimitarea timpului şi locului observării
6. stabilirea măsurilor organizatorice.

20
Planul observării statistice
1. Scopul observării se formulează în momentul declanşării
procesului cercetării şi depinde de scopul general al
investigaţiei statistice.

2. Delimitarea colectivităţii şi unităţilor de observare –


depinde de modul de utilizare a metodelor de observare.
- constă în localizarea în timp, spaţiu şi dpvd organizatoric a
colectivităţii studiate
- alegerea unităţii de observare în conformitate cu scopul urmărit şi
modul de organizare a colectivităţii.

3. Stabilirea caracteristicilor ce urmează a fi înregistrate formează


programul observării şi reprezintă partea cea mai importantă a
planului observării.
Selectarea variabilelor din programul observării se va realiza astfel încât să
permită studierea sub aspectele de interes, a fenomenului analizat,
evitându-se redundanţa de informaţii.

21
Planul observării statistice
4. Formularele de înregistrare reprezintă suportul material pe
care se vor înregistra datele culese. Pot fi de două tipuri: fişă
sau listă.

Fişa este un formular individual, completat de către o singură unitate de


observare.

Lista este un formular colectiv, completat cu date pentru mai multe unităţi
de observare.

5. Timpul observării indică două aspecte:


 timpul la care se referă datele (poate fi un singur moment, numit „moment
critic” sau un interval de timp, în funcţie de tipul fenomenului analizat (static
sau dinamic))
 timpul când se efectuează înregistrarea datelor (este, de regulă, un interval,
cu o dată limită precisă)

6. Măsurile organizatorice cuprind toate elementele care


asigură buna organizare şi desfăşurare a observării statistice.

22
Sondajul statistic

 Sondajul sau selecţia statistică este o metodă


de observare statistică parţială frecvent utilizată.
Avantaje ale utilizării sondajului statistic:
 Costuri materiale şi umane reduse
 Programul cercetării este amplu
 sondajul statistic devine absolut necesar când prin cercetarea
statistică se distrug unităţile statistice supuse analizei, ca de pildă în
controlul statistic al calităţii producţiei
 sondajul statistic poate fi utilizat pentru verificarea programului
unei observări totale şi pentru verificarea şi testarea unei ipoteze
statistice.

23
Sondajul statistic

 Sondajul statistic implică un grad de incertitudine referitor la


cunoaşterea situaţiei din colectivitatea generală
 Folosirea selecţiei aleatoare (eşantionarea probabilistă), în care
fiecare unitate statistică din colectivitatea generală are
şansa calculabilă şi diferită de zero să fie selecţionată în
eşantion, permite calcularea mărimii erorii şi stabilirea
prealabilă a acestei mărimi.
 Sondajele pot fi repetate sau nerepetate, după cum există
posibilitatea revenirii unei aceleaşi unităţi în cadrul aceluiaşi
eşantion.
 Pentru populaţiile de volum foarte mare, considerate populaţii
infinite, deosebirea dintre sondajul repetat şi sondajul nerepetat
dispare.

24
Procedee de selecţie

1. Procedeul „urnei cu bile”

 Dacă selecţia se face cu revenire eşantionul se numeşte eşantion aleator repetat.


La fiecare extragere, probabilitatea ca o unitate să fie extrasă este 1/N, iar după
ultima extragere, în baza de seleţie rămân N unităţi statistice. Numărul
eşantioanelor distincte, de volum n, ce pot fi extrase în sondajul cu revenire
este n
N
 Dacă selecţia se face fără revenire eşantionul se numeşte eşantion aleator nerepetat.
După extragerea primei unităţi în baza de selecţie rămân (N-1) unităţi, după a
doua extragere (N-2) unităţi, astfel încât după ultima extragere, în urnă rămân
N-n unităţi statistice.

Numărul eşantioanelor distincte, de volum n, ce pot fi extrase în sondajul


aleator simplu fără revenire este

C Nn
25
Procedee de selecţie
 Procedeul mecanic de selecţie a eşantionului presupune prelevarea
unităţilor din colectivitatea generală după un interval predeterminat,
denumit frecvent pas de numărare aplicat bazei de sondaj.
N
 Pasul de numărare se calculează după formula  exemplu, pentru
kde
n
a selecta 50 de unităţi dintr-o colectivitate generală de 1000 unităţi, se
va alege tot a 20-a unitate).
 Asigurarea caracterului aleator al eşantionului este dependentă de
caracterul întâmplător al includerii unităţilor colectivităţii generale în
baza de sondaj, după un criteriu ce nu are legătură cu cercetarea
efectuată.
 Numărul iniţial de la care se începe citirea se alege aleator între 1 şi k,
după care se selectează tot a k-a unitate, până la completarea
eşantionului de n unităţi statistice.

26
Eroarea statistică
 Orice măsurare statistică conţine erori
 Eroarea = diferenţa dintre rezultatul obţinut prin înregistrare şi
mărimea reală a caracteristicilor observate
 Erorile pot fi de înregistrare şi de calcul
 Clasificarea erorilor:
1. Erori de observare statistică
2. Erori de prelucrare
3. Erori de reprezentativitate
4. Erori de modelare

 Erorile de observare sunt:


1. Erori sistematice
2. Erori întâmplătoare
3. Erori grosiere (greşeli)

27
Erori de observare
1. Erori sistematice
- rezultă din acţiunea unui factor ce determină devierea variabilei studiate întotdeauna în
acelaşi sens
- surse de astfel de erori: încălcarea regulilor de delimitare a colectivităţii, a unităţii
statistice, de construire a chestionarelor, de selecţie a eşantionului
- distorsiunile pot fi introduse de răspunsuri incorecte ale persoanelor anchetate din
motive psihologice, economice etc. (de ex. dorinţa de a face impresie, de a răspunde pe
placul anchetatorului sau de a ascunde anumite aspecte - întrebări cu incidenţă fiscală sau ce
implică interese economice)

2. Erori întâmplătoare
- se produc în ambele sensuri şi diferă ca mărime
- influenţele lor se compenseză reciproc pe total şi nu afectează rezultatele
- sunt generate de cauze obiective şi nu pot fi evitate ci doar minimizate

3. Erori grosiere
- sunt cauzate de lipsa de experienţă, incompetenţă etc.
- trebuie depistate şi eliminate

28
Erori de observare

 Concluzii
 Orice măsurare statistică implică erori

 Ceea ce interesează este ordinul de mărime al erorii


pentru a se cunoaşte între ce limite de acceptabilitate se
găseşte afirmaţia unei investigaţii statistice

 Erorile generate în procesul de observare statistică pot fi


determinate

29

S-ar putea să vă placă și