Sunteți pe pagina 1din 27

BAZELE STATISTICII

Prof.univ.dr. Daniela MANEA

CURS 1_2

Curs introductiv
Concepte de bază utilizate în statistică 1
Informații utile

 Planul de invatamant anul I CSIE/IE


https://planinvatamant.ase.ro/SelectiePlan1.aspx?pp=15

 Platforma online (curs si seminar)


https://online.ase.ro

 Email
daniela.manea@csie.ase.ro
Obiectivele disciplinei

1. Dezvoltarea deprinderilor de aplicare a metodelor


statistice in vederea fundamentarii deciziei de
afaceri

2. Utilizarea pachetelor software specializate în


prelucrarea si analiza datelor statistice

3
Modul de evaluare

Examen, 5 puncte credit

30% evaluare pe parcurs

teste, teme, activitate la seminar

70% examen

4
Bibliografie

 D. Manea, STATISTICĂ. Teorie și aplicatii, Editura ASE, Bucuresti, 2013

 D. Manea, STATISTICĂ APLICATĂ Editura Meteor Press, Bucuresti, 2016

 E. Ţiţan, STATISTICĂ. TEORIE ŞI APLICAŢII ÎN SECTORUL TERŢIAR, Ed. Meteor


Press, Buc., 2005

 V. Voineagu, E. Ţiţan, S. Ghiţă, C. Boboc, D. Todose, STATISTICĂ. BAZE


TEORETICE ŞI APLICAŢII, Ed. Economică, Buc., 2007

 M. Fernandes, STATISTICS FOR BUSINESS AND ECONOMICS,


http://bookboon.com/int/student/statistics/statistics-for-business-and-economics
Ce este statistica?

 Pronunţarea cuvântului “statistică” vă face să vă gândiţi la: rata şomajului,


sondaje, studii de piaţă sau este o disciplină de studiu la facultate şi nimic
mai mult?

 Statistica este o ştiinţă utilă cu aplicabilitate pentru mediul de afaceri (la nivel
microeconomic), guvern (la nivel macroeconomic), ştiinţele sociale etc.

 Statistica “minte” doar când nu este aplicată corect

 Statistica formează gândirea critică, fie că sunteţi în sala de curs, la locul de


muncă, fie în viaţa de zi cu zi , aşadar timpul petrecut studiind această
disciplină va fi răsplătit în multe feluri

 Statistica nu poate fi evitată deoarece se regăseşte la orice nivel şi stă la


baza oricărei decizii

6
Ce este statistica?

 Statistica este ştiinţa care se ocupă cu obtinerea,


clasificarea/sistematizarea, analiza şi interpretarea datelor in
scopul obtinerii informaţiilor necesare intr-un process
decizional

 Statisticianul nu este o persoană care centralizeaza date


statistice sub forma de tabele si grafice sau calculează medii

 Statisticianul profesionist înregistrează, obtine date, le


analizează şi formuleaza concluzii adecvate, stabilind care
sunt informaţiile relevante pentru o anumită situaţie şi dacă
concluziile obţinute sunt de încredere sau nu.

7
Concepte de bază

1. POPULAŢIA STATISTICĂ (colectivitate generală)= totalitatea


elementelor de aceeaşi natură care au trăsături esenţiale comune
şi care sunt supuse unui studiu statistic.

➢ Termenul de populaţie se referă o colectivitate de obiecte, persoane,


păreri, gânduri, evenimente, opinii etc.
➢ O colectivitate devine, în general, finită, prin delimitarea sa în timp, spaţiu şi
ca formă organizatorică.
➢ Unele colectivităţi, deşi finite, sunt atât de numeroase, încât pot fi
considerate infinite.

2. EŞANTIONUL (colectivitate parţială, colectivitate de selecţie)=


submulţimea de elemente selectate dintr-o colectivitate statistică.
8
Concepte de bază

3. UNITATEA STATISTICĂ = elementul constitutiv al unei colectivităţi


statistice care este purtătorul unui nivel al fiecărei caracteristici
supuse observării şi cercetării statistice.

➢ Unitatea statistică trebuie definită clar pentru a face posibilă atât


identificarea ei exactă, cât şi înregistrarea datelor.

➢ Unităţile statistice pot fi simple sau complexe. Unităţile complexe sunt


rezultate ale organizării sociale ori economice a colectivităţii statistice
(exemplu: familia).

4. VARIABILA (CARACTERISTICA) STATISTICĂ = trăsătura, proprietatea,


însuşirea comună tuturor unităţilor unei colectivităţi şi care variază, ca
nivel, variantă sau valoare, de la o unitate a colectivităţii la alta.

9
Concepte de bază

Clasificarea variabilelor statistice


Variabilele statistice pot fi clasificate după:

a) Modul de exprimare în:


➢ Variabilele CALITATIVE
- oferă răspunsuri categoriale la întrebari de tipul:
„Aveţi asigurare de viaţă?” (variantele de răspuns sunt limitate la „da” şi „nu”)
„Ce profesie aveţi?” (sunt mai multe variante de răspuns)

➢ Variabilele CANTITATIVE
- oferă răspunsuri sub formă numerică la întrebări de tipul
„Ce vârstă aveţi?”
„ Ce sumă de bani cheltuiţi lunar pentru petrecerea timpului liber?”
10
Concepte de bază

b) În funcţie de modul de variaţie variabilele numerice pot fi:


➢ de tip discret
Datele discrete sunt răspunsuri numerice care apar în urma unui proces de numărare,
pot lua doar anumite valori pe scara lor de variaţie care este o submulţime a mulţimii
numerelor întregi

Ex.: numărul de copii pe care îi are o familie, numărul de oraşe dintr-un judeţ, vârsta

➢ de tip continuu
Datele continue sunt răspunsuri numerice care apar în urma unui proces de măsurare,
pot lua orice valoare din scara lor de variaţie, care este un interval de numere reale

Ex.: greutatea unei persoane, cifra de afaceri a unei firme, venitul unei persoane

În practică, continuitatea unor variabile poate să fie limitată de precizia măsurătorilor


(exemplu: vârsta în ani împliniţi). Unele variabile, deşi discrete, au salturile discontinuităţii atât
11
de mici în raport cu ordinul de mărime al lor, încât pot fi considerate continue (exemplu:
populaţia unei ţări).
Concepte de bază

c) În funcţie de numărul variantelor de răspuns în:

➢ Variabilele alternative (binare)


- pot avea două variante de răspuns, după modelul adevărat/fals din logică:
Ex: genul persoanei (M/F), promovabilitatea (promovat/nepromovat; admis/respins),

mediul de rezidenţă (urban/rural);

➢ Variabilele nealternative
- pot lua mai multe valori/variante de răspuns:
Ex. salariu, profesie, cifră de afaceri, categorie de confort hotelieră

O caracteristică nealternativă poate fi transformată într-una alternativă, printr-un proces de


dihotomizare: salariul până la 4000 lei/peste 4000 lei.
12
Concepte de bază

5. DATELE STATISTICE pot fi clasificate:


A) După numărul de variabile cu care caracterizăm o unitate
statistică:

 Datele univariate se referă la o singură variabilă statistică, adică


înregistrăm o singură valoare pentru fiecare unitate statistică.
Metodele statistice vor fi folosite pentru:
- sistematizarea datelor,
- analiza trăsăturilor esenţiale ale setului de date (tendinţa centrală)
- analiza variabilităţii datelor
- analiza distribuţiei valorilor observate în raport cu valorile tipice
determinate.
13
Concepte de bază

 Datele bivariate sunt cele care se referă la două variabile statistice şi


pentru fiecare unitate statistică din colectivitate avem exact câte
două valori.
Metodele statistice vor fi folosite pentru a caracteriza separat datele pentru
fiecare variabilă (ca în cazul datelor univariate), dar şi pentru a studia
legătura, dependenţa dintre cele două variabile considerate.

 Datele multivariate sunt cele care se referă la trei sau mai multe
variabile statistice, obţinând deci câte trei sau mai multe valori
pentru fiecare unitate statistică din colectivitatea studiată.
Deşi sunt multivariate, datele pot fi analizate separat (pentru fiecare
variabilă), sau în interdependenţă unele cu altele.

Pentru angajaţii unei firme, salariul, sexul, vechimea, profesia reprezintă un set
de date multivariate, ce pot fi folosite în explicarea diferenţelor dintre venituri.
Concepte de bază

B) Din punct de vedere cronologic în:


 Datele de tip profil (date de tip secvenţă sau de tip secţiune)
reprezintă rezultatul unor măsurători efectuate la un anumit
moment dat de timp asupra uneia sau mai multor variabile de
interes pentru populaţia studiată.
Acest tip de date constituie „tăieturi informaţionale” transversale în
raport cu axa timpului (adică nu includ influenţa timpului asupra
caracteristicilor studiate), efectuate într-o populaţie statistică la un
moment dat.

Numărul observaţiilor concide, în acest caz, cu numărul unităţilor


statistice din colectivitatea studiată.

15
Concepte de bază

 Datele de tip serii de timp (serii cronologice) reprezintă rezultate


ale unor măsurători efectuate asupra caracteristicilor unităţilor
populaţiei studiate, la momente succesive sau la anumite
intervale de timp.
Aceste date sunt clasificate în date de tip stoc sau de tip flux şi
reprezintă secţiuni informaţionale longitudinale în raport cu axa timpului.

 Datele de tip panel sunt combinaţii ale datelor de tip profil şi serii
de timp.
Aceste date reprezintă rezultate ale măsurătorilor efectuate asupra
caracteristicilor unităţilor statistice dintr-un panel (eşantion fix), la anumite
momente succesive de timp. Se obţin astfel, tăieturi informaţionale
transversale şi longitudinale în raport cu axa timpului, trăsătura principală
a acestor date fiind simultaneitatea.
Concepte de bază

6. FRECVENŢA DE APARIŢIE a unei variante/valori reprezintă numărul de apariţii


al acestei variante/valori în colectivitate.

7. STATISTICA DESCRIPTIVĂ poate fi definită ca totalitatea metodelor de


culegere, prezentare şi caracterizare a unui set de date, în scopul de a
descrie principalele trăsături ale setului de date.

8. STATISTICA INFERENŢIALĂ poate fi definită ca totalitatea metodelor ce


permit estimări, luarea unor decizii, realizarea unor previziuni sau alte
generalizări pentru colectivitatea generală, pe baza rezultatelor obţinute
pe un eşantion.

9. PARAMETRUL STATISTIC reprezintă un indicator statistic descriptiv calculat


pentru o colectivitate totală (generală). Indicatorul statistic ce este
calculat într-un eşantion şi pe baza căruia se estimează parametrul
colectivităţii generale se numeşte statistică.

10. ESTIMATORUL reprezintă un indicator statistic calculat pe un eşantion care


reprezintă aproximarea valorii adevărate şi necunoscute a unui parametru
ce caracterizează colectivitatea generală.

17
Măsurarea datelor. Tipuri de scale

 Prelucrarea statistică ţine cont de tipul datelor şi de scala pe care acestea


sunt măsurate.
 Toate datele statistice colectate sunt transpuse pe o scală de măsurare
 Măsurarea presupune, în anumite cazuri, asocierea unor numere
variantelor/valorilor variabilei de interes
 Indicatorii statistici calculaţi pentru o variabilă depind de nivelul de scalare
utilizat.
 Patru niveluri de măsurare sunt utilizate (de la cea mai slabă la cea mai
puternică:
1. scala nominală,
2. scala ordinală
3. scala de interval
4. scala de raport.

 Prelucrarea datelor statistice se va face în mod distinct, în funcţie de gradul


de „rafinament” al scalei.
18
SCALA NOMINALĂ

 SCALA NOMINALĂ (de clasificare sau scala denumirilor) este


utilizată pentru măsurarea variabilelor de tip nenumeric (calitativ) .

 Ea clasifică subiecţii în grupe ai căror membri diferă după


caracteristica scalară (nenumerică), fără să implice existenţa unei
gradări sau distanţe între grupe.

 Numerele ataşate unor observaţii reprezintă eticheta categoriei


respective.

 Scala nominală oferă cea mai slabă formă de măsurare,


deoarece nu se pot determina diferenţe între clase şi nici nu se
poate face o ordonare între categorii.

19
SCALA NOMINALĂ

 Exemple: ocupaţia, genul, statutul marital, tipul de


asigurare etc.
 Deşi variantele sunt convertite în numere, caracteristicile
rămân de tip nenumeric, calitativ şi orice prelucrare
aritmetică este lipsită de sens.
Presupunem că pentru variabila „ocupaţia”, s-au stabilit variantele de
răspuns codificate: actor – 1, muncitor – 2, inginer – 3, economist – 4, şi
10 persoane au fost întrebate ce ocupaţie au, înregistrându-se
variantele: 3; 1; 3; 4; 4; 2; 4; 3; 2; 2. Media acestor valori este 2,8 –
valoare lipsită complet de semnificaţie. Tot ceea ce putem face cu
aceste date este să numărăm de câte ori apare fiecare variantă de
răspuns şi să calculăm (în acest exemplu) proporţia persoanelor care
se încadrează în fiecare categorie ocupaţională.
SCALA NOMINALĂ

Prelucrări posibile:
- Determinarea frecvenţelor absolute (numărăm de câte
ori apare fiecare variantă de răspuns)
- Determinarea frecvenţelor relative (calculăm proporţia
unităţilor statistice din fiecare categorie)
- Determinarea valorii modale (varianta de raspuns cu
frecventa cea mai mare)
SCALA ORDINALĂ

 SCALA ORDINALĂ este utilizată pentru măsurarea variabilelor de tip


nenumeric (calitativ) ale căror variante de răspuns pot fi ordonate.
 Unităţile pot fi înşiruite una relativ cu cealaltă şi se poate realiza, astfel,
o ierarhizare, dar distanţa între numerele acordate nu este obligatoriu
egală.
 Numerele pe scala ordinală nu reprezintă intervale egale pe scala de
măsurare.

22
SCALA ORDINALĂ

 Prelucrări posibile:

 - Realizarea unei ierahizări a unităţilor statistice


- Determinarea frecvenţelor absolute
- Determinarea frecvenţelor relative
- Determinarea frecvenţelor absolute şi relative cumulate
 - Determinarea valorilor modală şi mediană
SCALA DE INTERVALE

 SCALA DE INTERVALE (sau cardinală) este prima scală numerică, ce


foloseşte unităţi de măsurare egale.

 Permite nu numai interpretarea ordinii notărilor pe scală, dar şi a


diferenţelor dintre ele.

 În plus, faţă de scala nominală şi cea ordinală, intervalele dintre


categoriile de pe scală sunt presupuse a fi egale.

 O caracteristică a scalei de interval este absenţa unui punct zero


absolut.

24
SCALA DE INTERVALE

 Pe scala de interval, numerele stabilite pe scală sunt


arbitrare. Chiar dacă unui punct de pe scală i se atribuie
valoarea „0“, acest lucru nu reprezintă absenţa absolută a
caracteristicii măsurate.

Punctul „0“ pe scala de temperatură Celsius sau Fahrenheit ilustrează


acest lucru.

 Judecăţi comparative ca „de două ori mai mult”, „de


patru ori mai puţin” etc. nu pot fi făcute pentru
compararea valorilor specifice măsurate pe o scală de
interval.

 Nu are sens multiplicarea sau divizarea valorilor.


SCALA DE RAPORT

 SCALA DE RAPORT (proporţională) se utilizează pentru măsurarea


variabilelor numerice, fiind scala care permite ca afirmaţiile făcute pe
baza operaţiilor de adunare, diferenţă, multiplicare sau divizare să
aibă sens.
 Pentru variabilele măsurate pe această scală putem afirma, cu precizie, că, de pildă, o
persoană cu vârsta de 30 ani are de două ori mai mult decât cea de 15. Punctul zero nu este
neapărat necesar să fie o valoare măsurată a variabilei; este suficient să existe efectiv pe
scală.

 Timpul de alergare pe distanţa de 50 metri este măsurat pe o scală de raport (proporţională),


deşi nimeni nu poate practic parcurge distanţa de 50 metri în 0,00 secunde.

 Un punct zero absolut sugerează absenţa totală a caracteristicii sau însuşirii care
este studiată.

26
SCALA DE RAPORT

 Prelucrări posibile:

- Determinarea frecvenţelor absolute şi relative


- Determinarea indicatorilor tendinţei centrale, ai
variabilităţii şi ai formei distribuţiei

S-ar putea să vă placă și