Documente Academic
Documente Profesional
Documente Cultură
CURS 1
Concepte de bază utilizate în statistică
1
BAZELE STATISTICII
Email cmitrut@ase.ro
mitrut.constantin@gmail.com
2
Obiectivele disciplinei
1. Dezvoltarea deprinderilor de aplicare a
metodelor statistice in vederea fundamentarii
deciziei de afaceri
3
Modul de evaluare
Examen, 5 puncte credit
40% evaluare pe parcurs
30% teste online curs
10% activitate la seminar
60% examen
4
Bibliografie
A. Isaic-Maniu, C. Mitruţ, V. Voineagu, STATISTICĂ, Ed. Universitară,
Buc., 2004
http://bookboon.com/int/student/statistics/statistics-for-business-and-economics
6
CE ESTE STATISTICA
Decizie
Informatii
Date
7
CE ESTE STATISTICA
Statistica studiaza
colectivitati/populatii mari
8
CE ESTE STATISTICA
Statistica pune in evidenta
caracteristici/proprietati stabile- legi
statistice/stochastice
Lege statistica – poate fi aplicata doar
la nivelul intregii colectivitati.
Stochastic vs deterministic
9
Descriptiv vs Inferential
Statistica descriptiva – implica
sistematizarea gruparea,calculul unor
indicatori derivati, prezentarea rezultatelor
pentru a obtine informatii suport pentru
decizii
Metodele Statisticii descriptive
Grafice
Indicatori descriptivi numerici.
Metodele pot fi utilizate
La nivel de populatie
La nivel de esantion
10
Descriptiv vs Inferential
Statistica inferentiala– un set de
proceduri folosite pentru a face
predictii referitoare la o populatie
studiind proprietatile unei parti a
populatiei ( esantion)
11
POPULATIE/ESANTION
POPULATIE – totalitatea elementelor
supuse cercetarii statistice
ESANTION - o parte a populatiei
selectata pentru studiu
PARAMETRU – indicator la nivelul
populatiei
STATISTICA/ESTIMATOR – indicator
la nivelul esantionului
Concepte de bază
1. POPULAŢIA STATISTICĂ (colectivitate generală)= totalitatea
elementelor de aceeaşi natură care au trăsături esenţiale comune şi
care sunt supuse unui studiu statistic.
Termenul de populaţie se referă o colectivitate de obiecte, persoane, păreri,
gânduri, evenimente, opinii etc.
O colectivitate devine, în general, finită, prin delimitarea sa în timp, spaţiu şi ca
formă organizatorică.
Unele colectivităţi, deşi finite, sunt atât de numeroase, încât pot fi considerate
infinite.
13
Concepte de bază
3. UNITATEA STATISTICĂ = elementul constitutiv al unei
colectivităţi statistice care este purtătorul unui nivel al fiecărei
caracteristici supuse observării şi cercetării statistice.
14
Concepte de bază
Clasificarea variabilelor statistice
Variabilele statistice pot fi clasificate după:
15
Concepte de bază
16
Concepte de bază
17
Concepte de bază
5. DATELE STATISTICE pot fi clasificate:
A) După numărul de variabile cu care caracterizăm o
unitate statistică:
Datele univariate se referă la o singură variabilă statistică,
adică înregistrăm o singură valoare pentru fiecare unitate
statistică.
Metodele statistice vor fi folosite pentru:
- sistematizarea datelor,
- analiza trăsăturilor esenţiale ale setului de date (tendinţa
centrală)
- analiza variabilităţii datelor
- analiza distribuţiei valorilor observate în raport cu valorile
tipice determinate.
18
Concepte de bază
Datele bivariate sunt cele care se referă la două variabile statistice şi
pentru fiecare unitate statistică din colectivitate avem exact câte două
valori.
Metodele statistice vor fi folosite pentru a caracteriza separat datele pentru
fiecare variabilă (ca în cazul datelor univariate), dar şi pentru a studia legătura,
dependenţa dintre cele două variabile considerate.
Datele multivariate sunt cele care se referă la trei sau mai multe
variabile statistice, obţinând deci câte trei sau mai multe valori pentru
fiecare unitate statistică din colectivitatea studiată.
Deşi sunt multivariate, datele pot fi analizate separat (pentru fiecare variabilă),
sau în interdependenţă unele cu altele.
Pentru angajaţii unei firme, salariul, sexul, vechimea, profesia reprezintă un set
de date multivariate, ce pot fi folosite în explicarea diferenţelor dintre venituri.
Concepte de bază
B) Din punct de vedere cronologic în:
Datele de tip profil (date de tip secvenţă sau de tip
secţiune) reprezintă rezultatul unor măsurători efectuate la un
anumit moment dat de timp asupra uneia sau mai multor
variabile de interes pentru populaţia studiată.
Acest tip de date constituie „tăieturi informaţionale” transversale în
raport cu axa timpului (adică nu includ influenţa timpului asupra
caracteristicilor studiate), efectuate într-o populaţie statistică la un
moment dat.
Numărul observaţiilor concide, în acest caz, cu numărul unităţilor
statistice din colectivitatea studiată.
20
Concepte de bază
Datele de tip serii de timp (serii cronologice) reprezintă
rezultate ale unor măsurători efectuate asupra caracteristicilor
unităţilor populaţiei studiate, la momente succesive sau la
anumite intervale de timp.
Aceste date sunt clasificate în date de tip stoc sau de tip flux şi
reprezintă secţiuni informaţionale longitudinale în raport cu axa
timpului.
Datele de tip panel sunt combinaţii ale datelor de tip profil şi
serii de timp.
Aceste date reprezintă rezultate ale măsurătorilor efectuate asupra
caracteristicilor unităţilor statistice dintr-un panel (eşantion fix), la
anumite momente succesive de timp. Se obţin astfel, tăieturi
informaţionale transversale şi longitudinale în raport cu axa timpului,
trăsătura principală a acestor date fiind simultaneitatea.
Măsurarea datelor. Tipuri de scale
Prelucrarea statistică ţine cont de tipul datelor şi de scala pe care
acestea sunt măsurate.
Toate datele statistice colectate sunt transpuse pe o scală de
măsurare
Măsurarea presupune, în anumite cazuri, asocierea unor numere
variantelor/valorilor variabilei de interes
Indicatorii statistici calculaţi pentru o variabilă depind de nivelul de
scalare utilizat.
Patru niveluri de măsurare sunt utilizate (de la cea mai slabă la cea mai
puternică:
1. scala nominală,
2. scala ordinală
3. scala de interval
4. scala de raport.
Prelucrarea datelor statistice se va face în mod distinct, în funcţie de
gradul de „rafinament” al scalei.
22
SCALA NOMINALĂ
SCALA NOMINALĂ (de clasificare sau scala denumirilor)
este utilizată pentru măsurarea variabilelor de tip nenumeric
(calitativ) .
Ea clasifică subiecţii în grupe ai căror membri diferă după
caracteristica scalară (nenumerică), fără să implice existenţa
unei gradări sau distanţe între grupe.
Numerele ataşate unor observaţii reprezintă eticheta categoriei
respective.
Scala nominală oferă cea mai slabă formă de măsurare,
deoarece nu se pot determina diferenţe între clase şi nici nu se
poate face o ordonare între categorii.
23
SCALA NOMINALĂ
Exemple: ocupaţia, sexul, statutul marital, tipul de
asigurare etc.
Deşi variantele sunt convertite în numere, caracteristicile
rămân de tip nenumeric, calitativ şi orice prelucrare
aritmetică este lipsită de sens.
Presupunem că pentru variabila „ocupaţia”, s-au stabilit variantele de
răspuns codificate: actor – 1, muncitor – 2, inginer – 3, economist – 4,
şi 10 persoane au fost întrebate ce ocupaţie au, înregistrându-se
variantele: 3; 1; 3; 4; 4; 2; 4; 3; 2; 2. Media acestor valori este 2,8 –
valoare lipsită complet de semnificaţie. Tot ceea ce putem face cu
aceste date este să numărăm de câte ori apare fiecare variantă de
răspuns şi să calculăm (în acest exemplu) proporţia persoanelor care se
încadrează în fiecare categorie ocupaţională.
SCALA NOMINALĂ
Prelucrări posibile:
- Determinarea frecvenţelor absolute (numărăm de
câte ori apare fiecare variantă de răspuns)
- Determinarea frecvenţelor relative (calculăm
proporţia unităţilor statistice din fiecare categorie)
- Determinarea valorii modale (varianta de raspuns cu
frecventa cea mai mare)
SCALA ORDINALĂ
SCALA ORDINALĂ este utilizată pentru măsurarea variabilelor de tip
nenumeric (calitativ) ale căror variante de răspuns pot fi ordonate.
Unităţile pot fi înşiruite una relativ cu cealaltă şi se poate realiza, astfel,
o ierarhizare, dar distanţa între numerele acordate nu este obligatoriu
egală.
Numerele pe scala ordinală nu reprezintă intervale egale pe scala de
măsurare.
26
SCALA ORDINALĂ
Prelucrări posibile:
28
SCALA DE INTERVALE
Celsius vs Fahrenheit
C -20 -10 0 10 20
F 32 14 32 50 68
SCALA DE RAPORT
SCALA DE RAPORT (proporţională) se utilizează pentru măsurarea
variabilelor numerice, fiind scala care permite ca afirmaţiile făcute
pe baza operaţiilor de adunare, diferenţă, multiplicare sau divizare să
aibă sens.
Pentru variabilele măsurate pe această scală putem afirma, cu precizie, că, de pildă, o
persoană cu vârsta de 30 ani are de două ori mai mult decât cea de 15. Punctul zero nu este
neapărat necesar să fie o valoare măsurată a variabilei; este suficient să existe efectiv pe
scală.
Timpul de alergare pe distanţa de 50 metri este măsurat pe o scală de raport (proporţională),
deşi nimeni nu poate practic parcurge distanţa de 50 metri în 0,00 secunde.
Un punct zero absolut sugerează absenţa totală a caracteristicii sau însuşirii care
este studiată.
Variabilă numerică Nivel de măsurare
Greutatea (în kg) Raport
Vârsta (în ani sau zile) Raport
Salariul (în lei, EUR etc.) Raport
31
SCALA DE RAPORT
Prelucrări posibile:
33