Sunteți pe pagina 1din 14

BAZELE STATISTICII

- anul universitar 2014-2015 Lect. univ. dr. Dana Vioric


BAZELE STATISTICII
- anul universitar 2014-2015 Programa analitic
Noiuni introductive
Analiza unei serii statistice unidimensionale, folosind metode grafice i numerice (variabile
cantitative: indicatori ai tendinei centrale, indicatori ai dispersiei i indicatori ai formei; variabile
calitative).
Analiza unei serii statistice bidimensionale.
Probabiliti i distribuii teoretice
Estimarea parametrilor unei populaii
Testarea statistic
Indicatori ai seriilor de timp
Bibliografie
Andrei, T., Statistic i econometrie, Ed. Economic, 2003.
Brbat, A., Teoria statisticii sociale, Editura Didactic i Pedagogic, Bucureti, 1972.
Biji, E.M., Lilea, E., Roca, E., Vtui, M., Statistic aplicat n economie, Editura Universal Dalsi,
2000
Jaba, E., Statistica, ed. a 3-a, Ed. Economic, Bucureti, 2002.
Bibliografie
Jaba, E., Pintilescu, C. Statistic. Teste gril i probleme, ed. a 2-a, Editura Sedcom Libris, Iai,
2007
James T. McClave, P. George Benson, Terry Sincich, Statistics for Business and Economics,
Pearson, Education New Jersey , 2008
arc, M., Tratat de statistic aplicat, Editura Didactic i Pedagogic, Bucureti, 1998.
Wonnacott, H., Wonnacott, T., Statistiques, Economica, Paris, 1991.
EVALUARE:
40% - Test susinut n sptmna 30.03-04.04;
20% - Not seminar;
40% - Examen.
1.1. Rolul statisticii n economie
1.2. Concepte fundamentale
1.3. Tipuri de variabile statistice
1.4. Scale de msurare
1.5. Metode de culegere a datelor
1.1. Rolul statisticii n economie
Scopul statisticii este cunoaterea fenomenelor de mas, caracterizate prin variabilitate.
Statistica descriptiv: descrie observaiile existente n baza de date
Statistica inferenial: folosete observaiile din baza de date, nregistrate la nivelul unui eantion
pentru a face extrapolri (inferri) asupra unor situaii care nu s-au petrecut nc, la nivelul
populaiei din care a fost extras eantionul
Descriptiv sau Inferenial?
Merg cu bicicleta, n medie, aproximativ 50 km pe sptmn.
Ne ateptm la mari cantiti de ploaie n acest anotimp.
1.2. Concepte fundamentale ale statisticii
Populaia statistic

reprezint o mulime de elemente unite ntre ele printr-o trstur comun.


pentru a fi bine definit, o populaie statistic trebuie s aib precizat omogenitatea
elementelor sale componente din punct de vedere calitativ, de timp i de spaiu.
- volumul unei populaii se noteaz cu N.
b. Eantionul
Reprezint un sub-ansamblu de uniti ale unei populaii extras din populaia statistic dup
anumite procedee.
Aplicarea acestor procedee trebuie s asigure reprezentativitatea eantionului.
Volumul eantionului se noteaz cu n.
Statisticile descriptive doar descriu un eantion
Statisticile infereniale generalizeaz rezultatele obinute la nivelul eantionului la ntreaga
populaie
c. Unitile statistice
sunt elementele componente ale unei populaii statistice.
se noteaz cu ni.
d. Variabila statistic
reprezint nsuirea, trstura esenial purtat de unitile statistice ale unei populaii.
se noteaz cu X. Valorile (categoriile) variabilei se noteaz cu xi.
e. Indicatorul statistic
mrime statistic, rezultatul numeric al unei numrri, al unei msurri statistice sau al unui
calcul asupra datelor obinute printr-o nregistrare statistic.
f. Indice statistic
mrime statistic relativ care se obine prin compararea, sub form de raport, a dou valori ale
unui indicator statistic.
1.3. Tipuri de variabile statistice
dup modul de exprimare:
1. Variabile numerice (cantitative):
variabile discrete;
variabile continue.
2. Variabile nenumerice (calitative):
variabile nominale. Caz particular: variabile alternative (dummy).
variabile ordinale.
Tipuri de Variabile
Care sunt variabilele pe care le luai n considerare atunci cnd cumprai o
biciclet second-hand?
Marca (DHS, Trek, Shimano)
Tipul (ora, munte, vitez)
Componentele (marc sau no-name)
Vrsta
Starea (excelent, bun, rea)
Preul
Mrimea cadrului
Numrul de viteze
1.4. Scale de msurare
Definire:
Scala este un continuum de cifre sau de simboluri, plasate ierarhic, de la inferior la superior.
Tipuri de scale
1. Variabile calitative

Scala nominal presupune acordarea de numere (coduri) fiecrei categorii a unei populaii (doi
indivizi care aparin unor categorii distincte au valori diferite).
b. Scala ordinal presupune ca atribuirea de coduri numerice pentru fiecare categorie s se
realizeze n ordine descresctoare, dup importana lor.
2. Variabile cantitative
a. Scala interval are ca proprieti identitatea, ordinea i faptul c intervalul ntre numere are un
sens.
1.4. Scale de msurare
se poate, astfel, compara diferena dintre dou valori ale aceleiai variabile.
Exemplu:
temperatura n sistemul Celsius i n sistemul Fahrenheit: diferena dintre dou temperaturi are
un sens;
scorurile obinute la testele de evaluare.
1.4. Scale de msurare
b. Scala raport
are aceleai proprieti ca scala interval i, n plus, posed un zero absolut (considerat punct de
referin).
diferena i raportul dintre dou valori au un sens.
Exemplu:
Rata omajului, PIB/locuitor, rata natalitii, vrsta, nlimea, greutatea ...
1.5. Metode de culegere a datelor
Surse de date statistice
Anuarul Statistic al Romniei (INS).
Sursa de date statistice la nivel european: Oficiul Statistic al Comunitii Europene EUROSTAT.
Adresa: http://europa.eu.int/comm/eurostat
2. Lucrri de nregistrare statistic
a. Recensmntul reprezint o lucrare de nregistrare exhaustiv, la un moment dat, a unei
populaii.
nregistrarea surprinde starea populaiei la un moment dat, numit moment critic.
b. Rapoarte statistice
reprezint lucrri de nregistrare total (evenimente, fapte).
c. Anchete prin sondaj
d. Monografia statistic
are ca obiectiv cunoaterea unei singure uniti complexe sau a unei singure probleme.
Aplicaii:
I. Pentru ansamblul firmelor din judeul Iai care desfoar activitate de producie se
nregistreaz valoarea cifrei de afaceri (mld. lei) la 31 decembrie 2010. Se cere:
s se precizeze dac nregistrarea statistic realizat asupra firmelor observate presupune o
cercetare exhaustiv.
s se defineasc unitatea statistic i variabila de grupare .

s se precizeze tipul variabilei studiate.


Un eantion de angajai ai unei firme a rspuns la cteva ntrebri cu caracter personal i
profesional. Precizai natura urmtoarelor variabile i tipul de scal specific:
numrul de animale al familiei
locul naterii
anul naterii
vrsta n ani mplinii
fumator (da, nu)
nivelul ultimei diplome de studii obinut (liceu, facultate, master, doctorat, post-doctorat)
tipul de main deinut: autohton sau de import
distana, n km, de acas pn la locul de munc
valoarea IQ-ului
poziia ierarhic ocupat n firm (funcionar, middle management, top management)
calificativul obinut la ultima evaluare la locul de munc
poziia privind politica firmei de a reduce salariile n locul reducerii personalului existent
(acord total, acord, indiferent, dezacord, dezacord total)
numrul de ore petrecute zilnic navignd pe internet
II. Se extrage aleator un eantion format din 50 de studeni din anul I de la FEAA, n anul
universitar 2010-2011, i se nregistreaz nota obinut la un examen.
Se cere:
s se precizeze dac nregistrarea statistic realizat presupune o cercetare exhaustiv.
s se defineasc unitatea statistic i variabila de grupare.
s se precizeze tipul variabilei studiate.
Observaii:
Cunoaterea unei colectiviti statistice, atunci cnd se dispune de valorile luate de una sau mai
multe variabile statistice asupra ansamblului, presupune aplicarea statisticii descriptive.
2. Atunci cnd se dispune de valorile luate de una sau mai multe variabile statistice asupra unui
eantion, cunoaterea ntregii colectiviti din care este extras eantionul presupune folosirea
statisticii infereniale.
Analiza unei serii statistice unidimensionale
2.1. Variabile cantitative

Variabil discret

A.1. Prezentarea seriei (distribuiei) statistice


Frecvene absolute cumulate cresctor (Ni ) sau descresctor (Ni )
exprim numrul de uniti statistice cumulate pn la sau peste nivelul considerat al
caracteristicii, adic valori xi, respectiv xi.

Frecvene relative cumulate cresctor (Fi ) sau descresctor (Fi )


exprim ponderea unitilor statistice cumulate pn la sau peste nivelul considerat al
caracteristicii, adic valori xi, respectiv xi.
A.2. Analiza seriei folosind metode numerice
Presupune calculul indicatorilor statisticii descriptive, cunoscui i sub denumirea de
caracteristici numerice ale unei distribuii.
A.2.1. Indicatori ai tendinei centrale (mrimi medii)

a. Definire:
mediile sunt acele valori n jurul crora se repartizeaz unitile unei populaii.
cele mai importante mrimi medii sunt media aritmetic, modul i mediana .
A.2. Analiza seriei folosind metode numerice
b. Media aritmetic (
)
Media aritmetic este valoarea pe care am observa-o dac unitile statistice ar
nregistra aceleai valori ale variabilei (dac nu ar exista variaii ale valorilor
nregistrate de unitile statistice).
Mod de calcul n cazul seriilor simple i seriilor cu frecvene diferite (variabil discret)

Media simpl:

Media ponderat:

Sau
Observaie:
Media aritmetic este sensibil la prezena valorilor extreme (outliers).
Cele mai importante proprieti ale mediei aritmetice:
1. Media unei distribuii este o valoare intern:

2. Media este o mrime normal: suma abaterilor valorilor individuale ale unei variabile X de la
media lor este egal cu zero.
Exemplu: S considerm distribuia membrilor unei familii dup numrul de litri de Coca-Cola
consumai ntr-o sptmn:
1, 1, 4, 6, 8.
c. Modul (Mo)
este valoarea variabilei cea mai frecvent observat ntr-o distribuie, adic valoarea x i care
corespunde frecvenei maxime (nimax).
Observaie:
modul poate fi aflat doar n cazul seriilor cu frecvene diferite.
o distribuie poate avea una, dou sau mai multe valori modale (serii unimodale, bimodale sau
plurimodale).
Interpretare: Cele mai multe uniti nregistreaz valoarea modal.

d. Mediana (Me)
este acea valoare a variabilei unei serii ordonate, cresctor sau descresctor, pn la care
i peste care sunt distribuite n numr egal unitile colectivitii: jumtate din uniti au
valori mai mici dect mediana, iar jumtate au valori mai mari dect mediana.
corespunde locului unitii mediane calculate astfel:

Aflarea medianei se face diferit n funcie de tipul seriei:


1. Serii simple:
- numr impar de termeni. Exemplu: 7, 3, 8, 4, 5
- numr par de termeni. Exemplu: 7, 3, 8, 4, 5, 5
2. Serii cu frecvene diferite
- se calculeaz unitatea median (UMe).
-

valoarea xi corespunztoare acesteia este Me.

Observaie:
mediana nu este influenat de valorile extreme.
Exemplu: 1, 1, 2, 4, 4, 80
f. Quartilele
- sunt valori ale variabilei care mpart volumul eantionului n 4 pri egale.
- reprezentare grafic i mod de calcul ( Q1, Q2, Q3).
g. Decile
- sunt valori ale variabilei care mpart volumul eantionului n 4 pri egale.
- decila unu (D1) i decila 9 (D9).
A.2.2. Indicatori ai dispersiei (variaiei)
Definire:
- dispersia exprim gradul de variaie a valorilor individuale ale unei variabile fa de
nivelul mediu.
- aprecierea fenomenului de dispersie al unei distribuii permite identificarea gradului de
reprezentativitate a mediei unei distribuii.
Indicatori sintetici ai dispersiei:
1. Abaterea medie liniar
1. Variana

, respectiv
Variana este ntotdeauna pozitiv, nu are unitate de msur i nu se interpreteaz.
Prin ridicarea la ptrat a abaterilor valorilor xi fa de medie crete influena valorilor
extreme asupra nivelului varianei.
3. Abaterea standard (s)
arat cu ct variaz, n medie, valorile x i ale variabilei fa de nivelul mediu al
distribuiei, n sens pozitiv i negativ.
Se calculeaz ca radical din varian
se exprim n aceeai unitate de msur cu cea a variabilei.

4. Coeficientul de variaie (v)

s2

(x x)
n
i

ni

s2

2
(
x

x
)
i
i

se exprim n procente.
valori ridicate ale acestui coeficient (v>50%) arat o distribuie eterogen, care se
caracterizeaz printr-o variaie mare a valorilor x i fa de nivelul mediu i o medie
nereprezentativ.
este sensibil fa de valoarea mediei: cu ct media este mai apropiat de zero, cu att
coeficientul de variaie este mai dificil de folosit (tinde spre infinit).
5. Intervalul interquartilic
IQ=Q3-Q1.
- cuprinde 50% din volumul eantionului.
n mod sintetic, cele mai importante caracteristici numerice ale unei distribuii pot fi cuplate
astfel:
media - abaterea standard - coeficientul de variaie
mediana - intervalul interquartilic
media - mediana
A.2.3. Indicatori ai formei
Asimetria:
reprezint o deviere de la forma simetric a unei distribuii.
Asimetria poate fi apreciat:
- pe cale grafic: curba frecvenelor, diagrama box-plot.
- pe cale numeric: - prin calculul indicatorilor de asimetrie (Skewness).

Coeficientul de asimetrie Fisher:

Relaii ntre cele trei mrimi medii


Arat forma unei distribuii:
Cnd
Cnd
pozitiv).
Cnd
negativ).

Me Me
Mo
xx Mo

x Me Mo

distribuia este simetric.


distribuia este asimetric la dreapta (asimetrie
distribuia este asimetric la stnga (asimetrie

2. Boltirea
este definit prin compararea distribuiei empirice cu distribuia normal din punctul de
vedere al variaiei variabilei X i a frecvenei n i.
Boltirea poate fi apreciat:
pe cale grafic: curba frecvenelor.
- numeric: prin calculul indicatorilor boltirii (kurtosis).
Coeficientul de boltire Fisher:

A.3. Analiza seriei folosind metode grafice


Poligonul frecvenelor:
- construirea acestuia presupune gsirea locului geometric al punctelor A i de
coordonate (xi,ni) sau (xi,fi) i unirea acestora prin segmente de dreapt.
- aproximeaz forma unei distribuii.
b.
Histograma
c.
Curba frecvenelor:
- presupune ajustarea printr-o linie curb, continu a histogramei.
- aproximeaz mai bine forma de distribuie a colectivitii dup variabila considerat.

d. Reprezentarea diagramei box-plot sau box-and-whiskers


Forma diagramei (D1, Q1, Q2, Q3, D9);
Avantaje:
- permite aprecierea nivelului mediu (Me), dispersiei i asimetriei unei distribuiei;
- faciliteaz compararea mai multor distribuii (prin reprezentarea simultan a
diagramelor).
Exemplu: Pentru o distributie s-au inregistrat valorile: D1=5, Q1=12, Q2=20, Q3=22, D9=25. Sa
se interpreteze asimetria distributiei folosind diagrama box-plot.
Diagrama box-plot

NOTA

10

11

A nalysis w eighted by NRSTUD

NOTA_1

NOTA_2

Indicatorii statisticii descriptive n Excel


Column1

10

11

Mean

8.6

Standard Error

0.347735

Median

Mode

10

Standard Deviation

1.904622

Sample Variance

3.627586

Kurtosis

-0.14315

Skewness

-0.40554

Range

Minimum

Maximum

12

Sum

258

Count

30

B. Variabil continu
B.1 Prezentarea seriei statistice
- gruparea unitilor statistice este realizat pe intervale de variaie.
Observaie:
- Gruparea pe intervale de variaie duce la pierderea unei pri a informaiei iniiale.
B.2. Indicatori ai statisticii descriptive
se calculeaz n mod identic, prin discretizarea variabilei (calculul mijlocului intervalelor
de variaie).
B.3. Prelucrarea seriei statistice folosind metode grafice
Histograma
Poligonul frecvenelor
Curba frecvenelor
Box-plot
Distribuia unui eantion de firme dup valoarea profitului (mil. lei), n anul 2012
2. Analiza unei serii univariate
2.1. Variabil cantitativ
Variabil discret
Variabil continu

2.2. Variabil calitativ


I. Tipuri de variabile
Variabile nominale
Variabile ordinale

III. Indicatori statistici specifici


a) Variabile nominale:
1. Mrimi relative
- frecvene relative (fi)
2. Indicatori ai tendinei centrale
- modul arat categoria cea mai frecvent observat.
II. Reprezentare grafic

Religie

ni

Budism

fi (%)
7

6,80

41

39,81

Hinduism

0,97

Iudaism

0,97

27

26,21

7,77

16

15,53

1,94

103

100

Catolic

Islam
Ortodox
Protestantism
Taoism
Total

a) Variabile nominale:
Pentru a reprezenta structura pe categorii la nivelul unui eantion se calculeaz
frecvene relative;
Reprezentarea structurii unui eantion se realizeaz folosind diagrame de structur:
dreptunghiul, ptratul i cercul de structur (Pie Chart) sau folosing diagrame prin
coloane (Bar Chart).
b) Variabile ordinale:
1. Mrimi relative

frecvene relative (fi)

frecvene relative cumulate (Fi)

2. Indicatori ai tendinei centrale


- mediana i modul.

3. Reprezentare grafica
Histograma
Poligonul frecvenelor
Box-plot