Sunteți pe pagina 1din 79

BAZELE STATISTICII

- anul universitar 2020-2021 –

Prof.univ.dr. Carmen PINTILESCU


carmen.pintilescu@uaic.ro
Programa analitică
Statistica descriptivă
1. Noţiuni introductive
2. Analiza unei serii statistice univariate, folosind metode
grafice şi numerice (variabile numerice sau cantitative:
indicatori ai tendinţei centrale, indicatori ai dispersiei şi
indicatori ai formei; variabile nenumerice sau calitative).
Programa analitică
Statistica inferențială
1. Noțiuni și notații
2. Estimarea parametrilor unei populaţii
3. Testarea ipotezelor statistice
Bibliografie
 Andrei, T., Statistică şi econometrie, Ed. Economică, 2003.
 Bărbat, A., Teoria statisticii sociale, Editura Didactică şi
Pedagogică, Bucureşti, 1972.
 Jaba, E., Statistica, ed. a 3-a, Ed. Economică, Bucureşti,
2002.
 Jaba, E., Pintilescu, C. Statistică. Teste grilă şi probleme, ed.
a 2-a, Editura Sedcom Libris, Iaşi, 2007
 James T. McClave, P. George Benson, Terry Sincich,
Statistics for Business and Economics, Pearson, Education
New Jersey , 2008.
 Wonnacott, H., Wonnacott, T., Statistiques, Economica,
Paris, 1991.
Evaluare
 30% test de evaluare pe parcurs (statistica descriptivă)
 70% examen (statistica inferentială)
1. Noţiuni introductive

1.1. Rolul statisticii în economie


1.2. Concepte fundamentale
1.3. Tipuri de variabile statistice
1.4. Scale de măsurare
1.5. Metode de culegere a datelor
1.1. Rolul statisticii în economie
Statistica descriptivă:
 Metodele descriptive se referă la descrierea unei populaţii
sau colectivităţi cu ajutorul graficelor, tabelelor şi a unor
indicatori statistici descriptivi care sintetizează informaţia
de la nivelul tuturor unităţilor statistice analizate.
2 5 4 3 5 3 6 5 5
5 2 7 6 4 2 2 6 5
5 5 5 6 4 2 3 5 5
3 3 5 6 5 3 2 7 7
2 5 5 5 5 3 2 2 2
3 6 2 3 4 5 3 5 5
4 2 2 6 3 5 3 6 2
6 3 5 5 4 5 2 5 5
3 3 3 3 5 3 5 5 5
5 5 3 2 5 2 5 5 2
5 2 6 2 2 2 5 5 2
5 6 6 6 4 5 7 7 6
6 2 6 5 6 3 5 6 8
7 5 5 4 5 2 7 5 6
5 5 5 6 2 3 2 5 7
5 3 2 4 3 5 2 6 7
6 4 3 5 5 4 5 5 5
… … … … …. … … … …
1.1. Rolul statisticii în economie

Statistica inferenţială:
 Metodele inferenţiale au la bază ideea culegerii datelor, a
prelucrării şi analizei acestora de la nivelul unui eşantion
reprezentativ extras din populaţie după un procedeu
ştiinţific corespunzător. Obiectivul principal al acestor
metode este estimarea unor parametri şi testarea unor
ipoteze care privesc realitatea analizată.
1.2. Concepte fundamentale
a. Populaţia statistică
 reprezintă o mulţime de elemente care pot fi
reprezentate de obiecte, persoane, fapte, evenimente sau
procese din lumea reală.
 volumul unei populaţii se notează cu N.

Exemplu: Studenții de la FEAA Iași la 1 octombrie 2020


b. Eşantionul
 Reprezintă un sub-ansamblu de unităţi ale unei populaţii
extras din populaţia statistică după anumite procedee.
 Volumul eşantionului se notează cu n.

c. Unităţile statistice
 sunt elementele componente ale unei populaţii statistice.

Exemplu: un student.
d. Variabila statistică
 reprezintă însuşirea, trăsătura esenţială purtată de unităţile
statistice ale unei populaţii.

Exemplu: nota obtinută la examenul de Matematică, scorul IQ,


vârsta, genul persoanei, mediul de rezidență.

 se notează cu X. Valorile (variantele) variabilei se notează


cu xi.
Exemplu: variabila X este “Vârsta”, valorile xi sunt: 20, 22, 35,
etc.
1.3. Tipuri de variabile statistice
 după modul de exprimare:
1. Variabile numerice (cantitative):
Valorile variabilei se exprimă prin numere.

- variabile discrete: valori exprimate prin numere întregi.


Exemplu: număr persoane, număr salariați, număr copii.

- variabile continue: valori exprimate prin subdiviziuni


zecimale.
Exemplu: note, înălțime, greutate, salariu, PIB.
1.3. Tipuri de variabile statistice
2. Variabile nenumerice (calitative):
Valorile se exprimă prin cuvinte.

- variabile nominale: între categorii nu există o ierarhie


Exemplu: mediul de rezidență

Caz particular: variabile alternative (dummy).


- variabile ordinale.
2. Analiza unei serii statistice univariate
2.1. Variabile cantitative

A. Variabilă discretă

A.1. Prezentarea seriei (distribuţiei) statistice


2. Analiza unei serii statistice univariate

A.1. Prezentarea seriei (distribuţiei) statistice


- seria simplă X:(xi), cu i=1,m , când n1=n2= … =ni.
 xi 
- seria cu frecvenţe diferite X:  
 ni 
, când ni≠nj.
 xi 
X:   , cu fi=ni/n.
 fi 
• Frecvenţe absolute cumulate crescător (Ni  )
sau descrescător (Ni  )
- exprimă numărul de unităţi statistice cumulate “până la”
sau “peste” nivelul considerat al caracteristicii, adică
valori ≤ xi, respectiv ≥ xi.

i
N i  N i 1   ni   nh
h 1

m
N i  N i 1   ni   nh
h i
• Frecvenţe relative cumulate crescător (F i  )
sau descrescător (Fi  )
- exprimă ponderea unităţilor statistice cumulate “până la”
sau “peste” nivelul considerat al caracteristicii, adică valori
≤ xi, respectiv ≥ xi.

i
Fi  Fi 1   f i   f h
h 1

m
Fi  Fi 1   f i   f h
h i
A.2. Analiza seriei folosind metode numerice
Presupune calculul indicatorilor statisticii descriptive,
cunoscuţi şi sub denumirea de caracteristici numerice ale unei
distribuţii.

A.2.1. Indicatori ai tendinţei centrale (mărimi medii)

a. Definire:
- mediile sunt acele valori în jurul cărora se repartizează
unităţile unei populaţii.
- cele mai importante mărimi medii sunt media aritmetică,
modul şi mediana.
A.2. Analiza seriei folosind metode numerice
b. Media aritmetică ( x )
- Media aritmetică este valoarea pe care am observa-o dacă
unităţile statistice ar înregistra aceleaşi valori ale variabilei
(dacă nu ar exista variaţii ale valorilor înregistrate de unităţile
statistice).
Mod de calcul în cazul seriilor simple şi seriilor cu frecvenţe
diferite (variabilă discretă).
 Media simplă:  xi
i
x
n

 Media ponderată.
 xi  ni
x i sau x   xi  f i
 ni i
i
Observaţie:
Media aritmetică este sensibilă la prezenţa valorilor
extreme (outliers).
Cele mai importante proprietăţi ale mediei aritmetice:
1. Media unei distribuţii este o valoare internă:
xmin≤ x ≤xmax.

2. Media este o mărime normală: suma abaterilor valorilor


individuale ale unei variabile X de la media lor este egală cu
zero.
c. Modul (Mo)
 este valoarea variabilei cea mai frecvent observată într-o
distribuţie, adică valoarea xi care corespunde frecvenţei
maxime (nimax).
Observaţie:
modul poate fi aflat doar în cazul seriilor cu frecvenţe diferite.
o distribuţie poate avea una, două sau mai multe valori modale
(serii unimodale, bimodale sau plurimodale).
Interpretare: Cele mai multe unităţi înregistrează valoarea
modală.
d. Mediana (Me)
- este acea valoare a variabilei unei serii ordonate, crescător sau
descrescător, până la care şi peste care sunt distribuite în
număr egal unităţile colectivităţii: jumătate din unităţi (50%)
au valori mai mici decât mediana, iar jumătate (50%) au valori
mai mari decât mediana.
- corespunde locului unităţii mediane calculate astfel:

Me n1
U 
2
Aflarea medianei se face diferit în funcţie de tipul seriei:
1. Serii simple:
- număr impar de termeni: mediana este termenul central al
seriei ordonate.

- număr par de termeni.


2. Serii cu frecvenţe diferite
- se calculează unitatea mediană (UMe).
- se calculează N i 
- se află prima valoare N i  U Me
- valoarea xi corespunzătoare acesteia este Me.
Interpretare:
- jumatate (50%) dintre salariati au un salariu de cel mult 4
mii lei, iar jumatate au cel putin 4 mii lei.

Observaţie:
mediana nu este influenţată de valorile extreme.
Știați că …
 În anul 2010, 388 de persoane dețineau veniturile echivalente
a jumătate din populația lumii?

 În anul 2014, acest număr a scăzut la 80?

 Iar în anul 2016, numărul acestor persoane a ajuns la 62?


f. Quartilele
- sunt valori ale variabilei care împart volumul eşantionului în
4 părţi egale.
- reprezentare grafică şi mod de calcul ( Q1, Q2, Q3).

g. Decile
- sunt valori ale variabilei care împart volumul eşantionului în
10 părţi egale.
- decila unu (D1) şi decila 9 (D9).
f. Quartilele
- sunt valori ale variabilei care împart volumul eşantionului în
4 părţi egale.
- reprezentare grafică şi mod de calcul ( Q1, Q2, Q3).
g. Decile
- sunt valori ale variabilei care împart volumul eşantionului în
10 părţi egale.
- decila unu (D1) şi decila 9 (D9).
A.2.2. Indicatori ai dispersiei (variaţiei)
Definire:
- dispersia exprimă gradul de variaţie a valorilor individuale
ale unei variabile faţă de nivelul mediu.
- aprecierea fenomenului de dispersie al unei distribuţii
permite identificarea gradului de reprezentativitate a mediei
unei distribuţii.
Indicatori sintetici ai dispersiei:
1. Varianţa
 ( xi  x ) 2  (x  x)
i
2
 ni
s2  i
s 
2 i
n , respectiv n i
i

Varianţa este întotdeauna pozitivă, nu are unitate de


măsură şi nu se interpretează.
Prin ridicarea la pătrat a abaterilor valorilor xi faţă
de medie creşte “influenţa” valorilor extreme
asupra nivelului varianţei.
2. Abaterea standard (s) (deviatia standard)
 arată cu cât variază, în medie, valorile xi ale variabilei faţă
de nivelul mediu al distribuţiei, în sens pozitiv şi negativ.
 se calculează ca radical din varianţă.
 se exprimă în aceeaşi unitate de măsură cu cea a variabilei.

 ( xi  x ) 2  (x  x)
i
2
 ni
s i
, s i

n n i
i
3. Coeficientul de variaţie (v)
s
v  100
x
 se exprimă în procente.
 valori ridicate ale acestui coeficient (v>50%) arată o distribuţie
eterogenă, care se caracterizează printr-o variaţie mare a
valorilor xi faţă de nivelul mediu şi o medie nereprezentativă.
4. Intervalul interquartilic
IQ=Q3-Q1.
- cuprinde 50% din volumul eşantionului.

 În mod sintetic, cele mai importante caracteristici numerice


ale unei distribuţii pot fi “cuplate” astfel:
 media - abaterea standard - coeficientul de variaţie;
 mediana - intervalul interquartilic.
A.2.3. Indicatori ai formei
1. Asimetria:
- reprezintă o deviere de la forma simetrică a unei distribuţii.

Asimetria poate fi apreciată:


- pe cale grafică: curba frecvenţelor, diagrama box-plot.
- pe cale numerică: - prin calculul indicatorilor de asimetrie
(Skewness).

3  (x i  x)3
Coeficientul de asimetrie Fisher: sw  , cu 3  i

s3 n
Relaţii între cele trei mărimi medii
Arată forma unei distribuţii:
1. Când x  Mo  Me distribuţia este simetrică.
2. Când x  Me  Mo distribuţia este asimetrică la
dreapta (asimetrie pozitivă).
3. Când x  Me  Mo distribuţia este asimetrică la
stânga (asimetrie negativă).
2. Boltirea
- este definită prin compararea distribuţiei empirice cu
distribuţia normală din punctul de vedere al variaţiei
variabilei X şi a frecvenţei ni.
Boltirea poate fi apreciată:
– pe cale grafică: curba frecvenţelor.
2. Boltirea
- numeric: prin calculul indicatorilor boltirii (kurtosis).
Coeficientul de boltire Fisher:

4 4
 (x i  x)4
k  3  3 , cu 4  i

n
 22 s4
A.3. Analiza seriei folosind metode grafice
a. Poligonul frecvenţelor:
- construirea acestuia presupune găsirea locului geometric al
punctelor Ai de coordonate (xi,ni) sau (xi,fi) şi unirea
acestora prin segmente de dreaptă.
- aproximează forma unei distribuţii.
b. Histograma
c. Curba frecvenţelor
- presupune ajustarea printr-o linie curbă, continuă a
histogramei.
- aproximează mai bine forma de distribuţie a colectivităţii
după variabila considerată, comparativ cu histograma.
Curba frecvențelor
Figura 1. Distribuția elevilor de la un liceu după nota
obținută la un examen, în martie 2016
d. Reprezentarea diagramei “box-plot” sau “box-and-whiskers”
 Forma diagramei (D1, Q1, Q2, Q3, D9);
 Avantaje:
- permite aprecierea nivelului mediu (Me), dispersiei şi
asimetriei unei distribuţiei;
 Avantaje:
- facilitează compararea mai multor distribuţii (prin
reprezentarea simultană a diagramelor).
Diagrama box-plot

1
NOTA

3 4 5 6 7 8 9 10 11

Analysis weighted by NRSTUD


 identificarea valorilor extreme şi analiza influenţei lor asupra
rezultatelor statistice (diagrama box-plot).
Indicatorii statisticii descriptive în Excel
Column1  
   
Mean 3.209581
Standard Error 0.131265
Median 3
Mode 2
Standard Deviation 1.696319
Sample Variance 2.877498
Kurtosis 1.40152
Skewness 1.315485
Range 9
Minimum 1
Maximum 10
Sum 536
Count 167
B. Variabilă continuă
B.1. Prezentarea seriei statistice
- gruparea unităţilor statistice este realizată pe intervale de
variaţie.
B.2. Prelucrarea seriei statistice folosind metode grafice
a. Histograma
b. Poligonul frecvenţelor
c. Curba frecvenţelor

B.3. Indicatori ai statisticii descriptive


- se calculează în mod identic, prin “discretizarea” variabilei
(calculul mijlocului intervalelor de variaţie).
2. Analiza unei serii univariate

2.2. Variabilă calitativă

I. Tipuri de variabile
A. Variabile nominale
B. Variabile ordinale
II. Indicatori specifici si reprezentare grafică
a) Variabile nominale:
• Pentru a reprezenta structura pe categorii la nivelul unui
eşantion se calculează frecvenţe relative.
• Reprezentarea frecvenţelor pentru un eşantion se realizează
folosind diagramele: Bar Chart sau Pie Chart.
• Indicatori specifici: modul.

b) Variabile ordinale:
• Reprezentarea frecvenţelor pentru un eşantion se realizează
folosind diagramele: Bar Chart sau Pie Chart.
• Frecvenţe absolute şi relative.
• Indicatori specifici: modul şi quartilele.

S-ar putea să vă placă și