Documente Academic
Documente Profesional
Documente Cultură
A. Variabilă discretă
i
N i N i 1 ni nh
h 1
m
N i N i 1 ni nh
h i
• Frecvenţe relative cumulate crescător (F i )
sau descrescător (Fi )
i
Fi Fi 1 f i f h
h 1
m
Fi Fi 1 f i f h
h i
Exemplu
Distribuţia unui eşantion de persoane după numărul de spectacole de teatru
vizionate într-o lună
xi ni fi
0 9 5,17
1 29 16,67
2 95 54,6
3 35 20,11
4 6 3,45
a. Definire:
- mediile sunt acele valori în jurul cărora se repartizează
unităţile unei populaţii.
- cele mai importante mărimi medii sunt media aritmetică,
modul şi mediana .
A.2. Analiza seriei folosind metode numerice
b. Media aritmetică ( x )
- Media aritmetică este valoarea pe care am observa-o dacă
unităţile statistice ar înregistra aceleaşi valori ale variabilei
(dacă nu ar exista variaţii ale valorilor înregistrate de
unităţile statistice).
Mod de calcul în cazul seriilor simple şi seriilor cu frecvenţe
diferite (variabilă discretă)
Media simplă: xi
i
x
n
Media ponderată.
x i ni
x i
sau x xi f i
ni i
i
Observaţie:
Media aritmetică este sensibilă la prezenţa valorilor extreme
(outliers).
Cele mai importante proprietăţi ale mediei aritmetice:
1. Media unei distribuţii este o valoare internă:
xmin≤ x ≤xmax.
Me n1
U
2
Aflarea medianei se face diferit în funcţie de tipul seriei:
1. Serii simple:
- număr impar de termeni. Exemplu: 7, 3, 8, 4, 5
- număr par de termeni. Exemplu: 7, 3, 8, 4, 5, 5
Observaţie:
mediana nu este influenţată de valorile extreme.
Exemplu: 1, 1, 2, 4, 4, 80
f. Quartilele
- sunt valori ale variabilei care împart volumul
eşantionului în 4 părţi egale.
- reprezentare grafică şi mod de calcul ( Q1, Q2, Q3).
g. Decile
- sunt valori ale variabilei care împart volumul
eşantionului în 10 părţi egale.
- decila unu (D1) şi decila 9 (D9).
A.2.2. Indicatori ai dispersiei (variaţiei)
Definire:
- dispersia exprimă gradul de variaţie a valorilor individuale
ale unei variabile faţă de nivelul mediu.
- aprecierea fenomenului de dispersie al unei distribuţii
permite identificarea gradului de reprezentativitate a mediei
unei distribuţii.
Indicatori sintetici ai dispersiei:
1. Abaterea medie liniară
1. Varianţa
( x x2
) (x x) n
i
2
i
i 2
s i
s
2 i
n
, respectiv n i
i
(x x)
i
2 (x x)
i
2
ni
s i
s i
n
n i
i
4. Coeficientul de variaţie (v)
s
v 100
x
se exprimă în procente.
valori ridicate ale acestui coeficient (v>50%) arată o
distribuţie eterogenă, care se caracterizează printr-o
variaţie mare a valorilor xi faţă de nivelul mediu şi o
medie nereprezentativă.
este sensibil faţă de valoarea mediei: cu cât media este mai
apropiată de zero, cu atât coeficientul de variaţie este mai
dificil de folosit (tinde spre infinit).
5. Amplitudinea intervalului interquartilic
IQ=Q3-Q1.
- cuprinde 50% din volumul eşantionului.
Avantaje:
- permite aprecierea nivelului mediu (Me), dispersiei şi
asimetriei unei distribuţiei;
- facilitează compararea mai multor distribuţii (prin
reprezentarea simultană a diagramelor).
Exemplu: Pentru o distributie s-au inregistrat valorile: D1=5,
Q1=12, Q2=20, Q3=22, D9=25. Sa se interpreteze asimetria
distributiei folosind diagrama box-plot.
Diagrama box-plot
1
NOTA
3 4 5 6 7 8 9 10 11
NOTA_2
3 4 5 6 7 8 9 10 11
Indicatorii statisticii descriptive în Excel
Column1
Mean 8.6
Standard Error 0.347735
Median 8
Mode 10
Standard Deviation 1.904622
Sample Variance 3.627586
Kurtosis -0.14315
Skewness -0.40554
Range 8
Minimum 4
Maximum 12
Sum 258
Count 30
B. Variabilă continuă
B.1 Prezentarea seriei statistice
- gruparea unităţilor statistice este realizată pe intervale de
variaţie.
Observaţie:
- Gruparea pe intervale de variaţie duce la pierderea unei părţi
a informaţiei iniţiale.
b. Poligonul frecvenţelor
c. Curba frecvenţelor
d. Box-plot
Distribuţia unui eşantion de firme după valoarea profitului (mil.
lei), în anul 2012
xi-1-xi ni xi' xi' ni
0 -10 20
5 100
10-20 40
15 600
20-30 35
25 875
30-40 15
35 525
40-50 10
45 450
TOTAL 120 -
2550
Statistics
Profit
N Valid 120
Mean 21.2500
Median 20.3333
Mode 15.00
Std. Deviation 11.52728
Variance 132.878
Skewness .442
Kurtosis -.484
Percentiles 10 5.6667
20 9.6667
25 11.6667
30 13.6667
40 17.1333
50 20.3333
60 23.5333
70 27.6000
75 30.0000
80 32.4000
90 39.4000
Histogram
50
40
Frequency
30
20
10
Mean = 21.25
Std. Dev. = 11.52728
0 N = 120
0.00 10.00 20.00 30.00 40.00 50.00
Profit
I. Tipuri de variabile
A. Variabile nominale
B. Variabile ordinale
III. Indicatori statistici specifici
a) Variabile nominale:
1. Mărimi relative
- frecvenţe relative (fi)
(Admis) 1 30
(Respins) 0 10
Total 40
II. Reprezentare grafică
a) Variabile nominale:
• Pentru a reprezenta structura pe categorii la
nivelul unui eşantion se calculează frecvenţe
relative;
• Reprezentarea structurii unui eşantion se
realizează folosind diagrame de structură:
dreptunghiul, pătratul şi cercul de structură
(Pie Chart) sau folosing diagrame prin
coloane (Bar Chart).
Religie ni fi (%)
Budism 7 6,80
Catolic 41 39,81
Hinduism 1 0,97
Iudaism 1 0,97
Islam 27 26,21
Ortodox 8 7,77
Protestantism 16 15,53
Taoism 2 1,94
3. Reprezentare grafica
• Histograma
• Poligonul frecvenţelor
• Box-plot
Distribuţia medaliilor olimpice obţinute de România la JO după categoria medaliei, în
perioada 1924-2012.
Medalia ni fi (%) Ni Fi
Aur 88 29 88 29