Documente Academic
Documente Profesional
Documente Cultură
– INDICATORI SINTETICI
SORANA D. BOLBOACĂ
10/31/2020 1
DESPRE …
STATISTICA DESCRIPTIVĂ
Parametrii de centralitate
Parametrii de dispersie
10/31/2020 5
Parametrii de centralitate
Media aritmetică
Mediana
Modulul
Media ponderată
Parametrii de centralitate
o Media aritmetică
Me = X n+1 Xn + Xn
+1
2 Me = 2 2
2
o Modulul: cea mai frecventă observație a seriei 10/31/2020
8
Parametrii de centralitate
Scorurile obținute la examenul practic de o grupă de 11 studenți:
4, 9, 5, 8, 6, 7, 9, 10, 8, 6, 5
10/31/2020
9
Parametrii de centralitate
Scorurile obținute la examenul practic de o grupă de 12 studenți:
4, 9, 5, 8, 6, 4, 9, 10, 8, 6, 5, 4
o Media = (4+9+5+8+6+4+9+10+8+6+5+4)/12 = 6.5
o Modulul: 4 → serie unimodală
o Mediana: 4, 4, 4, 5, 5, 6, 6, 8, 8, 9, 9, 10
o n (volumul eșantionului) = 12
o Me = (Xn/2+ Xn/2+1)/2 = (X6 +X7)/2= (6+6)/2 = 6
10/31/2020
10
Parametrii de centralitate
Media ponderată
n
WX i i
mX = i=1
n
W i=1
i
Media aritmetică
n
X i
X= i=1
n
Parametrii de centralitate
10/31/2020
Parametrii de centralitate
Estimator Avantaj Dezavantaj
Media Utilizează toate datele Influențată de valori extreme
Ușor de aplicat Nereprezentativă dacă datele nu au o
distribuție simetrică
Mediana Nu e influențată de valori extreme Ignoră majoritatea datelor din serie
Neinfluențată de asimetria datelor
Modulul Aplicabil și variabilelor calitative Ignoră majoritatea datelor din serie
Media Aplicabilă datelor asimetrice spre dreapta Adecvată dacă logaritmarea datelor
geometrică produce o distribuție normală
Media Cuantifică importanța relativă a fiecărei Ponderile trebuie să fie cunoscute sau
ponderată observații estimate
10/31/2020 12
13
Parametrii de dispersie
o Dispersie relativ la parametrul de centralitate
o Datele sunt cu atât mai dispersate cu cât valorile seriei sunt mai diferite unele
față de altele
Parametrii de dispersie
Cvartile
Amplitudinea Variația
Percentile
o Datele sunt cu atât mai dispersate cu cât valorile seriei sunt mai diferite
unele față de altele, respectiv față de valoarea centrală
10/31/2020
Parametrii de dispersie: Amplitudinea
A = Xmax – Xmin
o Metoda 1: A = 221-144 = 77
o Metoda 2: A = 205-195 = 10
16
14 M F
Frecvența absolută
12
10
o Consideră exclusiv valorile extreme 8
10/31/2020 16
Parametrii de dispersie: cvartile
Me=[X12/2+X(12/2+1)]/2 = (X6+X7)/2 = (8+8)/2 = 8
Q3 – Q1 = 9 – 5.5 = 3.5
examenul Ordonare
=MEDIAN(B1:B12)
practic
A = 10 – 4 = 6
(Intervalul dintre cvartila 3 şi 1)
IC:
Me=8
=QUARTILE(B1:B12,3)-
QUARTILE(B1:B12,1)
(Amplitudinea) A:
=MAX(B1:B12)-MIN(B1:B12)
10/31/2020 17
Parametrii de dispersie: cvartile
Variabila: note la examenul practic
Q1: 25% din studenţi au note ≤ 5.5
Q3: 75% din studenţi au note ≤ 9
IC: 50% din studenţi au note care
Q3 – Q1 = 9 – 5.5 = 3.5
nu diferă una faţă de alta cu mai
mult de 3,5 puncte
A = 10 – 4 = 6
Me=8
A: Diferenţa dintre nota
maximă şi nota minimă a fost
de 6 puncte
10/31/2020 18
Parametrii de dispersie: variația și deviația standard
o Populație o Eșantion
σ𝑁
(𝑥
𝑖=1 𝑖 − μ)2 σ𝑛
(𝑥
𝑖=1 𝑖 − ത
𝑋) 2
2 2
σ = 𝑠 =
𝑁 𝑛−1
σ𝑁
(𝑥 − μ)2 σ𝑛
(𝑥
𝑖=1 𝑖 − ത
𝑋) 2
𝑖=1 𝑖
σ= σ =
2 s= s =
2
𝑁 𝑛−1
10/31/2020 19
Parametrii de dispersie: media și deviația standard
o s ↓ ⟶ datele seriei au
valori apropiate de ale
mediei
o s ↑ ⟶ datele seriei sunt
depărtate faţă de valoarea
mediei
10/31/2020 20
21
10/31/2020
Parametrii de dispersie: Variabilitate vs. Diversitate
1. Care din grupurile de mai jos prezintă o compozie a culorilor mai diversă?
2. Care din grupurile de mai jos prezintă o variabilitate mai mare a orelor de
utilizare?
Grup 1➔ s = 15,81
Grup 2 ➔ s = 21,91
10/31/2020 22
Parametrii de dispersie: coeficientul de variație
o Dispersie relativă
o Nu are unitate de măsură
o Se calculează doar pentru variabilele cantitative de tip raţie care iau doar valori pozitive
o Compararea variabilităţii a două populaţii când unităţile de măsură sunt diferite (mg/dL
vs mmol/L – colesterol)
𝑠 𝑄3 − 𝑄1
𝐶𝑉(%) = × 100 𝐶𝑄𝑉(%) = × 100
𝑋ത 𝑄3 + 𝑄1
Relative Relativ
Omogen Eterogen
omogen eterogen
10/31/2020 23
Parametrii de dispersie: coeficientul de variație
o Se dorește evaluarea variabilității presiunii arteriale sistolice (PAS) comparativ cu cea a
indicelui de masă corporală (IMC). Datele aparținând la 10 subiecți sunt redate în
tabelul de mai jos:
1 2 3 4 5 6 7 8 9 10
PAS (mmHg) 220 182 100 130 120 100 140 160 120 160
IMC (kg/m2) 28 30 21 27 25 20 30 25 24 20
10/31/2020 24
100 120 130 160 182 220
Parametrii de dispersie: eroarea standard
25
10/31/2020 25
Parametrii de dispersie
Estimator Avantaj Dezavantaj
Amplitudinea Ușor de calculat Utilizează doar datele a două observații
Influențată de valori extreme
Tinde să aibă valoare mai mare odată cu
creșterea volumului eșantionului
IC Neafectată de valorile extreme Dificil de calculat
Independentă de volumul eșantionului Neadecvată pentru eșantioane mici
Adecvată pentru date cu distribuție asimetrică Utilizează doar două observații
Variația Utilizează toate datele seriei statistice Influențată de valorile extreme
Neadecvată pentru datele asimetrice
Deviația Utilizează toate datele seriei statistice Influențată de valorile extreme
standard Unitatea de măsură este identică cu cea a Neadecvată pentru datele asimetrice
datelor brute
Se interpretează ușor
CV Independent de unitățile de măsură Media aproape de zero → CV se apropie 26
de infinit
Permite compararea serilor statistice cu fiind sensibil la modificări mici ale mediei
diferite unități de măsură 10/31/2020 26
Parametrii de simetrie și boltire
10/31/2020 27
28
Număr subiecți
10
Număr subiecți
8 25 22
8 20
15 14
6 5 15 11
4 10 8
6
4 4
2 5 2
2 0
0
4 5 6 7 8 9 10
Scor durere (10 = durere insuportabilă)
Clase de venit (lei)
Direcţie negativă Direcţie pozitivă
10/31/2020 29
Parametrii de simetrie și boltire
2,80 2,97 3,05 3,25 3,40 3,45 3,80 4,10 4,30 4,40
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
o Q1 = 3,03
Q2-Q1= 3,43 – 3,03 = 0,40
o Q2 = 3,43
Q3-Q2 = 4,15 – 3,43 = 0,72
o Q3= 4,15
Cum interpretăm acest rezultat? 10/31/2020 30
o Datele calitative se sumarizează ca:
o proporții, rate, rapoarte
o metrica de centralitate? modulul
o Datele de tip interval/rație se sumarizează ca
o medie ± deviație standard dacă urmează distribuția normală
o mediană și interval cvartilic dacă nu urmează distribuția normală (aplicat și pentru
atele calitative scala ordinală)
o Dacă datele urmează distribuția normală, mă aștept ca
o media ≈ mediana ≈ modulul
o asimetria și boltirea ∈ (-0,5; +0,5)
10/31/2020 31
Tip Scala de măsură Indicator centralitate Indicator dispersie
Calitativ Nominal Modulul
Ordinal Mediana Valoarea minimă și maximă
Modulul Amplitudinea
Intervalul cvartilic
Cantitativ Interval/rație Media Variația
Mediana Deviația standard
Modulul Amplitudine
Intervalul cvartilic
10/31/2020 32
10/31/2020 33