Sunteți pe pagina 1din 13

STATISTICĂ

CURS 5

Măsuri statistice descriptive pentru


date univariate (II)
A. Măsurarea tendinţei centrale

1
Indicatori ai poziţiei relative – cuantilele

În caracterizarea unui set de date, cele mai uzuale cuantile sunt:

 Cuantila de ordin 2 ( mediana )

 Cuantilele de ordin 4 (cuartile, notate Q1, Q2, Q3, care împart seria
în patru părţi egale, delimitând câte 25% din observaţii, Q2=Me)

 Cuantilele de ordin 10 (decile, notate D1, ...., D9 şi care delimitează


câte 10% din observaţii, D5 = Me)

 Cuantilele de ordin 100 (centile, care delimitează câte 1% din


observaţii)

Cuantilele de ordin mai mare decât 2 se folosesc în cazul


seturilor de date de volum mare ( n  30)

2
Indicatori ai poziţiei relative – cuantilele

3
Indicatori ai poziţiei relative – cuantilele

 Se utilizează cinci indicatori, din categoria indicatorilor medii de


poziţie care oferă informaţii privind tendinţa centrală, variabilitatea şi
forma distribuţiei variabilei studiate:

- valoarea minimă -xmin (numită şi percentila 0);

- cuartila inferioară -Q1 (delimitează cele mai mici 25% din valori);

- mediana -Me (delimitează 50% din valori);

- cuartila superioară -Q3 (delimitează cele mai mari 25% din valori);

- valoarea maximă -xmax (numită şi percentila 100)

Cele cinci valori se reprezintă grafic prin intermediul diagramei Box-Plot

4
Indicatori ai poziţiei relative – cuantilele

Diagrama Box-Plot

5
Indicatori ai poziţiei relative – cuantilele

 Valorile extreme (outliers, în engl.) ale unei


serii de date se determină, pe baza diagramei
Boxplot, astfel:

xmin  xi  Q1  1,5  IQR xmax  xi  Q3  1,5  IQR

 IQR se numeşte abatere intercuartilică


(InterQuartile Range)
IQR  Q3  Q1

6
Modul
3. Modul (Mo, mode în engl.) reprezintă valoarea cel mai
des întâlnită într-o serie de date (valoarea care are cea
mai mare frecvenţă de apariţie)

 O distribuţie cu un singur mod se numeşte unimodală


(a), o distribuţie este bimodală (b) dacă are două
valori dominante şi multimodală (c) dacă are mai mult
de două valori modale.

7
Modul
ni
ni
a) b)

xi
xi
Mo Mo1 Mo2

ni
c)

xi
Mo1 Mo2 Mo3
8
MODUL (pentru date grupate)

1. Se identifică intervalul modal (intervalul cu frecvenţa maximă)

2. Se calculează modul, ca centrul intervalului modal sau prin


relaţia:
1
Mo  x0  h 
1   2
unde:
• x0 este limita inferioară a intervalului modal;
• h este mărimea intervalului modal;
1  nMo  nMo1
• este diferenţa între frecvenţa intervalului
modal şi frecvenţa intervalului anterior celui modal;
 2  nMo  nMo1
• este diferenţa între frecvenţa intervalului
modal şi frecvenţa intervalului următor celui modal;
9
Analiza comparativă indicatorilor tendinţei centrale

Pentru repartiţii moderat asimetrice, există o relaţie:


x  M 0  3 x  Me 
10
Alte tipuri de medii

1. MEDIA ARMONICĂ =medie de calcul, cu aplicaţii speciale, care se determină, ca


valoarea inversă a mediei aritmetice, calculată din inversele valorilor seriei:

xh  n
n
n i 1
i
1 100
xh   

1 r r r

  
1 1 * 1 *%
xi ni ni ni
i 1 xi xi xi
i 1 i 1 i 1

11
Alte tipuri de medii

2. MEDIA PĂTRATICĂ = medie de calcul cu aplicaţii speciale şi reprezintă


valoarea care, înlocuind termenii seriei, nu modifică suma pătratelor lor:

r r r

  
n


xi2 ni xi2 ni* xi2 ni*%
xi2 i 1 i 1 i 1
xp   
i 1 r
xp  1 100
n i 1
ni

12
Alte tipuri de medii

3. Media geometrică se calculează ca rădăcina de ordinul n din


produsul celor n valori ale unei serii de date:

r
.
 ni r


n
xg  n x
i 1
i
xg  i 1

i 1
xini

Între mediile de calcul prezentate există relaţia:


xh  x g  x  x p

13

S-ar putea să vă placă și