Sunteți pe pagina 1din 34

STATISTICĂ

CURS 3
SERII DE REPARTIŢIE
UNIDIMENSIONALE
Prof.univ.dr Cristache Silvia Elena
1
Caracteristicile
seriilor de repartiţie unidimensionale
 frecvenţelor caracteristicilor de grupare (n ) le
i

corespund variantele variabilei studiate, caz în


care analizăm serii de repartiţie /distribuție
unidimensionale pe variante (serii cu
frecvenţe pe variante)
 frecvenţelor caracteristicilor de grupare (n ) le
i

corespund intervalele (egale sau neegale) ale


caracteristicii studiate, caz în care analizăm serii
de repartiţie / distribuție unidimensionale pe
intervale (serii cu frecvenţe pe intervale)
INDICATORII TENDINŢEI CENTRALE
 Există trei proprietăţi majore care descriu o
distribuţie de frecvenţe:
• TENDINŢA CENTRALĂ;

• VARIABILITATEA;

• FORMA DISTRIBUŢIEI

Toate aceste proprietăți au în vedere
determinarea unui ansamblu de indicatori.
3
Indicatori de caracterizare a
seriilor de repartiţie unidimensionale

Principalii indicatori de caracterizare a


seriilor de repartiţie unidimensionale sunt:
a. - indicatorii tendinţei centrale
(media ,mediana,modul)
b. - indicatorii variaţiei ( simpli si sintetici)
c. – indicatori de caracterizare a formei de
repartiţie a frecvenţelor
a. Indicatorii tendinţei centrale

Definiţie
Expresia sintetizării într-un singur nivel reprezentativ a tot
ce este esenţial, tipic şi obiectiv în apariţia, manifestarea şi
dezvoltarea unui fenomen, este cunoscută ca indicator al
tendinţei centrale (medie).
În raport cu natura datelor disponibile şi cerinţele de analiză,
indicatorii tendinţei centrale se pot determina ca:
 – indicatori medii calculaţi (media aritmetică,

armonică, geometrică, pătratică, cronologică etc)


 – indicatori medii de poziţie (quantile, modul etc)
INDICATORII TENDINŢEI CENTRALE-
MEDIA
Media aritmetică
▪ Media aritmetică, numită deseori, simplu, medie, este indicatorul
care se utilizează cel mai adesea pentru caracterizarea tendinţei centrale.
▪ Reprezintă valoarea care, înlocuind toţi termenii unei serii, nu
modifică nivelul lor totalizator şi, deci, se calculează ca suma valorilor
raportată la numărul lor.
▪ Semnificaţia ei este evidentă: nivelurile individuale x 1, x2, …, xn ale
variabilei X se manifestă sub influenţa unui număr mare de factori
esenţiali şi neesenţiali, sistematici şi întâmplători; media aritmetică repre-
zintă valoarea care s-ar fi înregistrat dacă toţi aceşti factori ar fi acţionat
constant la toate unităţile.
▪ Media aritmetică simplă se calculează ca suma valorilor
individuale observate raportată la numărul lor (pentru o serie de date
negrupată-un șir de valori):
n

x i

x i 1

n 6
INDICATORII TENDINŢEI CENTRALE -
MEDIA
▪ Suma abaterilor valorilor individuale de la media lor aritmetică
este egală cu zero:
n

n n x i

 (x
i 1
i  x)   x i  n 
i 1
i 1

n
0
şi, evident, că media se situează, întotdeauna între valoarea minimă
(xmin) şi valoarea maximă (xmax) a variabilei.

▪ Cum calculul mediei se bazează pe toate valorile individuale


observate, media aritmetică este afectată de orice valoare sau valori
extreme.

▪ Este utilizată când fenomenul supus cercetării înregistrează


modificări aproximativ constante, în progresie aritmetică, respectiv
atunci când seria de valori are o distribuţie normală sau asimptotic
normală

7
INDICATORII TENDINŢEI CENTRALE
-MEDIA
Calculul mediei aritmetice ponderate, folosind frecvenţele relative
 r

 n   ni 
▪ Dacă n reprezintă volumul total al colectivităţii  i 1  , frecvenţele relative sunt
n
n *i  i , i  1, r şi rezultă, deci:
n
r r

x i n *
i x i  ni*%
x i 1
 i 1

1 100

▪ Dacă o serie statistică este alcătuită din mai multe serii componente, pentru care s-au
 
calculat medii parţiale x j , j  1, m , atunci media întregii serii poate fi calculată ca o medie
aritmetică ponderată din mediile parţiale:
m

x
j1
j nj
x 
n
m

j
, unde nj reprezintă volumul seriei componente j j  1, m .  
j 1

8
INDICATORII TENDINŢEI CENTRALE -
MEDIA

Media unei variabile de tip alternativ


În cazul în care variabila studiată este de tip alternativ, atunci celor două variante de
răspuns (afirmativ şi negativ) li se vor acorda, convenţional, valorile numerice 1 şi,
respectiv 0. Pentru calculul mediei aritmetice, datele le putem sistematiza astfel:
Varianta de răspuns xi Frecvenţe ni Frecvenţe relative n i
*

m
Afirmativ 1 m n
w
nm
Negativ 0 n-m n
 1 w

Total – n 1

Determinarea mediei se va face astfel:


2

x n
i 1
i i
1  m  0n  m  m
x    w.
n n n
Se observă că media aritmetică în cazul variabilei alternative este exact proporţia
răspunsurilor afirmative (care posedă caracteristica studiată), în totalul unităţilor statistice. 9
INDICATORII TENDINŢEI CENTRALE
Mediana și Modulul
 Tipurile indicatorilor medii de poziţie:
1. Modulul
Indicatorii
medii
de poziţie 2. Cuantilele

Quartilele (Q) - în 4 părţi egale

Mediana (Me) – în 2 părţi egale

Percentilele (v) în 100 părţi egale

Decilele (D) - în 10 părţi egale


INDICATORII TENDINŢEI CENTRALE
MEDIANA (Me)
 Mediana (Me) este un indicator mediu de poziţie care face parte
din categoria cuantilelor (Cuantilele sunt valori ale caracteristicii
care împart o serie de date ordonată crescător sau descrescător
într-un anumit număr de părţi egale).
 Mediana reprezintă valoarea/varianta din mijlocul unei serii de
date, serie în care observaţiile au fost ordonate crescător (sau
descrescător).
 Astfel, o jumătate dintre valori sunt situate la stânga medianei, iar
o jumătate dintre valori sunt plasate la dreapta medianei. Din
acest motiv, mediana este situată în mijlocul seriei şi reprezinta
un indicator al tendinţei centrale.
 Mediana se poate determina pentru o serie de date:
 Calitative, dar care permit ierahizarea valorilor variabilei;

 Cantitative;

11
INDICATORII TENDINŢEI CENTRALE
MEDIANA (Me)

Determinarea medianei:
50% din termenii seriei 50% din termenii seriei

xmin Me xmax

12
Determinarea Me pentru o serie simpla
(date negrupate)
Caz 1. Determinarea medianei pentru o serie
simpla (date negrupate):
Se parcurg următorii paşi:
1. Se ordonează crescător termenii seriei.
2. Se stabileste felul seriei: para/impara

2.a) dacă seria are număr impar de termeni,


mediana este egală cu valoarea termenului central
( al n  1  lea termen)
2

13
Determinarea Me pentru o serie simpla
(date negrupate)
2.b) Dacă seria are număr par de termeni, atunci vom
avea doi termeni centrali si se parcurg pasii:
Pas1: Se ordoneaza crescator frecventele
absolute/relative ale seriei
Pas 2: Se determina locul Me: n 1
locMe 
2
Pas 3: Dacă seria este numerică, Me este egală cu media
aritmetică simplă a celor doi termeni centrali.
Dacă seria este calitativă, atunci se precizează ambele

variante centrale ca valori ale medianei.

14
Determinarea Me pentru o distribuţie
de frecvenţe pe variante
caz 2 . Determinarea medianei pentru o serie de
distribuţie de frecvenţe pe variante
Se parcurg următorii paşi:
1. Se cumulează crescător frecvenţele absolute sau relative
(Fci, Fci*)
2. Se determină locul medianei în serie.

locMe 
 n i 1

n 1
2 2
3. Se determină prima frecvenţă cumulată crescator mai
mare decât locul Me
4. Varianta corespunzătoare ei va fi egală cu valoarea
Mediana.
15
Determinarea Me pentru o distribuţie de
frecvenţe pe variante (variabila numerica)
Exemplul 1. In tabelul de mai jos este redata distributia a 200 de
familii in functie de nr.de copii. Mediana seriei se determina astfel:
200  1
locMe   100,5
2
155>100,5

→ Me = 2 copii

16
Determinarea Me pentru o distribuţie de
frecvenţe pe variante (variabila nenumerica)

Exemplul 2.
In tabelul urmator este redata
distributia a 250 de locuitori ai unui
cartier din oraşul X in functie de
frecventa cu care îşi fac
cumpărăturile de la un supermarket
din zonă. Mediana seriei se
determina astfel:

Loc Me=251/2=125,5

152>locMe=125,5

Asadar, Me=saptamanal

17
Determinarea Me pentru o distribuţie de
frecvenţe pe intervale de variaţie
caz . Determinarea medianei pentru o distribuţie de
frecvenţe pe intervale de variatie
Se parcurg următorii paşi:
1. Se cumulează crescător frecvenţele absolute sau relative (Fci,
Fci*)
2. Se determină locul medianei în serie.
locMe 
 ni  1 n  1

2 2
3. Se determină intervalul median (primul interval a cărui frecvenţă
cumulată este mai mare decât locul medianei în serie).
4. Se determină mediana dupa relaţia: loc Me  Fc( Me1)
Me  x0  h 
nMe 18
Determinarea medianei pentru o distribuţie
de frecvenţe pe intervale de variaţie
unde:
x0 este limita inferioară a intervalului median;
este mărimea intervalului
h median;
este locul (poziţia) medianei în
loc Me serie;
suma frecvenţelor absolute/relative până la intervalul
Fc( Me1) median sau frecvenţa cumulată crescător anterioară
intervalului median.
n Me este frecvenţa absoluta/relativa
intervalului median;

19
Determinarea medianei pentru o distribuţie
de frecvenţe pe intervale de variaţie

Exemplul 3. In tabelul urmator este prezentata distributia a 200 de agenti


economici in functie de cifra de afaceri. Să se determine cifra de afaceri
mediană:
locMe 
 ni  1 200  1
  100,5
2 2

140>100,5 → Me  [25  35)


100,5  20
Me  25  10   31,71
120
Interpretare: 50% din
firme au realizat o cifră de
afaceri mai mică de 31,71
mld. lei, 50% mai mare.

20
Indicatorii tendinţei centrale: MODUL
(Mo)
 Se mai numeşte valoare modală sau dominanta seriei;
 Caz 1 –serie negrupata (sir de valori)
 Modul reprezintă valoarea caracteristicii cel mai des
întâlnită (valoarea care se repetă de cele mai multe ori)
 Este indicatorul cel mai uşor de calculat;
 Se poate determina pentru:
 O serie de date calitative (variabila nenumerica);

 O serie de date cantitative (variabila numerica).

 Dacă într-o serie toate variantele apar o singură dată sau


de acelaşi număr de ori – nu se determină modul.
 Într-o serie de date pot exista: o singură valoare modală
(serie unimodală – a), două valori modale (serie bimodală –
b), trei sau mai multe valori modale (serie multimodală –
c). 21
Indicatorii tendinţei centrale: MODUL
(Mo)
ni
ni
a) b)

xi
xi
Mo Mo1 Mo2

ni

c)

xi
Mo1 Mo2 Mo3

22
Indicatorii tendinţei centrale:
MODUL (Mo)
 Caz 2 si caz 3–Serie de date grupate (variante sau
intervale)

 Pentru cazul 2. - Serie de repartiţie unidimensională pe


variante valoarea modală reprezintă acea valoare/variantă căreia îi
corespunde frecvenţa de apariție absoluta sau relativa maximă

 Pentru cazul 3. - Serie de repartiţie unidimensională pe


INTERVALE EGALE valoarea modală se determină parcurgând
etapele:
 se stabileşte intervalul modal ca fiind intervalul căruia îi

corespunde frecvenţa absoluta sau relativa maximă


 se calculează valoarea modală cu relaţia:

23
Indicatorii tendinţei centrale: MODUL
(Mo)
1
Mo  x 0  h 
1   2
unde:
 x0 este limita inferioară a intervalului modal;
 h este mărimea intervalului modal;
1 
 este diferenţa între frecvenţa intervalului modal şi
frecvenţa intervalului anterior celui modal;


 2  n Mo  n Mo 1
este diferenţa între frecvenţa intervalului modal şi
frecvenţa intervalului următor celui modal;

24
Analiza comparativă a celor trei indicatori
fundamentali ai tendinţei centrale

 Dacă seria de date este numerică, se utilizează toţi cei trei indicatori ai
tendinţei centrale, pentru caracterizarea acesteia, deoarece oferă
informaţii complementare;

 Media aritmetică este, în general, indicatorul tendinţei centrale ce trebuie


folosit dacă nu există motive întemeiate pentru a utiliza alţi indicatori din
aceeaşi categorie.
 Cu toate acestea, ea are un dezavantaj: este sensibilă la valorile
extreme. În asemenea cazuri, mediana se consideră a fi un indicator mai
bun al tendinţei centrale.

 În plus, mediana se poate folosi şi în cazul datelor nenumerice, ale caror


valori pot fi ierarhizate.

25
Analiza comparativă a celor trei indicatori
fundamentali ai tendinţei centrale

Pentru repartiţii moderat asimetrice, există o relaţie:


x  M 0  3 x  Me 
26
Indicatori ai poziţiei relative – cuantilele
(continuare)
În caracterizarea unui set de date, cele mai uzuale
cuantile sunt:
 Cuantila de ordin 2 ( mediana Me sau Q2 )
 Cuantilele de ordin 4 (cuartile, notate Q1, Q2, Q3,
care împart seria în patru părţi egale: delimitând câte
25% din observaţii (Q1), delimitand cate 50% din
observatii (Q2=Me) , delimitand cate 75% din observatii
(Q3)
 Cuantilele de ordin 10 (decile, notate D1, ...., D9 şi
care delimitează câte 10% din observaţii, D5 = Me)
 Cuantilele de ordin 100 (percentile, care delimitează
câte 1% din observaţii)

Cuantilele de ordin mai mare decât 2 se folosesc în cazul


seturilor de date de volum mare ( n  30 )
Indicatori ai poziţiei relative – cuantilele
(continuare)
Indicatori ai poziţiei relative – cuantilele
(continuare)
Se utilizează cinci indicatori, din categoria indicatorilor
medii de poziţie care oferă informaţii privind tendinţa
centrală, variabilitatea şi forma distribuţiei variabilei
studiate:
o valoarea minimă -xmin (numită şi percentila 0);
o cuartila inferioară -Q1 (delimitează cele mai mici 25%
din valori); loc Q1 = 0.25(n+1)
o mediana -Me (delimitează 50% din valori); loc Q2 =
0.50(n+1) INDICATOR PRECIZAT ANTERIOR
o cuartila superioară -Q3 (delimitează cele mai mari 25%
din valori); loc Q3 = 0.75(n+1)
o valoarea maximă -xmax (numită şi percentila 100)
Cele cinci valori se reprezintă grafic prin intermediul
diagramei Box-Plot
Indicatori ai poziţiei relative –
cuantilele (continuare)

Diagrama Box-Plot
Indicatori ai poziţiei relative –
cuantilele (continuare)

 Valorile extreme (outliers, în engl.) ale unei serii de


date se determină, pe baza diagramei Boxplot, astfel:

xmin  xi  Q1  1,5  IQR xmax  xi  Q3  1,5  IQR


 IQR se numeşte abatere intercuartilică
(InterQuartile Range)

IQR  Q3  Q1
Indicatori medii calculaţi (continuare)
 Media armonică
 este calculată numai pentru o variabilă cantitativă
 contribuie la stabilirea nivelului mediu al unei caracteristici derivate,
cu caracter de mărime medie parţială
 se determina pentru o serie simpla, raportand frecvenţa absolută
totală (numărul total al unităţilor) la suma inverselor valorilor
caracteristicii:

 se determină ca o inversă a mediei aritmetice ponderate calculată


din valorile inverse ale termenilor seriei pentru o serie de frecvente:
k

n i 1
i
x h  k
1
i 1 xi
ni

Dacă termenii seriei sunt pozitivi, atunci x h  x .


Indicatori medii calculaţi (continuare)
• Media pătratică
 este reprezentată de acea valoare care, înlocuind termenii seriei
ridicaţi la pătrat nu modifică suma pătratelor acestora.
 este utilizată pentru o serie în care termenii au valori pozitive şi
negative, dacă se dă o importanţă mai mare termenilor mari ai
seriei sau pentru calculul abaterii medii pătratice, ca indicator al
variaţiei.
 Pentru o serie simpla se calculează ca radical din media aritmetică a
pătratelor termenilor seriei:

 Formula de calcul a medie patratice ponderate (utilizata in cazul


unei serii de frecvente) este: k

x 2

i 1
i ni
xp  k

n
i 1
i
Indicatori medii calculaţi (continuare)
 Media geometrică
În condiţiile în care termenii unei serii nu permit o relaţie de
aditivitate, ci un produs, există posibilitatea ca, pentru determinarea
nivelului mediu al dinamicii fenomenelor economico-sociale, a căror
evoluţie înregistreză decalaje mari la început şi mici către sfârşit,
pentru a calcula ritmul mediu de creştere sau descreştere a unui
fenomen în evoluţia lui în timp, să se utilizeze media geometrică a cărei
formulă de calcul este:
 pentru o serie simplă:

n
pentru o serie de frecvenţe:

 ni
xg  n xi
i 1
 Media geometrică are o valoare mai mică decât media aritmetică.
 Media geometrică nu se poate calcula dacă un termen al seriei este
negativ sau egal cu zero.

S-ar putea să vă placă și