Sunteți pe pagina 1din 13

CURS STATISTIC - Unitatea de nvare nr.

6


ANALIZA STATISTIC A DISTRIBUIILOR DE FRECVENE.
INDICATORII TENDINEI CENTRALE (2).

Cuprins:

1.Obiectivele unitii de nvare.
2.Indicatorii medii de poziie.
2.1 Mediana
2.2. Modul
3.Abordri comparative ntre principalii indicatori ai tendinei centrale.
4. Rspunsuri i comentarii la testele de autoevaluare.
5. Teme de control.
6. Rezumatul unitii de nvare.
7. Bibliografia unitii de nvare.

1. Obiectivele unitii de nvare

n urma parcurgerii acestei uniti de nvare studentul:
- va nelege cnd este indicat s se utilizeze mediana i modul
- i va nsui metodologia de calcul a celor doi indicatori (mediana i modul) pentru toate
tipurile de serii

2. Indicatorii medii de pozitie

Indicatorii medii de poziie evideniaz tendinele de mijloc sau de concentrare a unitilor.
Dintre indicatorii medii de poziie, cei mai frecveni utilizai sunt: mediana i modul.
2.1. Mediana

Mediana face parte din categoria cuantilelor alturi de quartile, decile. Cuvntul median
provine din cuvntul latin medius care nseamn mijloc.
Mediana reprezint acea valoare a unei serii ordonate cresctor sau descresctor care
mparte seria n dou pri egale, aa nct 50% din termenii seriei au valori mai mici dect
mediana, iar 50% mai mari dect mediana.
Un avantaj al medianei fa de medie este acela c poate fi utilizat n caracterizarea
tendinei centrale pentru o serie de date msurate pe o scar ordinal. Mediana ia n consideraie
doar poziia termenilor n serie, nu i mrimea acestor valori, deci mediana nu este supus
influenei valorilor foarte mari sau foarte mici care sunt lsate n afara seriei.
Exemplul 1
Pentru 10 obolani care ncearc s ias dintr-un labirint se cunosc urmtorii timpi de parcurgere:
9 obolani au parcurs labirintul n mai puin de 15 minute, n timp ce un obolan a reuit s
parcurg labirintul dup 24 de ore. Pentru a calcula timpul mediu n care un obolan parcurge
labirintul valoarea reprezentativ este mediana i nu media (care ar fi afectat de acea durat
mare de peste 24 ore).
Valoarea medianei este invariabil fa de convenia cu care se nchid intervalele extreme,
spre deosebire de medie care este influenat att de valori ct i de frecvena lor.
Dac seria prezint o repartiie normal atunci mediana poate s nlocuiasc valoarea
medie deoarece se calculeaz mai uor.
Mediana este un indicator utilizat n cercetrile medicale, n studiul mortalitii, la
determinarea duratei medii de via, la determinarea duratei medii de funcionare a unui produs.
Calculul medianei:
- pentru o serie simpl (pentru date negrupate), ntlnim dou situaii:
- seria are un numr impar de termeni atunci mediana este egal cu termenul central
al seriei ordonate cresctor sau descresctor.
Se cunoate urmtorul set de valori ale unei caracteristici:
5 7 4 9 12 3 10
Ordonm seria cresctor:
3 4 5 7 9 10 12
|
Me
Pentru date ordinale mediana este varianta situat n centrul seriei.
- seria are un numr par de termeni, atunci mediana este egal cu media aritmetic
simpl a celor 2 termeni centrali ai seriei ordonate cresctor sau descresctor.
Fie urmtorul set de valori:
3 1 5 7 9 4
1 3 4 5 7 9

5 , 4
2
5 4
Me =
+
=
Pentru un ir de date ordinale format din numr par de termeni, mediana este egal cu una
din cele dou variante din centrul seriei dac aceste variante sunt egale, iar dac variantele nu
sunt egale mediana ia 2 valori deoarece nu se poate face media lor.
- pentru o serie de distribuie de frecvene pe variante calculul medianei comport
urmtoarele etape:
Etapa 1: se determin locul medianei n cadrul seriei:
|
|
.
|

\
|
+ =

=
1 n
2
1
L
k
1 i
i Me

Etapa 2: se cumuleaz cresctor frecvenele absolute i se determin acea frecven
cumulat cresctor care este imediat mai mare sau egal cu locul medianei (L
Me
). Varianta care
corespunde frecvenei absolute cumulate ce ndeplinete condiia de mai sus este mediana.
Exemplul 2
80 de apartamente dintr-un bloc au fost sistematizate dup numrul de camere rezultnd
urmtoarea distribuie de frecvene:
Nr. Camere (x
i
) Nr. Apartamente (n
i
) n
i
cumulat cresctor
1
2
3
4
13
25
28
14
13
38
66
30
Total 80
Calculai mediana.
< = =
|
|
.
|

\
|
+ =

=
66 5 , 40 81
2
1
1 n
2
1
L
k
1 i
i Me

Me = 3 camere 50% dintre apartamente au mai puin de 3 camere, iar 50% mai mult
de 3 camere.

- pentru o serie de frecvene pe intervale de variaie, mediana se poate determina
numai n ipoteza n care valorile sunt distribuite uniform n cadrul intervalului de
grupare.
Etape:
- se determin locul medianei n cadrul seriei:
|
|
.
|

\
|
+ =

=
1 n
2
1
L
k
1 i
i Me

- se cumuleaz cresctor frecvenele absolute i se determin acea frecven cumulat
cresctor care este imediat mai mare sau egal cu L
me
. Intervalul care corespunde frecvenei
absolute cumulate ce ndeplinete condiia de mai sus este intervalul median.
- se calculeaz mediana cu relaia:
Me
pMe Me
0
n
n L
h x Me

+ =
x
0
= limita inferioar a intervalului median;
h = mrimea intervalului median;
n
pMe
= suma frecvenelor absolute pn la intervalul median;
n
Me
= frecvena absolut a intervalului median.

Exemplul 3
Repartiia sucursalelor unei bnci comerciale n funcie de volumul depozitelor bancare atrase
ntr-o lun este:
Volum depozite bancare
(mii euro) (x
i
)
Nr. Bnci (n
i
) n
i
cumulat cresctor
20 40
40 60
60 80
80 100
100 - 120
12
14
20
18
16
12
26
46
64
80
Total 80 -
| | 80 , 60 Me 46 5 , 40
2
81
1 n
2
1
L
5
1 i
i Me
e < = =
|
|
.
|

\
|
+ =

=

euro mii 5 , 74
20
26 5 , 40
20 60 Me =

+ =
Deci 50% dintre sucursale au atras depozite n valoare de 74,5 mii euro, iar 50% peste 74,5
mii euro.

Calculul grafic al medianei se poate realiza n dou moduri:
- mediana este corespondenta pe abscis a punctului de intersecie al ogivei cresctoare
cu ogiva descresctoare;
- se traseaz doar ogiva cresctoare, iar de pe axa OY din punctul corespunztor locului
medianei se duce o paralel cu axa OX ce intersecteaz ogiva cresctoare ntr-un punct.
Corespondenta pe abscis a acestui punct este mediana.
Dezavantajele medianei:
- mediana este mai puin stabil dect media;
- nu poate fi supus cu aa uurin calculelor algebrice;
- media este preferat n statistica inferenial.

2.2. Modul

Modul (dominanta unei serii) este valoarea cea mai des ntlnit sau creia i corespunde
cea mai mare frecven de apariie.
Calculul algebric al modului:
- pentru o serie simpl:

Exemplul 4
La un magazin de pantofi s-au vndut ntr-o or pantofi avnd urmtoarele mrimi:
Caz 1: 35 37 39 40 42
Aceast serie nu are mod.
Caz 2: 35 37 35 40 42
Mo = 35 deoarece este valoarea cea mai des ntlnit
Caz 3: 35 37 35 40 40
Mo
1
= 35 Mo
2
= 40
Aceast serie este bimodal.
Exist i serii plurimodale.

- pentru o serie de distribuie pe variante, modul este egal cu varianta creia i
corespunde frecvena absolut sau relativ maxim.
Exemplu 5
Nr. camere (x
i
) Nr. apartamente(n
i
)
1
2
3
4
13
25
28
14
Mo = 3 camere deoarece variantei 3 i corespunde frecvena absolut maxim.

- pentru o serie de distribuie de frecvene pe intervale de variaie modul se calculeaz
cu relaia:
2 1
1
0
h x Mo
A + A
A
+ =
x
0
= limita inferioar a intervalului modal;
h = mrimea intervalului modal;
A
1
= diferena dintre frecvena intervalului modal i a celui anterior;
A
2
= diferena dintre frecvena intervalului modal i a celui urmtor.
Intervalul modal este intervalul cruia i corespunde frecvena absolut maxim.
Exemplul 6
Volum depozite bancare (mii euro) (x
i
) Nr. Bnci (n
i
)
20 40
40 60
60 80
80 100
100 - 120
12
14
20
18
16
Intervalul modal este [60, 80)
75
2 6
6
20 60
) 18 20 ( ) 14 20 (
14 20
20 60 Mo =
+
+ =
+

+ = mii euro
Cele mai multe bnci au atras depozite n valoare de 75 mii euro.

Testul de autoevaluare 1
1. Un auditor bancar a selectat 10 conturi i a nregistrat sumele existente n fiecare dintre
aceste conturi. Sumele sunt date n Euro: 150,175, 195, 200,235,240,250,256,275,294
Se cere: s se calculeze mediana i modul.

2.Distribuia salariailor unui magazin n funcie de numrul de zile de concediu de odihn
dintr-un an se prezint astfel:
Zile concediu 14 15 16 17 18 19 20
Nr. salariai 2 6 10 15 8 5 4
Se cere : s se calculeze mediana i modul.

3.Un studiu efectuat asupra unui numr de 50 de cutii de brnz topit la cutie dintr-un
magazin a reliefat urmtoarele informaii cu privire la numrul de calorii coninute:
Calorii 75-85 85-95 95-105 105-115 115-125
Nr. cutii cu
brnz topit
5 10 15 14 6
Se cere s se calculeze indicatorii tendinei centrale

Calculul grafic al modului:
- n cazul seriilor de distribuie pe variante, determinarea grafic a modului se face cu
ajutorul diagramei prin bare sau prin bastoane, modul fiind acea valoare de pe abscis
creia i corespunde ordonata maxim:








- n cazul seriilor de distribuie pe intervale de variaie, determinarea grafic a
modului se face cu ajutorul histogramei. Se determin punctul de intersecie al
segmentului ce unete captul din stnga al blocului cel mai nalt cu captul din stnga
blocului urmtor cu segmentul ce unete captul din dreapta al blocului cel mai nalt cu
captul din dreapta al blocului anterior. Corespondena pe abscis a acestui punct de
intersecie este modul.










Analog cu modul se poate determina, n cazul distribuiilor n form de U i valoarea
antimodal creia i corespunde frecvena minim.
Modul nu este un indicator al tendinei centrale foarte stabil i poate fi afectat de modul n
care au fost construite intervalele de variaie. n plus, modul nu se preteaz aa uor la clacule
algebrice ca i mediana.
Cu toate aceste dezavantaje, modul este un indicator util n analiza seriilor de dimensiuni
mari n care ne intereseaz valoarea cea mai des ntlnit.

3. Abordarea comparativ a principalilor indicatori ai tendinei centrale

Media este indicatorul cel mai utilizat n analiza tendinei centrale. Calculul mediei se
bazeaz pe ansamblul valorilor caracteristicii x
i
, de aceea ea este influenat de valorile extreme.
Mo
x
i

n
i

Mo
x
i

n
i

Mediana este un indicator care, spre deosebire de medie, se calculeaz n funcie de poziia
termenilor n serie i nu este influenat de valorile termenilor.
Modul se determin foarte uor, dar este indicatorul cel mai sensibil la modul de grupare a
datelor. Dou grupri diferite ale aceleiai serii vor conduce la dou valori modale diferite.
Pentru o serie perfect simetric cei trei indicatori ai tendinei centrale sunt egali:
Mo Me x = =
Proprieti
(Yule & Kendall)
Modul Mediana Media aritmetic
Este definit ntr-un mod obiectiv da da da
Depinde de numrul de termeni ai
seriei
nu da da
Este puin sensibil la mrimea
valorilor extreme
da da nu
Are o semnificaie concret da da da
Este uor de calculat da da da i nu
Este puin sensibil la eantionare destul nu da
Se preteaz la calcule algebrice nu nu da


4. Rspunsuri i comentarii la testele de autoevaluare

1.Mediana
Pentru calculul medianei valorile x
i
trebuie ordonate cresctor. (sunt, din ipotez)
Seria are numr par de termeni (10 termeni), deci mediana este media aritmetic a celor doi
termeni centrali:
Euro 5 , 237
2
240 235
Me =
+
=
Deci, n 50% din conturi sunt mai puin de 237,5 Euro, iar n 50% din conturi sunt peste
237,5 Euro.
Modul este valoarea cea mai des ntlnit. Fiind serie simpl i neavnd date care s se
repete, seria nu are mod.
2.
Mediana (valoarea central a seriei)
zile 17 Me 33 5 , 25 51
2
1
) 1 n (
2
1
: L
7
1 i
i Me
= < = = +

=

Se cumuleaz cresctor frecvenele absolute (n
i
):

x
i
n
i
n
i
cumulate cresctor
14
15
16
17
18
19
20
2
6
10
15
8
5
4
2
8
18
33
41
46
50

Deci 50% dintre salariai au avut sub 17 zile concediu, iar 50%, peste 17 zile.
Modul (dominanta unei serii)
Modul este, n cazul gruprii pe variante, acea valoare a caracteristicii creia i corespunde
frecvena absolut maxim. Frecvena absolut (n
i
) maxim este 15 Mo = 17 zile. Cei mai
muli salariai au avut 17 zile de concediu.

3.Indicatorii tendinei centrale sunt:
a
1
) Media se calculeaz ca o medie aritmetic ponderat
x
i
reprezint centrul de interval calculat ca medie aritmetic simpl ntre limita inferioar i
limita superioar a fiecrui interval:
calorii 2 , 101
50
5060
50
6 120 14 110 15 100 10 90 5 80
n
n x
x
5
1 i
i
5
1 i
i i
= =
+ + + +
= =

=
=

a
2
) Mediana (valoarea central a seriei):
| | 105 , 95 Me 30 5 , 25 51
2
1
) 1 n (
2
1
: L
5
1 i
i Me
e < = = +

=

Se cumuleaz frecvenele absolute i se determin care frecven absolut este imediat mai
mare sau egal cu L
Me
. Intervalul care corespunde frecvenei absolute cumulate ce ndeplinete
condiia de mai sus este intervalul median.
Me se calculeaz cu relaia:
calorii 102
15
15 5 , 25
10 95
n
n L
h x Me
Me
pMe Me
0
=

+ =

+ =
x
0
= limita inferioar a intervalului median;
h = mrimea intervalului;
n
pMe
= suma frecvenelor absolute pn la intervalul median;
n
Me
= frecvena absolut a intervalului median.
Deoarece Me = 102 calorii 50% din cutii au sub 102 calorii, iar 50% au peste 102
calorii.

a
3
) Modul (dominanta seriei):
calorii 33 , 103
) 14 15 ( ) 10 15 (
10 15
10 95 h x Mo
2 1
1
0
=
+

+ =
A + A
A
+ =
x
0
= limita inferioar a intervalului modal;
h = mrimea intervalului modal;
A
1
= diferena dintre frecvena absolut a intervalului modal i frecvena absolut a
intervalului anterior celui modal;
A
2
= diferena dintre frecvena absolut a intervalului modal i frecvena absolut a
intervalului urmtor celui modal.
Intervalul modal este intervalul cruia i corespunde frecvena absolut maxim. Deci Mo
e [95, 105].
Deoarece Mo = 103,33 calorii, rezult c cele mai multe dintre cutii au 103,33 calorii.

5. Teme de control

1.Se cunosc urmtoarele date privind numrul de cri mprumutate n decursul unei luni de
abonaii unei biblioteci:
Nr. cri mprumutate 0 1 2 3 4 5 6 7
Nr. abonai 18 39 57 64 42 33 21 4
Calculai mediana acestei serii.

2. Calculai mediana pentru seria statistic urmtoare:
14 16 12 9 11 18 7 8 9 16 7 9 18

3.Un studiu privind durata de via n ore a unui produs electrocasnic efectuat pe 100 aparate a
condus la urmtoarele rezultate:
Durata de via (ore) Structura numrului de aparate electrocasnice
0 1000
1000 2000
2000 3000
3000 4000
4000 5000
5000 - 6000
8
20
26
22
18
6
Total 100
Se cere: s se calculeze indicatorii tendinei centrale;

6. Rezumatul Unitii de nvare

Indicatorii tendinei centrale reprezint o categorie deosebit de important de indicatori statistici
utilizai n analiza variabilelor numerice. Aceti indicatori sintetici redau ntr-o singur msur ceea ce
este tipic, esenial, caracteristic, obiectiv i stabil pentru o serie de date numerice.
Indicatorii tendinei centrale sunt:
mrimile medii care pot fi calculate att ca medii simple (pentru date negrupate), ct i
ca medii ponderate (pentru date grupate pe variante sau pe intervale)
- media aritmetic
- media geometric
- media ptratic
- media armonic
indicatorii medii de poziie
- mediana
- modul
Aceti indicatori caracterizeaz cu att mai bine tendina central cu ct datele pe baza crora
se determin sunt mai omogene.
Cei mai importani i mai utilizai indicatori ai tendinei centrale sunt: media, mediana, modul.

7. Bibliografia Unitii de nvare

1.Chauvat G., Reau J.P., Statistiques descriptives, Armand Colin, Paris, 2004
2. Danciu A.,Niculescu I., Gruiescu M., Statistic economic, Editura Enciclopedic, Bucureti,
2009
3. Isaic-Maniu Al., Mitrut C., Voineagu V., Statistic, Editura Universitar, Bucureti, 2003;
4. Voineagu V., ian E., Ghi S., Boboc C., Todose D. Statistic. Baze teoretice i aplicaii,
Editura Economic, Bucureti, 2007;
5.Wonnacott T.H., Wonnacott R.J., Statistique, Economica, Paris,1995