Sunteți pe pagina 1din 13

CURS STATISTIC - Unitatea de nvare nr.

ANALIZA STATISTIC A DISTRIBUIILOR DE FRECVENE. INDICATORII TENDINEI CENTRALE (2). Cuprins:


1.Obiectivele unitii de nvare. 2.Indicatorii medii de poziie. 2.1 Mediana 2.2. Modul 3.Abordri comparative ntre principalii indicatori ai tendinei centrale. 4. Rspunsuri i comentarii la testele de autoevaluare. 5. Teme de control. 6. Rezumatul unitii de nvare. 7. Bibliografia unitii de nvare.

1. Obiectivele unitii de nvare


n urma parcurgerii acestei uniti de nvare studentul: va nelege cnd este indicat s se utilizeze mediana i modul i va nsui metodologia de calcul a celor doi indicatori (mediana i modul) pentru toate tipurile de serii

2. Indicatorii medii de pozitie


Indicatorii medii de poziie evideniaz tendinele de mijloc sau de concentrare a unitilor. Dintre indicatorii medii de poziie, cei mai frecveni utilizai sunt: mediana i modul.

2.1. Mediana Mediana face parte din categoria cuantilelor alturi de quartile, decile. Cuvntul median provine din cuvntul latin medius care nseamn mijloc. Mediana reprezint acea valoare a unei serii ordonate cresctor sau descresctor care mparte seria n dou pri egale, aa nct 50% din termenii seriei au valori mai mici dect mediana, iar 50% mai mari dect mediana. Un avantaj al medianei fa de medie este acela c poate fi utilizat n caracterizarea tendinei centrale pentru o serie de date msurate pe o scar ordinal. Mediana ia n consideraie doar poziia termenilor n serie, nu i mrimea acestor valori, deci mediana nu este supus influenei valorilor foarte mari sau foarte mici care sunt lsate n afara seriei.

Exemplul 1

Pentru 10 obolani care ncearc s ias dintr-un labirint se cunosc urmtorii timpi de parcurgere: 9 obolani au parcurs labirintul n mai puin de 15 minute, n timp ce un obolan a reuit s parcurg labirintul dup 24 de ore. Pentru a calcula timpul mediu n care un obolan parcurge labirintul valoarea reprezentativ este mediana i nu media (care ar fi afectat de acea durat mare de peste 24 ore). Valoarea medianei este invariabil fa de convenia cu care se nchid intervalele extreme, spre deosebire de medie care este influenat att de valori ct i de frecvena lor. Dac seria prezint o repartiie normal atunci mediana poate s nlocuiasc valoarea medie deoarece se calculeaz mai uor. Mediana este un indicator utilizat n cercetrile medicale, n studiul mortalitii, la determinarea duratei medii de via, la determinarea duratei medii de funcionare a unui produs. Calculul medianei: pentru o serie simpl (pentru date negrupate), ntlnim dou situaii: - seria are un numr impar de termeni atunci mediana este egal cu termenul central al seriei ordonate cresctor sau descresctor. Se cunoate urmtorul set de valori ale unei caracteristici: 5 7 4 9 12 3 10 Ordonm seria cresctor:

7 Me

10

12

Pentru date ordinale mediana este varianta situat n centrul seriei. - seria are un numr par de termeni, atunci mediana este egal cu media aritmetic simpl a celor 2 termeni centrali ai seriei ordonate cresctor sau descresctor. Fie urmtorul set de valori: 3 1 1 3 5 4 7 5
4+5 = 4,5 2

9 7

4 9

Me =

Pentru un ir de date ordinale format din numr par de termeni, mediana este egal cu una din cele dou variante din centrul seriei dac aceste variante sunt egale, iar dac variantele nu sunt egale mediana ia 2 valori deoarece nu se poate face media lor. pentru o serie de distribuie de frecvene pe variante calculul medianei comport urmtoarele etape: Etapa 1: se determin locul medianei n cadrul seriei:
L Me =
k 1 n i + 1 2 i =1

Etapa 2: se cumuleaz cresctor frecvenele absolute i se determin acea frecven cumulat cresctor care este imediat mai mare sau egal cu locul medianei (LMe). Varianta care corespunde frecvenei absolute cumulate ce ndeplinete condiia de mai sus este mediana.

Exemplul 2

80 de apartamente dintr-un bloc au fost sistematizate dup numrul de camere rezultnd urmtoarea distribuie de frecvene:
Nr. Camere (xi) 1 2 3 4 Nr. Apartamente (ni) 13 25 28 14 ni cumulat cresctor 13 38 66 30

Total

80
k 1 n i + 1 = 1 81 = 40,5 < 66 2 2 i =1

Calculai mediana.
L Me =

Me = 3 camere 50% dintre apartamente au mai puin de 3 camere, iar 50% mai mult de 3 camere. pentru o serie de frecvene pe intervale de variaie, mediana se poate determina numai n ipoteza n care valorile sunt distribuite uniform n cadrul intervalului de grupare. Etape: - se determin locul medianei n cadrul seriei:
L Me =
k 1 n i + 1 2 i =1

- se cumuleaz cresctor frecvenele absolute i se determin acea frecven cumulat cresctor care este imediat mai mare sau egal cu Lme. Intervalul care corespunde frecvenei absolute cumulate ce ndeplinete condiia de mai sus este intervalul median. - se calculeaz mediana cu relaia:
Me = x 0 + h L Me n pMe n Me

x0 = limita inferioar a intervalului median; h = mrimea intervalului median; npMe = suma frecvenelor absolute pn la intervalul median; nMe = frecvena absolut a intervalului median.

Exemplul 3

Repartiia sucursalelor unei bnci comerciale n funcie de volumul depozitelor bancare atrase ntr-o lun este:
Volum depozite bancare (mii euro) (xi) Nr. Bnci (ni) ni cumulat cresctor

20 40 40 60 60 80 80 100 100 - 120 Total


L Me =

12 14 20 18 16 80
5 1 n i + 1 = 81 = 40,5 < 46 Me [60, 80] 2 2 i =1

12 26 46 64 80 -

Me = 60 + 20

40,5 26 = 74,5 mii euro 20

Deci 50% dintre sucursale au atras depozite n valoare de 74,5 mii euro, iar 50% peste 74,5 mii euro. Calculul grafic al medianei se poate realiza n dou moduri: mediana este corespondenta pe abscis a punctului de intersecie al ogivei cresctoare cu ogiva descresctoare; se traseaz doar ogiva cresctoare, iar de pe axa OY din punctul corespunztor locului medianei se duce o paralel cu axa OX ce intersecteaz ogiva cresctoare ntr-un punct. Corespondenta pe abscis a acestui punct este mediana. Dezavantajele medianei: mediana este mai puin stabil dect media; nu poate fi supus cu aa uurin calculelor algebrice; media este preferat n statistica inferenial.

2.2. Modul Modul (dominanta unei serii) este valoarea cea mai des ntlnit sau creia i corespunde cea mai mare frecven de apariie. Calculul algebric al modului: - pentru o serie simpl:

Exemplul 4

La un magazin de pantofi s-au vndut ntr-o or pantofi avnd urmtoarele mrimi: Caz 1: 35 37 39 40 42 Aceast serie nu are mod. Caz 2: 35 37 35 40 42 Mo = 35 deoarece este valoarea cea mai des ntlnit Caz 3: 35 37 35 40 40 Mo1 = 35 Mo2 = 40 Aceast serie este bimodal. Exist i serii plurimodale. - pentru o serie de distribuie pe variante, modul este egal cu varianta creia i corespunde frecvena absolut sau relativ maxim.

Exemplu 5
Nr. camere (xi) 1 2 3 4 Nr. apartamente(ni) 13 25 28 14

Mo = 3 camere deoarece variantei 3 i corespunde frecvena absolut maxim. - pentru o serie de distribuie de frecvene pe intervale de variaie modul se calculeaz cu relaia:
Mo = x 0 + h 1 1 + 2

x0 = limita inferioar a intervalului modal; h = mrimea intervalului modal; 1 = diferena dintre frecvena intervalului modal i a celui anterior; 2 = diferena dintre frecvena intervalului modal i a celui urmtor. Intervalul modal este intervalul cruia i corespunde frecvena absolut maxim.

Exemplul 6
Nr. Bnci (ni) 12 14 20 18 16

Volum depozite bancare (mii euro) (xi) 20 40 40 60 60 80 80 100 100 - 120

Intervalul modal este [60, 80)


Mo = 60 + 20 20 14 6 = 60 + 20 = 75 mii euro (20 14) + (20 18) 6+2

Cele mai multe bnci au atras depozite n valoare de 75 mii euro. Testul de autoevaluare 1 1. Un auditor bancar a selectat 10 conturi i a nregistrat sumele existente n fiecare dintre aceste conturi. Sumele sunt date n Euro: 150,175, 195, 200,235,240,250,256,275,294 Se cere: s se calculeze mediana i modul. 2.Distribuia salariailor unui magazin n funcie de numrul de zile de concediu de odihn dintr-un an se prezint astfel: Zile concediu Nr. salariai 14 2 15 6 16 10 17 15 18 8 19 5 20 4

Se cere : s se calculeze mediana i modul. 3.Un studiu efectuat asupra unui numr de 50 de cutii de brnz topit la cutie dintr-un magazin a reliefat urmtoarele informaii cu privire la numrul de calorii coninute:
Calorii Nr. cutii cu brnz topit 75-85 5 85-95 10 95-105 15 105-115 14 115-125 6

Se cere s se calculeze indicatorii tendinei centrale

Calculul grafic al modului: n cazul seriilor de distribuie pe variante, determinarea grafic a modului se face cu ajutorul diagramei prin bare sau prin bastoane, modul fiind acea valoare de pe abscis creia i corespunde ordonata maxim:

ni xi

Mo n cazul seriilor de distribuie pe intervale de variaie, determinarea grafic a

modului se face cu ajutorul histogramei. Se determin punctul de intersecie al segmentului ce unete captul din stnga al blocului cel mai nalt cu captul din stnga blocului urmtor cu segmentul ce unete captul din dreapta al blocului cel mai nalt cu captul din dreapta al blocului anterior. Corespondena pe abscis a acestui punct de intersecie este modul.
ni

xi Mo

Analog cu modul se poate determina, n cazul distribuiilor n form de U i valoarea antimodal creia i corespunde frecvena minim. Modul nu este un indicator al tendinei centrale foarte stabil i poate fi afectat de modul n care au fost construite intervalele de variaie. n plus, modul nu se preteaz aa uor la clacule algebrice ca i mediana. Cu toate aceste dezavantaje, modul este un indicator util n analiza seriilor de dimensiuni mari n care ne intereseaz valoarea cea mai des ntlnit.

3. Abordarea comparativ a principalilor indicatori ai tendinei centrale


Media este indicatorul cel mai utilizat n analiza tendinei centrale. Calculul mediei se bazeaz pe ansamblul valorilor caracteristicii xi, de aceea ea este influenat de valorile extreme.

Mediana este un indicator care, spre deosebire de medie, se calculeaz n funcie de poziia termenilor n serie i nu este influenat de valorile termenilor. Modul se determin foarte uor, dar este indicatorul cel mai sensibil la modul de grupare a datelor. Dou grupri diferite ale aceleiai serii vor conduce la dou valori modale diferite. Pentru o serie perfect simetric cei trei indicatori ai tendinei centrale sunt egali:
x = Me = Mo

Proprieti (Yule & Kendall) Este definit ntr-un mod obiectiv Depinde de numrul de termeni ai seriei Este puin sensibil la mrimea valorilor extreme Are o semnificaie concret Este uor de calculat Este puin sensibil la eantionare Se preteaz la calcule algebrice

Modul da nu

Mediana da da

Media aritmetic da da

da da da destul nu

da da da nu nu

nu da da i nu da da

4. Rspunsuri i comentarii la testele de autoevaluare


1.Mediana Pentru calculul medianei valorile xi trebuie ordonate cresctor. (sunt, din ipotez) Seria are numr par de termeni (10 termeni), deci mediana este media aritmetic a celor doi termeni centrali:
Me = 235 + 240 = 237,5 Euro 2

Deci, n 50% din conturi sunt mai puin de 237,5 Euro, iar n 50% din conturi sunt peste 237,5 Euro. Modul este valoarea cea mai des ntlnit. Fiind serie simpl i neavnd date care s se repete, seria nu are mod.

2. Mediana (valoarea central a seriei)


1 7 1 L Me : ( n i + 1) = 51 = 25,5 < 33 Me = 17 zile 2 i =1 2

Se cumuleaz cresctor frecvenele absolute (ni):

xi 14 15 16 17 18 19 20

ni 2 6 10 15 8 5 4

ni cumulate cresctor 2 8 18 33 41 46 50

Deci 50% dintre salariai au avut sub 17 zile concediu, iar 50%, peste 17 zile. Modul (dominanta unei serii) Modul este, n cazul gruprii pe variante, acea valoare a caracteristicii creia i corespunde frecvena absolut maxim. Frecvena absolut (ni) maxim este 15 Mo = 17 zile. Cei mai muli salariai au avut 17 zile de concediu. 3.Indicatorii tendinei centrale sunt: a1) Media se calculeaz ca o medie aritmetic ponderat xi reprezint centrul de interval calculat ca medie aritmetic simpl ntre limita inferioar i limita superioar a fiecrui interval:
i =1 5

xini
=
i =1

x=

ni

80 5 + 90 10 + 100 15 + 110 14 + 120 6 5060 = = 101,2 calorii 50 50

a2) Mediana (valoarea central a seriei):


1 1 5 L Me : ( n i + 1) = 51 = 25,5 < 30 Me [95, 105] 2 2 i =1

Se cumuleaz frecvenele absolute i se determin care frecven absolut este imediat mai mare sau egal cu LMe. Intervalul care corespunde frecvenei absolute cumulate ce ndeplinete

condiia de mai sus este intervalul median. Me se calculeaz cu relaia:


Me = x 0 + h L Me n pMe n Me = 95 + 10 25,5 15 = 102 calorii 15

x0 = limita inferioar a intervalului median; h = mrimea intervalului; npMe = suma frecvenelor absolute pn la intervalul median; nMe = frecvena absolut a intervalului median. Deoarece Me = 102 calorii 50% din cutii au sub 102 calorii, iar 50% au peste 102 calorii.

a3) Modul (dominanta seriei):


Mo = x 0 + h 1 15 10 = 95 + 10 = 103,33 calorii 1 + 2 (15 10) + (15 14)

x0 = limita inferioar a intervalului modal; h = mrimea intervalului modal; 1 = diferena dintre frecvena absolut a intervalului modal i frecvena absolut a intervalului anterior celui modal; 2 = diferena dintre frecvena absolut a intervalului modal i frecvena absolut a intervalului urmtor celui modal. Intervalul modal este intervalul cruia i corespunde frecvena absolut maxim. Deci Mo [95, 105]. Deoarece Mo = 103,33 calorii, rezult c cele mai multe dintre cutii au 103,33 calorii.

5. Teme de control
1.Se cunosc urmtoarele date privind numrul de cri mprumutate n decursul unei luni de abonaii unei biblioteci:
Nr. cri mprumutate Nr. abonai 0 18 1 39 2 57 3 64 4 42 5 33 6 21 7 4

Calculai mediana acestei serii.

2. Calculai mediana pentru seria statistic urmtoare: 14 16 12 9 11 18 7 8 9 16 7 9 18

3.Un studiu privind durata de via n ore a unui produs electrocasnic efectuat pe 100 aparate a condus la urmtoarele rezultate:
Durata de via (ore) 0 1000 1000 2000 2000 3000 3000 4000 4000 5000 5000 - 6000 Total Structura numrului de aparate electrocasnice 8 20 26 22 18 6 100

Se cere: s se calculeze indicatorii tendinei centrale;

6. Rezumatul Unitii de nvare


Indicatorii tendinei centrale reprezint o categorie deosebit de important de indicatori statistici utilizai n analiza variabilelor numerice. Aceti indicatori sintetici redau ntr-o singur msur ceea ce este tipic, esenial, caracteristic, obiectiv i stabil pentru o serie de date numerice. Indicatorii tendinei centrale sunt: mrimile medii care pot fi calculate att ca medii simple (pentru date negrupate), ct i ca medii ponderate (pentru date grupate pe variante sau pe intervale) - media aritmetic - media geometric - media ptratic - media armonic indicatorii medii de poziie - mediana - modul Aceti indicatori caracterizeaz cu att mai bine tendina central cu ct datele pe baza crora se determin sunt mai omogene. Cei mai importani i mai utilizai indicatori ai tendinei centrale sunt: media, mediana, modul.

7. Bibliografia Unitii de nvare


1.Chauvat G., Reau J.P., Statistiques descriptives, Armand Colin, Paris, 2004 2. Danciu A.,Niculescu I., Gruiescu M., Statistic economic, Editura Enciclopedic, Bucureti, 2009

3. Isaic-Maniu Al., Mitrut C., Voineagu V., Statistic, Editura Universitar, Bucureti, 2003; 4. Voineagu V., ian E., Ghi S., Boboc C., Todose D. Statistic. Baze teoretice i aplicaii, Editura Economic, Bucureti, 2007; 5.Wonnacott T.H., Wonnacott R.J., Statistique, Economica, Paris,1995