Sunteți pe pagina 1din 22

Statistic urban

Statistic descriptiv univariat

Cursul 4. Statistic descriptiv

Coninut:

Sintez numeric univariat

Indicatori de tendin central


Media aritmetic Mediana Moda

Relaii dintre indicatorii de tendin central

Sinteza numeric univariat

Sinteza numeric univariat se face pentru evidenierea obiectiv i exact a aspectelor eseniale ale variabilitii unei serii statistice, perceput ca mprtiere n jurul unei tendine centrale. Paradigma central a statisticii (n special descriptive) este renunarea la o parte din informaie pentru ctig n relevan.

Condiiile lui Yule asupra unui indicator de tendin central


1. S fie definit n mod obiectiv, indiferent de aprecierea subiectiv a cercettorului; 2. S fie expresia tuturor termenilor seriei; 3. S posede proprieti simple, evidente, al cror sens general poate fi uor neles; 4. S poat fi calculat rapid i cu uurin; 5. S se preteze uor la calcule algebrice ulterioare; 6. S fie afectat ct mai puin de valorile extreme, n particular de cele aberante.

Indicatori de tendin central media

Media aritmetic se noteaz cu M i se calculeaz folosind una dintre formulele:

unde N este numrul total de observaii Xj i p ( N) numrul de observaii distincte Xi, iar fi este frecvena relativ a valorii Xi.

Calculul mediei

Revenim la cel de-al treilea exemplu prezentat pentru distribuiile de frecvene. Se cere calculul mediei.

Xj
7 16,1 16,5 16,7 16,8 16,9 16,9 17 17 17 17 17 17,1 17,1 17,1 17,2 17,3 17,5 17,8 18

Valoarea Xj Frecvena Frecvena absolut relativ fj 7 1 1/20 16,1 1 1/20 16,5 1 1/20 16,7 1 1/20 16,8 1 1/20 16,9 2 2/20 17 5 5/20 17,1 3 3/20 17,2 1 1/20 17,3 1 1/20 17,5 1 1/20 17,8 1 1/20 18 1 1/20

Calculul mediei (continuare)

Calcul pe baza primei formule:

7 16,8 17 17,1 17,3 16,1 16,9 17 17,1 17,5 16,5 16,9 17 17,1 17,8 M

16,7 17 17 17,2 18 20

16,55

Calcul pe baza celei de-a doua formule:

M 7 1/20 16,1 1/20 16,5 1/20 16,7 1/20 16,8 1/20 16,9 2/20 17 5/20 17,1 3/20 17,2 1/20 17,3 1/20 17,5 1/20 17,8 1/20 18 1/20 16,55

Calculul mediei (continuare)

S eliminm acum valoarea aberant 7 i s recalculm media. Calcul pe baza primului tabel (stnga) folosind prima formul:

16,8 17 17,1 17,3 16,1 16,9 17 17,1 17,5 16,5 16,9 17 17,1 17,8 M

16,7 17 17 17,2 18 19

17,0526 17,05

Calcul pe baza tabelului al doilea (dreapta) folosind a doua formul:

M 16,1 1/19 16,5 1/19 16,7 1/19 16,8 1/19 16,9 2/19 17 5/19 17,1 3/19 17,2 1/19 17,3 1/19 17,5 1/19 17,8 1/19 18 1/19 17,0526 17,05

Proprietile mediei

Dup Dragomirescu L., op. cit.

Proprieti pozitive 1. Media unei serii poate fi exprimat ca o medie a mediilor subseriei proprietatea de aditivitate; 2. Se preteaz la calcule algebrice ulterioare; 3. Ia n considerare toate valorile seriei, cu ntreaga lor informaie.

Proprieti negative 1. Este relativ dificil de calculat manual; 2. Este sensibil la valorile aberante.

Mediana

Mediana se noteaz cu Me i este:

punctul care mparte aria de sub curba de frecvene n 2 arii egale

o valoare care mparte seria statistic ordonat n 2 subserii de volume egale, msurate ca numr de uniti statistice sau fraciuni ale acestora (Dragomirescu L., op. cit.)

Calculul medianei
Seria statistic
Mediana

Calculul medianei

Calculul medianei

n cazul unei serii cu N = 2k + 1 valori (numr impar), mediana este valoarea Xk+1 din seria ordonat. n cazul unei serii cu un numr par de valori N = 2k, prin convenie mediana este media aritmetic (semisuma) valorilor Xk i Xk+1 (Dragomirescu L., op. cit.).

Exemplu: s se calculeze mediana seriilor din exemplul anterior (cu i fr valoarea aberant 7).

Calculul medianei (continuare)

Rezolvare:

Pentru seria 7; 16,1; 16,5; 16,7; 16,8; 16,9; 16,9; 17; 17; 17; 17; 17; 17,1; 17,1; 17,1; 17,2; 17,3; 17,5; 17,8; 18 observm c N = 20, deci k = 10. Mediana este semisuma valorilor a 10-a i a 11a. Me = (17 + 17) / 2 = 17. Pentru seria 16,1; 16,5; 16,7; 16,8; 16,9; 16,9; 17; 17; 17; 17; 17; 17,1; 17,1; 17,1; 17,2; 17,3; 17,5; 17,8; 18 observm c N = 19, deci k = 9. Mediana este valoarea a 10-a Me = 17.

Proprietile medianei

Dup Dragomirescu L., op. cit. Proprieti negative 1. Nu se preteaz la calcule algebrice.

Proprieti pozitive 1. Este relativ uor de calculat; 2. Exprim cel mai bine tendina central (n special la distribuii asimetrice); 3. Nu ia n considerare valorile seriei (le trateaz ca ranguri), ci doar ordinea lor renun la o parte din informaie pentru ctig n relevan; 4. Nu este sensibil la valorile aberante; 5. Poate fi calculat i dac nu se cunosc toate valorile seriei; 6. Este element al irurilor cu un numr impar de termeni; 7. Poate fi determinat prin comparaii i ordonare, nefiind nevoie s fie efectuate toate msurtorile.

Media de via

Mortalitatea populaiei n funcie de vrst pe o curb de frecvene are o median care reprezint vrsta pn la care au murit 50% din indivizii populaiei respective, i care se numete media de vrst a populaiei. Calculul acesteia reprezint o situaie de excepie n care se calculeaz un indicator de tendin central pentru o distribuie multimodal (Dragomirescu L., op. cit.).
Dreapta: mortalitatea populaiei n funcie de vrst n Africa grupe de 4 ani

Moda

Moda este:

un punct de maxim local n cazul unei curbe de frecvene valoarea cu frecvena maxim local n distribuia de frecvene (Dragomirescu L., op. cit.).

Exemplu:

S se calculeze moda celor dou serii din exemplul anterior.

Moda (continuare)

Rezolvare: indiferent de prezena sau absena valorii aberante 7, singurul punct de maxim local este 17, deci Mo = 17. Proprietile modei (Dragomirescu L., op. cit.) Proprieti negative 1. Nu se preteaz la calcule algebrice.

Proprieti pozitive 1. Nu este sensibil la valorile aberante. 2. Induce clasificarea distribuiilor n uni , bi i multimodale

Valoarea Xj Frecvena Frecvena absolut relativ Nj 7 1 1/20 16,1 1 1/20 16,5 1 1/20 16,7 1 1/20 16,8 1 1/20 16,9 2 2/20 17 5 5/20 17,1 3 3/20 17,2 1 1/20 17,3 1 1/20 17,5 1 1/20 17,8 1 1/20 18 1 1/20

Clarificare privind moda

S se calculeze moda pentru fiecare din seriile:


1) 8, 8, 8, 10, 10, 11, 15 2) 8, 8, 10, 11, 15, 15 3) 8, 8, 10, 10, 11, 15 4) 8, 10, 11, 15 5) 8, 8, 8, 10, 11, 15, 15 6) 8, 8, 10, 10, 11, 11, 15, 15

Clarificare privind moda (rezolvare)


8 10 11 15
8 10 11 15

3 2 1 1
2 1 1 2

Seria 1: Mo = 8

8 10 11 15
8 10 11 15

2 2 1 1
1 1 1 1

Seria 3: Mo1 = 8 Mo2 = 10

8 10 11 15
8 10 11 15

3 1 1 2
2 2 2 2

Seria 5: Mo1 = 8 Mo2 = 15

Seria 2: Mo1 = 8 Mo2 = 15

Seria 4: Mo1 = 8 Mo2 = 10 Mo3 = 11 Mo4 = 15

Seria 6: Mo1 = 8 Mo2 = 10 Mo3 = 11 Mo4 = 15

Indicatori de preferin ntre indicatorii de tendin central, dup Steinbach


1. Moda unic indic omogenitatea; n absena omogenitii nu au sens indicatorii de tendin central. 2. O distribuie simetric cere o medie dac va fi supus ulterior unor prelucrri statistice. 3. Pentru o orientare rapid la o serie mare se folosete moda. 4. Pentru considerarea tuturor valorilor se folosete media. 5. Pentru a face abstracie de valorile extreme sau aberante se folosesc mediana i/sau moda. 6. Pentru o serie de volum redus se prefer mediana, pentru c moda nu se vede. 7. Mediana este indicatorul cel mai sugestiv de tendin central pentru toate distribuiile unimodale, n special pentru cele asimetrice. 8. Dac se cunosc doar rangurile valorilor se folosete mediana.

Relaia dintre medie, median i mod

Pentru distribuiile unimodale simetrice, cei trei indicatori coincid; La distribuiile unimodale uor asimetrice, mediana este plasat ntre mod i medie, distana fa de mod fiind dublul celei fa de medie Sensul asimetriei poate fi detectat aproximativ prin echivalena: asimetrie de stnga Mo < Me (M), asimetrie de dreapta Mo > Me (M) (Dragomirescu L., op. cit.)

ntrebri

Atept ntrebri.