Sunteți pe pagina 1din 25

Statistic urban

Statistic descriptiv univariat

Cursul 3. Statistic descriptiv

Coninut:

Sintez grafic univariat


Poligoane de frecvene Curbe de frecvene Piramida populaiei (pe vrste i sexe)

Statistic descriptiv

Statistica descriptiv

Sintetizeaz grafic i numeric informaia culeas exhaustiv dintro populaie statistic Descrie fr s explice esenialul din date Se realizeaz prin sinteze grafice i numerice, n care se renun la o parte din informaie pentru a ctiga n relevan paradigma central a statisticii, dup P. Benzecri

Sinteza grafic univariat se face pentru evidenierea intuitiv i aproximativ a aspectelor de variabilitate dintr-o serie statistic n dou etape:

Construirea tabelelor statistice simple/cu simpl intrare Reprezentri grafice adecvate tipului de variabil (Dragomirescu L., op. cit.)

Histograma

Se numete histogram reprezentarea cartezian plan a unei distribuii grupate (n care se specific valorile i frecvenele acestora), format din dreptunghiuri alipite, cu bazele plasate pe intervalele de grupare i cu ariile proporionale cu frecvenele claselor (Dragomirescu L., op. cit.).

Ex.: salariul anual n Londra n februarie 2006 pentru diferite profesiuni.

Histograma (continuare)

Exist doar reguli empirice de grupare (Dragomirescu L., op. cit.):


Grupm doar serii cu volume mai mari sau egale cu 50 n funcie de autor, grupm n: 20-40, 10-15, 8-20, 15-25 sau 8-15 intervale

Intervalele de grupare pot fi egale sau inegale n cazul intervalelor egale, se folosete formula lui Sturges:

nc 1 + 10 / 3 log10N, unde N este volumul seriei Valoarea nc se rotunjete la un numr ntreg convenabil. Lungimea intervalului de clas, ic, este: ic = (xmax xmin) / nc, unde xmax i xmin sunt valoarea maxim, respectiv minim din seria respectiv. ic se rotunjete la un numr ntreg convenabil (Dragomirescu L., op. cit.).

n acest curs nu vom studia gruparea n intervale inegale.

Piramida populaiei (pe vrste i sexe)

n demografie, volumele celor dou sexe (m / f) pe vrste sau grupe de vrst dintr-o populaie uman sunt reprezentate prin dou histograme cu bazele reprezentnd vrsta alipite pe vertical. Datorit faptului c odat cu naintarea n vrst, generaiile scad ca volum din cauza mortalitii, reprezentarea are aspectul unei piramide numit piramida vrstelor (Dragomirescu L., op. cit.). n dreapta: structura populaiei Romniei pe vrste i sexe la recensmntul din 18 martie 2002

Piramida populaiei (continuare)

n funcie de forma acesteia, se disting 3 tipuri: (1) baza ngustat indic o populaie n declin, fenomen denumit i cretere negativ sau mbtrnirea populaiei volumul total este n scdere; (2) forma ideal a piramidei indic o populaie n echilibru staionar volumul total rmne constant (3) baza lrgit indic o populaie n cretere prin ntinerire volumul total este n cretere (Dragomirescu L., op. cit.).

Se observ n graficul anterior c populaia Romniei este n declin.

Poligoane i curbe de frecvene

Se numete poligon de frecvene linia frnt format din segmentele care unesc mijloacele laturilor din vrfurile coloanelor consecutive figurate n diagrama prin batoane, fr a mai reprezenta i coloanele, sau mijloacele laturilor superioare ale dreptunghiurilor prin care sunt reprezentate clasele sau intervalele de grupare n histograme, fr a reprezenta i dreptunghiurile. Exemplu: fertilitatea n China n sec. al XXI-lea Poligoanele de frecvene tind odat cu creterea preciziei i a numrului de msurtori ctre o curb neted numit curb de frecvene (Dragomirescu L., op. cit.).

Construcia poligoanelor i a curbelor de frecvene

Se pornete de la construcia unei diagrame prin batoane i se aleg centrele intervalelor (majoritatea programelor le evideniaz)

15 10 5 0 1 2 3 4 5 6 7

Construcia poligoanelor i a curbelor de frecvene

Pentru poligoanele de frecvene, se unesc mijloacele bazelor superioare ale batoanelor care compun diagrama prin batoane (corespunznd centrelor intervalelor)

15 10 5 0 1 2 3 4 5 6 7

Curbe de frecvene

Curbele de frecvene se strvd n spatele diagramelor prin batoane, histogramelor sau poligoanelor de frecvene i nu se obin direct, ci prin creterea numrului de observaii sau a preciziei. Aceste curbe sunt curbe teoretice. Exist programe care netezesc poligoanele de frecvene. Se obin astfel curbe care sunt, de fapt, o form convenional de reprezentare a poligoanelor de frecvene, i pot eventual sugera aspectul curbelor teoretice. Curbele obinute prin netezirea poligoanelor de frecvene sunt mai intuitive, dar curbele teoretice sunt mai relevante.

Construcia poligoanelor i a curbelor de frecvene

Curb de frecvene obinut prin netezirea poligonului de frecvene corespunztor

15 10 5 0 1 2 3 4 5 6 7

Construcia poligoanelor i a curbelor de frecvene

n mod analog, se poate porni de la o histogram.

15 10 5 0 1 2 3 4 5 6 7

Construcia poligoanelor i a curbelor de frecvene

Se unesc mijloacele laturilor superioare ale dreptunghiurilor prin care sunt reprezentate clasele sau intervalele de grupare

15 10 5 0 1 2 3 4 5 6 7

Construcia poligoanelor i a curbelor de frecvene

Curb de frecvene obinut prin netezirea poligonului de frecvene corespunztor

15 10 5 0 1 2 3 4 5 6 7

Diagrama n batoane, histograma, poligoanele i curbele de frecvene

Diagrama n batoane este mai intuitiv, dar histograma este mai relevant, ilustrnd paradigma central a statisticii, dup P. Benzecri renunarea la o parte din informaie pentru a ctiga n relevan.

Curba erorilor de msurare

S presupunem c suprafaa unei camere de 17 m2 este msurat de 4, 40 i, respectiv, 400 de persoane. Distribuiile acestor msurtori sunt redate mai jos, reprezentate sub forma unor histograme. Dac se construiesc poligoanele de frecvene corespunztoare, se observ c acestea seamn, pe msur ce crete numrul de msurtori, cu curba neted din partea dreapt.

Curba erorilor de msurare (continuare)

Aceast curb se numete curba erorilor de msurare ntmpltoare, curba erorilor de msurare aleatoare sau curba lui Gauss. Forma de clopot ilustreaz urmtoarele aspecte:

Marea majoritate a msurtorilor au valori apropiate de centrul distribuiei (care este, cel mai probabil, valoarea corect sau real) Numrul msurtorilor care se abat de la centru scade odat cu creterea abaterii de la centru Numrul msurtorilor cu o anumit abatere pozitiv este relativ egal cu numrul msurtorilor cu aceeai abatere, dar de semn negativ (Dragomirescu L., op. cit.).

Curba erorilor de msurare (continuare)

Revenim la cel de-al doilea exemplu prezentat n cursul anterior pentru distribuiile de frecvene i la histograma corespunztoare.
7 16,8 17 17 17 17 17,1 17,3 17,1 17,5 17,1 17,8 17,2 18

16,1 16,9 16,5 16,9 16,7 17

Curba erorilor de msurare (continuare)

Observm c procesul de msurare a fost afectat de dou tipuri de erori:

S construim acum histograma eliminnd valoarea aberant, 7.

Erori aleatoare, care sunt mici, se produc n ambele sensuri i se compenseaz reciproc Erori sistematice, grosolane, care se produc sistematic n acelai sens i produc o deplasare sistematic a valorii cutate (Dragomirescu L., op. cit.).

10 8 6 4 2 0 1 2 3 4 5 6 7

Curba erorilor de msurare (continuare)

Cum ar arta aceast curb dac precizia de msurare ar fi de 10 m2, i nu de 0,1 m2?

Valoare (cm2) 0 10 20 30

Frecven 0 0 19 0

Aceasta este o distribuie grupat ntr-un singur punct i ilustreaz paradigma central a statisticii. Aflm c suprafaa camerei este de 20 m2, msurat cu o precizie de 10 m2. Am sczut precizia, renunnd la o parte din informaie, dar am obinut un rspuns mult mai relevant.

Limbajul repartiiilor

De ce grupm? Pentru a ctiga n relevan. Pentru ce grupm? Pentru a sesiza una dintre urmtoarele forme:

Distribuie unimodal simetric

Distribuie unimodal asimetric de stnga

Distribuie unimodal asimetric de dreapta

Distribuii n i, j i U

Limbajul repartiiilor (continuare)

Distribuie bimodal

Distribuie uniform

O mod este un punct de maxim local. O distribuie unimodal are o singur mod, o distribuie bimodal prezint dou mode, iar distribuiile multimodale, mai mult de dou mode. Distribuiile bi i multimodale pot fi considerate suma a dou, respectiv mai mult de dou distribuii unimodale (Dragomirescu L., op. cit.).

Distribuie multimodal

Limbajul repartiiilor (continuare)

Interpretare Distribuiile concentrate ntr-un punct exprim omogenitate absolut. Distribuiile simetrice exprim cel mai bine o tendin central. Distribuiile bi sau multimodale exprim eterogenitate ca amestec de distribuii omogene Distribuiile uniforme exprim eterogenitate absolut. Consecine Distribuiile multimodale vor fi decupate n distribuii unimodale, care vor fi analizate separat Distribuiile asimetrice vor fi transformate n distribuii simetrice cu ajutorul unor instrumente matematice (Dragomirescu L., op. cit.).

ntrebri

Atept ntrebri.