Sunteți pe pagina 1din 35

Statistic urban

Statistic descriptiv univariat

Cursul 2. Statistic descriptiv

Coninut:

Statistic descriptiv Tabele statistice Sintez grafic univariat


Diagrame n batoane Diagrame circulare Histograme

Statistic descriptiv

Statistica descriptiv

Sintetizeaz grafic i numeric informaia culeas exhaustiv dintr-o populaie statistic Descrie fr s explice esenialul din date Se realizeaz prin sinteze grafice i numerice, n care se renun la o parte din informaie pentru a ctiga n relevan paradigma central a statisticii, dup P. Benzecri

Sinteza grafic univariat se face pentru evidenierea intuitiv i aproximativ a aspectelor de variabilitate dintr-o serie statistic n dou etape:

Construirea tabelelor statistice simple/cu simpl intrare Reprezentri grafice adecvate tipului de variabil (Dragomirescu L., op. cit.)

Tabele statistice

Sinteza grafic n tabele statistice se poate face prin:

Grupare fr pierdere de informaie tabelele conin distribuiile de frecvene ale variantelor sau valorilor Tabelul 1 Grupare cu pierdere de informaie tabelele conin distribuiile de frecvene ale claselor sau intervalelor de grupare Tabelul 2

Tabelul 1. Distribuia populaiei Romniei pe judee la 1 iulie 2002


Alba Arad Arge Bacu Bihor Bistria-Nsud Botoani Braov Brila Buzu Cara-Severin Clrai Cluj Constana 385880 462427 652950 727230 603143 318315 462730 592491 375898 500160 335936 320387 689738 713783 Covasna Dmbovia Dolj Galai Giurgiu Gorj Harghita Hunedoara Ialomia Iai Ilfov Maramure Mehedini Municipiul Bucureti 225724 541431 730214 626277 291784 387335 330325 493760 294757 805330 275893 520635 309183 1934449 Mure Neam Olt Prahova Satu Mare Slaj Sibiu Suceava Teleorman Timi Tulcea Vlcea Vaslui Vrancea 588359 575767 494707 835745 374086 250014 423860 707242 437862 662590 255816 419635 464943 396002

Tabelul 2. Distribuia populaiei Romniei pe regiuni de dezvoltare la 1 iulie 2002


Nord-Est (Bacu, Botoani, Iai, Neam, Suceava, Vaslui) Sud-Est (Brila, Buzu, Constana, Galai, Tulcea, Vrancea) 3743242 2867936

Sud (Arge, Clrai, Dmbovia, Giurgiu, Ialomia, Prahova, Teleorman) Sud-Vest (Dolj, Gorj, Mehedini, Olt, Vlcea) Vest (Arad, Cara-Severin, Hunedoara, Timi)

3374916
2341074

1954713

Nord-Vest (Bihor, Bistria-Nsud, Cluj, Maramure, Satu Mare, Slaj) 2755931 Centru (Alba, Braov, Covasna, Harghita, Mure, Sibiu) Bucureti (Ilfov, Municipiul Bucureti) 2546639 2210342

Distribuii de frecvene

O distribuie de frecvene conine aceeai informaie ca i seria din care provine, dar este mai intuitiv O distribuie de frecvene grupate conine mai puin informaie dect seria din care provine, dar este mai relevant (Dragomirescu L., op. cit.)

Distribuii de frecvene (continuare)

Distribuii negrupate de variante: s presupunem c un student se deplaseaz de-a lungul unei strzi i noteaz fiecare tip de locuin ntlnit pe parcurs, folosind codificarea: i locuin individual, c locuin colectiv. Exist 10 de cldiri. Numrul total de valori, numit volumul irului i notat N, este, n acest caz, 10. Variantele obinute sunt: c, c, c, i, c, c, i, i, c, i.

Varianta

Frecvena Frecvena absolut relativ 6 6/10

4/10

Datele prezentate anterior se grupeaz astfel: Numrul de apariii ale fiecrei variante distincte este numit frecvena absolut a variantei respective. Proporia reprezentat de frecvena absolut din volumul irului este numit frecvena relativ a variantei respective.

Distribuii de frecvene (continuare)

Distribuii negrupate de valori: s presupunem c se msoar suprafaa unei camere (n m2), de ctre 20 de persoane. Valorile obinute, reprezentnd msurtori repetate ale aceleiai valori (numite replicate) sunt:

16,8

17 17 17 17

17,1 17,3 17,1 17,5 17,1 17,8 17,2 18

16,1 16,9 16,5 16,9 16,7 17

Numrul total de valori, numit volumul irului i notat N, este, n acest caz, 20.

Distribuii de frecvene (continuare)

Datele prezentate anterior se grupeaz astfel:

Numrul de apariii ale fiecrei valori distincte este numit frecvena absolut a valorii respective. Proporia reprezentat de frecvena absolut din volumul irului este numit frecvena relativ a valorii respective.

Valoarea Frecvena Frecvena absolut relativ 7 1 1/20 16,1 1 1/20 16,5 1 1/20 16,7 1 1/20 16,8 1 1/20 16,9 2 2/20 17 5 5/20 17,1 3 3/20 17,2 1 1/20 17,3 1 1/20 17,5 1 1/20 17,8 1 1/20 18 1 1/20

Distribuii de frecvene (continuare)

Aceleai date pot fi grupate n intervale sau clase. Aceste intervale pot fi egale (tabelul de mai jos) sau inegale (tabelul din dreapta).
Interval [6, 12) [12, 18) [18, 24) Frecven absolut 1 18 1

Interval
[0, 8) [8, 16) [16, 16,5) [16,5, 17) [17, 17,5)

Frecven absolut
1 0 1 5 10

[17,5, 18)
[18, 18,5) [18,5, 22,5)

2
1 0

Sintez grafic univariat: etapa a II-a

Vom studia urmtoarele metode de sintez grafic:

Diagrame n batoane Diagrame circulare Histograme Poligoane de frecvene Curbe de frecvene Piramida populaiei (pe vrste i sexe)

Sinteza grafic univariat se realizeaz prin diferite instrumente n funcie de tipul variabilelor. Pentru variabilele calitative se recomand diagramele circulare, pentru cele tip rang se recomand diagramele n batoane sau poligoanele sau curbele de frecvene, iar pentru variabilele tip msurtoare se recomand diagramele n batoane, poligoanele sau curbele de frecvene i, n special, histogramele (Dragomirescu L., op. cit.).

Diagrama n batoane

Se numete diagram n batoane reprezentarea cartezian plan n care pe axa orizontal sunt marcate variantele sau valorile, fiecreia dintre acestea corespunzndu-i pe vertical o coloan de nlime proporional cu frecvena corespunztoare.
Exemplu: calitatea aerului n 1998 n oraele din Turkmenistan: SO2, CO, noxe i pulberi.

Diagrama n batoane (continuare)

Aplicaie: accidente de avion n funcie de momentul zborului (Cotidianul, 2007)

Diagrama n batoane (continuare)

S presupunem c un student se deplaseaz de-a lungul unei strzi i noteaz gradul de confort al locuinelor aflate n fiecare imobil. Datele obinute sunt prezentate n tabelul alturat. Se cere sintetizarea datelor folosind diagrama n batoane.

Grad de confort 1
2 3 4

Frecven absolut 15
40 25 10

Diagrama n batoane (continuare)

Rezolvare:

Manual Folosind programul Excel


50 40 30 20 10 0 1 2 3 4

Diagrama n batoane (continuare)

Se numete diagram n batoane reprezentarea cartezian plan n care pe axa orizontal sunt marcate variantele sau valorile, fiecreia dintre acestea corespunzndu-i pe vertical o coloan de nlime proporional cu frecvena corespunztoare. S se realizeze diagrama n batoane pentru ierarhia aezrilor umane din Romnia (2002), prezentat n tabelul alturat.

Tipul de aezare Municipiu Ora Comun Sat

Numr 97 171 2698 13089

Diagrama n batoane rezolvarea problemei

Folosind programul Excel Probleme?

14000 12000 10000 8000 6000 4000 2000 0 Municipii Orase Comune Sate

Diagrama n batoane rezolvarea problemei (continuare)


Observm

c acest grafic nu spune prea multe, deoarece frecvenele difer de la un tip de aezare la altul cu cte cel puin un ordin de mrime. Soluii?

Diagrama n batoane rezolvarea problemei (continuare)

Pentru a rezolva aceast problem, vom aplica frecvenelor o transformare matematic, cea mai convenabil fiind, n acest caz, logaritmul zecimal. Coloanele vor fi, astfel, proporional cu logaritmul zecimal al frecvenei fiecrei variante sau valori.

Diagrama n batoane rezolvarea problemei (continuare)

Reprezentarea grafic este (folosind programul Excel):

4.50 4.00 3.50 3.00 2.50 2.00 1.50 1.00 0.50 0.00 Municipii Orase Comune Sate

Diagrama circular

Se numete diagram circular cercul format din sectoare pentru fiecare variant sau valoare, astfel nct unghiul, respectiv aria fiecrui sector s fie proporional() cu frecvena respectiv.
Exemplu: structura etnic a populaiei fr adpost din SUA n 1996: 40% albi, 40% negri, 11% provenii din America Latin, 9% indieni originari din SUA.

Diagrama circular (continuare)


Revenim

la primul exemplu prezentat pentru distribuiile de frecvene.

Tip de locuin c i

Frecvena absolut 6 4

Frecvena relativ 6/10 4/10

Se cere sintetizarea datelor folosind diagrama circular.

Diagrama circular (continuare)

Rezolvare:

Varianta c i

Manual prezentat n tabel Folosind programul Excel

Frecvena Frecvena Unghiul absolut relativ sectorului circular 6 4 6/10 4/10 (6/10)3600=2160 (4/10)3600=1440

Histograma

Se numete histogram reprezentarea cartezian plan a unei distribuii grupate (n care se specific valorile i frecvenele acestora), format din dreptunghiuri alipite, cu bazele plasate pe intervalele de grupare i cu ariile proporionale cu frecvenele claselor.
Ex.: salariul anual n Londra n februarie 2006 pentru diferite profesiuni.

Histograma (continuare)

Revenim la cel de-al treilea exemplu prezentat pentru distribuiile de frecvene. Se cere sintetizarea datelor folosind histograma.

16,8

17

17,1 17,3

16,1 16,9
16,5 16,9

17
17

17,1 17,5
17,1 17,8

16,7

17

17

17,2

18

Histograma (continuare)

Rezolvare: apare o nou problem GRUPAREA.

Exist doar reguli empirice de grupare (Dragomirescu L., op. cit.): Grupm doar serii cu volume mai mari sau egale cu 50 n funcie de autor, grupm n: 20-40, 1015, 8-20, 15-25 sau 815 intervale

Histograma (continuare)

Intervalele de grupare pot fi egale sau inegale n cazul intervalelor egale, se folosete formula lui Sturges:

nc 1 + 10 / 3 log10N, unde N este volumul seriei Valoarea nc se rotunjete la un numr ntreg convenabil. Lungimea intervalului de clas, ic, este: ic = (xmax xmin) / nc, unde xmax i xmin sunt valoarea maxim, respectiv minim din seria respectiv. ic se rotunjete la un numr ntreg convenabil (Dragomirescu L., op. cit.).

n acest curs nu vom studia gruparea n intervale inegale, ci doar o vom prezenta.

Histograma (continuare)

Rezolvarea problemei propuse: folosim formula lui Sturges: nc 1+10/3log1020 = 5,337 se rotunjete la 6 ic = (18 7) / 6 = 1,833 se rotunjete la 2

Interval [7, 9) [9, 11) [11, 13) [13, 15) [15, 17) [17, 19)

Frecven 1 0 0 0 6 13

Histograma (continuare)

Gruparea nu are sens, deoarece N=20<50. Mai exist o problem. Deoarece exist trei intervale care nu conin valori, aspectul histogramei nu este prea sugestiv. O soluie este s recurgem la gruparea n intervale inegale.

Interval
[7, 15) [15, 17) [17, 19)

Frecven
1 6 13

Histograma (continuare)

Pentru aceasta, vom grupa primele patru intervale ntr-unul singur. Pentru a respecta definiia histogramei ariile proporionale cu frecvenele claselor avnd n vedere c frecvena intervalului rmne aceeai, dar lungimea lui crete de 4 ori, va trebui s scdem nlimea dreptunghiului corespunztor de 4 ori. O alt soluie va fi prezentat mai trziu, cnd vom relua acest exemplu.

Histograma (continuare)

Cea mai elegant rezolvare: folosirea aplicaiei HISTO (Dragomirescu et al.). Aplicaia, dup instalare, creeaz n Excel o pictogram: a nu se confunda cu . Programul se poate descrca gratuit de pe Internet. Pentru realizarea histogramelor se apas pe pictogram dup selectarea datelor

Histograma (continuare)

Pentru seria complet

Histograma (continuare)

Pentru seria fr 7

ntrebri

Atept ntrebri.