Sunteți pe pagina 1din 16

Statistic urban

Statistic descriptiv univariat

Cursul 6. Statistic descriptiv


Coninut:
Sintez

numeric univariat

Valori extreme Distribuia normal Distribuia normal standard

Curba erorilor de msurare

Procesul de msurare este afectat de dou tipuri de erori:

Erori aleatoare, care sunt mici, se produc n ambele sensuri i se compenseaz reciproc Erori sistematice, grosolane, care se produc sistematic n acelai sens i produc o deplasare sistematic a valorii cutate (Dragomirescu L., op. cit.).

Valori aberante

Sunt sensibile la valorile aberante:


Media Dispersia Abaterea standard Coeficientul (procentual) de variaie

Prin urmare, aceste valori trebuie eliminate dac dorim s folosim aceti indicatori (i dorim, datorit proprietilor matematice, de exemplu aditivitatea). Pentru a le elimina, este necesar identificarea lor.

Distribuia normal

Se mai numete curba erorilor de msurare ntmpltoare, curba erorilor de msurare aleatoare sau curba lui Gauss. Forma de clopot ilustreaz urmtoarele aspecte:

Marea majoritate a msurtorilor au valori apropiate de centrul distribuiei (care este, cel mai probabil, valoarea corect sau real) Numrul msurtorilor care se abat de la centru scade odat cu creterea abaterii de la centru Numrul msurtorilor cu o anumit abatere pozitiv este relativ egal cu numrul msurtorilor cu aceeai abatere, dar de semn negativ (Dragomirescu L., op. cit.).

Distribuia normal (continuare)


Este o distribuie unimodal i simetric, cu dou cozi care tind asimptotic ctre infinit. Este caracterizat de doi parametri: media m abaterea standard s Are dou puncte de inflexiune situate simetric fa de verticala x = m la distana s, respectiv x + s i x s. M = Me = Mo = m. m poate fi orice numr real, iar s orice numr real pozitiv, deci exist o infinitate de distribuii normale. Distribuia normal de medie m i abatere standard s se noteaz: N(m, s).

Distribuia normal standard

Dac m = 0 i s = 1, avem de-a face cu distribuia normal N(0, 1), care se numete distribuia normal standard. Se obine o distribuie normal standard dac pentru distribuia normal N(m, s) se aplic simultan transformrile:

Transformarea z = (x m) / s se numete standardizare, iar rezultatul scor z (Dragomirescu L., op. cit.).

x' = x m (centrare) x" = x' / s (reducere), sau x" = (x m) / s,

Regula 3 sigma de eliminare a valorilor aberante


Pentru serii de volum mare (N > 30) se utilizeaz regula 3 sigma de eliminare a valorilor aberante. Regula se bazeaz pe:

inegalitatea lui Cebev: orice distribuie se ntinde ntre media sa plus / minus 6 abateri standard, faptul c aria cuprins ntre media unei distribuii normale plus / minus 3 abateri standard reprezint cca. 99,7% din aria total. Valorile situate n afara acestor limite sunt improbabile sau aberante, i neglijabile.

Aplicarea regulii presupune existena unei distribuii normale a datelor / fenomenului. Dac acest lucru nu este cunoscut, se aplic regula 6 sigma (Dragomirescu L., op. cit.).

Aplicaie

Revenim la cel de-al treilea exemplu prezentat pentru distribuiile de frecvene. Se cere determinarea valorilor aberante.
Xj
7 16,1 16,5 16,7 16,8 16,9 16,9 17 17 17 17 17 17,1 17,1 17,1 17,2 17,3 17,5 17,8 18

Rezolvare

Deoarece avem de-a face cu un proces de msurare, tim c datele se distribuie normal i folosim regula 3 sigma. M = 16,55, S = 2,23. Orice valoare mai mic dect 16,55 3 2,23 = 9,86 sau mai mare dect 16,55 + 3 2,23 = 23,24 este o valoare aberant. Deoarece 7 < 9,86, este valoare aberant. Volumul seriei este N = 20 < 30, deci aplicarea regulii este improprie.

Distribuia normal (continuare)

Am observat c aplicarea regulii 3 sigma n locul regulii 6 sigma se bazeaz pe faptul c avem de-a face cu o distribuie normal. Se pune problema: cum putem aprecia dac distribuia datelor pe care le avem este normal?

Msurarea gradului de concordan cu o distribuie normal

Prin sintez grafic

Exemplu
Valoare Frecven Frecven seria 1 seria 2

Reprezentm datele sub forma unei histograme Suprapunem peste histogram distribuia normal cu aceeai medie i cu aceeai abatere standard cu distribuia datelor Apreciem pe baza graficului concordana distribuiilor.

1
2 3 4 5

1
10 3 3 1

1
3 10 3 1

Msurarea gradului de concordan cu o distribuie normal (continuare)

Rezolvare: se observ c Seria 2 concord mai bine cu o distribuie normal.

Seria 1
10 8 6 4 2 0 10 8 6 4 2 0

Seria 2

Msurarea gradului de concordan cu o distribuie normal (continuare)

Rezolvare numeric: testul c2:

c
2 j 1

o j t j
t
j

unde oj sunt frecvenele observate, corespunztoare distribuiei analizate, iar tj sunt frecvenele teoretice, corespunztoare distribuiei normale.

Msurarea gradului de concordan cu o distribuie normal (continuare)

Pentru a calcula frecvenele teoretice, avem nevoie de tabele ale distribuiei normale standard, dup care, prin anumite calcule, vom determina valorile teoretice pentru o distribuie normal cu media i abaterea standard egale cu cele ale distribuiei analizate. n acest curs nu vom studia aceste aspecte.

ntrebri

Atept ntrebri.