Sunteți pe pagina 1din 23

Statistic urban

Statistic descriptiv univariat

Cursul 5. Statistic descriptiv

Coninut:

Sintez numeric univariat

Indicatori de mprtiere
Dispersia Variana Abaterea standard Coeficientul (procentual de variabilitate Amplitudinea

Tipuri de indicatori de mprtiere

Sinteza numeric univariat se face pentru evidenierea obiectiv i exact a aspectelor eseniale ale variabilitii unei serii statistice! perceput ca mprtiere n "urul unei tendine centrale# $aradi%ma central a statisticii (n special descriptive este renunarea la o parte din informaie pentru c&ti% n relevan# Indicatorii de mprtiere se bazeaz pe: indicatorii de tendin central ' dispersia! abaterea standard i coeficientul (procentual de variaie indicatorii de tendin e(trem ' amplitudinea

Cum am putea construi un indicator de mprtiere?


Am artat c vorbim de mprtiere n "urul unei tendine centrale# Am artat c! datorit proprietilor sale matematice! dintre indicatorii de tendin central )ule prefer media# Vom ncerca! deci! s construim un indicator de mprtiere n "urul mediei# Idei*

Cum am putea construi un indicator de mprtiere?

Vom construi indicatorul I:

I=

(X
k =1

X)

N
(a +! ,! (b -,! --! -.! -/

S se calculeze suma abaterilor de la medie pentru seriile:

Cum am putea construi un indicator de mprtiere?


Surprini* Se poate demonstra matematic c media abaterilor de la media aritmetic a unei serii este ntotdeauna 0 (v reamintii! de la curba erorilor de msurare! c suma valorilor aflate la 1st&n%a2 mediei este e%al! dar de semn contrar! cu cea a valorilor aflate la 1dreapta2 ei # Soluii*

Cum am putea construi un indicator de mprtiere?

3 alt idee este s construim un alt indicator:

I =

X
k =1

M k

Din nefericire! proprietile matematice ale modulului (valorii absolute fac impractic folosirea acestui indicator# Ce putem face*

Indicatori de mprtiere dispersia


$entru a obine o valoare pozitiv! putem ridica abaterile la ptrat# Dispersia se noteaz cu S2 i se calculeaz folosind una dintre formulele:

( X j M )
N j =1

=
i =1

( X iM )

unde M este media aritmetic! N este numrul total de observaii Xj i p ( N numrul de observaii distincte Xi! iar fi este frecvena relativ a valorii Xi (Dra%omirescu 4#! op# cit# # 5umrtorul dispersiei se numete varian#

!ropriet"ile dispersiei

6# S+ 7 0 (e%alitate doar pentru serii constante +# $ermite compararea (Dra%omirescu 4#! op# cit# :

variabilitii unui caracter n n 7 + populaii! dac datele au acelai ordin de mrime (i medii apropiate a n 7 + caractere ale aceleiai populaii dac se folosesc aceleai uniti de msur i datele au acelai ordin de mrime (i medii apropiate

Proprieti pozitive 6# 8ine cont de toate valorile din cadrul seriei9 +# 5umrtorul e(presiei ndeplinete o proprietate de aditivitate#

Proprieti negative 6# :ste sensibil la valorile aberante9 +# Are alt ordin de mrime fa de datele iniiale i medie i se e(prim n ptratul unitii de msur a datelor#

#baterea standard

Abaterea standard se noteaz cu S i este rdcina ptrat a dispersiei# $roprieti (Dra%omirescu 4#! op# cit# 6# S 7 0 (e%alitate doar pentru serii constante +# $ermite compararea:

S=

variabilitii unui caracter n n 7 + populaii! dac datele au acelai ordin de mrime (i medii apropiate a n 7 + caractere ale aceleiai populaii dac se folosesc aceleai uniti de msur i datele au acelai ordin de mrime (i medii apropiate

Proprieti pozitive 6# 8ine cont de toate valorile din cadrul seriei# +# ;ndeplinete o proprietate de aditivitate#

Proprieti negative 6# :ste sensibil la valorile aberante9 +# Are acelai ordin de mrime fa de datele iniiale i medie i se e(prim n unitatea de msur a datelor#

Coe$icientul (procentual) de variabilitate

Coeficientul (procentual) de variabilitate! notat cu CV! reprezint procentul reprezentat de abaterea standard S din media M:

S CV = 1%% M

$roprieti

6# CV< 7 0 (deoarece S 7 0 i! pentru c msurtorile se situeaz pe o scar raport! = > 0 # CV ? 0 dac i numai dac S ? 0! adic irul este constant# +# $ermite compararea: variabilitii unui caracter n n 7 + populaii! dac datele au ordine de mrime (i medii diferite a n 7 + caractere ale aceleiai populaii dac se folosesc uniti de msur diferite sau aceleai uniti de msur! dar datele au ordine de mrime diferite (Dra%omirescu 4#! op# cit#

Coe$icientul (procentual) de variabilitate (continuare)


Proprieti pozitive 6# $oate fi utilizat i n cazurile recomandate pentru dispersie sau abaterea standard! deci este indicatorul universal de comparare a variabilitii pentru variabile pe scara raport9 +# 5umrtorul e(presiei ndeplinete o proprietate de aditivitate9 ,# :ste independent de unitatea de msur folosit pentru valorile seriei! fiind adimensional# Proprieti negative 6# :ste sensibil la valorile aberante9 +# :ste valabil doar pentru msurtorile pe scar raport! nu i interval#

&e'uli empirice re$eritoare la coe$icientul (procentual) de varia"ie


CV< @ 60< ' populaie omo%en CV< > ,0< ' populaie etero%en 60< @ CV< @ +0< ' populaie relativ omo%en sau cAiar omo%en! n funcie de variabil +0< @ CV< @ ,0< ' populaie relativ etero%en (Dra%omirescu 4#! op# cit#

(mo'enitate i etero'enitate
:tero%enitatea ca mprtiere n "urul tendinei centrale Bealitatea 1vzutC de mod! CV Bealitatea 1vzutC de mod! CV

3mo%enitate ma(im e(primat 3mo%enitatea e(primat de moda prin moda unic i CV mic unic! etero%enitatea de CV mare
:tero%enitatea ca amestec de omo%eniti Bealitatea 1vzutC de mod Bealitatea 1vzutC de mod :tero%enitate ma(im e(primat prin multimodalitate i CV mare

:tero%enitate e(primat prin multimodalitate! dar CV mic

#plica"ie

S se calculeze dispersia! abaterea standard i coeficientul (procentual de variaie pentru seria D9 6E!69 6E!.9 6E!D9 6E!/9 6E!F9 6E!F9 6D9 6D9 6D9 6D9 6D9 6D!69 6D!69 6D!69 6D!+9 6D!,9 6D!.9 6D!/9 6/! nainte i dup eliminarea valorii aberante D#

&e)olvare seria cu valoarea aberant * inclus

Calcul pe baza primei formule:


+ + .-+,

( */1,-55) + (1,-0/1,-55) + (1*/1,-55) + (1*-1/1,-55) + (1*-1/1,-55) + + (1,-1/1,-55) + (1,-+/1,-55) + (1* /1,-55) + (1*-1/1,-55) + (1*-5/1,-55) + (1,-5/1,-55) + (1,-+/1,-55) + (1*/1,-55) + (1*-1/1,-55) + (1*-0/1,-55) + (1,-*/1,-55) + (1*/1,-55) + (1*/1,-55) + (1*- /1,-55) + (10/1,-55) =
%

Calcul pe baza celei deGa doua formule:

( */1,-55) 12 % + (1,-1/1,-55) 12 % + (1,-5/1,-55) 12 % + + (1,-* /1,-55) 12 % + (1,-0/1,-55) 12 % + (1,-+/1,-55) 2 % + + (1* /1,-55) 52 % + (1*-1/1,-55) 12 % + (1*- /1,-55) 12 % + + (1*-1/1,-55) 12 % + (1*-5/1,-55) 12 % + (1*-0/1,-55) 12 % + (10/1,-55)
S
=

12 % .-+,

&e)olvare seria cu valoarea aberant * inclus (continuare)

S = .-+, = - 1

CV CV ? 600 H (+!+, I 6E!.. ? 6,!-E Dia%nostic $opulaie relativ omo%en

&e)olvare seria $r valoarea aberant *

Calcul pe baza primei formule:


+ + %-1*

(1,-0/1*-%5) + (1*/1*-%5) + (1*-1/1*-%5) + (1*-1/1*-%5) + + (1,-1/1*-%5) + (1,-+/1*-%5) + (1* /1,-%5) + (1*-1/1*-%5) + (1*-5/1*-%5) + (1,-5/1*-%5) + (1,-+/1*-%5) + (1*/1*-%5) + (1*-1/1*-%5) + (1*-0/1*-%5) + (1,-*/1*-%5) + (1* /1*-%5) + (1*/1*-%5) + (1*- /1*-%5) + (10/1*-%5) =
1+

Calcul pe baza celei deGa doua formule:

(1,-1/1*-%5) 121+ + (1,-5/1*-%5) 121+ + + (1,-* /1*-%5) 121+ + (1,-0/1*-%5) 121+ + (1,-+/1*-%5) 21+ + + (1* /1*-%5) 521+ + (1*-1/1*-%5) 121+ + (1*- /1*-%5) 121+ + + (1*-1/1*-%5) 121+ + (1*-5/1*-%5) 121+ + (1*-0/1*-%5) 121+ + (10/1*-%5)
S
=

121+ %-1*

&e)olvare seria $r valoarea aberant * (continuare)

S = %-1* = %-.1

CV CV ? 600 H (0!-6 I 6D!0. ? +!-6 Dia%nostic $opulaie omo%en

34emplu practic de utili)are a indicatorilor de mprtiere n 5urul tendin"ei centrale

=edia! deviaia standard i coeficientul de variabilitate pentru cAiriile pltite n diferite zone din re%iunea JasAin%ton (DC n +00, (n dolari ! pe baza datelor obinute din anunurile publicate n pres

Kalorama Cleveland Par( Dupont Circle +eorgeto,n -ogg. /ottom Cat0edral 1eig0ts Capitol 1ill 3dams Morgan Columbia 1eig0ts 4ogan Circle Mount Pleasant +lover Par( 5ort0,est 5ort0east 6out0east 3merican 7niversit. Par(

Media ($) !"" ) ' # ' )'% *" *)% ' %' ** 2'% 2*# 2 2 2 ' % #%! *%)

Deviaia standard ($) #$%&# %%&' $'$&' ) !&% $ %&% $2 & **%&) %"&2 *2%&2 **%&% * *&! "#&% ) *&# ' &' %"&' '2&*

CV% $ &' $&$ *)&! *%&* *)&' *)& *2&# #&" %&# * &* *2&' "&) $'&' *$&" #&$ #&#

#mplitudinea

Beprezint diferena dintre valoarea ma(im i valoarea minim dintrGo serie (Dra%omirescu 4#! op# cit# :

A ? Kma( ' Kmin S se calculeze amplitudinea seriei D9 6E!69 6E!.9 6E!D9 6E!/9 6E!F9 6E!F9 6D9 6D9 6D9 6D9 6D9 6D!69 6D!69 6D!69 6D!+9 6D!,9 6D!.9 6D!/9 6/! nainte i dup eliminarea valorii aberante D#

Aplicaie:

&e)olvare

;nainte de eliminarea valorii aberante: A ? 6/ ' D ? 66# Dup eliminarea valorii aberante: A ? 6/ ' 6E!6 ? 6!F# Proprieti negative 6# Consider doar valorile e(treme9 +# :ste sensibil la valorile aberante9 ,# 5u este sensibil la alte valori dec&t cele e(treme# -# 5u se preteaz la calcule al%ebrice#
(Dra%omirescu 4#! op# cit#

Proprieti pozitive 6# 3fer o ima%ine %eneral asupra mprtierii#

6ntrebri

Atept ntrebri#