Sunteți pe pagina 1din 23

Andr Jalles

Departamento de Estatstica e Matemtica Aplicada

Sumarizao de dados
Medidas
Proporo: medida que proporciona a comparao entre

distribuies
diferentes.

de

frequncia

com

tamanhos

amostrais

Pessoas de 18 a 24 anos de idade, por nvel de instruo,

segundo a situao do domiclio e gnero, Estado do cear 2010


Nvel de instruo

Homens
Sem instruo e fundamental incompleto
118.425
Fundamental completo e mdio incompleto 119.796
Mdio completo e superior incompleto
176.907
Superior completo
7.744
Total
422.872
Fonte: SIDRA/IBGE, Censo 2010

Urbana
Rural
Percentual Mulheres Percentual Homens Percentual Mulheres Percentual
28,0%
89.497
20,2% 63.520 45,1%
41.168
32,4%
28,3% 118.500 26,7% 45.235 32,1%
41.829
32,9%
41,8% 221.604 50,0% 31.550 22,4%
43.070
33,9%
1,8%
13.780
3,1%
421
0,3%
1.035
0,8%
100% 443.381 100% 140.726 100% 127.102 100%

Sumarizao de dados
Medidas
Razo: medida que proporciona a comparao de algum fenmeno

entre categorias distintas.


Pessoas de 18 anos ou mais de idade que costumam consumir bebida
alcolica uma vez ou mais por ms, por gnero e UF-NE, ano 2013.
UF
Masculino Feminino
total
Razo
Alagoas
354
122
476
2,90
Bahia
2.247
1.004
3251
2,24
Cear
1.062
306
1368
3,47
Maranho
750
258
1008
2,91
Paraba
357
127
484
2,81
Pernambuco
1.145
444
1589
2,58
Piau
431
154
585
2,80
Rio Grande do Norte
435
129
564
3,37
Sergipe
309
98
407
3,15
Fonte: SIDRA/IBGE

Sumarizao de dados
Medidas
Varivel quantitativa
{x1,x2,x3,...,xn},

observaes
quantitativa.

Amostra
com
n
de
uma
varivel

Medidas de posio (localizao)


Mdia aritmtica: localiza o centro de

gravidade dos dados


Frmula: (x1+x2+x3+...+xn)/n
Exemplo: (1+2+3+5+9)/5 = 4
Deficincia:
sensvel
a
extremos.

valores

Medidas de posio (localizao)


Mdia Geomtrica: localiza o centro

de dados geomtricos.
1/n
Frmula: (x1x2x3... xn)
1/5
Exemplo: (24x8x32x512) = 16
Deve ser utilizada para dados
geomtricos (Exemplo: inflao)

Medidas de posio (localizao)


Mediana: localiza o valor que divide os

dados em dois grupos de tamanhos


iguais.
Exemplo: {1,2,3,5,9}, Mediana = 3
Frmula:
n mpar: x(n+1)/2
Geral: (n+1)/2
n par: (xn/2+xn/2+1)/2

Medidas de posio: Quartis


Q1- primeiro quartil: divide os dados

em duas partes, uma com 25% e outra


com 75% das observaes.
Q2- segundo quartil: Mediana
Q3- terceiro quartil: divide os dados em
duas partes, uma com 75% e outra com
25% das observaes.

Medidas de posio: Quartis


Exemplo: {1,2,3,5,9}
Q1=2
Q3=5

Medidas de posio (localizao)


Moda: valor mais frequente. Valor que

mais se repete. Valor que representa o


local de maior densidade dos dados,
cuja vizinhana mais povoada com
dados.
Exemplo: {1,2,3,5,9}, Moda = 2

Medidas de posio (localizao)


Exemplo: {1,2,3,5,9}
Mediana
Moda

Mdia

0 1 2 3 4 5 6 7 8 9

Varivel quantitativa
{x1,x2,x3,...,xn}, Amostra com n observaes de uma varivel

quantitativa.
Uma medida do centro isolada no adequada para descrever
dados numericamente para uma varivel quantitativa. Ela
descreve um valor tpico, mas no a disperso dos dados em torno
do valor tpico. (Agreste,A e Finlay,B. Mtodos Est. Para as C. Sociais)
A disperso de conjunto de dados a variabilidade que os dados
apresentam entre si. Se todos os valores forem iguais, no h
disperso; se os dados no so iguais, existe disperso entre os
dados. A disperso pequena quando os valores so prximos uns
dos outros. Se os valores so muito diferentes entre si, a disperso
grande, assim, as medidas de disperso apresentam o grau de
agregao dos dados. (Waldir Medri, ANLISE EXPLORATRIA DE DADOS )

Medidas de disperso (variabilidade)


Medida possvel de variabilidade dos

dados
Amplitude dos dados: Mximo - Mnimo
Exemplo: {1,2,3,5,9}
9 1 = 8

Medidas de disperso (variabilidade)


Medida possvel de variabilidade dos

dados
Distncia interquartlica: Q3 Q1
Exemplo: {1,2,3,5,9}
5 2 = 3

Medidas de disperso (variabilidade)


Mdia aritmtica: localiza o centro de

gravidade dos dados. Qual a sua


representatividade?
Medida possvel do custo: Distncia
quadrtica mdia dos dados mdia
Varincia: Frmula (m=mdia aritmtica)
2
2
2
((x1-m) +(x2-m) +...+(xn-m) )/(n-1)
Exemplo
2
2
2
2
2
((1-4) +(2-4) +(3-4) +(5-4) +(9-4) )/4 = 10

Menor soma quadrtica


f ( m) xi m xi2 2m xi nm 2
2

f ( x ) ax 2 bx c. f ( x ' ) 0, se :
b b2 4ac
x'
, desse modo, f ( m' ) 0, se :
2a
2 xi 4 xi 4n xi2
2

m'

2n
2 xi 2 xi

m'1 m'2
2n
2n
2
2

Medidas de disperso (variabilidade)


Problemas da varincia: unidade de

medida quadrtica
Desvio-Padro: raiz da Varincia
Exemplo
2
2
2
2
2
raiz((1-4) +(2-4) +(3-4) +(5-4) +(9-4) )/4
= raiz(10) 3,16

O que o Desvio Padro representa

Medidas de disperso (variabilidade)


Mediana: localiza o valor que divide os

dados em dois grupos de tamanhos


iguais.
Desvio Mdio: Distncia linear mdia
entre as observaes e a mediana
Exemplo
(|1-3|+|2-3|+|3-3|+|5-3|+|9-3|)/5=11/5=2,2

Mnima soma linear

Medidas de disperso (variabilidade)


Problemas

do desvio-padro: a
unidade de medida influencia o valor
Coeficiente de variao: S/mdia
Adimensional
Exemplo: 3,16/ 4 0,7906

Medidas de assimetria
Medida de afastamento da simetria dos

dados, ou grau de deformao da


distribuio dos dados
Comparao entre medidas de tendncia
central
Coeficiente de Pearson:
Sk = 3(mdia-mediana)/S
= 3(4-3)/3,16 0,9487

Medidas de assimetria
Medida de afastamento da simetria dos

dados, ou grau de deformao da


distribuio dos dados
Comparao entre medidas de tendncia
central
Coeficiente quartil de assimetria
eQ = ((Q3-Q2)-(Q2-Q1))/(Q3-Q1)
=((5-3)-(3-2))/(5-2) 0,3333

S-ar putea să vă placă și