Documente Academic
Documente Profesional
Documente Cultură
Estatstica
Aula 3
Medidas Numricas Descritivas
Objetivos
Nesta parte, aprenderemos:
a descrever as propriedades de tendncia central,
Cap 3-2
Exemplo
Uma pesquisa em uma certa cidade perguntou a 15
Em rol:
5 10 10 10 10 12 15 20 20 25 30 30 40 40 60
Cap 3-3
Exemplo
Diagrama ramo-e-folha:
Distribuio assimtrica
Maior tempo de viagem = 60 min
000025
005
00
00
5
6
Definies
A tendncia central corresponde extenso na qual
Cap 3-5
Mdia aritmtica
Mediana
Moda
Cap 3-6
Mdia
A mdia aritmtica (mdia) a mais comum das
X
Tamanho da
amostra
X
i1
X1 X2 Xn
n
Valores
observados
Cap 3-7
Exemplo: Mdia
A tabela abaixo lista o tempo de viagem de casa para o
x2
x3
x4
x5
x6
x7
x8
x9
x10
30
20
10
40
25
20
10
60
15 40
x11
x12
x13
x14
x15
30
12
10
10
15
=1
30 + 20 + + 10 337
=
=
= 22.5
15
15
Cap 3-8
Mdia
0 1 2 3 4 5 6 7 8 9 10
Mdia = 3
1 2 3 4 5 15
3
5
5
0 1 2 3 4 5 6 7 8 9 10
Mdia = 4
1 2 3 4 10 20
4
5
5
Cap 3-9
Mdia = 4
(1 - 4) (2 - 4) (3 - 4) (4 - 4) (10 - 4) 0
Cap 3-10
nula.
X
n
i 1
i 1
i 1
X Xi X
n
Xi nX
i 1
Cap 3-11
nula.
=
=1
Desvio de Xi em relao a mdia
=1
=1
= 0
=1
Cap 3-12
Mdia
Propriedade: o valor que minimiza a soma do
= min
=1
Cap 3-13
Mediana
Em um rol (lista dos dados em ordem crescente), a mediana o
Mediana = 4
0 1 2 3 4 5 6 7 8 9 10
Mediana = 4
Cap 3-14
Localizando a Mediana
A mediana de um conjunto de dados ordenados
localizada na posio:
+1
.
2
+1
2
+1
no inteiro. Ento,
2
Cap 3-15
A Mediana
Em um rol, a mediana o nmero do meio, (50% acima, 50%
abaixo)
0 1 2 3 4 5 6 7 8 9 10
Mediana = 4
A Mediana
Em um rol, a mediana o nmero do meio, (50% acima, 50%
abaixo)
0 1 2 3 4 5 6 7 8 9 10
Mediana = 4.5
Exemplo com = 6 (nmero par)
Posio da mediana = (6+1)/2=3.5, entre o 4 e o 5
valor no rol:
4 + 5 4 + 5
=
=
= 4.5
2
2
Cap 3-17
Exerccio: Mediana
Exerccio: Determine o tempo mediano de viagem de
casa para o trabalho para as pessoas da cidade.
x1
x2
x3
x4
x5
x6
x7
x8
x9
x10
30
20
10
40
25
20
10
60
15 40
x11
x12
x13
x14
x15
30
12
10
10
Soluo:
- O tamanho da amostra : = 15 (mpar)
+1
2
15+1
2
=8
Posio da mediana:
Mediana
Propriedade: o valor que minimiza a soma do valor
= min
=1
Cap 3-19
Mdia x Mediana
Vimos que a mdia afetada por valores extremos,
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Moda = 9
2 3 4
5 6
Sem Moda
Cap 3-21
Exemplo
Uma pesquisa em uma certa cidade perguntou a 15
Em rol:
5 10 10 10 10 12 15 20 20 25 30 30 40 40 60
Qual a moda?
Cap 3-22
Mdia:
($3,000,000/5)
= $600,000
Mediana: valor do meio dos dados
ordenados
= $300,000
Moda: valor mais frequente
= $100,000
Cap 3-23
Cap 3-24
Mdia
Aritmtica
Mediana
Moda
X
i1
Valor do meio
em um rol
Valor
observado
com mais
frequncia
Cap 3-25
Simtrica
Mdia = Mediana = Mo
Assimtrica direita
Mo < Mediana < Mdia
Medidas de Variao
Medidas de variao medem a disperso de valores em
Varincia e Desvio-padro)
Indicam se um conjunto de dados homogneo ou
heterogneo.
Cap 3-28
Amplitude
Medida de variao mais simples
Amplitude definida como a diferena entre o maior e o
13 14
Amplitude = 13 - 1 = 12
Cap 3-29
Desvantagens da Amplitude
Ignora a forma na qual os dados so distribudos:
7
10
11
12
Amplitude = 12 - 7 = 5
10
11
12
Amplitude = 12 - 7 = 5
sensvel a outliers
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5
Amplitude = 5 - 1 = 4
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
Amplitude = 120 - 1 = 119
Cap 3-30
Exemplo
Uma pesquisa em uma certa cidade perguntou a 15 pessoas,
5 10 10 10 10 12 15 20 20 25 30 30 40 40 60
A amplitude : 60 5 = 55 min
Afetada pelo valor atpico
Como podemos ter uma ideia da variao que no
Medidas Separatrizes
Medidas separatrizes so valores que dividem o rol
em partes iguais.
Medidas separatrizes tipicamente usadas:
Quartis (4 partes)
Decis (10 partes)
Centis (100 partes)
A nomenclatura geral : quantil ou pertencil
Cap 3-32
Exerccio: Quartis
Exerccio: Voc tem uma corda de um metro e
Cap 3-33
Quartis
Quartis dividem os dados ordenados em 4 segmentos
25%
Q1
25%
Q2
25%
Q3
Localizando Quartis
Encontre os quartis ao determinar o valor correspondente a
posio apropriada nos dados ordenados, onde
Posio do primeiro quartil: Q1 = (n+1)/4 valor ordenado
Posio do segundo quartil: Q2 = (n+1)/2 valor ordenado
Posio do terceiro quartil: Q3 = 3(n+1)/4 valor ordenado
em que n o nmero observado de valores
ESTA A POSIO DOS QUARTIS NOS DADOS ORDENADOS!!
Cap 3-35
Localizando Quartis
Posio dos quartis:
1
1 = ( + 1)
4
1
2 = ( + 1)
2
3
3 = ( + 1)
4
seguir:
11 12 13 16 16 17 18 21 22
Primeiro, note que n = 9.
Exerccio: Quartis
Uma pesquisa em uma certa cidade perguntou a 15
5 10 10 10 10 12 15 20 20 25 30 30 40 40 60
Quais so os quartis da distribuio do tempo de
viagem??
Cap 3-38
Medidas de Variao:
Amplitude Interquartil
Uma boa medida de disperso dos dados, que no sensvel a
= Q3 Q1
Cap 3-39
Exerccio: Quartis
Uma pesquisa em uma certa cidade perguntou a 15
5 10 10 10 10 12 15 20 20 25 30 30 40 40 60
Qual a Amplitude Interquartil do tempo de viagem?
Cap 3-40
Cap 3-41
de 5 nmeros.
25%
mnimo
25%
1 Quartil
25%
Mediana
25%
3 Quartil
mximo
Cap 3-42
Box-Plot
O quadro e a linha central esto localizados no meio
Min
Q1
Mediana
Q3
Max
Box-Plot
Quando os dados tem uma nica moda, o box-plot nos d uma ideia
da direo da assimetria nos dados (sem precisar olhar a
distribuio).
Assim. Esq
Q1
Q2Q3
Simtrica
Q1Q2Q3
Assim. Dir
Q1 Q2 Q3
Cap 3-44
Cap 3-45
Varincia e Desvio-padro
O resumo dos 5 nmeros no a descrio numrica
so:
Cap 3-46
Medidas de Variao:
Varincia
A varincia a mdia (aproximadamente*) do
Varincia Amostral: S 2
Em que
2
(X
X
)
i
i 1
n -1
X = mdia aritmtica
n = tamanho da amostra
Xi = iesimo valor da varivel X
* (n-1: graus de liberdade)
Cap 3-47
Medidas de Variao:
Desvio-padro
Medida de variao mais utilizada: "desvio mdio dos dados
em relao a mdia".
Mostra variaes em relao a mdia
Raiz quadrada da varincia
Tem a mesma unidade que os dados originais
n
Desvio-padro amostral:
2
(X
X
)
i
i 1
n -1
Cap 3-48
Medidas de Variao:
Desvio-padro
Passos para computar o desvio-padro amostral
1.
2.
3.
4.
5.
Cap 3-49
Medidas de Variao:
Desvio-padro
Dados
Amostrais (Xi) :
10
n=8
12
14
15 17 18 18 24
Mdia = X = 16
130
7
4.31
Medidas de Variao:
Comparando Desvios-padro
Dados A
11
12
13
14
15
16
17
18
19
20 21
Mdia = 15.5
S = 3.338
20
Mdia = 15.5
S = 0.926
Dados B
11
21
12
13
14
15
16
17
18
19
Dados C
11
12
13
14
Mdia = 15.5
S = 4.570
15
16
17
18
19
20 21
Cap 3-51
Medidas de Variao:
Comparando Desvios-padro
Desvio-padro pequeno
Desvio-padro grande
Cap 3-52
Exerccio: Desvio-padro
A taxa metablica de uma pessoa a taxa segundo a qual
Cap 3-53
Exerccio: Desvio-padro
Soluo: n=3
1792
1666
1362
Soma:
4820
Mdia:
1606.67
Cap 3-54
Exerccio: Desvio-padro
n
Soluo: n=3
b)
Soma:
Determine o desvio-padro.
Xi
(Xi-Mdia)
(Xi-Mdia)2
1792
17921606.67=
185.33
185.332=
34347.21
1666
1666-1606.67
59.33
59.332=
3520.05
1362
1362-1606.67
-244.67
(-244.67)2=
59863.40
4820
-0.01
97730.67
Mdia=
1606.67
97730.67/2=48865.33
2
(X
X
)
i
i 1
n -1
S=raiz(48865.33)
= 221.05
Cap 3-55
Medidas de Variao:
Propriedades da Varincia
Propriedade 1: A varincia de uma constante nula;
11
12
13
14
11
12
13
14
16
17
18
19
Cap 3-56
Medidas de Variao:
Propriedades da Varincia
Propriedade 1: A varincia de uma constante nula;
Para uma base de dados com dados: 1 = 2 = = =
=
(
+
)
=
=
+ =
=
=
Cap 3-57
Medidas de Variao:
Propriedades da Varincia
Propriedade 3: A varincia do produto de uma constante por uma
varivel igual ao produto do quadrado da constante pela varincia
da varivel.
11
12
13
14
22
23
24
25
26
27
28
Cap 3-58
Medidas de Variao:
Propriedades da Varincia
Propriedade 3: A varincia do produto de uma constante por
uma varivel igual ao produto do quadrado da constante pela
varincia da varivel.
Para uma base de dados com dados: 1 = 2 = = .
=
=
=
=
= ()
Cap 3-59
amostra e no a populao.
Medidas descritivas para a populao so chamadas
Mdia Populacional
A mdia populacional a soma dos valores na
Em que
X
i 1
X1 X 2 X N
= mdia populacional
N = tamanho da populao
Xi = isimo valor da varivel X
Cap 3-61
Varincia Populacional
A varincia populacional a mdia do quadrado dos
2
Em que
2
(
X
)
i
i 1
= mdia populacional
N = tamanho da populao
Xi = isimo valor da varivel X
Cap 3-62
Desvio-Padro Populacional
O desvio-padro populacional a medida de
Em que
2
(
X
)
i
i 1
N
= mdia populacional
N = tamanho da populao
Xi = isimo valor da varivel X
Cap 3-63
Parmetro
Populacional
Estatstica
Amostral
Mdia
Varincia
Desvio Padro
Cap 3-64
Cap 3-65
Cap 3-67
Cap 3-68
Localizando Valores
Extremos: Escore-Z
O Escore-Z de um valor o nmero de desvios-padro
Localizando Valores
Extremos: Escore-Z
Xi X
Zi
S
Em que Xi representa o valor do dado observado
X a mdia amostral
S o desvio-padro amostral
Mede a distncia em desvio-padres de um certo
dado em relao a mdia.
Cap 3-70
Localizando Valores
Extremos: Escore-Z
Exerccio: Suponha que a nota mdia do ENEM seja
1.3
S
100
100
Um escore de 620 equivale a 1.3 desvios-padro acima
da mdia e portanto no seria considerado um valor
extremo.
Cap 3-71
relacionam entre si
2 variveis!!
Cap 3-72
Covarincia Amostral
A covarincia amostral mede a fora da relao linear
Covarincia amostral:
cov ( X , Y )
( X X)( Y Y)
i1
n 1
Cap 3-73
Covarincia Amostral
n
A covarincia amostral
cov ( X , Y )
( X X)( Y Y)
i1
n 1
Cap 3-74
Covarincia Amostral
Covarincia, cov(X,Y), entre duas variveis:
Covarincia Amostral
A covarincia depende das dimenses usadas
Assim, ao olharmos o valor calculado podemos apenas
Coeficiente de Correlao
O coeficiente de correlao mede a fora relativa da
( X X)( Y Y)
i
i1
( Xi X )
i1
2
(
Y
Y
)
i
cov ( X , Y )
SX SY
i1
Cap 3-77
Coeficiente de Correlao
Y
r = -1
r = -0.6
X
r=0
X
r = +1
r = +0.3
Cap 3-78
Coeficiente de Correlao:
Propriedades
Propriedades do coeficiente de correlao:
Adimensional
Varia entre -1 e 1
Quanto mais prximo de -1 mais forte a relao linear
negativa entre as variavies
Quanto mais prximo de 1, mais forte a relao linear
positiva entre as variveis.
Quanto mais prximo de 0, mais fraca a relao linear entre
as variveis.
Ver applet regression by eye
Cap 3-79
Coeficiente de Correlao:
Exemplo
r = 0.733
Nota na 2a Prova
100
95
90
85
80
75
70
70
75
80
85
90
Nota na 1a Prova
95
100
Coeficiente de Correlao
Exerccio: Supe-se que o contedo de hidrognio (X)
0.18
0.20
0.21
0.22
0.30
0.46
0.70
0.41
0.44
0.72
( X X)( Y Y)
i
i1
( X X) ( Y Y )
2
i1
i1
cov ( X , Y )
SX SY
Cap 3-81
Coeficiente de Correlao
Soluo:
Para calcularmos a correlao:
n
(X
i 1
(X
i 1
X )(Yi Y )
X)
(Y
i 1
Y )
0.18
0.46
0.20
0.70
0.21
0.41
0.22
0.44
0.30
0.72
Soma=1.11
Soma=2.73
1.11
0.22
5
2.73
Y
0.55
5
X
Cap 3-82
Coeficiente de Correlao
Soluo:
_ _
Soma:
(Xi-X)2
(Xi-X)
(Yi Y)
Yi
(Yi-Y)2
_ _
(Xi-X)(Yi Y)
0.18
-0.04
0.0016
0.46
-0.09
0.0081
0.0036
0.20
-0.02
0.0004
0.70
0.15
0.0225
-0.003
0.21
-0.01
0.0001
0.41
-0.14
0.0196
0.0014
0.22
0.44
-0.11
0.0121
0.30
0.08
0.0064
0.72
0.17
0.0289
0.0136
1.11
0.01
0.0085
2.73
-0.02
0.0912
0.0156
Ento:
r
(X
i 1
X )(Yi Y )
( X i X )2
i 1
(Y
i 1
Y )2
0.0156
0.0085 * 0.0912
0.0156
0.55
0.092 * 0.31
Cap 3-83
Correlao x Causalidade
Correlao no a mesma coisa que causalidade!!
Pode ser que Y cause X, ou que X cause Y ou que exista outra varivel
(omitida) Z que cause as duas coisas...
Correlao x Causalidade
- Eu achava
que correlao
implica
causalidade
- A eu fiz um
curso de
estatstica e
agora no acho
mais.
- Parece que o
curso ajudou.
- Pode ser.
Cap 3-85
Armadilhas em Medidas
Descritivas
A anlise de dados objetiva
Uma anlise de dados sempre deve apresentar as medidas
Cap 3-86
Consideraes ticas
Medidas Descritivas Numricas:
Devem documentar tanto os resultados bons quanto os
resultados ruins.
No deve-se usar medidas descritivas inadequadas para
distorcer os fatos.
Ficar atento para omisses ao ler estatsticas descritivas,
Cap 3-87
Questes Recapitulativas
Cap 3-88