Sunteți pe pagina 1din 16

2.

2 Medidas de Posicao ou Medidas de Tendencia Cen-


tral1
Sao medidas empregadas para resumir um conjunto de dados, apresentando um ou alguns
valores que sejam representativosdo conjunto todo. Quando usamos um so valor, obtemos
uma reducao drastica dos dados.

Sao medidas de posicao, dentre outras:


Media;
Mediana;
Moda.

2.2.1 Media
Media Aritmetica
E chamada medida de tendencia central, pois representa os fenomenos pelos seus valores
medios em torno do qual tendem a se concentrar os dados.
Se X1 , X2 , . . . , Xn sao n valores quaisquer da variavel X, entao a media aritmetica de
X, que denotaremos por X e dada por
n
P
Xi
X1 + X2 + ... + Xn i=1
X = = ,
n n
ou seja, e a soma de todos os valores que a variavel assume, dividido pelo numero total de
valores que a mesma assume.

Exemplo:
Calcular a media aritmetica para o conjunto de valores assumidos pela variavel X a seguir:

X = {50, 70, 45, 60, 75} (R : X = 60)

Agora, se temos n observacoes da variavel X, das quais f1 sao iguais a X1 , f2 sao iguais
a X2 , . . . , fk sao iguais a Xk , entao a media aritmetica de X sera dada por

k
P
f i Xi
f1 X1 + f2 X2 + ... + fk Xk i=1
X = = k (media aritmetica ponderada)
f1 + f2 + ... + fk P
fi
i=1

Se quisermos calcular a media aritmetica ponderada para um determinado conjunto de


dados, entao podemos considerar fi como sendo o peso ou a frequencia de cada valor Xi .

1Notas de aulas adaptadas do material elaborado pelos professores da UFV: Adair J. Ragazzi, Carlos
H. O. Silva e Grson R. dos Santos.
Exemplo:
Um estudante obteve as seguintes notas nas provas parciais de Estatstica:

Prova Pesos Notas


(fi ) (Xi )
1a 1 50
2a 1 70
3a 2 50
4a 4 70

Pede-se: calcular a mdia aritmtica. (R: 62, 5)

2.2.2 Mediana (Md)


Para um conjunto de valores colocados em ordem crescente ou decrescente de grandeza,
a mediana e o elemento que ocupa a posicao central.

Numa amostra de n observacoes, a interpretacao da mediana e a seguinte: pode-se afirmar


que pelo menos 50% das observacoes da amostra sao valores iguais ou superiores e pelo menos
50% das observacoes da amostra sao valores iguais ou inferiores a mediana.

Mediana para Dados Nao-Agrupados em Classes

1o Caso: O numero de elementos e mpar.


n+1
Md e o elemento que ocupa a posicao , ou seja, M d = X n+1 .
2 2

Exemplos:

1. Seja uma variavel aleatoria X assumindo os seguintes valores:

X = 14,8,10,5,7. Calcule a mediana.

2. Considerando a Tabela a seguir, obtenha a mediana.

Xi fi
2 3
3 5
1 1
4 2

2o Caso: O numero de elementos e par.


n n
Md e a media aritmetica dos valores centrais de ordem e + 1.
2 2
X n2 + X n2 +1
Md =
2
Exemplos:
1. Seja uma variavel X assumindo os seguintes valores:
X = 8, 10, 5, 7, 15, 14. Obter a mediana.

2. Considerando a Tabela a seguir, obter a mediana:


Xi fi
87 15
90 4
82 5
89 8
85 10

2.2.3. Quartis
Os quartis so valores que dividem uma amostra de dados em quatro partes iguais.
Chamamos de primeiro quartil ou quartil inferior (QI), ao valor
que delimita os 25% menores valores. De terceiro quartil ou quartil
superior (QS) o valor que separa os 25% maiores valores. O segundo quartil,
ou quartil do meio, a prpria mediana, que separa os 50% menores dos 50% maiores
valores.
Dado um conjunto de dados ordenados, podemos obter, de forma
aproximada, o quartil inferior (QI) como a mediana dos valores de posies
menores ou iguais posio da mediana. A mediana dos valores de posies
maiores ou iguais posio da mediana corresponde ao quartil superior, QS.
Exemplo: Determine os quartis do conjunto de dados: 1, 2, 2, 5, 5, 7, 8, 10, 11, 11.

2.2.4 Moda (Mo)


A moda e definida como a relizacao mais frequente do conjunto de valores observados.
Em algumas situacoes, a distribuicao das observacoes e tal que as frequencias sao maiores
nos extremos. Nesses casos, a utilizacao apenas da media e da mediana e contra-indicada, pois
sao valores pouco representativos do conjunto e o uso da moda podera, entao, ser considerado.

Com relacao a moda, uma serie de dados pode ser classificada em:

- Amodal: nao possui moda;

- Unimodal: possui apenas uma moda;

- Bimodal: possui duas modas;

- Multimodal: possui mais de duas modas.

Moda para Dados Nao-Agrupados em Classes

Exemplos:

1. Identificar a moda para os dados da Tabela a seguir:


Xi fi
0 4
1 5
2 7
3 3
4 2
5 1
22

2. Considerando a Tabela abaixo, obter a moda:

Xi fi
3 1
5 4
9 2
10 4
15 3

(R: Serie bimodal M o1 = 5 e M o2 = 10)

Relacao entre media, mediana e moda:

1. Distribuicao simetrica: X = M o = M d

2. Distribuicao assimetrica: a media e a mediana se deslocam.

(a) Assimetria positiva: X > M d > M o


(b) Assimetria negativa: X < M d < M o
Mediana, Quartis, Decis, Percentis e Moda para dados agrupados em
classes (varivel contnua).
Alm da mediana e dos quartis, sero abordados os decis e percentis para
as variveis continuas. Essas duas ltimas medidas no foram vistas para o caso
de variveis discretas.
Clculo da Mediana para dados agrupados em classes (varivel
contnua)
1 Passo: Calcula-se a ordem n/2. Como a varivel contnua, no se
preocupe se n par ou mpar.
2 Passo: Pela frequncia acumulada (Fa) identifica-se a classe que contm
a mediana (classe Md).
n
Faa h

2
3 passo: Utiliza-se a frmula: Md LMd
f Md
Onde: LMd o limite inferior da classe Md
n o tamanho da amostra
Faa: a frequncia acumulada anterior a classe da mediana
h: amplitude da classe Md
fMd: a frequncia da classe Md.

Exemplo: Dada a distribuio amostral, calcular a mediana.

Classes Frequncias
35 45 5
45 55 12
55 65 18
65 75 14
75 85 6
85 95 3
Total 58

Resposta: 61,67
Quartis
Como j vimos, os quartis dividem a amostra em 4 partes iguais. Para o
caso de variveis continuas, os clculos de Q 1 e Q 3 so dados a seguir.
Determinao de Q1
1 Passo: Calcula-se a ordem n/4.
2 Passo: Pela frequncia acumulada (Fa) identifica-se a classe que contm
o primeiro quartil (Q1).
n
Faa h
3 passo: Utiliza-se a frmula: Q1 LQ1
4
fQ1

Determinao de Q3
1 Passo: Calcula-se 3n/4.
2 Passo: Pela frequncia acumulada (Fa) identifica-se a classe que contm
o terceiro quartil (Q3).
3n
Faa h
3 passo: Utiliza-se a frmula: Q3 LQ 3
4
fQ 3

Exemplo: Dada a distribuio, determinar os quartis (Q1 e Q3) e mediana.


Classes fi
7 17 6
17 27 15
27 37 20
37 47 10
47 57 05
Total 56

Q1 = 22,33; Q2 = Mediana = 30,5; Q3 = 38

Decis
Os decis so os valores que dividem os dados em 10 partes iguais.
Como j deve ter percebido, a formula semelhante a dos quartis e da mediana.
in
1 Passo: Calcula-se , em que i = 1, 2,3, 4, 5, 6, 7,8 e 9.
10
2 Passo: Pela frequncia acumulada (Fa) identifica-se a classe Di.
in
Faa h
3 passo: Utiliza-se a frmula: Di LDi
10
f Di

Percentis
Os percentis so os valores que dividem os dados em 100 partes iguais.
O clculo de um percentil dado por:

in
1 Passo: Calcula-se , sendo i =1, 2, 3, ..., 99
100
2 Passo: Pela frequncia acumulada (Fa) identifica-se a classe Pi
in
Faa h
3 passo: Usa-se a frmula: Pi LPi
100
f Pi

Onde:
LPi o limite inferior da classe Pi, em que i = 1, 2, 3, ..., 99
n o tamanho da amostra
Faa: a frequncia acumulada anterior a classe Pi
h: amplitude da classe Pi
fMd: a frequncia da classe Pi.

Exemplo: Determinar o 4 Decil e o 72 Percentil da seguinte distribuio.

Classes fi
4 9 8
9 14 12
14 24 17
19 24 3
Total 40

D4 = ; P72 = 14

Portanto, nesta distribuio, o valor 12,33 divide a amostra em duas partes: uma
com 40% dos elementos e a outra com 60% dos elementos. O valor 16,89 indica que
72% da distribuio esto abaixo dele e 28% acima.
De maneira geral, temos que decis e quartis so casos especiais de percentis.
Decis so pontos que dividem a distribuio em 10 partes iguais. Quartis so pontos que
dividem a distribuio em quatro partes iguais. Assim temos a seguinte tabela:
Classificao Percentil Decil Quartil
95
90= 9
85
80= 8
75= 3
70= 7
65
60= 6
55
50= 5 2
45
40= 4
35
30= 3
25= 1
20= 2
15
10= 1
5

Moda para dados agrupados em classes


Para dados agrupados em classes, h diversas frmulas para o clculo da
Moda. Iremos utilizar a frmula de Czuber.
1 Passo:
Identifica-se a classe modal (aquela que possuir maior freqncia).
2 Passo: Aplica-se a frmula:
1
Mo LMo h
1 2
Onde:
LMo o limite inferior da classe modal
1 : diferena entre a freqncia da classe modal e a imediatamente
anterior.
2 : diferena entre a frequncia da classe modal e a imediatamente
posterior.
h: amplitude da classe Pi
Exemplo: Calcular a moda para a distribuio.
Salrios N de empregados
0 1 3
1 2 10
2 3 17
3 4 8
4 5 5
Total 43

Mo =
2.3 Medidas de Dispersao (ou Medidas de Variabili-
dade)1
2.3.1 Introducao
As medidas de dispersao sao estatsticas descritivas, que quantificam de algum modo a
variabilidade dos dados, geralmente utilizando como referencia uma medida de posicao.

Caracterizar um conjunto de dados apenas por medidas de posicao e inadequado e peri-


goso, pois, conjuntos com medidas de posicao semelhantes podem apresentar caractersticas
muito diferentes. Por exemplo: com relacao a variabilidade do conjunto de valores.

Exemplos:
Amostra A: 4, 8, 3, 9, 7, 5
Amostra B: 1, 5, 2, 14, 3, 11
Note que XA = 6 e XB = 6 , porem, a dispersao dos valores na amostra B e maior.

2.3.2 Variancia Amostral


A variancia mede a dispersao dos valores em torno da media. Ela e dada pela soma
dos quadrados dos desvios em relacao a media aritmetica, dividida pelo numero de graus de
liberdade. E a medida de dispersao mais utilizada, facil de calcular e compreender, alem de
ser bastante empregada na inferencia estatstica.
Para uma amostra de n valores, X1 , X2 , ..., Xn , a variancia amostral e dada por:
n 2
P
n n
Xi
P 2 P 2 i=1
Xi X Xi
2 SQDX i=1 i=1 n
S (X) = V (X) = = =
n1 n1 n1

Se aos valores X1 , X2 , ..., Xk estiverem associados as frequencias f1 , f2 , ..., fk , a variancia


amostral sera dada por:
k 2
P
k
f i Xi
P 2 i=1
f i Xi k
i=1 P
fi k
2 SQDX i=1 P
S (X) = V (X) = = , pois n = fi
n1 Pk
i=1
fi 1
i=1

Graus de Liberdade

E possvel demonstrar que, utilizando-se o denominador n 1, obtem-se um estimador


nao tendencioso da variancia populacional, isto e, E (S 2 ) = 2 .

De uma maneira geral, o numero de graus de liberdade associados a uma estatstica e o


numero de elementos da amostra, n, menos o numero de parametros (medidas da populacao)
ja estimados. Existem n 1 desvios independentes.
Algumas propriedades uteis da variancia:

(i) A variancia e sempre maior ou igual a zero, isto e, S 2 (X) 0;

(ii) Para X = k, sendo k uma constante, S 2 (X) = 0;


(iii) Para Y = X + k, sendo k uma constante, S 2 (Y ) = S 2 (X);

(iv) Para Y = kX, sendo k uma constante, S 2 (Y ) = k 2 S 2 (X).

Exemplo 1:
Amostra A: 4, 8, 3, 9, 7, 5 Amostra B: 1, 5, 2, 14, 3, 11

Para o nosso exemplo, temos:

(36)2 (36)2
244 356
SA2 = 6 = 5, 6 SB2 = 6 = 28
61 61
Exemplo 2:

Para os dados da Tabela a seguir, calcule a variancia.

Xi fi
2 1
4 3
5 3
6 1
7 1
8 1

(R.: S 2 (X)
= 2, 89)

2.3.3 Desvio-Padrao Amostral


Como medida de dispersao, a variancia tem a desvantagem de apresentar unidade de
medida igual ao quadrado da unidade de medida dos dados. Assim, por exemplo, se os
dados sao medidos em metros, a variancia e dada em metros ao quadrado. Para voltarmos a
unidade de medida original, precisamos de uma outra medida de dispersao. Entao, se define
desvio-padraoqcomo a raiz quadrada positiva da variancia.
S (X) = V (X)

2.3.4 Coeficiente de Variacao


Frequentemente, se tem o interesse em comparar variabilidades de diferentes conjuntos
de valores. A comparacao se torna difcil em situacoes onde as medias sao muito desiguais
ou as unidades de medida sao diferentes. Nesses casos, o CV e indicado por ser uma medida
de dispersao relativa.
O CV expresso em percentagem e dado por:
S(X)
CV (%) = X
100

Note que o CV e o desvio-padrao expresso em percentagem da media. E uma medida


adimensional.
Aplicacao:
- Utilizado para avaliacao da precisao de experimentos;

- Utilizado para analisar qual amostra e mais homogenea (menor variabilidade). Na


situacao em que as amostras possuem a mesma media, a conclusao pode ser feita a
partir da comparacao de suas variancias. Para amostras com medias diferentes, aquela
que apresentar menor CV, e a mais homogenea.
Exemplo:

Duas turmas A e B da disciplina EST 105 apresentaram as seguintes estatsticas na


primeira prova:

Turma A Turma B
nA = 50 nB = 60
XA = 65 XB = 70
S 2 (A) = 225 S 2 (B) = 235

Qual e a turma mais homogenea?


Solucao:
100 225
CVA = = 23, 08%
65

100 235
CVB = = 21, 90%
70
Assim, a turma mais homogenea e a B, pois e a que possui menor coeficiente de variacao.

2.3.5 Erro-Padrao da Media:


E uma medida utilizada para avaliar a precisao da media. E dada por:
r q
 q  V (X) V (X) s (X)
S X = V X = = =
n n n

Exemplo:
 2, 3664 
Considerando SA2 = 5, 6 e SB2 = 28, temos que: S XA = = 0, 966 S XB =
6
5, 2915
= 2, 1602
6

Note que o erro-padrao da media e:


- Inversamente proporcional ao tamanho da amostra;

- Diretamente proporcional a variancia da amostra.



Fato: Variancia da media: V X = V (X) n
. Esta expressao e valida para populacao
infinita ou populacao finita e amostras com reposicao dos elementos.

2.3.6 Amplitude Total (AT)


A amplitude total e dada pela diferenca entre o maior e o menor valor de uma amostra
ou de um conjunto de dados.

A amplitude total indica que o desvio entre duas observacoes quaisquer e no maximo igual
a AT.

AT = Xi Xj
em que: Xi e o maior valor e Xj e o menor valor.

Exemplo:
Amostra A : 4, 8, 3, 9, 7, 5 e Amostra B : 1, 5, 2, 14, 3, 11
AT (A) = 9 3 = 6 e AT (B) = 14 1 = 13.

2.3.7 Amplitude Interquartlica


A amplitude interquartlica a diferena entre o terceiro e o primeiro quartil.
Esta medida mais estvel que a amplitude total por no considerar os valores
mais extremos. Esta medida abrange 50% dos dados e til para detectar valores
discrepantes.
AI=Q3 - Q1

Exemplo: Calcule as amplitudes totais e interquartlicas das amostras abaixo.


Compare os valores obtidos para ambas as amostras.
Amostra A: 52,0; 54,5; 54,0; 51,0; 54,4; 55,0.

Amostra B: 54,0; 51,5; 52,0; 51,0; 53,0; 77,1.


2.4 Box Plot ou Diagrama em caixas
O grfico Box Plot uma anlise grfica que utiliza cinco medidas estatsticas:
valor mnimo, valor mximo, mediana, primeiro e terceiro quartis da varivel
quantitativa. Este conjunto de medidas oferece a ideia da posio, disperso, assimetria e
dados discrepantes. A posio central dada pela mediana e a disperso pela amplitude
interquartlica AI = Q3 - Q2. As posies relativas de Q1 , Q2 e Q3 do uma noo da
assimetria da distribuio.
Os comprimentos das caudas so dados pelas linhas que vo do retngulo aos
valores atpicos. Segundo Triola (2004), um outlier ou ponto discrepante um valor que
se localiza distante de quase todos os outros pontos da distribuio. A distncia a partir
da qual considera-se um valor como discrepante aquela que supera (1,5)AI. De
maneira geral, so considerados outliers todos os valores inferiores a Li = Q1-1,5AI ou
os superiores a LS = Q3+1,5AI.
Para desenhar um Box-plot (VIEIRA, 2008):
1. Desenhe um segmento de reta em posio vertical, para representar a amplitude
dos dados.
2. Marque, nesse segmento, o primeiro, o segundo e o terceiro quartis.
3. Desenhe um retngulo (box) de maneira que o lado superior e o lado inferior
passem exatamente sobre os pontos que marcam o primeiro e o terceiro quartis.
4. Faa um ponto para representar a mediana (obedecendo a escala).
5. Entre os quartis e os extremos, traa-se uma linha. Caso existam valores
discrepantes (valores inferiores a Li e valores superiores a LS), a linha traada
at o ltimo valor no discrepante; e os valores discrepantes so indicados por
pontos (veja a Figura abaixo).

Exemplo: Suponha que os dados abaixo referem-se as idades dos estudantes que
esto no 2 perodo do curso de Engenharia Florestal da UFAC no ano de 2016.
Obtenha o grfico Box-plot desses valores.
18 18 19 20 20 20 20 20 20 21 21
22 23 24 25 25 25 26 29 30 35 37

A Figura acima mostra que a distribuio das idades dos alunos apresenta
assimetria positiva, ou seja, dispersam-se para os valores maiores.
LISTA DE EXERCCIOS N 04
1 A tabela a seguir apresenta os tempos de durao de chamadas telefnicas (em minutos),
obtidos com uma amostra de oito telefonemas.
Telefonema Tempo (min.) Telefonema Tempo (min.)
1 1 5 8
2 3 6 1
3 6 7 4
4 15 8 2
Calcule e interprete:
a. O tempo medio (aritmetico).
b. O tempo mediano.
c. O tempo modal.
d. O erro-padrao da media.
e. O coeficiente de variacao da amostra.

2. Em um Painel Sensorial indivduos treinados avaliam (degustam) determinado produto e


atribuem uma nota de acordo com a percepo do sabor: 0=muito ruim, 1=ruim, 2=regular,
3=bom, 4=muito bom e 5=excelente. Na tabela a seguir so informadas as notas obtidas
com um determinado azeite de oliva,
0 0 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2
3 3 3 3 3 4 4 4 4 5 5 5 5 5 5 5 5
Sumarize as notas com duas medidas de posicao e duas de dispersao e interprete os valores
calculados.

3. Cronometrando o tempo para vrias provas de uma gincana automobilstica, encontramos:


Equipe 1: 40 provas
tempo mdio: 45 segundos
varincia: 400 segundos ao quadrado

Equipe 2: tempo: 20 40 50 80
n de provas: 10 15 30 5

a) qual o coeficiente de variao relativo equipe 1?


b) qual a mdia da equipe 2?
c) qual o desvio-padro relativo equipe 2?
d) qual a mdia aritmtica referente s duas equipes consideradas em conjunto?
e) qual a equipe que apresentou resultados mais homogneos? Justifique
4. Dada a tabela de distribuio de frequncias em intervalo de classes abaixo:

Altura (cm) Frequncia


160 164 5
164 168 13
168 172 22
172 176 25
176 180 10
180 184 3
Total 78
Calcule:
a) Mdia
b) Mediana
c) Moda pelo processo de Czuber
d) Varincia e desvio-padro.

RESPOSTAS

1. a. X = 5 minutos, o tempo total dividido igualmente entre os 8 telefonemas


b.Md = 3, 5 minutos, sendo 4 com duraoo acima e tambm 4 abaixo
c. Mo = 1 minuto, o valor mais frequente d.
S(X) 1, 67 minutos uma estimativa do desvio padro da distribuio amostral da
mdia, uma medida de preciso da estimativa
e.CV(%) 94, 4% minutos o valor do desvio-padrao expresso em termos percentuais
do valor da mdia.

2. Mo=2 Md=2,5 2, 82; varincia 2, 513 desvio-padro (X) 1, 59; erro-padro


0, 27; CV(%) = 56,15 AT=5.

3. a) 44% b) 45 c) 15,13 d) 45 e) equipe 2

4. a) 171,59 b) 171,82 c) 172,67 d)23,414 e 4,839

S-ar putea să vă placă și