Documente Academic
Documente Profesional
Documente Cultură
ESTATÍSTICA
1ª edição
1ª edição 2014
M165e
Magalhães, Cássio
Estatística / Cássio Magalhães. - 2014. - Mogi das Cruzes,
SP. 116p.
Bibliografia
ISBN - 978-85-65148-28-3
1. Estatística. 2. Matemática.
CDU-519.22
Jan/2016
Prof. Cássio Magalhães 1*
* Com mais de 20 anos de experiência no setor de energia elétrica (concessionárias) atuo na área de gerenciamento
de projetos e portfólio de projetos e planejamento da expansão do sistema elétrico. Mestre em engenharia elétrica
pela USP MBA em Gestão Empresarial pela FGV e leciono em cursos de Engenharia Administração Produção
e Qualidade. Os últimos trabalhos em destaque foram como palestrante no 5 Congresso Internacional (IEEE) e
publicação de artigo em periódicos Revista Eletricidade Moderna com redução do orçamento em R$ 45 milhões.
Desenvolvo diversos trabalhos de P&D e melhoria contínua (PDCA). Por meio da pesquisa Thomas obtive ótimas
notas nas nove áreas de competência gerencial.
SUMÁRIO
APRESENTAÇÃO 9
INTRODUÇÃO 11
UNIDADE I
INTRODUÇÃO 13
1.2 ESTATÍSTICA 14
1.4.1 VARIÁVEL 25
1.4.2 QUALITATIVA 26
1.4.3 QUANTITATIVA 28
1.4.4 POPULAÇÃO 30
1.4.5 AMOSTRA 30
1.4.6 AMOSTRAGEM 31
UNIDADE II
SÉRIES ESTATÍSTICAS 37
5 SUMÁRIO 5
2.2 PORCENTAGEM 42
2.4 GRÁFICOS 46
UNIDADE III
DISTRIBUIÇÃO DE FREQUÊNCIAS 59
UNIDADE IV
MEDIDAS DE POSIÇÃO 81
4.1 MODA 82
4.2 MEDIANA 84
6 SUMÁRIO
4.5 MÉDIA PONDERADA 92
4.6.1 QUARTIS 93
4.6.2 QUINTIS 93
4.6.3 DECIS 94
4.6.4 PERCENTIS 94
REFERÊNCIAS 111
7 SUMÁRIO 7
APRESENTAÇÃO
Seja muito bem-vindo à disciplina de Estatística. Este livro didático tem como
principal objetivo, embasar os estudos da disciplina, sendo complementar as teleaulas
e ao material disponível na Plataforma.
Cada uma das unidades corresponde a uma teleaula, e sugiro que os estudos se
iniciem pelo livro didático. Com uma leitura atenta de cada uma das unidades antes de
assistir as teleaulas, o desempenho será otimizado e o aprendizado será mais efetivo.
Ao final de cada uma das unidades, você encontrará uma lista de exercícios,
com o gabarito correspondente, para que você possa testar o aprendizado. Na
Plataforma, teremos quatro atividades, que serão liberadas após cada teleaula e que
corresponderão a cada unidade do livro didático. Por meio da plataforma, teremos um
canal aberto de comunicação.
9 APRESENTAÇÃO 9
INTRODUÇÃO
A estatística aplicada nos ajuda a responder vários porquês do nosso dia a dia,
e a descoberta para a resposta desses porquês é uma importante ajuda na arte de
administrar e gerir um negócio.
O estudo da estatística aplicada tem o objetivo de fazer com que você seja
capaz de planejar o processo de coleta de dados e, após coletá-los, consiga processar,
analisar e apresentar os mesmos de forma clara e objetiva.
11 INTRODUÇÃO 11
Para o profissional que atua com a gestão ou administração de negócios, é
imprescindível que além de aprender como utilizar os diversos instrumentos da
estatística, seja possível entender como as informações obtidas podem auxiliá-lo no
processo decisório. Os nossos objetivos em relação aos dados estatísticos são:
• Análise do resultado;
12 INTRODUÇÃO
1 UNIDADE I
INTRODUÇÃO
OB JET IVOS D A UN ID A D E
HAB IL IDADE S E C O MP E T Ê N C IA S
13 UNIDADE I - INTRODUÇÃO 13
1.1 PANORAMA HISTÓRICO
1.2 ESTATÍSTICA
Alguns exemplos:
• Taxas de desemprego;
• Taxas de inflação;
14 UNIDADE I - INTRODUÇÃO
Famílias, governos e empresas se apoiam fortemente nos dados estatísticos
para orientação Esses dados estatísticos são cuidadosamente compilados de modo
regular, e os dados resultantes são utilizados para tomar decisões que afetam futuras
contratações, níveis de produção, investimentos em educação e saneamento básico.
Portanto, a estatística pode ser definida como uma parte da matemática que
fornece métodos para coleta, organização, análise e interpretação de dados, com o
objetivo final de facilitar a tomada de decisão.
• Dados são observações (medidas, sexo etc.) que tenham sido coletados;
Exemplos
Uma pesquisa foi feita com 108 alunos de uma universidade, com a seguinte pergunta:
“Você faz o uso de bebidas alcoólicas antes de entrar em sala de aula”?
Trata-se de uma amostra, pois a universidade tem uma população muito maior
do que a entrevistada.
15 UNIDADE I - INTRODUÇÃO 15
Estatística – Medida numérica que descreve alguma característica de uma
amostra. Ex.: Com base em uma amostra, 50% dos professores de do ensino
fundamental erraram a conta zero dividida por um.
Exemplo:
Parâmetro
Estatística
• Coleta Direta;
• Coleta Indireta.
16 UNIDADE I - INTRODUÇÃO
Coleta Direta
Coleta Indireta
17 UNIDADE I - INTRODUÇÃO 17
Algumas frases para reflexão:
• Andrew Lang – Pessoas usam a estatística como bêbado, usam postes para
apoio mais do que para iluminação;
Exemplo: Foi realizada uma pesquisa sobre a renda média mensal de homens e
mulheres, com os seguintes resultados:
18 UNIDADE I - INTRODUÇÃO
A pergunta é: “Qual estado tem menor desequilíbrio na média salarial quando
comparados homens e mulheres?”
Nesse caso, é normal “pensarmos” que o estado do Rio de Janeiro está em melhor
condição, pois há uma diferença de altura das barras entre os homens e a mulheres.
Adicionado a isto, temos a pergunta que “sugere” que você encontre uma diferença.
Note que no gráfico do Rio de Janeiro, a escala iniciou em 0 (zero), e em São Paulo,
a escala do gráfico iniciou em 500 (quinhentos).
19 UNIDADE I - INTRODUÇÃO 19
1.3.3 APURAÇÃO DE DADOS
A apuração pode ser realizada manualmente, em que, até pouco tem atrás, as
eleições no Brasil eram realizadas dessa forma, embora ainda exista este modelo de
apuração em outros segmentos. Este tipo de apuração ainda é utilizado em larga escala.
Sintetizar significa unir os dados. Essa união que iremos transformar em tabelas ou
gráficos para facilitar e agilizar a interpretação do fenômeno que está sendo estudado.
20 UNIDADE I - INTRODUÇÃO
1.3.5 ANÁLISE DE DADOS
Essa fase, talvez, seja a mais importante de todas, pois é aqui que tiramos as
conclusões e iniciamos o processo de tomada de decisão.
Como estamos tratando com a fase mais importante, cabem algumas perguntas:
“Qual a qualidade desta pesquisa? Como ela foi feita? O que ela está querendo demonstrar?”
Embora todas essas perguntas devam ser pensadas na fase de coleta de dados,
a análise dos resultados deve atentar para elas. A diferença é que na coleta de dados
ainda não possuímos os resultados. Com a posse dos resultados e sabendo qual a
motivação da pesquisa, podemos aferir a qualidade do processo de forma global.
21 UNIDADE I - INTRODUÇÃO 21
Os exemplos abaixo foram perguntas realizadas à população, sendo que
foram obtidos os seguintes resultados:
99 “O Presidente deve ter o poder de veto para eliminar gastos?” 97% sim;
99 “Pouco dinheiro está sendo gasto com assistência aos pobres?” 63%.
22 UNIDADE I - INTRODUÇÃO
Note que a diferença da pergunta está na ordem em que os motivos
causadores foram inseridos na pesquisa.
Sabemos que pode haver uma relação entre os fatores, mas sabemos, também,
que há uma série de fatores que podem influenciar a relação QI e nível social.
23 UNIDADE I - INTRODUÇÃO 23
O objetivo dessa declaração é incentivar as pessoas a comprarem sapatos
ao participarem de processos seletivos em empresas, com isso, ela estaria
alavancando suas vendas.
Como a pesquisa publica que 90% dos carros vendidos nos últimos 10 anos
ainda estão nas ruas, concluímos que há 900 mil, e apenas 100 mil estão
fora de circulação.
24 UNIDADE I - INTRODUÇÃO
Continuando a análise que dos 90%, 80% foram nos últimos três anos,
temos que 720 mil carros têm menos que três anos, ou seja, acima de três
anos e até 10 anos, temos apenas 180 mil carros.
PAR A R EFLE T IR
Uma pesquisa realizada na região sul do país, mediu o índice de massa corporal
(IMC) dos caminhoneiros, em que faz uma relação peso e altura. O resultado
da pesquisa foi que 95% dos caminhoneiros estavam acima do peso.
1.4.1 VARIÁVEL
• Para o fenômeno ‘sexo’ podemos ter dois resultados possíveis: sexo feminino
e sexo masculino;
25 UNIDADE I - INTRODUÇÃO 25
Esta série de possibilidades referente às variáveis, nos condiciona a dividi-las em
dois grandes grupos:
• Variáveis qualitativas;
• Variáveis quantitativas.
Qualitativas
Quantitativas
• Idade;
• Salário;
• Quantidade de carros;
• Peso.
1.4.2 QUALITATIVA
1 Fonte: IBGE.
26 UNIDADE I - INTRODUÇÃO
Ordinal
Nominal
A ordem dos elementos não faz sentido, ou ainda, a hierarquia dos elementos
não tem significado. Exemplo:
99 Região de trabalho quando classificadas por zonas: Zonal sul, Zona Leste.
Ordinal.
Nominal.
Nominal.
27 UNIDADE I - INTRODUÇÃO 27
1.4.3 QUANTITATIVA
Discreta
Formada por números naturais, ou seja, o elemento não pode ser fracionado,
tendo de ser um número inteiro. Exemplo:
Contínua
99 Leite, quando classificados por litros: 1,5 litros, 3,4 litros etc.;
99 Altura;
99 Peso.
Exemplo:
Contínuo. Embora o exemplo não tenha vírgula, mas é possível que a variável
salário, expressa em reais, venha a ter.
99 Em uma pesquisa com 1059 adultos, verificou-se que 39% deles tinham
armas em suas casas.
28 UNIDADE I - INTRODUÇÃO
C ONHEÇ A MA IS
29 UNIDADE I - INTRODUÇÃO 29
1.4.4 POPULAÇÃO
Outro exemplo seria um estudo sobre a faixa etária dos alunos da universidade,
ou seja, a população de dados seriam todos os alunos. Agora, se no mesmo segmento,
o objetivo fosse estudar apenas a faixa etária dos alunos em EaD, a população seria
apenas os alunos em EaD e não mais todos os alunos da universidade.
1.4.5 AMOSTRA
• Custo – Nos tempos atuais, tudo é movido pelo custo. Portanto, trabalhar
com uma amostra, quantidade menor de dados, reduz o custo da pesquisa.
Com este cenário, podemos concluir que a função dos estudos, baseados
em amostras, tem o objetivo de relacionar a amostra com a população, ou seja, as
conclusões obtidas na amostra representa a população.
30 UNIDADE I - INTRODUÇÃO
1.4.6 AMOSTRAGEM
Arredondamento
31 UNIDADE I - INTRODUÇÃO 31
C ONHEÇ A MAIS
a) 53,672.
b) 4,914.
c) 68,937.
d) 334,786.
e) 38,545
f) 44,485.
g) 2,77555.
h) 55,5555.
• Simples;
• Sistemática;
• Estratificada.
32 UNIDADE I - INTRODUÇÃO
Exemplo: Temos 80 pessoas e queremos entrevistar 10% da população.
Anotamos os 80 nomes em partes semelhantes e sorteamos oito. Quando a população
é muito grande, o sorteio fica inviável, então utilizamos uma tabela de dados aleatórios.
Técnica em que a seleção dos elementos que irão compor a amostra é feita por
meio de um sistema pré-estabelecido. Considerando o exemplo anterior, a amostra
seria a cada 10 (80/8) elementos, ou seja:
10 - 20 - 30 - 40 - 50 - 60 - 70 – 80.
Nesse caso, seria possível adotar uma posição inicial como a posição três. Os
elementos sorteados seriam:
3 – 13 – 23 – 33 – 43 – 53 – 63 – 73.
Exemplo gráfico
Amostragem
Sexo População Amostra
(10%)
Feminino 54 5,4 5
Masculino 26 2,6 3
Total 80 8,0 8
Note que outro critério poderia ser adotado. Como a amostra é de oito alunos,
seriam escolhidos quatro alunos de cada sexo.
33 UNIDADE I - INTRODUÇÃO 33
Essa técnica, embora válida, seria injusta, pois o público masculino teria maior
chance de ser escolhido, pois estão em menor número.
C ONHEÇ A MAIS
34 UNIDADE I - INTRODUÇÃO
1.5 CONSIDERAÇÕES DA UNIDADE I
Na próxima unidade, iremos ver séries e gráficos estatísticos, em que os dados serão
apresentados em forma de tabelas ou gráficos e as melhores maneiras de representação.
35 UNIDADE I - INTRODUÇÃO 35
TESTE SEU CONHECIMENTO
36 UNIDADE I - INTRODUÇÃO
2 UNIDADE II
SÉRIES ESTATÍSTICAS
OB JET IVOS D A UN ID A D E
HAB ILIDADE S E C O MP E T Ê N C IA S
37 II - SÉRIES ESTATÍSTICAS
UNIDADE 37
2.1 SÉRIES ESTATÍSTICAS
Objetivo é sintetizar os valores que uma ou mais variáveis pode assumir para
termos uma visão global e, assim, facilitar a análise.
• Tabelas
99 Corpo
99 Cabeçalho
99 Coluna Indicadora
99 Coluna Numérica
99 Linhas
99 Título
Índice Valor
Coluna Coluna
Indicadora IPCA 0,4% Numérica
IGP-M 0,66%
INPC 0,43%
Ano Médias
2008 5,0
2009 6,0
2010 6,0
2011 5,0
2012 7,0
Tabelas geográficas
39 II - SÉRIES ESTATÍSTICAS
UNIDADE 39
Descreve as variáveis de acordo com a localização.
País IDH
Austrália 0,938
Chile 0,783
China 0,663
Quênia 0,470
Brasil 0,699
Psicologia 80 95
Marketing 110 92
Esse tipo de tabela faz uma distribuição dos valores em um intervalo de variação,
ou seja, agrupamos em um intervalo, a partir de uma lista de números. Na primeira
linha da tabela, temos alunos de 18 anos e alunos menores que 21 anos.
Na segunda linha da tabela, 21|---- 24, o limite superior passa a ser de 24 anos,
que é o limite inferior da segunda classe, que também começa em 24 anos. E assim
sucessivamente.
Exemplo:
Idade Frequênca
18 |---- 21 20
21 |---- 24 40
24 |---- 27 70
27 |---- 30 35
30 |---- 33 15
41 II - SÉRIES ESTATÍSTICAS
UNIDADE 41
2.2 PORCENTAGEM
Iremos ver alguns princípios chaves a serem usados, quando trabalhamos com
porcentagem. Todos esses princípios usam a noção básica que % ou por cento significa
dividir por 100.
6
6% de 1200 = × 1200 = 72
100
12
= 0,15 → 0,15 ×100%=15%
80
85
85%= =0,85
100
Exemplos:
17
= =0,68 = 68%
25
35,2%
= =0,352
100%
57%
= ×1500=855
100
=0,486 ×100%=48,6%
26%
= × 950 = 247
100
43 II - SÉRIES ESTATÍSTICAS
UNIDADE 43
Transforme 5% em um decimal equivalente.
5%
= = 0,05
100%
=0,01 ×100%=1%
527
= × 100% = 43,92%
1200
19
= = 0,07037 = 7,04%
270
3%
= × 270 = 8,1
100
Índices
São razões entre duas grandezas, em que uma não está associada à outra.
Exemplo:
Coeficientes
número de nascimentos
Coeficiente de natalidade=
população total
número de óbitos
Coeficiente de mortalidade =
população total
Taxas
45 II - SÉRIES ESTATÍSTICAS
UNIDADE 45
2.4 GRÁFICOS
O gráfico tem por objetivo, apresentar dados estatísticos que exiba uma visão
rápida e fácil do estudo. Nos dias atuais, não se monta mais gráficos à mão. Os
softwares disponíveis no mercado facilitam muito o trabalho, pois oferecem uma
diversidade muito grande de modelos.
Mas não adianta montar os gráficos e não saber o que ele está demonstrando.
Para algumas representações de dados por meio de gráfico, dependendo do tipo
adotado, a visualização não fica agradável e algumas das vezes o software não
consegue montar o gráfico.
Linha ou curva
Este tipo de gráfico é muito utilizado quando queremos mostrar uma evolução
em função do tempo. Vamos utilizar os dados da tabela das médias de estatísticas e
inserir mais uma disciplina – Teoria geral da administração.
Média Final
Colunas ou barras
Por outro lado, a disciplina de TGA vem mostrando uma queda no seu
desempenho, migrando da média 9 para a média 6.
“Será que a ações que a disciplina de estatística vem realizando para melhorar
o seu rendimento, são possíveis de aplicá-las na disciplina de TGA?”
47 II - SÉRIES ESTATÍSTICAS
UNIDADE 47
“O que será que a disciplina de TGA deixou de fazer certo e começou a fazer
de errado para cair seu desempenho?”
Veja como é possível iniciar o processo decisório com os dados bem demonstrados
e com fácil visualização.
Concordam?
Exemplo:
49 II - SÉRIES ESTATÍSTICAS
UNIDADE 49
Análise gráfica
Concordam?
Agora, vamos ver o mesmo gráfico em setores. Este tipo de gráfico é o próximo
a ser estudado.
Então, vamos entender um pouco mais sobre este tipo de gráfico, que chamamos
de gráfico de setores.
Setores
51 II - SÉRIES ESTATÍSTICAS
UNIDADE 51
Eixo principal e secundário
Supondo que esta empresa tenha 1000 funcionários, podemos concluir que
eles estão retendo os funcionários “problemáticos” e dispensando os talentos.
25
Problemáticos: 20% de 1000 = 200 → × 100% = 12,5% saíram da empresa
200
Outra conclusão que podemos ter, é que 80% dos funcionários da empresa
estão de acordo ou superam o que a empresa espera do seu desempenho.
Vimos que este tipo de gráfico carrega uma grande quantidade de informação,
em que a análise é fundamental para entendimento e tomada de decisão.
Diagrama de Pareto
Para conhecer o Pareto, vamos imaginar uma empresa que produz camisas
sociais. Essa empresa vem recendo um elevado número de reclamações em relação à
qualidade da camisa.
Botão solto 45
Mancha 19
Rasgo 1
Sem etiqueta 1
53 II - SÉRIES ESTATÍSTICAS
UNIDADE 53
Verificamos que três itens, como: botão solto, colarinho costurado torto e
mancha, correspondem a 90% dos problemas encontrados nas camisas.
Portanto, esses três itens são chamados de “itens vitais para o negócio”.
Neste caso, foram adotadas três causas vitais, ou seja, o responsável pela
melhoria iniciaria seus trabalhos por estes itens, pois agir nos demais itens poderia
levar muito tempo, muito esforço e a quantidade de problemas não é tão significativa,
em torno de 10%.
Pictogramas
São gráficos representados por figuras. Este tipo de gráfico é muito utilizado
em revistas e jornais por ser atraente e sugestivo.
55 II - SÉRIES ESTATÍSTICAS
UNIDADE 55
2.5 CONSIDERAÇÕES DA UNIDADE II
Lembre que, o mais importante do gráfico é a informação que ele quer passar
e para isso a análise é fundamental.
57 II - SÉRIES ESTATÍSTICAS
UNIDADE 57
3 UNIDADE III
DISTRIBUIÇÃO DE FREQUÊNCIAS
OB JET IVOS D A UN ID A D E
HAB ILIDADE S E C O MP E T Ê N C IA S
59
UNIDADE III - DISTRIBUIÇÃO DE FREQUÊNCIAS 59
3.1 DISTRIBUIÇÃO DE FREQUÊNCIA
Vamos imaginar que fizemos uma coleta de dados relativa à idade dos alunos
de uma determinada sala, resultando nos dados:
Idade
25
21
23
23
30
18
25
25
26
24
32
19
29
24
25
Observando os dados, é difícil termos alguma conclusão sobre a idade dos alunos,
pois eles foram coletados aleatoriamente, sem obedecer a uma ordem ou sequência.
Esse tipo de dados, chamamos de tabela primitiva ou dados brutos. Ou seja:
Idade
18
19
21
23
23
24
24
25
25
25
25
26
29
30
32
Essas informações são bastante simples, e para verificar tais conclusões, não
seria um estudo aprofundado sobre estatística.
61
UNIDADE III - DISTRIBUIÇÃO DE FREQUÊNCIAS 61
Na verdade, essas definições de aluno mais novo, aluno mais velho e diferença
entre o mais velho e o mais novo aluno, quando transformamos estas informações em
estudos estatísticos, temos as seguintes definições:
Quando trabalhamos com grande quantidade de dados, pode ser útil organizar
e resumir os dados com a construção de uma tabela que liste diferentes valores com
suas frequências.
Portanto, podemos criar uma tabela com essas frequências, o que chamamos
de distribuição de frequência.
Esse tipo de tabela, denominamos de tabela simples. Embora seja simples sua
montagem, quando há uma grande quantidade de dados, pode ficar trabalhosa.
Para reduzir esse tipo de problema, montamos uma tabela de dados agrupados,
em que as frequências são atribuídas a intervalos de classe da variável.
Na tabela simples, cada linha representa uma idade e uma frequência. Na tabela de
dados agrupados, cada linha representa um intervalo de classe e a respectiva frequência.
63
UNIDADE III - DISTRIBUIÇÃO DE FREQUÊNCIAS 63
Dica:
Quando for montar a tabela de dados agrupados, é aconselhável que crie uma
terceira coluna, que chamamos de coluna auxiliar.
Para cada valor, atribuímos um traço de maneira tal que a sequência de traços
forme um quadrado cortado ao meio. Um quadrado cortado ao meio corresponde a
cinco valores.
Classes
Limite de classes
Em cada classe, temos dois números, sendo o primeiro número o limite inferior
da classe (Li) e o segundo número o limite superior da classe (Ls).
24 |--- 27
Note que em todas as classes temos uma representação de uma barra com três traços.
Essa barra determina qual o número que deve estar na classe, ou ir para outra,
quando este número é igual ao limite inferior ou limite superior da classe.
No exemplo 24 |--- 27, a barra está no lado do limite inferior. Significa que a idade 24
deve ser considerada na terceira classe, porém a idade 27 deve ser considerada na quarta
classe, 27 |--- 30. Esse tipo de representação, chamamos de intervalo aberto à direita.
Se o exemplo estivesse com a barra no lado do limite superior da classe, 24 ---| 27,
a idade 24 deveria ser considerada na classe anterior, 21 ---|24, e a idade 27 seria considerada
na terceira classe. Esse tipo de representação, chamamos de intervalo aberto à esquerda.
A grande maioria das tabelas são representadas com o intervalo aberto a direita “|----“.
Note que este valor deve ser igual para todas as classes.
65
UNIDADE III - DISTRIBUIÇÃO DE FREQUÊNCIAS 65
Intervalos de classe das
Intervalo de Classe
idades
18 |---- 21 = 21 – 18 = 3
21 |---- 24 = 24 – 21 = 3
24 |---- 27 = 27 – 24 = 3
27 |---- 30 = 30 – 27 = 3
30 |---- 33 = 33 – 30 = 3
É a diferença entre o limite superior da rol (maior valor) e limite inferior da rol
(menor valor).
Para o exemplo:
Número de classe
O número de classes, ou ainda, o número de linhas que irá ter na tabela, será
fornecido pela regra de Sturges (k), o qual é calculado em função da quantidade de dados.
Em que:
Para o exemplo:
H
h=
k
Para o exemplo:
15
h= ≅ 3,073 = 3
4,8811
Cabe ressaltar que, embora o cálculo seja feito, o intervalo da classe é definido
por quem está elaborando a tabela.
67
UNIDADE III - DISTRIBUIÇÃO DE FREQUÊNCIAS 67
C ONHEÇ A MAIS
37 37 38 38 38
26 32 33 34 34
36 36 36 36 36
34 35 35 35 35
35 36 36 36 36
38 39 39 39 40
40 40 41 42 43
Tabela Simples
Li = 26
Ls = 43
H = 43 – 26 = 17
N = 35
17
h= ≅ 2,7889 ≅ 3
6,0954
Classe Falhas por dia Frequência
1 26 |--- 29 1
2 29 |--- 32 0
3 32 |--- 35 5
4 35 |--- 38 16
5 38 |--- 41 10
6 41 |--- 44 3
Consumo
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
(kWh/mês)
2011 510 532 421 401 358 348 258 269 357 319 456 491
2012 524 554 427 439 321 351 246 289 384 323 489 406
2011
Li = 258
Ls = 532
H = 274
H = 274/4,5612 = 60
69
UNIDADE III - DISTRIBUIÇÃO DE FREQUÊNCIAS 69
Consumo (kWh) Frequência
258 |--- 318 2
318 |--- 378 4
378 |--- 438 2
438 |--- 498 2
498 |--- 558 2
Total 12
2012
Li = 246
Ls = 554
H = 308
H = 274/4,5612 = 68
Acidentes – 29 33 24 29 27 33 36 22 25 24 31 31 27 23 30 35 26 31 32 24
Acidente Frequência
22 1
23 1
24 3
25 1
26 1
27 2
29 2
30 1
31 3
32 1
33 2
35 1
36 1
Total 20
Li = 22
Ls = 36
H = 14
H = 14/5,2934 = 2,6448
Acidentes Frequência
22 |--- 25 5
25 |--- 28 4
28 |--- 31 3
31 |--- 34 6
34 |--- 37 2
Total 20
71
UNIDADE III - DISTRIBUIÇÃO DE FREQUÊNCIAS 71
Erros de Ortografia 9 7 1 7 5 5 1 9 1 2 8 7 6 3 1 6 7 2 4 7 5 5 5 2 1 4 4
9945331925682
Li = 1
Ls = 9
H=8
Altura – 1,20 1,35 1,37 1,39 1,29 1,22 1,34 1,29 1,28 1,42 1,36 1,33 1,42
1,31 1,50 1,41 1,45 1,40 1,34 1,28 1,42 1,52 1,38 1,32 1,40 1,48 1,37
1,36 1,49 1,38 1,38 1,3 1,44 1,36 1,46 1,31 1,42 1,35 1,45 1,48 1,44 1,33
1,45 1,51 1,38 1,36 1,41 1,39 1,35 1,43 1,42 1,41 1,34 1,45 1,31
f = Σfi
f 3
fr2 = = 0,2
Σfi 15
frp = 100% x fr
73
UNIDADE III - DISTRIBUIÇÃO DE FREQUÊNCIAS 73
Frequência acumulada (fa)
fak = f1 + f2 + f3 + f4 + ... fn
Intervalos de classe
Classe Frequência
das idades
1 18 |---- 21 2
2 21 |---- 24 3
3 24 |---- 27 7
4 27 |---- 30 1
5 30 |---- 33 2
Para o exemplo:
C ONHEÇ A MA IS
Itens em Frequên-
Classe Fr Frp (%) Fa far Fap(%)
Estoque cia
1 00 |--- 20 6 0,1 10% 6 0,1 10%
2 20 |--- 40 12 0,2 20% 18 0,3 30%
3 40 |--- 60 21 0,35 35% 39 0,65 65%
4 60 |--- 80 15 0,25 25% 54 0,9 90%
5 80|--- 100 6 0,1 10% 60 1 100%
75
UNIDADE III - DISTRIBUIÇÃO DE FREQUÊNCIAS 75
2. Dada a distribuição de frequência dos níveis de nicotina de fumantes,
Nicotina Frequência
0 |--- 100 110
100 |--- 100 120
200 |--- 100 140
300 |--- 100 70
400 |--- 100 50
Total
Frequên-
Nicotina Fr Frp (%) Fa far Fap(%)
cia
0 |--- 100 110 0,2245 22,45% 110 0,2245 22,45%
100 |--- 100 120 0,2449 24,49% 230 0,4694 46,94%
200 |--- 100 140 0,2857 28,57% 370 0,7551 75,51%
300 |--- 100 70 0,1429 14,29% 440 0,8980 89,80%
400 |--- 100 50 0,1020 10,20% 490 1,0000 100,00%
Total 490
Pressão Frequência Fr
70 |--- 100 0,1549
100 |--- 130 0,2535
130 |--- 160 0,4225
160 |--- 190 0,1267
190 |--- 210 0,0422
Total 71
Notas Fa
0 |--- 20 4
20 |--- 40 19
40 |--- 60 51
60 |--- 80 79
80 |--- 100 99
Repetindo essa operação até a última classe, obtemos todas as frequências
absolutas.
77
UNIDADE III - DISTRIBUIÇÃO DE FREQUÊNCIAS 77
3.5 CONSIDERAÇÕES DA UNIDADE III
A tabela simples, embora seja fácil a montagem, quando existe uma grande
quantidade de dados, tem sua estética comprometida, ou seja, a visualização dos
dados e a leitura da tabela ficam maçantes.
79
UNIDADE III - DISTRIBUIÇÃO DE FREQUÊNCIAS 79
4 UNIDADE IV
MEDIDAS DE POSIÇÃO
OB JET IVOS D A UN ID A D E
HAB ILIDADE S E C O MP E T Ê N C IA S
81 IV - MEDIDAS DE POSIÇÃO
UNIDADE 81
Uma medida de centro é um valor no centro ou meio do conjunto de dados,
em que existem diversas maneiras de determiná-lo, de modo que temos diferentes
definições de medidas de centro, incluindo a Moda (MO), mediana (MD) e Média (M).
4.1 MODA
2 6 8 8 8 8 10 10 11 12 18
Dada a tabela:
Notas Frequência
0 1
1 3
2 4
3 5
4 7
5 2
6 1
8 1
Total 24
A moda neste caso é a nota 4 (MO = 4), pois está relacionada à maior frequência,
que é 7.
Em que:
83 IV - MEDIDAS DE POSIÇÃO
UNIDADE 83
Dada a tabela, vamos calcular a moda.
4.2 MEDIANA
• Se o total de dados (N) for ímpar, a mediana está associada ao termo médio;
• Se o total de dados (N) for par, a mediana está associada à média dos
termos médios.
Dados: 2 5 9 15 21 26 31 44 50.
1º 2º 3º 4º 5º 6º 7º 8º 9º
Termo Termo Termo Termo Termo Termo Termo Termo Termo
2 5 9 15 21 26 31 44 50
Dados: 2 5 9 15 21 26 31 44 52.
10 + 1
n=10 (par) → Tm = = 5,5
2
85 IV - MEDIDAS DE POSIÇÃO
UNIDADE 85
O Termo Médio está entre o 5º e 6º termo, portanto a mediana é:
1º 2º 3º 4º 5º 6º 7º 8º 9º 10º
Termo Termo Termo Termo Termo Termo Termo Termo Termo Termo
2 5 9 15 21 26 31 44 50 52
A mediana é 23,5.
É obtida com auxílio da frequência acumulada. Para isso, basta inserir uma coluna
na tabela, calculando a frequência acumulada, e encontrar a posição do termo médio.
A mediana é 3.
Em que:
h – Amplitude da classe;
N – Total de dados.
87 IV - MEDIDAS DE POSIÇÃO
UNIDADE 87
Notas Frequência Frequência Acumulada
0 |--- 2 3 3
2 |--- 4 4 7
4 |--- 6 4 11
6 |--- 8 9 20
8 |--- 10 3 23
Total 23
Em que:
xi - os valores da variável;
Exemplo:
Notas Frequência f . xi
0 1 0x1=0
1 3 3x1=3
2 4 2x4=8
3 5 3 x 5 = 15
4 7 4 x 7 = 28
5 2 5 x 2 = 10
6 1 6x1=6
8 1 8x1=8
Total 24 78
89 IV - MEDIDAS DE POSIÇÃO
UNIDADE 89
A média é:
A média é
3, 5, 2, 6, 5, 9, 5, 2, 8, 6.
Idade Frequência
50 8
60 5
80 4
90 3
Salário (R$) F
0 |--- 1000 18
1000 |--- 2000 31
2000 |--- 3000 15
3000 |--- 4000 13
4000 |--- 5000 11
Em que:
Π é o produtório;
N é a quantidade de dados.
‘‘
91 IV - MEDIDAS DE POSIÇÃO
UNIDADE 91
Exemplo:
Exemplo:
Um aluno fez três provas e cada prova tem um peso para cálculo da média final.
De acordo com o quadro de notas, qual a média do aluno?
Vimos que a mediana separa os valores em dois grupos iguais. Porém, existem
demais modelos ligados à mediana, que não são medidas de tendência central. Essas
medidas chamaram de quartis, percentis e decis.
4.6.1 QUARTIS
Nesta série, dividimos os dados em quatro partes, sendo que cada parte fica
com 25% dos dados.
• O primeiro quartil (Q1) separa 25% dos dados à esquerda e 75% dos dados
para a direita;
• O segundo quartil (Q2) separa 50% dos dados à esquerda e 50% dos dados
para a direita (mediana);
• O terceiro quartil (Q3) separa 75% dos dados à esquerda e 25% dos dados
para a direita.
4.6.2 QUINTIS
Nesta série, dividimos os dados em cinco partes, sendo que cada parte fica com
20% dos dados.
• O primeiro quintil (K1) separa 20% dos dados à esquerda e 80% dos dados
para a direita;
• O segundo quintil (K2) separa 40% dos dados à esquerda e 60% dos dados
para a direita;
93 IV - MEDIDAS DE POSIÇÃO
UNIDADE 93
• O terceiro quintil (K3) separa 60% dos dados à esquerda e 40% dos dados
para a direita;
• O quarto quintil (K4) separa 80% dos dados à esquerda e 20% dos dados
para a direita.
4.6.3 DECIS
Nesta série, dividimos os dados em dez partes, sendo que cada parte fica com
10% dos dados.
• O primeiro decil (D1) separa 10% dos dados à esquerda e 90% dos dados
para a direita;
• O segundo decil (D2) separa 20% dos dados à esquerda e 80% dos dados
para a direita;
• O terceiro decil (D3) separa 30% dos dados à esquerda e 70% dos dados
para a direita;
• O quarto decil (D4) separa 40% dos dados à esquerda e 60% dos dados
para a direita.
• O quinto decil (D5) separa 50% dos dados à esquerda e 50% dos dados
para a direita (mediana).
E assim sucessivamente.
4.6.4 PERCENTIS
Nesta série, dividimos os dados em 100 partes, sendo que cada parte fica com
1% dos dados.
• O segundo percentil (P2) separa 2% dos dados à esquerda e 98% dos dados
para a direita
E assim sucessivamente.
Exemplo:
Dados: 2 5 9 15 21 26 31 44 50 52 55 56.
Q1=P25
Portanto Q1 = 9
K3=P60
Portanto K3 = 37,5
95 IV - MEDIDAS DE POSIÇÃO
UNIDADE 95
4.7 MEDIDAS DE VARIABILIDADE OU DISPERSÃO
Como vimos, a moda, a mediana e a média podem ser usadas para resumir em um
único número aquilo que é médio. Porém, quando empregada sozinha, qualquer medida
de tendência central fornece apenas uma visão parcial, e, desse modo, incompleta.
Para termos uma visão mais realista do que realmente acontece, precisamos
de outro parâmetro, que chamamos de medida de dispersão ou variabilidade. Dos
diversos parâmetros, iremos estudar o Desvio Padrão.
Em que:
x é o dado;
é o número de dados.
Vamos calcular o desvio padrão das notas dos alunos, conforme dados.
Notas: 1, 4, 4, 5, 5, 6, 8, 9, 9, 10.
Agora, iremos utilizar uma tabela de apoio para calcular a soma dos quadrados.
x
1 1 – 6,1 = - 5,1 26,01
4 4 – 6,1 = - 2,1 4,41
4 4 – 6,1 = - 2,1 4,41
5 5 – 6,1 = - 1,1 1,21
5 5 – 6,1 = - 1,1 1,21
6 6 – 6,1 = - 0,1 0,01
8 8 – 6,1 = 1,9 3,61
9 9 – 6,1 = 2,9 8,41
9 9 – 6,1 = 2,9 8,41
10 10 – 6,1 = 3,9 15,21
∑= 72,9
Sabendo que o número de dados é 10, temos que N-1 será igual a 9. Portanto,
o desvio será:
Lembrando que, sempre iremos trabalhar com no mínimo 4 casas após a vírgula.
97 IV - MEDIDAS DE POSIÇÃO
UNIDADE 97
Exemplo II
Vamos calcular o desvio padrão das notas dos alunos, conforme dados.
Notas: 1, 3, 5, 6, 6, 6, 6, 7, 7, 9.
x
1 1 – 5,6 = - 4,6 21,16
3 3 – 5,6 = - 2,6 6,76
5 5 – 5,6 = - 0,6 0,36
6 6 – 5,6 = 0,4 0,16
6 6 – 5,6 = 0,4 0,16
6 6 – 5,6 = 0,4 0,16
6 6 – 5,6 = 0,4 0,16
7 7 – 5,6 = 1,4 1,96
7 7 – 5,6 = 1,4 1,96
9 9 – 5,6 = 3,4 11,56
∑ = 44,4
Sabendo que o número de dados é 10, temos que N-1 será igual a 9. Portanto,
o desvio será:
Lembrando que, sempre iremos trabalhar com no mínimo 4 casas após a vírgula.
Em que:
CV é o coeficiente de variação em %;
Exemplo I
Desvio
Média CV (%)
Padrão
Sala I 6,1 2,8460 46,66%
Sala II 5,6 2,2211 39,66%
99 IV - MEDIDAS DE POSIÇÃO
UNIDADE 99
Agora, podemos entender com maior clareza, comprovada por números,
a conclusão que tivemos ao compararmos as duas salas. A variação do desvio em
função da média é menor na sala 2, ou seja, o aprendizado foi mais homogêneo
quando comparado com a sala 1.
C ONHEÇ A MAIS
• Consultório II: 20, 18, 20, 22, 21, 25, 22, 26, 30, 16.
Supondo que o QI médio dos homens seja de 100, com um desvio padrão de 10.
Com isso, podemos concluir que:
Para isso, utilizamos uma tabela em que os valores dos desvios já estão
calculados, com duas casas após a vírgula.
Z = 0,42 desvios =
Z = 0,84 desvios =
Z = 2,3 desvios =
Z = 2,4 desvios =
Z = 2,98 desvios =
• Aproximadamente, 84% dos homens têm QI até 110 —> (50% + 34%).
Exemplo:
P(Z ≤ 1,71)
Solução
Representando graficamente:
Exemplo
P(-1,32 ≤ Z ≤ 1,79)
Representando graficamente:
Portanto, a resposta é:
Em que é a média.
Utilizando o exemplo dos QI, em que a média de QI é 110 e o desvio é 10, vamos
imaginar que o pesquisador queira saber qual a probabilidade do QI ser inferior a 115.
P(z ≤ 115)
P(z=1,5) = 43,32%
C ONHEÇ A MAIS
Caro aluno, finalizamos a nossa quarta unidade. Com isso, peço para que assista
à teleaula para complementar os seus estudos, bem como participar do Ambiente
Virtual de Aprendizagem (AVA). E lembre-se: em caso de dúvida, procure o Fórum.
CRESPO, Antonio. Estatística Fácil. 18ª Edição. São Paulo: Saraiva, 2002.
LEVINE, David M. et. al. Estatística - Teoria e Aplicações. Rio de Janeiro: LTC, 2008.
UNIDADE I
3. Amostragem Estratificada
Área Funcionários
Almoxarifado 18
Montagem 55
Produção 82
Comercial 38
Marketing 7
Engenharia 22
Vendas 30
Serviços Gerais 48
Total 300
Vendas 30 30 x (50/300) = 5
Total 300
Agora, iremos definir a quantidade de funcionários por área, utilizando as regras de arredondamento
sem casas após a vírgula, pois número de funcionários é uma variável quantitativa discreta.
Almoxarifado 18 3,0 3
Montagem 55 9,2 9
Produção 82 13,7 14
Comercial 38 6,3 6
Marketing 7 1,2 1
Engenharia 22 3,7 4
Vendas 30 5,0 5
Total 300 50 50
1. a)
Utilização da regra I.
52
52% de 1038 = × 1038 = 539,76 ≅ 540 adultos
100
2. Verdadeiro.
A classe A e B, quando somadas, correspondem a 11% dos clientes, que geram uma receita, também
quando somadas, a 68% do total da receita.
3. Falso.
A classe D corresponde a maior quantidade de clientes, 48%, porém gera uma receita de, apenas, 11%.
UNIDADE III
1. b) 4
Justificativa: intervalo de classe é a diferença entre o limite superior e inferior da classe.
2. c) 0,075
Justificativa: a frequência relativa da 6a classe é a relação entre frequência absoluta da sexta classe e o
total de dados.
3. c) 37
Justificativa: a frequência acumulada da 5a classe é a soma da frequência acumulada da 4a classe com
a frequência absoluta da 5a classe.
UNIDADE IV
1. a) 40
A idade que mais acontece na contratação, é 40 anos.
2. a) 40
Como a quantidade de dados é par, temos a definição da mediana pelo termo médio.