Vicente Garibay Cancho - Noções de Estatística e Probabilidade

UNIVERSIDADE FEDERAL DE OURO PRET0
INSTITUTO DE CIÊNCIAS EXATAS E BIOLÓGICAS

DEPARTAMENTO DE MATEMÁTICA
Noções de Estatística e Probabilidade
Prof: Vicente Garibay Cancho
-Ouro Preto, 5 de Agosto de 2004-

Conteúdo
1 Introdução 2
1.1 Introdução e Denição de Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Populações e Amostras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Parâmetro e Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4 Etapas do Método de Análise Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4.1 Formulação do problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4.2 Planejamento do experimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4.3 Recolha dos dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4.4 Análise de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4.5 Estabelecimento de inferência estatística acerca da população . . . . . . . . . . 4
1.5 Somatório . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.5.1 Propriedades das somatórios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.6 Somatório double . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.7 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2 Análise Descritiva 8
2.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2 Classicação dos Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2.1 Dados qualitativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2.2 Dados quantitativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3 Organização e Representação de Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3.1 Organização de dados qualitativos . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3.2 Organização de dados quantitativos . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4 Medidas de Posição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4.1 Média . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4.2 Média geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
i
2.4.3 Média harmônica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.4.4 Mediana (M d) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.4.5 Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.4.6 Percentil e quartil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.5 Medidas de Dispersão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.5.1 Amplitude (A) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.5.2 Intervalo interquartil (d) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.5.3 Variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.5.4 Desvio padrão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.5.5 Coeciente de variabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.5.6 Medidas de variabilidade para dados agrupados . . . . . . . . . . . . . . . . . . 31
2.6 Boxplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.7 Exercícios Resolvidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.8 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3 Introdução à Probabilidade 48
3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.2 Conceitos Básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.2.1 Experimentos aleatórios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.2.2 Espaço amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.2.3 Eventos aleatórios e operações . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.3 Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.3.1 Denição clássica ou a priori . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.3.2 Denição frequentista ou a posteriori . . . . . . . . . . . . . . . . . . . . . . . . 52
3.3.3 Denição axiomática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.4 Probabilidade Condicional e Independência . . . . . . . . . . . . . . . . . . . . . . . . 55
3.5 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.6 Exercícios Resolvidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.7 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4 Variáveis Aleatórias 74
4.1 Introdução e Denição de Variável Aleatória . . . . . . . . . . . . . . . . . . . . . . . . 74
4.2 Variáveis Aleatórias Discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.2.1 Função de probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
ii
4.2.2 Função de distribuição acumulada de uma variável aleatória discreta . . . . . . 76
4.3 Variáveis Aleatórias Contínuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.3.1 Função de probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.3.2 Função de distribuição acumulada de uma variável aleatória contínua . . . . . . 80
4.4 Valor Esperado e Variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4.4.1 Propriedades do valor esperado e variância de uma variável aleatória . . . . . . 84
4.5 Principais Modelos Discretos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.5.1 Ensaio e distribuição de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.5.2 Distribuição Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.5.3 Distribuição Hipergeométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
4.5.4 Distribuição de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
4.6 Principais Modelos Contínuos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
4.6.1 Distribuição uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
4.6.2 Distribuição exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.6.3 Distribuição normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
4.7 Distribuições Amostrais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.7.1 Distribuição da média amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
4.7.2 Forma da distribuição da média amostral quando a população não é normal . . 109
4.7.3 Distribuição da diferença de duas médias amostrais . . . . . . . . . . . . . . . . 110
4.7.4 Distribuição amostral de uma proporção amostral . . . . . . . . . . . . . . . . . 111
4.8 Distribuições Utilizadas na Inferência Estatística . . . . . . . . . . . . . . . . . . . . . 113
4.8.1 Distribuição Qui-quadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
4.8.2 A distribuição t-Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.8.3 Distribuição F-Snedecor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
4.9 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
5 Inferência Estatística 133

5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
5.2 Estimação de Parâmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
5.2.1 Estimação pontual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
5.2.2 Estimação por intervalos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
5.3 Intervalos de conança para média de uma população (µ) . . . . . . . . . . . . . . . . 134
5.3.1 Quando variância σ 2 é conhecida . . . . . . . . . . . . . . . . . . . . . . . . . . 134
5.3.2 Quando a variância populacional σ 2 é desconhecida . . . . . . . . . . . . . . . . 138
iii
5.3.3 Para amostras grandes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
5.4 Intervalo de Conança para uma Proporção Populacional . . . . . . . . . . . . . . . . 139
5.4.1 Determinação do tamanho da amostra para estimação de uma proporção popu-
lacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
5.5 Intervalo de Conança para a Variância (σ 2 ) . . . . . . . . . . . . . . . . . . . . . . . . 142
5.6 Intervalo de Conança para a Diferença de Médias (µ1 − µ2 ) . . . . . . . . . . . . . . . 143
5.6.1 Quando as variâncias σ12 e σ22 são conhecidos . . . . . . . . . . . . . . . . . . . 143
5.6.2 Quando σ12 = σ22 = σ 2 , mas desconhecidos . . . . . . . . . . . . . . . . . . . . . 143
5.6.3 Quando as variâncias são desconhecidas e diferentes . . . . . . . . . . . . . . . 144
5.7 Intervalo de Conança para Razão de Variâncias . . . . . . . . . . . . . . . . . . . . . 145
5.8 Teste de Hipóteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
5.8.1 Conceitos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
5.8.2 Testes unilaterais e bilaterais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
5.8.3 Procedimento básico de teste de hipóteses . . . . . . . . . . . . . . . . . . . . . 155
5.9 Teste de Hipóteses para uma Média Populacional . . . . . . . . . . . . . . . . . . . . . 155
5.10 Teste de Hipóteses para uma Variância Populacional . . . . . . . . . . . . . . . . . . . 159
5.11 Teste de Hipótese para a Diferença de Médias Populacionais (µ1 − µ2 ) . . . . . . . . . 161
5.12 Teste de Hipóteses para a Igualdade de Duas Variâncis Populacionais . . . . . . . . . . 163
5.13 Teste Hipóteses para uma Proporção Populacional, para Amostras Grandes . . . . . . 166
5.14 Teste de Hipóteses de Igualdade de Duas Proporções Populacionais para Amostras Grandes167
5.15 Nível Descritivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
5.16 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
6 Análise de regressão e correlação 177

6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
6.2 Análise de Regressão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
6.3 Modelo de Regressão Linear Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
6.3.1 Estimação dos parâmetros do MRLS através do método de mínimos quadrados 180
6.3.2 Propriedades dos estimadores de mínimos quadrados de β0 e β1 e a estimação de
σ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184
6.3.3 Teste de hipóteses em regressão linear simples . . . . . . . . . . . . . . . . . . . 186
6.3.4 Intervalos de conança para β1 e β0 . . . . . . . . . . . . . . . . . . . . . . . . 190
6.3.5 Intervalo de conança para a resposta média . . . . . . . . . . . . . . . . . . . 191
6.3.6 Previsão de novas observações . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
6.3.7 Estudo da adequação do modelo de regressão . . . . . . . . . . . . . . . . . . . 194
iv
1
6.4 Análise de correlação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198

6.5 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
Referências Bibliográcas 205
Apêndice 206
A Tabelas Estatísticas 207

Capítulo 1
Introdução
1.1 Introdução e Denição de Estatística

O termo estatística é derivado da palavra "estado", em virtude de ser função tradicional dos governos
centrais levantar registros da população, tais como nascimentos, mortes, prossões e entre outras
atividades. Contar e medir esses fatos gera muitas classes de dados numéricos.
A estatística é concebida popularmente como colunas de cifras ou grácos, associadas geralmente com
médias. Esse conceito se aproxima muito da denição tradicional de estatística: coleção, organização,
resumo e apresentação de dados numéricos. Atualmente a estatística é uma ciência (ou método)
baseada na teoria de probabilidades, cujo objetivo principal é auxiliar-nos a tomar decisões ou tirar
conclusões em situações de incerteza, a partir de informações numéricas.
Como um procedimento de tomada de decisões, a estatística tem uma importância crescente em vários
campos, por exemplo, na produção industrial, na medicina, na nutrição e biologia, na economia, na
política, na psicologia, na análise de opinião pública e outras ciências sociais, na agricultura, na física,
na química e na engenharia.
1.2 Populações e Amostras

Uma população é o conjunto maior de indivíduos ou objetos cujo estudo nos interessa ou acerca dos
quais deseja ter informações. Os elementos desse conjunto se denominam dados ou observações. As
observações mensuráveis denominam-se dados quantitativos. Por exemplo, altura de estudantes, idade
de pessoas, a duração de uma lâmpada de luz ( vida útil das lâmpadas) etc. Porém, o sexo, o estado
civil das pessoas, a marca de cigarros são não mensuráveis e denominam-se dados qualitativos. Assim,
uma população estatística é o conjunto de observações quantitativas ou qualitativas. A população sendo
innita, portanto, é impossível ter uma informação completa sobre ela, a população sendo numerosa
talvez não seja possível estudar cada um dos seus elementos. Nesses casos, recorre-se à informação
proporcionada por uma parte nita da população chamada amostra. Em estatística é freqüente
trabalhar com as chamadas amostras aleatórias, nas quais todos os elementos da população têm a
mesma chance de serem escolhidos para compor a amostra. Uma amostra aleatória tem a propriedade
de reetir as características da população da qual foi sorteada. Alguns exemplos de população
• população: todos os eleitores do Brasil
2
CAPÍTULO 1. INTRODUÇÃO 3
amostra: 2000 eleitores entrevistados em uma pesquisa pelo IBOPE.

• população: todas peças produzidas por uma maquina em um dia.
amostra: 30 peças sorteadas ao acaso da produção de um dia maquina.

• população: um lote de artigos recebidas por uma empresa.
amostra: 20 artigos sorteados ao acaso para inspeção.
1.3 Parâmetro e Estatística

Um parâmetro é uma medida que descreve alguma característica de toda a população. Para deter-
minar seu valor, é necessário utilizar a informação da população(censo). Com isso, as decisões são
tomadas com certeza absoluta.
Uma estatística é uma medida que é obtida a partir dos dados amostrais e descreve alguma caracte-
rística de uma amostra. As decisões nesse caso, tomadas com um grau de incerteza.
1.4 Etapas do Método de Análise Estatística

A estatística, como ciência, tem como objetivo desenvolver procedimentos que permitam obter con-
clusões acerca dos parâmetros de uma população a partir das informações contida na amostra. Para
a aplicação objetiva e pragmática dos procedimentos e técnicas estatísticas é recomendável seguir as
seguintes etapas:
i) Formulação do problema e denição de um objetivo
ii) Planejamento do experimento.
iii) Recolha de dados.
iv) Análise de dados.
v) Estabelecimento de inferência estatística acerca da população (com base na informação amostral).
1.4.1 Formulação do problema

É evidente a necessidade de encarar essa etapa com máximo rigor pois dela dependerá a forma como
se desenvolverão todos os passos seguintes. Nesse sentido, deve-se determinar, nessa etapa, de forma
clara, quais são os problemas apresentados e quais são os objetivos da investigação.
1.4.2 Planejamento do experimento

Nessa etapa deve-se denir que informações devem ser e como são recolhidos( amostra ou censo ?). O
objetivo é obter um conjunto adequado de dados que permita alcançar os objetivos da pesquisa.
1.4.3 Recolha dos dados.

Nessa etapa se recolhem-se os dados de acordo com os planos estabelecidos na etapa anterior, tendo o
cuidado de controlar a qualidade da informação que se recolhe. O sucesso de uma pesquisa depende
muito da qualidade dos dados recolhidos.
1.4.4 Análise de dados

Nessa etapa classica-se a informação segundo suas características e se resume mediante a aplicação
de estimadores, para a análise posterior e interpretação e interpretação dos resultados.
1.4.5 Estabelecimento de inferência estatística acerca da população

Mediante a aplicação dos métodos de inferência estatística, as conclusões da pesquisa são generalizadas
à população de onde se obteve a informação
Talvez, a contribuição mais importante, dada pela estatística para a realização de inferências seja
justamente, a de permitir medir a conança nas conclusões relativas às populações, obtidas a partir da
informação contida na amostra. A gura 1.1, apresenta o esquema que sintetiza o método de análise
estatística.
Figura 1.1: Etapas do Método de Análise Estatística.
1.5 Somatório
Dado um conjunto de observações de alguma característica ou variável X , representada por X1 , X2 , . . . , Xn ,
a soma, X1 + X2 + · · · + Xn , é expressado, em forma abreviada como:
n
X
Xi .
i=1
Lê-se somatório de Xi , de i = 1 a i = n. O i denomina-se índice de adição da somatório.

1.5.1 Propriedades das somatórios

P
b
1. O número de termos da somatório, Xi é igual b − a + 1
i=a
P
n P
n
2. Se c é uma constante qualquer, então cXi = c Xi
i=1 i=1
3.
n
X n
X n
X n
X
(Xi + Yi − Zi ) = Xi + Yi − Zi
i=1 i=1 i=1 i=1
P
n P
n
4. Xi = Xj
i=1 j=1
1.6 Somatório double

Freqüentemente em estatística deseja-se conhecer a interação entre duas variáveis, assim por exemplo,
considere as 20 determinações de pressão sangüínea sistólica tomadas a um indivíduo que participa de
um programa idealizado para estudar fontes e intensidade de variação de leituras da pressão sangüínea.
A pressão do sangue foi medida por 4 médicos em cada uma das 5 visitas. Os dados são apresentados
na seguinte tabela 1.1 Com a nalidade de ordenar linearmente essas duas classicações, utiliza-se
Tabela 1.1: Leituras da pressão sanguínea sistólica de um individuo tomadas em 5 visitas por 4
observadores
Número de visitas número de médicos
1 2 3 4
1 118 112 116 118
2 120 116 112 112
3 114 120 112 117
4 118 116 118 116
5 118 108 122 116
um sistema de dois subíndices, isto é, usam-se um subíndice para o número de visitas e outro para o
número de médicos. Em tais situações é freqüente utilizar as letras i e j para indicar o número da
linha e o número da coluna, respectivamente. A cada observação denota-se por Xij que indica o dado
da i-ésima linha e j -ésima coluna. No conjunto de dados da tabela 1.1, X34 = 117, X32 = 120, por
exemplo.
Considere agora, os diversos tipos de soma, por exemplo, a soma dos elementos da terceira linha é
P4
X3j . (na linha 3, o primeiro subíndice é xo, o que muda é o segundo subíndice).
j=1
Para somar todos elementos da tabela 1.1, pode-se proceder de duas maneiras, primeiro somar os
elementos correspondentes a cada linha e logo determinar a soma dessas somas ou somar cada coluna
e logo somar essas somas.
por linhas temos:
4
X 4
X 4
X 4
X 4
X 5 X
X 4
X1j + X2j + X3j + X4j + X5j = Xij
j=1 j=1 j=1 j=1 j=1 i=1 j=1
por colunas temos:

5
X 5
X 5
X 5
X 4 X
X 5
Xi1 + Xi2 + Xi3 + Xi4 = Xij
1=1 i=1 i=1 i=1 j=1 i=1
No exemplo:
5 X
X 4
Xij = 464 + 460 + 463 + 468 + 464 = 2319.
i=1 j=1
4 X
X 5
Xij = 588 + 572 + 580 + 579 = 2319.
j=1 i=1
Em geral, suponha que a tabela 1.1, tenha n linhas e m colunas, então, soma de todos elementos da
tabela é:
Xn X m
Xij .
i=1 j=1
1.7 Exercícios
1. Vericar as seguintes expressões:
P
n P
n
1 P
n
(a) [Xi (Xi + X̄) + (Xi − X̄)2 ] = 2 Xj2 , se X̄ = n Xi .
i=1 j=1 i=1
P
n
1 P
n
(b) (Xi − X̄) = 0, se X̄ = n Xi .
i=1 i=1
Pn P
n
1 P
n
(c) Xi (Xi − X̄) = (Xi − X̄)2 . se X̄ = n Xi .
i=1 i=1 i=1
Pn Pn
1 P
n
1 P
n
(d) (Xi − X̄)(Yj − Ȳ )2 = 0, se X̄ = n Xi e Ȳ = n Yi
i=1 j=1 i=1 i=1
P
n P
n
1 P
n
(e) [Xi (Xi + X̄) − X̄ 2 ] = Xi2 , se X̄ = n Xi .
i=1 i=1 i=1
2. Na seguinte tabela tem-se a quantidade em toneladas de açúcar transportada desde os depósitos

de uma distribuidora aos supermercados de Belo Horizonte.
Depósito Supermercados
1 2 3
1 5 6 8
2 4 4 2
3 6 4 9
4 5 7 8
5 4 3 2
Se Xij : é quantidade em toneladas de açúcar transportada desde o depósito i aos supermercados

j . i = 1, 2, 3, 4. e j = 1, 2, 3 Representar em termos de somatório simplicada e determine o
valor:
(a) Da quantidade total de açúcar transportada aos supermercados.

(b) Da quantidade total de açúcar transportada desde os depósitos 2 e 4 aos supermercados 1
e 3.
(c) Se os preços (em reais) por tonelada de açúcar nos supermercados 1, 2 e 3 são respectiva-
mente: P1 = 450, 0, P2 = 500, 0 e P3 = 510, 0. Determine o ingresso da distribuidora para
transportar aos supermercados 2 e 3.
(a) Suponha além da informação dada em (c) que os custos de transporte por tonelada desde
os depósitos 1,2, 3, 4 e 5 são respectivamente: C1 = 1, 5, C2 = 0, 90, C3 = 1, 2, C4 = 1, 5 e
C5 = 0, 95. Determine o lucro nos supermercados 1 e 3.
Capítulo 2
Análise Descritiva
2.1 Introdução
O objetivo da estatística descritiva, já identicado anteriormente, é o de representar de uma forma
compreensível a informação contida nos dados. A necessidade de um esforço de classicação desses
dados e de síntese da informação neles contida resulta da incapacidade que, normalmente, a mente
humana tem de assimilar e interpretar conjuntos signicativos de dados que sejam apresentados de
uma forma desorganizada.
A forma de representar a informação contida numa amostra ou numa população depende antes de
tudo, da escala na qual são expressos os dados que a integram. Por essa razão, antes de analisar as
técnicas de estatística descritiva mais freqüentemente utilizadas, é apresentado uma classicação dos
dados (ou variáveis).
2.2 Classicação dos Dados

Os dados podem ser classicados em qualitativos e quantitativos
2.2.1 Dados qualitativos

São aqueles dados cujos resultados não podem ser expressos em forma numérica. Esses tipos de dados
classicam-se em:
Qualitativo ordinal
Para esses tipos de dados é possível estabelecer uma relação de ordem entre as possíveis categorias,
por exemplo, grau de instrução de funcionários de uma empresa (1 0 grau, 20 grau, superior), opinião
de um grupo de pessoas sobre um programa de TV( ruim, regular, bom, muito bom).
8
CAPÍTULO 2. ANÁLISE DESCRITIVA 9
Qualitativo nominal
Nesses tipos de dados não há uma relação de ordem entre as possíveis categorias. Por exemplo: cor de
preferência, lugar de procedência dos estudantes de uma universidade.
2.2.2 Dados quantitativos

São aqueles cujos resultados são expressos em forma numérica e são de dois tipos:
Quantitativos discretos
São dados que tem um número nito ou innito enumerável de possíveis valores. Usualmente são
associados a processos de contagem, onde o resultado é representado mediante um número inteiro. Por
exemplo; número de alunos por sala de aula, número de lhos por família na cidade de Ouro Preto,
etc.
Quantitativos contínuos
São dados que têm um número innito não enumerável de possíveis valores e são representados por
números de um intervalo real. Por exemplo: Altura do aluno da turma 21, peso de crianças recém
nascidas num hospital universitário etc.
2.3 Organização e Representação de Dados

2.3.1 Organização de dados qualitativos
Se os dados são qualitativos são simplesmente, agrupados segundo a freqüência e a proporção ou
porcentagem de cada categoria e representados gracamente mediante barras horizontais ou verticais
ou diagramas circulares (ou gráco de pizza) .
Exemplo 2.3.1 A 40 alunos que foram reprovados em alguma disciplina do semestre anterior. per-
guntado em quais disciplinas tinham sido reprovados e as respostas foram as seguintes:
Cálculo II Cálculo II Cálculo I Álgebra Estatística Estatística Cálculo II
Biologia Química Cálculo II Estatística Cálculo I Estatística Álgebra
Álgebra Estatística Cálculo II Álgebra Álgebra Cálculo I Cálculo I
Estatística Cálculo II Cálculo II Cálculo II Estatística Cálculo I Estatística
Genética Mecânica Economia Estatística Cálculo I Bioquimica Cálculo II
Cálculo I Fisica Cálculo II Quimica Física
A freqüência absoluta são o resultado de um processo de contagem das respostas obtidas entre os
40 alunos consultados. Assim, por exemplo, 10 alunos desaprovaram na disciplina de Cálculo II, 7
desaprovaram em cálculo I, etc. Observa-se que a soma das freqüências absolutas é igual ao número
total de alunos consultados ou também chamada de tamanho da amostra a qual será denotado por n.
P
k
Suponha que um conjunto de dados qualitativos tenha k categorias (no exemplo k = 5) então fi = n
i=1
Considerando o número total de alunos consultados (n = 40 alunos), as freqüências relativas são

obtidos dividindo cada freqüência absoluta por n, isto é, fri = fni . Por exemplo, para o caso cálculo
II, sua freqüência relativa são obtidas da seguinte forma: fr1 = f1 /40 = 10/40 = 0, 25. Para cálculo I,
fr2 = f2 /40 = 0, 175 e assim por diante.
Similarmente, as freqüências percentuais são obtidas dividindo cada freqüência absoluta por 40 e
multiplicando por 100. Também é possível obter multiplicando cada freqüência relativa por 100, isto
é, pi = fni × 100 = fri × 100. Por exemplo, para cálculo II, p1 = 40
10
× 100 = 25% ou p1 = 100 × fr1 =
f2 7
100 × 0, 25 = 25% a freqüência percentual para cálculo I será: p2 = 40 × 100 = 40 × 100 = 17, 5%, etc.
As freqüências relativas e percentuais têm uma interpretação similar e podem ser usadas indistinta-
mente, por exemplo, para o caso de cálculo II, a freqüência relativa ou percentual indica que 25%
dos alunos consultados desaprovaram em cálculo II. De maneira similar, são interpretados as outras
freqüências relativas (ou percentuais). A vantagem do uso desse tipo de freqüências é que seu valor
da informação sobre a incidência de uma resposta, sem requer do total de alunos consultados. A
distribuição de freqüências do exemplo 2.3.1, é apresentado na tabela 2.1.
Tabela 2.1: Distribuição de alunos desaprovados numa disciplina no semestre 2003/1

Freqüência Freqüência Freqüência
Disciplina Absoluta Relativa Porcentual
fi fri pi
Cálculo II 10 0,250 25,0
Cálculo I 7 0,175 17,5
Álgebra 5 0,125 12,5
Estatística 9 0,225 22,5
Outras 9 0,225 22,5
Total 40 1,000 100
Para uma análise mais simples da informação é conveniente a representação dos dados mediante grá-
cos. Como foi dito anteriormente, existe uma grande diversidade de representações grácas, sendo
as mais simples e freqüentes os grácos de barras (horizontais e verticais) e os grácos circulares (ou
"pizza"). Para a elaboração do gráco de barras é construído um sistema de eixos cartesianos XY . No
eixo vertical se forma uma escala para representar a magnitude de algum tipo de freqüência; em geral,
utilizam-se as freqüências percentuais. No eixo horizontal, uma escala para representar as respostas
obtidas mediante barras verticais. A amplitude de cada barra é a mesma e é deixando um espaço
entre cada barra. A altura de cada barra deve ser igual à magnitude da freqüência correspondente a
cada um dos dados e que é representada no eixo vertical. É conveniente colocar rótulos aos eixos que
permitam entender melhor a informação. O gráco de barras verticais para os dados do exemplo 2.3.1,
é apresentado na gura 2.1.
Para a elaboração de grácos circulares devem ser calculados os ângulos de cada região circular que
são associados a cada resposta. Para isto, multiplica-se cada freqüência relativa por 360. Por exemplo,
para o caso de cálculo II, o ângulo da região circular utilizada para representar essa resposta é α1 =
360fr1 = 360×0, 25 = 90o . Uma vez determinados os ângulos das regiões o gráco é construído partindo
do eixo de referência, usualmente o eixo associado 0o ou 90o e representando as regiões circulares uma
a uma. Para uma adequada identicação é conveniente colocar um rótulo de identicação ao lado de
cada região e a freqüência que correspondente a cada resposta. O gráco circular para os dados do
exemplo 2.3.1 é apresentado na gura 2.2.
Figura 2.1: Distribuição de alunos desaprovados no semestre 2003/1.
Podem ser utilizados, também, efeitos tridimensionais para obter uma melhor apresentação. Por
exemplo, o gráco anterior pode ser mostrado como:
Para organizar e representar dados qualitativos ordinais, geralmente, ordena-se as categorias dos
dados em ordem de maior a menor hierarquia.
2.3.2 Organização de dados quantitativos

Quantitativos discretos
Para dados quantitativos discretos cujo número de resultados possíveis não é grande ( não é maior que
12 ou 15), a informação pode ser classicada e representada diretamente sem perda de informação da
mesma.
Nesses casos, primeiro ordena-se a informação segundo sua magnitude e, em seguida obtém-se as
freqüências absolutas associadas a cada valor observado. As freqüências relativas e percentuais são
obtidas de forma similar à descrita na seção anterior.
Para representar, gracamente um conjunto de dados quantitativos discretos é construído um sistema
de eixos cartesianos XY . No eixo vertical, utiliza-se uma escala para representar a magnitude de algum
tipo de freqüência; em geral consideram-se as freqüências percentuais. No eixo horizontal, utiliza-se
uma escala para representar os valores observados. Logo, para cada um dos dados na escala horizontal
levanta-se um segmento de reta vertical cuja magnitude é determinada pela freqüência correspondente.
Exemplo 2.3.2 Com a nalidade de estudar o número de emergências que chegam a um hospital por
dia, o administrador de um hospital selecionou uma amostra 50 dias, ao acaso, dos arquivos de um
hospital. Os dados são os seguintes:
Figura 2.2: Distribuição de alunos desaprovados no semestre 2003/1
2 2 1 1 3 4 6 7 0 0 0 1 1 1 2 2 1 0
0 0 0 5 5 1 2 2 1 1 1 2 1 3 4 4 4 1
2 1 1 1 2 2 2 4 5 0 0 0 2 1
Ao ordenar os dados em ordem crescente tem-se:

0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2
2 2 3 3 4 4 4 4 4 5 5 5 6 7
Tabela 2.2: Distribuição de freqüências do número de emergências atendidas pelo hospital
Número de Frequência Freqüência Freqüência

emergências Absoluta Relativa Percentual
Xi fi fri pi
0 10 0,20 20
1 16 0,32 32
2 12 0,24 24
3 2 0,04 4
4 5 0,10 10
5 3 0,06 6
6 1 0,02 2
7 1 0,02 2
Total 50 1,00 100
De maneira similar ao exemplo 2.3.1, as freqüências absolutas são o resultado de um processo de

contagem das respostas obtidas nos 50 dias observados. Assim, por exemplo, em 12 dias (em cada um
dos 12 dias ) observou-se que o número de emergências atendidas pelo hospital foi igual 2, que em dois
Figura 2.3: Distribuição de alunos desaprovados no semestre 2003/1
dias observou-se que o número de emergências foi igual a 3, etc. Na tabela 2.2, tem-se a correspondente
distribuição de freqüências. E, na gura 2.4, é mostrada a representação gráca dos dados do exemplo
2.3.2.
Quantitativos contínuos
Quando os dados em estudo são do tipo quantitativo contínuo, que assume muitos valores distintos,
é conveniente agrupá-los em intervalos de classe. Mesmo correndo o risco de perder algum detalhe
manifestado na ordenação de valores individuais, há vantagem em resumir os dados originais em uma
distribuição de freqüência, onde os valores observados não mais aparecerão individualmente, mas agru-
pados em classe.
Quando se considera intervalos de classe de igual amplitude, o procedimento é o seguinte:
1. Deve-se estabelecer o número de intervalos de classe ( k ) que se vai utilizar. Tal número é
recomendado que esteja entre 5 e 15. Não existe uma regra xa para determinar o número ótimo
de intervalos. O critério do pesquisador tem um papel importante na determinação do mesmo.
Como referência, pode-se utilizar a regra de Surges, que indica que o número de intervalos de
classe é dado por:
k = 1 + 3, 3 log10 (n),
onde n é o número de observações (ou tamanho da amostra). [O valor k deve ser arredondado
ao número inteiro mais próximo].
2. Determinar o comprimento ou amplitude (A) dos dados, isto é,
A = Xmax − Xmin ,
onde Xmax é o valor da observação de maior magnitude e Xmin a observação de menor magnitude.
Figura 2.4: Distribuição do número de emergências atendidas pelo hospital
3. Determinar a amplitude de cada intervalo de classe ( h):

A
h=
k
quando o quociente A/k não é exato o valor de h deve ser arredondado ao valor superior mais
próximo, segundo o número de cifras decimais dos dados.
4. Gerar os limites dos intervalos. Para o primeiro intervalo considere como limite inferior o valor
da observação de menor magnitude, isto é, LI1 = Xmin .
Os limites inferiores dos outros intervalos são obtidos da seguinte forma: LIi = LIi−1 +h, para i =
2, 3, . . . , k . Os limites superiores dos intervalos são obtidos: LSi = LIi+1 , para i = 1, 2, . . . , k − 1
ou LSi = LSi−1 + h , para i = 2, 3, . . . , k .
5. Cada um dos intervalos é da forma [LIi ; LSi ), isto é, fechado na esquerda e aberto na direita.
6. Obter as marcas de classe ou ponto médio ( Xi0 ) que são valores representativos da informação
contida num intervalo. Numericamente são obtido como a média dos limites inferior e superior
do intervalo. Isto é,
LIi + LSi h
Xi0 = = LIi + , i = 1, . . . , k
2 2
7. Uma vez denidos os intervalos de classe, o passo seguinte consiste em classicar cada observa-
ção em um dos ditos intervalos e determinar as freqüências absolutas, isto é, o número de
observações que estão dentro de cada intervalo de classe. A partir dessas freqüências, as freqüên-
cias relativas e percentuais correspondentes a cada intervalo de classe são obtidos. Além disso,
para o caso de dados quantitativos contínuos pode-se determinar a densidade de freqüências ou
simplesmente densidade ( di ) denido pelo quociente das freqüências relativas (ou freqüências
percentual ) e amplitude de intervalo de classe, isto faz com que a área total do histograma seja
igual a um (ou 100%).
8. Adicionalmente, quando se dispõe de dados quantitativos contínuos é conveniente obter as freqüên-
cias acumuladas procedendo da seguinte forma:
(a) Freqüência acumulada absoluta ( Fi ):

i
X
Fi = fj = f1 + f2 + · · · + fi = Fi−1 + fi ;
j=1
(b) Freqüência acumulada relativa ( Fri ):

i
X
Fri = frj = fr1 + fr2 + · · · + fri = Fri−1 + fri ;
j=1
(c) Freqüência acumulada percentual ( Pi ):

i
X
Pi = frj = p1 + p2 + · · · + pi = Pi−1 + pi ;
j=1
(d) Densidade acumulada ( Di ):

i
X
Di = dj = d1 + d2 + · · · + di = Di−1 + di ;
j=1
É necessário levar em conta que as freqüências estão associadas aos intervalos e não às observações,
como foi considerado anteriormente para dados qualitativos e quantitativos discretos.
Para representar gracamente, a informação pode ser usada qualquer tipo de freqüência. Em especial,
recomenda-se utilizar a freqüência relativa ou percentual que permite analisar a informação indepen-
dente do número de observações. Além disso, é possível comparar os resultados com os obtidos em
estudos similares sempre que os intervalos de classe forem iguais, ou, ao menos, similares.
O procedimento descrito anteriormente pode ser aplicado também quando se tem dados quantitativos
discretos cujo número de resultados possíveis é grande ( maior que 20 ) e sua representação gráca,
através dos procedimentos descritos na seção anterior não é apropriada.
Exemplo 2.3.3 Os seguintes dados representam a quantidade de hemoglobina (Hb) em g/dl encon-
trados em 40 animais expostos a um produto tóxico.
5,2 10,2 7,0 7,1 10,2 8,3 9,4 9,2 5,4 8,1
6,5 7,1 6,6 7,8 6,8 7,2 8,4 9,6 8,7 7,3
8,5 5,7 6,4 10,1 8,2 9,0 7,8 8,2 7,8 6,6
5,3 6,2 9,1 8,6 7,0 7,7 8,3 7,5 9,8 7,5
Para obter a tabela de distribuição de freqüências, procede-se da seguinte maneira:

n = 40, k = 1 + 3, 3 log10 (40) = 6, 2868 ≈ 6
A = Xmax − Xmin = 10, 2 − 5, 2 = 5, 0,
h= A 5
k = 6 = 0, 8333 ≈ 0, 9 (arredondamento por excesso a uma decimal, ou seja, à mesma
precisão dos dados),
LI1 = Xmin = 5, 2
LI1 +LS1
LI2 = LI1 + h = 5, 2 + 0, 9 = 6, 1 LS1 = LI2 = 6, 1 X10 = 2 = 5, 65
LI1 +LS1
LI3 = LI2 + h = 6, 1 + 0, 9 = 7, 0 LS2 = LI3 = 7, 0 X20 = 2 = 6, 55
De maneira similar obtém-se os outros limites de classe e suas marcas de classe.

Construídos os intervalos de classe, classicam-se as observações para serem obtidas as freqüências
absolutas, relativas e densidades de forma similar ao indicado acima.
Para obter as freqüências acumuladas procede-se da seguinte forma:
F1 = f1 = 4 Fr1 = F1 /40 = 0, 10 P1 = 100Fr1 = 10
F2 = f1 + f2 = 4 + 6 = 10 Fr2 = F2 /40 = 0, 25 P2 = 100Fr2 = 25
De forma similar procede-se com os outros intervalos. Com os resultados anteriores é obtida a tabela
2.3, que contem a distribuição de freqüências para esse exemplo.
Tabela 2.3: Distribuição da quantidade de hemoglobina de 40 animais
Quantidade de Hb Xi0 fi fri pi di = phi Fi Fri Pi

5, 2 ` 6, 1 5,65 4 0,100 10,0 11,11 4 0,100 10,0
6, 1 ` 7, 0 6,55 6 0,150 15,0 16,67 10 0,25 25,0
7, 0 ` 7, 9 7,45 12 0,300 30,0 33,33 22 0,550 55,0
7, 9 ` 8, 8 8,35 9 0,225 22,5 25,00 31 0,775 77,5
8, 8 ` 9, 7 9,25 5 0,125 12,5 13,89 36 0,900 90,0
9, 7 ` 10, 6 10,15 4 0,100 10,0 11,11 40 1,000 100,0
Total 40 1,00 100,0
Histograma de freqüência
Primeiramente é construído um sistema de eixos cartesianos XY. No eixo vertical, é usada uma escala
para representar a magnitude do tipo freqüência. Em geral, utilizam-se as freqüências relativas ou
percentuais ou densidades. No eixo horizontal é usada uma escala para representar os intervalo de
classe. Logo, para cada intervalo de classe na escala horizontal é construído um retângulo cuja altura
é determinada pela freqüência usando. Por exemplo, com as freqüências percentuais da tabela 2.3, é
obtida a seguinte representação gráca:
Polígono de freqüências
No sistema de eixos cartesianos XY , no eixo vertical é usada uma escala para representar a magnitude
de algum tipo de freqüência. Em geral, consideram-se as freqüências relativas ou percentuais. No
eixo horizontal é usada uma escala para os valores da variável em estudo. Logo, plotam-se os pontos
(Xi0 , fri ), i = 1, . . . , k. É considerando, também, dois intervalos adicionais: um anterior ao primeiro
e outro posterior ao último intervalo de classe, cada um deles com uma freqüência zero. Por último,
os pontos plotados são unidos por uma linha reta obtendo, assim, um polígono de freqüências. Por
exemplo, com as freqüências percentuais da tabela 2.3 tem-se:
Polígono de freqüências acumuladas (ogiva)
No sistema de eixos cartesianos XY , no eixo vertical é usada uma escala para representar a freqüência
acumulada. Em geral, consideram-se as freqüências relativas ou percentuais. No eixo horizontal é usada
Figura 2.5: Distribuição da quantidade de hemoglobina de animais expostos a um produto tóxico
uma escala para os valores da variável em estudo. Logo, plotam-se os pontos (LSi , Fri ), i = 1, . . . , k. É
considerando, adicionalmente, o ponto (LI1 , Fr0 ), com Fr0 = 0. Por último, unem-se os pontos plotados
obtendo um polígono de freqüências acumuladas (ogiva). Por exemplo, com as freqüências percentuais
da tabela 2.3, tem-se a ogiva mostrada na gura 2.7
2.4 Medidas de Posição

Na seção anterior, foi apresentada a forma de representar a informação contida em conjunto de dados
populacionais ou amostrais mediante tabelas de freqüências e grácos. Essa informação constitui a
informação básica do problema em estudo. Mas, é conveniente apresentar, além dos dados, medidas
que mostrem a informação de maneira resumida. As medidas de posição ou tendência central, denidas
nesta seção, são usadas para indicar um valor que tende a resumir ou representar melhor um conjunto
de dados. As três medidas mais usadas são a média, a mediana e a moda.
2.4.1 Média
A média de um conjunto de observações é denida como a soma de todas as observações dividida pelo
número de observações. Isto é,
N
1 X
Média populacional : µ = Xi (2.1)
N
i=1
Xn
1
Média Amostral : X̄ = Xi (2.2)
n
i=1
onde
Xi : Valor da i-ésima observação da variável em estudo.
Figura 2.6: Polígono de freqüências para a quantidade de hemoglobina de animais expostos a um

produto tóxico.
N : Tamanho da população.
n: Tamanho da amostra.
Essa medida de posição apresenta a desvantagem de ser fortemente inuenciada por valores discrepan-
tes, isto é, valores muito pequenos ou muito elevados. Portanto, nesse caso essa medida já não será
um valor representativo do conjunto de dados.
Exemplo 2.4.1 Sejam as notas de quatro provas de um estudante: X1 = 8.3, X2 = 9.4, X3 =

9.5, X4 = 8, 6. Determinar a nota média.
n
1X 8, 3 + 9, 4 + 9, 5 + 8.6
X̄ = Xi = = 8, 95
4 4
i=1
Propriedades
1. A soma dos desvios das observações em relação à média é igual a zero. Isto é,
n
X
(Xi − X̄) = 0
i=1
2. A soma de quadrados dos desvios das observações em relação à média é mínima, ou seja,
n
X
(Xi − X̄)2 , é um valor minímo.
i=1
Isto é,
n
X n
X
2
(Xi − X̄) ≤ (Xi − k)2 , k ∈ R.
i=1 i=1
Figura 2.7: Polígono de freqüências acumuladas (ogiva) para a quantidade de hemoglobina de animais
expostos a um produto tóxico
3. Para k 6= 0 ∈ R.
• Se Yi = Xi ± k, então Ȳ = X̄ ± k,
• Se Yi = kXi , então Ȳ = k X̄ ,
Xi X̄
• Se Yi = k , então Ȳ = k,
A demonstração dessas propriedades ca com exercício paro o leitor.

Quando tem-se dados quantitativos contínuos agrupados em uma tabela de distribuição de freqüên-
cias (TDF), a média pode ser calculada da seguinte forma:
k
1 X
Média populacional : µ = fi Xi0 (2.3)
N
i=1
Xk k
X
1
Média Amostral : X̄ = fi Xi0 = fri Xi0 (2.4)
n
i=1 i=1
onde
Xi0 : O i-ésima marca de classe da variável em estudo.
fi : Freqüência absoluta do intervalo i.
fri :Freqüência relativa do intervalo i.
k : Número de intervalos de classe.
Para dados quantitativos discretos em uma TDF a média é:

k k
1 X X
Média populacional : µ = fi Xi = fri Xi (2.5)
N
i=1 i=1
Xk Xk
1
Média Amostral : X̄ = fi Xi = fri Xi (2.6)
n
i=1 i=1
onde
Xi : Valor observado i da variável em estudo.
fi : Freqüência absoluta do valor observado i
fri :Freqüência relativa do valor observado i.
k : Número de valores da variável em estudo.
Exemplo 2.4.2 Considere os dados do exemplo 2.3.3, que representam a quantidade de hemoglobina
(Hb) em g/dl encontrados em 40 animais expostos a um produto tóxico.
5,2 10,2 7,0 7,1 10,2 8,3 9,4 9,2 5,4 8,1
6,5 7,1 6,6 7,8 6,8 7,2 8,4 9,6 8,7 7,3
8,5 5,7 6,4 10,1 8,2 9,0 7,8 8,2 7,8 6,6
5,3 6,2 9,1 8,6 7,0 7,7 8,3 7,5 9,8 7,5
(a) Achar a quantidade média de hemoglobina.
P
n
Xi
i=1
X̄ =
n
5, 2 + 10, 2 + · · · + 7, 5 311.4
= = = 7, 785 g/dl.
40 40
Logo, a quantidade média de hemoglobina em animais expostos a um produto tóxico é 7,785 g/dl
(b) Obtenha a tabela de distribuição de freqüências, e, em seguida, obtenha a quantidade média de

hemoglobina dos 40 animais.
No exemplo 2.3.3 da seção anterior gerou-se a seguinte tabela de distribuição de freqüências da
quantidade de hemoglobina em animais expostos a certo tóxico.
Quantidade de Hb Xi0 fi fri Fi Fri
5, 2 ` 6, 1 5,65 4 0,100 4 0,100
6, 1 ` 7, 0 6,55 6 0,150 10 0,25
7, 0 ` 7, 9 7,45 12 0,300 22 0,550
7, 9 ` 8, 8 8,35 9 0,225 31 0,775
8, 8 ` 9, 7 9,25 5 0,125 36 0,900
9, 7 ` 10, 6 10,15 4 0,100 40 1,000
Total 40 1,00
Aqui, k = 6 e n = 40. Dessa forma,

P
n
Xi0 fi
i=1
X̄ =
n
(5, 65)(4) + (6, 55)(6) + · · · + (10, 15)(4) 313.3
= = = 7, 8325 g/dl.
40 40
Os resultados anteriores (obtidos em (a) e (b)) não são iguais. Isto porque em (b) foram usadas as
marcas de classe como valores representativos das observações. Quando tem-se dados agrupados em
TDF, a média é obtida assumindo que a marca de classe é igual à média das observações classicadas
em cada intervalo. Obviamente, na prática, isto ocorre raras vezes e, portanto, o valor obtido é uma
aproximação do valor da média obtida como a soma de cada uma das observações.
Média ponderada
A média ponderada de um conjunto de observações X1 , . . . , Xn , com pesos ou ponderações W1 , . . . , Wn ,

é denida como:
Pn
Wi Xi
i=1 W1 X1 + · · · + Wn Xn
X̄p = n =
P W1 + · · · + Wn
Wi
i=1
Exemplo 2.4.3 Suponha que os custos de produção e as quantidades produzidas por três liais A, B
e C de uma empresa são:
Custo de produção (Xi ) Quantidade produzida (Wi )
Filial unidades monetárias (u.m) (número de unidades)
A 1,20 500
B 1,60 200
C 1,05 900
O custo médio de produção por unidade produzida para a empresa em seu conjunto é:
(500)(1, 20) + (200)(1, 60) + (900)(1, 05) 1865
X̄p = = = 1, 1656 (u.m)
500 + 200 + 900 1600
Esse valor indica que o custo médio de produção por artigo para a empresa é de 1,1656 unidades
monetárias por cada unidade produzida. Se, ao invés dessa média, fosse calculada a média aritmética,
1, 20 + 1, 60 + 1, 05 3, 85
X̄ = = = 1, 2833 (u.m)
3 3
Esse valor indicaria que o custo de produção por artigo das liais é de 1,2833 unidades monetárias,
supondo de que as três liais produzem a mesma quantidade de artigos. Para nosso exemplo essa
suposição não é verdadeira.
2.4.2 Média geométrica

A média geométrica de um conjunto de n observações positivas X1 , . . . , Xn dene-se como:
X̄G = (X1 × X2 × · · · × Xn )1/n
Essa média é usada na elaboração de números índices e para o cálculo de taxa média de variação.
Exemplo 2.4.4 Suponha que uma fábrica teve um incremento em sua produção de: 15% no ano
1998, 10% em 1999 e 16% em 2001. Achar o crescimento médio anual.
X̄G = ((1, 15)(1, 10)(1, 16))1/3 = 1, 136361.

Esse resultado indica que a produção é incrementada anualmente a um ritmo médio de 13,6461%.
2.4.3 Média harmônica

A média harmônica de n observações X1 , . . . , Xn é denida como:
n
X̄H = 1 1 .
X1 + ··· + Xn
Essa média tem a particularidade de que os valores discrepantes a afetam em menor intensidade as
outras médias.
Exemplo 2.4.5 Suponha que um automóvel percorre os primeiros 10 quilômetros a 30 km/h e os

outros 10 km a 60 km/h, a primeira vista pareceria que a velocidade média de 30 e 60 km/h é de 45
km/h. Mas esse tipo de medida é denido na Física como a distância total percorrida dividida pelo
tempo total empregado para percorre-la. Como a distância total é 20 quilômetros e tempo total é 10 10
30 + 60
hora. Daí tem-se que a velocidade média é:
20 120
V̄ = 10 10 = 3 = 40 km/h
30 + 60
É interessante observar que essa média pode ser calculada como uma média harmônica de 30 e 60 ,
isto é:
2
X̄H = 1 1 = 40 km/h.
30 + 60
2.4.4 Mediana (M d)
É uma medida de posição que divide o conjunto de observações, previamente ordenadas de acordo a
sua magnitude (crescente ou decrescente), em dois grupos de tal modo que 50% das observações são
menores que a mediana e os outros 50% são maiores.
Suponha que Y1 , Y2 , . . . , Yn seja um conjunto de n observações ordenadas em forma crescente, isto é,
Y1 ≤ Y2 ≤ · · · ≤ Yn . A mediana denida como
(
Y n+1 , se n impar
Md = 2
Y n +Y n +1
2
2
2
, se n par
Exemplo 2.4.6 Consideram-se duas amostras constituídas pelos dados apresentados a seguir e já
ordenadas:
Y 4 +Y 4 +1
Y2 +Y3
a)Y1 = 2, 0,Y2 = 3, 2, Y3 = 4, 5, Y4 = 4, 6 n = 4; é par então M d = 2
2
2
= 2 = 4, 5
b)Y1 = 2,Y2 = 3, Y3 = 5, Y4 = 6, Y5 = 10; n = 5 é ímpar então M d = Y 5+1 = Y3 = 5.
2
Propriedades
1. A soma dos desvios das observações em relação à mediana é mínima, ou seja,

n
X
|Xi − M d|, é mínima
i=1
Isto é,
n
X n
X
|Xi − M d| ≤ |Xi − h|, h ∈ R.
i=1 i=1
2. Para k 6= 0 ∈ R.
• Se Yi = Xi ± k, então M dY = M dX ± k,
• Se Yi = kXi , então M dY = kM dX ,
Xi M dX
• Se Yi = k , então M dY = k ,
A mediana para dados quantitativos contínuos agrupados em TDF é obtida da seguinte forma:
· ¸
n/2 − Fi−1
M d = LIi + h
fi
onde
i: é classe mediana, posição (n + 1)/2.
a classe mediana é o intervalo de classe onde
na coluna das Fi superou o 50% dos dados.
LIi : limite inferior da classe mediana.
Fi−1 : freqüência acumulada absoluta da classe
anterior à classe mediana.
fi freqüência absoluta da classe mediana
Exemplo 2.4.7 Considerando os dados da TDF do exemplo 2.4.2, o intervalo que contém a classe
mediana é i = 3 uma vez que a freqüência absoluta dessa classe é maior que 50% dos dados ( maior a
20 ). Portanto
µ ¶ µ ¶
n/2 − F2 20 − 10
me = LI3 + h = 7, 0 + (0, 9) = 7, 75 g/l
f2 12
Esse resultado indica que 50% dos animais expostos a um certo tóxico têm quantidades de hemoglobina
menor que 7,75 g/dl e os outros 50% dos animais observados têm quantidades de hemoglobina superior
a 7,75 g/dl.
2.4.5 Moda
A moda de um conjunto de observações é denida como o valor, classe ou categoria que ocorre com
maior freqüência. A moda populacional é denotada por M o e a moda amostral denotada por mo.
Exemplo 2.4.8 Têm-se as seguintes observações amostrais:

a)5, 8, 7, 9, 5, 4, 6.
b) 5, 8, 5, 9, 6, 5, 4, 9.
para (a) 4,5,5,6,7,8,9, então mo = 5
para (b) 4, 5, 5, 5, 6, 8, 9, 9, então mo1 = 5 e mo2 = 9
Propriedades
1. A moda pode não existir, ou pode existir mais de uma moda.
2. Aplica-se tanto para dados do tipo qualitativo quanto para do tipo quantitativo.
3. A moda é uma medida de tendência central instável e é difícil de estimar.
A moda para dados quantitativos contínuos agrupados em TDF é obtida da seguinte forma:
· ¸
d1
mo = LIi + h
d1 + d2
onde
i: classe modal. A classe modal é idenditicada
pela freqüência absoluta (fi ) com maior valor.
LIi : limite inferior da classe modal.
d1 : é a diferença entre a freqüência absoluta da
classe modal e freqüência absoluta anterior, ou seja, d1 = (fi − fi−1 ).
d2 é a diferença a freqüência absoluta da classe modal
e freqüência absoluta posterior à classe modal,
ou seja, d2 = (fi − fi+1 ).
Exemplo 2.4.9 Considerando os dados da TDF do exemplo 2.4.2, o intervalo que contém a classe
modal é i = 3 uma vez que é o intervalo de classe de maior freqüência absoluta (f3 = 12). Portanto,
i = 3, d1 = f3 − f2 = 12 − 6 = 6 e d2 = f3 − f4 = 12 − 9 = 3
· ¸ · ¸
d1 6
mo = LIi + h = 7, 0 + (0, 9) = 7, 6 g/dl.
d1 + d2 6+3
Esse valor indica que a quantidade de hemoglobina mais freqüente entre os animais observados estão
ao redor de 7,6 g/dl.
2.4.6 Percentil e quartil

A mediana seja de uma população ou de uma amostra divide o conjunto de dados em duas partes
iguais. Também é possível dividi-lo em mais de 2 partes.
Quando se divide um conjunto ordenado de dados em quatro partes iguais, os pontos da divisão são
conhecidos como quartil; o primeiro quartil, Q1 , é o valor que divide aproximadamente, a quarta parte
(25%) das observações abaixo dele, e os 75% restantes, acima dele. O segundo quartil é exatamente a
mediana (M d). O terceiro quartil ou quartil inferior, Q3 , tem aproximadamente os três quartos (75%)
das observações debaixo dele.
Exemplo 2.4.10 A seguir são apresentada 20 observações do tempo de falha, em horas de um ma-
terial, 204 228 252 300 324 444 624 720 816 912 1176 1296 1392 1488 1512 2520 2856 3192 3528
3710
A mediana, já que n = 20 é pa é:
912 + 1176
M d = Q2 =
2
O primeiro quartil deve ter 25% dos dados abaixo dele ou, nesse exemplo, pelo menos 5 observações
abaixo dele, e 75% dos dados acima dele ou menos de 15 de observações de seu valor acima dele. A
quinta e sexta observação satisfazem essa denição de modo que Q1 é denido como a média dessas
observações
324 + 444
Q1 = = 384
2
Similarmente, o terceiro quartil deve ter s 75% dos dados abaixo dele ou pelo menos 15 observações
abaixo de seu valor, e 25% dos dados acima ou pelo menos 5 observações acima dele. As observações
15 e 16 satisfazem essa denição. Portanto,
1512 + 2520
Q1 = = 2016
2
Denição 2.4.1 (Percentil) O percentil Pp , é um valor que divide um conjunto de observações or-
denados de forma crescente (ou decrescente) em duas partes, o 100p% dessas observações com valores
inferiores (superiores) a Pp , e o 100(1−p)% com valores superiores (inferiores) a Pp . Sendo 0 < p < 1.
Observe que:
Q1 = P0,25
Q3 = P0,75
O percentil Pp para dados quantitativos contínuos agrupados em TDF é obtido da seguinte forma:
· ¸
np − Fi−1
Pp = LIi + h, 0 < p < 1
fi
onde
i: classe percentil,
a classe percentil é o intervalo de classe onde se supera
por primeira vez o (np) dos dados, isto é, Fi > np ou Fri > p
LIi : limite inferior da classe percentil.
Fi−1 : freqüência acumulada absoluta da classe
anterior à classe percentil.
fi freqüência absoluta da classe percentil
Exemplo 2.4.11 Considerando os dados da TDF do exemplo 2.4.2, o valor do percentil P0,8 encontra-
se na classe i = 5 pois sua freqüência acumulada é maior de nk = 40 × 0, 8 = 32. Isto é, F5 = 35 >
nk = 32. Portanto,
· ¸ · ¸
32 − F4 32 − 31
P0,8 = LI5 + h = 8, 8 + (0, 9) = 8, 98 g/dl
f5 5
Esse valor indica que em 80% dos animais observou-se uma quantidade menor que 8,89 g/dl e no 20%
restante dos animais observou-se uma quantidade superior a 8,89 g/dl.
2.5 Medidas de Dispersão

As medidas de posição ou de tendência central não necessariamente proporcionam informação suciente
para descrever dados de maneira adequada. Por exemplo, considere os dados de resistência à tensão
(em psi) de três amostras de alheação de alumínio-lítio.
Amostra 1: 130 150 145 158 165 140
Amostra 2: 148 148 148 148 148
Amostra 3: 90 120 205 140 165 160
Vemos que a média das 3 amostras é, X̄1 = X̄2 = X̄2 = 148 psi. Porém, em relação ao diagrama de
pontos da gura 2.8, observa-se que a dispersão ou variabilidade da amostra 3 é muito maior que da
amostra 1 e que os dados da amostra 2 apresentam variabilidade nula. Nesta seção, são denidos e
ilustrados várias medidas úteis de variabilidade:
As medidas de dispersão ou variabilidade são medidas estatísticas que permitem conhecer o grau
de homogeneidade ou heterogeneidade de um conjunto de dados. As medidas mais utilizadas são:
amplitude, intervalo interquartil, variância, desvio padrão, e coeciente de variabilidade. As três
primeiras medidas são chamadas de medidas de variabilidade absoluta e a ultima é chamada de medida
de variabilidade relativa.
2.5.1 Amplitude (A)

É a diferença entre a observação de maior e menor valor,
A = Xmax − Xmin .
Para as três amostras de resistência à tensão dadas anteriormente, a amplitude da primeira amostra
é A1 = 165 − 130 = 35, para a segunda amostra é A2 = 0, enquanto para a terceira amostra é
A3 = 205 − 90 = 115. Desses resultados é claro que, quanto maior for a amplitude, maior será a
variabilidade nos dados.
Figura 2.8: Diagrama de pontos dos dados da resistência à tensão
2.5.2 Intervalo interquartil (d)

É a diferença entre o terceiro quartil e o primeiro quartil,
d = Q3 − Q1
Considere os dados do exemplo 2.4.10, o intervalo interquartil é :
d = Q3 − Q1 = 2016 − 384 = 1632 horas
O intervalo interquartil é menos sensível aos valores discrepantes ou extremos dos dados, que a ampli-
tude.
2.5.3 Variância
É uma medida de dispersão absoluta das observações. É dada pela soma das diferenças quadráticas
das observações em relação a sua média dividida pelo número total de observações. A variância
populacional é denotada pela letra grega σ 2 e variância amostral por S 2
Populacional:
P
N P
N P
N
(Xi − µ)2 Xi2 − N µ2 Xi2
i=1 i=1 i=1
σ2 = = = − µ2 .
N N N
Amostral:
2
P
n
P
n P
n P
n Xi
(Xi − X̄)2 Xi2 − nX̄ 2 Xi2 − i=1
n
2 i=1 i=1 i=1
S = = = .
n−1 n−1 n−1
onde
Xi : Valor da i-ésima observação da variável em estudo.
X̄ : Média amostral.
µ: Média populacional.
2.5.4 Desvio padrão

É a raíz quadrada positiva da variância. O desvio padrão populacional e amostral são denotados por
σ e S respectivamente.
Populacional:
v v v
uN uN uN
uP uP 2 uP 2
u (Xi − µ)2 u 2 u
√ t i=1 t i=1 Xi − N µ t i=1 Xi
σ= σ2 = = = − µ2 .
N N N
Amostral:
v
v v u n
P
2
uP uP u n Xi
u n u n u P
√ u (Xi − X̄)2 u Xi2 − nX̄ 2 u
t Xi2 − i=1n
t t
S = S 2 = i=1 = i=1 = i=1 .
n−1 n−1 n−1
As unidades de medida da variância são iguais ao quadrado das unidades de medida da variável. Assim,
se X é medido em libras por polegada quadrada (psi), a unidade da variância amostral são (psi)2 . O
desvio padrão tem a propriedade de medir a variabilidade nas mesmas unidades que a variável de
interesse X .
Exemplo 2.5.1 Na tabela 2.4, são apresentados as quantidades necessárias para cálculo da variância
e do desvio padrão amostral, para os dados da amostra 1.
A variância amostral é:
790 790
S2 = = = 158 (psi)2 .
6−1 5
Enquanto que, o desvio padrão é: √
S= 158 = 12, 57 psi.
Alternativamente pode ser calculado a variância amostral utilizando a fórmula alternativa dada na
denição de S 2 : 2
P
n
P
n Xi
Xi2 − i=1
n
i=1
S2 = . (2.7)
n−1
Tabela 2.4: Cálculo da variância e o desvio padrão amostral

i xi xi − x̄ (xi − x̄)2
1 130 -18 324
2 150 2 4
3 145 -3 9
4 158 10 100
5 165 17 289
6 140 -8 64
P6 P6 P6
xi = 888 (xi − x̄) = 0 (xi − x̄)2 = 790
i=1 i=1 i=1
888
x̄ = 6 = 148
Exemplo 2.5.2 Na tabela 2.5, são apresentadas as quantidades necessárias para cálculo da variância
usando a fórmula (2.7).
Tabela 2.5: Cálculo da variância e o desvio padrão amostral

i xi x2i
1 130 16900
2 150 22500
3 145 21025
4 158 24964
5 165 27225
6 140 19600
P6 P6
xi = 888 x2i = 132214
i=1 i=1
Essa formula proporciona o seguinte:

2
132214 − (888)
2 790
S = 6
= = 158 (psi)2 .
6−1 5
Essa quantidade é exatamente igual ao valor obtido anteriormente.
Observação 2.5.1 A variância e o desvio padrão são utilizados para comparar a variabilidade de con-
juntos de dados expressados nas mesmas unidades, com médias que sejam aproximadamente similares.
Exemplo 2.5.3 Deseja-se comparar a renda mensal do ano 2000 de duas empresas.
Empresa A: µA = 450.000 2 = 2.500
σA
Empresa B: µB = 400.000 2 = 5.000
σB
Então pode-se armar que a renda mensal em 2000 da empresa B apresenta maior variabilidade que
2 < σ2 )
da empresa A (σA B
Exemplo 2.5.4 A variância e o desvio padrão amostral para os dados das três amostras de alheação
de alumínio-lítio do exemplo desta são apresentados abaixo:
Amostra Média Variância Desvio padrão

1 148 158 12,57
2 148 0 0
3 148 1502 38,8
Essas medidas conrmam a armação inicial de que a resistência à tensão da alheação de alumínio-lítio
na amostra 3 apresenta uma maior dispersão que da amostra 1 e, que a resistência à tensão da alheação
na amostra 2 não apresenta variabilidade. Esse último fato signica que as observações da resistência
à tensão nessa amostra são todas iguais a sua média (148 psi).
2.5.5 Coeciente de variabilidade

É uma medida de variabilidade adimensional expressa o número de vezes que o desvio padrão contém
a média. Essa medida estatística é utilizada para comparar conjuntos de dados que têm diferentes uni-
dades ou quando as médias são muito diferentes. Denota-se o coeciente de variabilidade populacional
e amostral por CV e cv, respectivamente.
Populacional:
σ
CV =
µ
onde
µ: Média populacional.
σ : Desvio padrão populacional.
Amostral:
S
cv =
X̄
onde
X̄ : Média amostral.
S : Desvio padrão amostral
Observação 2.5.2 O coeciente de variabilidade geralmente é expressado em percentuais, isto é multiplica-

se por 100 as expressões anteriores.
Exemplo 2.5.5 Considere a altura (em metros) e peso (em kg) de uma amostra de alunos.
Média Desvio Padrão

Altura 1,70 m 0,085m
Peso 70 kg 7kg
Pode-se observar que as características (altura e peso)tem diferentes unidades e nada pode ser dito a
respeito de sua variabilidade, mas,
0, 085
cvAltura = × 100% = 5%
1, 70
7
cvP eso = × 100% = 10%
70
Os alunos são duas vezes mais dispersos quanto ao peso do que à altura.
Exemplo 2.5.6 Considere os pesos (em kg) de uma amostra de meninos de 11 anos de idade e de
uma amostra de homens de 25 anos de idade.
Média Desvio Padrão
Homens 66 ,0 4,5
Meninos 36,0 4,5
Aparentemente as duas amostras tem a mesma variabilidade, porem,
4, 5
cvH = × 100% = 6, 8%
66, 0
4, 5
cvM = × 100% = 12, 5%
36, 0
Os pesos dos meninos apresentam uma dispersão maior que dos adultos.
2.5.6 Medidas de variabilidade para dados agrupados

Suponha um conjunto de dados quantitativos contínuos agrupados em uma tabela de distribuição
de freqüência com k intervalos de classes.
Amplitude
A = LSk − LI1
onde LSk é o limite superior da k -ésima classe e LI1 é o limite inferior da primeira classe.
Variância
Populacional:
P
k P
k P
k 0
(Xi0 − µ)2 fi Xi 02 fi − N µ2 Xi 2 fi
i=1 i=1 i=1
σ2 = = = − µ2 .
N N N
Amostral: " #2
P
k
Xi0 fi
P
k P
k P
k 0 i=1
(Xi0 − X̄)2 fi Xi 02 fi − nX̄ 2 Xi 2 fi − n
i=1 i=1 i=1
S2 = = = .
n−1 n−1 n−1
onde Xi0 é a i-ésima a marca de classe (ou ponto médio do intervalo de classe), fi é a i-ésima freqüência
absoluta, n é o tamanho da amostra e N é o tamanho da população. Para dados quantitativos
discretos organizados em TDF as expressões para a variância são similares mas considerando Xi0 = Xi .
Desvio padrão
√ √
Populacional: σ= σ2 Amostral: S= S2
Exemplo 2.5.7 Considere a TDF do exemplo 2.4.2, referente a quantidade de hemoglobina (g/dl) de
animais expostos a certo tóxico:
Quantidade de Hb Xi0 fi Xi0 fi (Xi0 )2 fi

5, 2 ` 6, 1 5,65 4 22,6 127,69
6, 1 ` 7, 0 6,55 6 39,3 257,415
7, 0 ` 7, 9 7,45 12 89,4 666,03
7, 9 ` 8, 8 8,35 9 75,15 627,5025
8, 8 ` 9, 7 9,25 5 46,25 427,8125
9, 7 ` 10, 6 10,15 4 40,60 412,09
P
6 P
6
Total 40 Xi0 fi = 313, 3 Xi02 fi = 2518, 54
i=1 i=1
Amplitude
A = 10, 6 − 5, 2 = 5, 4
Variância:
2518, 54 − (313, 3)2 /40
S2 = = 1, 6569 (g/dl)2
39
Desvio padrão:
S = 1, 2872 g/dl
Esse resultado indica que a quantidade de hemoglobina em animais expostos a certo tóxico apresenta
uma dispersão em relação a sua média (7,8325) de 1, 2872 g/dl.
Coeciente de variabilidade:
S 1, 2872
cv = = = 0, 1643
X̄ 7, 8325
Esse valor indica que a quantidade de hemoglobina em animais expostos a um certo tóxico, apresenta
uma variabilidade relativa de 16, 43%.
2.6 Boxplot
O boxplot é um gráco que fornece uma visualização da distribuição dos dados, além de permitir de-
tectar rapidamente uma possível assimetria dessa distribuição. Sua construção é baseada nas seguintes
medidas: na mediana, no primeiro e terceiro quartis, e nos valores extremos. A forma desse gráco
tem as seguintes características (veja a gura 2.9):
a) A caixa ("box") é delimitada pelo primeiro (Q1 ) e terceiro (Q3 ) quartis. A linha interior da caixa
corresponde a mediana (me = Q2 ).
b) A partir dos limites da caixa, considera-se duas linhas auxiliares que distam 1,5 o intervalo
interquartil d = Q3 − Q1 . Essas linhas não aparecerão no gráco nal. Elas servem para
caracterizar os valores discrepantes que são os valores menores que Q1 − 1, 5d ou valores maiores
que Q3 + 1, 5d. Os valores discrepantes serão representados no gráco com asteriscos (∗).
c) Os limites do gráco, representados por uma linha à direita e à esquerda ("bigodes") da caixa,
correspondem ao maior e ao menor valores não discrepantes do conjunto de dados.
Figura 2.9: Desenho esquemático do Boxplot
Observação 2.6.1 A caixa contém 50% dos valores (25% de cada lado da mediana). Outros 50% dos
valores estão praticamente divididos entre o "bigode"direito e "bigode"esquerdo.
Exemplo 2.6.1 (Exemplo de construção de um Boxplot) Com a nalidade de aumentar o peso

(em kg) um regime alimentar foi aplicado em 12 pessoas. Os resultados (ordenados) foram: -0,5 2,5
3,0 3,6 4,7 5,3 5,9 6,0 6,2 6,3 7,9 11,2
Calculando as medidas temos:

mediana (me ou Q2 ) = 5,6 kg
1o.quartil (Q1 ) = 3,3 kg
3o.quartil (Q3 ) = 6, 25 kg
d =intervalo interquartil = Q3 − Q1 = 2, 95 kg
Logo as linhas auxiliares correspondem aos pontos:
Q1 − 1, 5d = −1, 125 kg
Q3 + 1, 5d = 10, 675 kg
O gráco de boxplot para o exemplo é mostrada na gura 2.10.
Da gura 2.10, pode-se observar que há uma observação discrepante no conjunto de dados, o que
signica que há uma pessoa que teve um incremento de peso muito acima do resto das pessoas. Além
disso, há uma maior concentração dos dados acima do peso mediano.
Figura 2.10: Gráco de Boxplot para o regime alimentar
Observação 2.6.2 O boxplot também pode-se representar em forma vertical, como mostra a gura
2.11.
Figura 2.11: Gráco de Boxplot para o regime alimentar
2.7 Exercícios Resolvidos

1. Uma pesquisa foi realizada numa cidade do interior de Minas Gerais, com o objetivo de determinar
o número de horas por dia que as donas de casa se dedicam a assistir televisão. Obtendo-se os
seguintes resultados:
4,4 5,2 4,5 4,6 4,1 4,3 4,3 4,8 5,0 4,4
4,7 2,5 3,6 3,8 4,9 5,4 4,5 4,7 3,1 4,2
3,9 5,7 5,3 4,5 4,7 3,3 3,7 4,3 4,9 5,0
4,5 4,7 3,4 4,3 3,9 5,6 5,3 4,8 4,0 3,5
4,2 4,3 5,0 6,3 4,6 4,2 3,6 3,8 4,0
(a) Construa a tabela de distribuição de freqüências com intervalos de classe do mesmo com-
primento e usando a regra de Sturges.
(b) Interpretar:
(i) A marca de classe do segundo intervalo.
(ii) A freqüência absoluta de segundo intervalo de classe.
(iv) A freqüência relativa percentual do terceiro intervalo de classe.
(v) A freqüência acumulada relativa do quarto intervalo de class.
(c) Desenhe o histograma e polígono de freqüências relativas.
(d) Que porcentagem de donas de casa assistem televisão mais de 4,8 horas diárias?(considere
a TDF)
(e) Qual é a quantidade mínima de horas que uma dona de casa deve assistir televisão para
pertencer aos 14,2% das donas de casa que menos assistem televisão?
Solução
a) Construção da tabela de distribuição de freqüências absolutas e relativas:
(1) Cálculo do número de classe (k )
n = 49 k = 1 + 3, 3 log(49) = 6.57765
⇒ k = 7 (arredondamento simples)
(2) Cálculo do comprimento ou amplitude (A)

A = Xmax − Xmin = 6, 3 − 2, 5 = 3, 8
(3) Cálculo da amplitude (ou comprimento) de intervalo de classe (h)
A 3, 8
= h= = 0, 542857 ≈ 0, 6
k 7
(arredondamento por excesso ao um número igual ao de cifras decimais dos dados)
(3) Cálculos dos limites dos intervalos de classe
LI1 = Xmin = 2, 5, LS1 = LI1 + h = 2, 5 + 0, 6 = 3, 1
LI2 = LS1 , LS2 = LI2 + h = 3, 1 + 0, 6 = 3, 7
LI3 = LS2 , LS3 = LI3 + h = 3, 7 + 0, 6 = 4, 3
LI4 = LS3 , LS4 = LI4 + h = 4, 3 + 0, 6 = 4, 9
LI5 = LS4 , LS5 = LI5 + h = 4, 9 + 0, 6 = 5, 4
LI6 = LS5 , LS6 = LI6 + h = 5, 4 + 0, 6 = 6, 0
LI7 = LS6 , LS7 = LI7 + h = 6, 0 + 0, 6 = 6, 7
(4) Obtenção das marcas de classe (Xi0 ). É possível mostrar que a marca de classe satisfaz as
seguintes relações que são de muita utilidade.
LIi + LSi h h
Xi0 = 0
; Xi+1 = Xi0 + h; LSi = Xi0 + ; LIi = Xi0 −
2 2 2
Por exemplo:
LIi + LSi 3, 1 + 3, 7
Xi0 = = = 3, 4.
2 2
Desse modo calcula-se as marcas de classe restantes.
(5) Efetua-se a contagem para alocar cada observação (dado) ao intervalo que lhe corresponde.
Determina-se as freqüências absolutas (fi ). Dos dados obtemos: f1 = 1, f2 = 6, f3 = 11,
f4 = 19, f5 = 9, f6 = 2, f7 = 1.
(6) Determinação das freqüência relativas(fri ) para cada intervalo ”i”
Pk
fri = fni , Além disso, i=1 fri .
fr1 = 1/49 = 0, 020, fr2 = 0, 122, . . . , fr7 = 0, 020
(7) Determinação das freqüências acumuladas absolutas(Fi )
Fi = Fi−1 + fi , i = 1, 2, . . . , k , com Fk = n.
F1 = 1, F2 = 1 + 6 = 7, F3 = 7 + 11 = 18, . . . , F7 = 49 = n
(8) Determinação das freqüências acumuladas relativas (Fri )
Tem-se as seguintes relações para Fri :
P
Fri = ij=1 frj ; Fr1 = fr1 , Fr1 = Fn1 , Fri = Fri−1 + fri , i = 1, . . . , k
Fr1 = 1/49 = 0, 020, Fr2 = 0, 020 + 0, 122 = 0, 142, . . . , Fr7 = 1
Na tabela 2.6, são apresentados a distribuição de freqüências do número de horas por dia que as
49 donas de casa entrevistadas assistem televisão:
Tabela 2.6: Distribuição do número de horas diárias que as 49 donas de casa entrevistadas assistem
televisão
Número de horas Xi0 fi fri pi Fi Fri Pi
2, 5 ` 3, 1 2,8 1 0,020 2,00 1 0,020 2,00
3, 1 ` 3, 7 3,4 6 0,122 12,20 7 0,142 14,20
3, 7 ` 4, 3 4,0 11 0,224 22,40 18 0,367 36,70
4, 3 ` 4, 9 4,6 19 0,388 38,80 37 0,755 75,50
4, 9 ` 5, 5 5,2 9 0,184 18,40 46 0,939 93,90
5, 5 ` 6, 1 5,8 2 0,041 4,10 48 0,979 97,9
6, 1 ` 6, 7 6,4 1 0,020 2,00 49 1,00 100
Total 49 1,00 100,0
(b)Da tabela 2.6 tem-se:
(i) X20 = 3, 4; há 6 donas de casa que em média assistem televisão 3,4 horas por dia.
(ii) f4 = 19; há 19 donas de casa assistem televisão entre 4,3 e 4,8 horas por dia.
(iii) p3 = 22, 4%; 22,4% das donas de casa assistem TV entre 3,8 e 4,3 horas por dia.
(iv) P4 = 75, 5%; 75,5 % das donas de casa entrevistadas assistem TV menos de 4,8 horas ao
dia.
(c) A partir da tabela 2.6, são construídos o histograma e o polígono de freqüências relativas em
porcentagens.
(d) Para determinar a percentagem de donas de casa que assistem TV mais de 4,8 horas considere
o gráco do histograma de freqüência de densidade para esses dados. Essa freqüência é área
hachurada no gráco de densidade da gura 2.12, o qual é completamente determinada se obtemos
o valor de x.
Figura 2.12: Gráco de distribuição de densidade do números de horas que as donas de casa assistem
TV.
Da gura 2.12, tem-se

4, 9 − 4, 8 4, 9 − 4, 3
= =⇒ x = 6, 5
x 38, 8
Portanto, a porcentagens de donas de casa que assistem mais de 4,8 horas é aproximadamente
6,5+18,4+4,1+2=31%.
(e) Do gráco de densidade na gura 2.12, observa-se que tempo máximo é 3,7 horas para ser
incluído no grupo 14,2% das amas de casa que menos assistem televisão.
2. Um Biólogo estuda o comprimento em centímetros de peixes de uma espécie conhecida como

carpa de Singapur (cyprinus Cardio). Para uma amostra aleatória, de tamanho 7, de peixes
machos e 8, de peixes fêmeas, ele obteve os seguintes resultados:
Macho: 46 42 55 49 40 44 39
Fêmea: 44 41 42 40 48 47 46 45
Faça uma análise descritiva dos dados e comente as principais diferenças.
Figura 2.13: Boxplot dos comprimentos de peixes machos e fêmeas
Inicialmente na gura 2.13, é representado o boxplot para os comprimentos de peixes machos e fêmeas.
Dessa gura, pode-se observar que há diferenças nos comprimentos de peixes machos e fêmeas. O valor
mediano dos comprimentos dos peixes estão próximos, mas as medidas dos comprimentos dos peixes
machos apresentam maior variabilidade que as dos peixes fêmeas.
Na tabela 2.7, são apresentados algumas medidas descritivas, para os dados do exemplo. A tabela
conrma as armações feitas inicialmente.
Tabela 2.7: Medidas descritivas para o comprimento de peixes machos e fêmeas

Peixe Média Mediana Desvio padrão
Macho 45,00 44,00 5,60
Fêmea 44,13 44,50 2,90
2.8 Exercícios
1. Os seguintes dados são resultados de uma amostra aleatória de quantidade de hemoglobina (Hb)
no sangue, em g/dl (gramas por decilitro),encontrados em 30 pacientes entre 15 - 20 anos, que
foram ao laboratório central de um Hospital:
20.8 27.8 26.2 21.6 23.3 23.5 26.1 26.5 20.0 24.7 21.7 28.2
25.0 23.4 24.5 27.9 25.7 24.8 26.8 25.5 25.3 22.3 21.2 26.0
23.8 22.5 23.7 24.9 25.2 24.4
(a) Qual é a variável de estudo? Classique-a.

(b) Construa uma tabela de freqüências usando a regra de Sturges para determinar o número
de intervalos de classe.
(c) Faça o Histograma e o polígono de freqüências relativas.
(d) Qual é o signicado da freqüências acumulada percentual do quarto intervalo?
(e) Faça o polígono de freqüências acumulada relativa (ogiva).
(f) Qual é a porcentagem de pacientes com mais de 25.6 g/dl de hemoglobina no sangue?
(g) Qual é a quantidade máxima de hemoglobina deve ter um paciente para pertencer aos 40%
dos pacientes de menor quantidade de Hb no sangue.
2. Na elaboração de microcomprimidos de liberação gradual para um medicamento, coloca-se um

cor que identica o número de capas de recobrimento. O responsável da produção deseja ter uma
representação gráca da proporção em que se encontre cada cor. Para isto escolhe ao acaso uma
amostra obtendo os seguintes resultados:
azul verde verde verde vermelho
azul verde azul azul verde
verde azul vermelho verde azul
vermelho vermelho vermelho azul verde
vermelho vermelho azul azul azul
verde azul verde vermelho verde
(a) Classique os dados obtidos.

(b) Que tipo de gráco você faria para estes dados. Faça-o.
3. Uma Empresa Farmacêutica classica os seus empregados de acordo com o grau de instrução,
assim foi obtido dos seguintes resultados:
Grau de instrução N o de empregados Gastos total mensal
com remunerações
Primeiro grau 15 1950
Segundo grau 35 6650
Nível Superior 50 14000
(a) Que medida de posição recomendamos para a variável grau de instrução dos empregados?
(b) Achar a remuneração mensal média dos empregados.
(c) Se a empresa decidir dar um aumento mensal aos empregados de acordo com os seguinte
critérios e apartir de 01/05/2000
(i) Cada empregado terá um aumento de 40 u.m. mensais
(ii) Adicionalmente ao aumento descrito em 1 os empregados teriam uma remuneração

complementar ao total mensal, sendo 5% para os empregados com primeiro grau, 8%
para empregados com segundo grau e 15% para empregados com instrução superior.
Achar a remuneração média mensal prometido aos empregado apartir de 01/05/2000.
4. A continuação apresenta-se o rendimento (%) de uma reação para a fabricação de uma substância
química, em 80 bateladas consecutivas produzidas por uma industria:
81,8 87,1 82,7 79,8 81,3 79,5 88,5 75,9 81,6 73,9
85,5 87,1 82,0 79,3 82,5 87,1 83,0 87,3 79,7 82,0
83,6 84,5 80,4 78,1 86,4 76,7 83,7 78,4 76,0 80,9
80,2 78,9 77,4 78,5 82,9 81,9 80,7 78,4 78,0 81,4
84,6 79,5 83,2 80,5 80,7 79,0 90,9 79,9 86,8 80,1
83,2 78,2 80,4 85,5 85,5 79,3 83,0 78,1 83,4 83,6
85,7 86,8 86,5 83,8 86,8 83,5 79,9 76,6 84,3 78,5
74,4 71,8 79,1 82,1 84,5 78,4 80,7 70,7 78,5 85,2
(a) Construa uma tabela de freqüências com intervalos de classe do mesmo comprimento con-
siderando que k=7.
(b) Obtenha e interprete:
(i) A marca de classe do quarto intervalo de classe.
(ii) A freqüência absoluta do segundo intervalo de classe.
(iii) A freqüência acumulada percentual do segundo intervalo de classe.
(c) Desenhe o histograma de freqüências percentuais e descreve as principais características dos
dados.
(d) Obtenha e interprete a média, mediana, moda e desvio padrão.
5. Para cinco volumes de uma solução foram medidos os tempos de aquecimento em um mesmo
bico de gás e as respectivas temperaturas. O resultado foi a seguinte:
Tempo (min.): 22 20 19 23 17
Temperatura (0C): 75 80 78 84 78
Qual das duas variáveis apresenta uma maior variabilidade? Justique.
6. Um artigo publicado na Food Tecnology Journal (1956), descreve um estudo sobre o conteúdo
de protopectina em tomates durante o armazenamento. Para o qual considerou-se dois períodos
de armazenamento e analisou-se as amostras de nove lotes de tomates em cada período, obtendo-
se os dados abaixo:
Tempo de lotes
armazenamento. 1 2 3 4 5 6 7 8 9
7 Dias 1802.0 107.4 278.8 1275 544.0 672.2 818.0 406.8 461.6
21 dias 415.5 485.4 377.6 270.4 467.8 272.1 394.1 336.4 371.2
(a) Qual é a variável e de que tipo é ?

(b) Determine a média e mediana. Qual destas duas medidas é melhor para os dois grupos
acima ?.
(c) Dos tempos de armazenamento, qual apresenta maior variabilidade? Justique.
(d) Desenhe o Boxplot para cada um dos tempos de armazenamento. Quais são as principais
diferenças?
(e) Considerando os ítens (b) a (d) , descreva as principais diferenças nos tempos de armaze-
namento.
7. Um hospital maternidade está planejando a ampliação dos leitos para recém nascidos. Para
tal, fez um levantamento dos últimos 50 nascimentos obtendo a informação sobre o número de
dias que os bebes permanecem no hospital, antes de terem alta. Os dados, já ordenados, são
apresentados a seguir:
1 1 1 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3
3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 5
5 5 5 5 5 6 7 7 8 15
(a) Calcule média, moda e mediana.

(b) Determine o desvio padrão.
(c) Você identica algum valor excepcional dentre os que foram observados? Se sim, remova-o
e recalcule os ítens a) e b). Comente as diferenças encontradas.
(d) Dentre as medidas de posição calculadas em a), discuta quais delas seriam mais adequadas
para resumir esse conjunto de dados.
8. O índice de germinação é um dos principais fatores para denir a qualidade de sementes. Ele
é determinado em um experimento cientíco conduzido pelo fabricante e regulamentado pelos
órgãos scalizadores. Um fabricante arma que o índice de germinação de suas sementes de milho
é mais de 85%. Para vericar tal armação uma cooperativa de agricultura sorteou 100 amostras
com 100 sementes em cada uma e anotou a porcentagem de germinação em cada amostra. Os
resultados estão na tabela de abaixo.
% de germinação Freqüência
70 ` 75 5
75 ` 80 20
80 ` 85 40
85 ` 90 18
90 ` 95 12
95 ` 100 5
(a) Calcule e interprete a mediana, 10 quartil e 30 quartil . Comente a armação do fabricante.

(b) Desenhe o Boxplot
(c) Determine a proporção de sementes com índice de germinação menor de 82
(d) Suponha que outro fabricante produz sementes com índice de germinação média igual a
89% e desvio padrão igual a 5%, qual dos produtores apresentam maior variabilidade ?.
Justique
9. Uma maquina foi regulada para fabricar placas de 5 mm de espessura, em média, com uma
variabilidade relativa de, no máximo, 3%. Iniciada a produção, foi colhida aleatoriamente uma
amostra de tamanho 50, que forneceu a seguinte tabela de distribuição de freqüência com inter-
valos do mesmo comprimento.
Espessura (em mm) N0 de placas

4, 6 ` 3
` 18
` 4, 8 10
` 18
`
` 2
(a) Esboce o histograma de freqüências percentuais e descreva as principais características das

placas amostradas.
(b) Que você pode armar a respeito da regulagem da maquina?
(c) Determinar e interpretar: a moda e a mediana.
(d) Qual deve ser a espessura das placas para ser considerado entre os 10% com maior espessura?
(e) Placas com espessuras menores ou iguais a 4,95 mm são vendidos a R$ 1,5 e placas com
espessuras entre 4,95 mm e 5,15 mm são vendidos a R$ 2,0 e placas com espessuras maiores
ou iguais a 5,15 mm são vendidos a R$ 1,0. Determinar o preço médio de venda de cada
placa.
10. Um biólogo esta investigando qual o acasalamento de um determinado tipo de caramujo que
produz o maior número mediano de ovos eclodidos. Nesse sentido desenvolve um experimento
em que três grupos são investigados: Grupo1 (1 macho e 1 fêmea), Grupo 2 (2 machos e 1 fêmea)
e Grupo 3 (1 macho e 2 fêmeas). Para cada grupo, 20 acasalamento são feitos e observados o
número de ovos postos eclodidos após 14 dias de permanência. Os Boxplots correspondentes são
apresentados na gura 2.14.
Figura 2.14: Boxplot do número de ovos eclodidos em três grupos.
(a) Qual grupo produz o maior número mediano de ovos eclodidos? Forneça uma estimativa
desse número mediano de ovos eclodidos
(b) Qual são as principais diferenças entre os 3 grupos ?. Justique.
11. Uma empresa química arma que nenhum de seus funcionários estão contaminado por chumbo,
para vericar isto a empresa faz um exame de rotina em 36 funcionários escolhido ao acaso,
constatado as seguintes concentrações no sangue. Sabendo que o limite máximo de contaminação

por chumbo é de 4,80 µmol /L(Concentrações em µmol de chumbo por litro de sangue).
3.35 3.67 4.27 5.11 5.55 2.83 3.29 3.63 4.15 4.96 5.50 2.81
3.26 3.58 3.94 4.58 5.42 2.52 3.15 3.55 3.90 4.49 5.28 2.32
3.09 3.49 3.82 4.43 5.25 1.53 3.03 3.45 3.76 4.36 5.20 1.28
(a) Construa uma tabela de distribuição de freqüências de classe usando a regra de Sturges
(k = 1 + 3, 3 log10 (n) ) para determinar o número de intervalos de classe .
(b) Calcule as medidas de posição e diga se o nível deste metal entre os funcionários é preocu-
pante. Justique.
(c) Determine a porcentagem de funcionários que se encontra no intervalo (X̄ − S; X̄ + S) .
12. O teste do pezinho é feito para se constatar em recém nascidos uma doença genética chamada
de fenicetonúria. Este teste consiste em dosar a quantidade de um aminoácido, a fenilalanina,
que em quantidades altas no organismo pode causar dano às células, principalmente as cerebrais.
Numa maternidade, em um mesmo dia, o teste foi feito em 30 recém nascidos obtendo as seguintes
concentrações de fenilalanina em µ mol / L
133,92 174,12 170,88 244,81 142,26 206,73 156,25
224,29 145,59 214,26 175,06 205,72 144,94 171,73
147,69 168,12 182,64 186,24 206,96 143,82 173,31
116,44 208,01 110,29 197,26 212,34 180,76 189,12
167,96 144,07
(a) Construa uma tabela de distribuição de freqüências e a representação gráca dos dados
acima considerando a freqüência relativa em porcentagens. Comente as principais caracte-
rísticas destes dados.
(b) a concentração de fenilalanina permitida é de 70 a 210 µmol / L para um recém nascido
sadio. Determine a porcentagens crianças que se encontra nessa faixa.
(c) Calcule e interprete as medidas de posição para esses dados.
(d) Numa outra maternidade a concentração de fenilalanina média foi de 2,99mg/dl e variância
de S 2 = 0, 084mg 2 /dl2 . Qual das maternidade obteve maior variabilidade dos dados ?.
Justique.
13. O número de pessoas praticam a auto-medicação no Brasil são alarmantes. Para se constatar
que essa atitude é praticada por pessoas de todos os níveis sócio-econômicos e graus de instrução,
foi feito entrevistas com 20 pessoas de uma cidade do interior de Minas. Os dados obtidos foram
organizados na tabela abaixo:
No Automedicam Grau de instrução Nível sócio-econ.

1 Sim 1o grau Baixa
2 Sim 1o grau Baixa
3 Sim 2o grau Média
4 Sim Superior Média
5 Não Superior Alta
6 Não Superior Média
7 Sim 1o grau Baixa
8 Não 2o grau Baixa
11 Sim Superior Alta
13 Sim 1o grau Baixa
(a) classique as variáveis em qualitativa nominal ou ordinal.

(b) Calcule a porcentagem dos entrevistados que praticam a auto-medicação, levando em conta
a escolaridade e o nível social.
(c) De acordo com os dados, você acha que a auto-medicação não depende do nível sócio-
econômico ou grau de instrução. Justique.
14. O cloranfenicol é um antibiótico bacteriostático, pois inibe a síntese protéica. Apesar de agir
somente em ribosomas bacterianos, este antibiótico produz efeitos colaterais e até a morte de
pessoas com sensibilidade a esta família de antibiótico. Um grupo de 1400 pacientes com infecção
por estreptococos tratado com o cloranfenicol e 800 foram retratadas com um novo antibiótico
obtendo-se os seguintes dados relacionados com o aparecimento de efeitos colaterais e óbitos.
Clorannicol Novo Antibiótico
Não apresentaram 1279 613
Apresentaram 116 184
Óbito 5 3
(a) Classique a variável em estudo. Qual dos dois antibióticos oferece menores riscos para a
saúde dos pacientes?Justique.
15. Em um laboratório de análises clínicas revelou os dados sobre o nível de glicose no soro de 50
pessoas que solicitaram esse exame. Os dados obtidos apresentados abaixo são em mg de glicose
por decilitros de soro:
181,93 145,09 132,92 124,88 118,96 110,48 100,04 89,65
181,17 143,78 130,83 124,83 118,39 108,02 95,33 88,51
167,83 141,89 129,83 122,01 116,00 105,87 95,07 85,10
152,06 137,96 129,53 121,57 115,13 103,62 93,66 83,12
149,56 136,37 128,84 121,26 114,55 102,16 92,94 80,98
145,62 134,48 124,96 119,65 111,90 100,99 92,72 78,49
62,32 76,73
(a) Construa uma tabela de freqüências usando a regra de Sturges para determinar o número
de intervalo de classe.
(b) Faça o histograma de freqüências relativas e comente as principais características dos dados.
(c) Uma pessoa é considerado saudável, se o nível de glicose é maior o igual a 30mg/dl mais
menor a 110 mg/dl. Qual é a porcentagens de pessoas saudáveis? (considere a TDF).
(d) Calcule e interprete média, mediana, 1o quartil e 3o quartil.
(e) Determina a porcentagens de pessoas que se encontram no intervalo [Q1 − 1, 5d; Q3 + 1, 5d),
onde d = Q3 − Q1 .
16. Uma farmácia de manipulação encomendou lotes de ácido acetisalicílico(AAS) de duas empresas
(A e B). Na análise da pureza da matéria prima constatou-se que havia ácido salicílico misturado
ao AAS. Amostras dos lotes foram retiradas (100 mg), analisadas e organizadas na tabela abaixo:
Empresa A Empresa B
Lotes % de Pureza Lote % de Pureza
1 96.793 1 93.808
2 98.381 2 94.651
3 96.590 3 93.073
4 96.458 4 95.169
5 97.335 5 95.376
6 95.778 6 94.606
7 94.941 7 94.410
8 97.578 8 93.691
9 94.764 9 95.614
10 96.197 10 94.194
(a) Determine a média e o desvio padrão e comente as principais diferenças.

(b) Construa o Boxplot e considerando o item (a) descreva as principais diferenças.
(c) Em uma das empresas estava especicado na embalagem do material que em média havia
1,175% de impurezas. Qual das duas empresas poderia, corretamente, informar isto?
17. Num hospital foi realizado exames para se determinar o nível de colesterol em pacientes com peso
acima do normal. Os dados obtidos dos 36 pacientes examinados estão relacionados a seguir, em
mg/dl.
180,31 213,99 227,53 246,87 264,67 275,18 182,41 214,41 235,22
254,43 266,19 288,08 188,43 218,06 235,40 257,57 266,52 290,89
191,71 219,67 237,98 260,42 269,72 292,66 204,24 220,42 241,23
262,83 271,95 327,64 212,81 225,22 246,38 264,42 274,00 336,47
(a) Construa uma tabela de freqüências usando a regra de Sturges.

(b) Faça o polígono de freqüências relativas.
(c) Calcule e interpreta a média e o desvio padrão.
(d) Qual o percentual de pacientes que pertencem ao intervalo de 150 a 240 mg/dl considerado
para uma pessoa normal.
18. Na análise de vacinas contra a febre amarela, constatado uma possível fraude no volume espe-
cicado no rótulo dessas vacinas. Foram analisadas 30 ampolas de 0.50 ml, dando os seguintes
resultados:
0,591 0,521 0,495 0,546 0,503 0,456 0,592 0,511 0,491
0,543 0,503 0,448 0,573 0,508 0,482 0,540 0,502 0,435
0,563 0,505 0,481 0,531 0,500 0,424 0,549 0,505 0,476
0,529 0,497 0,400
(a) Calcule as medidas de posição e interprete-as.

(b) Faça uma representação gráca.
(c) No rótulo dos lotes estava mencionado o volume de 0.5 ml e a variabilidade de 1% em volume
nas ampolas. Diga se isto está correto, de acordo com os dados obtidos.
19. Em um laboratório de pesquisa genéticas foi feito cruzamentos entre camundongos pretos e
albinos, o objetivo da pesquisa era se saber quais as cores dos lhotes e suas proporção; os dados
obtidos foram organizados abaixo:
Preto Marrom albino marrom preto marrom albino preto
Albino Preto preto preto preto preto preto marrom
Preto Albino preto albino marrom preto albino preto
Preto Preto marrom preto albino preto preto albino
(a) Qual é a variável em estudo? Classique-a.

(b) Calcule a medida de tendência central mais conveniente para os dados acima.
(c) Faça um gráco adequado para os dados obtidos.
20. Hidatidose é uma doença causada por helmintos do gênero Echinococcus. O quadro abaixo
mostra pacientes com cisto ciático operados em Azul ( Província de Bueno Aires, Argentina
)segundo grupos etários.
Grupos etários No de pacientes operados
0 ` 10 29
10 ` 20 76
20 `30 88
30 ` 40 52
40 `50 42
50 ` 60 23
60 ` 70 12
Fonte: Adaptado do livro "Patologia"de Luís Rey
(a) Faça a representação gráca dos dados considerando a freqüência relativas em percentuais
e descreva as principais características.
(b) Calcule e interprete 1o quartil, mediana e 3o quartil.
(c) Qual é a idade média dos pacientes com cisto ciático operados em Azul.
(d) De acordo com os dados, qual o percentual que pacientes operados com menos de 18 anos.
21. Para cada uma das doses 0,20 0,32 0,50 e 0,80 (mg/cm2 ) de um determinado inseticida foram
submetidos seis grupos, cada um com dez besouros, e observado o número de sobreviventes. Os
dados são resumidos na tabela abaixo.
0,20 0,32 0,50 0,80
7 9 10 6 7 9 6 4 8 1 3 2
8 9 9 7 8 4 5 6 3 2 6 5
Para cada dose calcule a proporção de sobreviventes e calcule a média, mediana, desvio padrão
e quartis para o número de sobreviventes. Compare o número médio com o número mediano de
sobreviventes segundo as doses. Comente.
22. Um experimento é conduzido para comparar dois regimes alimentares no que diz respeito ao
aumento de peso. Vinte indivíduos são distribuídos ao acaso entre dois grupos em que ao primeiro
deles foi dado a dieta A e ao segundo a dieta B. Decorrido certo intervalo de tempo verica-se
que os aumentos de peso correspondentes foram as seguintes:
Dieta A -1,0 0,0 2,1 3,1 3,3 4,3 5,2 5,5 5,0 6,8
Dieta B 2,5 3,0 4,0 5,7 6,0 6,9 7,0 7,2 7,3 8,1
Análise os dados descritivamente e comente as principais diferenças.
23. Uma empresa construtora de equipamentos para indústria alimentar pretende adquirir termos-
tatos para comandar a abertura de um certo tipo de fornos, contemplando a possibilidade de
os adquirir a um dos fornecedores A ou B. O fornecedor B vende os termostatos mais caros,
invocado que são mais áveis do mercado. Num ensaio de 9 termostatos de fornecedor A e 11
do fornecedor B, todos regulados à mesma temperatura, as temperaturas observadas de abertura
dos fornos foram as seguintes.
Fornecedor A 423 425 401 430 417 425 416 421 419
Fornecedor B 419 414 422 435 418 421 429 410 406 418 421
Você acha que o termostato do fornecedor B é mais conável que do fornecedor A?. Justique
porque?
24. A qualidade de rebites é tanto melhor quanto maiores sua resistência média e sua homogeneidade.
Com a nalidade de vericar qual das marcas A e B são melhores, 8 rebites da marca A foram
ensaiados ao cisalhamento que forneceu uma média de 37,09 e desvio padrão de 4,05, ao passo
que rebites da marca B forneceu, nas mesmas unidades, os seguintes valores: 38,5 39,0 40,7 37,8
41,4. A gura 2.15 mostra o gráco do boxplot das cargas de ruptura das marcas A e B. Com a
Figura 2.15: Boxplot das resistência dos rebites das marcas A e B.
informação acima qual das marcas de rebites é melhor em pelo menos um aspecto? Justique.
Capítulo 3
Introdução à Probabilidade
3.1 Introdução
A representação dos dados em forma sintética e compreensível, que foi o tema central do capítulo
anterior, é um passo necessário, mas limitado, para viabilizar a utilização dos mesmos na análise e
interpretação de processos ou na tomada de decisões.
Nesse capítulo é apresentado um conjunto de conceitos básicos da teoria de probabilidade, que constitui
a parte fundamental sobre a qual se assenta a inferência estatística. Essa seria uma justicativa
atribuída à teoria de probabilidade, mas, seu objetivo principal é modelar fenômenos ou processos
nos quais interfere o acaso, pois faz dela um instrumento imprescindível para uma compressão dos
fenômenos da natureza.
3.2 Conceitos Básicos

3.2.1 Experimentos aleatórios
Os fenômenos que ocorrem na natureza podem ser classicados em dois grupos: de um lado estão
aqueles fenômenos que ocorrem naturalmente, sem a intervenção do homem. Enquanto de outro lado,
estão aqueles fenômenos que ocorrem como conseqüência de experimentos realizados com a intervenção
do homem. Nessas notas, a palavra experimento é usada para designar qualquer um dos dois tipos
mencionados anteriormente. Pode-se dizer, portanto, que um experimento é qualquer procedimento
que envolva observação. Assim, quando se efetuam medidas da massa de um elétron ou quando se
observam as sucessivas posições da lua no espaço estão sendo realizados experimentos.
Um outro critério de classicação diz respeito à possibilidade de se prever ou não resultados particu-
lares de um experimento que será realizado. Para certos experimentos, realizados sob determinadas
condições, é possível prever um resultado particular. Quando a água é aquecida a 1000 C, sob pressão
normal, ela entra em ebulição. Um corpo colocado a 20m de altura e solto, cai por ação da gravidade.
Esses experimentos são chamados experimentos determinísticos.
Para outros experimentos, realizados sob idênticas condições, não é possível prever um resultado par-
ticular. Se um dado é lançado sobre a superfície plana, não é possível armar que ocorra a face 6. Se
esse experimento é realizado várias vezes, em condições idênticas, observaremos, em geral, resultados
48
CAPÍTULO 3. INTRODUÇÃO À PROBABILIDADE 49
distintos. O número de pacientes que chegam a um hospital, num intervalo de tempo de uma hora, num
dia varia de dia para dia. O número de lâmpadas que queimarão, 50 horas depois de 200 delas serem
instaladas, não pode ser previsto com certeza. A estes experimentos denominamos de experimentos
aleatórios(ε).
Exemplo 3.2.1 Considere os seguintes experimentos:

ε1 : Um dado é lançado sobre uma superfície plana e observamos a cara superior
ε2 : Um moeda é lançada e observamos o resultado que aparece (cara ou coroa)
Pode-se observar que um experimento aleatório tem as seguintes propriedades:
i. O experimento pode repetir-se, indenidamente sem mudar as condições. .
ii. Cada experimento é não determinístico.
iii. Cada experimento tem vários resultados possíveis que são descritas com antecedência e com
precisão. Por exemplo em ε1 tal conjunto é {1, 2, 3, 4, 5, 6} e, em ε2 , é {cara, coroa}.
Exemplo 3.2.2 Os seguintes experimentos são experimentos aleatórios:

ε3 : Escolher um representante ao acaso num grupo de 30 alunos.
ε4 : Examinar o sexo (feminino = M ou masculino = F) dos lhos em famílias com 3 lhos.
ε5 : Uma moeda é lançada três vezes sobre uma mesa e observado o número de caras.
ε6 : Observar o tempo de vida de uma lâmpada num período de um ano.
ε7 : Escolher ao acaso 2 vacinas de um lote que tem 2 tipos vacinas (A , B).
3.2.2 Espaço amostral

O objetivo é construir um modelo matemático que descreva os experimentos aleatórios. Esse modelo
deve ser genérico para englobar os exemplos mencionados e outros que, facilmente, possamos imaginar.
Para este m, introduzimos o conceito de espaço amostral.
Denição 3.2.1 Denomina-se espaço amostral associado a um experimento aleatório, ao conjunto

de resultados possíveis de dito experimento aleatório.
O espaço amostral é denotado por Ω. Assim, por exemplo, os espaços amostrais associados aos respec-
tivos experimentos dos exemplos 3.2.1-3.2.2, são:
ε1 : Ω1 = {1, 2, 3, 4, 5, 6}
ε2 : Ω2 = {C, K} , C =cara e K = corõa
ε3 : Ω3 = {R1 , . . . , R30 }, Ri representa cada aluno: Pedro, João, Maria, etc.
ε4 : Ω4 = {HHH, HHF, HF H, F HH, HM M, M HM, M M F, F F F }
ε5 : Ω5 = {CCC, CCK, CKC, KCC, CKK, KCK, KKC, KKK}
ε6 : Ω5 = {t ∈ R; t ≥ 0}
ε7 : Ω6 = {AA, AB, BA, BB}
3.2.3 Eventos aleatórios e operações

Muitas vezes, tem-se interesse na ocorrência de alguns resultados do experimento aleatório. Por exem-
plo, ao lançar um dado tem-se interesse em saber se o resultado é um número maior do que 4 ou, ao
medir o tempo de vida de uma lâmpada, tem-se interesse em saber se ela durou mais de 100 horas.
Os pontos amostrais de Ω são chamados eventos simples e são denotados por w. Um evento aleatório
será representado por um conjunto de eventos simples. Ou seja, um evento aleatório ( ou simplesmente
evento) será representado por um subconjunto de Ω e Denotado pelas letras A, B , C , etc .
Exemplo 3.2.3 Considerando os experimentos aleatórios do exemplo 3.2.2 e os espaços amostrais

respectivos, são apresentados exemplos de eventos aleatórios associados a seus respectivos Ω.
Assim, Ai será o evento relacionado com o experimento cujo espaço amostral é Ωi , i = 1, . . . , 7.

A1 : o número observado é par;
A2 : resulte cara;
A3 : o representante escolhido seja João; = {João}
A4 : os lhos são do mesmo sexo; ={M M M, F F F }
A5 : o número de caras seja 3; = {3}
A6 : a lâmpada dure menos de 200 horas;
A7 : as 2 vacinas selecionadas sejam do tipo B; = {BB} .
Como o espaço amostral Ω é representado por um conjunto e os eventos são denidos como subconjuntos
de Ω, são denidos operações entre eventos que correspondem às operações entre conjuntos. Ao se falar
em eventos sempre se referira a eventos em relação a dado espaço amostral.
Um evento A ocorre quando observamos um evento simples, w ∈ A.
Sejam A e B dois eventos associados a um experimento aleatório cujo espaço amostral é Ω.
Denição 3.2.2 A união dos eventos A e B é o evento que ocorre se pelo menos um dos eventos A
ou B ocorre.
A notação A ∪ B é usada para representar a união de A e B. Em notação matemática é representado

por : A ∪ B = {w ∈ Ω; w ∈ A ou w ∈ B}.
Denição 3.2.3 A intersecção dos dois eventos A e B é o evento que ocorre se e somente se ambos
ocorrem.
É Denotado por AB ou A ∩ B o evento intersecção. Matematicamente, esse evento é representado por:

A ∩ B = {w ∈ Ω; w ∈ A e w ∈ B}
Exemplo 3.2.4 Considere uma urna que contem bolas numeradas de 1 a 15. Uma bola é extraída
da urna, sejam os eventos:
A: o número observado é múltiplo de 5 ;
B: o número observado é ímpar.
Então, Ω = {1, 2 . . . , 15} , A = {5, 10, 15} e B = {1, 3, 5, 7, 9, 11, 13, 15}. Assim,
A ∪ B = {1, 3, 5, 7, 9, 10, 11, 13, 15},
ou seja, um ponto amostral pertence a A ∪ B se ele é ímpar ou se é múltiplo de 5. Para que um ponto
amostral pertença a A ∩ B é necessário que ele seja ímpar e múltiplo de 5, logo, A ∩ B = {5, 15}.
Denição 3.2.4 O complementar de um evento A é o evento em que A não ocorre.
A notação Ac ou Ā para designar o complementar de A e matematicamente é representada por :

Ac = {w ∈ Ω; w ∈
/ A}.
No exemplo 3.2.4; Ac = {1, 3, 4, 6, 7, 8, 9, 11, 12, 13, 14}, B c = {2, 4, 6, 8, 10, 12, 14}.
Denição 3.2.5 Dois eventos A e B denidos no mesmo espaço amostral, são mutuamente exclusivos
se não podem ocorrer juntos. Ou seja, a ocorrência de um exclui a ocorrência do outro. Em símbolos,
A ∩ B = ∅.
O evento que contém todos os elementos de um espaço amostral e que, portanto, coincide com o
espaço amostral é chamado evento seguro. Essa designação reete o fato de que, na realização de um
experimento aleatório correspondente, um dos resultados nele contido ocorre com certeza. O evento
impossível representa-se através de um conjunto que não contém nenhum elemento do espaço amostral.
Tal conjunto é representado por um conjunto vazio, ou seja, ∅.
3.3 Probabilidade
O conceito de probabilidade pode ser denido de diferentes maneiras. Apresenta-se seguidamente três
denições distintas: a clássica, a frequentista e a axiomática.
3.3.1 Denição clássica ou a priori

Na origem, a teoria de probabilidade esteve associada aos jogos de azar (por exemplo, de dados ou de
cartas). Dessa associação nasceu a denição clássica de probabilidade: se um experimento aleatório
tiver n(Ω) resultados exclusivos e igualmente prováveis e se um acontecimento A tiver n(A) desses
resultados, então a probabilidade de ocorrer o evento A é dada por:
n(A)
P (A) = (3.1)
n(Ω)
ou seja, a probabilidade de acorrer o evento A é a razão entre o número de resultados favoráveis à
ocorrência de A e o número resultados possíveis do experimento aleatório.
Como resultado da denição acima, as probabilidades satisfazem algumas propriedades:
1. A probabilidade de ocorrência do evento A está compreendida entre 0 e 1.
2. P (A) = 0 se A é o evento impossível.
3. P (A) = 1 se A é o evento seguro.

4. Se todos os pontos amostrais de Ω = {w1 , w2 , . . . , wn } são igualmente prováveis tem-se: P ({wi }) =

1
n , i = 1, . . . , n e P (Ω) = 1. Se A é um evento em Ω, então
X
P (A) = P ({wi })
wi ∈A
.
5. Se A e B são dois eventos em Ω e são mutuamente exclusivos, então
P (A ∪ B) = P (A) + P (B)
Exemplo 3.3.1 Considere o lançamento de 2 dados balanceados. Calcular a probabilidade de
(a) obter soma 7;
(b) obter soma 6;
(c) obter soma maior que 5;
(d) que o resultado do primeiro dado seja superior ao resultado do segundo.
Solução O experimento aleatório é "lançar dois dados". O espaço amostral associado a esse experi-
mento aleatório é  

 (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6) 


 (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6) 


 

 
(3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
Ω=

 (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6) 


 


 (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6) 

 
(6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)
onde cada ponto amostral é da forma (w1 , w2 ), sendo w1 o ponto amostral correspondente ao resultado
do primeiro dado w2 , ao do segundo dado.
Sejam os seguintes eventos:
A= {(w1 , w2 ) ∈ Ω; w1 + w2 = 7} = obter soma 7
B= {(w1 , w2 ) ∈ Ω; w1 + w2 = 6} = obter soma 6
C= {(w1 , w2 ) ∈ Ω; w1 + w2 > 5} = obter soma maior que 5
D= {(w1 , w2 ) ∈ Ω; w1 > w2 } = o resultado do primeiro dado ser maior que do segundo.
Uma simples contagem permite determinar nA = 6, nB = 5 nC = 26 e nD = 15. Então,
6 5
(a) P (A) = 36 (b) P (B) = 36
26 15
(c) P (C) = 36 (d) P (D) = 36
3.3.2 Denição frequentista ou a posteriori

A denição clássica não pode ser utilizada no cálculo da probabilidade de acontecimentos associados
à realização da maioria dos experimentos com interesse prático, aos quais a equiprobabilidade dos
resultados não se aplica. Por exemplo, se perguntamos qual é a probabilidade de que um paciente seja
curado após o tratamento médico, ou qual é probabilidade de que uma determinada máquina produza
artigos defeituosos. Uma forma de responder essas questões é obter alguns dados empíricos com a
intenção de estimar as probabilidades.
Suponha que seja realizado um experimento n vezes (n grande) e o evento A ocorra exatamente
r ≤ n vezes. Então, a freqüência relativa de vezes que ocorreu o evento A, ”frA = nr ”, é a estimação
da probabilidade que ocorra o evento A, ou seja,
r
P (A) = .
n
Essa estimação da probabilidade por freqüência relativa de um evento A, nr , é próxima da verdadeira
probabilidade de ocorrência do evento A quando n tende ao innito, isto é,
r
P (A) = lim frA = lim .
n→∞ n→∞ n
É imediato vericar, de acordo com a denição frequentista apresentada, que as probabilidades ainda
satisfazem as propriedades apresentadas anteriormente.
Exemplo 3.3.2 Suponha que uma moeda balanceada é lançado 1000 vezes. Os resultados desse ex-
perimento são apresentados na tabela 3.1
Tabela 3.1: Lançamento de um moeda 1000 vezes.

Número de Número de Frequência Frequência Freqüência ac.
lançamento caras relativa acumulada relativa
1 - 100 52 0,52 52 0,520
101-200 53 0,53 105 0,525
201-300 52 0,52 157 0,523
301-400 47 0,47 204 0,510
401-500 51 0,51 255 0,510
501-600 53 0,53 308 0,513
601-700 48 0,48 356 0,509
701-800 46 0,46 402 0,503
801-900 52 0,52 454 0,504
901-1000 54 0,54 508 0,508
Em um total de 1000 lançamentos ocorreram 508 caras, isto é, a freqüência relativa é aproximadamente
0,5. Portanto, baseada na denição frequentista, a probabilidade de cara em um lançamento de uma
moeda balanceada é 0,5.
3.3.3 Denição axiomática

As denições anteriores são puramente empíricas ou experimentais, no entanto, após estabelecer uma
forma de se determinar a probabilidade experimentalmente, pode-se deduzir leis ou propriedades da
probabilidade em forma lógica ou computacional sob certas suposições chamadas de axiomas da pro-
babilidade.
A probabilidade de um evento A é denida como o número P (A), que satisfaz os seguintes axiomas:
Axioma 1 A probabilidade P (A) de qualquer evento satisfaz a relação

0 ≤ P (A) ≤ 1
Axioma 2 A probabilidade do evento certo (Ω) é

P (Ω) = 1
Axioma 3 Se A1 , A2 , . . . , Ak são eventos mutuamente exclusivos, então

P (A1 ∪ A2 ∪, . . . , ∪Ak ) = P (A1 ) + P (A2 ) + · · · + P (Ak )
Toda a teoria elementar da probabilidade está construída sob a base destes três simples axiomas.
A seguir, são apresentados propriedades que são conseqüência imediata dos axiomas acima.
Teorema 3.3.1 1. Se ∅ é um evento impossível, então P (∅) = 0
2. Para um evento A, tem-se:
P (Ac ) = 1 − P (A) ou P (A) = 1 − P (Ac )
3. Se A e B são eventos tais que A ⊂ B , então
P (A) ≤ P (B)
4. Se A e B são eventos em Ω, então
P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
5. Se A, B e C são três eventos em Ω, então
P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (A ∩ B) − P (A ∩ C) − P (B ∩ C) + P (A ∩ B ∩ C).
Exemplo 3.3.3 Na tabela 3.2 mostrada a seguir, são apresentados a composição por raça e sexo de
uma população de certo país
Tabela 3.2: Distribuição da população por raça e sexo de um país.

Sexo
Raça Masculino Feminino Total
Branca 1726384 2110253 3836637
Outra 628 309 753125 1381434
Total 2354693 2863378 5218071
Suponha que seja selecionado um habitante desse país e considere os eventos:

H: "o habitante selecionado é do sexo masculino"

H c: "o habitante selecionado é do sexo feminino"
B: "o habitante selecionado é da raça branca"
Bc: "o habitante selecionado é de outra raça"
H ∩B : "o habitante selecionado é do sexo masculino e da raça branca"
H ∪B : "o habitante selecionado é do sexo masculino ou da raça branca"
Hc ∩ B : "o habitante selecionado é do sexo feminino e da raça branca"
Hc ∪ B : "o habitante selecionado é do sexo feminino ou da raça branca"
H c ∩ Bc : "o habitante selecionado é do sexo feminino e de outra raça "
H c ∪ Bc : "o habitante selecionado é do sexo feminino ou de outra raça"
As probabilidades de ocorrência de cada um desses eventos são, respectivamente:
P (H) = 2354693
5218071 = 0, 451;
P (H c ) =1 − P (H) = 1 − 451 = 0, 549;
P (B) = 3836637
5218071 = 0, 735;
P (B c ) =1 − P (B) = 1 − 0, 735 = 0, 265;
P (H ∩ B) = 1726384
5218071 =0,331;
P (H ∪ B) =P (H) + P (B) − P (H ∩ B)
=0, 451 + 0, 735 − 0, 331 = 0, 855;
P (H c ∩ B) = 2110253
5218071 =0,404;
P (H c ∪ B) =P (H c ) + P (B) − P (H c ∩ B)
=0, 549 + 0, 735 − 0, 404 = 0, 880;
753125
P (H c ∩ B c ) = 5218071 = 0, 144
P (H c ∪ B) =P (H ) + P (B c ) − P (H c ∩ B c )
c
=0, 549 + 0, 265 − 0, 144 = 0, 660.
3.4 Probabilidade Condicional e Independência

Considere o exemplo 3.3.3, onde um indivíduo é selecionado, ao acaso, dentre os habitantes desse país.
Caso se tenha a informação de que o indivíduo selecionado é do sexo masculino, a probabilidade de que
1726384
seja da raça branca é 2354693 = 0, 73. Esse porque do total de 2354693 de habitantes do sexo masculino,
1726384 são de raça branca. Este tipo de probabilidade chama-se probabilidade condicional e denota-se
por P (B|H). Lê-se a probabilidade de ocorrência do evento B dado que ocorreu o evento H .
Observe que, para o caso de experimentos aleatórios com resultados equiprováveis tem-se:
nB∩H nB∩H /n P (B ∩ H) 0, 331
P (B|H) = = = = = 0, 73.
nH nH /n P (H) 0, 451
Denição 3.4.1 (Probabilidade condicional) Sejam A e B dois eventos em um mesmo espaço

amostral Ω. A probabilidade condicional de A dado que ocorreu o evento B , é denotado por P (A|B), é
denido como:
P (A ∩ B)
P (A|B) = , P (B) > 0. (3.2)
P (B)
Caso P (B) = 0, P (A|B) pode ser denido arbitrariamente. Nesse texto será usado P (A|B) = P (A)
Exemplo 3.4.1 Selecionamos uma semente, ao acaso, uma a uma e sem reposição, de uma sacola
que contém 10 sementes de ores vermelhas e 5 de ores brancas. Qual é a probabilidade de que:
(a) a primeira semente seja vermelha?
(b) a segunda seja branca se a primeira foi vermelha?
(c) a segunda seja vermelha se a primeira foi vermelha?
Sejam os eventos:
V1 : "a primeira semente selecionada é vermelha"
V1c : "a primeira semente selecionada é branca"
V2 : "a segunda semente selecionada é vermelha"
V2c : "a segunda semente selecionada é branca"
10
(a) A probabilidade de que a primeira semente seja vermelha é 15 = 23 . Pois há 10 sementes de ores
vermelhas em um total de 15; isto é, P (V1 ) = 32 .
5
(b) A probabilidade de que a segunda semente seja branca se a primeira foi vermelha é 14 , já que
5
ainda existem 5 sementes brancas em um total de 14; isto é, P (V2c |V1 ) = 14 .
9
(c) A probabilidade de que a segunda seja vermelha se a primeira foi vermelha é 14 , já que ainda
9
existem 9 sementes vermelhas em um total de 14, isto é,P (V2 |V1 ) = 14 .
Essas probabilidades podem ser representadas em um diagrama da árvore de probabilidades, que é

mostrado na gura 3.1,
Figura 3.1: Diagrama da arvore de probabilidade
Da denição de probabilidade condicional e do teorema 3.3.1 podem ser mostrados o seguintes resul-
tados:
Teorema 3.4.1 Se B é um evento em Ω, tal que, P (B) > 0 então
1. P (∅|B) = 0
2. o A ⊂ Ω então
P (Ac |B) = 1 − P (A|B) ou P (A|B) = 1 − P (Ac |B)
3. Se A e C são eventos em Ω tal que, A ⊂ C , então
P (A|B) ≤ P (C|B)
4. Se A e C são eventos em Ω, então
P (A ∪ C|B) = P (A|B) + P (C|B) − P (A ∩ C|B)
Exemplo 3.4.2 Em uma cidade, a probabilidade de chuva no primeiro dia de setembro é 0,50 e a
probabilidade de chuva nos dois primeiros dias de setembro é 0,40. Se no primeiro dia de setembro
choveu, qual é a probabilidade que no dia seguinte não chova ?
Solução: denem-se os eventos: A : Chove no primeiro dia setembro. B : Chove no segundo dia de
setembro. Do enunciado do problema tem-se : P (A) = 0, 50 e P (A ∩ B) = 0, 40. A probabilidade
pedida é P (B c |A). Pelo teorema 3.4.1, tem-se:
P (A ∩ B) 0, 40
P (B c |A) = 1 − P (B|A) = 1 − =1− = 0, 20.
P (A) 0, 50
Exemplo 3.4.3 Uma faculdade, em seu primeiro ano de funcionamento tem três cursos: Ciências,
Administração e Engenharia. A classicação dos alunos por sexo, é apresentada na tabela a seguir.
Tabela 3.3: Distribuição de alunos por curso e por sexo.

Sexo Ciência Administração Engenharia Total
Masculino 250 350 200 800
Feminino 100 50 50 200
Total 350 400 250 1000
Um estudante é selecionado ao acaso.
(a) Sabe-se que o estudante escolhido é do sexo masculino, qual é a probabilidade de que ele curse
Ciências?
(b) Sabe-se que o estudante curse Engenharia, qual é a probabilidade de que seja do sexo feminino?
(c) Sabe-se que o estudante é do sexo feminino, qual é a probabilidade de que curse Ciências ou
Administração?
Solução: Sejam os eventos:

B1 : O estudante selecionado do sexo masculino.
B2 : O estudante selecionado do sexo feminino.
A1 : O estudante é do curso de Ciências.
A2 : O estudante é do curso de Administração.
A3 : O estudante é do curso de Engenharia.
As probabilidade de ocorrência dos eventos são:

800 200
P (B1 ) = = 0, 80; P (B2 ) = = 0, 20,
1000 1000
Essas probabilidade algumas vezes são chamadas de probabilidades marginais. Similarmente, P (A1 ) =
250 400 250
1000 = 0, 35; , P (A2 ) = 1000 , e P (A3 ) = 1000 = 0, 25, são probabilidades marginais.
As probabilidade: P (Ai ∩ Bj ), i = 1, 2 e j = 1, 2, 3 são chamados de probabilidades conjuntas. Essas
probabilidades são mostradas na tabela 3.4.
Tabela 3.4: Distribuição de probabilidade conjunta e marginal do exemplo 3.4.3.

A1 A2 A3 P (Bi )
B1 0,25 0,35 0,20 0,80
B2 0,10 0,05 0,05 0,20
P (Aj ) 0,35 0,40 0,25 1
P (A1 ∩B1 ) 0,25

(a) P (A1 |B1 ) = P (B1 ) = 0,80 = 0, 3125
P (A3 ∩B2 ) 0,05
(b) P (B2 |A3 ) = P (A3 ) = 0,025 = 0, 20
(c)
P (A1 ∪ A2 |B2 ) = P (A1 |B2 ) + P (A2 |B2 ) − P (A1 ∩ A2 |B2 )

P (A1 ∩ B2 ) P (A2 ∩ B2 ) P (A1 ∩ A2 ∩ B2 )
= + −
P (B2 ) P (B2 ) P (B2 )
0, 10 0, 05
= + + 0 = 0, 75.
0, 20 0, 20
Da expressão (3.2), pode-se deduzir uma relação bastante útil,
P (A ∩ B) = P (A)P (B|A).
Essa expressão é conhecida com a regra do produto de probabilidade ou probabilidade da inter-

secção que indica que a probabilidade de que ocorram os eventos A e B é igual à probabilidade de
ocorrência do evento A vezes a probabilidade de que ocorrência do evento B , dado que o evento A
ocorreu.
Exemplo 3.4.4 No exemplo 3.4.1, suponha que se tenha interesse em determinar a probabilidade de
que as duas sementes selecionadas sejam brancas
Solução: O evento é V1c ∩ V2c : "a primeira e a segunda sementes de ores são brancas"
5 4 2
P (V1c ∩ V2c ) = P (V1c )P (V2c |V1c ) = × =
15 14 21
Teorema 3.4.2 Se A, B e C são eventos de Ω, tais que P (A) 6= 0 e P (A ∩ B) 6= 0, então

P (A ∩ B ∩ C) = P (A)P (B|A)P (C|A ∩ B)
Exemplo 3.4.5 Dois currais A e B têm 1000 cabeças de gado cada um. Existe uma epidemia que
afeta os cascos e a boca do gado. 20% dos animais do curral A têm doença e 75% dos animais do
curral B estão sadios. Escolhe-se um gado ao acaso .
(a) Qual é a probabilidade de que o gado escolhido venha do curral A e tenha afecção aos cascos e a
boca?
(b) Dos animais do curral B, afetados pela doença o 70% são menores de um ano. Qual é a proba-
bilidade que o gado escolhido venha do curral B, tenha a doença e seja maior de um ano?

A: O gado escolhido é do curral A
B: O gado escolhido é do curral B
E: O gado escolhido estão afetados ao casco e boca
F: O gado escolhido tem idade acima de ano.
(a) Deve-se calcular
1000
P (A ∩ E) = P (A)P (E|A) = × 0, 20 = 0, 10.
2000
(b) A probabilidade pedida é:
1000 3
P (B ∩ E ∩ F ) = P (B)P (E|B)P (F |B ∩ E) = × (0, 25) × (0, 30) = .
2000 80
Denição 3.4.2 (Independência de eventos) Dois eventos A e B são independentes se a infor-

mação da ocorrência ou não de B não altera a probabilidade da ocorrência de A. Isto é,
P (A|B) = P (A), P (B) > 0.
Conseqüentemente, dois eventos A e B são independentes se e somente se,
P (A ∩ B) = P (A)P (B).
Exemplo 3.4.6 Em uma escola 20% dos alunos tem problemas visuais, 8% problemas auditivos e 4%
tem problemas visuais e auditivos. Seleciona-se um aluno dessa escola ao acaso:
(a) os eventos de ter problemas visuais e auditivos são eventos independentes ?
(b) se o aluno selecionado tem problemas visuais, qual é a probabilidade de que tenha problemas
auditivos?
(c) qual é a probabilidade de não ter problemas visuais ou o ter problemas auditivos ?

V: "o aluno tem problemas visuais"
A: "o aluno tem problemas auditivos"
Do enunciado do problema temos: P (V ) = 0, 20, P (A) = 0, 08 e P (A ∩ V ) = 0, 04. A partir desta
informação, é possível construir a seguinte tabela:
V Vc total
A 0,04 0,04 0,08
Ac 0,16 0,76 0,92
total 0,20 0,80 1,00
(a) P (V )P (A) = 0, 2 × 0, 08 = 0, 16
P (V ∩ A) = 0, 04.
Como P (V ∩ A) 6= P (V )P (A), A e V não são independentes.
P (A∩V ) 0,04
(b) P (A|V ) = P (V ) = 0,20 = 0, 20
(c) P (V c ∪ A) = P (V c ) + P (A) − P (V c ∩ A) = 0, 8 + 0, 08 − 0, 04 = 0, 84
Uma conseqüência imediata da denição 3.4.2 é o teorema seguinte:
Teorema 3.4.3 Se A e B, eventos em Ω, são eventos independentes, então
(i) A e B c são independentes;

(ii) Ac e B são independentes;
(iii) Ac e B c são independentes.
O teorema mostra que se os eventos A e B são independentes então os complementares também são
independentes. ( A demonstração é deixada para o leitor)
Exemplo 3.4.7 Sejam A e B dois eventos independentes, tais que a probabilidade de que ocorram
simultaneamente os dois eventos é 1/6 e a probabilidade de que nenhum dos eventos ocorra é 1/3.
Determine P (A) e P (B).
1 1
Solução: Do enunciado tem-se: P (A ∩ B) = 6 e P (Ac ∩ B c ) = 3
Se A e B são independentes, então
1
P (A ∩ B) = P (A)P (B) = (3.3)
6
Assim sendo Ac e B c são também independentes (pelo teorema 3.4.3.iii). Isto é,
1
= P (Ac ∩ B c ) = P (Ac )P (B c ) = [1 − P (A)][1 − P (B)]
3
1
= 1 − P (A) − P (B) + P (A)P (B) = 1 − P (A) − P (B) + . O qual implica
6
5
P (B) = − P (A). (3.4)
6
Substituindo (3.4) em (3.3) vem:
· ¸
5 1
P (A) − P (A) =
6 6
5 1
P (A)2 − P (A) + = 0.
6 6
Resolvendo a equação do segundo grau encontra-se P (A) = 1/3 ou P (A) = 1/2. Logo, o conjunto de
soluções é: {P (A) = 1/3, P (B) = 1/2} ou {P (A) = 1/2, P (B) = 1/3}.
Exemplo 3.4.8 Um atirador acerta 80% de seus disparos e outro (na mesmas condições de tiro),
70%. Qual é a probabilidade de acertar se ambos atiradores disparam simultaneamente o alvo? Consi-
dere que o alvo foi acertado quando pelo menos uma das duas balas tenha feito impacto no alvo.
Solução: sejam os eventos: Bi : "o atirador i acerta o alvo, i = 1, 2". P (B1 ) = 0, 80 e P (B2 ) = 0, 70.
Logo,
P (B1 ∪ B2 ) = P (B1 ) + P (B2 ) − P (B1 ∩ B2 )

= P (B1 ) + P (B2 ) − P (B1 )P (B2 )
= 0, 80 + 0, 7 − (0, 8)(0, 7) = 0, 94.
Alternativamente, esse exemplo pode ser resolvido de uma segunda forma,
P (B1 ∪ B2 ) = 1 − P (B1c ∩ B2c )

= 1 − [1 − P (B1 )][1 − P (B2 )]
= 1 − [1 − 0, 80][1 − 0, 70] = 0, 94.
Teorema 3.4.4 Se A1 , A2 , . . . , An são n eventos em Ω independentes, então

n
[
P( Ai ) = 1 − [1 − P (A1 )] [1 − P (A2 )] . . . [1 − P (An )]
i=1
A demonstração se deixa para o leitor.
Exemplo 3.4.9 A probabilidade de que falhe um motor em um avião é 0,10. Com quantos motores
deve estar equipado um avião par ter uma seguridade de 0,999 de que o avião voe? (Suponha que é
suciente que um motor funcione para que o avião se mantenha em vôo)
Solução: Sejam os seguintes eventos:

Mi : O motor i funciona perfeitamente, i = 1, . . . , n,
A: O avião se mantém em vôo.
Os eventos Mi são independentes, e P (Mi ) = 0, 9 para i = 1, . . . , n
S
n
O evento A é equivalente a: A = Mi . Usando o teorema 3.4.4,
i=1
n
[
0, 999 = P (A) = P ( Mi ) = 1 − [1 − P (M1 )] [1 − P (M2 )] . . . [1 − P (Mn )] = 1 − [0, 1]n .
i=1
Logo, (0, 1)n = 0, 001. Daí, tem-se n = 3. Portanto, o avião deve ser equipado com três motores.
Figura 3.2: Condições de denição do teorema de Bayes para o caso de k = 4
3.5 Teorema de Bayes

Denição 3.5.1 (Partição de um espaço amostral) Uma coleção de eventos B1 , B2 , . . . , Bk for-
mam uma partição do espaço amostral, se eles não tem intersecção entre si e sua união é igual ao
espaço amostral completo
Teorema 3.5.1 (Teorema da probabilidade total) Se B1 , B2 , . . . , Bk formam uma partição do

espaço amostral Ω, qualquer evento A, em Ω, satisfaz :
k
X
P (A) = P (Bi )P (A|Bi ) = P (B1 )P (A|B1 ) + · · · + P (Bk )P (A|Bk )
i=1
Demonstração: Das condições do teorema temos que

1. Ω = B1 ∪ B2 ∪, · · · ∪ Bk , (hipóteses)
2. Para qualquer evento A em Ω tem-se
A =A ∩ Ω
=A ∩ (B1 ∪ B2 ∪, · · · ∪ Bk )
=(A ∩ B1 ) ∪ (A ∩ B2 ) ∪ · · · ∪ (A ∩ Ak )
3. Os eventos (A ∩ B1 ), (A ∩ B2 ), . . . , (A ∩ Ak ) são mutuamente exclusivos
4. Tomando probabilidades em ambos membros da igualdade da equação (2) vem
P (A) = P (A ∩ B1 ) + P (A ∩ B2 ) + · · · + P (A ∩ Ak )
= P (B1 )P (A|B1 ) + P (B2 )P (A|B2 ) + · · · + P (Bk )P (A|Bk )
k
X
P (A) = P (Bi )P (A|Bi ).
i=1
Teorema 3.5.2 (Teorema de Bayes) Se B1 , B2 , . . . , Bk formam uma partição do espaço amostral,

Ω e A é qualquer evento em Ω então
P (Bi )P (A|Bi )
P (Bi |A) =
P
k
P (Bi )P (A|Bi )
i=1
Este teorema resulta de uma conseqüência imediata do teorema da probabilidade total
Exemplo 3.5.1 Das pacientes de uma clínica de Ginecologia com idade acima de 40 anos, 70% são
ou foram casadas e 30% são solteiras. E sendo solteira, a probabilidade de ter um distúrbio hormonal
no último ano é 20% enquanto para as demais a probabilidade aumenta para 40%. Se um paciente é
escolhido ao acaso de todas as pacientes da clínica,
(a) qual é a probabilidade dela ter distúrbio hormonal?
(b) se a paciente escolhida resultou ter distúrbio hormonal qual é probabilidade dela ser solteira?

S: "a paciente sorteada seja solteira"
C: "a paciente sorteada seja casada"
D: "paciente sorteada com distúrbio hormonal"
DC "paciente sorteada sem distúrbio hormonal."
Do enunciado tem-se: P (S) = 0, 30, P (C) = 0, 70, P (D|S) = 0, 20 e P (D|C) = 0, 40. Pelo teorema da
probabilidade total dada em (3.5.1) vem:
(a) P (D) = P (S)P (D|S) + P (C)P (D|C) = 0, 30 × 0, 20 + 0, 70 × 0, 40 = 0, 34 (ou 34%)
(b) Pelo teorema de Bayes tem-se :
P (S)P (D|S) 0, 30 × 0, 20 3
P (S|D) = = =
P (D) 0, 34 17
3.6 Exercícios Resolvidos

1. Uma pesquisa de opinião determinou que a probabilidade de que uma pessoa consuma o produto
A é 0,50, que consuma o produto B é 0,37 que consuma o produto C é 0,30, que consuma A e B
é 0,12, que consuma somente o produto A e C é 0,08, que consuma somente B e C é 0,5 e que
consuma somente C é 0,15. Obtenha a probabilidade de que uma pessoa consuma:
(a) A ou B mas não C.

(b) Somente A.

A: A pessoa consuma o produto A

Ac : A pessoa não consume o produto A
B: A pessoa consume o produto B
Bc: A pessoa não consume o produto B
C: A pessoa consuma o produto C
C c: A pessoa não consume o produto C
Do enunciado do problema tem-se:
P (A) = 0, 50; P (B) = 0, 37; P (C) = 0, 30; P (A ∩ B) = 0, 12.
O evento somente A e C , escreve-se: A ∩ B c ∩ C ; logo, P (A ∩ B c ∩ C) = 0, 08.
Similarmente o evento somente B e C escreve-se: Ac ∩ B ∩ C ; portanto, P (Ac ∩ B ∩ C) = 0, 05.
E o evento somente C , escreve-se: Ac ∩ B c ∩ C . Logo, P (Ac ∩ B c ∩ C) = 0, 15.
(a) Pede-se calcular a probabilidade do evento (A ∪ B) ∩ C c .
Observe que
P ((A ∪ B) ∩ C c ) = 1 − P ((Ac ∩ B c ) ∪ C) (3.5)
Pela propriedade de probabilidade tem-se:
P ((Ac ∩ B c ) ∪ C) = P (Ac ∩ B c ) + P (C) − P (Ac ∩ B c ∩ C). (3.6)
Mas,
P (Ac ∩ B c ) = 1 − P (A ∪ B) (3.7)
= 1 − [P (A) + P (B) − P (A ∩ B)]
= 1 − [0, 5 + 0, 37 − 0, 12] = 0, 25
Substituindo esse valor em (3.6), vem:
P ((Ac ∩ B c ) ∪ C) = 0, 25 + 0, 30 − 0, 15 = 0, 40
Finalmente, substituindo em (3.5) obtém-se a probabilidade pedida, ou seja,
P ((A ∪ B) ∩ C c ) = 1 − 0, 40 = 0, 60.
(b) O evento somente A, escreve-se: A ∩ B c ∩ C c . Mas o evento A pode ser escrito como a união
de eventos mutuamente exclusivos (disjuntos), isto é:
A = (A ∩ B) ∪ (A ∩ B c ∩ C) ∪ (A ∩ B c ∩ C c ).
Portanto,
P (A) = P (A ∩ B) + P (A ∩ B c ∩ C) + P (A ∩ B c ∩ C c ),
sendo
P (A ∩ B c ∩ C c ) = P (A) − P (A ∩ B) − P (A ∩ B c ∩ C)
= 0, 50 − 0, 12 − 0, 08 = 0, 30.
Uma forma prática de resolver esse exercício é levando os dados do problema para um diagrama
de Venn, como se observa na gura 3.3. Além disso, observe que as probabilidades indicadas no
diagrama correspondem a eventos mutuamente exclusivos. Logo,
(a) P ((A ∪ B) ∩ C c ) = 0, 30 + 0, 10 + 0, 20 = 0, 60
(b) P (A ∩ B c ∩ C c ) = 0, 3
Figura 3.3: Digrama de Venn do exercício 1
2. A probabilidade de que a construção de um prédio termine a tempo é 17/20, a probabilidade de

que não haja greve é 3/4, a probabilidade de que a construção termine a tempo dado que não
houve greve é 14/15 e a probabilidade de que haja greve e a construção não termine a tempo é
1/10. Qual é a probabilidade de que:
(a) A construção termine a tempo e não haja greve?

(b) Não haja greve dado que a construção terminou a tempo?
(c) A construção não termine a tempo se houve greve?
(d) A construção não termine a tempo se não houve greve?
Solução: Sejam os eventos

A: A construção termine a tempo,
B: Não haja greve.
Do enunciado do problema tem-se:
17 3 14 1
P (A) = ; P (B) = ; P (A|B) = , P (Ac ∩ B c ) =
20 4 15 10
3 14 7
(a) P (A ∩ B) = P (B)P (A|B) = = = 0, 7 (pela regra do produto).
4 15 10
P (A ∩ B) 7/10 14
(b) P (B|A) = = = (da denição de probabilidade condicional)
P (A) 17/20 17
P (Ac ∩ B c ) P (Ac ∩ B c ) 1/10 2
(c) P (Ac |B c ) = c
= = 3 = .
P (B ) 1 − P (B) 1− 4 5
14 1
(d) P (Ac |B) = 1 − P (A|B) = 1 − = (pelo teorema 3.4.1.3)
15 15
3. Os membros de um clube são médicos ou são advogados , 40% dos membros são médicos enquanto
que 30% das mulheres, são médicas. 50% dos médicos e 30% dos advogados ganham mais de
R$ 100.000 por ano. Porem, somente 20% das mulheres médicos e 10% das mulheres advogadas
ganham mais de R$ 100.000, por ano. Se um membro do clube é sorteado ao acaso,
(a) Qual é a probabilidade de que ganhe mais R$ 100.000 por ano?

(b) Se a pessoa escolhida foi mulher, qual é a probabilidade de que ela ganhe mais de R$ 100.000
por ano.?

M: O membro do clube é médico.
A: O membro do clube é advogado.
F: O membro do clube é do sexo feminino.
G: O membro do clube ganhe mais de R$ 100.000 por ano
(a) Deve-se calcular P (G).
Ω = A ∪ M e A ∩ M =. Assim, os eventos A e M formam uma partição do espaço amostral Ω
(0 clube). Além disso, G ⊂ Ω e G = (A ∩ G) ∪ (M ∩ G). Aplicando o teorema de probabilidade
total 3.5.1 temos,
P (G) = P (A)P (G|A) + P (M )P (G|M )

= (0, 6)(0, 3) + (0, 4)(0, 5) = 0, 38.
(b) Deve-se calcular P (G|F ). De (a) tem-se G = (A ∩ G) ∪ (M ∩ G). Logo,
P (G|F ) = P ((A ∩ G) ∪ (M ∩ G)|F ) = P (A ∩ G|F ) + P (M ∩ G|F )

= P (A|F )P (G|A ∩ F ) + P (M |F )P (G|M ∩ F )
= (0, 7)(0, 1) + (0, 30)(0, 2) = 0, 13.
4. Uma empresa de desenvolvimento urbano está considerando a possibilidade de construir um cen-

tro comercial na região de Belo Horizonte. Uma condição para que essa obra seja realizada é
a construção de uma estrada que une a região ao centro da cidade. Se a prefeitura aprova a
construção da estrada, há uma probabilidade de 0,90 de que a empresa construa o centro comer-
cial, no entanto se a estrada não é aprovada a probabilidade é de 0,20. Baseado na informação
disponível, o presidente da empresa estima que há uma probabilidade de 0,60 de que a construção
da estrada seja aprovada pela prefeitura.
(a) Qual é a probabilidade de que a empresa construa o centro comercial ?

(b) Se o centro comercial foi construído, qual é a probabilidade de que a estrada tenha sido
aprovada pela prefeitura.?
(c) Se o centro comercial foi construído, qual é a probabilidade de que a estrada não tenha sido
aprovada pela prefeitura?
Solução: dene-se os eventos:

A: A estrada é aprovada.
B: O centro comercial é construído.
(a) Deve-se calcular P (B), aplicando o teorema de probabilidade total 3.5.1. O evento B é
equivalente a: B = (A ∩ B) ∪ (Ac ∩ B). Logo,
P (B) = P (A ∩ B) + P (Ac ∩ B) = P (A)P (B|A) + P (Ac )P (B|Ac )

= (0, 6)(0, 90) + (0, 4)(0, 20) = 0, 54 + 0, 08 = 0, 62.
(b) A probabilidade pedida é P (A|B). do teorema de Bayes tem-se:
P (A)P (B|A) 0, 6 × 0, 9 54
P (A|B) = = = 0, 87
P (B) 0, 62 62
(c) Deve-se calcular P (AC |B). Do teorema 3.4.1, tem-se:
P (Ac |B) = 1 − P (A|B) = 1 − 0, 87 = 0, 13.
5. O gerente da empresa EX viaja em um avião de 6 motores para assistir a uma reunião importante
em EEUU. A probabilidade de que motor falhe é de 0,10 e cada um funciona independentemente
dos outros. Precisa-se de que pelo menos um motor de cada lado do avião funcione. Qual é a
probabilidade que o gerente esteja ausente na reunião por causa de um acidente com seu avião?
Mi : O i-ésimo motor funciona perfeitamente i = 1, . . . , 6.
A: O gerente esteja ausente na reunião por causa do acidente.
Ac : O gerente não esteja ausente na reunião por causa do acidente.
Deve-se determinar a probabilidade do evento A,isto é,
P (A) = 1 − P (Ac ) (3.8)
Do enunciado do problema tem-se: P (Mi ) = 0, 90, i = 1, . . . , 6. Suponhamos que os motores M1 ,

M2 e M3 estejam de um lado e os motores M4 , M5 e M6 do outro lado. Além disso, os Mi são
independentes i = 1, . . . , 6.
O evento Ac é equivalente à ocorrência conjunta dos eventos,
E : Ao menos um dos motores Mi funcionam perfeitamente i = 1, 2, 3.
F : Ao menos um dos motores Mi funcionam perfeitamente i = 4, 5, 6
S
3 S
6
Ou seja E = Mi e F = Mi , Portanto, Ac = E ∩ F. Já que os eventos E e F são
i=1 i=4
independentes, implica
Ã 3
! Ã 6
!
[ [
P (Ac ) = P (E)P (F ) = P Mi P Mi
i=1 i=4
= (1 − [1 − P (M1 )][1 − P (M2 )][1 − P (M3 )]) (1 − [1 − P (M4 )][1 − P (M5 )][1 − P (M0 )])
= (1 − (0, 1)3 )(1 − (0.1)3 ) = (0, 999)2 = 0, 998001.
A segunda igualdade da equação acima deve-se ao teorema 3.4.4. Substituindo este resultado em
(3.8) temos que:
P (A) = 1 − 0, 998001 = 0, 001999.
Figura 3.4: Diagrama de um circuito.
6. A probabilidade de fechamento de cada relê do circuito apresentado na gura 3.4 é dado por p.
Se todos os relê funcionarem independentemente, Qual é a probabilidade de que haja corrente
entre os terminais L e R.?
Ri : O relê i está fechado, i = 1, . . . , 6.
A: A corrente passa por L e R.
Do enunciado do problema tem-se: P (Ri ) = p e A = (R1 ∩R2 )∪(R3 ∩R4 )∩(R5 ∩R6 ) (observe que
(R1 ∩ R2 ), (R3 ∩ R4 ) e (R5 ∩ R6 ) não são mutuamente exclusivos (disjuntos)). Se B1 = R1 ∩ R2 ,
B2 = R3 ∩ R4 e B3 = R5 ∩ R6 . Portanto,
P (A) = P (B1 ∪ B2 ∪ B3 ) = P (B1 )+P (B2 )+P (B3 )−P (B1 ∩B2 )−P (B1 ∩B3 )−P (B2 ∩B3 )+P (B1 ∩B2 ∩B
T
3
Mas, P (Bi ) = p2 , i = 1, 2, 3; P (Bi ∩ Bj ) = p4 , i 6= j = 1, 2, 3 e P ( Bi ) = p6 . Daí tem-se:
i=1
P (A) = 3p2 − 3p4 + p6
3.7 Exercícios
1. Determine um possível espaço amostral para experimentos descritos abaixo:
(a) Um posto tem dois tipos de vacina (A e B). Três vacinas são selecionadas , uma de cada vez,
ao acaso e com reposição , observando-se (i) o número de vacinas do tipo A; (ii) o número
de vacinas do tipo B.
(b) Lança-se duas moedas e anota-se a conguração
(c) Conta-se o número de peças produzidas em um dia numa industria
(d) Observa-se uma lâmpada até que se queime
(e) Inspeciona-se três peças para vericar se são defeituosas ou não
2. Sejam A, B e C três eventos quaisquer no espaço amostral Ω. Expresse cada um dos eventos em
termos de operações entre A, B e C.
(a) Ocorre exatamente dois dos eventos.

(b) Ocorre pelo menos um dos eventos.
(c) Ocorre todos os eventos.
(d) Não ocorre nenhum dos eventos.
(e) Não ocorre A, ou não ocorre B ou não ocorre C.
(f) Ocorre exatamente um dos eventos.
(g) Ocorre pelo menos um dos eventos.
3. Um número é escolhido ao acaso, dentre os números 1,2,. . . ,50. Qual é a probabilidade de que o
número escolhido seja divisível por 6 ou por 8?
4. Sejam A e B eventos de Ω, tais que P (A) = 0, 5, P (B) = 0, 25 e P (A ∩ B) = 0, 2. Calcular

P (A ∪ B), P (A ∩ B c ), P (Ac ∩ B c ), P (Ac |B c ) e P (B c |Ac )
5. Uma urna contém 30 bolas numeradas de 1 a 30. Três bolas são sorteadas ao acaso da urna.
Qual é a probabilidade de que a soma dos números sorteados seja par?
6. Lança-se um dado 12 vezes. Determinar a probabilidade de obter:
(a) dois "seis".

(b) no máximo dois "seis".
7. Em um determinado exame de seleção foram propostos dois problemas. Sabendo-se que 132
indivíduos acertaram o primeiro, 86 erraram o segundo, 120 acertaram os dois e 54 acertaram
apenas um problema, qual a probabilidade de que um indivíduo escolhido ao acaso dentre os que
zeram o exame:
(a) Não tenha acertado nenhum problema.

(b) Tenha acertado apenas o primeiro problema.
(c) Tenha acertado apenas o segundo problema.
(d) Tenha acertado pelo menos um problema.
8. Um número é escolhido ao acaso entre os inteiros de 1 a 20 ( isto é, todos tem a mesma proba-
bilidade ). Considere os eventos: A : o número é múltiplo de 3 ; B : o número é ímpar.
(a) Descreva os eventos: A ∩ B , A ∪ B e A ∪ B C

(b) calcule as probabilidades dos eventos em (a).
9. Um restaurante popular oferece dois tipos de refeições: salada completa ou um prato a base de
carne. 20% dos fregueses do sexo masculino preferem salada e 30% das mulheres preferem carne .
75% dos fregueses são homens. Um freguês é escolhido ao acaso. Considere os seguintes eventos:
H: freguês é homem; M : freguês é mulher; A: freguês prefere salada ; B: freguês prefere carne.
Calcule as probabilidades: P (H ∩ A), P (A|H), P (H ∪ B) e P (A).
10. Duas ambulâncias são mantidas em um posto para atender emergência. Devido a vários proble-
mas, como manutenção pôr exemplo, a probabilidade que cada ambulância esteja disponível é
0,9. A disponibilidade de uma ambulância é independente da outra.
(a) Em um acidente qual é a probabilidade de que as duas ambulâncias estejam disponíveis?

(b) Qual a probabilidade de que nenhuma esteja disponível ?

(c) Se uma ambulância é chamada em um acidente, qual a probabilidade de que o chamado
seja atendido?
11. Dois tipos de vacina foram aplicados em uma população de tal forma que 60% das pessoas
receberam vacina do tipo A e as 40% restante receberam vacina do tipo B. Sabendo que a vacina
do tipo A fornece 70% de imunização e a B fornece 80%, determine a probabilidade de que uma
pessoa escolhida ao acaso, (i) esteja imunizado dado que foi vacinada por A; (ii) esteja imunizado;
(iii) tenha sido vacinada pôr A dado que não esteja imunizado.
12. Um pedagogo deseja investigar se a "aversão"pela estatística está relacionada com o sexo. Um
teste investigando atitude é administrado a 2000 estudantes para determinar seus níveis de ansi-
edade em relação à resolução de problemas de estatística . Cada estudante é classicado quanto
a nível (alto ou baixo) de ansiedade e quanto ao sexo. Os resultados são apresentados na tabela
abaixo.
Sexo/ Nível de Ansiedade Alto Baixo Total

Feminino 270 630 900
Masculino 330 770 1100
Total 600 1400 2000
(a) Se um aluno é selecionado qual é a probabilidade de que seja homem e tenha nível de
ansiedade baixo?
(b) Se o aluno selecionado é do sexo feminino, qual é a probabilidade de que tenha nível de
ansiedade baixo?
(c) Com base nesses dados verique se o sexo e o nível de ansiedade são independentes.
13. O senhor X pode ir para sua casa usando a estrada A e a estrada B. Na estrada A ele tem
probabilidade 0,25 de se atrasar devido a engarrafamento, enquanto que na estrada B essa pro-
babilidade vale 0,35. Se ele escolhe o caminho A com probabilidade 0,7 e o caminho B com
probabilidade 0,3: (i) Qual é a probabilidade de que ele se atrase devido a engarrafamento ?, (ii)
se ele se atrasou qual é a probabilidade de que o senhor X tenha escolhido a estrada A.?
14. A probabilidade de uma pessoa contrair meningite durante certo ano é 0,001 se ela for vacinada
0,005 se ela não for vacinada. Se 95% da população for vacinada , (i) qual é a probabilidade de
uma pessoa contrair meningite? (ii) se uma pessoa contrair meningite, qual a probabilidade dela
ter sido vacinada?
15. Numa sorveteria 25% dos clientes são mulheres e o restante são homens. Dentre os homens 30%
gostam de um novo sabor (jiló caramelizado) e, dentre as mulheres, apenas 20%. Escolhendo-se
um cliente ao acaso
(a) qual é a probabilidade dele ser homem e gostar desse novo sabor?
(b) qual é a probabilidade de ser mulher ou não gostar desse novo sabor ?
(c) qual é a proporção de clientes que gostam do novo sabor ?
(d) se o cliente escolhido resultou mulher, qual é a probabilidade de que goste do novo sabor ?
16. Em uma universidade o 70% dos estudantes são de ciências e o 30% são de letras. Dos estudantes
de ciências, 60% são homens e os de letras, 40% são homens. Escolhe-se ao acaso um estudante.
Calcular a probabilidade que:
(a) seja um estudante homem,

(b) seja um estudante homem se é de ciências,
(c) seja uma estudante de ciências, se é homem,
(d) seja um estudante de ciências e mulher.
17. Em uma linha de produção há dois processos A e B. No processo A há 20% de defeituosos e em

B há 25%. Em um lote de 300 produtos há 200 do processo A e 100 do processo B.
(a) Se um produto é sorteado ao acaso, qual é a probabilidade de que seja defeituoso.

(b) Se o produto sorteado resultou ser defeituoso, qual é a probabilidade de que seja do processo
B.
18. Um pesquisador desenvolveu um teste para detectar um certo tipo de doença. Ele usa o teste em
pacientes com ou sem a doença. Suponha que ele aplica o teste em uma população onde a taxa
de incidência da doença é igual a 2%. Sabe-se que em indivíduos sem a doença, a probabilidade
do resultado do teste ser positivo é de 5% (taxa de falso positivo), enquanto que em indivíduos
com a doença, a probabilidade do resultado do teste ser negativo é 20% (taxa de falso negativo).
Selecionando-se um indivíduo, ao acaso, dessa população,
(a) qual é a probabilidade de que o resultado do teste seja positivo?

(b) qual é a probabilidade dele ser portador da doença se o resultado de seu teste foi positivo?
19. Num laboratório há três gaiolas. Na gaiola I há 2 coelhos pardos e 3 brancos, a gaiola II tem 4
coelhos pardos e 3 brancos e a gaiola III contem 5 coelhos pardos e 5 brancos . Seleciona-se, ao
acaso, uma gaiola e tira-se um coelho ao acaso desta gaiola.
(a) Qual é a probabilidade que o coelho escolhido seja branco ?

(b) Se o coelho sorteado foi um coelho pardo, qual é probabilidade de que seja da gaiola III ?
20. No circuito elétrico dado na gura 3.5, em que consiste tensão entre os pontos A e B, determine
a probabilidade de passar corrente entre A e B, sabendo-se que a probabilidade de cada chave
estar fechada é 0,5 e que cada chave está aberta ou fechada independente de qualquer outra.
21. Em uma fábrica, a máquina 1 produz por dia o dobro de peças que máquina 2. Sabe-se que 4%
das peças fabricadas pela maquina 1 tendem a ser defeituosas, enquanto 7% de defeituosas são
produzidas pela máquina 2. A produção diária das maquinas é misturada.
(a) Selecionando-se ao acaso uma peça da produção das maquinas, qual é a probabilidade que
a peça seja defeituosa ?
(b) Se a peça sorteada resultou (em (a)) ser não defeituosa, qual á probabilidade de que ela seja
da maquina 1?
(c) Se selecionamos uma amostra de 3 peças, qual é a probabilidade de que as 2 sejam defeituosas
? (considere que amostra é com reposição)
Figura 3.5: Diagrama de um circuito.
22. Uma cidade tem 30.000 habitantes e três jornais: A, B, e C. Uma pesquisa de opinião revela que
12.000 lêem A, 8.000 lêem B, 7.000 lêem A e B, 6.000 lêem C, 4.500 lêem A e C, 1.000 lêem B e
C e 500 lêem A, B e C. Seleciona-se, ao acaso, um habitante dessa cidade. Qual a probabilidade
de que ele leia: (a) pelo menos um jornal. (b) somente um jornal.
23. Os problemas de assédio sexual têm recebido muita atenção nos últimos anos. Em uma pesquisa,
420 trabalhadores (240 dos quais homens) consideram que uma simples batida no ombro como
uma forma de assedio sexual, enquanto 580 trabalhadores (380 dos quais homens) não consideram
isso como assédio sexual. Escolhido aleatoriamente um dos trabalhadores pesquisados, determine:
(a) a probabilidade de obter alguém que não considere um simples tapa no ombro uma forma
de assedio sexual.
(b) De escolher um homem ou alguém que não considere uma simples batida no ombro como
uma forma de assédio sexual.
24. Dois processadores, um do tipo A e outro do tipo B são colocados em teste por 50 mil horas. A
probabilidade que um erro de cálculo aconteça em um processador do tipo A é de 2/60, no tipo
B, 1/80 e em ambas, 1/1000. Qual é a probabilidade de que somente o processador A ou apenas
o processador B tenha apresentado erro.?
25. Uma montadora trabalha com 2 fornecedores (A e B) de uma determinada peça. As chances de
que uma peça proveniente dos fornecedores A e B esteja fora das especicações são 10% e 5%
respectivamente. A montadora recebe 30% das peças do fornecedor A e 70% de B.
(a) Se uma peça do estoque inteiro é escolhida ao acaso, calcule a probabilidade de que ela
esteja fora das especicações.
(b) Se uma peça do estoque inteiro é escolhida ao acaso e verica-se que ela está fora das
especicações, de qual fornecedor ela é mais provável de ter vindo ?
26. Suponha que A e B são eventos independentes associados a um mesmo experimento aleatório,
a P (A ∪ B) é de 0,6 enquanto que a probabilidade de que somente A ocorra é de 0, 2. Qual é
probabilidade de que somente ocorra o evento B.?
27. Três maquinas A B e C apresentam, respectivamente, 10%, 20% e 30% de defeituosos na sua
produção. Se as três maquinas produzem igual quantidade de peças e retiramos duas peças ao
acaso da produção global qual é a probabilidade que as duas sejam perfeitas.?
28. Um dado é viciado de tal forma que a probabilidade de dar "seis"é 1/5, sendo os demais resultados
equiprováveis. Jogando-se esse dado juntamente com o dado normal, calcule a probabilidade de
que
(a) a soma dos pontos seja igual a 10.

(b) tenha dado ponto 6 no dado viciado, sabendo que a soma dos pontos seja superior a 9.
Capítulo 4
Variáveis Aleatórias
4.1 Introdução e Denição de Variável Aleatória

Na análise estatística de alguma característica (variável) de interesse da população é freqüente que seu
valor numa futura observação não se pode predizer com certeza; assim por exemplo, quando se estuda
o consumo dos clientes de uma loja, é difícil saber com precisão quanto gastará o seguinte cliente
que ingresse na loja. Nesses casos, a análise será mas simples se for estabelecido o comportamento
probabilístico da variável para assim, poder estabelecer uma metodologia para estimar seu compor-
tamento futuro. Nesse capítulo são apresentados os procedimentos clássicos para avaliar e analisar o
comportamento aleatório das variáveis.
Denição 4.1.1 (Variável aleatória) Seja Ω o espaço amostral associado a um experimento alea-
tório. Uma variável aleatória, X , é uma função que tem como domínio em Ω e como contradomínio
um subconjunto dos números reais,RX ⊂ R.
Por exemplo, retira-se, ao acaso, um artigo de um grande lote e denem-se as variáveis:
X : Número de falhas do artigo..

Y : Tempo de vida do artigo. .
74
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 75
O espaço amostral associado a esse experimento aleatório é:
Ω = {a1 , a2 , a3 , . . .}
Para o exemplo, os valores possíveis da variável X são 0, 1, 2, ..., e os valores possíveis da variável Y
serão números reais não negativos. Ou seja, o contradomínio das variáveis X , Y são:
RX = {x; x = 0, 1, 2, 3, ...}
RY = {y; y ≥ 0, y²R}
As variáveis aleatórias podem ser classicados, segundo o tipo de contradomínio em 2 tipos:
• Variáveis aleatórias discretas. Aquelas variáveis cujo contradomínio é um conjunto nito ou

innito enumerável de valores. No exemplo anterior, X é uma variável aleatória discreta pois seu
contradomínio RX é um conjunto innito enumerável.
• Variáveis aleatórias continuas. Aquelas variáveis cujo contradomínio é um conjunto innito não
enumerável. No exemplo anterior, Y é uma variável aleatória continua pois seu contradomínio
RY é o conjunto innito não enumerável com innitos de elementos.
4.2 Variáveis Aleatórias Discretas

4.2.1 Função de probabilidade
Se X é uma variável aleatória discreta que tem como contradomínio RX , uma função f (x) é chamada
função de probabilidade da variável aleatória X se tem como domínio RX , e como contradomínio um
conjunto de número reais P (X = xi ] = f (xi ) que satisfaz as seguintes condições:
1. P [X = xi ] = f (xi ) ≥ 0, se xi ∈ Rx ;
2. 0 ≤ f (xi ) ≤ 1, se xi ∈ Rx ;
P
3. f (xi ) = 1.
xi ∈RX
Exemplo 4.2.1 Suponha que 3 artigos são retirados ao acaso um a um e sem reposição de uma caixa
que contém 10 unidades das quais 2 são defeituosos. Seja a variável aleatória, X : Número de artigos
não defeituosos na amostra. Determinar a função de probabilidade de X .
O espaço amostral,Ω, associado ao experimento aleatório é dado por:
Ω = {D1 D2 D3c , D1 D2c D3 , D1c D2 D3 D1 D2c D3c , D1c D2 D3c , D1c D2c D3 , D1c D2c D3c },
onde Di e Dic representam respectivamente, o i-ésimo artigo defeituoso e não defeituoso, i = 1, 2, 3.

Como X conta o número de artigos não defeituosos, segue imediatamente que X pode assumir os
valores 1, 2 e 3. Para deduzir a função de probabilidade de X , observe que o valor 1 ocorre nos eventos
{D1 D2 D3c }, {D1 D2c D3 } e {D1c D2 D3 }, enquanto que o valor 2, tem os eventos {D1 D2c D3c },{D1c D2 D3c }
e {D1c D2c D3 }, e valor 3, tem apenas um evento a ele associado, ou seja, {D1c D2c D3c }. Segue, então, as
probabilidades associadas aos valores X
f (1) = P [X = 1] = P [(D1 , D2 , D3c ) ∪ (D1 , D2c , D3 ) ∪ (D1c , D2 , D3 )]
= P [(D1 , D2 , D3c ) + P [(D1 , D2c , D3 )] + P [(D1c , D2 , D3 )]
= (2/10)(1/9)(8/8) + (2/10)(8/9)(1/8) + (8/10)(2/9)(1/8) = 1/15
f (2) = P [X = 2] = P [(D1 , D2c , D3c ) ∪ (D1c , D2 , D3c ) ∪ (D1c , D2c , D3 )]

= P [(D1 , D2c , D3c ) + P [(D1c , D2 , D3c )] + P [(D1c , D2c , D3 )]
= (2/10)(8/9)(7/8) + (8/10)(2/9)(7/8) + (8/10)(7/9)(2/8) = 7/15
f (3) = P [X = 3] = P [(D1c , D2c , D3c )] = (8/10)(7/9)(6/8) = 7/15.
Conseqüentemente a função de probabilidade da variável aleatória X é dada por:


 1/15, se x = 1
f (x) = P (X = x) 7/15, se x = 2, 3 (4.1)

0, caso contrário
O gráco dessa distribuição de probabilidade é:
Figura 4.1: Gráco da função de probabilidade da variável aleatória X.
4.2.2 Função de distribuição acumulada de uma variável aleatória discreta

Outro conceito importante no desenvolvimento dos seguintes capítulos é a função de distribuição acu-
mulada ou simplesmente função de distribuição (FDA) de uma variável aleatória.
Denição 4.2.1 Seja X uma variável aleatória discreta com contradomínio RX = {x1 , x2 , . . . } e
função de probabilidade f (xi ) = P (X = xi ). Seja x ∈ R, a função de distribuição acumulada de X
denotado por F (x), é denida como:
X X
F (x) = P (X ≤ x) = f (xi ) = P (X = xi ) onde xi ∈ RX
xi ≤x xi ≤x
Exemplo 4.2.2 Considere o exemplo 4.2.1. Determine a função de distribuição da variável aleatória
X : número de artigos não defeituosos. Ou seja, F (x).
Neste caso RX = {1, 2, 3} portanto,
Se x < 1 F (x) = P (X ≤ x) = 0
X 1
Se x = 1 F (1) = P (X ≤ 1) = P (X = xi ) = P (X = 1) = f (1) =
15
xi ≤1
X 1 1
Se 1 ≤ x < 2 F (x) = P (X ≤ x) = P (X = xi ) = P (X = 1) = =
15 15
xi ≤x
X 1 7 8
Se x = 2 F (2) = P (X ≤ 2) = P (X = xi ) = P (X = 1) + P (X = 2) = + =
15 15 15
xi ≤2
X 1 7 8
Se 2 ≤ x < 3 F (x) = P (X ≤ x) = P (X = xi ) = P (X = 1) + P (X = 2) = + =
15 15 15
xi ≤x
X
Se x = 3 F (3) = P (X ≤ 3) = P (X = xi ) = P (X = 1) + P (X = 2) + P (X = 3)
xi ≤3
1 7 7
= + + =1
15 15 15X
Se x ≥ 3 F (3) = P (X ≤ x) = P (X = xi ) = P (X = 1) + P (X = 2) + P (X = 3) = 1
xi ≤x
Observação 4.2.1 Pode-se observar, que se x ∈ [1; 2), então F (x) = F (1), se x ∈ [2; 3), F (x) =
F (2). Em geral, se x ∈ [xl ; xl+1 ), então F (x) = F (xl ), onde xl e xl+1 são elementos de Rx .
Logo, a função de distribuição pode ser escrito como:


 0,1 se


x<1
F (x) = 15 , se 1≤x<2
(4.2)
8

 , se 2≤x<3
 15
1, se x≥3
Na gura 4.2, é apresentado o gráco da FDA da variável aleatória X.
Propriedades da função de distribuição
Sendo F (x) a FDA da variável aleatória discreta X com contradomínio RX , deve satisfazer as seguintes
propriedades:
1. Para todo x ∈ R, 0 ≤ F (x) ≤ 1.
2. F (x) é uma função monótona não decrescente.

Figura 4.2: Gráco da função de distribuição acumulada
3.
lim F (x)= 0 e lim F (x) = 1.
x→−∞ x→+∞
4. Se Rx = {x1 , x2 , . . . , } tal que, x1 < x2 < . . . , então f (xi ) = P (X = xi ) = F (xi ) − F (Xi−1 )
5. Se a, b ∈ R tal que a < b, então
(i) P (X ≤ a) = F (a).
(ii) P (X ≥ a) = 1 − P (X < a)
(iii) P (a < X ≤ b) = F (b) − F (a)
(iv) P (a ≤ X ≤ b) = F (b) − F (a) + P (X = a)
(v) P (a < X < b) = F (b) − F (a) − P (X = b)
Exemplo 4.2.3 A variável aleatória X tem a seguinte função de distribuição:



 0, se x<0


 1/8, se 0≤x<1
F (x) = 1/2, se 1≤x<2



 5/8, se 2≤x<3

1, se x≥3
Calcular: (a) P (1 < X ≤ 3); (b) P (X ≥ 2); (c) A função de probabilidade da variável aleatória X .
Da propriedade 5.iii da FDA temos que

(a) P (1 < X ≤ 3) = F (3) − F (1) = 1 − 1/2 = 1/2
(b) Da propriedade 5.i da FDA: P (X ≥ 2) = 1 − P (X < 2) = 1 − F (1) = 1 − 1/8 = 7/8
(c) Da função da distribuição acumulada, tem-se RX = {0, 1, 2, 3}. Considerando, a propriedade 4 da

FDA, pode-se mostrar que a função de probabilidade da variável aleatória X é:

 1/8, se x = 0, 2
f (x) = P (X = x) = 3/8, se x = 1, 3

0, caso contrário
4.3 Variáveis Aleatórias Contínuas

4.3.1 Função de probabilidade
Uma função f (x) é chamada função de probabilidade ou função densidade de probabilidade da variável
aleatória contínua X se satisfaz as seguintes condições.
1. f (x) ≥ 0, se x²R
R∞
2. −∞ f (x) dx = 1
Rb
3. Seja o evento A = {x/ a ≤ x ≤ b}. Assim, P [A] = P [x²A] = P [a ≤ x ≤ b] = a f (x) dx
Exemplo 4.3.1 Suponha que o tempo de produção de um artigo (em minutos) é uma variável alea-
tória (v.a.) X que tem como função densidade de probabilidade:
½ (5−x)
f (x) = 4 , se 2 ≤ x ≤ 4 (4.3)
0 caso contrário
Vericar se f (x), é uma função de densidade de probabilidade e calcular a probabilidade do tempo de

produção de um artigo, escolhido ao acaso ser menor que 3 minutos.
A gura 4.3.1, mostra o gráco da função de probabilidade de X.
Figura 4.3: Função de densidade da va X do exemplo 4.3.1.

Da gura pode-se observar que a função, f (x) ≥ 0 (é não negativa) para x ∈ R. Para que seja uma
função de densidade é preciso vericar se a área sob eixo x e a função f (x) é igual a 1. Isto é, a integral
de −∞ a +∞ deve ser igual a um.
Z ∞ Z 2 Z 4 Z ∞ Z 4
f (x) dx = f (x) dx + f (x) dx + f (x) dx = f (x) dx
−∞ −∞ 2 4 2
Z 4
5−x 1 x2
= dx = (5x − ) |42 = 1
2 4 4 2
Logo, a probabilidade do tempo de produção de um artigo escolhido ao acaso ser menor que 3 minutos
é a probabilidade do evento: A = {x ∈ RX ; x < 3}, ou seja,
Z 3 Z 2 Z 3 Z 3
P (A) = P (X < 3) = f (x) dx = f (x) dx + f (x) dx = f (x) dx
−∞ −∞ 2 2
Z 3
5−x 1 x2 5
= dx = (5x − ) |32 = .
2 4 4 2 8
Observação 4.3.1 Se X é uma variável aleatória contínua, então

P (X = x) = 0, para todo x ∈ RX
P (a < X < b) = P (a ≤ X ≤ b) = P (a ≤ X < b) = P (a < X ≤ b), para todo a, b ∈ RX
P (X ≤ a) = P (X < a), para todo a ∈ R.
4.3.2 Função de distribuição acumulada de uma variável aleatória contínua

Denição 4.3.1 Seja X uma variável aleatória contínua (VAC) com função densidade de probabili-
dade f (x). A função de distribuição acumulada (FDA) da VAC X , é denida como
Z x
F (x) = P (X ≤ x) = f (t)dt para todo x ∈ R.
−∞
Exemplo 4.3.2 Considere a variável aleatória X do exemplo 4.3.1. Determine a FDA de X.
Dos intervalos da denição de f (x) apresentados em (4.3), tem-se:

Se x < 2, tem-se f (x) = 0. Logo, F (x) = 0.
Se 2 ≤ x ≤ 4 tem-se
Z x Z 2 Z x Z x
5−t (5 − t)2 x 9 − (5 − x)2
F (x) = f (t)dt = F (x) = f (t)dt + f (t)dt = 0 + dt = − |2 = .
−∞ −∞ 3 2 4 8 8
Se x > 4 tem-se:
Z x Z 2 Z 4 Z x Z 4
F (x) = f (t)dt = f (t)dt + f (t)dt + f (t)dt = f (t)dt = 1
−∞ −∞ 2 4 2
| {z } | {z }
0 0
Logo, a FDA da variável X é:


 0, se x < 2
9−(5−x)2
F (x) = , se 2 ≤ x ≤ 4 (4.4)
 8
1, se x ≥ 4
O gráco da FDA da variável aleatória X :
Figura 4.4: Função de distribuição acumulada da variável aleatória X , do exemplo 4.3.1.
Observação 4.3.2 A FDA, além de caracterizar uma variável aleatória contínua X , permite o cálculo
de probabilidades de eventos da forma (a ≤ X ≤ b), onde a < b ∈ R . Isto é
P (a ≤ X ≤ b) = P (X ≤ b) − P (X ≤ a)
Exemplo 4.3.3 Considere A FDA, exemplo 4.3.2, obtenha: P (X < 3) e P (2, 5 ≤ X < 3, 5)
Considerando a FDA apresentada em (4.4), tem-se:
9 − (5 − 3)2 5
P (X < 3) = F (3) = = .
9 8
9 − (5 − 3, 5)2 9 − (5 − 2, 5)2
P (2, 5 ≤ X < 3, 5) = F (3, 5) − F (2, 5) = − = 0, 5.
9 9
Propriedades da função de distribuição

1. 0 ≤ F (x) ≤ 1, para todo x ∈ R.
2. F (x) é uma função monótona não decrescente.
3. Z x Z x
lim F (x)= lim f (t)dt = 0 e lim F (x) = lim f (t)dt = 1
x→−∞ x→−∞ −∞ x→+∞ x→+∞ −∞
4. F(x) é função contínua para todo x ∈ R
5. Do segundo teorema fundamental do cálculo tem-se:

Z x
d d
f (x) = F (x) = f (t)dt
dx dx −∞
.
Exemplo 4.3.4 Suponha que o tempo de vida de um microorganismo seja uma variável aleatória X
com a seguinte FDA: ½ x
1 − ke− 2 , x ≥ 0
F (x) =
0, x<0
(a) Para que valor de k , F (x) é uma FDA da variável X .
(b) Determinar: P (X ≥ 2), P (2 < X ≤ 4) eP (X ≥ −1).
(c) Determinar a função de densidade de X.
(c) Determinar a função de densidade da variável aleatória Y = 2X + 1.
(a) Uma vez que F (x) é uma função contínua, para todo x ∈ R, tem-se que: F (0) = 0, ou seja,
1 − ke−0 = 0, o qual resulta em k = 1. Logo,
½ x
1 − e− 2 , x ≥ 0
F (x) =
0, x<0
é a FDA de X
(b1 ) P (X ≥ 2) = 1 − P (X < 2) = 1 − F (2) = 1 − [1 − e−1 ] = e−1 .
(b2 ) P (2 < X ≤ 4) = F (4) − F (2) = 1 − e−2 − (1 − e−1 ) = e−1 − e−2 .
(b3 ) P (X > −1) = 1 − P (X ≤ −1) = 1 − 0.
(c) Da propriedade 5, da FDA contínua, tem-se:
½ 1 − x2
d 2e , x≥0
f (x) = F (x) =
dx 0, x<0
(c) Seja FY (y) a FDA da variável aleatória Y = 2X + 1, então,

µ ¶ ( y−1
y−1 y−1 1 − e − 22
, y−1
≥0
FY (y) = P (Y ≤ y) = P (2X + 1 ≤ y) = P X ≤ = F( )= 2
2 2 0, y−1
< 0.
2
Logo, (
d 1 − y−1
4e
4 , y≥1
f (y) = FY (y) =
dy 0, y<1
4.4 Valor Esperado e Variância

Denição 4.4.1 (Valor esperado de uma variável aleatória) Seja X uma variável aleatória com
função de probabilidade ou função densidade de probabilidade,f (x). O valor esperado, ou esperança
matemática ou média da variável aleatória, denotado por E(X) = µX , é denida como:
1. Se X é uma variável aleatória discreta,

X
E(X) = xf (x).
x∈RX
2. Se X é uma variável aleatória contínua,

Z ∞
E(X) = xf (x)dx.
−∞
Nessa denição supõe-se que somatório e a integral convergem. Em caso contrário dizemos que o valor
esperado da variável aleatória X não existe.
Denição 4.4.2 (Valor esperado de uma função de variável aleatória) Seja Y = g(X), sendo
g(.) uma função real e contínua na variável aleatória X . O valor esperado de g(X), é denida como:

X
E(g(X)) = g(x)f (x),
x∈RX

Z ∞
E(g(X)) = g(x)f (x)dx,
−∞
Como anteriormente, supõe-se que tanto a somatório quanto a integral convergem.
Denição 4.4.3 (Variância de uma variável aleatória) Seja X uma variável aleatória com fun-
ção de probabilidade f (x), com média E(X) = µX , a variância da variável aleatória, X , denotado por
V ar(X) = σ 2 é denida como o valor esperado da variável aleatória (X − µX )2 .

X
V ar(X) = E[(X − µX )2 ] = (x − µX )2 f (x).
x∈RX

Z ∞
V ar(X) = E[(X − µX )2 ] = (x − µX )2 f (x)dx.
−∞
4.4.1 Propriedades do valor esperado e variância de uma variável aleatória

Sejam X e Y duas variáveis aleatórias denidas no mesmo espaço amostral Ω e a e b duas constantes
reais. É possível mostrar as seguintes propriedades:
1. E(a) = a.
2. E(aX) = aE(X)
3. E(aX ± b) = aE(X) ± b
4. E(aX ± bY ) = aE(X) ± bE(Y )
5. V ar(a) = 0
6. V ar(aX) = a2 V ar(X)
7. Se X e Y são variáveis aleatórias independentes1 , V (aX ± bY ) = a2 V ar(X) + b2 V ar(Y ).
Teorema 4.4.1 Se X é uma variável aleatória com média, µX , então

V ar(X) = E(X 2 ) − (µX )2
A demonstração é deixada por conta do leitor.
Exemplo 4.4.1 Suponha que tem-se 3 caixas (C1 , C2 e C3 ) com dois tipos de ampolas (A e B ). A
caixa C1 contem 40 ampolas dos quais 10 são do tipo A e 30 de B , a caixa C2 tem 20 ampolas do tipo
A e 20 do tipo B e a caixa C3 , somente tem ampolas do tipo B . Sorteia-se ao acaso, uma ampola de
cada caixa e dene-se a variável aleatória Y como número de ampolas escolhidos do tipo B.
(a) Determine o espaço amostral e a função de probabilidade de Y .

(b) Calcule a média e variância do número de ampolas do tipo B.
Solução:
(a) Seja Bi : a ampola do tipo B escolhida da caixa i e Ai : a ampola do tipo A escolhida da
caixa i Logo, o espaço amostral é Ω = {A1 A2 B3 , A1 B2 B3 , B1 A2 B3 , B1 B2 B3 },
wi A1 A2 B3 A1 B2 B3 B1 A2 B3 B1 B2 B3
P ({wi }) 40 × 40 × 1 40 × 40 × 1 40 × 40 × 1 40 × 20
10 20 10 20 30 20 30
40 × 1 Portanto, a variável aleató-
Y ({wi }) 1 2 2 3
ria Y , assume os valores 1, 2 e 3. Da tabela anterior as probabilidades associadas aos valores de Y são
as seguintes:
1
f (1) = P [Y = 1] = P (A1 A2 B3 ) = .
8
4
f (2) = P [Y = 2] = P ({A1 B2 B3 } ∪ {B1 A2 B3 }) = P ({A1 B2 B3 }) + P ({B1 A2 B3 }) = .
8
3
f (3) = P [Y = 3] = P ({B1 B2 B3 }) = .
8
1
Se as variáveis aleatórias X e Y são independentes a distribuição conjunta de probabilidades de X e Y ( f (x, y)) é
igual ao produto de cada uma das distribuições marginais ( fX (x) e fY (y).) Isto é, f (x, y) = fX (x)fY (x))
Logo, a função de probabilidade (f.p) da variável aleatória é dado por:

 1

 , se y = 1
 84
f (y) = P (Y = y) = 8 , se y = 2
3

 , se y = 3
 8
0, caso contrário
A f.p da variável aleatória Y , pode ser representada na tabela de distribuição de probabilidade:

y 1 2 3
f (y) = P [Y = y] 18 48 38
(b) A média e variância de Y .
X 1 4 3
E(X) = yf (y) = 1 × + 2 × + 3 × = 2, 25
y
8 8 8
X 1 4 3
E(X 2 ) = y 2 f (y) = 12 × + 22 × + 32 × = 5, 5
y
8 8 8
Da denição da média e variância tem-se:
µy = E(Y ) = 2, 25
σy2 = V ar(Y ) = E(Y 2 ) − µ2y = 5, 5 − 2, 252 = 0, 4375
Exemplo 4.4.2 Suponha que as vendas diárias de uma Drogaria (em dezenas de milhares de dólares)
é uma variável aleatória com função de densidade;

 x, se, 0≤x<1
f (x) = 2 − x, se, 1≤x<2

0, caso contrário
Escolhe-se ao acaso um dia de venda. Determine:
(a) A probabilidade de que as vendas da Drogaria seja maior de 5.000 dólares mais não superior a
1.5.000 dólares.
(b) A média e o desvio padrão das vendas diárias.
(c) Se o lucro diário é denido pela função Y = 0, 2X − 0, 1, calcule a média e variância do lucro
diário.
Solução: Seja X : Vendas diárias de uma Drogaria (Dezenas de milhares de dólares)

(a) Seja o evento A = {x ∈ RX ; 0, 5 < x ≤ 1, 5}, então se deseja determinar : P (A) =?
Z 1,5 Z 1 Z 1,5
P (0, 5 < X ≤ 1, 5) = f (x)dx = xdx + (2 − x)dx
0,5 0,5 1,0
µ 2¶ µ ¶
x x2 1,5 3
= |10,5 + 2x − |1 =
2 2 4
(b) Da denição da esperança matemática temos

Z ∞ Z 1 Z 2
2
E(X) = xf (x)dx = x dx + x (2 − x) dx = 1, 0
−∞ 0 1
Z ∞ Z 1 Z 2
2 2 3 7
E(X ) = x f (x)dx = x dx + x2 (2 − x) dx =
−∞ 0 1 6
Logo, a média e o desvio padrão de X são respectivamente:
µX = E(X) = 10.000, 0 dólares.

r r
p p 7 1
σX = V ar(X) = E(X 2 ) − µ2x = − 12 = = 4082, 4829 dólares.
6 6
Esses valores indicam que, a longo prazo (um número elevado de dias), espera-se que as vendas diárias
da drogaria mostrem um comportamento com uma média de 10.000 dólares e um desvio padrão de
4082,4829 dólares, mesmo que as vendas tenham utuações aleatórias.
(c) Seja Y = g(X) = 0, 2X − 0, 1. Das propriedades da esperança matemática, vem
µy = E(g(X)) = E(0, 2X − 0, 1) = 0, 2E(X) − 0, 1 = 0, 2(1) − 0, 1 = 0, 1.

1
σy2 = V ar(0, 2X − 0, 1) = 0, 22 V ar(X) = 0, 22 ( ) = 0, 0067.
6
Esses valores indicam que a longo prazo (um número elevado de dias), espera-se que os lucros diários da
drogaria mostrem um comportamento com uma média de 1.000 dólares e uma variância 0,0067(dezenas
de milhares de dólares)2 .
4.5 Principais Modelos Discretos

Algumas variáveis discretas geradas mediante processos de contagem podem ser associadas a funções
de probabilidade que tenham um comportamento particular conhecido. Assim, por exemplo, quando
se estuda o número de artigos defeituosos em um lote ou quando se estuda o número de pessoas que
chegam a um estabelecimento comercial num certo período de tempo, entre outros. Nesses casos, é
possível estudar o comportamento de tais variáveis através de funções de probabilidade particulares
em cada caso. Nessa seção, são apresentadas algumas das principais funções de probabilidade ou
distribuições de probabilidade, que podem ser utilizadas para analisar variáveis, tais como as descritas
anteriormente.
4.5.1 Ensaio e distribuição de Bernoulli

Há muitos experimentos que tem somente dois resultados possíveis, chamado de sucesso (S) e fracasso
(F ). Logo, o espaço amostral para esse tipo de experimento é Ω = {S, F }. Por exemplo, ao lançar uma
moeda, obtém-se somente dois resultados possíveis, cara (C ) ou coroa (K ). Chama-se de sucesso ao
evento de interesse. No exemplo, caso o interesse seja "cara", obtém-se um sucesso quando no ensaio
ocorre cara. Caso contrário, obtém-se um fracasso.Um experimento com essa característica chama-se
de experimento ou ensaio de Bernoulli.
Seja a variável aleatória X , denida como o número de sucessos num ensaio de Bernoulli. Então, o
contradomínio de X é dado por RX = {1, 0}. Isto é, X(S) = 1 se o resultado do ensaio é sucesso e
X(F ) = 0, se o resultado é fracasso. A variável aleatória assim denida chama-se variável aleatória de
Bernoulli. Sejam P (E) = p e P (F ) = q = 1 − p as probabilidade de sucesso e fracasso respectivamente.
A distribuição de probabilidade da variável aleatória X de Bernoulli, é chamada de distribuição de
Bernoulli, e é dada por
x 0 1
f (x) = P [X = x] q p
A distribuição de Bernoulli pode, também ser expressa como uma função f (x), dada por
½ x
p (1 − p)1−x , x = 0, 1
f (x) = P [X = x] =
0, caso contrário.
A média e variância da variável aleatória X , são respectivamente
µX = E(X) = 0 × q + 1 × p = p.
2
σX = V ar(X) = E(X 2 ) − µ2x = 02 × q + 12 × p − p2 = p(1 − p)
Denota-se por X ∼ bernoulli(p) para indicar que a variável aleatória X tem distribuição Bernoulli
com parâmetro p.
4.5.2 Distribuição Binomial

Existem muitos problemas, nos quais o experimento consiste em n ensaios (ou experimentos) de Ber-
noulli ε1 , . . . , εn , uma seqüência de ensaios de Bernoulli forma um processo de Bernoulli ou experimento
Binomial quando satisfazer as seguintes condições:
(i) Cada ensaio tem somente dois resultados possíveis S ou F .
(ii) Os ensaios são independentes. Isto é, o resultado (sucesso ou fracasso) de qualquer ensaio é
independente do resultado de qualquer outro ensaio.
(iii) A probabilidade de sucesso, p, permanece constante de ensaio em ensaio. Logo, a probabilidade

de fracasso q = 1 − p também é constante.
Exemplo 4.5.1 Suponha um experimento onde uma moenda é lançada três vezes e suponha que p
seja a probabilidade de cara. Seja X a variável aleatória que representa o número de caras obtidas ao
nal dos três lançamentos. Achar a distribuição de probabilidade de X.
Solução. O espaço amostral para experimento de lançar uma moeda três vezes é:
Ω = {KKK, KKC, KCK, CKK, KCC, CKC, CCK, CCC}.
Seja Xi (i = 1, 2, 3) a variável aleatória de Bernoulli que representa o número caras no lançamento i.

Então a variável
X = X1 + X2 + X3 ,
representa o número de caras nos 3 lançamento da moeda. Pode-se mostrar que Xi ∼ bernoulli(p).
wi P ({wi }) X1 (wi ) X2 (wi ) X3 (wi ) X(wi ) = X1 (wi ) + X2 (wi ) + X2 (wi )

KKK (1 − p)3 0 0 0 0
KKC (1 − p)2 p 0 0 1 1
KCK (1 − p)2 p 0 1 0 1
CKK (1 − p)2 p 1 0 0 1
KCC (1 − p)p2 0 1 1 2
CKC (1 − p)p2 1 0 1 2
CCK (1 − p)p2 1 1 0 2
CCC p3 1 1 1 3
O contradomínio da variável X é: RX = {0, 1, 2, 3}. Logo,
P [X = 0] = P ({KKK}] = (1 − p)(1 − p)(1 − p) = (1 − p)3

P [X = 1] = P ({KKC}) + P ({KCK}) + P ({CKK}) = 3p(1 − p)2
P [X = 2] = P ({KCC}) + P ({CKC}) + P ({CCK}) = 3p2 (1 − p)
P [X = 3] = P ({CCC}) = p3
A distribuição de probabilidades da variável aleatória X é dada por

x 0 1 2 3
f (x) = P [X = x] (1 − p) 3 3p(1 − p) 2 3p2 (1 − p) p3
O comportamento de X ca completamente determinado pela função,
½ ¡3¢ x 3−x , x = 0, 1, 2, 3
f (x) = x p (1 − p)
0, caso contrário
¡ ¢
onde x3 = x!(3−x)!
3!
. Observe que as probabilidades correspondem aos termos do desenvolvimento em
binômio de Newton de (p + (1 − p))2 , o que justiça o nome distribuição Binomial escolhido para esse
modelo.
Denição 4.5.1 (Distribuição Binomial) Considere a repetição de n ensaios de Bernoulli indepen-

dentes todos com a mesma probabilidade de sucesso p. A variável aleatória que conta o número total
de sucessos nos n ensaios de Bernoulli, é denominada de variável aleatória Binomial com parâmetros
n e p e sua função de probabilidade é dado por
½ ¡n¢ x n−x , x = 0, 1, . . . , n
f (x) = P [X = x] = x p (1 − p)
0, caso contrário
¡n¢ n!
onde x = x!(n−x)! representa o coeciente Binomial.
A notação X ∼ B(n, p), é usado para indicar que a variável X tem distribuição Binomial com parâ-
metros n e p.
Propriedades da distribuição Binomial
Se X ∼ B(n, p) então:
(a) E(X)=np.
(b) Var(X)=np(1-p)
A demonstração dessas propriedades é deixada como exercício, para o leitor.
Exemplo 4.5.2 Suponha que o nascimentos de menino e menina seja igualmente prováveis e que o
nascimento de qualquer criança não afeta a probabilidade do sexo do próximo nascimento. Determine
a probabilidade de:
(a) Exatamente 4 meninos em 10 nascimentos.

(b) Ao menos 4 meninos em 10 nascimentos.
(c) No máximo um menino em 10 nascimentos.
Solução: Seja a variável aleatória X número de meninos em 10 nascimentos.

RX = {0, 1, . . . , n}
O evento de interesse é nascimento de menino. Então dene-se

S : "nascimento de um menino."
F :"nascimento de uma menina."
P (S) = P (F ) = 1/2
Do enunciado do problema a variável aleatória X tem distribuição Binomial (satisfaz as condições de
um experimento Binomial) com parâmetros n = 10 e p = 0, 5, com função de probabilidade é dada
por: ½ ¡10¢ ¡ 1 ¢10
, x = 0, 1, . . . , 10,
P [X = x] = x 2
0, caso contrário
¡10¢ ¡ 1 ¢10 210
(a) P (X = 4) = 4 2 = 1024 = 0, 205078
(b) P (X ≥ 4) = 1 − p(X < 4) = 1 − (P [X = 0] + P [X = 1] + P [X = 2] + P [X = 3]) = 1 − 0, 05469 =

0, 94531
1 10 11
(c) P (X ≤ 1) = P [X = 0] + P [X = 1] = 1024 + 1024 = 1024 = 0.01074
Exemplo 4.5.3 O professor da disciplina de Estatística e probabilidade elaborou uma prova de múlti-
pla escolha, constituída de 10 questões, cada uma com 4 alternativas. Suponha que todos estudantes que
irão a fazer a prova não assistem as aulas e não estudaram para a mesma (o que é muito freqüente).
O professor estabeleceu que para aprovar deve acertar ao menos 6 questões. Se 100 alunos se apresen-
taram, quantos alunos foram aprovados na disciplina?
Solução. Uma vez que todos os estudantes, que farão a prova não assistem as aulas ou não estudaram,
a escolha de cada resposta em cada uma das 10 questões será feita ao acaso. Portanto, a escolha da
resposta de cada questão é considerada de um ensaio de Bernoulli, com
1 3
p = Probabilidade de acertar a resposta correta = , q = 1 − p = .
4 4
A variável aleatória denida, X : número de questões respondidas corretamente nas 10 questões com
RX = {0, 1, . . . , n}, tem distribuição Binomial. Isto é, X ∼ B(10, 1/4).
½ ¡10¢ ¡ 1 ¢x ¡ 3 ¢10−x
, x = 0, 1, . . . , 10,
P [X = x] = x 4 4
0, caso contrário
Para ser aprovado o estudante deve responder ao menos 6 questões corretas. Isto é, a probabilidade
de ser aprovado a prova é.
10 µ ¶ µ ¶x µ ¶10−x
X 10 1 3
P (X ≥ 6) = = 0, 0197.
x 4 4
x=6
Portanto, dos 100 alunos que se apresentaram para a prova, seriam aprovados 100(0, 0197) ≈ 2 alunos.
Aplicações da Distribuição Binomial numa Amostra
O sorteio de uma amostra de n elementos de uma população pode ser considerada como um experimento
que consiste de n ensaios (ou experimento) de Bernoulli. Os n ensaios serão independentes nos seguintes
casos:
(a) Quando os elementos da amostra são sorteados com ou sem reposição de uma população innita.
Obviamente, o resultado de um sorteio qualquer é independente do outro sorteio e a proporção
p de sucessos (P (S) = p) permanece constante em cada sorteio. Então, é aplicável a distribuição
Binomial.
(b) Quando os elementos da amostra são sorteados com reposição de uma população nita. Suponha
que a população tenha N elementos, dos quais k são de certa classe que temos interesse. Dene-
se, assim, a variável X : numero de elementos da classe de interesse na amostra de tamanho
n.
Os sorteios individuais são ensaios de Bernoulli, onde elemento da classe de nosso interesse cor-
responde "sucesso"e o experimento de tomar uma amostra de tamanho n com reposição consiste
nos n ensaios independentes de Bernoulli onde p = P (sucesso) = Nk ; isto é, X tem distribuição
binomial, µ ¶ · ¸x · ¸
n k k n−x
f (x) = 1− , x = 1, . . . , n
x N N
Exemplo 4.5.4 Numa população grande de Drosophila, o 25% das moscas tem mutação de asas.
Seleciona-se, aleatoriamente 300 moscas da população para uma exame de mutação de asas. A variável
aleatória X é denida como o número de moscas que têm mutação na amostra. Determinar o valor
esperado e a variância de X
Como a população é grande (innita), não interessa se amostragem é com ou sem reposição, portanto,
X tem distribuição Binomial com parâmetros n = 300 e p = 0, 25, isto é X ∼ B(300, 0, 25)
A função de probabilidade de X é
µ ¶
300
f (x) = (0, 25)x (0, 75)300−x , x = 0, 1, . . . , n
x
A média
E(X) = np = 300 × 0, 25 = 75
Variância
3 225
V ar(X) = np(1 − p) = 75 × =
4 4
4.5.3 Distribuição Hipergeométrica

Suponha uma população nita com N elementos , divididos em duas classes. Uma classe com M
(M < N ) elementos (sucesso) e a outra com N − M elementos (fracasso). Por exemplo, no caso
particular de N peças produzidas, podem ser consideradas as classe: M artigos defeituosos e (N-M)
artigos não defeituosos.
Considere o seguinte experimento, uma amostra aleatória de tamanho n (n < N ) sem reposição é
sorteada da população nita de N elementos. A variável aleatória é denida da seguinte forma,
X : Número de elementos com a característica de interesse( sucessos) na amostra de tamanho n.
A variável aleatória assim denida chama-se variável aleatória Hipergeométrica e sua função de pro-
babilidade é:  M N −m
 ( x )( n−x )
, x = 0, 1, . . . , min{n, M }
f (x) = P (X = x) = (Nn )
 0, caso contrário
A notação X ∼ H(N, M, n), indica que a variável aleatória X tem distribuição Hipergeométrica com
parâmetros N , M e n.
Propriedades da distribuição Hipergeométrica
Se X ∼ H(N, M, n), então
(a) E(X) = n M
N
(b) V ar(X) = n M
N (1 −
M N −n
N )( N −1 )
Exemplo 4.5.5 Suponha que o gerente de credito de um estabelecimento recebe 10 pedidos de credito,
dos quais 4 têm documentação incompleta e devem ser devolvidas aos clientes. Escolhe-se, ao acaso 5
pedidos sem reposição obter:
(a) a probabilidade de devolver mais de 3 pedidos de crédito.

(b) A média e o coeciente de variabilidade de variável X .
Seja X : número de pedidos de crédito devolvidos numa amostra de 5 pedidos . Neste caso considera-se
"sucesso", se o pedido de credito é devolvido . Portanto X ∼ H(10, 4, 5), ou seja,
 4 6
 (x)(5−x)
, x = 0, 1, 2, 3, 4
f (x) = P (X = x) = (10)
 0, 5 caso contrário
(a) A probabilidade pedida é:

¡4¢¡ 6
¢
4 1
P (X > 3) = P (X = 4) = f (4) = ¡105−x
¢ = = 0, 0238.
5
42
4 2 = V ar(X) = 5( 4 )(1 − 4 10−5 2
(b) µX = E(X) = 5 × 10 = 2 e σX 10 10 )( 10−1 ) = 3 = 0, 6667 e CV =
√
σX 0,6667
µX × 100% = 2 × 100% = 40, 28%
Distribuição binomial como aproximação da distribuição hipergeométrica
Nas distribuição binomial e hipergeométrica só há duas possibilidades mutuamente exclusivas, de

ocorrência em cada prova; porem a primeira se refere à realização de n ensaios, em condições idênticas
(extração com reposição) enquanto que na hipergeométrica a composição é alterada após a realização
de cada prova. Vericamos, porém, que se N (tamanho da população) for muito grande em relação
n (f = n/N < 0, 1) praticamente não há variação nas condições dos ensaios, que podem então ser
considerada como extração com reposição.
Assim, a distribuição binomial pode ser usada como limite da distribuição quando n for suci-
n
entemente pequeno em relação a N. Isto é, Se X ∼ H(N, M, n) e f = N < 0, 10 então X ∼ B(n, Mn ).
Exemplo 4.5.6 Foram colocados em uma caixa 100 peças, 40 dos quais foram fabricadas pela indus-
tria B e as outras pela indústria A. Retiradas, sem reposição, 8 peças, qual é a probabilidade de que
sejam 4 da indústria A?
Solução: Seja a variável aleatória X o número de peças da industria B. A distribuição exata de X é

a hipergeométrica. Isto é, X ∼ H(100, 40, 8)
A probabilidade pedida é :
¡40¢¡60¢
4
P (X = 4) = ¡100¢4 = 0, 2395
8
8 40
Já que f = 100 = 0, 08 < 0, 10 tem-se X ∼ B(8, 100 ). (aproximadamente) Logo,
µ ¶
8
P (X = 4) = 0, 44 0, 64 = 0, 2322.
4
4.5.4 Distribuição de Poisson

A distribuição de Poisson é uma das distribuições discretas mais importantes pois que se aplica a
muitos problemas práticos. A distribuição de Poisson pode ser obtida de duas formas. A primeira se
deduz a partir de um processo de Poisson e a segunda como limite da distribuição Binomial.
Inicialmente é apresentada a idéia intuitiva de um processo de Poisson. Muitos problemas consistem em
observar a ocorrência de eventos discretos num intervalo contínuo (unidade de medida), por exemplo,
o número de manchas (falhas) por unidade de medida (digamos 1m2 ) no esmaltado de uma geladeira.
Pode-se encontrar 0 manchas, 1 mancha, 2 manchas, ou talvez mais, num metro quadrado. Isto é,
podemos contar o número de falhas por unidade de medida. Sendo impossível contar o número de
pontos sem manchas (é innito não enumerável). Além disso, as falhas são eventos discretos, uma
vez que ocorre em pontos isolados na área de 1 m2 . Ao se denir a variável aleatória X : número de
manchas em um metro quadrado, o contradomínio é RX = {0, 1, . . . , }
Outro exemplo é contar o número de chamadas que chegam a uma central telefônica de uma empresa
num intervalo de tempo (de 8,00 horas a 10,00 horas, por exemplo) num dia determinado. Podem
chegar 0 chamadas, 1 chamada, 2 chamadas, etc. É um evento discreto, visto que o tempo de chegada
de qualquer delas é um ponto isolado num período de 2 horas. Pode-se também contar, número de
bactérias em um cm3 de água. Nesse caso, o intervalo contínuo é o número de bactérias é um evento
discreto supondo que se possa considerar cada bactéria como um ponto no espaço.
Os eventos discretos gerados num intervalo contínuo (unidade: comprimento, área, volume, tempo,
etc.) formam um processo de Poisson com parâmetro λ se satisfazer as seguintes propriedades:
1. O número médio de ocorrência dos eventos numa unidade de medida (comprimento, área, volume,
tempo, etc.) é conhecido e igual a λ.
2. A ocorrência de um evento numa unidade de medida h não afeta a ocorrência ou a não ocorrência
em outra unidade de medida h contígua. Isto é, a ocorrência dos eventos em unidades de medida
contíguas são independentes.
3. Seja uma unidade de medida sucientemente pequeno de comprimento h, logo:
• a probabilidade de sucesso nessa unidade de medida é proporcional ao comprimento do

intervalo , isto é, λh;
• a probabilidade da ocorrência de 2 ou mais sucessos, nessa unidade de medida pequena é
aproximadamente igual a zero.
Denição 4.5.2 Uma variável discreta X tem distribuição de Poisson com parâmetro µ se sua função
de probabilidade é dada por
e−µ µx
f (x) = , x = 0, 1, 2, . . . , (4.5)
x!
onde
X numero de eventos discretos em t unidades de medida.
λ é a média de eventos discretos em uma unidade de medida.
t número de unidade de medida.
µ = λt é a média de eventos discretos em t unidades de medidas.
A notação X ∼ Po (µ) é para indicar que a variável aleatória X tem distribuição de Poisson com
parâmetro µ. A média e a variância de variável aleatória com distribuição de Poisson com parâmetros
µ são:
E(X) = µ
V ar(X) = µ.
Exemplo 4.5.7 Suponha que a central telefônica de empresa de grande porte recebe, em média, 3
chamadas cada 4 minutos. Qual é probabilidade que a central recepcione 2 ou menos chamadas em um
intervalo de 2 minutos?
Solução: Se, X: número de chamadas que recebe a central telefônica da empresa em intervalos de 2
minutos, então X ∼ Po (µ = λt). Aqui, λ = 3/4 = 0.75, t = 2, então µ = λt = 0, 75 × 2 = 1, 5. Daí,
X ∼ Po (1, 5) ou seja, a variável aleatória X tem a seguinte função de probabilidade:
e−1,5 1, 5x
f (x) = P [X = x] = , x = 0, 1, . . . .
x!
1,52
P (X ≤ 2) = P [X = 0] + P [X = 1] + P [X = 2] = e−1,5 [1 + 1, 5 + 2 ] = 0, 808847.
Exemplo 4.5.8 Sabe-se que um líquido particular contem certas bactérias a razão de 4 bactérias por
cm3 . Uma amostra de 1cm3 desse líquido é tomado. (a) Qual é a probabilidade que a amostra não
contenha nenhuma bactéria.? (b) Qual é a probabilidade de que em 0, 5cm3 do líquido haja pelo menos
uma bactéria?
Solução: (a) Seja a variável aleatória X : número de bactérias em 1cm3 do líquido. Aqui λ = 4, t = 1
e µ = λt = (4)(1) = 1. Então X ∼ Po (4). A função de probabilidade da variável aleatória X é dada
por:
4x e−4
f (x) = P (X = x) = , x = 0, 1, . . . .
x!
P (X = 0) = e−4 = 0, 0183
(b) X : O número de bactérias em 0, 5cm3 do liquido. Aqui λ = 4, t = 0, 5 e µ = λt = (4)(0, 5) = 2.
Então X ∼ Po (2).
2x e−2
f (x) = P (X = x) = , x = 0, 1, . . . .
x!
P (X ≥ 1) = 1 − P (X < 1) = 1 − P (X = 0) = 1 − e−2 = 0, 864.
Distribuição de Poisson com aproximação da distribuição Binomial
Será mostrado agora, a distribuição de Poisson como um limite da distribuição Binomial, com µ = np é
considerado que p = P (S) é sucientemente pequena (p −→ 0) e n é sucientemente grande (n −→ ∞),
de tal forma que np permaneça constante. A distribuição binomial para x sucessos em n ensaio de
Bernoulli é dada por: µ ¶
n x n−x
P [X = x] = p q , x = 0, . . . , n.
x
µ
Considera-se µ = np. Logo p = n e q = 1 − p = 1 − nµ . Substituindo-se na função de probabilidade
tem-se:
n! µ µ
P [X = x] = ( )x (1 − )n−x
x!(n − x)! n n
n! µ x (1 − nµ )n
= × ×
(n − x)!nx x! (1 − nµ )x
µ
n(n − 1)(n − 2) . . . (n − (x − 1))(n − x)! µx (1 − n )n
= × ×
nx (n − x)! x! (1 − nµ )x
µ
1 2 x+1 µx (1 − n )n
= (1 − )(1 − ) . . . (1 + )× ×
n n n x! (1 − nµ )x
x
(1) Se n −→ ∞, então n −→ 0 e, x+1
n −→ 0
µ
(2) p = n é pequeno (p −→ 0), então (1 − nµ )x −→ 1
(3) sabe-se que (1 − nµ )n = e−λ se n −→ ∞.
de (1), (2) e (3) temos que para n −→ ∞,

µx −µ
P [X = x] = e
x!
Observação 4.5.1 Da forma como foi obtido essa aproximação, a distribuição de Poisson pode ser uti-
lizado para aproximar probabilidades de uma distribuição Binomial quando n é sucientemente grande
(n −→ ∞ ) e p é muito pequeno (p −→ 0 ). Na prática considera-se que a aproximação é aceitável se
np < 5 ou n(1 − p) < 5. Nesse caso, considera-se que X ∼ Po (np).
Exemplo 4.5.9 Uma vacina imuniza contra polio num 99,99%. Supondo que a vacina foi adminis-
trada a 10.000 pessoas.
(a) Qual é número esperado de pessoas não imunizados ?
(b) Qual é a probabilidade de se ter exatamente k pessoas não imunizadas?
(c) Qual é probabilidade de se ter menos de 2 pessoas não imunizadas?
Solução: X número de pessoas não imunizadas nas 10.000 vacinadas. RX = {0, 1, . . . , 10.000}. A
probabilidade que uma pessoa não seja imunizado é 0,0001, ou seja P (S) = p = 0, 0001 e n = 10.000,
portanto X ∼ B(10.000, 0, 0001)
(a) E(X) = np = (10.000)(0, 0001) = 1.

e−1
(b) E(X) = 1 < 5 então X ∼ Po (1), portanto P [X = k] = k!
(c) P (X ≤ 1) = P [X = 0] + P [X = 1] = 2e−1 = 0.7358
Propriedade reprodutiva da distribuição de Poisson
A propriedade reprodutiva de algumas distribuições de probabilidades é a seguinte: em que, se duas

ou mais variáveis aleatórias independentes, com a distribuições do mesmo tipo, se somam, a variável
resultante tem uma distribuição do mesmo tipo da soma. Essa propriedade chama-se propriedade
reprodutiva.
Teorema 4.5.1 Se X1 , . . . , Xn são variáveis aleatórias independentes , com distribuição de Poisson

com parâmetros µ1 , . . . , µn , respectivamente te, então a variável aleatória
Y = X1 + · · · + Xn ,
tem distribuição de Poisson com parâmetros µ = µ1 + · · · + µn .
Exemplo 4.5.10 Em uma fábrica foram registrados em três semanas a média de acidentes: 2,5 na
primeira semana, 2 na segunda semana e 1,5 na terceira semana. Suponha que o número de acidentes
por semana segue um processo de Poisson. Qual é a probabilidade de que haja 4 acidentes nas três
semanas?
Solução:
Denem-se as variáveis aleatórias com distribuição de Poisson com parâmetro µi , (i = 1, 2, 3).
X1 : Número de acidentes na primeira semana.
X2 : Número de acidentes na segunda semana.
X3 : Número de acidentes na terceira semana.

As três variáveis aleatórias são independentes. A variável aleatória X = X1 + X2 + X3 pelo teorema
4.5.1, tem distribuição de Poisson com parâmetro µ = 2, 5 + 2 + 1, 5 = 6. Isto é, X ∼ Po (6)
64 e−6
P (X = 4) = = 0, 1339.
4!
4.6 Principais Modelos Contínuos

Nessa seção são apresentados algumas das principais distribuições contínuas.
4.6.1 Distribuição uniforme

Denição 4.6.1 Uma variável aleatória contínua X tem distribuição uniforme com parâmetros α e
β se sua função de densidade é dado por:
½ 1
f (x) = β−α , α≤x≤β
(4.6)
0, caso contrário.
A função da distribuição acumulada de uma variável aleatória uniforme contínua é:


 0; x<α
x−α
F (x) = , α ≤ x<β (4.7)
 β−α
1, x≥β
Na gura 4.5, é mostrada a representação gráca da função de densidade de probabilidade e da função
de distribuição acumulada da variável aleatória uniforme contínua.
Figura 4.5: Função de: (a) densidade e (b) distribuição acumulada, da distribuição uniforme
A média e variância de uma variável aleatória X, com distribuição uniforme no intervalo α ≤ x ≤ β

são dadas por:
α+β (α − β)2
E(X) = e V ar(X) = (4.8)
2 12
A notação X ∼ U (α, β) é usada para indicar que X tem distribuição uniforme no intervalo (α, β).
4.6.2 Distribuição exponencial

Denição 4.6.2 Uma variável aleatória contínua X tem distribuição exponencial com parâmetro λ,
se sua função de densidade é dada por
½ x
1 −λ
f (x) = λe , x>0
(4.9)
0, x≤0
A média e a variância de uma variável aleatória X, com distribuição exponencial são dadas por:
E(X) = λ e V ar(X) = λ2 . (4.10)
A notação X ∼ Ex(λ) indica que a variável aleatória X tem distribuição exponencial com parâmetro
λ.
Na gura 4.6, é apresentado o gráco da densidade
Figura 4.6: Função de densidade de probabilidade de X ∼ Ex(λ).
A função da distribuição acumulada de uma variável aleatória contínua com distribuição exponencial
com parâmetro λ: ½
0, x≤0
F (x) = x (4.11)
1 − e− λ , x > 0
Exemplo 4.6.1 O tempo de vida (em horas) de um transistor é uma variável aleatória X com f.d.p
½ x
1 − 500
f (x) = 500 e , x>0
0, x≤0
(a) Qual é a média de vida do transistor ?
(b) Qual é a probabilidade de que o tempo de vida seja maior do que a média
(c) Se um transistor em particular há durado mais 300 horas. Qual é a probabilidade de que dure
outras 400 horas?
Figura 4.7: Função de distribuição acumulada, de X ∼ Ex(λ).
Solução(a)Já que X ∼ E(500), de (4.10) temos que: E(X) = 500 horas.

(b) Também temos que a função de distribuição acumulada de X é dado por:
½
0, x≤0
F (x) = x
1 − e− 500 , x > 0
500
Daí temos que: (b) P (X > 500) = 1 − P (X ≤ 500) = 1 − (1 − e− 500 ) = e−1 .
(c)
P (X ≥ 700; X > 300)
P (X ≥ 700|X > 300) =
P (X > 300)
P (X ≥ 700) 1 − [1 − e−7/5 ]
= =
P (X > 300 1 − [1 − e−3/3 ]
= e−4/5 .
4.6.3 Distribuição normal

A distribuição normal foi descoberta no século XVIII. Astrônomos e outros cientistas observaram, não
sem certa surpresa, que mensurações repetidas de uma mesma quantidade (como distância entre a lua
e terra ou a massa de um objeto) tendiam a variar e quando se coletava um grande número dessas
mensurações, dispondo-as numa distribuição de freqüências, elas se apresentavam repetidamente com
uma forma análoga da gura 4.8.
Denição 4.6.3 (Distribuição normal) Uma variável aleatória contínua X tem distribuição nor-
mal com média µ e variância σ 2 , se sua função de densidade é dado por:
1 1 x−µ 2
f (x) = √ e− 2 ( σ ) , x ∈ R (4.12)
2πσ
Usaremos a notação X ∼ N (µ, σ 2 ), para indicar que X tem distribuição normal com parâmetros µ e σ 2 .
A função de densidade da normal é representada na gura 4.8. Algumas propriedades da distribuição
Figura 4.8: Distribuição normal com parâmetros µ e σ 2
normal podem ser facilmente observadas de seu gráco
1. E(X) = µ e V ar(X) = σ 2 .
2. A curva é simétrica em torno da média µ.
3. É assintótica em relação ao eixo horizontal.
4. A área total sob a curva é igual a um portanto, cada metade da curva tem 0, 5 da área total.
A gura 4.9 apresenta o comportamento da função de densidade para valores diferentes da média µ e
variâncias iguais. A variância é uma medida de dispersão ou de variabilidade da variável aleatória. A
Figura 4.9: Distribuições normais com médias diferentes e variâcias iguais.
maior variância, maior variabilidade. Isso pode ser observado gracamente na gura 4.10.
Denição 4.6.4 (Distribuição normal padrão ou reduzida) Se Z é uma variável aleatória que
tem distribuição normal com média µ = 0 e variância σ 2 = 1, então Z é chamado de variável aleatória
Figura 4.10: Distribuições normais com médias iguais e variâncias diferentes.
normal padrão, sua função de densidade dada por:

1 1 2
f (z) = √ e− 2 z . z ∈ R (4.13)
2π
Teorema 4.6.1 (Transformação linear de uma variável normal) Se X é uma variável aleatória
normal com média µ e variância σ 2 , então a variável, Y = a + bX tem distribuição normal com média,
µY = a + bµ e variância, σY2 = b2 σ 2 .
Uma conseqüência imediata do teorema 4.6.1 é a variável

X −µ
Z= (4.14)
σ
que tem distribuição normal padrão, sendo X ∼ N (µ, σ 2 ).
Uso da tabela normal padrão para o cálculo de probabilidade
A tabela de distribuição normal padrão (veja apêndice A) fornece a probabilidade da variável normal
padrão Z assumir um valor menor ou igual a z . Isto é,
Φ(z) = P (Z ≤ z).
Essa probabilidade é representada pela área sombreada na gura 4.11. A função Φ(z) também recebe
o nome de distribuição acumulada da distribuição normal padrão. A tabela A do apêndice A fornece
os valores de Φ(z), para valores 0 ≤ z < 3, 99 (os valores para Φ(z), para −3, 99 ≤ z ≤ 0 são obtidos
por simetria).
Exemplo 4.6.2 Seja Z uma variável aleatória normal padrão. Determine:
(a) P (Z < 1, 80);

Figura 4.11: Probabilidade Φ(z) = P (Z ≤ z)
(b) P (0, 80 ≤ Z < 1, 40);
(c) P (Z ≤ −0, 58);
(d) P (−0, 58 ≤ Z ≤ 0, 58);
(e) o valor de k tal p(Z ≤ k) = 0, 95.
Solução: Para o cálculo de probabilidades sob a distribuição de variáveis aleatórias contínuas (normal
padrão) torna-se indiferente o uso de sinais < ou ≤ bem como > ou ≥, então temos:
(a) P (Z ≤ 1, 80) = 0, 96784
(b) P (0, 80 ≤ Z < 1, 40) = P (Z ≤ 1, 40) − P (Z ≤ 0, 80) = 0.91924 − 0.78814 = 0, 1311
(c) P (Z ≤ −0, 58) = 1 − P (Z ≤ 0, 58) = 1 − 0.71904 = 0, 28096
(d) P (−0, 58 ≤ Z ≤ 0, 58) = P (Z ≤ 0, 58) − P (Z ≤ −0, 58) = P (Z ≤ 0, 58) − [1 − P (Z ≤ 0, 58]
= 2P (Z ≤ 0, 58) − 1 = 2 × 0, 71904 − 1 = 0, 43808
(e) p(Z ≤ k) = 0, 95. da tabela normal padrão observa-se que z = 1, 64
Observação 4.6.1 Se Z ∼ N (0, 1) então,
• P (Z ≤ −z) = 1 − P (Z ≤ z), para todo z > 0
• P (−z < Z ≤< z) = 2P (Z ≤ z) − 1
Exemplo 4.6.3 Se X ∼ N (90, 100) determine
(a) P (70 ≤ X < 90).

Figura 4.12: Probabilidade P (Z ≤ −z) = P (Z ≥ z) = 1 − P (Z ≤ z).
(b) P (|X − 90| ≤ 30).

(c) O valor de a tal que P (90 − 2a ≤ X ≤ 90 + 2a) = 0, 99.
Solução: Utilizando a fórmula (4.14), tem-se
(a)
µ ¶
70 − 90 X −µ 90 − 90
P (70 ≤ X < 90) = P ≤ ≤ = P (−2 ≤ Z ≤ 0)
10 σ 10
= P (Z ≤ 0) − P (Z ≤ −2) = P (Z ≤ 0) − [1 − P (Z ≤ 2)]
= 0, 5 − [1 − 0, 97725] = 0, 47725
(b)
µ ¶
−30 X − 90 30
P (|X − 90| ≤ 30) = P (−30 ≤ X − 90 ≤ 30) = P ≤ ≤ = P (−3 ≤ Z ≤ 3)
10 10 10
= P (Z ≤ 3) − P (Z ≤ −3) = 2P (Z ≤ 3) − 1 = 2 × 0, 99865 − 1 = 0, 9973
(c)
−2a 2a
P (90 − 2a ≤ X ≤ 90 + 2a) = P (−2a ≤ X − 90 ≤ 2a) = P ( ≤Z≤ )
10 10
a a
= 2P (Z ≤ ) − 1 = 0, 99 ⇒ P (Z ≤ ) = 0, 995
5 5
a
Portanto 5 = 2, 57 → a = 12, 85.
Exemplo 4.6.4 Os níveis de colesterol sérico em homens de 18 a 24 anos de idade tem distribuição
normal com média de 178,1 mg/mL e desvio padrão de 40,7 mg/mL. Os dados se baseiam na "National
Health Survey". Escolhido aleatoriamente um homem entre 18 e 24 anos, determine:
(a) a probabilidade de que seu nível de colesterol esteja entre 200 mg/mL e 250 mg/mL.
(b) o nível de colesterol para ser incluído nos 10% dos homens com menor nível de colesterol.
Solução: Seja a variável X : "nível de colesterol sérico em homens com idade entre 18 a 24 anos."X ∼
N (178, 1; 40, 72 ).
³ ´
200−178,1 X−µ 200−178,1
(a) P (200 ≤ X ≤ 250) = P 40,7 ≤ σ ≤ 40,7 = P (0, 54 ≤ Z ≤ 1, 77) =
= P (Z ≤ 1, 77) − P (Z ≤ 0, 54) = 0, 96164 − 0, 70540 = 0, 25624

(b) Da gura, P (X < x0 ) = 0, 10
³ ´
x0 −178,1
Portanto, 0, 10 = P (X < x0 ) = P Z < 40,7 , ⇒ P (Z < −z0 ) = 0, 10, sendo −z0 =
x0 −178,1
40,7 . Da observação 4.6.1, tem-se que P (Z ≤ z0 ) = 0, 90. Isso implica em z0 = 1, 28. Daí
x0 −178,1
40,7 = −1, 28 =⇒ x0 = 126, 004
Teorema 4.6.2 (Combinação linear de variáveis aleatórias normais) Sejam X1 , . . . , Xn , n va-

riáveis aleatórias independentes onde Xi ∼ (µi ; σi2 ) para i = 1, . . . , n e sejam a1 , . . . , an constantes
reias. Seja a variável aleatória Y uma combinação linear das variáveis aleatórias normais, X1 , . . . , Xn .
Isto é,
Y = a1 X1 + a2 X2 + · · · + an Xn .
Então a variável aleatória Y, tem distribuição normal com média
n
X
µY = a1 µ1 + a2 µ2 · · · + an µn = ai µi
i=1
e variância n
X
σY2 = a21 σ12 + a22 σ22 · · · + a2n σn2 = a2i σi2 .
i=1
Exemplo 4.6.5 Uma empresa desenvolve um conjunto restrito de atividades,Xi (i = 1, 2, 3). Suponha
que o lucro Y (em unidades monetárias) associado às diferentes atividades é dado pela seguinte equação:
Y = 2X1 + 3X2 + X3 . Considerado que as diferentes atividades da empresa são variáveis aleatórias
independentes com distribuição normal tais que: X1 ∼ N (10, 5), X2 ∼ N (15, 20) e X3 ∼ N (12, 10),
qual é a probabilidade de que empresa tenha um lucro de no máximo, 80 unidades monetárias.?
Solução: Do teorema 4.6.2, tem-se Y ∼ N (µY , σY2 ) onde,

µY = 2E(X1 ) + 3E(X2 ) + E(X3 ) = 2 × 10 + 3 × 15 + 12 = 77,
σY2 = 4V ar(X1 ) + 9V ar(X2 ) + V ar(X3 ) = 4 × 5 + 9 × 20 + 10 = 210.
Logo, µ ¶
80 − 77
P (Y ≤ 80) = P Z ≤ √ = P (Z ≤ 0, 21) = 0, 58317
210
Exemplo 4.6.6 Suponha que a carga máxima suportada X1 por um pilar de concreto armado durante
sua vida é uma variável aleatória normal com média 110 kg e desvio padrão de 16 kg, além disso admite-
se que sua resistência é outra variável aleatória X2 , com distribuição normal com média 215 kg e desvio
padrão de 30 kg. Qual é a probabilidade de ruptura desse pilar?.
Solução: Considere a variável Aleatória

Y = X2 − X1 ,
o pilar se romperá quando X1 > X2 o qual é equivalente a, Y < 0. Do teorema 4.6.2, Y ∼ N (µY , σY2 ),
pois X1 e X2 são variáveis aleatórias normais independentes. Sendo
µY = E(X2 ) − E(X1 ) = 215 − 110 = 105
e
σY2 = V ar(X2 ) + (−1)2 V ar(X1 ) = 302 + 162 = 1156
Daí tem-se que: P (Y < 0) = P ( Y −µ
σ2
Y
< 0−105
√
1156
) = P (Z < −3, 09) = 0, 001.
Y
Um resultado imediato do teorema 4.6.2 está dado no seguinte corolário.
Corolário 4.6.1 (Propriedade reprodutiva da distribuição normal) Se X1 , . . . , Xn são variá-

veis aleatórias independentes e identicamente distribuídos com distribuição normal com média µ e
variância σ 2 , isto é, Xi ∼ N (µ, σ 2 ), então, a variável aleatória:
Xn
Y = X1 + X2 + · · · + Xn = Xi (4.15)
i=1
tem distribuição normal com média nµ e variância nσ 2 ,

ou seja, Y ∼ N (nµ, nσ 2 ) ou
P
n
Xi − nµ
X̄ − µ
Z = i=1 √ = √ ∼ N (0, 1).
nσ σ/ n
Pn
onde X̄ = n1 Xi .
i=1
Exemplo 4.6.7 O peso de peixes pescados por uma embarcação tem distribuição normal com média
de 4,5 kg e desvio padrão 0,5 kg. Se os peixes são embaladas em caixas que contem 20 peixes, qual é a
probabilidade de que o peso total dos peixes contidos numa caixa seja maior de 92 kg?
Solução: Seja a variável aleatória, X : peso de um peixe. Então X ∼ N (4, 5, (0, 5)2 ), e seja Y : o peso
total da caixa com 20 peixes, então Y = X1 +X2 +· · ·+Xn , onde Xi é o peso do i-ésimo peixe na caixa.
Assim, Xi ∼ N (4, 5, (0, 5)2 ), i = 1, . . . , 20. Pelo corolário 4.6.1, Y ∼ (20 × 4, 5, 20 × (0, 5)2 ) = N (90, 5)
Y − 90 92 − 90
P (Y > 92) = P ( √ > √ ) = P (Z > 0, 89) = 1 − p(Z ≤ 0, 89) = 1 − 0, 81327 = 0, 18673
5 5
4.7 Distribuições Amostrais

Denição 4.7.1 As variáveis aleatórias X1 , X2 , . . . , Xn constituem uma amostra aleatória de tamanho
n de uma população X ∼ f (x, θ), se: (a) cada Xi é uma variável aleatória independente e (b) cada
Xi , tem a mesma distribuição de probabilidade f (x, θ).
A denição de amostra aleatória é satisfeita nos seguintes casos:
1. Quando a amostra provem de uma população innita2 e quando a amostra é sorteada ao acaso
com reposição de uma população nita.
2. Quando as amostras se sorteia sem reposição de uma população nita, evidentemente não satisfaz
a denição da amostra aleatória, pois as variáveis aleatórias X1 , . . . , Xn não são independentes.
Porem, se o tamanho da amostra é muito pequena em comparação com o tamanho da população,
a denição é satisfeita aproximadamente.
Exemplo 4.7.1 De uma população normal com média 10 e variância 12 selecionou-se uma amostra
aleatória, X1 , X2 , . . . , X10 . Calcular
P (X1 − X5 + X8 ≥ 13).
Solução: Se X, é uma variável aleatória da população normal, X ∼ N (10, 12). Então, por ser
X1 , . . . , X10 uma amostra aleatória, satisfaz: (a) Xi , i = 1, . . . , 10 são variáveis aleatórias indepen-
dentes e (b) Xi ∼ N (10, 12). Se, Y = X1 − X5 + X8 , então Y ∼ N (µY , σY ) por ser variáveis aleatórias
normais independentes (pela teorema 4.6.2) onde
µY = E(X1 − X5 + X8 ) = E(X1 ) − E(X5 ) + E(X8 ) = 10 − 10 + 10 = 10
σY2 = V ar(X1 − X5 + X8 ) = V ar(X1 ) + V ar(X5 ) + V ar(X8 ) = 12 + 12 + 12 = 36.

Logo
13 − 10
P (X1 − X5 + X8 ≥ 13) = P (Y ≥ 13) = P (Z ≥ )
6
= P (Z ≥ 0, 5) = 1 − P (Z ≤ 0, 5) = 1 − 0, 69146 = 0, 30854.
Denição 4.7.2 (Estatística) Um estatística é uma variável aleatória que depende somente da amos-
tra observada
P
n
Exemplo 4.7.2 Sejam X1 , . . . , Xn uma amostra aleatória de uma população X , então X̄ = 1
n Xi
i=1
1 P
n
e S2 = n−1 (Xi − X̄)2 são estatísticas.
i=1
Denição 4.7.3 A distribuição de probabilidade de uma estatística é chamada de distribuição amos-

tral
2
Quando o tamanho da população não é mencionado neste texto será considerado como uma população innita
4.7.1 Distribuição da média amostral

Teorema 4.7.1 Se de uma população com média µX e variância σX
2 se extraem amostras aleatórias
de tamanho n e para cada amostra determinam-se a média

n
1X
X̄ = Xi
n
i=1
então a média e variância da variável X̄ são dados por:
a) Se a amostragem é com reposição de uma população nita (ou amostragem com ou sem reposição
em uma população innita).
2 σ2
µX̄ = µX e σX̄ = X
n
b) Se a amostragem é sem reposição de uma população nita com N elementos.
2 ·
σX
¸
2 N −n
µX̄ = µX e σX̄ =
n N −1
Observação 4.7.1 Se a fração de amostragem f = n

Né pequena (f < 0, 1) e o tamanho da população
(N ) é grande, a variância da média amostral em (b) é aproximado com a expressão do caso (a), isto
é,
2 σ2
σX̄ = X
n
Exemplo 4.7.3 Um auditor de uma empresa deseja determinar a quantidade de produtos existentes
no estoque da empresa. Para isso determinou para cada produto do inventario, a diferença (X) entre
o número artigos registrados e o número de artigos realmente existente. Se o inventario consta de 5
artigos e os valores de X em milhares de dólares são:
P roduto A B C D E
X 0 −1 0 1 2
obter a distribuição amostral de X̄ para amostragem com ou sem reposição, quando n = 2
Solução: A função de probabilidade de X é dado por:


 1/5, se x = −1, 1, 2
f (x) = 2/5, se x = 0

0, caso contrário
Portanto,
2 6
E(X) = = 0, 4 e E(X 2 ) = = 1, 2
5 5
2 = E(X − µ )2 = E(X 2 ) − E(X)2 = 1, 2 − (0, 4)2 = 26
com o qual: µX = E(X) = 0, 4 e σX X 25 = 1, 04
Considerando o teorema 4.7.1 tem-se que a média e variância da distribuição da média amostral
com N = 5, n = 2 é:
a) Para uma amostragem com reposição.

2
σX
2 1, 04
µX̄ = µX = 0, 4 e σX̄ = = = 0, 52
n 2
b) Para uma amostragem sem reposição.

· ¸ · ¸
2 σ2 N −n 1, 04 5 − 2
µX̄ = µX = 0, 4 e σX̄ = X = = 0, 39
n N −1 2 5−1
Para determinar a distribuição da média amostral deve-se determinar todas as amostras possíveis, suas
respectivas médias e suas probabilidades de ocorrência considerando 2 casos:
(a) Para uma amostragem sem reposição
Quando a seleção dos elementos da amostra se efetua com probabilidades iguais, o número de amostras
possíveis é igual á:
µ ¶ µ ¶
N 5
Número de amostras possíveis = = == 10
n 2
onde N é o tamanho da população e n é o tamanho da amostra. As amostras possíveis se apresentam
na tabela seguinte:
Amostra Valores Média
possível observados de X amostral x̄ probabilidade
1
A, B (0; −1) −0, 5 0, 1 = 10
A, C (0;0) 0,0 0,1
A, D (0;1) 0,5 0,1
A, E (0;2) 1,0 0,1
B, C (-1;0) -0,5 0,1
B, D (-1;1) 0,0 0,1
B, E (-1;2) 0,5 0,1
C, D (0;1) 0,5 0,1
C, E (0;2) 1,0 0,1
D, E (1;2) 1,5 0,1
Sendo a seleção com probabilidades iguais, todas as amostras possíveis tem a mesma probabilidade de
ocorrência , e portanto a probabilidade de um valor da média amostral será igual a probabilidade de
1
seleção de cada amostra ( 10 ) multiplicada por o número de amostras que geram dito valor.
Logo,a função de probabilidade da média amostrais X̄, é:


 0, 1, se x̄ = 1, 5

0, 2, se x̄ = −0, 5; 0, 0; 1, 0
f (x̄) =

 0, 3, se x̄ = 0, 5

0, 0, caso contrário
Pode-se mostrar que

X
E(X̄) = x̄i f (x̄i ) = (1, 5)(0, 1) + ... + (0, 5)(0, 3) = 0, 4
X 2
E(X̄ 2 ) = X̄i f (x̄i ) = (1, 5)2 (0, 1) + ... + (0, 5)2 (0, 3) = 0, 55
µx̄ = E[X̄] = 0, 4 e σx̄2 = E[X̄ 2 ] − µ2x̄ = 0, 55 − (0, 4)2 = 0, 39

(b) Para uma amostragem com reposição
Quando a seleção dos elementos da amostra se efetua com probabilidades iguais, o número de amostras
possíveis é igual a N n = 52 = 25, onde N é o tamanho da população e n é o tamanho da amostra. As
amostras possíveis se apresentam na seguinte tabela:
Amostra Valores Média
possível observados de X amostral probabilidade
1
A, A 0; 0 0, 0 0, 04 = 25
A, B 0;-1 -0,5 0,04
A, C 0;0 0,0 0,04
A, D 0;1 0,5 0,04
A, E 0;2 1,0 0,04
B, A -1;0 -0,5 0,04
B, B -1;-1 -1,0 0,04
B, C -1;0 -0,5 0,04
B, D -1;1 0,0 0,04
B, E -1;2 0,5 0,04
C, A 0;0 0,0 0,04
C, B 0;-1 -0,5 0,04
C, C 0;0 0,0 0,04
C, D 0;1 0,5 0,04
C, E 0;2 1,0 0,04
D, A 1;0 0,5 0,04
D, B 1;-1 0,0 0,04
D, C 1;0 0,5 0,04
D, D 1;1 1,0 0,04
D, E 1;2 1,5 0,04
E, A 2;0 1,0 0,04
E, B 2;-1 0,5 0,04
E, C 2;0 1,0 0,04
E, D 2;1 1,5 0,04
E, E 2;2 2,0 0,04
Como no caso anterior, a probabilidade de um valor de X̄ é igual a probabilidade de seleção de

1
cada amostra ( 25 ) multiplicada por o número de amostras que geram dito valor. Logo, a função de
probabilidade das médias amostrais é:
 1

 25 , se x̄ = −1, 0; 2, 0

 4
se x̄ = −0, 5

 25 ,
 6
25 , se X̄ = 0, 0; 0, 5
f (X̄) = 5

 25 , se X̄ = 1, 0

 2

 25 , se x̄ = 1, 5

0, casso contrario
Daí tem-se que:
X 1 2
E(X̄) = ) + ... + (1, 5)( ) = 0, 4
x̄i f (x̄i ) = (−1, 0)(
25 25
X
2 2 1 2
E(X̄ ) = 2
x̄i f (x̄i ) = (−1, 0) ( ) + ... + (1, 5)2 ( ) = 0, 68
25 25
µx̄ = E[X̄] = 0, 4 e σx̄2 = E[X̄ 2 ] − µ2x̄ = 0, 68 − (0, 4)2 = 0, 52
No exemplo anterior, conseguimos enumerar as possíveis amostras e assim obter sua função de
probabilidade da média amostral. Nem sempre isso será possível, por exemplo se X tem distribuição
de Poisson com parâmetro µ = 5, uma amostra aleatória de tamanho 2 desta população, X1 e X2
continuaram sendo independentes e identicamente distribuídos com função de probabilidade, Po (5).
Mas, é complicado enumerar todas as possíveis amostras de tamanho 2, portanto é difícil de determinar
a distribuição de probabilidade da média amostral.
4.7.2 Forma da distribuição da média amostral quando a população não é normal

2 . Se
Seja X uma variável aleatória que tem uma distribuição normal com média µX e variância σX
desta distribuição seleciona-se amostras aleatórias de tamanho n, a média amostral,
n
1X
X̄ = Xi ,
n
i=1
2 ) e independentes entre
é uma combinação linear de variáveis Xi , todas elas com distribuição N (µX , σX
si (o fato da distribuição de X ser normal presume, em rigor que a população é innita e que, portanto,
não há diferença entre escolher uma amostra com e sem reposição). Foi visto na seção anterior, uma
combinação linear de variáveis normais independentes é, também é normal, portanto, a média amostral
segue uma distribuição normal com média µX e variância, σX 2 . Isto é,
2
X̄ ∼ N (µX , σX /n).
Embora este resultado seja de extrema importância, eles são relativamente limitado, já que, somente
permite especicar a distribuição da média amostral no caso de uma população normal. Na prática,
muitas vezes não temos informação a respeito da distribuição das variáveis que constituem a amostra,
o que nos impede utilizar o resultado apresentado. Felizmente, satisfeitas certas condições pode ser
mostrado que para uma amostra sucientemente grande, a distribuição de probabilidade da média
amostral pode ser aproximada por uma distribuição normal, com média e variância iguais àquelas
calculadas anteriormente. Este fato é um dos teoremas mais importantes da estatística e probabilidade
e é denominado o teorema central do limite.
A continuação enuncia-se o teorema central do limite considerando que a população é innita.
Teorema 4.7.2 (Teorema Central do Limite) Seja X1 , . . . , Xn uma amostra aleatória de tama-
2 , nita. Então a média amostral, X̄ ,
nho n retirada de uma população com média µX é variância σX
tem distribuição aproximadamente normal com média µX e variância σX 2 /n, para n sucientemente
grande (n → ∞). Isto é,

X̄ − µX n→∞
Z= −→ N (0, 1).
σX /n
Neste texto consideraremos que o tamanho de amostra é sucientemente grande quando n ≥ 30.
Exemplo 4.7.4 Suponha que na produção em série de um artigo, o peso é uma variável aleatória
com uma média de 950 g e uma variância de 1600 g 2 . Seleciona-se aleatóriamente e com reposição 36
artigos, calcular a probabilidade que a média amostral seja maior de 965 g.
Solução: Seja X o peso do artigo (em gramas), como, µX = 950, σX

2 = 1600 e n = 36. Pelo teorema
2 = 1600/36.
4.7.2, tem-se que X̄ aproximadamente normal com média, µX̄ = µX = 950 e variância σX̄
Portanto,
Ã !
965 − 950
P (X̄ > 965) = P Z > 40 = P (Z > 2, 25)
√
36
= 1 − P (Z ≤ 2, 25) = 1 − 0, 9878 = 0, 0122
4.7.3 Distribuição da diferença de duas médias amostrais

Teorema 4.7.3 X1 , . . . , Xn é uma amostra aleatória de tamanho n de uma população com caracte-
rística X que tem distribuição normal com média µ1 e variância σ12 e que Y1 , . . . , Ym é outra amostra
aleatória de tamanho m, de uma população com a característica Y que tem distribuição normal com
média µ2 e variância σ22 . Se X e Y são independentes, então a diferença amostral X̄ −Ȳ tem distribuição
σ2 σ2
normal com média µ1 − µ2 e variância n1 + m2 . Isto é,
X̄ − Ȳ − (µ1 − µ2 )
Z= q ∼ N (0, 1), (4.16)
σ12 σ22
n + m
Se as populações onde foram retiradas as amostras não tiveram distribuição normal, pelo teorema 4.7.2,
segue válido o resultado se os tamanhos amostrais n e m são sucientemente grandes, isto é n ≥ 30 e
m ≥ 30.
Exemplo 4.7.5 Suponha que numa central de correios (A) o peso (em gramas) das cartas tem dis-
tribuição normal com média 350 g e desvio padrão de 56,27 g.
(a) Qual deve ser o tamanho da amostra para que a probabilidade de que o peso médio das carta
dera do peso médio verdadeiro em menos de 15 g, seja igual a 0,9426
(b) Em outra central de correio (B) encontrou-se que os peso (em gramas) das cartas tem distribuição
normal com média de 320 g e desvio padrão de 50 g. Retiram-se ao acaso 20 cartas de cada central
de correios, qual é probabilidade de que o peso médio das cartas retiradas do correio A seja maior
ao peso médio das cartas do correio B em pelo menos 10 g?
Solução: Seja, X : peso das cartas do correio A, então X ∼ N (350, (56, 27)2 )
(a) X̄ ∼ N (350, (56, 27)2 /n), do enunciado do problema temos que determinar n =?, tal que, P (|X̄ −
µ| < 15) = 0, 9426
|X̄ − µ| √
P (|X̄ − µ| < 15) = P ( √ < 15/56, 27/ n)
σ/ n
√
= P (|Z| ≤ 0, 2666 n) = 0, 9426,
que é equivalente a:
P (|Z| < z0 ) = P (−z0 ≤ Z ≤ z0 ) = P (Z ≤ z0 ) − P (Z ≤ −z0 )
= 2P (Z ≤ z0 ) − 1 = 0, 9426
√
portanto P (Z ≤ z0 ) = 0, 9713, da tabela normal padrão, temos que, z0 = 1, 90. Portanto, 0, 2666 n =
1, 90, n = 51.
(b) Y o peso de cartas do correio B, então, Y ∼ N (320, 502 ), que implica em
n = 20 X̄ ∼ N (350, (56, 27)2 /20)
m = 20 Ȳ ∼ N (320, 502 /20),
56, 272 502
X̄ − Ȳ ∼ N (350 − 320, + ) = N (30, 283, 31)
20 20
P (X̄ − Ȳ ≥ 10) = P (Z ≥ √10−30 ) = P (Z ≥ −1, 19) = P (Z ≤ 1, 19) = 0, 88297

283,31
4.7.4 Distribuição amostral de uma proporção amostral

Considere uma população dicotômica, constituída apenas por elementos de dois tipos, isto é, cada
elemento pode ser classicado com sucesso ou fracasso. Suponha que a probabilidade de sucesso seja
p e de fracasso seja q = 1 − p. Se dessa população retira-se uma amostra aleatória de n observações
X1 , . . . , Xn . Seja a variável aleatória Y número de sucessos na amostra. Então,
P
n
1. Y = Xi tem distribuição Binomial com parâmetros n e p.
i=1
Y P
n
2. A proporção amostral de sucessos é: p̂ = n = Xi /n = X̄. De (1) a distribuição de probabili-
i=1
dade de p̂ é: µ ¶
y n y
P (p̂ = ) = p (1 − p)n−y .
n y
E para n sucientemente grande ( teorema 4.7.2), tem distribuição aproximadamente normal
com média p e variância pq
n . Isto é,
pq
p̂ ∼ N (p, ).
n
Exemplo 4.7.6 Uma empresa tem um número grande de funcionários. A probabilidade de que um
empregado selecionado ao acaso, participe de um programa de treinamento é 0,40.
(a) Se 10 funcionários são escolhidos ao acaso, qual é a probabilidade que proporção de participantes
seja
(a1) exatamente 60%?

(a2) pelo menos 80%?
(b) suponha que 100 funcionários escolhidos ao acaso, participaram do treinamento qual é a proba-
bilidade de que proporção de participantes do programa seja maior que 50%?
Solução: Seja Y : número de funcionários que participaram do programa de treinamento entre os 10

selecionados. Considere sucesso: "funcionário que participa do programa."Logo, P (sucesso) = 0, 40.
Portanto, Y ∼ B(10, 0, 4) .
¡ ¢
Y
(a1) P (p̂ = 0, 60) = P ( 10 6
= 10 ) = P (Y = 6) = 10 6 4
6 (0, 4) (0, 6) = 0, 1115
(a2) P (p̂ ≥ 0, 8) = P (Y ≥ 8) = 0, 0123.
(b) Y : número de funcionários que participaram do programa de treinamento entre os 100 selecionados.
Então Y ∼ B(100, 0, 4). Logo, p̂ ∼ N (0, 4, 0, 24/100)
Ã !
p̂ − p 0, 5 − 0, 40
P (p̂ > 0, 50) = P p > √
pq/100 0, 24/10
= P (Z > 2, 04) = 1 − P (Z ≤ 2, 04) = 1 − 0, 97932 = 0, 02068.
Observação 4.7.2 Os resultados de acima são válidas tambén nos seguintes casos:
1. Para uma população innita, qualquer que seja o tipo de amostragem.
2. Para população nita, com amostragem com reposição.
Se a amostragem é sem reposição, em uma população nita de N elementos, a distribuição exata de

probabilidade p̂ é uma distribuição Hipergeométrica. Isto é,
¡N ¢¡N −M ¢
y
P (p̂ = ) = x ¡Nn−x¢ (4.17)
n n
A variância de p̂ é ajustado através do fator de correção de população nita, isto é,

µ ¶
pq N − n
V ar(p̂) = .
n N −1
Se, n é sucientemente grande, pelo teorema central do limite, a variável aleatória,

p̂ − p
Z=q ,
pq N −n
n ( N −1 )
tem distribuição aproximadamente normal padrão.
Exemplo 4.7.7 Informações anteriores mostram que 10% do lote de peças para uma máquina são
defeituosos. Suponha que um lote de 5000 peças foi adquirido. Seleciona-se uma amostra de 400 peças,
ao acaso e sem reposição. Que proporção da amostra terá
(a) entre 9% e 10% de peças defeituosas ?
(b) menos de 8% de peças defeituosas
Solução: Seja a variável aleatória Y : número de peças defeituosas na amostra e P (sucesso) = p = 0, 10.
A população é nita pois N = 5000 e p̂ = Yn é a proporção de defeituosos na amostra. Já que, n = 400,
grande, a variável
r aleatória, p̂ tem distribuição aproximadamente normal com média µp̂ = 0, 10 e desvio
³ ´ r ³ ´
(0,10)(0,90) 5000−400
padrão, σp̂ = pq n
N −n
N −1 = 400 5000−1 = 0, 0144.
(a)
 
0, 09 − 0, 10 p̂ − p 0, 10 − 0, 10
P (0, 09 < p̂ < 0, 10) = P  <q < 
0, 0144 pq N −n 0, 0144
n ( N −1 )
= P (−0, 69 < Z < 0) = P (Z ≤ 0) − P (Z ≤ −0, 69)
= 0, 5 − 0, 2451 = 0, 2549.
Ã !
(b) P (p̂ < 0, 08) = P q p̂−p < 0,08−0,10
= P (Z < −1, 39) = 0, 0823.
pq N −n
( ) 0,0144
n N −1
4.8 Distribuições Utilizadas na Inferência Estatística

4.8.1 Distribuição Qui-quadrado
Denição 4.8.1 Sejam Z1 , . . . , Zk k variáveis aleatórias distribuídas normalmente e independentes
com média µ = 0 e variância σ 2 = 1. A variável aleatória,
W = Z12 + Z22 + · · · + Zk2 (4.18)
tem distribuição Qui-quadrado com k graus de liberdade e sua função de densidade é dada por:
1 k w
f (w) = k/2
w 2 −1 e− 2 , w > 0 (4.19)
Γ(k/2)2
onde Γ(a) é uma função matemática denida

Z ∞
Γ(a) = xa−1 e−x dx,
0
chamada de função gama essa função satisfaz as seguintes propriedades:
Γ(a) = (a − 1)Γ(a − 1)
√
Γ(1/2) = π
Γ(a) = (a − 1)!, para a enteiro
O gráco da distribuição Qui-quadrado para k = 2, 4, 6, 10 graus de liberdade é mostrado na gura

4.13.
Figura 4.13: Funções de densidade de probabilidade de varias distribuições χ2(k)
A notação W ∼ χ2(k) é usada para indicar que a variável W tem distribuição Qui-quadrado com k
graus de liberdade.
Propriedades
Se W ∼ χ2(k)
(a) E(W ) = k e V ar(W ) = 2k.
(b) A distribuição é assimétrica direita.
(c) A medida que aumentam-se os graus de liberdade, torna-se simétrica.
Uso da tabela Qui-quadrado
Na tabela B do apêndice A, tem-se os pontos críticos da distribuição W ∼ χ2(k) , denotado por χ2α,k tal
que a probabilidade Z ∞
2
P (W > χα,k ) = f (w)dw
χ2α,k
Figura 4.14: Pontos críticos χ2α,k das distribuições χ2(k)
Essa probabilidade é representada pela área sombreada da gura 4.14. Para ilustrar o uso da tabela
B, observe que as áreas α estão na primeira linha e na primeira coluna estão os graus de liberdade
k. Portanto, o valor de χ2 com 10 graus de liberdade e com área (probabilidade) 0,05 à direita é
χ20,05,10 = 18, 31. Isto é,
P (W > χ20,05,10 ) = P (W > 18, 31) = 0, 05.
Exemplo 4.8.1 Se X é uma variável aleatória χ2(17) , obtenha: (a) P (X ≥ 8, 67); (b)P (X ≤ 867);
(c) P (6, 41 < X < 27, 59); (d) o valor de a tal que P (X < a) = 0, 025.
Solução
(a) P (X ≥ 8, 67) = P (X ≥ χ20,95,17 ) = 0, 95.
(b) P (X ≤ 867) = 1 − P (X ≥ 8, 67) = 1 − 0, 95 = 0, 05.
(c) P (6, 14 < X < 27, 59) = P (X ≥ 6, 41) − P (X ≥ 27, 59) = 0, 99 − 0, 05 = 0, 94

(d) P (X < a) = 0, 025; implica que P (X > a) = 0, 975. Logo, a = χ20,725,17 = 7, 56.
Teorema 4.8.1 (Propriedade reprodutiva ) Se W1 , W2 , . . . , Wn são variáveis aleatórias indepen-

dentes distribuídas cada uma com distribuição Qui-quadrado com k1 , k2 , . . . , kn graus de liberdade res-
pectivamente, então, a variável
W = W1 + W2 + . . . , Wn
P
n
tem distribuição Qui-quadrado com k = ki graus de liberdade
i=1
Exemplo 4.8.2 Se W1 , W2 e W3 são variáveis aleatórias independentes com distribuição Qui-quadrado

respectivamente com 2, 3 e 4 graus de liberdade respectivamente, então W = W1 + W2 + W3 ∼ χ2(9) .
Teorema 4.8.2 Seja X1 , . . . , Xn uma amostra aleatória de uma população normal com média µ e
variância, σ 2 . Então a variável aleatória
P
n
(Xi − X̄)2
i=1
W = (4.20)
σ2
segue uma distribuição Qui-quadrado com n − 1 graus de liberdade.
³ ´
Prova: A variável Zi = Xi −µ
∼ N (0, 1), i = 1, . . . , n independentes entre si. Pela denição da
σ
n ³
P ´2 ³ ´2
Xi −µ 2 e X̄−µ
distribuição Qui-quadrado, tem-se σ ∼ χ(n)
√
σ/ n
∼ χ2(1) , mas
i=1
n µ
X ¶ X n µ ¶2 µ ¶
Xi − µ 2 Xi − X̄ X̄ − µ
= + √
σ σ σ/ n
|i=1 {z } i=1
| {z } | {z 2
}
χ2(n) χ2(n−1) χ(1)
Pelo teorema 4.8.1, W tem distribuição Qui-quadrado com n − 1 graus de liberdade. Uma forma
equivalente da variável W, em (4.20), é:
(n − 1)S 2
W = ∼ χ2(n−1)
σ2
Exemplo 4.8.3 Suponha que o tempo de atendimento por cliente em uma loja tem distribuição
normal com variância de 0,81. Se uma amostra aleatória de 21 clientes foi retirada, obtenha: (a)
P (S 2 < 1, 272); (b) P (0, 50625 < S 2 < 1, 272);
Solução: Seja X : o tempo de atendimento por cliente. Se X ∼ N (µ, 0, 81).

(n−1)S 2 (20−1)S 2
Então W = σ2
= 0,81 ∼ χ2(20) .
(a)
µ ¶
2 (n − 1)S 2 (21 − 1)(1, 272)
P (S < 1, 272) = P <
σ2 0, 81
= P (W < 31, 41) = 1 − P (W ≥ 31, 41)
= 1 − 0, 05 = 0, 95
(b)
µ ¶
2 (21 − 1)(0, 50625) (n − 1)S 2 (21 − 1)(1, 272)
P (0, 50625 < S < 1, 272) = P < <
0, 81 σ2 0, 81
= P (12, 5 < W < 31, 41) = P (W > 12, 5) − P (W > 31, 41),
Nesse caso, na tabela χ2(20) , não há a probabilidade associada ao valor 12,5. Porém, essa probabilidade
pode ser aproximada mediante um processo de interpolação linear da seguinte forma:
P (W > χ2α,20 ) → 0, 50 α 0, 90 (0, 90 − 0, 5) → (12, 44 − 19, 34)

2
χα,20 → 19, 34 12, 5 12, 44 (α − 0, 5) → (12, 5 − 19, 34)
onde
(12, 5 − 19, 34)(0, 90 − 0, 5)
α = 0, 5 + = 0, 896522.
12, 44 − 19, 34
Portanto, P (0, 50625 < S 2 < 1, 272) = P (W > 12, 5) − P (W > 31, 41) = 0, 896522 − 0, 05 = 0, 846522
4.8.2 A distribuição t-Student

Denição 4.8.2 Seja Z e W duas variáveis independentes com distribuição normal padrão e Qui-
quadrado com k graus de liberdade, respectivamente. A variável aleatória,
Z
T =q
W
k
tem distribuição t-Student com k graus de liberdade. A função de densidade de probabilidade é dado
por:
µ ¶−(k+1)/2
Γ( k+1
2 ) t2
f (t) = 1+
(kπ)1/2 Γ( k2 ) k
A notação T ∼ t(k) é usada para indicar que a variável T tem distribuição t-Student com k graus de
liberdade.
Na gura 4.15 é apresentado o gráco da função de densidade de probabilidade, para k = 5, 10, 20
graus de liberdade.
Propriedades Se T ∼ t(k) .
(a)
E(T ) = 0
k
V ar(T ) = , k>2
k−2
(b) A distribuição é simétrica em torno de sua média.
(c) Se k → ∞, T ∼ N (0, 1).

Figura 4.15: Função de densidade de probabilidade da distribuição t-Student.
Uso da tabela t-Student
A tabela C, do apêndice A proporciona os pontos críticos da distribuição t-Student. Seja tα,k o valor da
variável aleatória T com k graus de liberdade para o qual tem-se uma área (probabilidade) α. Portanto,
tα,k é um ponto crítico na cauda superior da distribuição t-Student com k graus de liberdade. Este
ponto crítico aparece na gura 4.16. Na tabela C do apêndice, os valores de α encontram-se na primeira
linha da tabela, enquanto os graus de liberdade aparecem na primeira coluna da parte esquerda. Para
ilustrar o uso da tabela, observe que o valor de t-Student com 10 graus de liberdade que tem área de
0,05 à direita é t0,05,10 . Isto é,
P (T > t0,05,10 ) = P (T > 1, 812) = 0, 05
Figura 4.16: Pontos críticos, tα,k , da distribuição t-Student com k graus de liberdade
Como, a distribuição t-Student é simétrica com respeito a zero (média), tem-se que t1−α,k = −tα,k .
Isto é, o valor da variável T que corresponde a uma área igual (1 − α) à direita (e, portanto, uma área
de α à esquerda) é igual ao negativo do valor de T, que tem área α na cauda direita da distribuição.
Em conseqüência, t0,95,10 = −t0,05,10 = −1, 812.
Exemplo 4.8.4 Seja T uma variável aleatória com distribuição t-Student com 12 graus de liberdade
(gl). Determine:
(a) P (T > −1, 356)
(b) P (0, 695 < T < 2, 179)
(c) P (−2, 179 < T < 2)
(d) P (−1, 782 < T < 1, 782)
Solução: Se T ∼ t(12)
(a) Da tabela t-Student tem-se: P (T > 1, 356) = 0, 10. Pela simetria da distribuição t-Student tem-se;
P (T > 1, 356) = P (T < −1, 356) = 0, 10. Portanto,
P (T > −1, 356) = 1 − P (T < −1, 356) = 1 − P (T > 1, 356) = 1 − 0, 10 = 0, 90.
(b) P (0, 695 < T < 2, 179) = P (T > 0, 695) − P (T > 2, 179) = 0, 25 − 0, 025 = 0, 225
(c) P (−2, 179 < T < 2) = P (T > −2, 179) − P (T > 2). Mas na tabela t-Student não há o valor de
2 para 12 graus de liberdade (ou seja, não há tα,12 ). Porem, essa quantidade pode ser aproximado
mediante uma interpolação linear.
P (T > tα,20 ) → 0, 05 α 0, 025 (0, 05 − 0, 025) → (1, 782 − 2, 179)

tα,20 → 1, 782 2 2, 179 (α − 0, 025) → (2 − 2, 179)
daí tem-se:
(0, 05 − 0, 025)(2 − 2, 179)
α = 0, 025 + = 0, 036272.
1, 782 − 2, 179
Logo,
P (−2, 179 < T < 2) = P (T > −2, 179) − P (T > 2) = 1 − P (T > 2, 179) − P (T > 2)
= 1 − 0, 025 − 0, 036272 = 0, 938728.
(c)
P (−1, 782 < T < 1, 782) = P (T > −1, 782) − P (T > 1, 782) = 1 − P (T < 1, 782) − P (T > 1, 782)
= 1 − 2P (T > 1, 782) = 1 − (2)(0, 05) = 0, 90.
Observação 4.8.1 Se T ∼ t(k) e t1 > 0 ∈ R tem-se:
1. P (T > −t1 ) = 1 − P (T > t1 )
2. P (−t1 < T < t1 ) = 1 − 2P (T > t1 )

Teorema 4.8.3 Seja X1 . . . , Xn uma amostra aleatória de tamanho n de uma população normal com
média µ e variância σ 2 (desconhecida). Assim, a variável aleatória
X̄ − µ
T = √
S/ n
tem distribuição t-Student com n − 1 graus de liberdade
Exemplo 4.8.5 De uma população normal com média µ, seleciona-se uma amostra aleatória de
tamanho 16 sendo a variância amostral igual a 2,25. Qual é probabilidade de que média amostral dira
da média real numa quantidade maior que 0,7543?
Solução: P (|X̄ − µ| > 0, 7543) =? Do teorema 4.8.3, tem-se

X̄ − µ X̄ − µ
T = √ = √ ∼ t(15).
S/ n 2, 25/ 16
Logo, µ ¶
|X̄ − µ| 0, 7543
P √ > √ = P (|T | > 1, 341)
S/ n 2, 25/ 16
P (|T | > 1, 341) = 1 − P (−1, 341 ≤ T ≤ 1, 341) = 1 − [P (T > −1, 341) − P (T > 1, 341)]
= 1 − [1 − P (T < 1, 341) − P (T > 1, 341) = 1 − [1 − 2P (T > 1, 341)]
= 2P (T > 1, 341) = 2 × 0, 10 = 0, 20
Teorema 4.8.4 Seja X1 , . . . , Xn uma amostral aleatória de tamanho n de uma população com carac-
terística X, que tem distribuição normal com média µ1 e variância σ 2 (desconhecida). Seja Y1 , . . . , Ym
outra amostra aleatória de tamanho m, de uma população com característica Y que tem distribuição
normal com média µ2 e variância σ 2 (desconhecida). Se X e Y são independentes, a variável aleatória:
X̄ − Ȳ − (µ1 − µ2 )
T = q ,
Sp2 ( n1 + n1 )
(n−1)S12 +(m−1)S22
segue uma distribuição de t-student com n + m − 2 graus de liberdade, onde Sp2 = n+m−2 , e
é conhecida com a variância ponderada.
Prova: Se X ∼ N (µ1 , σ 2 ) e Y ∼ N (µ1 , σ 2 ) então X̄ ∼ N (µ1 , σ 2 /m) e Ȳ ∼ N (µ1 , σ 2 /m). Daí,

X̄ − Ȳ − (µ1 − µ2 ) X̄ − Ȳ − (µ1 − µ2 )
Z= q = q ∼ N (0, 1) (4.21)
σ 2 σ 2 1 1
n + n
σ n + n
Além disso,
(n − 1)S12 2 (m − 1)S22
W1 = ∼ χ(n−1) e W2 = ∼ χ2(m−1)
σ2 σ2
Pelo teorema 4.8.1, tem-se:
(n − 1)S12 + (m − 1)S22
W = W1 + W2 = ∼ χ2(n+m−2) (4.22)
σ2
Além disso, as variáveis Z em (4.21) e W em (4.22) são independentes. Pela denição da distribuição
t-Student tem-se:
X̄−Ȳ −(µ1 −µ2 )
q
1 1
Z σ n +n X̄ − Ȳ − (µ1 − µ2 )
T =q =r 2 +(m−1)S 2
= q ∼ t(n+m−2) ,
W
n+m−2
(n−1)S1
σ2
2 Sp2 ( n1 + n1 )
n+m−2
(n−1)S12 +(m−1)S22
onde Sp2 = n+m−2 .
4.8.3 Distribuição F-Snedecor

Denição 4.8.3 Seja W1 uma variável aleatória com distribuição Qui-quadrado com k1 graus de li-
berdade e W2 outra variável aleatória com distribuição Qui-quadrado com k2 graus de liberdade. Se W1
e W2 são independentes, a variável aleatória,
W1
k1
F = W2
,
k2
segue uma distribuição F-Snedecor com graus de liberdade, k1 (numerador) e k2 (denominador). A

função de densidade de probabilidade é dada por:
k1 k1
Γ( k1 +k
2 )
2 ( kk12 ) 2 f 2
−1
h(f ) = Γ(k1 /2 k1 +k2 , f >0
k1
Γ(k2 /2) (1 + k2 f )
2
A notação F ∼ F (k1 , k2 ) indica que que a variável aleatória F tem distribuição F-Snedecor, com graus
de liberdade k1 e k2 .
Propriedades
Se F ∼ F (k1 , k2 ) então
1. A distribuição é assimétrica direita.
2. A média e variância são respectivamente
k2 2k22 (k1 + k2 − 2)
µ= , k2 > 2 e σ 2 = , k2 > 4
k2 − 2 k1 (k2 − 2)2 (k2 − 4)
Uso da tabela F-Snedecor
Os pontos críticos da distribuição F -Snedecor são apresentados na tabela D do apêndice. Seja fα,u,v o
ponto crítico da distribuição F com graus de liberdade numerador u e graus de liberdade denominador
v , tal que a probabilidade de que variável aleatória F seja maior que este valor é
Z ∞
P (F > fα,u,v ) = h(f )df = α
fα,u,v
Isto é ilustrado na gura 4.17. Por exemplo se u = 5 e v = 10, então da tabela C do apêndice, tem-se:
P (F > f0,05,5,10 ) = P (F (5, 10) > 3, 33) = 0, 05.
Isso é o ponto crítico do 5% superior de F (3, 5) é f0,05,5,10 = 3, 33.
Figura 4.17: Pontos críticos, fα,u,v e , f1−α,u,v da distribuição F-Snedecor com u e v graus de liberdade
A tabela D contém, somente pontos críticos na cauda superior (valores de fα,u,v , para α ≤ 0, 25) da
distribuição F. Os pontos críticos na cauda inferior f1−α,u,v podem ser obtidos da seguinte forma:
1
f1−α,u,v = .
fα,v,u
Por exemplo, para determinar o ponto crítico na cauda inferior f0,95,5,10 observe que:
1 1
f0,95,5,10 = = = 0, 211.
f0,05,10,5 4, 74
Exemplo 4.8.6 Seja Y uma variável aleatória F -Snedecor.
(a) Se Y ∼ F (8, 12) obtenha: (a1) P (Y > 2, 85); (a2) P (2, 85 < Y < 4, 50); (a3) y1 se P (y1 < Y <
2, 95) = 0, 94
(b) Se Y ∼ F (45, 24), achar y1 tal que, P (Y ≤ y1 ) = 0, 95

Solução: Se Y ∼ F (8, 12),

(a1) P (Y > 2, 85) = P (Y > f0,05,8,11 ) = 0, 05.
(a2)P (2, 85 < Y < 4, 50) = P (Y > 2, 85) − P (Y < 4, 50) = 0, 05 − 0, 01 = 0, 04
(a3)
P (y1 < Y < 2, 95) = P (Y > y1 ) − P (Y > 2, 85) = 0, 94

= P (Y > y1 ) − 0, 05 = 0, 94.
1
Dai tem-se: P (Y > y1 ) = 0, 99, y1 = f0,99,8,12 . Logo, y1 = f0,99,8,12 = f0,01,12,8 = 1/5, 67 = 0, 176367
(b) Se Y ∼ F (45, 24), P (Y ≤ y1 ) = 1 − P (Y > y1 ) = 0, 95, daí tem-se: P (Y > y1 ) = 0, 05 e
y1 = f0,05,45,24 .
A tabela F -Snedecor não contem o valor crítico f0,05,45,24 . Esse valor pode ser aproximado mediante o
processo de interpolação harmônica.
gl do numerador 40 45 60 (1/45 − 1/60) → (1/40 − 1/60)

gl do denominador 24 24 24
f0,05,u,v 1, 89 y1 1, 84 (y1 − 1, 84) → (1, 89 − 1, 84)
Daí tem-se
(1, 89 − 1, 84)(1/45 − 1/60)
y1 = 1, 84 + = 1, 87333
(1/40 − 1/60)
Teorema 4.8.5 Seja X1 , . . . , Xn uma amostra de tamanho n retirada de uma população, X que tem
distribuição normal com média µ1 (desconhecida) e variância, σ12 . Seja Y1 , . . . , Ym uma amostra de
tamanho m de uma população, Y , com distribuição normal com média µ2 (desconhecida) e variância
σ22 e se X e Y são independentes, a variável aleatória,
S12 /σ12
F =
S22 /σ22
segue uma distribuição F-Snedecor com n − 1 e m − 1 graus de liberdade.
Exemplo 4.8.7 Suponha que duas máquinas A e B produzem em forma independente um mesmo
artigo. A maquina A é regulado produzir artigos com peso médio µ (desconhecido) e variância σ12 = 5.
Enquanto a maquina B foi regulada a produzir artigos com média µ a variância σ22 = 4. Da produção
da máquina A foi escolhidas ao acaso, uma amostra aleatória de n = 11 artigos e da máquina B uma
amostra aleatória m = 12 artigos. Supondo que os pesos dos artigos produzidos pelas máquinas A e B
S2
seguem uma distribuição normal determine o valor de k tal que, P ( S12 > k) = 0, 05.
2
Solução: Do teorema 4.8.5, tem-se que a variável

S12 /σ12 4 S12
F = = ,
S22 /σ22 5 S22
S2
segue uma distribuição F com 10 e 11 graus de liberdade, isto é, F ∼ F (10, 11). Portanto, P ( S12 >
2
S2
k) = P ( 54 S12 > 45 k) = P (F (10, 11) > 45 k) = 0, 05, Da tabela C do apêndice temos que, 45 k = 2, 85 −→
2
k = 3, 575.
4.9 Exercícios
1. O Departamento de Matemática é formado por 35 professores, sendo 21 homens e 14 mulhe-
res. Uma comissão de 3 professores será constituída, sorteando-se, ao acaso, três membros do
departamento. Considere a variável aleatória X : número de mulheres na comissão. Determine:
(a) A probabilidade a comissão ser formada por pelo menos duas mulheres.
(b) O valor esperado e variância de X .
(c) A função de distribuição acumulada de X .
(d) A distribuição de probabilidades, valor esperado e a variância da variável |1 − 2X|
2. A produção diária de 850 peças contem 50 não satisfazem os requerimentos do cliente. Da

produção de um dia escolhe-se ao acaso três peças uma a uma e sem reposição. Seja a variável
aleatória X o número de peças da amostra que não cumpre com os requerimentos do cliente.
Determine
(a) a função de probabilidades de X e sua representação gráca ,

(b) a função de distribuição acumulada de X e sua representação gráca,
(c) Para variável Y = 2X−1, determine sua função de probabilidade e sua função de distribuição
acumulada.
(d) E(X) e Var(X).
3. Considere no exercício 2, que escolha foi com reposição. Determina a função de probabilidades
da variável aleatória e a esperança de X e compare com os resultados do exercício anterior.
4. Num lote de 400 lâmpadas por experiências passadas se sabe que 20% são defeituosos. Do lote
sortia-se uma amostra (sem reposição) de 3 lâmpadas. (i) Qual é probabilidade de obter no
máximo 1 defeituosos na amostra. (ii) se cada lâmpada tem um custo de 1,5 unidades monetária
(u.m) e vende-se a 3 u.m , qual é o lucro esperado na amostra.
5. Uma empresa Química paga a seus estagiários de acordo com o ano de curso do estudante. Para
obter o salário mensal pago por 30 horas semanais, multiplica-se o salário mínimo pelo ano de
curso do estagiário. Dessa forma, o estudante do primeiro ano ganha um salário mínimo, o
do segundo recebe dois e assim por diante até o quinto ano. A empresa vai empregar 2 novos
estagiários e admitimos que todos os anos têm igual número de estudantes interessados no estágio
(considere a população de candidatos muito grande de modo a não haver diferença entre escolher
com e sem reposição). Determinar:
(a) O gasto médio da empresa nos estagiários ,

(b) A probabilidade de que o empresário gaste mais de 5 salários mínimos nos estagiários?
(c) Determine a função de distribuição para variável aleatória gasto e faça sua representação
gráca.
6. Suponha que D, o número de medicamentos vendidos em uma semana, seja uma variável aleatória
com a seguinte função de probabilidade:
½ Cd2
f (d) = P (D = d) = d! ; d = 1, 2, 3, 4
0; caso contrário
(a) Determine: (i) A constante C para que f(d) seja a função de probabilidade de D. (ii) o
número médio de medicamentos vendidos. (iii) a probabilidade do número de medicamentos
vendidos em uma semana seja no máximo três peças.
(b) Se cada medicamento vendido o representante ganha uma comissão de R$ 12,00 e se o custo
do medicamento é de R$ 3,00, qual é o lucro esperado em uma semana?
7. Uma variável aleatória X tem a seguinte função de probabilidade:

½ k
f (x) = 2x ; x = 0, 1, . . .
0; caso contrário
(a) Determine a constante k

(b) Determine a probabilidade que X assuma um valor par.
8. O tempo de duração(em anos) de certo microprocessador, é considerado uma variável aleatória

contínua X, com a seguinte função de densidade de probabilidade
( x−k
e− 10 ; x ≥ 2
f (x) =
0; x<2
(a) Determine a constante k para que f (x) seja uma função de densidade de probabilidade de
X.
(b) Determine e interprete E(X) e V ar(X),
(c) Qual é a probabilidade de um microprocessador dure mais de 5 anos em uma escolha alea-
tória?
(d) Determine a função de distribuição acumulada da variável tempo de vida,
(e) Se um microprocessador há durando mais de 7 anos, qual é a probabilidade que dure outros
2 anos?
9. Uma industria produz artigos cujos pesos (em kg) é uma variável aleatória contínua X, que tem
a seguinte função de densidade de probabilidade

 x−8 ; 8≤x≤9
f (x) = 10 − x ; 9 < x < 10

0 ; caso contrário
(a) Determine a média e desvio padrão da variável aleatória X;

(b) O fabricante vende um artigo por um preço xo de R$ 20,00 e garante o reembolso do preço
de venda a qualquer cliente se o peso do artigo seja inferior a 8,25 kg. O custo de produção
está relacionado ao peso do artigo de acorda com a expressão 0, 05X + 0, 50. Expresse a
variável lucro L, em termos da variável aleatória X.
(c) Determine o lucro esperado por artigo.
10. Sabe-se que com determinado tratamento alcança 60% de curas para certa doença quando o
mesmo é administrado a pacientes em condições bem denidas. Se tratamento for aplicado a 20
pacientes nessas condições, qual é probabilidade de que:
(a) Ocorram no máximo 5 curas?

(b) Ocorram no mínimo 9 e no máximo 11 curas ?.
(c) Qual é o número esperado de curas? E qual a variância?.
11. O teste de DNA, feito numa clínica, tem 99.99% de conabilidade nos resultados. Durante o
último ano, num hospital, esse exame foi requisitado por 200 pessoas para a comprovação de
paternidade. Com esses dados, calcule:
(a) A probabilidade que 5 conrmações de paternidade estejam erradas.

(b) A probabilidade que, ao menos, 2 conrmações estejam erradas.
12. Um fármaco usado para combater intoxicação causada pelo mercúrio, causa, em 45% dos paci-
entes, efeitos colaterais. Num teste feito em 10 pessoas contaminadas por mercúrio, obtenha:
(a) A probabilidade de exatamente 5 pessoas apresentarem efeitos colaterais.

(b) A probabilidade de menos de 2 pessoas apresentarem efeitos colaterais.
(c) A probabilidade de ninguém apresentarem efeitos colaterais.
13. Num teste de laboratório para se medir a taxa de glicose no sangue, constatou-se que 25% das
pessoas que zeram o teste tinham glicose em torno de 100 mg/dl. Calcule a probabilidade de:
(a) Em 10 pessoas que zeram o teste, mais de 9 tenham glicose em torno de 100 mg/dl.
(b) Em 50 pessoas que zeram o teste, haja entre 5 e 10 pessoas com glicose em torno de 100
mg/dl.
14. Uma universidade processa 100.000 avaliações em determinado semestre, em ocasiões anteriores
mostraram, que o 0,1% de todas avaliações estavam equivocadas. Suponha que uma pessoa
faz cinco disciplinas nesta universidade em um semestre. Qual é a probabilidade que todas as
avaliações estejam corretas?
15. Um exame de múltipla escolha consiste em 10 questões, cada uma com cinco possibilidades de
escolha. A aprovação exige no mínimo 50%. Qual a chance de aprovação, se
(a) O candidato comparece ao exame sem saber absolutamente nada, apelando apenas para o
palpite.
(b) O candidato estudou suciente para poder eliminar três escolhas, devendo então apenas
entre as duas escolhas restante.
16. Um time Mineiro de futebol tem probabilidade 0,70 de vitórias sempre que joga. Se o time atuar
4 vezes determine a probabilidade de que vença:
(a) Todas as 4 partidas.

(b) Exatamente 2 partidas.
(c) Pelo menos uma partida.
(d) No máximo 3 partidas.
(e) Mais da metade das partidas.
17. Um corpo se encontra em repouso, no ponto (0,0). Lança-se um dado e por cada número primo
que aparece o corpo se movimenta uma unidade de distância à direita, em caso contrário uma
unidade à esquerda. Calcular a probabilidade que após 10 lançamentos o corpo se encontre:
(a) a 8 unidades de distância à direita da origem;

(b) a 3 unidades de distância à direita da origem;

(c) a 2 unidades de distância à esquerda da origem;
(d) a mais de uma unidade à direita da origem.
18. Um atirador faz três disparos a um alvo. Em cada um dos disparos a probabilidade de acertar
é igual a 3/4. Acerta-se uma vez recebe R$50, 0, se acerta duas vezes recebe R$70, 0, se acerta
três vezes recebe R$100,0 e nenhum dos disparos acertou o alvo, tem que pagar R$700. Calcular
o lucro esperado.
19. Uma mulher de 47 anos pretendia ter lhos através de inseminação articial. Uma junta de
técnicos da área zeram testes para se saber qual o risco que ela poderia correr. Foi diagnosticado
que, por ser uma mulher muito saudável, o único risco era de nascer uma criança com alguma
doença genética. Assim, foi dado a probabilidade de 0,1 para ocorrer o nascimento de uma
criança doente. Supondo que ela tenha 6 lhos, qual a probabilidade de 2 nascerem doentes.(
Calcule usando a distribuição Poisson e a distribuição Binomial )
20. O número de partículas emitidas por uma fonte radiativa, durante o período especicado, é uma
variável aleatória de Poisson. Se a probabilidade de não houver emissões for igual a 1/3, qual é
a probabilidade de que 2 ou mais emissões ocorram?
21. Laminas de metal apresentam defeitos no cromado, segundo uma distribuição de Poisson, com
uma média de um defeito por m2 . Essas laminas são usadas para construção de janelas para
uma instalação industrial cuja dimensão são de, 150 cm × 200 cm.
(a) Em um grupo 10 dessas janelas qual é a probabilidade de que no máximo 4 delas não tenha
nenhum defeito?
(b) Em um grupo de 3 dessas janelas, qual é a probabilidade de total de falhas nesse grupo seja
no máximo três?
22. Em uma fabrica, a maquina 1 produz por dia o dobro de peças que a maquina 2 e, a maquina
3 o triplo da maquina 1. Sabe-se que 6% das peças fabricadas pela maquina 1 tendem a ser
defeituosas, e o 4% das peças produzidas pela maquina 2 tendem a ser defeituosas, enquanto
8% de peças defeituosas da maquina 3. A produção diária é misturada. Extraída uma amostra
aleatória (com reposição) de 20 peças, qual é a probabilidade de que essa amostra contenha:
(a) No máximo duas peças defeituosas?

(b) Entre três e cinco peças defeituosas?
(c) Suponha que o total de peças produzidas por dia é de 1000 peças. Refaça o item (a) se
amostragem foi sem reposição.
23. Foi analisada uma cultura de bactérias para se obter o número médio de bactérias por mm2 .
Os dados obtidos, levaram a se prever a probabilidade de não se encontrar nenhuma bactéria
escolhendo-se, aleatoriamente, um 1mm2 na placa de cultura que é igual a 0.006734. Calcule,
assim, o valor médio de bactérias por mm2 , sabendo que a variável "no de bactérias /mm2 da
placa de cultura"constitui uma distribuição de Poisson.
24. Em uma comunidade isolada no himalaia, foram feitas medições de nível de colesterol no sangue
nos moradores locais. O valor da média encontrado foi de 178 mg/dl e um desvio padrão igual a
10 mg/dl. Supondo que o nível de colesterol dessa população tem distribuição normal obtenha:
(a) a probabilidade de um morador dessa comunidade apresentar taxa de colesterol igual a 180
mg/dl.
(b) a probabilidade de um morador se encontrar entre 168 e 188 mg/dl.
25. Um vendedor de automóveis sabe que o número de carros vendidos por dia em sua loja comporta-
se como uma variável de Poisson cuja média é 2 nos dias de bom tempo, e é 1 nos dias chuvosos.
Se em 70% dos dias faz bom tempo, qual é a probabilidade de que em certo dia do ano sejam
vendidos pelo menos três automóveis?
26. Considere um experimento que consiste em contar o número de partículas alfa emitidas, num
intervalo de tempo de um segundo. Sabe-se por experiências passada que, em média, 3 de
tais partículas são emitidas por segundo. Determinar a probabilidade de que não mais de duas
partículas alfa sejam emitidas em um quarto de segundos.
27. Um determinado fármaco, usado para combater infecção, foi usado em cobaias para se vericar
sua ecácia. Foi usado quantidades variáveis do fármaco que se assemelha de uma variável
aleatória com distribuição normal. Assim, foi obtida a probabilidade de 99.9% de que os animais
foram tratados com uma quantidade de fármaco igual ou menor a 171 mg. Calcule a média de
fármaco utilizado nas cobaias, sabendo que por estudos similares σ = 5 mg.
28. A dureza H de uma peça de aço pode ser pensada como sendo uma variável aleatória com
distribuição uniforme no intervalo (50,90) da escala de Rochkwel. Qual é a probabilidade que a
peça tenha dureza entre 55 e 60.
29. O petróleo é separado por destilação nas frações, listados na tabela seguinte
Fração Temperatura de destilação ( 0 C ) Preço de venda por galão (US $)
Gás Menos de 20 C1
Petróleo éter 20 |− 60 C2
Ligroin 60 |− 100 C3
Suponha que C dólares é o custo de produzir um galão de petróleo e a temperatura de destilação
T está distribuído uniformemente em [0, 100]. Achar o lucro esperado (por galão) pelas frações.
30. Suponha que um fabricante tenha que decidir entre dois processos de fabricação de certa com-
ponente eletrônica. O custo do processo A é de c dólares e do processo B é kc dólares por
unidade de componente, onde k > 1. Os tempos de falhas das componentes eletrônicas pode ser
consideradas como uma variável aleatória exponencial com média de falha de 200 horas para os
fabricados pelo processo A e 300 horas para B . Admita-se, além disso, que se a componente dure
menos de 400 horas, pagará uma multa de D dólares. Que processo deverá usar ?
31. O 5% das lâmpadas produzidas por certa maquina são defeituosos. O tempo de vida,T, de uma
lâmpada defeituosa é uma variável exponencial com média 0,5 ano, enquanto que o tempo de
vida T1 de uma lâmpada não defeituosa é uma variável aleatória exponencial com média 2 anos.
Calcular a probabilidade de uma lâmpada:
(a) Se queimar antes dos 2 anos.

(b) Durar entre 2 e 4 anos.
32. Certo tipo de fusível tem duração de vida que segue uma distribuição exponencial com tempo
médio de vida de 100 horas. Cada peça tem um custo de 10,0 unidades monetárias (u.m) e se
durar menos de 20 horas, existe um custo adicional de 8.0 u.m.
(a) Qual é a probabilidade de uma durar mais de 150 horas?

(b) Determinar o custo esperado.
33. A fabrica de pneu "DURAMAS"produz um tipo de pneus que tem uma vida útil média de 80.000
km e um desvio padrão de 8.000 km. Supondo que essa vida útil tem distribuição normal :
(a) qual é a probabilidade de que um pneu dure más de 96.000 km ?

(b) O 50% dos pneus durem entre a e b quilômetros. Achar os valores a e b, sim eles são
simétricos respeito à média.
34. Um combustível para foguetes vai a conter certo porcentagem (chamado de X) de um componente
especial. As especicações exigem que X esteja compreendido entre 30 a 35 por cento. O
fabricante terá um lucro liquido no combustível (por galão ) que é a seguinte função de X :

 −0, 10 por galão se 30 < x < 35
T (X) = 0, 05 por galão se 33 ≤ x < 40 ou 25 ≤ x ≤ 30

0, 10 caso contrário
Se X ∼ N (33, 9). Calcular (a) a função de probabilidade de T (X), (b) E(T (X)).
35. Um teste de aptidão feito por pilotos de aeronaves em treinamento inicial requer que uma série
de operações seja realizada em uma rápida sucessão. Suponha que o tempo necessário para
completar o teste seja distribuído de acordo com uma Normal de média 90 minutos e desvio
padrão 20 minutos.
(a) Para passar no teste, o candidato deve completá-lo em menos de 80 minutos. Se 65 candi-
datos tomam o teste, quantos são esperados passar no teste?
(b) Se os 5% melhores candidatos serão alocados para aeronaves maiores, quão rápido deve ser
o candidato para que obtenha essa posição?
36. Estudos meteorológicos indicam que a precipitação pluviométrica mensal em períodos de seca
numa certa região pode ser considerada como seguindo a distribuição Normal de média 30 mm
e variância 16 mm2 .
(a) Qual a probabilidade de que a precipitação pluviométrica mensal no período da seca esteja
entre 24mm e 38mm?
(b) Qual seria o valor da precipitação pluviométrica de modo que exista apenas 10% de chance
de haver uma precipitação inferior a esse valor?
(c) Construa um intervalo central em torno da média que contenha 80% dos possíveis valores
de precipitação pluviométrica.
37. Numa certa população, o peso dos homens tem distribuição normal com média 75kg e desvio
padrão 10kg, enquanto que o das mulheres é também normal com média 60kg e desvio padrão
4kg.
(a) Sorteando-se um homem qualquer, qual é a probabilidade dele ter peso acima de 65kg?
(b) Sorteando-se uma mulher qualquer, qual é a probabilidade dela ter peso acima de 65kg?
(c) Qual é a probabilidade de uma pessoa ter peso acima de 65kg, sendo ela sorteada de um
grupo em que o número de mulheres é o dobro do de homens?.
38. O diâmetro X de rolamentos de esfera fabricados por uma certa fábrica tem distribuição normal
com média 0,614 cm e desvio padrão 0,0025. O lucro T de cada esfera depende de seu diâmetro,
e T = 0, 10 se a esfera é boa, isto é, se (0, 61 < X < 0, 618); T=0,05 se a esfera é recuperável,
isto é, se (0, 608 < X < 0, 61) ou (0, 618 < X < 0, 62); T=-0,10 se a esfera é defeituosa, isto é,
(X < 0, 6080 ou X > 0, 620). Calcular:
(a) As probabilidades de as esferas serem boas, recuperáveis e defeituosas:

(b) O valor médio do lucro T.
39. Supondo que numa população de pessoas normais a pressão de pulso é uma variável aleatória tem
distribuição normal com média 40 mmHg e desvio padrão 16 mmHg. Se uma pessoa é selecionada
dessa população obtenha:
(a) a probabilidade da pessoa apresentar pressão de pulso menor a 45 mmHg a e maior 60

mmHg.
(b) a probabilidade da pessoa sorteada apresentar pressão de pulso menor que 55 mmHg.
40. Em uma espécie animal, a taxa normal de hemoglobina é uma variável aleatória com distribuição
normal com média µ = 150g/L de sangue e variância, σ = 144g/L de sangue. Se uma animal
dessa espécie é selecionada ao acaso, qual a probabilidade de que a taxa de hemoglobina normal,
estar entre 146 e 153 g/L.?
41. Um estudo feito em duas cidades (A e B) de Minas obteve o valor médio e o desvio padrão da
concentração de glicose no sangue de pessoas que não apresentavam distúrbios siológicos em
relação a concentração de glicose no sangue.
Cidade A µ1 = 104.8mg/100mL de sangue σ1 = 6.4mg/100mL de sangue.
Cidade B µ2 = 102.3mg/100mL de sangue σ2 = 4.9mg/100mL de sangue.
Admitindo que a concentração de glicose no sangue de pessoas das duas cidades tem distribuição
normal,
(a) calcule a probabilidade de uma pessoa da cidade A ter a concentração de glicose no sangue
seja pelo menos 100 mg/100mL de sangue.
(b) calcule a probabilidade de uma pessoa da cidade B ter a concentração de glicose no sangue
pelo menos 100 mg/100mL de sangue.
(c) Retirando-se uma pessoa de amostra contendo a proporção de 1:3 para moradores da cidade
A e B, Qual a probabilidade dessa pessoa ter a concentração de glicose seja pelo menos 100
mg/100mL de sangue
(a) se uma pessoa é sorteada ao acaso de cada uma das cidades, qual é probabilidade que a
concentração de glicose da pessoa da cidade A seja maior ao da pessoa da cidade de B.?
42. A concentração de uma substância X no sangue tem distribuição normal com média 10 mg e
desvio padrão 2 mg por unidade de volume. É considerado doente o indivíduo que tenha uma
dosagem menor que 6,0 mg ou maior que 13,5 mg.
(a) Se um indivíduo é escolhido ao acaso, qual é a probabilidade dele ser considerado doente ?
(b) Em 100 pessoas escolhidas ao acaso, qual é a probabilidade de observamos no máximo 2
doentes?.
(c) Se escolhemos ao acaso 30 pessoas, qual é a probabilidade de que a concentração média da

substância das 30 pessoas ultrapasse 11 mg?
43. A capacidade máxima de um elevador é de 500 kg. Se a distribuição dos pesos dos usuários
é suposta normal com média 70 kg e desvio padrão 10 kg. Qual é probabilidade de que 10
passageiros ultrapassem esse limite ?.
44. Um braço mecânico consta de três partes. Suponha que X, Y e Z são produzidos por diferentes
fabricas e cuja longitude de cada um estão dado por : X ∼ N (12, 0, 02), Y ∼ N (24, 0, 03) e
Z ∼ N (18, 0, 04), onde a média está dado em centímetros e variância em centímetros quadrados.
Calcular a probabilidade do braço esteja compreendido entre 53.8 y 54.2.
45. Uma corretora de negocia título na Bolsa de Valores e utiliza um modelo probabilístico para
avaliar o lucro seus lucros. Suas aplicações nanceiras de compra e venda atingem três áreas:
agricultura, industria e comércio. Admite que o seguinte modelo representa o comportamento
do lucro diário da corretora ( em milhares de dólares)L = 3LA + 5LI + 4LC , com LA , LI e LC
representando respectivamente os lucros diários nos setores de agricultura, industria e comércio.
As distribuições de probabilidade dessas variáveis aleatórias são LA ∼ N (3, 5), LI ∼ N (6, 9) e
LC ∼ N (4, 16). Supondo independência entre os três setores, qual será a probabilidade de um
lucro diário acima de 50 mil ?.
46. O tempo gasto no exame de uma universidade tem distribuição normal com média 100 minutos
e desvio padrão 10 minutos.
(a) Qual é a porcentagem de vestibulandos que gastam no máximo 90 minutos no exame?

(b) Qual é probabilidade de que um vestibulando gaste exatamente 160 minutos?
(c) Qual deve ser o tempo da prova, de modo que 90% dos vestibulandos terminem no prazo
estipulado?
(d) Dez vestibulandos foram sorteados ao acaso, qual é a probabilidade que pelo menos dois
alunos gastem no máximo 90 minutos?
(e) Suponha que o total de vestibulandos foi 700. Refaça o item (d) se amostragem foi sem
reposição.
47. A dimensão de hastes metálicas fabricadas em série é uma variável aleatória normalmente dis-
tribuída com média 60 cm e variância 4 cm. Ao se coletar uma amostra aleatória de 10 valores
determine:
(a) A probabilidade de que a média amostral esteja situada entre 59,5 a 60,5 cm.
(b) A probabilidade de que variância amostra seja inferior a 3 cm.
(c) Refaça os cálculos indicados nos ítens (a) e (b) supondo uma amostra com n=20.
48. Se tomarmos uma amostra de 20 elementos de uma variável aleatória X tal que X ∼ N (µ, σ 2 )
e se nesta amostra obtivermos S = 5. Com que probabilidade podemos armar que a média da
amostra não se afaste de em mais de uma unidade.
49. Suponhamos que uma central atacadista tenha como média para o montante de vendas o valor
de 150 OTN's e como desvio padrão o valor 10 OTN's . Suponha ainda que 20% das vendas
efetuadas tenha valor superior a 170 OTN's. Nestas condições ao se coletar uma amostra de 100
clientes calcular:
(a) A probabilidade de que a média encontrada na amostra se distância da média real em mais
de 2 unidades .
(b) A probabilidade de que a amostra apresente mais de 26 clientes que efetuem compras com
valor superior a 170 OTN's
50. Admitimos que em um lote de 800 motores apresente 200 com um determinado defeito. Ao
coletarmos uma amostra de 50 motores sem reposição, qual é a probabilidade de que a mesma
apresente menos de 10 motores com defeito.
51. Constatou-se que um lote de 20.000 faturas de uma grande cadeia de lojas apresenta média de
4,5 OTN's e como desvio padrão o valor 0,5 OTN's , sendo ainda que 30% das mesmas superior
a 0,5 OTN's. Tomada uma amostra (sem reposição) de 225 faturas, calcular:
(a) A probabilidade de que a média amostral se afastar em 0,01 OTN's da média real .
(b) Qual a probabilidade de que dentre as 225 faturas observadas mais de 60 apresentem um
valor superior a 5,0 OTN's
52. A maquina de empacotar um determinado produto o faz segundo uma distribuição normal, com
média µ e desvio padrão 10 gr.
(a) Em quanto deve ser regulado o peso médio para que apenas 10% dos pacotes tenham menos
do que 500.
(b) Com a maquina assim regulada qual é a probabilidade de que o peso total de 4 pacotes
escolhidos ao acaso seja inferior a 2 kg ?
53. No exercício anterior, após a maquina estar regulada programou-se uma carta de controle de
qualidade. De hora em hora, será retirada uma amostra de 4 pacotes, e estes serão pesados. Se
a média da amostra foi inferior a 4095 gr ou superior a 520 gr, para-se a produção para reajustar
a máquina isto é, reajustar o peso médio.
(a) Qual a probabilidade de ser feita uma parada desnecessária ?

(b) Se o peso médio da maquina desregulou-se para 500 gr, qual a probabilidade de continuar-se
a produção fora dos padrões desejados. ?
54. Uma empresa recebe certo componente em grandes lotes. Sabendo-se que o fornecedor envia
lotes com 10% de peças defeituosas, qual é a probabilidade de numa amostra com 100 ítens, a
proporção defeituosa ser
(a) 17% ou mais ?

(b) entre 9,5% e 10% ?
(c) menor que 8% ?
(d) maior que 9 %?
55. Cerca de 15% dos bares em Ouro preto vendem ado a seus clientes. Determine a probabilidade
de, numa amostra aleatória de 64 bares:
(a) 16% ou menos venderem ado.

(b) Entre 15% e 16% venderem ando.
(c) Mais de 15% e 17% venderem ado.
56. Sabendo-se que 70% da população ativa do Brasil ganha menos de 3 salários mínimos, qual é a
probabilidade de que uma amostra aleatória com 900 pessoas apresentar:
(a) mais de 67% das pessoas da amostra recebendo menos de 3 salários mínimos ?
(b) mais que 72% ou menos que 68% da amostra ganhando menos que 3 salários mínimos?
(c) Entre 540 a 720 pessoas com renda menor que 3 salários mínimos ?
57. Suponha que tem-se 2 processos (A e B) para produzir um artigo, e que o tempo médio de
produção para o processo A é 300 horas e desvio padrão 16 horas, enquanto que para o processo
B tem o tempo médio de 306 horas e uma desvio padrão de 12 horas. Se sorteiam-se uma amostra
aleatória de 64 artigos produzidos com processo A e 49 produzidos com o processo B, calcular a
probabilidade que:
(a) A diferença de médias amostrais seja superior a 2 horas.

(b) O tempo médio de produção da amostra do processo A seja menor ao correspondente pro-
cesso B.
(c) Refaça os cálculos indicados nos ítens (a) e (b) supondo que as amostras foram selecionados
sem reposição de um lote de 500 artigos produzidos pelo processo A, e de um lote de 480
artigos produzidos pelo processo B.
58. Suponha que uma empresa de comercialização tem 2 lojas A , B e que porcentagens de clientes
que consideram que a atenção dada é boa na loja A de 70% entanto que na loja B é de 63%.
Para avaliar a opinião dos clientes enquanto ao atendimento seleciona-se amostras aleatórias de
tamanhos: 50 para a loja A e 60 para a loja B, calcular a probabilidade de que a proporção de
clientes satisfeitos pela atenção recebida pela loja A na amostra supere aos dados pela loja B em
menos de 0,05% se:
(a) A amostra é com reposição.

(b) A amostra sem reposição, tendo-se escolhida a amostra da loja A de uma total de 900
clientes e a de B de um total de 1400 clientes.
59. Suponha que os pesos de artigos produzidos por uma maquina tem distribuição normal com
média µ e variância 25 gr. Se escolhe ao acaso 16 artigos, calcular:
(a) P (S 2 > 32, 128)

(b) O valor de k tal que P (S < k) = 0, 6
60. Suponha que 2 maquinas A e B produzem um mesmo artigo e que os pesos por artigo (em gramas)
tem distribuição normais com médias: µ1 = 550 e µ2 = 565 e variâncias: σ12 = 144 e σ22 = 256
respectivamente. Escolhe-se ao acaso 21 artigos produzidos pela maquina A e 31 produzidos pela
maquina B, calcular :
(a) a probabilidade de que o peso médio de produção da amostra da maquina A seja maior do
peso médio dos produzidos pela maquina B em mais de 2 gr.
S12
(b) P (1, 08563 ≤ S22
≤ 1, 4344)
Capítulo 5
Inferência Estatística
5.1 Introdução
A inferência estatística é o processo que consiste em utilizar os resultados de uma amostra para tirar
conclusões gerais de uma ou mais características de uma população. Ela compreende: estimação de
parâmetros e teste de hipóteses estatística.
5.2 Estimação de Parâmetros

No capítulo anterior foram considerados diversas distribuições de probabilidade. Muitas vezes sabe-se
ou admite-se que uma variável aleatória X (característica da população) segue uma certa distribuição
de probabilidade, mas não são conhecidos os valores dos parâmetros da distribuição. Por exemplo, se X
seguir a distribuição normal, pode-se querer saber o valor de seus parâmetros (a média e a variância).
Para estimar os parâmetros, considera-se uma amostra aleatória de tamanho n e, utiliza-se os dados
amostrais para estimar os parâmetros desconhecidos. Isso é conhecido como o problema de estimação.
E esse problema pode ser dividido em duas categorias: estimação pontual e estimação por intervalos.
5.2.1 Estimação pontual

Para xar os conceitos, seja X alguma característica da população com função de probabilidade ou
função de densidade f (x; θ), onde θ é o parâmetro da distribuição. Suponha que conhecida a forma
funcional de f (x; θ), como por exemplo, a distribuição normal, mas não se sabe o valor de θ. Portanto,
sorteia-se uma amostra aleatória de tamanho n e desenvolve-se uma função dos valores amostrais
θ̂ = h(X1 , . . . , Xn )
que forneça uma estimativa de θ. θ̂ é conhecido como um estimador, e um valor numérico particular
assumido pelo estimador é conhecido como uma estimativa. Note que θ̂ pode ser tratado como uma
variável aleatória, pois é uma função dos dados amostrais. O estimador θ̂ fornece uma regra, ou
fórmula, que diz como se pode estimar o θ verdadeiro. Assim, ao se admitir que
1
θ̂ = (X1 + X2 + · · · + Xn ) = X̄
n
133
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 134
temos que X̄, a média amostral, é um estimador do valor médio verdadeiro (ou populacional), µ. Se
em um caso especico, X̄ = 50, tem-se uma estimativa de µ. O estimador θ obtido anteriormente nos
fornece uma única estimativa (pontual) de θ.
5.2.2 Estimação por intervalos

Ao invés de se obter uma única estimativa de θ, suponha que obtém-se duas estimativas de θ por meio
da construção de dois estimadores, θ̂1 e θ̂2 , e considera-se com alguma conança (isto é, probabilidade)
que o intervalo entre θ̂1 e θ̂2 inclui o verdadeiro θ. Assim, em um estimativa por intervalo, em contraste
com a estimativa pontual, fornecemos uma classe de possíveis valores dentro do qual se pode encontrar
o verdadeiro θ.
Denição 5.2.1 (Intervalos de conança) Seja X1 , . . . , Xn uma amostra aleatória de população

com a característica X , cuja distribuição de probabilidade é f (x; θ). Seja T1 = G(X1 , . . . , Xn ) e
T2 = H(X1 , . . . , Xn ) duas estatísticas tais que T1 < T2 e que
P (T1 < θ < T1 ) = γ = 1 − α.
Então, o intervalo (T1 ; T2 ) é chamado de intervalo de 100γ% ou (1 − α)100% de conança para θ.
Denota-se por IC(θ, 1 − α), o intervalo de (1 − α)100% de conança para θ. Isto é,
IC(θ; 1 − α) = ( T1 ; T2 )
onde T2 e T1 são os limites superior e inferior de conança respectivamente e γ = 1 − α é o coeciente

(ou nível) de conança. A escolha do coeciente de conança depende do pesquisador e os valores mais
utilizados são γ = 1 − α = 0, 90; 0, 95; 0, 98; 0, 99.
Supondo que uma característica, X , da população tem distribuição normal ou qualquer outra distri-
buição e considerando as distribuições amostrais estudadas nos capítulos anteriores pode-se deduzir
intervalos de conança para: uma média populacional, uma proporção populacional, uma variância
populacional, diferença de médias e razão de variâncias.
5.3 Intervalos de conança para média de uma população (µ)

5.3.1 Quando variância σ 2 é conhecida
Suponha que X1 , . . . , Xn , seja uma amostra aleatória de tamanho n extraída de uma população, com
a característica X , que tem distribuição normal com média µ e variância σ 2 . Foi visto que a média
amostral X̄ tem distribuição normal com média µ e variância σ 2 /n. Assim
X̄ − µ
Z= √ ∼ N (0, 1).
σ/ n
Logo, xando um valor (1 − α), encontrar-se zα/2 tal que:

¡ ¢
P −zα/2 < Z < zα/2 = 1 − α
ou, o que é equivalente, µ ¶

X̄ − µ
P −zα/2 < √ < zα/2 = 1 − α. (5.1)
σ/ n
Note que zα/2 pode ser obtida de tabela da distribuição normal padrão, utilizando-a de forma inversa
aquela discutida no capítulo anterior e como mostra a gura 5.1, abaixo.
¡ ¢
Figura 5.1: Distribuição normal padrão P −zα/2 < Z < zα/2 = 1 − α.
De (5.1)
X̄ − µ σ σ
−zα/2 < √ < zα/2 ⇒ X̄ − zα/2 √ < µ < X̄ + zα/2 √
σ/ n n n
Assim, o intervalo de conança para µ, com coeciente de conança (1 − α) , é dado por

µ ¶
σ σ
IC(µ; 1 − α) = X̄ − zα/2 √ ; X̄ + zα/2 √ . (5.2)
n n
Um erro muito comum que se comente ao interpretar o intervalo de conança é dizer que a probabilidade
de µ estar no intervalo é 1 − α . O erro resulta do fato de que µ não é uma variável aleatória e sim um
parâmetro que caracteriza uma população. Ou seja, µ não varia e portanto, não tem uma distribuição
de probabilidade. Deve car claro o que é aleatório (antes de que seja obtida a amostra e calculada os
valores) é o intervalo. Portanto, o correto seria dizer que a probabilidade do intervalo a ser escolhido
conter o verdadeiro valor da média é igual a 1 − α. Outra interpretação considerada é a seguinte:
obtendo várias amostras e, para cada uma delas, calculando o correspondente intervalo de conança
para µ, teremos que um 100(1 − α)% das amostras conterão o valor de µ e 100α% das amostras não
conterão a média populacional.
Exemplo 5.3.1 Um pesquisador deseja estimar, com 99% de conança a média da força máxima
de um certo músculo de um grupo de indivíduos. Ele considera que os valores da força muscular
estão distribuídos normalmente com variância de 144. Com esta nalidade selecionou-se uma amostra
aleatória de 15 indivíduos da mesma faixa etária e do mesmo peso e obteve-se que X̄ = 84, 3. Qual é
o intervalo?
Da tabela normal padrão temos que zα/2 = z0,005 = 2, 57. Substituindo em (5.2) temos que
µ ¶
12 12
IC(µ; 0, 99) = 84, 3 − 2, 57 √ ; 84, 3 + 2, 57 √
15 15
= (84, 3 − 7, 9628; 84, 3 + 7, 9628)
= (76, 3372; 92, 2672.)
A interpretação deste intervalo de conança é: dado o coeciente de conança de 99%, a longo prazo, em
99 de 100 casos, intervalos como (76, 3372; 92, 2672) conterão a média verdadeira da força máxima de um
certo músculo do grupo de indivíduos. Note, porém, que não se pode dizer que é 99% a probabilidade
do intervalo especico (76, 3372; 92, 2672) conter a média verdadeira (µ) da força máxima de um certo
músculo, pois, esse intervalo agora esta xado, não é mais aleatório. Logo µ ou se encontra nele ou
não se encontra: a probabilidade de o intervalo xado especico incluir o verdadeiro µ é portanto, de
1 ou 0.
Observação 5.3.1 A continuação apresenta-se intervalos de conança para o caso de populações -

nitas:
(a) Se σ é desconhecido e n ≥ 30, pode-se utilizar o desvio padrão amostral S para aproximar σ.
(b) No caso que a população é nita de N elementos e σ é conhecido e amostragem é sem reposição,
o intervalo de (1 − α)100% de conança para µ é:
Ã r r !
σ N −n σ N −n
IC(µ; 1 − α) = X̄ − zα/2 √ ; X̄ + zα/2 √ . (5.3)
n N −1 n N −1
Se σ é desconhecido e n ≥ 30, por (a) o intervalo é
Ã r r !
S N −n S N −n
IC(µ; 1 − α) = X̄ − zα/2 √ ; X̄ + zα/2 √ . (5.4)
n N −1 n N −1
(c) z α2 é uma função crescente do coeciente de conança γ = 1 − α. Portanto, se γ → 1, o

comprimento do intervalo de conança é maior.
(d) O tamanho da amostra aparece no denominador de z α2 σ. Para amostras grandes os intervalos de
conança têm comprimentos mais curtos, portanto, informação mais precisa.
Exemplo 5.3.2 De um lote de 2200 lâmpadas foram sorteadas 81 lâmpadas ao acaso, o tempo médio
de duração das lâmpadas sorteadas foi 3200 horas com um desvio padrão de 900 horas. Construa um
intervalo de 95% de conança para o tempo médio das lâmpadas do lote.
Solução: Já que 1 − α = 0, 95, temos da tabela normal padrão zα/2 = z0,025 = 1, 96.
Como X̄ = 3200, S = 900 n = 81 e N = 2200 (tamanho da população nita), pela observação 5.3.1.b,
tem-se:
Ã r r !
S N −n s N −n
IC(µ; 1 − α) = X̄ − zα/2 √ ; X̄ + zα/2 √
n N −1 n N −1
Ã r r !
(1, 96)(900) 2200 − 81 (1, 96)(900) 2200 − 81
= 3200 − √ ; 3200 + √
81 2200 − 1 81 2200 − 1
= (3008; 3396).
Determinação do tamanho da amostra para estimar a média µ
A determinação do tamanho da amostra for muito importante, uma vez que, se a amostra for muito
pequena não será signicativa e, se a amostra for muito grande estão desperdiçando recursos. Utiliza-
se o intervalo de conança para calcular tamanho de uma amostra. Do intervalo de conança para a
média populacional µ ¶
σ σ
IC(µ; 1 − α) = X̄ − zα/2 √ ; X̄ + zα/2 √
n n
deseja-se que o comprimento do intervalo seja o mais curto possível, para isso tem-se duas opções:
(i) Diminuir o coeciente de conança: 1 − α

zα
(ii) Aumentar o tamanho da amostra, o que diminui o erro padrão ( σ/√
2
n
), já que σ é xo.
Dessas duas opções, a primeira não é recomendável porque aumenta-se α,que é o risco de que µ não
esteja no intervalo.
Há uma conseqüência interessante que se desprende da relação entre o erro máximo de estimação (
diferença entre o estimador e o parâmetro) e o risco (α denido anteriormente) que é a determinação
do tamanho da amostra. O comprimento ou amplitude do intervalo é:
σ
L = 2zα/2 √ .
n
Onde o erro máximo da estimação, denotado por E , é:

L σ
E= = zα/2 √ .
2 n
Dessa equação é possível obter n se o erro máximo de estimação E , o risco α e a variância populacional
são conhecidos. Ou seja,
2 σ2
zα/2
n=
E2
q
N −n
Se a amostragem é sem reposição, é introduzido o fator de correção de população nita: N −1 , de
onde: r
σ N −n
E = zα/2 √ ,
n N −1
que ao resolver em n, tem-se
2 σ2
N zα/2
n= 2 σ2 .
E 2 (N − 1) + zα/2
n
Se o tamanho da população nita N é muito maior em comparação com n (isto é, N < 0, 10) o fator
de correção de população nita pode ser ignorado.
Exemplo 5.3.3 Uma rma construtora deseja estimar a resistência média das barras de aço utiliza-
das na construção de casas. Qual o tamanho amostral necessário para garantir que haja um risco de
0,001 de ultrapassar um erro de 5 kg ou mais na estimação ? O desvio padrão da resistência para este
tipo de barra é estimado em 25 kg.
Solução: E = 5kg, σ = 25kg. Como o risco de ultrapassar esse erro é de 0,001, então, γ = 1 − α =
1 − 0, 001 = 0, 999. Logo, z0,0005 = 3, 29. Daí, tem-se
2 σ2
z0,0005 (3, 29)2 (252 )
n= = = 270, 6025 ≈ 271.
E2 53
5.3.2 Quando a variância populacional σ 2 é desconhecida

Se X1 , . . . , Xn é uma amostra aleatória de tamanho n, de uma população normal com média µ e
variância desconhecida σ 2 a variável aleatória,
X̄ − µ
T = √ ,
S/ n
tem distribuição t-Student com n − 1 graus de liberdade. Seguindo o procedimento anterior, para o
nível de conança xado,100(1 − α)% tal que 0 < α < 1 , pode-se encontrar um valor de t α2 ,n−1 , tal
que µ ¶
X̄ − µ
P −t α2 ,n−1 < √ < t α ,n−1 = 1 − α, (5.5)
S/ n 2
onde t α2 ,n−1 , é obtido da tabela de distribuição t-Student com n − 1 graus de liberdade. Logo, o
intervalo de conança para µ, com coeciente de conança 100(1 − α)% é dado por:
µ ¶
S S
IC(µ; 1 − α) = X̄ − t α2 ,n−1 √ ; X̄ + t α2 ,n−1 √ . (5.6)
n n
Exemplo 5.3.4 Suponha que o gerente de produção de uma companhia que fornece petróleo para
calefação de uso doméstico, deseja estimar o consumo médio anual(em galões) em casas onde moram
somente uma família, numa área geográca particular. Seleciona-se uma amostra de 36 casas em que
moram somente uma família e o consumo médio para essa amostra resultou x̄ = 1.122, 7 galões e um
desvio padrão de s = 295, 72 galões. Se o gerente de produção deseja ter 95% de conança de que
o intervalo obtido inclua o consumo médio anual de petróleo para calefação em casas de famílias que
moram nessa área geográca.
Solução: Suponha que X : consumo de petróleo para calefação por família é tal que X ∼ N (µ, σ 2 ).
Para , 1 − α = 0, 95, α = 0, 05. Da tabela t-Student com 35 graus de liberdade tem-se que t α2 ,n−1 =
t0,025,3−1 = 2, 03. Substituindo em (5.6)
µ ¶
295, 7 295, 72
IC(µ; 0, 99) = 1.122, 7 − 2, 03 √ ; 1.122, 7 + 2, 03 √
36 36
= (1.122, 7 − 100, 5; 1.122, 7 + 100, 5) = (1, 223, 2; 1022, 2.)
Conclui-se com 95% de conança, que a quantidade média de petróleo consumida ao ano está entre
1.022,2 e 1.222,75 galões. O intervalo de conança de 95% estabelece que existe uma seguridade de
95% de que a amostra selecionada é uma na qual a média populacional µ está localizada dentro do
intervalo.
5.3.3 Para amostras grandes

A aplicação do Teorema Central do Limite permite a obtenção de intervalos de conança para µ, quando
a distribuição das variáveis aleatórias que constituem a amostra não é dada pelo modelo normal. Nesse
caso, os intervalos terão coeciente de conança aproximadamente igual a (1 − α) × 100%, sendo que
essa aproximação melhora à medida que aumenta o tamanho da amostra.
Exemplo 5.3.5 Um provedor de acesso à internet está monitorando a duração do tempo das conexões
de seus clientes com o objetivo de dimensionar seu equipamento. Suponha que são desconhecidos a
média e a distribuição de probabilidade desse tempo, mas a variância, por analogia com outra serviços
é considerada como sendo igual a 50 (minutos)2 . Uma amostra de 500 conexões resultou num valor
observado médio de 25 minutos. O que dizer da verdadeira média com conança de 95%.
O Teorema Central do Limite garante que para amostras sucientemente grandes X̄ ∼ N (µ; σ 2 /n).
Então o intervalo de conança aproximado de 95% para o tempo médio de conexões, será dado por
µ ¶ Ã r r !
σ σ 50 50
IC(µ; 0, 95) = X̄ − zα/2 √ ; X̄ + zα/2 √ = 25 − 1, 96 ; 25 + 1, 96
n n 500 500
= (25 − 0, 62; 25 + 0, 62) = (24, 38; 25, 62). (5.7)
5.4 Intervalo de Conança para uma Proporção Populacional

Considere uma população dicotômica, constituída apenas por elementos de dois tipos (por exemplo,
indivíduos doentes ou não doentes). O valor de p, que corresponde à proporção de elementos de um dos
dois tipos na população (por exemplo, indivíduos doentes) é denido como proporção populacional.
Se dessa população for retirada uma amostra aleatória de tamanho n, então p̂ = Y /n será uma
proporção amostral sendo Y o número de elementos de um tipo na amostra (por exemplo, número de
indivíduos doentes), o que pode ser interpretado como número de sucesso em n ensaios de Bernoulli.
Nessas condições a variável aleatória Y segue uma distribuição Binomial com parâmetros n e p.
De acordo com Teorema Central do Limite, para n sucientemente grande, a distribuição de Y (número
de elementos de um tipo contidos na amostra) aproxima-se a uma distribuição normal com média np
e variância np(1 − p). Daí é imediato vericar , que a proporção amostral p̂ também aproxima-se da
distribuição normal com média p e variância p(1 − p)/n, ou seja,
p(1 − p)
p̂ ∼ N (p, ), (5.8)
n
Fixando o nível de conança (1 − α) × 100% tal que 0 < α < 1, o intervalo de conança para p, para
amostras sucientemente grandes, é dado por:
Ã r r !
p(1 − p) p(1 − p)
IC(p; 1 − α) = p̂ − zα/2 ; p̂ + zα/2 . (5.9)
n n
Note que, nesse caso, os limites do intervalo dependem de p que é desconhecido. Assim sendo, o
intervalo não pode ser calculado diretamente. Uma possível solução é substituir p(1 − p) por p̂(1 − p̂)
em (5.9). Assim o intervalo se reduz a
Ã r r !
p̂(1 − p̂) p̂(1 − p̂)
IC(p; 1 − α) = p̂ − zα/2 ; p̂ + zα/2 (5.10)
n n
Uma outra abordagem é baseada no fato de que a expressão p(1 − p) assume o valor máximo igual 1/4
quando 0 ≤ p ≤ 1 . Como mostra a gura 5.3 abaixo.
Figura 5.2: Gráco da função f (p) = p(1 − p)
Logo, o intervalo (5.9) se reduz a

Ã r r !
1 1
IC(p; 1 − α) = p̂ − zα/2 ; p̂ + zα/2 (5.11)
4n 4n
Foram apresentados acima duas alternativas para o cálculo do intervalo de conança para p. A primeira
dada em (5.10), é usualmente denominada de abordagem otimista, pois parte da crença que a estimativa
obtida está sucientemente próxima de p, de tal forma que a variância p(1−p)/n é bem aproximada por
p̂(1 − p̂). Já a abordagem, calculada em (5.11) é conhecida na literatura como abordagem conservativa,
pois substitui-se a variância por um valor seguramente maior do que real. Assim assegura-se que o
nível de conança seja no mínimo (1 − α) × 100%.
Exemplo 5.4.1 Um estudo foi feito para determinar a proporção de famílias em uma comunidade
que tem telefone (p). Uma amostra de 200 famílias é selecionada, ao acaso, e 160 armam ter telefone.
Que dizer de p com 95% de conança?
O Estimador (pontual) para p é dado por p̂ = 160/200 = 0, 8.

Como 1 − α = 0, 95, α = 0, 05, portanto, z0,025 = 1, 96. Logo, substituindo em (5.10), tem-se
Ã r r !
p̂(1 − p̂) p̂(1 − p̂)
IC1 (p; 0, 95) = 0, 8 − 1, 96 ; 0, 8 + 1, 96
n n
= (0, 745; 0, 855)
E, em (5.11) tem-se
Ã r r !
1 1
IC2 (p; 0, 95) = 0, 8 − 1, 96 ; 0, 8 + 1, 96
4 × 200 4 × 200
= (0, 731; 0, 869)
Pode-se observar que o comprimento do intervalo de conança otimista é menor que o comprimento
do intervalo conservativo.
5.4.1 Determinação do tamanho da amostra para estimação de uma proporção

populacional
A determinação do tamanho da amostra quando se quer estimar a proporção populacional é essenci-
almente a mesma descrita na seção 5.3 para a determinação do tamanho da amostra na estimação de
uma média populacional. Para isto, considere o erro máximo de estimação
r
p(1 − p)
E = zα/2 .
n
Supondo que p e risco α são conhecidos, tem-se:
2 p(1 − p)
zα/2
n= .
E2
Se a população é nita e a amostragem é sem reposição
r r
p(1 − p) N − n
E = zα/2 ,
n N −1
de onde tem-se:
2 p(1 − p)
N zα/2
n= 2 p(1 − p)
E 2 (N − 1) + zα/2
Quando não se tem nenhuma informação de p, considera-se p = 0, .5 Nesse caso o tamanho da amostra
é:
2
0, 25zα/2
n= .
E2
E
2
0, 25N zα/2
n= 2 2
E (N − 1) + 0, 25zα/2
Se N é muito maior que n o fator de correção de população nita pode ser ignorado.
Exemplo 5.4.2 O serviço social de um município deseja determinar a proporção de famílias com
uma renda familiar inferior a R$ 200,00. Estudos anteriores indicam que esta proporção é de 20%.
(a) Que tamanho de amostra se requer para assegurar uma conança de 95% que o erro máximo de
estimação desta proporção não ultrapasse o 0,05?
(b) Em quanto variara o tamanho da amostra se o erro máximo permissível é reduzido a 0,01.?
Solução: p = 0, 2 e 1 − α = 0, 95 da tabela normal padrão z0,025 = 1, 96. Logo,

(a) O erro máximo é E = 0, 05, então
(1, 96)2 (0, 2)(0, 8)

n= = 245, 86 ≈ 246.
(0, 05)2
(b) O erro máximo é E = 0, 01, é então,
(1, 96)2 (0, 2)(0, 8)

n= = 6146, 56 ≈ 6147.
(0, 01)2
5.5 Intervalo de Conança para a Variância (σ 2 )

Se X1 , . . . , Xn é uma amostra aleatória de tamanho n, de uma população normal com média µ e
variância σ 2 , ambas desconhecidas, vimos que a variável aleatória
(n − 1)S 2
W = ∼ χ2(n−1)
σ2
Ou seja, a variável aleatória W tem distribuição Qui-quadrado com n-1 graus de liberdade.
Para um nível de conança (1 − α) × 100% , é possível determinar χ21− α ,n−1 e χ2α ,n−1 , valores
2 2
da distribuição Qui-quadrado com n − 1 graus de liberdade, como é mostrado na gura.
Figura 5.3: Distribuição Qui-quadrado com n − 1 graus de liberdade
³ ´ µ ¶
(n − 1)S 2
P χ21− α ,n−1 < W < χ2α ,n−1 = P χ21− α ,n−1 < < χ2
α
,n−1 = 1 − α
2 2 2 σ2 2
Logo, o intervalo de (1 − α) × 100% de conança para σ 2 é dado por

Ã !
(n − 1)S 2 (n − 1)S 2
IC(σ 2 ; 1 − α) = ; .
χ2α ,n−1 χ21− α ,n−1
2 2
Exemplo 5.5.1 Pretende-se avaliar a variabilidade associada ao resultado de um determinado método

de análise química. Com esse objetivo, efetuaram-se 24 análises a uma determinada substância em
que se segui o referido método, em condições perfeitamente estabilizadas. A variância amostral dos
resultados (expressados numa determinada unidade) foi de 4,58. Admitindo que o resultado das análises
segue uma distribuição normal. Um intervalo de conança do 90% de conança para variância, é dado
por:
µ ¶
2 (24 − 1)4, 58 (24 − 1)4, 58
IC(σ ; 0.90) = ; = (2, 995; 8, 047).
35, 17 13, 09
5.6 Intervalo de Conança para a Diferença de Médias (µ1 − µ2 )

Nesta seção considere que X1 , . . . , Xn é uma amostra aleatória de tamanho n de uma população com
característica X que tem distribuição normal com média µ1 e variância σ12 e que Y1 , . . . , Ym é outra
amostra aleatória de tamanho m, de uma população com a característica Y que tem distribuição normal
com média µ2 e variância σ22 . Se X e Y são independentes foi apresentado distribuições amostrais para a
diferença das médias amostrais, no caso quando as variâncias populacionais eram conhecidas e quando
não são conhecidos mais iguais.
5.6.1 Quando as variâncias σ12 e σ22 são conhecidos

Foi visto que a variável
X̄ − Ȳ − (µ1 − µ1 )
Z= q
σ12 σ22
n + m
tem distribuição normal padrão. Considerando este resultado e seguindo o mesmo procedimento para
o caso da média populacional, apresentada na seção 5.3, pode-se deduzir o intervalo de conança para
µ1 − µ2 , para um nível de conança (1 − α) × 100% xado. Ou seja,
¡ ¢
P −zα/2 < Z < zα/2 = 1 − α.
Logo, o intervalo de (1 − α) × 100% de conança para µ1 − µ2 é dado por:

Ã r r !
σ12 σ22 σ12 σ22
IC(µ1 − µ2 ; 1 − α) = X̄ − Ȳ − zα/2 + ; X̄ − Ȳ + zα/2 + (5.12)
n m n m
Exemplo 5.6.1 Em um estudo em crianças com retardo mental, a 11 meninas e a 10 meninos, após
um ano de educação especial acompanhado de terapia, foi aplicado um teste de conhecimentos. A média
para meninas foi de 67,0 e para as meninos foi de 61,5 (em uma escala de 0 a 100). Supondo que as
qualicações obtidas pelas meninas e meninos em estudo seguem uma distribuição normal com desvio
padrão σ1 = 11 e σ2 = 10. Achar um intervalo de 90% de conança para µ1 − µ2 .
Solução: Para o nível de conança 1 − α = 0, 90 temos que α = 0, 10. Obtemos da distribuição normal
padrão o valor zα/2 = 1, 64, X̄ = 67, 0, n = 11, Ȳ = 61, 5 e m = 10. Substituindo em (5.12) o intervalo
para µ1 − µ2 é dado por
Ã r r !
121 100 121 100
IC(µ1 − µ2 ; 0, 90)) = 67, 0 − 61, 5 − 1, 64 + ; 67 − 61, 5 + 1, 64 +
11 10 11 10
= (−2, 038; 13, 038).
5.6.2 Quando σ12 = σ22 = σ 2 , mas desconhecidos

Mostrou-se que a variável T , denida por:
X̄ − Ȳ − (µ1 − µ2 )
T = q ,
Sp2 ( n1 + n1 )
(n−1)S 2 +(m−1)S 2
segue uma distribuição de t-student com n + m − 2 graus de liberdade, onde Sp2 = 1
n+m−2
2
é conhecida com a variância ponderada. Neste caso o intervalo de conança para µ1 − µ2 , com0 um
nível de conança (1 − α) é dado por:
Ã r r !
2
1 1 2
1 1
IC(µ1 − µ2 ; 1 − α) = X̄ − Ȳ − tα/2,n+m−2 Sp ( + ); X̄ − Ȳ + tα/2,n+m−2 Sp ( + )
n m n m
(5.13)
Exemplo 5.6.2 O gerente de um banco está interessado em analisar a diferenças entre os saldos
médios das contas à ordem de duas agências. De cada uma delas foi recolhida uma amostra aleatória
de saldos ( milhões de unidades monetárias), tendo-se registrado os seguintes resultados:
Agência n Média Variância
A 10 17,8 30,3
B 13 14,2 28,7
Supondo que saldos das agências tenha distribuição normal com variâncias iguais, mas desconhecidas.
Determine um intervalo de 95% de conança para µ1 − µ2 .
Solução:Do enunciado do exemplo tem-se: n = 10, X̄ = 17, 8, S12 = 30, 7, m = 13, Ȳ = 14, 2,
(n −1)S 2 +(n −1)S 2
S22 = 28, 7 portanto a variância ponderada é, Sp2 = 1 n+m−2 1 2 2
= (10−1)30,7+(13−1)28,7
10+13−2 = 29, 39.
Como 1 − α = 0, 95, t0,025,21 = 2, 08. Logo, substituindo (5.13) temos um intervalo de 95% de conança
para µ1 − µ2 é dado por:
Ã r
1 1
IC(µ1 − µ2 ; 0, 95) = 17, 8 − 14, 2 − 2, 08 29, 39( + )
10 13
r !
1 1
; 17, 8 − 14, 2 + 2, 08 29, 39( + )
10 13
= (−1, 14; 8, 34)
5.6.3 Quando as variâncias são desconhecidas e diferentes

No caso em que as variâncias populacionais não são conhecidas e diferentes (σ12 6= σ22 ) pode-se mostrar
que a variável aleatória
X̄ − Ȳ − (µ1 − µ1 )
T0 = q ∼ t(ν)
S12 S22
n + m
2
2
S1 S2
n
+ m2
onde ν = 2
S1
!2
2
S2
!2 − 2. Ou seja que T 0 tem distribuição t-Student com ν graus de liberdade.
n m
n+1
+ m+1
Neste caso o intervalo de (1 − α) × 100% de conança para µ1 − µ2 é dado por:

Ã r r !
0 S12 S22 0 S12 S22
IC(µ1 − µ2 ; 1 − α) = X̄ − Ȳ − tα/2,ν + ; X̄ − Ȳ + tα/2,ν + (5.14)
n m n m
Exemplo 5.6.3 Um artigo publicado no Food Technology Journal (1956) descreve um estudo sobre
conteúdo de protopectina em tomates durante o armazenamento. Para o qual foram considerados dois
períodos de armazenamento e analisou-se as amostras de nove lotes de tomates em cada período. Os
dados sumariados apresentam-se a continuação:
Tempo de armazenamento Média Desvio Padrão
7 Dias 792 495,0
21 Dias 372,3 73,3
Considerando que o conteúdo de propectina para os tempo de armazenamento tenha distribuição nor-
mal e que as variâncias verdadeiras são diferentes construa um intervalo de conança do 95%, para
diferença de médias entre o tempo de armazenamento de 7 dias e 21 dias.
2
2
S1 S2
+ m2 2
n (4952 /9+732 /9)
Da tabela t-Student com ν = !
2 2
S1
!
2 2
S2
−2 = (4952 /9)2 (732 /9)2
−2 ≈ 8, 0395 = 8 graus de liberdade
9+1
+ 9+1
n m
n+1
+ m+1
e nível de conança 1−α = 0, 95 obtém-se que t00,025,8 = 2, 306. Logo, substituindo em (5.14) o intervalo
é calculado, ou seja:
Ã r r !
4952 733 4952 733
IC(µ1 − µ2 , 0, 95) = 729 − 3172 − 2, 306 + ; 729 − 3172 + 2, 306 +
9 9 9 9
= (48, 06; 791, 34).
5.7 Intervalo de Conança para Razão de Variâncias

Seja X1 , . . . , Xn uma amostra de tamanho n retirada de uma população com a característica X, que
tem distribuição normal com µ1 (desconhecida) e variância, σ12 . Considere Y1 , . . . , Ym outra amostra
de tamanho m de outra população com a característica Y , com distribuição normal µ2 (desconhecida)
e variância σ22 e se X e Y são independentes, foi visto que a variável aleatória denida
S12 σ22
F = × ∼ F(n−1;m−1) ,
S22 σ12
ou seja, que variável aleatória F tem distribuição F-Snedecor com n − 1 e m − 1 graus de liberdade,
sendo S12 e S22 as variâncias amostrais calculadas com as n e as m amostras da população X e população
Y, respectivamente.
Para um nível de conança (1 − α) × 100 xado temos que
P (f1 ≤ F ≤ f2 ) = 1 − α
ou seja, µ ¶
S12 σ22
P f1 ≤ 2 × 2 ≤ f2 = 1 − α
S2 σ1
σ2
Portanto, o intervalo de (1 − α) × 100% de conança para σ22 é dado por :
1
2
µ 2
¶
σ2 S2 S22
IC( 2 ; 1 − α) = f1 2 ; f2 2 . (5.15)
σ1 S1 S1
onde f1 e f2 são valores da distribuição F-Snedecor com n − 1 e m − 1 graus de liberdade mostradas
1
na gura 5.4, sendo f1 = f e f2 = fα/2,n−1,m−1 .
α/2,m−1,n−1
Figura 5.4: Distribuição F-Snedecor com n − 1 e m − 1 graus de liberdade
Exemplo 5.7.1 Dois catalisadores podem ser usados em um processo químico em bateladas. Oito
bateladas foram preparadas usando o catalaisador 1, resultado em rendimento médio de 86 e uma
variância de 46,5. Dezessete batelados foram preparados com o catalisador 2, resultando um rendimento
médio de 90 e uma variância de 23,4. Considerando que as medidas dos rendimentos sejam distribuidas
aproximadamente normal. Determinar um intervalo do 90% de conança para razão de variâncias dos
rendimentos do catalisador 1 e o catalisador 2.
Solução: Do enunciado temos que n = 8, S12 = 46, 5, m = 17, S22 = 23, 4 e da tabela F-Snedecor
1
obtemos que f1 = f0,05,7,16 = 1/2, 61 = 0, 376 e f2 = f0,05,16,7 = 3, 49. Substituindo essas quantidade
σ12
em (5.15) temos que um intervalo de 90% de conança para a razão de variâncias, σ22
:
µ ¶
σ2 46, 5 46, 5
IC( 12 ; 0, 90) = 0, 376 × ; 3, 49 × = (0, 7478; 6, 935).
σ2 23, 4 23, 4
5.8 Teste de Hipóteses

5.8.1 Conceitos básicos
O teste de uma hipótese estatística é talvez a área mais importante da teória de decisão. Vamos
introduzir os conceitos de teste de hipótese estatística através do exemplo seguinte.
Exemplo 5.8.1 Considere que uma industria compra de um certo fabricante, pinos cuja resistência
média à ruptura é especicada em 60 kgf (valor nominal da especicação). Em um determinado dia,
a indústria recebeu um grande lote de pinos e a equipe técnica da industria deseja vericar se o lote
atende as especições.
É claro que equipe técnica não espera que todos os pinos tenham examente uma resistência de 60 kgf.
Alguma variabilidade em torno deste valor é esperada. A partir de experiência anterior a indústria
sabe que a resistência à ruptura dos pinos desse fabricante segue uma distribuição normal com desvio
padrão σ = 5kgf e esta variabilidade é adequada para a industria. O interesse da industria consiste,
então, em determinar se a resistência média dos pinos que constituem o lote entregue pelo fabricante
pode ser ou não considerado igual a 60 kgf.
Do dito anteriormente considere que a resistência dos pinos do lote é uma variável aleatória X , tal que
, X ∼ N (µ, 25). Observe que equipe técnica da industria deseja testar:
H0 : µ = 60 (5.16)
A seguir é apresentada a denição formal de hipótese estatística.
Denição 5.8.1 Uma hipótese estatística é uma armação sobre os parametros de uma ou mais ca-
racteristícas da população
Em todo problema de teste de hipóteses, duas hipóteses complementares são consideradas. A hipótese
que foi destacada na equação (5.16) denominada de hipótese nula, sendo representanda por H0 ,
(pois ela expressa que não há mudança). A outra hipótese, que será aceita caso H0 seja rejeitada, é
denominada hipótese alternativa e é denotada por H1 . Tem-se
Rejeitar H0 ⇒ Acietar H1
Aceitar H0 ⇒ Rejeitar H1
No exemplo, a hipótese alternativa H1 é
H1 : µ 6= 60 (5.17)
Essa hipótese é chamada de hipótese composta porque especica mais de um valor para o parâmetro.
No caso que especique somente um único valor, a hipótese é chamada de hipótese simples, por exemplo
a hipótese dada em (5.16).
Para realizar-se um teste de uma hipótese estatística retira-se uma amostra da população em
estudo e com base na observação dos resultados dessa amostra toma-se a decisão de aceitar H0 ou de
rejeitar H0 .
Suponha que a equipe técnica da indústria tenha decidido retirar uma amostra aleatória de tamanho
n = 16, do lote recebido, medir a resistência de cada pino e calcular a resistência média X̄ (estimador
25
de µ). Além disso, X̄ ∼ N (µ, 16 ). Para quais valores de X̄ a equipe técnica deve rejeitar H0 e portanto
não aceitar o lote?
Denição 5.8.2 A variável aleatória cujo valor é utilizado para determinação da decisão a ser tomada
em um teste de hipóteses é denominada estatística de teste
Se o lote está fora de especicação , isto é , H1 : µ 6= 60, espera-se que X̄ seja inferior ou superior a 60
kgf.
Suponha que equipe técnica tenha decidido adotar a seguinte regra: rejeitar H0 se X̄ for maior que 62.5
kgf e ou menor que 57.5 kgf. O conjunto Rc = {X̄ < 57, 5 ou X̄ > 62.5} é o conjunto de valores para
os quais rejeita-se H0 : µ = 0, 5, sendo denominado região de rejeição ou região crítica do teste.
Os valores de X̄ que não pertencem ao intervalo [57,5 ; 62,5], constituem a região de aceitação
(Ra = Rcc ). Os valores que estão na fronteiras entre a região crítica e a região de aceitação, são
denominados valores críticos. Portanto, a regra consiste em, rejeitar H0 a favor de H1 se o valor
assumido pela estatística de teste pertencer a região crítica. Isto é, se ocorrer o evento (X̄ ∈ Rc ),
rejeita-se H0 . Caso contrário, se o valor assumido por X̄ pertencer a região de aceitação Rcc , isto é, se
o evento (X̄ ∈ Rcc ), ocorrer não rejeitar H0 .
Figura 5.5: Regra de decisão para testar H0 : µ = 60 contra H1 : µ 6= 60
O procedimento de tomada de decisão em um teste de hipóteses pode resultar em dois tipos de con-
clusões incorretas. Por exemplo, é possível que a resistência média dos pinos que constituem o lote
seja, de fato, igual a 60 kgf. Mas, pode acontecer que para os pinos selecionados para a composição
da amostra aleatória, o valor observado para a estatística de X̄ pertence a região crítica. Neste caso a
hipótese nula H0 seria rejeitada em favor da hipótese alternativa H1 , quando H0 é de fato verdadeiro.
Essa forma de conclusão incorreta é denominada de erro tipo I.
Por outro lado, poderia ocorrer situações na qual a hipótese H0 é falsa, ou seja, na realidade a resistência
média do lote de pinos é diferente de 60 kgf e a média amostral observada x̄ pertença a região de
aceitação, levando a aceitação de H0 sendo ela falsa. Esta forma de conclusão incorreta é denominada
de erro tipo II. Em resumo, em um teste de hipótese, podem ocorrer dois tipos de erros:
• Erro tipo I: rejeitar H0 sendo H0 verdadeira;

• Erro tipo II: Aceitar H0 sendo H0 falsa.
Portanto, ao testar qualquer hipótese estatística, existem quatro situações diferentes que determinam
se a decisão nal é correta ou incorreta. Essas situações aparecem na tabela 5.1.
Tabela 5.1: Decisões em um teste de hipóteses.

Decisão real e desconhecida
Decisão H0 verdadeira H0 falsa
Não rejeitar H0 Decisão correta Erro tipo II
Rejeita H0 Erro tipo I Decisão correta
Dado que a decisão tomada em um teste de hipóteses é baseada em variáveis aleatórias (estatística de
teste), é possível calcular as probabilidades dos erros tipos I e II da tabela 5.1.
A probabilidade de erro tipo I é denominada de nível de signicância do teste será denotada por α.
Isto é,
α = P (Erro tipo I) = P (rejeitar H0 | H0 é verdadeiro)
No exemplo 5.8.1, o erro tipo I irá ocorrer se X̄ < 57, 5 ou X̄ > 62, 5 quando a resistência média no
lote de pinos for µ = 60 kgf. Para este exemplo, observe que, se H0 é verdadeira, isto é, H0 : µ = 60
então,X̄ tem distribuição normal com média µ = 60 e σX̄ = √σn = 1, 25. Portanto, a probabilidade do
erro tipo I é calculada como:
α = P (X̄ < 57, 5 ou X̄ > 62, 5|H0 : µ = 60) = P (X̄ < 57, 5) + P (X̄ > 62, 5|H0 : µ = 60)
X̄ − µ 57, 5 − 60 X̄ − µ 62, 5 − 60
= P( < ) + P( < )
σX̄ 1, 25 σX̄ 1, 25
= P (Z < −2) + P (Z > 2) = 0, 02275 + 0, 02275 = 0, 0455.
Este resultado, que está ilustrado na gura 5.6, signica que há 4,55% de chance que uma amostra
aleatória extraida do lote de peças de pinos leve à rejeição da hipóteses nula H0 : µ = 60, quando a
verdadeira resistência média dos pinos é, de fato, igual a 60 kgf.
Figura 5.6: Região crítica e nível de signicância para o teste de H0 : µ = 60 contra H1 : α 6= 60 com
n = 16
Ao analisar a gura 5.6, pode-se observar que é possível diminuir α ao aumentar a amplitude da região
de aceitação. Por exemplo, se no caso dos pinos, a região de aceitação fosse constituída pelo intervalo
[56 ; 64], o valor de α será:
α = P (X̄ < 56) + P (X̄ > 64|H0 : µ = 60)

X̄ − µ 56 − 60 X̄ − µ 64 − 60
= P( < ) + P( < )
σX̄ 1, 25 σX̄ 1, 25
= P (Z < −3, 2) + P (Z > 3, 2) = 0, 00069 + 0, 00069 = 0, 00138.
Pode-se também√diminuir o valor de α aumentando o tamanho da amostra. Se n = 25, a variância de

√
X̄ é σ/ n = 5/ 25 = 1. Ao utilizar a região crítica original da gura 5.6, tem-se:
X̄ − µ 57, 5 − 60 X̄ − µ 62, 5 − 60
α = P( < ) + P( < )
σX̄ 1, 0 σX̄ 1, 0
= P (Z < −2, 5) + P (Z > 2, 5) = 0, 00621 + 0, 00621 = 0, 01242.
Ao avaliar um procedimento de teste de hipóteses é importante determinar a probabilidade de erro

tipo II, o qual denota-se por β. Isto é,
β = P (Erro tipo II) = P (aceitar H0 | H0 é falso)
Para o exemplo 5.8.1, o erro tipo II irá ocorrer se 57, 5 ≤ X̄ ≤ 62, 5 quando a resistência média do
lote é diferente de 60 kgf. Portanto, para que seja possível calcular o valor de β , deve-se considerar um
valor particular para µ sob a hipótese alternativa. Como exemplo, suponha que é muito importante
para a indústria rejeitar a hipótese nula H0 : µ = 60, quando a resistência dos pinos do lote µ for, igual
a 56,5 kgf ou igual a 63,5 kgf. Nessa situação, para vericar se o teste é de fato adequado, a industria
poderia calcular o valor de β para µ = 56, 5 e µ = 63, 5 e então avaliar se esse valor é sucientemente
baixo.
25
O cálculo de β para µ = 63, 5. Nesse caso, X̄ ∼ N (63, 5, 16 ). Portanto, a probabilidade de erro tipo II
é calculada como:
β = P (Erro tipo II) = P (57, 5 ≤ X̄ ≤ 62, 5|H1 : µ = 63, 5)
Os valores críticos 57, 5 e 62,5 padronizados com µ = 63, 5 são:

57, 5 − 63, 5
z1 = = −4, 80 e
1, 25
62, 5 − 63, 5
z2 = = −0, 80
1, 25
Logo,
β = P (57, 5 ≤ X̄ ≤ 62, 5|H1 : 63, 5) = P (Z ≤ −0, 80) − P (Z ≤ −4, 80)

= 0, 21186 − 0, 00 = 0, 21186
Esse resultado, que está ilustrado na gura 5.7, signica que para o teste de H0 : µ = 60 contra
H1 : µ 6= 60, com base na amostra de tamanho n = 16, quando o valor verdadeiro da resistência média
dos pinos é µ = 63, 5, a probabilidade de que a hipóteses nula (que neste caso é falsa) não seja rejeitada
é igual a 21,186%. Devido à simetria da distribuição normal, quando a verdadeira média é µ = 56, 5,
a probabilidade de erro tipo II é igual 21,186%.
A probabilidade de cometer erro tipo II aumenta rapidamente à medida que o valor verdadeiro de µ
se aproxima do valor estabelecido sob a hipótese H0 . Para ilustrar essa armação, calcula-se o valor
Figura 5.7: Probabilidade do erro tipo II (β ) para o teste de H0 : µ = 60 contra H1 : µ 6= 60 com

n = 16 e µ = 63, 5
de β para o exemplo 5.8.1, no caso que o valor verdadeiro da resistência média dos pinos é µ = 61 e
que o teste de H0 : µ = 60 contra H1 : µ 6= 60 é conduzido baseando-se em uma amostra de tamanho
n = 16, ou seja,
β = P (57, 5 ≤ X̄ ≤ 62, 5|H1 : µ = 61)
= P (X̄ < 56) + P (X̄ > 64) = P (Z ≤ 1, 20) − P (Z ≤ −2, 80)
= 0, 88493 − 0, 00256 = 0, 88237.
Esse resultado, que esta ilustrado na gura 5.8, signica que, para o teste de H0 : µ = 60 contra
H1 : µ 6= 60, com base em amostras de tamanho n = 16, quando o valor verdadeiro da resistência
média é igual a 61kgf, há 88,237% de chance que hipótese nula (que é falsa) não seja rejeitada.
Figura 5.8: Probabilidade do erro tipo II(β ) para o teste de: H0 : µ = 60 contra H1 : µ 6= 60 com
n = 16 e µ = 61
Portanto, a probabilidade de erro tipo II é muito maior para o caso em que a média verdadeira é
µ = 61 do que para a situação em que µ = 63, 5 kgf. No entanto, esse tipo de resultado não causa
muita preocupação. Isso porque apenas diferenças de maior magnitude entre o valor verdadeiro de µ e
o valor estabelecido sob H0 são consideradas signicativas sob o ponto de vista prático, devendo então
ser detectadas com elevada probabilidade.
A probabilidade do erro tipo II também depende do tamanho da amostra (n). Para ilustrar este fato,
refaz-se o cálculo de β, para exemplo 5.8.1, considerando que a hipótese nula é H0 : µ = 60 e a
verdadeira média é µ = 63, 5 e que o tamanho da amostra aumenta de n = 16 para n = 25.
β = P (57, 5 ≤ X̄ ≤ 62, 5|H1 : µ = 63, 5)

25
Quando n = 25, X̄ ∼ N (63, 5, 25 ) e os valores críticos de 57,5 e 62,5 padronizados são:
57, 5 − 63, 5
z1 = = −6 e
1
62, 5 − 63, 5
z2 = = −1.
1
Logo,
β = P (−6 ≤ Z ≤ −1)
= P (Z ≤ −1) − P (Z ≤ −6) = 0, 15866 − 0, 0000 = 0, 15866.
Esse resultado é ilustrado na gura 5.9. Observa-se que o aumento do tamanho da amostra resulta em
uma diminuição da probabilidade do erro tipo II.
Figura 5.9: Probabilidade do erro tipo II(β ) para o teste de: H0 : µ = 60 contra H1 : µ 6= 60 com
n = 25 e µ = 63, 5
A tabela 5.2 sumariza os resultados apresentados anteriormente conjuntamente com outros resultados
obtidos de forma similar:
A tabela 5.2 mostra as seguintes características dos testes de hipóteses:
(i) Os erros tipo I e II estão relacionados. Se o tamanho de amostra permanece constante, uma dimi-
nuição da probabilidade de ocorrência de um dos erros implica em um aumento da probabilidade
da ocorrência do outro erro.
Tabela 5.2: Relacionamento entre n, α, β e região de aceitação para o exemplo 5.8.1.

Região de aceitação Tamanho da amostra α β para µ = 61 β para µ = 63, 3
57, 5 ≤ X̄ ≤ 62, 5 16 0,0455 0,88237 0,21186
56, 0 ≤ X̄ ≤ 64, 0 16 0,00138 0,99886 0,18843
57, 5 ≤ X̄ ≤ 62, 5 25 0,01242 0,93312 0,15866
56, 0 ≤ X̄ ≤ 64, 0 25 0,00003 0,99862 0,30209
(ii) A probabilidade de ocorrência do erro tipo I pode ser reduzida por meio de uma escolha apro-
priada da região crítica.
(iv) O valor de β aumenta à medida que valor verdadeiro de µ se aproxima do valor estabelecido sob
a hipótese H0 .
(iv) Em geral, um aumento no tamanho da amostra reduz tanto α quanto β , desde que os valores
críticos sejam mantidos constantes.
O ideal seria minimizar tantos o erros do tipo I quanto os do tipo II. Mas, infelizmente, para qualquer
tamanho de amostra dado, não é possível minimizar ambos erros simultaneamente. A abordagem
clássica deste problema considera que o erro tipo I é provavelmente ser o mais sério que o erro tipo II.
Para tenta-se manter a probabilidade de cometer erro tipo I em um nível razoavelmente baixo, como
0,01, 0,05 ou 0,10 e então minimizar quanto possível a probabilidade do erro tipo II.
Denição 5.8.3 O poder de um teste de hipóteses é a probabilidade de rejeitar H0 quando H0 é falsa.
P oder = P (Rejeitar H0 |H0 falsa)

= 1 − P (Não rejeitar H0 |H0 falsa) = 1 − β
O poder de um teste de hipóteses pode ser interpretado como a probabilidade de rejeitar de

maneira correta uma hipótese nula falsa, o que representa a decisão correta. Em muitos casos, dois
diferentes testes de hipóteses são comparados por meio de comparação do poder de cada um deles.
Considere o exemplo 5.8.1, onde se testam as hipóteses
H0 : µ = 60,
H1 : µ 6= 60
onde µ é a resistência média dos pinos do lote. Suponha que o valor verdadeiro da média é µ = 63, 5.
Para o tamanho da amostra n = 16, com região de aceitação 57, 5 ≤ X̄ ≤ 62, 5 foi vista que β = 0, 21186
(veja tabela 5.2). Logo, o poder do teste correspondente é:
P oder = 1 − β = 1 − 0, 21186 = 0, 78814
Já o poder do teste para n = 25, para a mesma região de aceitação é igual.
P oder = 1 − β = 1 − 0, 15866 = 0, 84135.
O poder do teste é uma medida capacidade do teste para detectar uma possível diferença existente entre
o valor estabelecido para o parâmetro sob a hipótese H0 e o valor assumido pelo parâmetro. Observe
que o primeiro teste tem poder igual a 0,78814, para detectar a diferença entre resistência igual 60
kgf e a outra de 63,6 kgf estabelecida pela hipótese alternativa. Isso signica que, se a verdadeira
resistência média dos pinos é 63,5 kgf, esse teste rejeitará de maneira correta H0 : µ = 60 e detectará
essa diferença em 78,814% das vezes que for utilizado. O poder do segundo teste é um pouco maior
(0,84135), como já era de se esperar, porque o tamanho da amostra é maior que aquele utilizado no
primeiro. O poder de um teste pode ser aumentado por meio do aumento de n ou do aumento do nível
de signicância α.
5.8.2 Testes unilaterais e bilaterais

Se a hipótese nula e alternativa de um teste de hipóteses são:
H0 : µ = µ0
H1 : µ 6= µ0
onde µ0 é uma constante conhecida, o teste é chamada de teste bilateral, pois é importante detectar
diferenças a partir do valor hipotético da média µ0 que se encontre em qualquer lado de µ0 . Em um
teste desse tipo a região crítica é dividida em duas partes, com a mesma probabilidade em cada cauda
da distribuição da estatística de teste. O teste considerado no exemplo 5.8.1 é um teste bilateral . Em
muitos problemas tem-se interesse em testar hipóteses do tipo:
H0 : µ = µ 0
H1 : µ < µ 0 .
Neste caso tem-se um teste unilateral esquerdo, porque a região de rejeição não é dividida em
duas partes, cando localizada apenas na cauda esquerda da distribuição da estatística de teste. Para
exemplicar, considere o seguinte problema.
Exemplo 5.8.2 Uma região do país é conhecida por ter uma população obesa. A distribuição de
probabilidade do peso dos homens dessa região entre 20 e 30 anos é normal com média de 90 kg
e desvio padrão de 10 kg. Um endocrinologista propõe um tratamento para combater a obesidade que
consiste de exercícios físicos, dietas e ingestão de um medicamento. Ele arma que com seu tratamento
o peso médio da população da faixa em estudo diminuirá num período de três meses.
Neste caso as hipóteses que deverão ser testados são:
H0 : µ = 90 kg
H1 : µ < 90 kg
sendo µ a média dos pesos dos homens da faixa etária em estudo.

Em muitas situações, tem-se interesse em provar que a média populacional µ é maior do que valor de
µ0 . Assim, tem-se um teste unilateral direito, para o qual as hipóteses assumem a forma:
H0 : µ = µ0
H1 : µ > µ0
No teste unilateral direito a região crítica ca localizada na cauda direita da estatística de teste. Para
uma situação onde seria apropriado realizar um teste unilateral direito, considere o seguinte exemplo
Exemplo 5.8.3 Um fabricante de uma certa peça arma que o tempo médio de vida das peças pro-
duzidas é de 1000 horas. Suponha que os engenheiros de produção têm interesse em vericar se a
modicação do processo de fabricação aumenta a duração das peças.
Nesse caso as hipóteses que deverão ser testados são:
H0 : µ = 1000 horas
H1 : µ > 1000 horas
sendo µ é o tempo médio de vida das peças produzidas pelo novo processo.
5.8.3 Procedimento básico de teste de hipóteses

O procedimento básico de teste de hipóteses relativo ao parâmetro θ de uma população, será decom-
posto em 4 passos:
(i) Denição das hipóteses:
H0 : θ = θ0 ,
H1 : θ < θ0 ou θ > θ0 ou θ 6= θ0 (qualquer alternativa)
(ii) Identicação da estatística do teste e caracterização da sua distribuição.
(iii) Denição da regra de decisão, com a especicação do nível de signicância do teste.
(iv) Cálculo da estatística de teste e tomada de decisão.
Nas seguintes seções serão apresentados procedimentos básicos de teste de hipóteses para uma média
populacional, diferenças de duas médias populacionais, variância populacional, igualdade de variâncias
populacionaias, uma proporção populacional e a diferença de duas proporções populacionais.
5.9 Teste de Hipóteses para uma Média Populacional

Considere uma amostra aleatória de tamanho n de uma população normal com média µ (desconhe-
cida) e variância σ 2 . Inicialmente, considera-se o caso do teste unilateral esquerdo, para de imediato
generalizar o procedimento. Suponha que tem-se interesse em vericar as seguintes hipóteses:
(i)
H0 : µ = µ0
H1 : µ < µ0
onde µ0 é um valor numérico da média populacional.

(ii) A estatística do teste é a média amostral X̄ . Se população é normal (ou se amostra é grande
n ≥ 30, mesmo que a população não é normal) a distribuição de X̄ é N (µ, σ 2 /n) e a variável aleatória
X̄ − µ0
Z= √ ∼ N (0, 1).
σ/ n
(iii) É razoável, rejeitar H0 em favor de H1 , se a média amostral X̄ é demasiado pequena em relação

µ0 . A região crítica, então poderia ser obtido, selecionando um k da média amostral, de maneira que
Rc = {X̄ ≤ k} onde k é tal que P (X̄ ≤ k|H0 : µ = µ0 ) = α. Ou
µ ¶
X̄ − µ0 X̄ − µ0 k − µ0
P √ ≤ √ = P (Z ≤ √ )=α
σ/ n σ/ n σ/ n
Da tabela normal padrão obtém-se zα para um nível de signicância α xado (veja a gura 5.10)
Figura 5.10: Região crítica para teste de hipóteses unilateral de uma média.
k−µ z√
ασ z√
ασ
Tem-se, √0
σ/ n
= zα . Daí k = µ0 + n
. Logo, Rc = {X̄ ≤ µ0 + n
}.
z√
ασ
(iv) Conclusão: se x̄ ∈ Rc = {X̄ ≤ µ0 + n
}, rejeita-se H0 , em caso contrário não se rejeita H0 .
Método alternativo
Um método alternativo prático é trabalhar diretamente na escala Z (veja a gura 5.10) de seguinte
forma:
(i)
H0 : µ = µ0
H1 : µ < µ0
(ii) A estatística do teste é

X̄ − µ0
Z= √ ,
σ/ n
se a hipótese nula é verdadeira Z ∼ N (0, 1).
(iii) A região crítica, para um nível de signicância α xado é: Rc = {z ∈ Z ∼ N (0, 1); Z ≤ zα }.
(iv) Calcula-se o valor da estatística do teste, Zobs de acordo os dados amostrais e compara-se se Zobs
com zα . Se Zobs ≤ zα (Zobs ∈ Rc ) rejeita-se H0 em caso contrário aceita-se H0 .
Exemplo 5.9.1 Um comprador de tijolos acha que a qualidade dos tijolos está diminuindo. De
experiências anteriores, considera-se a resistência média ao desmoronamento de tais tijolos é igual a
200 kg, com um desvio padrão de 10 kg. Uma amostra de 100 tijolos, escolhidos ao acaso, forneceu
uma média de 195 kg. Ao nível de signicância de 5%, pode-se armar que a resistência média ao
desmoronamento diminuiu?
Solução Seja µ é a resistência média ao desmoronamento dos tijolos. Nesse caso, tem-se interesse em
testar as seguintes hipóteses:
(i)
H0 : µ = 200 kg
H1 : µ < 200 kg.
(ii) A estatística do teste é X̄. Sendo n = 100, sob H0 , X̄ tem distribuição N (200; 100
100 ) = N (200; 1).
(iii) A região crítica: Rc = {X̄ ≤ k} onde k é tal que P (X̄ ≤ k|H0 ) = α ou seja,
X̄ − µ0 k − 200
P( √ ≤ ) = P (Z ≤ k − 200) = 0, 05.
σ/ n 10/10
Assim, zα = k − 200 = −1, 64. Logo, k = 198, 36. O que resulta então, a Rc = {X̄ ≤ 198, 36}.
(iv) Do enunciado do problema a média amostral é x̄ = 195 ∈ Rc = {X̄ ≤ 198, 36}. Nesse caso,
rejeita-se H0 ao nível de signicância de 5%.
Método alternativo: uma solução alternativa ao problema obtém-se como segue: No passo (iii)
a região crítica na escala Z é da forma Rc = {z ∈ Z ∼ N (0, 1); Z ≤ zα }. Para α = 0, 05 tem-se
zα = −1, 64. Então, Rc = {z ∈ Z ∼ N (0, 1); Z ≤ −1, 64}.
No passo (iv) ao ínves de calcular x̄, obtém-se o valor da estatística do teste com os dados,
X̄ − µ0 195 − 200
Zobs = √ = = −5.
σ/ n 1
Como Zobs = −5 < zα = −1, 64, rejeita-se H0 ao nível de signicância de 5%.
Procedimento geral
A seguir é apresentado o procedimento geral de teste de hipóteses para uma média populacional
considerando o procedimento alternativo descrito acima.
H0 : µ = µ0 (ou µ ≥ µ0 ) H0 : µ = µ0 (ou µ ≤ µ0 ) H0 : µ = µ0
(i)
H1 : µ < µ0 H1 : µ > µ 0 H1 : µ 6= µ0
(ii) A estatística do teste é:
Quando a variância é conhecida
X̄ − µ0
Z= √ , (5.18)
σ/ n
onde n representa o tamanho da amostra através da qual é calculada o valor da média amostral
X̄. Quando H0 é verdadeira, a estatística de teste segue uma distribuição normal padrão ou reduzida.
Esse resultado é válido também, quando o tamanho da amostra é sucientemente grande para qualquer
população.
Quando a variância é desconhecida
X̄ − µ0
T = √ , (5.19)
S/ n
sendo S o desvio padrão amostral calculado com as n observações da amostra aleatória.
Se H0 é verdadeira, a estatística (5.19) segue uma distribuição t-Student com n − 1 graus de liberdade.
(iii) As regiões críticas, para um nível de signicância α xado, são os valores da distribuição da
estatística do teste (Z ou t(n − 1)) se a hipóteses nula é verdadeira.
Figura 5.11: Regiões críticas para testes de hipóteses de uma média populacional :(a) unilateral es-
querdo, (b) unilateral direito e (c) bilateral
Para o teste de hipóteses unilateral esquerdo, a região crítica ou região de rejeição é representada
pela parte hachurada da gura 5.11.a. Ela concentra valores na cauda esquerda da distribuição da
(z) (t)
estatística do teste, isto é, o conjunto, tal que: Rc = {c ∈ Z ∼ N (0, 1); Z ≤ −c} ou Rc : {c ∈ T ∼
t(n − 1); T ≤ −c}. Para o teste unilateral direita (ou de cauda direita), a região crítica é representada
(z)
pela parte hachurada da gura 5.11.b, e representa o conjunto de valores tal que Rc = {c ∈ Z ∼
(t)
N (0, 1); Z ≥ c} ou Rc : {c ∈ T ∼ t(n−1); T ≥ c}. Para o teste bilateral, a região crítica é representada
(z)
pela parte hachurada da gura 5.11.c, e representa o conjunto de valores tal que Rc = {c ∈ Z ∼
(t)
N (0, 1); |Z| ≤ c} ou Rc : {c ∈ T ∼ t(n − 1); |T | ≤ c}.
(iv) Rejeita-se H0 , ao nível de signicância, α se a estatística do teste observada (calculada com os
(z) (t)
dados da amostra) pertenece à região crítica, ou seja, se Zobs ∈ Rc ou Tobs ∈ Rc .
Exemplo 5.9.2 (Teste para um média populacional) No exemplo 5.8.2, suponha que 25 ho-
mens na faxia etária entre 20 e 30 anos escolhidos ao acaso dessa população, foram tratados com
o novo tratamento durante um período de três meses. Sendo o peso medio dos 25 homens igual a 84
kg, pode-se armar que o novo medicamento no combate da obesidade é ecaz. Use α = 0, 05.
Solução: Seja X : Peso de homens da faixa etária entre 20 e 30 anos numa região do pais. Pelo
enunciado tem-se, X ∼ N (90, 100). Deseja-se vericar as seguintes hipóteses:
H0 : µ = 90 (o tratamento não é ecaz)

H1 : µ < 90 (o tratamento é ecaz).
onde µ é o peso médio de homens da faixa etária entre 20 e 30 anos tratados com o novo tratamento.
Considerando que a variabilidade dos pesos dos homens tratados com a novo tratamento é a mesma
da população a estatística de teste é (5.18), pois a população é normal, ou seja,
X̄ − 90 ∼
Z= √ sob H0 N (0, 1)
10/ n
A região crítica é parte representada pela região hachurada da gura 5.12, para α = 0, 05:
Figura 5.12: Região crítica para teste de hipóteses: H0 : µ = 90 contra H1 : µ < 90
Do enunciado tem-se: X̄ = 84 e n = 25. Logo a estatística de teste resulta

X̄ − 90 84 − 90
Zobs = √ = √ = −2.
10/ n 10/ 25
Como Zobs < −1, 64 rejeita-se H0 . Pode-se concluir para α = 0, 05 que o novo tratamento, proposto
pelo endocrinologista, para perda de peso da população obesa dessa região, é ecaz.
5.10 Teste de Hipóteses para uma Variância Populacional

Suponha se tenha uma amostral aleatória de tamanho de uma população normal com média µ e
variância σ 2 (ambas desconhecidas), e tem-se interesse em vericar as seguintes hipóteses estatísticas:
H0 : σ 2 = σ02 (ou σ 2 ≥ σ02 ) H0 : σ 2 = σ02 (ou σ 2 ≤ σ02 ) H0 : σ 2 = σ02
(i)
H1 : σ 2 < σ02 H1 : σ 2 > σ02 H1 : σ 2 6= σ02
onde σ02 é uma constante conhecida.
(ii) A estatística de teste é :
(n − 1)S 2
W = (5.20)
σ02
onde n é tamanho da amostra e S 2 é variância amostral calculada a partir das n observações amostrais.
A estatística de teste, apresentada (5.20), tem distribuição qui-quadrado com n − 1 graus de liberdade
se a hipótese nula for verdadeira.
Figura 5.13: Região crítica para teste de hipóteses de uma variância populacional: (a) unilateral
esquerdo, (b) unilateral direito e (c) bilateral
(iii) A região crítica para o teste de hipóteses unilateral é a parte hachurada da gura 5.13.a, que
concentra valores na cauda esquerda da distribuição da estatística do teste, isto é, o conjunto tal que
:Rc = {χ2n−1 ≤ χ21−α,n−1 }. Para o teste unilateral de cauda direita , a região crítica é representada
pela parte hachurada da gura 5.13.b, e representa o conjunto de valores da distribuição qui-quadrado
com n − 1 graus de liberdade, tal que Rc = {χ2n−1 ≥ χ2α,n−1 }. Para o teste bilateral a região crítica é
representada pela parte hachurada da gura 5.13.c, e representa o conjunto de valores da distribuição
qui-quadrado, estatística de teste, tal que Rc = {χ2n−1 ≤ χ21−α/2,n−1 ou χ2n−1 ≥ χ2α/2,n−1 }.
(iv) Rejeita-se H0 , ao nível de signicância α, se a estatística de teste observada (calculada com os
dados da amostra) pertence à região crítica, ou seja, se Wobs ∈ Rc .
Exemplo 5.10.1 (Teste hipóteses para uma variância populacional) No exemplo 5.8.2, supo-
nha que tem-se interesse em vericar se houve mudança no desvio padrão dos pesos na população. Com
essa nalidade, 15 homens na faixa etária entre 20 e 30 anos foram escolhidos ao acaso dessa popula-
ção. O desvio padrão dos 15 homens resultou em 8,5 kg. Use α = 0, 05.
Solução: Como no exemplo 5.9.2, seja X : Peso de homens da faixa etária entre 30 e 30 anos numa
região do pais. Portanto, X ∼ N (90, 100), deseja-se vericar as seguintes hipóteses:
H0 : σ = 10 =⇒ H0 : σ 2 = 100,
H1 : σ 6= 10 =⇒ H1 : σ 2 6= 100
A estatística do teste é (5.20),

(n − 1)S 2 ∼
W = sob H0 χ2n−1
100
Figura 5.14: Região crítica para teste de hipóteses: H0 : σ 2 = 100 contra H1 : σ 2 6= 100
A região crítica, para α = 0, 05, é o conjunto de valores da distribuição qui-quadrado com n − 1 = 14

graus de liberdade, tal que Rc = {χ214 ≤ 5, 63 ou χ214 ≥ 26, 12}, e é representada na gura 5.14, pela
parte hachurada.
O valor da estatística calculada com os dados da amostra é :
(15 − 1) × 8, 52
Wobs = = 10, 115.
100
Como Wobs 6∈ Rc aceita-se H0 ao nível de signicância de α = 0, 05
5.11 Teste de Hipótese para a Diferença de Médias Populacionais

(µ1 − µ2 )
Como no caso da construção de intervalos de conança para a diferença de duas médias populacionais,
considere que X1 , . . . , Xn é uma amostral aleatória de tamanho n de uma população com característica
X, que tem distribuição normal com média µ1 e variância σ12 . Considere que Y1 , . . . , Ym é uma amostra
aleatória de tamanho m, de uma população com característica Y que tem distribuição normal com
média µ2 e variância σ22 . Se X e Y são independentes foram apresentadas distribuições amostrais para
a diferença das médias amostrais, quando as variâncias populacionais conhecidas e quando não são
conhecidos mais iguais. Suponha que tem-se interesse em vericar se existe ou não uma diferença
signicativa entre as médias populacionais µ1 e µ2 . O procedimento básico de teste, neste caso é a
seguinte:
(i) As hipóteses estatística são:
H0 : µ1 − µ2 = ∆ H0 : µ1 − µ1 = ∆ H0 : µ1 − µ2 = ∆
H1 : µ1 − µ2 < ∆ H1 : µ1 − µ2 > ∆ H1 : µ1 − µ2 6= ∆
onde ∆ é uma constante conhecida. Observa-se se ∆ = 0 tem-se o teste de hipóteses para a igualdade
de duas médias populacionais.
(iii) A estatística do teste é:
Quando as variâncias σ12 e σ12 são conhecidas
X̄ − Ȳ − ∆ ∼
Z= q 2 sob H0 N (0, 1) (5.21)
σ1 σ22
n + m
Quando as variâncias σ12 = σ22 = σ 2 mas desconhecidas
X̄ − Ȳ − ∆ ∼
T =q sob H0 t(n + m − 2), (5.22)
Sp2 ( n1 + m
1
)
(n−1)S 2 +(m−1)S 2
onde Sp2 = 1
n+m−2
2
, sendo S12 e S22 são as variâncias amostrais calculadas com as n e m das
amostras da população X e população Y, respectivamente.
Quando as variâncias σ12 6= σ22 e desconhecidas
X̄ − Ȳ − ∆ ∼
T0 = q 2 sob H0 t(ν), (5.23)
S1 S22
( n + m)
2
2
S1 S2
n
+ m2
onde ν = 2
S1
!2 2
S2
!2 − 2.
n m
n+1
+ m+1
Os passos (iii) e (iv) do procedimento de teste de hipóteses, são similares ao procedimento de teste de
hipóteses para uma média populacional.
Exemplo 5.11.1 (Teste de hipóteses para diferença de duas médias populacionais) Estuda-
se o conteúdo de nicotina de duas marcas de cigarros (A e B ), obtendo-se os seguintes resultados.
A 17; 20; 23; 20
B 18; 20; 21; 22; 24
Admitindo que o conteúdo de nicotinas das duas marcas tem distribuição normal e que as variâncias
populacionais são iguais, com α = 0, 05, pode-se armar que existe alguma diferença signicativa no
conteúdo médio de nicotina nas duas marcas?
Solução: Sejam X : o conteúdo de nicotina da marca A. Y : o conteúdo de nicotina da marca B , tais

que; X ∼ N (µ1 , σ 2 ) e Y ∼ N (µ2 , σ 2 )
As hipóteses estatística são:
H0 : µ1 = µ2 ⇐⇒ H0 : µ1 − µ2 = 0
H1 : µ1 6= µ2 ⇐⇒ H1 : µ1 − µ2 6= 0
(ii) A estatística do teste é dada em (5.22), pois as variâncias são iguais mais desconhecidas, ou seja
X̄ − Ȳ ∼
T =q sob H0 t(n + m − 2),
Sp2 ( n1 + 1
m)
onde é n = 4, m = 5 e Sp2 é a variância ponderada.

(iii) A região crítica, para α = 0, 05, (parte achurada) representa os valores corresponte da distribuição
t-Student com n + m − 2 = 4 + 5 − 2 = 7 graus de liberdade com mostra a gura 5.15:
Figura 5.15: Região crítica para teste de hipóteses: H0 : µ1 = µ2 contra H1 : µ1 6= µ2
Ou seja, é o conjunto: Rc = {t ∈ t(7); t ≤ −2, 365, ou t ≥ 2, 365}

(4−1)×6+(5−1)×5 38
(iv) Dos dados do problema tem-se: X̄ = 20, S12 = 6, Ȳ = 21 , S22 = 5 e Sp2 = 4+5−2 = 7 .
Logo a estatística calculada ou observada é:
X̄ − Ȳ 20 − 21
Tobs = q =q ¡ ¢ = −0, 641
Sp2 ( n1 + 1
m)
38 1
7 4 + 1
5
Como, Tobs 6∈ Rc , não se rejeita H0 . Portanto, não existe diferença signicativa no conteúdo médio de
nicotina nas duas marcas de cigarro ao nível de signicância de α = 0, 05.
5.12 Teste de Hipóteses para a Igualdade de Duas Variâncis Popula-

cionais
Na seção anterior foi apresentado o procedimento de teste de hipóteses para diferença de duas médias
populacionais independentes. Em muitas outras situações, porém, pode-se estar interessado, também
em vericar se as duas populações independentes têm a mesma variância. Ou, pode-se estar interessado
em estudar as variâncias de duas populações com a nalidade de vericar se a suposição de igualdade
de variâncias. Para a escolha da estatística do teste no teste de hipóteses de diferença de duas médias,
ou seja, para a escolha da estatística T dada em (5.22) ou T 0 , dada em (5.23). Supõe-se que tem-se
dois conjuntos de dados obtidos de duas populações independentes e distribuídos normalmente. Nesta
seção apresenta-se o procedimento de teste de hipóteses estatístico para a igualdade de variâncias
(homogeneidade).
(i)
H0 : σ12 = σ22 , versus H1 : σ12 6= σ22

(ii) A estatística do teste:

S12 ∼
F = 2 sob H0 F (n − 1, m − 1), (5.24)
S2
ou seja, F tem distribuição F-Snedecor com n − 1 e m − 1 graus de liberdade, sendo n o tamanho
da amostra da população 1, S12 a variância amostral da população 1, m o tamanho da amostra da
população 2 e S22 é variância amostral da população 2.
(iii) A região crítica para um nível signicância α xado é apresentada na gura 5.16. Ela representa
Figura 5.16: Região crítica para teste de hipóteses: H0 : σ12 = σ22 contra H1 : σ12 6= σ22
o conjunto de valores da distribuição F-Snedecor com n − 1 e m − 1 graus de liberdade, tal que:

Rc = {F ≤ F1−α/2;n−1,m−1 ou F ≥ Fα/2;n−1,m−1 }.
(iv) Rejeita-se H0 se a estatística calculada ou observada Fobs pertence à Rc .
Exemplo 5.12.1 Um artigo publicado na Food Tecnology Journal (1956), descreve um estudo
sobre o conteúdo de protopectina em tomates durante o armazenamento. Considerou-se dois períodos
de armazenamento e analisou-se as amostras de nove lotes de tomates em cada período, obtendo-se os
dados abaixo:
Tempo de armazenamento Média Desvio Padrão
7 Dias 792 495,0
21 Dias 372,3 73,3
Admitindo que os conteúdos de protopectina para os 2 tempos de armazenamento tenha distribuição
normal.
(a) Pode-se armar que as variâncias verdadeira de conteúdo de protopectina nos dois tempos de
armazenamento são similares (ou homogêneas)? Use α = 0, 10
(b) Com probabilidade de cometer erro tipo I de 0,05, pode-se armar que o conteúdo médio de
protopectina em tomates com tempo de 7 dias de armazenamento supera o conteúdo médio de
protopectina em tomates armazenadas durante 21 dias em mais de 150 unidades ?
(c) Construa e interprete um intervalo de 90% de conança para a razão de variâncias verdadeiras
do conteúdo de protopectina armazenadas por um período de tempo de 7 dias e 21 dias.
Solução: (a) Sejam X : o conteúdo de protopectina em tomates armazenados em períodos de 7

dias e Y : o conteúdo de protopectina em tomates armazenados em períodos de 21 dias, tais que
X ∼ N (µ1 , σ22 ) e Y ∼ N (µ2 , σ22 ). Tem-se interesse em provar as seguintes hipóteses:
(i)
H0 : σ12 = σ22 , versus H1 : σ12 6= σ22
(ii) A estatística do teste é:

S12 ∼
F = 2 sob H0 F (n − 1, m − 1),
S2
onde n = m = 9 e F (8, 8) é a distribuição F-Snedecor com 8 e 8 graus de liberdade.
1 1
(ii) Para α = 0, 10 a região crítica Rc é tal que: F0,05,8,8 = 3, 44 ou F ≤ F0,95,8,8 = F0,05,8,8 = 3,44 =
0, 290698. Ou seja, Rc = {F ≤ 0, 29069 ou F ≥ 3, 44}.
(iv) Dos dados do problema tem-se S1 = 495 e S2 = 73.3. Com isso,

µ ¶2
495
Fobs = = 45.6039.
73, 3
Como Fobs ∈ Rc rejeita-se H0 . Portanto, pode-se armar que as variâncias do conteúdo do

protopectina em tomates armazenados em períodos de 7 dias e 21 dias não são similares.
(b) Nesse caso deseja-se vericar as seguintes hipóteses:
H0 : µ1 − µ2 ≤ 150 contra H1 : µ1 − µ2 > 150
onde µ1 é o conteúdo médio verdadeiro de protopectina em tomates armazenados durante 7 dias e µ2

é o conteúdo médio verdadeiro de protopectina em tomates armazenados durante 21 dias.
A estatística de teste é (5.23) pois, no item (b), foi vericado que as variâncias são diferentes. Isto é,
X̄ − Ȳ − 150
T0 = q 2 ,
S1 S22
( n + m)
2
2
S1 S2
n
+ m2
tem distribuição t-Student com ν = 2
S1
!2
2
S2
!2 − 2, graus de liberdade.
n m
n+1
+ m+1
Para α = 0, 05 e
¡ 2 ¢2
495 /9 + (732 /9)
ν= (4952 /9)2 (732 /9)2
− 2 ≈ 8, 0395 = 8,
9+1 + 9+1
a região crítica, é tal que: Rc = {T 0 ≥ t0,025,8 = 1, 860}.

Dos dados experimentais tem-se X̄ = 792 e Ȳ = 372, 3; daí a estatística calculada ou observada é :
0 792 − 372, 3 − 150 269, 7

Tobs = q = = 1, 61691
2 73,3 2 166, 779
( 495
9 + 9 )
0 6∈ R , a hipóteses nula, H , não é rejeitado. Portanto, concluí-se que há evidência estatística

Como Tobs c 0
suciente para armar que conteúdo médio de protopectina de tomates armazenada em períodos de 7
dias não supera o conteúdo médio de protopectina de tomates armazenados em períodos de 21 dias,
ao nível de signicância de 5%.
(c) Como 1 − α = 0, 90 tem-se α = 0, 10 e como n = m = 9, da tabela da distribuição F-Snedecor com
1
8 e 8 graus de liberdade encontra-se os valores de f2 = 3, 44 e f1 = 3,44 = 0, 290698. Substituindo esss
σ12
quantidades em (5.15) tem-se que um intervalo de 90% de conança para a razão de variâncias, σ22
,
dado por:
Ã µ ¶ µ ¶ !
σ12 495 2 495 2
IC( 2 ; 0, 90) = 0, 29069 × ; 3, 44 × = (13, 2570; 156.878).
σ2 73, 3 73, 3
Observa-se que esse intervalo de 90% de conança não contém o valor de um, portanto pode-se armar
com 90% de conança que as variâncias do conteúdo de protopectina de tomates armazenadas em
períodos de 7 dias e 21 dias não são homogêneas e essa mesma conclusão foi obtida através do proce-
dimento de teste de hipóteses. Em geral pode-se utilizar intervalos de conança para testar hipóteses
bilaterais.
5.13 Teste Hipóteses para uma Proporção Populacional, para Amos-

tras Grandes
O procedimento para os testes de hipóteses para proporção populacional é basicamente igual ao proce-
dimento para o teste para uma média populacional. Considere o problema de testar a hipótese que a
proporção de sucessos de um ensaio de Bernoulli é igual a valor especico, p0 . Isto é, testar as seguintes
hipóteses:
H0 : p = p 0 H0 : p ≥ p 0 H0 : p ≤ p 0
H1 : p 6= p0 H1 : p < p0 H1 : p > p0 ,
A estatística de teste é :
p̂ − p0 ∼
Z=q sob H0 N (0, 1), (5.25)
p0 (1−p0 )
n
ou seja, a estatística do teste (5.25) tem distribuição normal padrão. Na expressão acima, p̂ a proporção
amostral calculada com as n observações amostrais (n ≥ 30).
Exemplo 5.13.1 Um estudo é realizado para determinar a relação entre uma certa droga e certa
anomalia em embriões de frango. Injetou-se 50 ovos fertilizados com a droga no 400 dia de incubação.
No vigésimo dia de incubação, os embriões foram examinados e 7 apresentaram a anomalia. Suponha
que deseja-se averiguar se a proporção verdadeira é inferior a 25% com um nível de signicância de
0,05.
Solução: Seja Y : número de embriões que apresentam anomalia nos 50 ovos fertilizados com a droga.
Então, Y ∼ B(50, p), onde p é proporção populacional (ou verdadeira) de embriões que apresentam
anomalia. Deseja-se vericar as seguintes hipóteses:
H0 : p = 0, 25 contra H1 : p < 0, 25.

A estatística de teste é apresentada em (5.25). Com p0 = 0, 25. Tem-se

p̂ − 0, 25 ∼
Z=q sob H0 N (0, 1).
0,25(1−0,25)
n
A região crítica, para α = 0, 05 é o conjunto de valores da distribuição normal padrão menores ou

iguais a −1, 64 como mostra a gura 5.17. Isto é, Rc = {z ∈ Z; Z ≤ −1, 64}.
Figura 5.17: Regiões críticas para teste de hipóteses: H0 : p ≥ 0, 25 contra H1 : p < 0, 25
Temos que n = 50 e Y = 8. Portanto, p̂ = Yn = 50 7

= 0, 14 é a proporção estimada de embriões que
apresentam a anomalia. A estatística calculada ou observada é:
p̂ − 0, 25 0, 14 − 0, 25
Zobs = q = q = −1, 7963.
0,25(1−0,25) 0,25×0,75
n 50
Como Zobs < −1, 64, rejeita-se H0 . Conclui-se ao nível de signicância de 5% que a proporção de
embriões que apresentam anomalia ao serem fertilizados com a droga é signicativamente inferior a
25%.
5.14 Teste de Hipóteses de Igualdade de Duas Proporções Populaci-

onais para Amostras Grandes
Suponha que tem-se duas amostras independentes de tamanhos n e m sucientemente grandes (n > 30
e m > 30), de duas populações Bernoulli, com probabilidades de sucessos p1 e p2 respectivamente. E
sejam X : o número de sucessos na amostra de tamanho n e Y : o número de sucessos na amostra de
tamanho m. Portanto, X ∼ B(n, p1 ) e Y ∼ B(m, p2 ). Há interesse em vericar as seguintes hipóteses
estatística:
H0 : p1 = p2 ; H0 : p1 ≥ p2 ; H0 : p1 ≤ p2 ;
H1 : p1 6= p2 ; H1 : p1 < p2 ; H1 : p1 > p2 ,
A estatística do teste é, então
pˆ1 − pˆ2
Z=q , (5.26)
p̄(1 − p̄)( n1 + 1
m)
X Y X+Y
que tem distribuição normal padrão se H0 for verdadeira. Onde pˆ1 = n, pˆ2 = n e p̄ = n+m .
Exemplo 5.14.1 Um experimento foi conduzido com a nalidade de estudar a efetividade da vacina
Salk contra a pólio. Para isso, considerou-se um grupo de 100 camundongos com as mesmas caracterís-
ticas (idade, peso, etc), os quais foram distribuídos ao acaso em dois grupos iguais. Ao primeiro grupo
aplicou-se uma vacina similar sem o composto mais importante da vacina salk (placebo), e observou-se
que 40 dos 50 camundongos foram imunizados. No outro grupo aplicou-se a vacina salk e observou-se
que 45 dos 50 foram imunizados. Pode-se armar que a vacina Salk é efetiva contra a pólio. Use
α = 0, 05.
Solução: Sejam X : número de camundongos imunizados com a vacina Salk no grupo de 50 e Y :

número de camundongos imunizados com a vacina placebo no grupo de 50. Então X ∼ B(50, p1 ) e
Y ∼ B(50, p2 ). Tem-se interesse em vericar as seguintes hipóteses:
H0 : p1 ≤ p2 contra H1 : p1 > p2
A estatística de teste é dada em (5.26), tem distribuição normal padrão. Para α = 0, 05, a região
critica é a parte hachurada mostrada na gura 5.18. Ou seja, Rc = {z ∈ Z; Z ≥ 1, 64}.
Figura 5.18: Regiões críticas para testar: H0 : p1 ≤ p2 contra H1 : p1 > p2 .
Como pˆ1 = 45 40
50 = 0, 90 e pˆ2 = 50 = 0, 80 e p̄ =
45+40
100 = 0, 95 a estatística apresentada em (5.26),
avaliada com os dados amostrais é,
pˆ1 − pˆ2 0, 90 − 0, 80
Zobs = q =q = 2, 294.
p̄(1 − p̄)( n1 + 1
m)
1
0, 95 × 0, 05( 50 + 1
50 )
Como Zobs ∈ Rc rejeita-se H0 . Conclui-se, ao nível de signicância de 5% que a vacina Salk é efetiva
contra pólio.
5.15 Nível Descritivo

De acordo com o procedimento descrito anteriormente para o teste de hipóteses, no nal toma-se uma
decisão de rejeição ou de não-rejeição da hipótese nula. Esta dicotomia é, na realidade, articial. De
fato
(i) a xação de um nível de signicância é arbitrária e
(ii) os dados amostrais podem contradizer a hipótese nula em maior ou menor grau.
O nível descritivo denotado por α∗ ( ou P-value ) constitui uma medida do grau com que os dados
amostrais contradizem a hipótese nula. A sua denição é a seguinte: o nível descritivo corresponde à
probabilidade da estatística de teste tomar um valor igual ou mais extremo do que aquela que, de fato,
é observado. Alternativamente, pode-se denir o nível descritivo como o menor nível de signicância
para o qual a estatística de teste determina a rejeição da hipótese nula H0 . Note-se que, tal como a
estatística de teste, o nível descritivo é calculado admitindo que H0 seja verdadeira.
Exemplo 5.15.1 No exemplo 5.13.1, a estatística de teste observada é, ZObs = −1, 7963 (recorde-se
que o nível de signicância do teste era α = 0, 05 e o correspondente valor crítico z0,05 = −1, 64).
De acordo com a denição apresentada, o nível descritivo da prova, α∗ , é:
α∗ = P (Z ≤ −1, 7963|H0 ) = 0, 0362 (veja a tabela normal padrão)
Portanto, o nível descritivo é de 3,62% que indica a probabilidade de encontrarmos valores da estimativa
mais desfavoráveis à hipótese nula. Note que o valor do nível descritivo se relaciona diretamente com
o nível signicância.
Nesse exemplo, se o nível de signicância fosse xado em qualquer valor igual ou superior a 3,62%, a
conclusão seria pela rejeição de H0 ao passo que valores inferiores a 3,62% conduziriam à aceitação da
hipótese nula. O signicado do nível descritivo é ilustrado na gura 5.19,
Figura 5.19: Valor do nível descritivo para testar: H0 : p = 0, 25 contra H1 : p < 0, 25.
Como é evidente, quanto menor for o valor do nível descritivo maior será o grau com que a hipótese
nula é contradita. Dada a relevância da informação contida no nível descritivo, é recomendável a sua
inclusão explícita nos resultados de qualquer teste de hipóteses. Por exemplo, muito mais esclarecedor
do que dizer que uma hipóteses nula foi rejeitada, ao nível de signicância de 5%, é armar que isso
sucedeu e que o nível descritivo foi de 0,3%.
Para os testes de hipóteses na qual a distribuição normal é a estatística do teste, o nível descritivo
nesta caso é dado por:

 2(1 − Φ(|zobs| )); para teste bilateral
∗
α = 1 − Φ(zobs ); para teste unilateral de cauda superior

Φ(zobs ); para teste unilateral de cauda inferior
onde zobs é o valor da estatística do teste e Φ( ) é a função da distribuição acumulada normal padrão
denida no capítulo anterior.
5.16 Exercícios
1. Com a nalidade de estudar os efeitos do feijão no consumo humano examinou-se o incremento de
peso de 20 indivíduos ao nal de 3 dias. O pesquisador por experiências anteriores conhece que
variância do incremento de peso de qualquer grupo de pessoas é 16 gramas. Os dados apresenta-se
a continuação:
8,0 20,4 15,1 11,2 16,0 12,5 19,2 17,4 14,2 19,3
19,2 16,6 10,1 8,1 18,0 9,5 13,1 21,2 15,0 16,2
(a) Construa um intervalo do 98% de conança para o incremento de peso médio verdadeiro.
(b) Suponha que deseja-se saber quantos indivíduos tem que ser examinados, para que o erro
da média amostral não exceda 1,5 gr, com 99% de conança.
2. Uma pesquisa é feita com a nalidade de estimar a proporção de estudantes da UFOP, usuários
de algum tipo de droga (p) com um margem de erro de três pontos percentuais, a porcentagem
de estudantes usuários de algum tipo de droga. Supondo que se pretende um nível de conança
de 99% nos resultados, quantos estudantes devem ser pesquisados ?.
(a) Suponha que tenhamos uma estimativa com base em estudo anterior, que mostrou que 67%
dos estudantes tinham consumido algum tipo de droga.
(b) Suponha que não tenhamos qualquer informação que possa sugerir o valor de p.
(c) Sabendo-se que a amostra obtida no item (a), forneceu uma estimativa de que 70% dos
estudantes tinham consumido algum tipo de droga, obtenha e interprete um intervalo de
95% de conança para a verdadeira proporção de estudantes que consumem algum tipo de
droga.
3. Um artigo publicado no Journal Of Heat Transfer (1974) descreve um novo método para medir
a condutividade térmica do ferro Armco. Ao utilizar uma temperatura de 100o F e uma potência
de entrada de 550 W, resultaram as seguintes medições de condutividade (em Btu/hr-ft-o F):
41,60; 41,48; 42,34; 41,95; 41,86; 42,18; 42,26; 41,48; 42,04; 41,72. Supondo que a condutividade
térmica a 100o F e 550 W se distribui normalmente com desvio padrão, σ = 0, 30Btu/hr−f t−o F .
Obtenha um intervalo do 95% de conança da condutividade média deste material.
4. De um lote de 2200 lâmpadas foram sorteadas 81 lâmpadas ao acaso, o tempo médio de duração
das lâmpadas sorteadas foi de 3200 horas e um desvio padrão de 900 horas. Construa um intervalo
de 95% de conança para o tempo médio das lâmpadas do lote (suponha que tempo de duração
das lâmpadas é normal).
5. A resistência média à tensão de uma bra sintética é uma característica importante de qualidade
de interesse do fabricante, o qual deseja encontrar um intervalo de 95% de conança para estimar
a média. O fabricante supõe, com base na resistência à tensão está distribuída aproximadamente
normal. Embora, se desconheça a resistência média à tensão e seu desvio padrão. Selecionou-se
uma amostra aleatória de 16 troços de bra e determinou-se sua resistência (em psi, lb/plg2). A
média e desvio padrão amostrais resultaram respectivamente; 49,86 psi e 1,66 psi. Que dizer ao
respeito à resistência média da bra sintética?.
6. Uma rma construtora deseja estimar a resistência média das barras de aço utilizadas na cons-
trução de casas. Qual tamanho amostral se requer para garantir que haja um risco de 0,001 de
ultrapassar um erro de 5 kg ou mais na estimação? O desvio padrão da resistência para este tipo
de barra é considerado 25 kg.
7. Uma psicóloga elabora um novo teste de percepção espacial e deseja estimar o escore médio
alcançado por pilotos do sexo masculino. Quantas pessoas ela deve testar para o que o erro da
média amostral não exceda 2,0 pontos, com 95% de conança ?. Estudo anterior mostro sugere
que σ = 21, 2.
8. As alturas de estudantes mulheres do primeiro ano de uma universidade têm distribuição normal
com média de 1,65 m, e desvio padrão de 0,5 m. Quantas estudantes devem ser pesquisadas,
se queremos estimar a porcentagem das que têm mas 1,60 m. de altura ?. Admita um nível de
conança de 99% , em que o erro não supere 2,5 pontos percentuais.
9. Um fabricante da área farmacêutica produz frascos de certo produto. A quantidade de certo

principio ativo em cada frasco é uma variável aleatória com média desconhecida e variância 30
mg. Um comprador tomou uma amostra de 11 elementos e mediu a quantidade dessa substância
em cada frasco a média da amostral foi 263 mg. Supondo normalidade, determine um intervalo
de 95% de conança para a quantidade média da substância em cada frasco.
10. Uma agência governamental está encarregada de scalizar a contaminação de um certo produto
alimentício, através da análise de uma amostra dos pacotes desse produto. Uma porcentagem de
contaminação de 7% é considerado tolerável. Se a porcentagem de contaminação for maior que
este valor o produtor deverá ser atuado. Uma norma da agência estabelece que, se no exame de
20 pacotes desse produto forem detectados pelo menos 4 pacotes contaminados, então a fabrica
deve ser multado. Seja p a proporção de contaminação do produto.
(a) Formule as hipóteses estatísticas especicando as hipóteses nula e alternativa .

(b) Qual é o signicado do erros tipo I e do tipo II neste problema.?
(c) Qual é região crítica escolhida ?
(d) Qual é nível de signicância do teste ?
(e) Qual é a probabilidade de se atuar o produto se a proporção de contaminação de seu produto
for 15%.?
11. O encarregado do controle de trafego aéreo da Companhia de aviação ASA arma que 95% dos
vôos dessa Companhia chegam ao lugar de destino no máximo com 30 minutos de atraso. Uma
instituição de defesa do consumidor recebeu queixas dos clientes da ASA que armam que a
porcentagem de vôos que chegam no máximo com 30 minutos de atraso é muito menor. Eles
examinam uma amostra selecionada ao acaso de 200 registros de vôos da ASA e vericaram que
182 vôos chegaram no máximo com 30 minutos de atraso.
(a) Formule as hipóteses nula e alternativa . Faça o teste usando o nível descritivo (P-value)
(b) Construa um intervalo do 98% de conança para a verdadeira proporção .
12. As companhias de seguros estão cando preocupados com o fato de que o número crescente
de telefones celulares resulte em maior colisões de carros; estão por isso, pensando em cobrar
prêmios mais elevados para os motorista que utilizam celulares. Desejamos estimar, com um
margem de erro de três pontos percentuais, a porcentagem de motoristas que falam ao celular
enquanto estão dirigindo. Supondo que se pretende um nível de conança de 95% nos resultados,
quantos motoristas devem ser pesquisados ?.
(a) Suponha que tenhamos uma estimativa com base em estudo anterior, que mostrou que 18%
dos motoristas falavam ao celular.
(b) Suponha que não tenhamos qualquer informação que possa sugerir o valor de .
13. O rótulo de remédio contra resfriado Dozenol indica a presença de 600 mg de acetaminofem em
cada onça uida. A Food and Drug Administration (FDA) selecionou aleatoriamente 65 amostra
de uma onça e constatou que o conteúdo médio de acetaminofen é de 585 mg, com um desvio
padrão de 21 mg. Ao nível de signicância de 1%, testa a armação da Medassist Pharmaceutical
Company de que a média populacional é igual a 600 mg.
14. Determinou-se o custo de operação por cliente para cada uma de 12 organizações. Os 12 valores
têm média de $2133 e desvio padrão de $345 .Ao nível de 0,01 de signifcância, teste a armação
de uma acionista, que se queixa de que a média para todas as organizações desse tipo excede $
1800 por cliente.
15. Em um estudo de 71 fumantes que estavam procurando deixar de fumar utilizando uma terapia
especial, 32 não estavam fumando uma após o tratamento. Ao nível de 0,10 de siginicância, teste
a armação de que, dos fumantes que procuram deixar de fumar com aquela terapia, a maioria
está fumando um após o tratamento. Esses resultados sugerem que a terapia não é ecaz?
16. A Medassit Pharmaceutical Company utiliza uma maquina para encher frascos com um remédio,
de tal maneira que o desvio padrão dos pesos é de 0,15 oz. Testou-se uma nova maquina em 71
frascos e, para essa amostra, o desvio padrão é 0,12 oz. A Dayton Machine Company, fabricante
da nova maquina, arma que ela enche os frascos com menor variação.
(a) Teste a armação da Dayton Machine Company, ao nível de 0,05 de signicância de. Se a
máquina na Dayton está sendo usanda como experiência, deve-se cogitar de sua aquisição ?
(b) Determine um intervalo de 95% de conança para o desvio padrão dos pesos nos frascos.
17. Pesquisadores de Johns Hopkins zeram um estudo de empregadas da IBM que estavam gravidas.
De 30 empregadas que lidavam com éter-glicol, 10 tiveram aborto (espontâneo) mas, de 750 que
não estavam expostas ao éter-glicol, apenas 120 abortaram.
(a) No nível de 0,01 de signicância, teste a armação de que as mulheres expostas ao éter-glicol
apresentam maior taxa de aborto.
(b) Qual é o nível descritivo para o teste de hipóteses em (a) ?.
18. A empresa "Duramas"garante que, se os pneus forem utilizados com condições normais, têm uma
vida média superior a 40000 km. Uma amostra constituída por 30 pneus utilizados nas condições
acima referidas proporcionou os seguintes resultados: X̄ = 43200 km e S = 8000 km. Teste, ao
nível de signicância de 5% se os pneus têm a vida média que o fabricante reivindica.
19. Um certo analgésico adotado em determinado hospital é ecaz em 70% dos casos. Um grupo de
médicos chineses em vista a esse hospital arma que a utilização da acupuntura produz melhores
resultados. A direção do hospital resolve testar o método alternativo em 80 pacientes sorteados
ao acaso, com a nalidade de adotá-lo em denitivo se ele apresentar eciência satisfatória numa
proporção de casos maior que do anestésico atual. Seja p a probabilidade de que a o método de
acupuntura apresente a eciência satisfatória quando aplicada a um paciente.
(a) Formule este problema como um problema de testes de hipóteses especicando as hipóteses
nula e alternativa.
(b) Quais os erros de tipo I e II (em palavras) ?
(c) Supondo que o critério para rejeitar a hipóteses nula seja: número de pacientes, com re-
sultado satisfatório, no mínimo 64, qual é a probabilidade do erro tipo I ? Interprete o
resultado.
(d) Se dentre os 80 pacientes submetidos à nova técnica em 69 deles apresentaram eciência
satisfatória, qual é a decisão a ser tomada ?. (Use α = 0, 01)
20. Uma companhia de cigarros anuncia que o índice médio de nicotina dos cigarros que fabrica
apresenta-se abaixo de 23 mg por cigarro. Um laboratório realiza 6 análises desse índice, obtendo:
27; 24; 21; 25; 26; 22. Sabe-se que o índice de nicotina se distribui normalmente, com variância
igual a 4,86 mg 2 .
(a) Pode-se aceitar, no nível de 10%, a armação do fabricante?

(b) Determine o nível descritivo e qual é sua conclusão?
21. Um fabricante de um certo tipo de aço especial arma que seu produto tem um severo serviço
de controle de qualidade, traduzido pelo desvio padrão da resistência à tensão que não é maior
do que 5 kg por cm2 . Um comprador, querendo vericar a veracidade da armação, tomou uma
amostra de 11 cabos e submeteu-a a um teste de tensão. Os resultados foram as seguintes:
x̄ = 263 e S 2 = 48. Esses resultados trazem alguma evidência contra a armação do fabricante?
Use α = 0, 05.
22. Karl Pearson, que elaborou muitos conceitos importantes em estatística, coletou dados sobre
crimes que 1909. Dos condenados por incêndio criminoso, 50 bebiam 43 eram abstêmios. Dos
condenados por crime de fraude, 63 bebiam e 144 eram abstêmios. Com o nível de 0,01 de
signicância, teste a armação de que a proporção dos que bebem entre os incidiarios é maior
do que proporção dos bebedores condenados por fraude. A bebida parece ter algum efeito sobre
o tipo de crime?. Por que?
23. Realiza-se um experimento para comparar a média da absorção de medicamentos em espécimens

de tecido muscular. Divide-se 72 espécimens em dois grupos iguais, seguindo um procedimento
aleatório. Cada grupo foi ministrada uma de das 2 medicamentos (A e B), as médias amostrais
foram respectivamente :X¯A = 7, 9 e X¯B = 8, 5 . Admitindo que a absorção dos medicamentos
tem distribuição normal e, que a variância de absorção para este tipo de medicamentos é 0,10.
(a) Construa um intervalo de 99% de conança para diferença de médias de absorção do medi-
camento A e B.
(b) No nível de 1% de signicância, pode-se armar que absorção dos medicamentos são os
mesmos ?
(c) Teste o item (a) usando o nível descritivo ?
24. Dividem-se 50 pacientes de epilepsia em duas amostra aleatórias iguais, Ao grupo A se lhe deu
tratamento que incluía doses diárias de vitamina D. Ao grupo B se lhes deu o mesmo tratamento
com exceção que não recebeu vitamina D ao invés recebeu placebo em seu lugar. Os dados
sumariados do número de ataques experimentados são apresentados na tabela embaixo:
Tratamento Média Variância
Vitamina D 15 8
Placebo 24 18
(a) Pode-se armar que as variâncias do número ataques dos 2 tratamentos são similares ou
homogêneos. Use a=0,10.
(b) Há suciente evidência que indique que a vitamina D reduz o número de ataques epilépticos
?. Use a=0,05.
(c) Construa um intervalo do 95% para diferença de médias de ataques do tratamento com
vitamina D e com placebo.
25. Um artigo publicado no Journal of Sport Science (1987) apresenta os resultados de uma pesquisa
sobre o nível de hemoglobina dos jogadores do jockey sobre gelo na olimpíada de Canada. Os
resultados que aparecem no artigo são as seguintes (em g/dl):
15,3 16,0 14,5 16,2 14,9 15,7 15,3 14,6 14,5 16,2
15,7 16,0 15,0 15,7 16,2 14,7 14,8 14,6 15,6 15,2
Outro pesquisador mediu o nível de hemoglobina de 20 pessoas normais não esportistas escolhidos
ao acaso. Os dados (em g/dl) são os seguintes:
12,5 13,0 10,3 11,6 10,6 11,2 13,4 10,2
11,8 14,0 11,2 11,9 12,2 10,9 11,1 9,8
Supondo que os dados têm distribuições normal.
(a) Pode-se armar que a variâncias do nível de hemoglobina em pessoas esportistas e não
esportistas são as mesma. Use a=0,10.
(b) Determine um intervalo de 95% de conança para a razão de variâncias do nível de hemo-
globina entre os que são esportistas os que não são .
(c) Com probabilidade de cometer erro tipo I de 0,05, você poderia armar que existe alguma
diferença no nível de hemoglobina entre pessoas esportistas e não esportistas. ?
(d) Considerando o item (a), construa um intervalo de 95% de conança para diferença de
médias do nível de hemoglobina entre pessoas esportistas e não esportistas.
26. Uma pesquisa é feita com a nalidade de vericar se ltros de cigarros realmente diferença, ou
apenas são truques de venda sem qualquer efeito real. A continuação apresentam-se os dados
sumariados dos conteúdos alcatrão e nicotina em uma amostra aleatória de cigarros tamanho
padrão, com ltro e sem ltro. Todas as medidas em miligramas.
Com ltro Sem ltro
Alcatrão Nicotina Alcatrão Nicotina
Tamanho da amostra 21 21 8 8
Média 13,3 0,94 24,0 1,65
Desvio padrão 3,7 0,31 1,7 0,16
Supondo que os dados tem distribuição normal.
(a) Construa e interprete um intervalo de 98% de conança para desvio padrão da quantidade
de nicotina em cigarros com ltro.
(b) Construa e interprete um intervalo do 95% de conança , para a quantidade media de

nicotina em cigarros sem ltro.
(c) Pode-se armar que a variâncias da quantidade de nicotina em cigarros com ltro e sem
ltro são as mesma.? Use a=0,10.
(d) Com probabilidade de cometer erro tipo I de 0,05, você poderia armar que quantidade
alcatrão em cigarros sem ltros é maior à quantidade alcatrão em cigarros com ltro ?
(e) Considerando o item (c), construa um intervalo de 95% de conança para diferença de
médias da quantidade média de alcatrão de cigarros com ltro e sem ltro.
27. Em estudo recente de 22.000 médicos, metade tomou doses regulares de aspirina, e à outra
metade foi administrado um placebo. O estudo se estendeu por seis anos, a um custo total de $
4,4 milhões. Entre os que tomaram aspirina, 104 tiveram ataque cardíacos, e dos que receberam
um placebo 189 tiveram ataques.
(a) Esses resultados mostram uma redução estatisticamente signicativa dos ataques cardíacos
no grupo que tomaram aspirina ?. (Use o nível descritivo).
(b) Construa e interprete um intervalo do 98% de conança para a proporção de médicos que
tomaram aspirina e não tiveram ataques cardíacos.
28. Uma peça de um certo equipamento elétrico é fornecido, sob encomenda, por duas empresas
externas (A e B ). A dimensão desta peça é uma característica de qualidade importante no
momento da montagem do produto. Para examinar se há diferença nas dimensões das peças da
empresa A e empresa B, forem extraídas amostras aleatórias das respectivas fabricas, obtendo-se
os dados abaixo (em mm):
Empresa A Empresa B
12,5 12,6 12,4 12,8 12,7 12,6 13, 0 13,1 13,0 13,2 13,1 12,7
12,6 12,5 12,6 12,4 12,3 12,7 13,0 12,1 12 ,9 12,9
Supondo que os dados tem distribuição aproximada normal.
(a) Para um nível de signicância de 5%, pode-se armar que variâncias são homogêneas ?
(b) Considerando o item (a), Existe diferencias signicativas entre a média da dimensão forne-
cida pêlos dois fornecedores ?. Use α = 0.05.
(c) Obtenha o nível descritivo do teste em (b).? Qual é sua conclusão ?
(d) Obtenha e interprete um intervalo de 95% de conança para a diferença de media da di-
mensão do fornecedores A e B.
29. Numa determinada empresa industrial, uma peça é fabricada automaticamente, em grandes
quantidades, por duas maquinas A e B, que se distinguem apenas pelo fato da maquina B ser
mais velha (e mais usada) do que a maquina A. Com a nalidade de avaliar se as duas maquinas
estão produzindo peças da mesma qualidade, avaliou-se o tempo (em segundos) de operação de
cada maquina em produzir uma peça e, também foi vericado se peça satisfaz os requerimentos de
Engenharia (se a peça é defeituosas ou não). Da linha de produção da maquina A obteve-se uma
amostra aleatória de 31 peças e, da maquina B uma amostra aleatória de 41 peças obtendo-se
os seguintes resultados .
Maquina Tempo médio Variância No de peças defeituosos
A 45,020 31,393 6
B 48,041 6,758 6
(a) Pode-se dizer, ao nível de 5% de signicância, que o tempo médio de operação da maquina
B supera o tempo médio de operação da maquina A em mais de 2 segundos ?
(b) Quais são os pressupostos necessários para a resolução de item (a) ?
(c) Para um nível de 5% de signicância, pode-se armar que maquina A produz a mesma
proporção de peças defeituosas que a maquina B ?.
(d) Qual é o nível descritivo em (c), ? Qual é sua conclusão ?
30. Um experimento é conduzido para comparar dois regimes alimentares no que diz ao aumento de
peso. Vinte indivíduos são distribuídos ao acaso entre dois grupos em que ao primeiro deles foi
dada a deita A ao segundo a B . Decorrido certo intervalo de tempo verica-se que os aumentos
de peso correspondentes foram os seguintes:
A -1,0 0,0 2,1 3,1 3,3 4,3 5,2 5,5 5,0 6,8
B 2,5 3,0 4,0 5,7 6,0 7,0 7,2 7,3 6,9 8,1
Supondo que incrementos de peso tem distribuição normal.
(a) Construa e interprete um intervalo do 95% de conança para o desvio padrão do incremento
do peso de indivíduos alimentados com a dieta B .
(b) Ao um nível de 10% de signicância pode-se armar que as variâncias verdadeiras dos
incrementos de pesos de pessoas alimentadas com a dieta A e B são similares ?
(c) Com probabilidade de cometer erro tipo I de 0,05, você poderia armar que dieta B é melhor
que a dieta A.
(d) Considerando o item (b), construa um intervalo de 95% de conança para diferença de
médias do incremento de peso de pessoas alimentadas com dieta B e A .
Capítulo 6
Análise de regressão e correlação
6.1 Introdução
Em diversas áreas de aplicação, freqüentemente há interesse em estudar a relação entre duas variáveis,
como quantidade de fertilizante; e a produção com o uso do fertilizante, a concentração de uma droga
injetada em um animal de laboratório e o batimento do coração após a injeção; a dureza de um plástico
tratado com calor durante diferentes períodos de tempo , etc. A natureza e o grau de relação entre
variáveis podem ser analisadas pelas técnicas de Regressão e Correlação respectivamente, mesmo que
essas técnicas estão relacionadas têm propósitos e interpretações diferentes como será mostrado mais
adiante.
O termo regressão foi introduzido pelo cientista inglês Francis Galton em 1880. Em um famoso ensaio,
Galton vericou que embora houvesse uma tendência de pais altos terem lhos altos e pais baixos terem
lhos baixos, a altura média dos lhos de uma dada altura tendia a se deslocar ou "regredir"até a altura
média da população como um todo. Em outras palavras, a altura dos lhos de pais extraordinariamente
altos ou baixos tende a se mover para a altura média da população. A lei de regressão universal de
Galton foi conrmada por seu amigo Karl Pearson, que coletou mais de mil registros de alturas dos
membros de uma família. Ele vericou que a altura média dos lhos de um grupo de pais altos era
inferior à altura de seus pais e que a altura média dos lhos de um grupo de pais baixos era superior
à altura de seus pais. Assim, tanto os lhos altos quanto os baixos "regrediram"em direção à altura
média de todos os homens.
A moderna interpretação da regressão é, porém, bem diferente. Em linha gerais, podemos dizer:
a análise de regressão ocupa-se do estudo da dependência de uma variável, a variável dependente
(ou variável resposta), em relação a uma ou mais variáveis, as variáveis explicativas (ou variáveis
independentes), com o objetivo de estimar e/ou prever a média (da população) ou valor médio da
variável dependente em termo dos valores conhecidos ou xos das variáveis explicativas.
A análise de correlação, por outro lado, consiste na medição do grau ou intensidade de associação
entre duas variáveis. Quando se pode demonstrar que a variação de uma variável está de algum modo
associada com a variação da outra, então podemos dizer que as duas variáveis estão correlacionadas.
Uma correlação pode ser positiva (quando ao aumentar uma variável a outra também aumenta) ou
negativa ( quando ao aumentar uma variável a outra diminui). Por outro lado, se a variação de uma
variável não corresponde em absoluto à variação da outra, então não existe nenhuma associação e
portanto, nenhuma correlação entre as duas variáveis. Assim por exemplo, se um investigador deseja
determinar o grau de associação que existe entre a biomassa do toplacton e a quantidade de clorola
177
CAPÍTULO 6. ANÁLISE DE REGRESSÃO E CORRELAÇÃO 178
"x", o investigador retira repetidas amostras de água do lugar amostrado na lagoa e mede a clorola
"x"e a biomassa em cada amostragem. Nessa situação, o investigador não tem controle sobre uma ou
outra variável, já que os valores de clorola "x"e da biomassa encontrados em cada amostra serão "os
que natureza lhe provê". Portanto, deduz-se que as duas variáveis acima são aleatórias e a análise de
correlação é o procedimento estatístico adequado.
6.2 Análise de Regressão

Conforme foi apresentado na seção anterior, a análise de regressão é uma das técnicas estatísticas mais
utilizadas para pesquisar e modelar o relacionamento existente entre duas ou mais variáveis. O estudo
da análise de regressão será iniciado considerando o exemplo abaixo.
Exemplo 6.2.1 Um administrador de uma cadeia de supermercados deseja desenvolver um modelo

com a nalidade de estimar as vendas médias semanais (em milhares de dólares) de cada supermercado,
Para isto, selecionou-se uma amostra aleatória de 20 supermercados entre todos os que formam a
cadeia. Ao desenvolver o modelo foi considerado entre outras variáveis explicativas (ou independentes)
a variável "o número de clientes por semana."Os dados são apresentados na tabela 6.1:
Tabela 6.1: Número de clientes e vendas semanais para uma amostra de 20 supermercados.
Supermercado No de clientes (X ) Vendas semanais (Y )
1 907 11,20
2 926 11,05
3 506 6,84
4 741 9,21
5 789 9,42
6 889 10,08
7 874 9,45
8 510 6,73
9 529 7,24
10 420 6,12
11 679 7,63
12 872 9,43
13 924 9,46
14 607 7,64
15 452 6,92
16 729 8,95
17 794 9,33
18 844 10,23
19 1010 11,77
20 621 7,41
Na gura 6.1, é apresentado o diagrama de dispersão das vendas semanais e o número de clientes. O
diagrama é somente um gráco em que cada par (xi , yi ) está representado como um ponto no sistema
de coordenadas bidimensionais. A análise desse diagrama indica que uma curva não passa exatamente
11
10
Vendas semanais
9
8
7
6
400 500 600 700 800 900 1000
Numero de clientes
Figura 6.1: Diagrama de dispersão das vendas semanais e o número de clientes
por todos os pontos, mas existe uma forte evidência que os pontos estão dispersos de maneira aleatória
em torno de uma linha reta. Portanto, é razoável supor que a média da variável aleatória Y , está
relacionada com X pela seguinte relação
E(Y |X = x) = µY |x = β0 + β1 x
onde βo e β1 , são respectivamente, o intercepto e a inclinação da reta e recebem o nome de coecientes

de regressão. Mesmo que a média de Y seja uma função linear de X , o valor observado de y não
cai de maneira exata sobre a reta. A maneira apropriada para generalizar este fato como um modelo
probabilístico linear, é supor que o valor esperado de Y seja uma função linear, mas, para um valor
xo de X o valor real de Y será determinado pelo valor médio da função linear (µY |x ) mais um termo
que representa um erro aleatório, assim:
Y = µY |x + ε = β0 + β1 x + ε, (6.1)
onde ε é o erro aleatório. É importante observar que ε leva em conta a falha desse modelo em se
ajustar exatamente aos dados. Isso pode ser devido ao efeito de outras variáveis que afetam as vendas
semanais. O modelo (6.1) recebe o nome de modelo de regressão linear simples, pois tem somente
uma variável explicativa ou variável regressora ou variável independente . Em muitas situações, os
modelos desse tipo surgem de uma relação teórica. Em outras, não há nenhum conhecimento teórico
da relação existente entre x e y. A seleção dos modelos se baseia na análise do diagrama de dispersão,
tal como foi feito com os dados de vendas semanais. Nesses casos, o modelo de regressão se considera
como um modelo empírico.
Em geral, a variável resposta pode estar relacionada com k variáveis explicativas X1 , . . . Xk
obedecendo à equação :
Y = β0 + β1 X1 + · · · + βk Xk + ε, (6.2)
Em nosso exemplo, as variáveis X1 , . . . Xk poderia ser, por exemplo, número de promoções por semana,
formas de pagamento e outras.
A equação (6.2) é denominada modelo de regressão linear múltipla, porque envolve mais uma variável
explicativa. O adjetivo "linear"é usado para indicar que o modelo é linear nos parâmetros β1 , . . . , βk
e não porque Y é função linear dos X 's. Por exemplo, uma expressão da forma Y = βo + β1 log X1 +
β2 X23 + ε é um modelo de regressão linear múltipla, mas o mesmo não acontece com a equação Y =
β0 + β1 X1β2 + β3 X22 + ε.
Na seção seguinte é apresentado o caso mais simples em que apenas duas variáveis estarão envolvidas,
o qual corresponde à regressão linear simples.
6.3 Modelo de Regressão Linear Simples

Conforme foi mencionado anteriormente, um modelo de regressão linear simples (MRLS) descreve
uma relação entre uma variável independente (explicativa ou regressora) X e uma variável dependente
(resposta) Y , nos termos seguintes:
Y = β0 + β1 X + ε, (6.3)
onde β0 e β1 são constantes (parâmetros) desconhecidas e ε é o erro aleatório dado pela diferença entre
o valor observado Y e a média de Y.
Como é mostrado na equação (6.3), os erros considerados no MRLS incidem diretamente sobre os
valores observados de Y ; a teoria da regressão assenta nas seguintes suposições:
1. Os erros têm média zero e a mesma variância desconhecida, σ 2 .
2. Os erros são não correlacionados, ou seja, o valor de um erro não depende de qualquer outro erro.
3. A variável explicativa X é controlada pelo experimentador e é medida sem erro, ou seja, não é
uma variável aleatória.
4. Os erros tem distribuição normal.
Se as suposições (1)-(4) se vericarem, atendendo à relação na equação (6.3), a variável dependente Y

é uma variável aleatória com distribuição normal com variância σ 2 e média µY |x , sendo
E(Y |X = x) = µY |x = β0 + β1 x. (6.4)
Observe em (6.4) que para um acréscimo de uma unidade em X há um acréscimo de β1 unidades na

média de Y. Se os valores de X incluem X = 0, então o intercepto β0 é a média de Y quando X = 0.
Em caso contrário, β0 não tem interpretação prática.
6.3.1 Estimação dos parâmetros do MRLS através do método de mínimos qua-

drados
Suponha que tem-se n pares de observações (x1 , y1 ), . . . , (xn , yn ). A gura 6.2, mostra uma represen-
tação gráca dos dados observados e um candidato para a linha de regressão. As estimações de β0
e β1 devem dar como resultado uma linha que (em algum sentido) se "ajuste melhor"aos dados. O
cientista alemão Karl Gauss (1777-1855) propôs estimar os parâmetros de β0 e β1 de equação (6.3) de
modo que se minimize a soma de quadrados dos desvios verticais da gura 6.2.
Figura 6.2: Desvio dos dados do modelo de regressão linear n = 5.
Este critério de estimação dos coecientes de regressão é conhecido como método de mínimos qua-
drados. Ao utilizar o modelo (6.3), é possível expressar as n observações da amostra como:
yi = β0 + β1 xi + εi , i = 1, . . . , n. (6.5)
E a soma de quadrados dos desvios das observações em relação à linha de regressão é:

n
X n
X
Q= ε2i = (yi − β0 − β1 xi )2 . (6.6)
Os estimadores de mínimos quadrados (EMQ) de β0 e β1 denotados por β̂0 e β̂1 devem satisfazer as
seguintes equações:
n
X
∂Q
| = −2 (yi − β̂0 − β̂1 xi ) = 0, (6.7)
∂β0 β̂0 ,β̂1
i=1
n
X
∂Q
| = −2 (yi − β̂0 − β̂1 xi )xi = 0.
∂β1 β̂0 ,β̂1
i=1
Após simplicar as expressões anteriores, tem-se:

n
X n
X
β̂0 + β̂1 xi = yi (6.8)
i=1 i=1
n
X Xn
β̂0 xi + β̂1 x2i = xi yi .
i=1 i=1
As equações (6.8) recebem o nome de equações normais de mínimos quadrados. A solução dessas
equações fornece os EMQ, β̂0 e β̂1 , dados por:
β̂0 = ȳ − β̂1 x̄. (6.9)

P
n P
n
P
n xi yi
i=1 i=1
xi yi − n
i=1
β̂1 = 2 . (6.10)
P
n
P
n xi
x2i − i=1
n
i=1
P
n P
n
xi yi
onde x̄ = i=1
n e ȳ = i=1
n .
Portanto, a linha de regressão estimada ou ajustada é :
ŷ = β̂0 + β̂1 x
e estima a média da variável dependente para um valor da variável explicativa X = x, µY |x . Note que
cada par de observações satisfaz a relação:
yi = β̂0 + β̂1 xi + ei , i = 1, . . . , n
onde ei = yi − yî recebe o nome de resíduo. O resíduo descreve o erro no ajuste do modelo na i-ésima
observação. Nesta seção, utilizamos os resíduos para o estudo da adequação do modelo ajustado.
Conforme o ponto de vista da notação, em certas situações é conveniente ter notações especiais no
MRLS. Dados (x1 , yi ), . . . , (xn , yn ) sejam:
µ n ¶2
P
Xn X n X n xi Xn
2 2 i=1
Sxx = (xi − x̄) = (xi − x̄)xi = xi − = x2i − nx̄2 ,
n
i=1 i=1 i=1 i=1
µ n ¶µ n ¶
P P
Xn Xn Xn x i yi Xn
i=1 i=1
Sxy = (xi − x̄)(yi − ȳ) = (xi − x̄)yi = xi yi − = xi yi − nx̄ȳ,
n
i=1 i=1 i=1 i=1
µ n ¶2
P
Xn X n X n yi X n
2 2 i=1
Syy = (yi − ȳ) = (yi − ȳ)yi = yi − = yi2 − nȳ 2 .
n
i=1 i=1 i=1 i=1
Os EMQ de β0 e β1 em termos da notação acima são:

Sxy
β̂0 = ȳ − β̂1 x̄, β̂1 = .
Sxx
Exemplo 6.3.1 Considere os dados do exemplo 6.2.1, apresentado ao inicio desta seção, no qual o
gerente de supermercado estava interessado em estimar as vendas médias semanais de cada supermer-
cado, dado o número de clientes por cada supermercado.
Conforme já visto na gura 6.1, existe indicação da existência de um relacionamento linear entre as
vendas semanais (Y ) e o número de clientes (X ) dos supermercados. Para determinar o modelo de
regressão estimada foram calculados as seguintes quantidades:
n = 20
n
X
xi = 907 + 926 + · · · + 621 = 14.623; x̄ = 731, 15
i=1
Xn
yi = 11, 20 + 11, 05 + · · · + 7, 41 = 176, 11; ȳ = 8, 8055
i=1
Xn
x2i = (907)2 + (926)2 + · · · + (621)2 = 11.306.209
i=1
n
X
yi2 = (11, 20)2 + (11, 05)2 + · · · + (7, 41)2 = 1.602, 0971
i=1
n
X
xi yi = (907)(11, 20) + (11, 05)(926) · · · + (7, 41)(621) = 134.127, 90
i=1
n
X
Sxx = x2i − n(x̄)2 = 11.306.209 − 20(731, 15)2 = 614.603
i=1
n
X
Sxy = xi yi − n(x̄)(ȳ) = 134.127, 90 − 20(8, 8055)(731, 15) = 5.365, 08
i=1
Xn
Syy = yi2 − n(ȳ)2 = 1.609, 0971 − 20(8, 8055) = 51, 3605.
i=1
Os EMQ dos parâmetros do MRLS são:

Sxy 5.365, 08
β̂1 = = = 0, 00873; β̂0 = ȳ − β̂1 x̄ = 8, 8055 − (0, 00873)(731, 15) = 2, 423.
Sxx 614.603
Portanto, a linha de regressão ajustada ou estimada para esses dados são:
ŷ = 2, 423 + 0, 00873x. (6.11)
O gráco desse modelo aparece na gura 6.3, junto com os dados da amostra.
A estimativa do coeciente de regressão β̂1 foi 0,00873. Isto signica que, para cada incremento de
uma unidade de X, estimamos que o valor da média de Y aumenta em 0,00873 unidades. Isto é, para
cada incremento de um cliente, o modelo prevê uma estimação de um aumento nas vendas de 0,00873
mil dólares (ou 8,73 dólares). Portanto, para cada 100 clientes, esperamos que as vendas semanais
aumentem, em média $ 873 dólares.
A estimativa do intercepto β̂0 foi de 2,423 mil dólares. Essa estimativa representa o valor médio Y,
quando X = 0. Como é improvável que o número de clientes seja zero, esse valor pode ser visto como a
proporção média das vendas semanais que variam em relação a fatores diferentes ao número de clientes.
Se o modelo de regressão ajustado aos dados (6.11) for aceitável, pode ser usado para prever os valores
futuros da venda semanal.
Por exemplo, suponha que tem-se interesse em prever as vendas semanais para um supermercado com
600 clientes. No modelo de regressão ajustado em (6.11), é feito X = 600 e tem-se:
ŷ = 2, 423 + (0, 00873)(600) = 7, 661.
A venda semanal de 7,661 mil dólares pode ser interpretada com uma estimação da venda média
semanal verdadeira dos supermercados com X = 600 clientes, ou como uma estimação de uma futura
11
10
Vendas semanais
9
8
7
6
400 500 600 700 800 900 1000
Numero de clientes
Figura 6.3: Gráco de dispersão da venda semanal e o número de clientes, e o modelo de regressão
ajustado: ŷ = 2, 423 + 0, 00873x
venda de um supermercado quando o número de clientes for X = 600. Claro que essas estimações estão
sujeitas a um erro, isto é, é pouco provável que uma venda futura seja exatamente 7661 dólares quando
o número de clientes do supermercado seja 600. Em seções subseqüentes, será visto como utilizar os
intervalos de conança e as previsões para descrever o erro ao fazer estimações a partir do modelo de
regressão.
6.3.2 Propriedades dos estimadores de mínimos quadrados de β0 e β1 e a estimação

de σ 2
Supondo que as suposições do modelo de regressão sejam válidas é possível demonstrar as seguintes
propriedades:
E(β̂1 ) = β1 (6.12)
σ2
V ar(β̂1 ) = . (6.13)
Sxx
E(β̂0 ) = β0 (6.14)
· ¸
1 x̄2
V ar(β̂0 ) = σ 2 + . (6.15)
n Sxx
σ 2 x̄
Cov(β̂0 , β̂1 ) = − (6.16)
Sxx
Para realizarmos inferências com relação aos parâmetros do MRLS β0 e β1 , é necessário estimar o
parâmetro σ 2 que aparece nas expressões de V ar(β̂0 ) e V ar(β̂1 ). O parâmetro σ 2 , que é a variância do
termo aleatório ε no MRLS, reete a variação aleatória ao redor da verdadeira linha de regressão.
Os resíduos, ei = yi − yî são empregados na estimação de σ 2 . A soma de quadrados residuais ou soma
de quadrados dos erros, denotado por SQR é:
n
X n
X
SQR = e2i = (yi − yî )2
i=1 i=1
Pode-se demonstrar que o valor esperado da soma de quadrados dos residuais SQR, é dado por:
E(SQR) = (n − 2)σ 2
Portanto,
SQR
σˆ2 = , (6.17)
n−2
é um estimador não viciado de σ 2 , isto é, E(σˆ2 ) = σ 2 . A quantidade SQR
n−2 é denominado quadrado
médio residual (QM R).
Uma fórmula mais conveniente para o cálculo da SQR é dada por:
SQR = Syy − β̂1 Sxy . (6.18)
Exemplo 6.3.2 Com os dados do exemplo 6.3.1, é feita a estimação da variância σ 2 . Nesse caso,
Syy = 51, 3605, Sxy = 5.365, 08 e β̂1 = 0, 00873.
Portanto, da equação (6.17),

SQR
σˆ2 =
n−2
Syy − β̂1 Sxy
=
n−2
51, 3605 − (0, 00873)(5.365, 08)
= = 0, 2513.
20 − 2
A estimativa de σ (σ̂ 2 = 0, 2513) poderia ser utilizada na estimação da equação (6.13) para ter uma
estimativa da variância do estimador do coeciente de inclinação, e também na equação (6.15) para
estimar a variância do intercepto. As raízes quadradas dos estimadores de variância resultantes se
conhecem como erros padrões estimados da inclinação e do intercepto, respectivamente.
Denição 6.3.1 No modelo de regressão linear simples, o erro padrão estimado da inclinação é
dado por: s
σ̂ 2
EP (βˆ1 ) =
Sxx
e o erro padrão do intercepto é dado por:
s · ¸
1 X̄ 2
EP (βˆ0 ) = σ̂ 2 +
n Sxx
onde σ̂ 2 é calculada com a equação (6.17),

6.3.3 Teste de hipóteses em regressão linear simples

Um parte importante ao avaliar a adequação de um MRLS é o teste de hipóteses sobre os parâmetros do
modelo e a construção de certos intervalos de conança. Nessa seção são apresentados o procedimentos
de teste de hipóteses e métodos para construir intervalos de conança. Para realizar testes é necessário
que a suposição dos erros serem independentes e identicamente distribuídos normalmente com média
zero e variância σ 2 (εi ∼ N ID(0, σ 2 )) seja válida. Na próxima subseção será discutido como a validade
dessa suposição pode ser vericada através da análise de resíduos.
Teste de hipóteses sobre β1 e β0
Suponha que se deseje testar a hipótese de que a inclinação é igual a uma constante representada por
β1,0 . As hipóteses apropriadas são:
H0 : β1 = β1,0 (6.19)
H1 : β1 6= β1,0
onde é considerada uma alternativa bilateral. Mas se os ε ∼ N (0, σ 2 ), de maneira imediata é possível
demonstrar que a variável Yi ∼ N ID(β0 + β1 xi , σ 2 ). Da equação (6.10) observa-se que β̂ é uma com-
binação linear de variáveis aleatórias normais independentes e conseqüentemente, β̂1 ∼ N (β1 ; σ 2 /Sxx ).
Além disso, (n − 2)σ̂ 2 /σ 2 tem distribuição qui-quadrado com n − 2 graus de liberdade e β̂1 é indepen-
dente de σ̂ 2 . Como resultado destas propriedades, a estatística
β̂1 − β1,0
T =p , (6.20)
σ̂ 2 /Sxx
tem distribuição t-Student com n − 2 graus de liberdade sob H0 : β1 = β1,0 . Rejeita-se H0 se
|Tobs | > tα/2, n−2
onde Tobs é calculado a partir da equação (6.20).

Um procedimento similar pode ser utilizado para testar hipóteses sobre o intercepto. Para testar
H0 : β0 = β0,0 (6.21)
H1 : β0 6= β0,0
usamos a estatística
β̂0 − β0,0
T =q (6.22)
2
σ̂ 2 [ n1 + Sx̄xx ]
que tem distribuição t-Student com n − 2 graus de liberdade. Rejeitamos a hipóteses nula se |Tobs | >
tα/2, n−2 .
Um caso particular muito importante das hipóteses dadas em (6.19) é:
H0 : β1 = 0 (6.23)
H1 : β1 6= 0
Esse teste está relacionado com a signicância do modelo de regressão. Deixar de rejeitar H0 : β1 = 0
é equivalente a concluir que não há nenhuma relação linear entre X e Y. Na gura 6.4, é ilustrada essa
Figura 6.4: A hipótese H0 : β1 = 0 não é rejeitada.
situação. Note que esse resultado pode implicar que X é pouco importante para explicar a variação Y
e o melhor estimador de Y para qualquer X é Ŷ = Ȳ (gura 6.4a ), ou que a verdadeira relação entre
X e Y não é linear (gura 6.4b). Como alternativa, se H0 : β1 = 0 é rejeitado, implica que X tem
importância ao explicar a variabilidade de Y (veja a gura 6.5). Contudo, a rejeição de H0 : β1 = 0
pode signicar que o modelo linear é adequado (gura 6.5a), ou que, mesmo havendo um efeito linear
de X , melhores resultados podem ser obtidos com a adição de termos polinomiais de ordem maior em
X (gura 6.5b).
Figura 6.5: A hipótese H0 : β1 = 0 é rejeitada.
Exemplo 6.3.3 Aqui é apresentado o teste de signicância para o MRLS para os dados do exemplo
6.3.1.
As hipóteses são
H0 : β1 = 0
H1 : β1 6= 0.
Com α = 0, 05. Dos exemplos 6.3.1 e 6.3.2, tem-se:
β̂1 = 0, 00873, n = 20 Sxx = 614, 603, σ̂ 2 = 0, 2512,
De modo que a estatística de teste, dada em (6.22), é:
β̂1 0, 00873
Tobs = p =p = 13, 65.
2
σ̂ /Sxx 0, 2513/614.603
Como Tobs = 13, 65 > t0,03,18 = 2, 101, rejeita-se a hipótese H0 : β1 = 0. Portanto, conclui-se ao nível
de signicância de 5%, que existe uma relação linear signicativa entre o número de clientes e as vendas
semanais.
Análise de variância para o teste de H0 : β1 = 0
Para testar a signicância do modelo de regressão ( H0 : β1 = 0,) pode-se utilizar o método conhecido
como análise de variância. O método consiste em decompor a variabilidade da variável resposta em
componentes mais manejáveis. Considere a seguinte identidade:
(Yi − Ȳ ) = (Yi − Ŷi − Ȳ + Ŷi ) (6.24)
Elevando ao quadrado a igualdade e somando as n observações em (6.24) vem:

n
X n
X
(Yi − Ȳ )2 = (Yi − Ŷi − (Ȳ − Ŷi ))2
i=1 i=1
n
X n
X
= (Ŷi − Ȳ )2 + (Yi − Ŷi )2 . (6.25)
i=1 i=1
Os dois componentes do membro direito da equação (6.25) medem, respectivamente, a quantidade de

variabilidade em Yi , explicada pela linha de regressão e variação residual que não é explicada pela
Pn
linha de regressão. É usual chamar a SQR = (Yi − Ŷi )2 de soma de quadrados dos residuais e
i=1
P
n
SQreg = (Ŷi − Ȳ )2 , soma de quadrados da regressão. Portanto, a equação (6.25) pode ser escrita
i=1
como:
Syy = SQreg + SQR (6.26)
P
n
onde Syy = (Ŷi − Ȳ )2 é a soma de quadrados total de Y , representando por SQT. Comparando a
i=1
equação (6.26) com a equação (6.18), observa-se que a soma de quadrados devido à regressão SQreg
é:
SQreg = β̂1 Sxy . (6.27)
Pode-se mostrar que a soma de quadrado total, SQT, tem n − 1 graus de liberdade e, SQR e SQreg
têm respectivamente 1 e n − 2 graus de liberdade.
Também é possível demonstrar que:

· ¸
SQreg
E = σ 2 + β12 Sxx ,
1
· ¸
SQR
E = σ2
n−2
e que SQreg/σ 2 e SQR/σ 2 são variáveis aleatórias qui-quadrado independentes com 1 e n − 2 graus
de liberdade respectivamente. Portanto, se a hipótese nula H0 : β1 = 0 é verdadeira, a estatística
SQreg/1 QM reg
F = = , (6.28)
SQR/(n − 2) QM R
tem distribuição F com 1 e (n − 2) graus de liberdade. Portanto, rejeita-se H0 se F0bs > Fα, 1, n−2 . As
quantidades QM reg = SQreg/1 e QM R = SQR/(n−2) são denominadas respectivamente quadrado
médio devido à regressão e quadrado médio devido aos residuais. O procedimento do teste é
usualmente representado em uma tabela de análise de variância, como mostrada na tabela 6.2 abaixo.
Tabela 6.2: Análise de variância para o teste de H0 : β1 = 0

Fonte de Soma de Graus de Quadrado
variação Quadrados Liberdade Médio F
Regressão SQreg = β̂1 Sxy 1 QM reg QM reg/QM R
Residual SQR = SQT − SQreg n−2 QM R
Total SQT n−1
Exemplo 6.3.4 A seguir é apresentado o procedimento de análise de variância para testar se de fato
existe relação linear entre o número de clientes (X) e as vendas semanais (Y), no modelo proposto
para os dados do exemplo 6.3.1. (Use α = 0, 05)
Relembre que Syy = 51, 3605, β̂1 = 0, 00873, Sxy = 5.365, 08 e n = 20. A soma de quadrados da
regressão é
SQreg = β̂1 Sxy = (0, 00873)(5.365, 08) = 46, 8371
enquanto a soma de quadrados dos residuais é:
SQR = SQT − β̂1 Sxy = 51, 3605 − 46, 8371 = 4, 5234
Na tabela 6.3, é apresentado um resumo da análise de variância para testar H0 : β1 = 0. Nesse

caso, a estatística de teste é F0bs = QM reg/QM R = 46, 837148/0, 2512 = 186, 4536. Como Fobs =
186, 4536 > F0,05,1,18 = 4, 41 rejeita-se H0 , ao nível de signicância de 5%.
Note, que o procedimento de análise de variância para testar a signicância da regressão é equivalente
o teste t dada no início desta seção. Portanto, qualquer desses procedimentos conduz às mesmas
conclusões. Não é difícil demonstrar que a estatística do teste T da equação (6.20), com β1,0 = 0,
β̂1
T =p , (6.29)
σ̂ 2 /Sxx
Tabela 6.3: Análise de variância para o teste de H0 : β1 = 0 do exemplo 6.3.1

Fonte de Soma de Graus de Quadrado
variação Quadrados Liberdade Médio F
Regressão 46, 8371 1 46, 8371 186,4536
Residual 4, 5234 18 0, 2513
Total 51, 3605 19
é equivalente ao teste F da equação (6.28). Elevando ao quadrado ambos membros da equação (6.29)
e considerando que σ̂ 2 = QM R, tem-se que:
β̂12 β̂1 Sxy QM reg

T2 = 2
= = , (6.30)
σ̂ /Sxx QM R QM R
Observe que o termo T 2 da equação (6.30) é idêntico à F da equação 6.28. É verdade, em geral, que
o quadrado de uma variável aleatória t-Student com ν graus de liberdade é uma variável aleatória F,
com um e ν graus de liberdade no numerador e denominador , respectivamente. Portanto, o teste
que utiliza T é equivalente ao teste baseado em F. Mas, o teste t é um pouco mais exível , pois que
permite testar hipóteses unilaterais, enquanto que o teste F é restrito ao teste bilateral.
6.3.4 Intervalos de conança para β1 e β0

Além das estimativas pontuais para a inclinação e o intercepto da linha de regressão, é possível obter
estimações por intervalos de conança para esses parâmetros. O comprimento desses intervalos é uma
medida da qualidade total da linha de regressão. Se para o MRLS é válida a suposição de que os
εi ∼ N ID(0, σ 2 ), então
s
p 1 x̄2
(β̂1 − β1 )/ QM R/Sxx e (β̂0 − β0 )/ QM R[ + ]
n Sxx
são variáveis aleatórias com distribuição t-Student com n−2 graus de liberdade. Isso conduz à seguinte
denição de intervalo de 100(1 − α)% de conança para a inclinação β1 :
Ã r r !
QM R QM R
IC(β1 ; 1 − α) = β̂1 − t α2 , n−2 ; β̂1 + t α2 , n−2 (6.31)
Sxx Sxx
De modo similar, um intervalo de 100(1 − α)% de conança para a inclinação β0 é dado por:
 s s 
1 x̄2 1 2
x̄ 
IC(β0 ; 1 − α) = β̂0 − t α2 , n−2 QM R[ + ] ; β̂0 + t α2 , n−2 QM R[ + ] (6.32)
n Sxx n Sxx
Exemplo 6.3.5 A seguir é obtido um intervalo de 95% de conança para a inclinação do MRLS com
os dados do exemplo 6.3.1,
Relembre que n = 20, β̂1 = 0, 00873, Sxx = 614, 603 e QM R = 0, 2513. Para 1 − α = 0, 95, tem-se
t0,025, 18 = 2, 101. Então da equação (6.31), vem:
Ã r r !
QM R QM R
IC(β1 ; 0, 95) = β̂1 − t0,025,18 ; β̂1 + t0,025,18
Sxx Sxx
Ã r r !
0, 2513 0, 2513
= 0, 00873 − 2, 101 ; 0, 00873 + 2, 101
614.603 614.603
= (0, 00873 − 0, 00134; 0, 00873 + 0, 00134)
Ou seja,
IC(β1 ; 0, 95) = (0, 00739; 0, 01007).
6.3.5 Intervalo de conança para a resposta média

Também é possível construir intervalos de conança para a resposta média correspondente a um valor
especicado da variável explicativa, que representaremos por x0 . Ou seja, o interesse consiste em
estimar um intervalo de conança para E(Y |X = x0 ) = µY |x0 = β0 + β1 x0 . Um estimador pontual de
µY |x0 pode ser obtido a partir do modelo de regressão ajustado
µ̂Y |xo = Ŷ = β̂0 + β̂1 x0 .
Considerando que a suposição de que os εi ∼ N ID(0, σ 2 ) é válida, pode-se demonstrar que E(µ̂Y |x0 ) =
µ̂Y |x0 . A variância de µ̂Y |xo é:
· ¸
2 1 (x0 − x̄)2
V ar(µ̂Y |xo ) = σ + .
n Sxx
Além disso, µ̂Y |xo tem distribuição normal. Já que β̂0 e β̂1 são normalmente distribuídos. Também
podemos demonstrar que a variável aleatória
µ̂Y |xo − µY |xo
T =r h i
2
QM R n1 + (x0S−x̄)
xx
tem distribuição t-Student com n − 2 graus de liberdade. Portanto, um intervalo de 100(1 − α)% de
conança para µY |x0 é dado
 s s 
1 (x0 − x̄)2 1 (x0 −x̄)2
IC(µ̂Y |x ; 1 − α) = µ̂Y |xo − t α2 , n−2 QM R[ + ]; µ̂Y |xo + t α2 , n−2 QM R[ + ]
n Sxx n Sxx
(6.33)
Observe que o comprimento de intervalo de conança para µ̂Y |x é mínimo quando x0 = x̄ e aumenta.
à medida que |x0 − x̄| aumenta.
Exemplo 6.3.6 Para o problema dos supermercados do exemplo 6.3.1, suponha que tem-se interesse
em construir um intervalo de 95% de conança da venda, média, semanal para todos supermercados
com 600 clientes.
No modelo ajustado µ̂Y |x0 = 2, 423 + 0, 00873x0 . Para x0 = 600, obtém-se µ̂Y |x0 = 7, 661. Também,
x̄ = 731, 15, QM R = 0, 2513, Sxx = 614.603, n = 20 e 1 − α = 0, 95 ⇒ t0,05,18 = 2, 101.
Substituindo esses valores na equação (6.33), obtém-se o seguinte intervalo de conança:
IC(µY |x0 ; 0, 95) =

Ã r s · ¸!
1 (600 − 731, 15)2 1 (600 − 731, 15)2
= 7, 661 − 2, 101 0, 2513[ + ]; 7, 661 + 2, 101 0, 2513 +
20 614.603 20 614.603
= (7, 661 − 0, 292; 7, 661 + 0, 292)
= (7, 369; 7, 935).
Portanto, a partir do intervalo construído, conclui-se, com 95% de conança, que as vendas médias
semanais poderiam variar de 7.369 dólares a 7.953 dólares para supermercados com 600 clientes.
Ao repetir os cálculos anteriores para valores diferentes de x0 , obtém-se os limites de conança para
cada µY |x0 . Na gura 6.6, é mostrado o diagrama de dispersão com o modelo de regressão ajustado
e os correspondentes limites de conança de 95% (bandas de conança). Observe que o comprimento
do intervalo de conança para µY |x0 aumenta a medida que |x0 − x̄| aumenta.
Figura 6.6: Diagrama de dispersão dos dados dos supermercados do exemplo 6.3.1, conjuntamente com
a linha de regressão ajustada e as bandas de conança do 95% para µY |x0 .
6.3.6 Previsão de novas observações

Uma aplicação muito importante de um modelo de regressão é a previsão de novas ou futuras obser-
vações de Y, (Y0 ) correspondente a um dado valor da variável explicativa X, x0 , então
Yˆ0 = β̂0 + β̂1 x0 (6.34)

é o melhor estimador pontual de Y0 .

A nova observação Y0 é independente das observações usadas para o desenvolvimento do modelo de
regressão. Portanto, o intervalo de conança para µY |x0 da equação (6.33) é inadequado nesta situação,
pois esse intervalo se baseia somente nos dados utilizados para ajustar o modelo de regressão. O
intervalo de conança ao redor de µY |x0 se refere à resposta média em x0 (um parâmetro populacional),
e não a observações futuras.
Seja Y0 a observação futura quando X = x0 e Yˆ0 , dado pela equação (6.34), o estimador pontual de
Y0 . Note que o erro de previsão
Ψ = Y0 − Yˆ0
é uma variável aleatória com distribuição normal, com média zero e variância
V ar(Ψ) = V ar(Y0 − Yˆ0 )

· ¸
2 1 (x0 − x̄)2
= σ 1+ +
n Sxx
dado que Y0 é independente de Ŷ0 . Se é usado QM R como estimador de σ 2 , pode-se demonstrar que
Y0 − Ŷ0
T =r h i
(x0 −x̄)2
QM R 1 + n1 + Sxx
tem distribuição t-Student com n − 2 graus de liberdade. Portanto um intervalo de 100(1 − α)% de
conança para uma futura observação é dado por:
 s s 
1 (x − x̄)2 1 (x − x̄)2
0 0
IC(Y0 ; 1 − α) = Ŷ − t α2 , n−2 QM R[1 + + ]; Ŷ + t α2 , n−2 QM R[1 + + ]
n Sxx n Sxx
(6.35)
Observe que o comprimento do intervalo de conança para a nova observação é mínimo quando x0 = x̄
e aumenta a medida que |x0 − x̄| aumenta. Ao comparar as equações (6.35) e (6.33) observa-se que o
comprimento do intervalo de predição em que X = x0 é sempre maior que o comprimento do intervalo
de conança para a resposta média obtido quando X = x0 . Esse resultado é conseqüência do fato
de que o intervalo de previsão depende tanto do erro associado ao ajuste do modelo quanto do erro
associado à observação futura.
Exemplo 6.3.7 Para ilustrar a construção de um intervalo de previsão, considere os dados do exem-
plo 6.3.1 e suponha agora, tem-se interesse em encontrar um intervalo de previsão de 95% das vendas
semanais de um supermercado com 600 clientes.
Considerando a equação (6.35) e os dados do exemplo 6.3.6, Ŷ = 7, 661 e o intervalo de predição é:

Ã r
1 (600 − 731, 15)2
IC(Y0 ; 0, 95) = 7, 661 − 2, 101 0, 2513[1 + + ];
20 614.603
s · ¸!
1 (600 − 731, 15)2
7, 661 + 2, 101 0, 2513 1 + +
20 614.603
= (7, 661 − 1, 084; 7, 661 + 1, 084)
= (6, 577; 8, 745).
Portanto, a partir do intervalo construído, conclui-se, com 95% de conança, que as vendas médias
semanais poderiam variar de 6.577 dólares a 8.745 dólares para um supermercado que tem 600 clientes.
Ao repetir os cálculos anteriores para diferentes valores de x0 , podemos obter os intervalos de previsão
de 95%, que estão representados na gura 6.7. Observe que esse gráco também apresenta os limites
de conança do 95% para µY |x0 , calculados com os dados do exemplo 6.3.1. Isto ilustra que os limites
de previsão sempre são mais amplos que os limites de conança da µY |x0 .
Figura 6.7: Digrama de dispersão dos dados dos supermercados do exemplo 6.3.1, conjuntamente com
a linha de regressão ajustada e as bandas de conança do 95% para µY |x0 (CI) e Y0 (ICP).
6.3.7 Estudo da adequação do modelo de regressão

O ajuste de um modelo de regressão requer várias suposições. A estimação dos parâmetros do modelo
requer a suposição de que os erros são variáveis aleatórias não correlacionadas com média zero e
variância constante. A construção de intervalos de conança e testes de hipóteses requer que os erros
sejam normalmente distribuídos. Além disso, é assumindo que a ordem do modelo é correta; isto é, se
ajustamos um modelo de regressão linear simples, considera-se que o fenômeno realmente se comporta
dessa forma.
O pesquisador deve sempre questionar a validade dessas suposições e realizar análises para vericar
a adequação do modelo adotado. Nesta subseção serão discutidos métodos úteis para o estudo da
adequação do modelo de regressão.
Análise residual
Os resíduos de um modelo de regressão são denidos como
ei = yi − ŷi , i = 1, . . . , n
onde yi é uma observação real de Y e ŷi é o valor correspondente estimado através do modelo de
regressão. Freqüentemente a análise de resíduos é útil para vericar a suposição de que os erros são
não correlacionados e têm uma distribuição que é aproximadamente normal com média zero e variância
constante, assim como para determinar se é necessária a adição de termos adicionais ao modelo.
A análise da adequação do modelo será feita pelo gráco de resíduos. Como uma vericação aproxi-
mada da normalidade, pode-se construir os histogramas de freqüências dos resíduos ou um gráco de
probabilidade normal dos resíduos. Muitos programas computacionais produzem grácos de probabili-
dade normal dos resíduos (por exemplo, Minitab), já que, os tamanhos das amostra em um modelo de
regressão geralmente são pequenos para que os histogramas sejam de utilidade por isso que o gráco
de probabilidade é o método preferido. Além desses métodos grácos, existem procedimentos de testes
para vericar a normalidade, como por exemplo o teste de aderência, teste de Shapiro-Wilk, teste de
Kolgomorov, entre outras.
Também é possível padronizar os resíduos mediante o cálculo de:
ei
di = √ , i = 1, . . . , n
QM R
Se os erros tem distribuição normal, então aproximadamente 95% dos resíduos padronizados devem
pertencer ao intervalo (−2, 2). Os resíduos fora desse intervalo podem indicar a presença de um valor
atípico ("outlier"). Isto é, uma observação que não é comum do restante da massa de dados. Na
literatura, foram propostas várias regras para descartar valores atípicos. Porém , muitas vezes, os
"outliers"fornecem informações importantes sobre situações pouco usuais que são de interesse para o
pesquisador e não devem ser descartadas. Para um estudo de valores atípicos, veja Montgomery e
Peck, (1992).
Figura 6.8: Padrões para grácos de resíduos: (a) satisfatório, (b) funil, (c) laço duplo, (d) não linear.
Geralmente é útil fazer um gráco dos resíduos (i) com uma seqüencia no tempo (se é conhecida); (ii)
em relação aos ŷ e (iii) em função da variável independente x. Usualmente, esses grácos tem aspecto
similar aos quatro padrões gerais que aparecem na gura 6.8. O padrão (a) dessa gura representa a
situação ideal, enquanto que os padrões (b), (c) e (d) representam anomalias. Se os resíduos aparecem
como em (b), a variância das observações pode aumentar com o tempo ou com a magnitude de Y ou
X . Usualmente uma transformação nos dados sobre a resposta Y elimina este problema. Entre as
√
transformações mais usadas para estabilizar a variância se inclui o emprego de: y , ln y ou 1/y. (veja
Montgomery e Peck (1992) para mais detalhes). Se um gráco dos resíduos com o tempo tem o aspecto
da gura 6.8b, então a variância das observações aumenta com o tempo. Os grácos dos resíduos com
ŷ ou com x, semelhantes (c) também indicam uma desigualdade da variância. Grácos dos resíduos
semelhantes ao de gura 6.8d, indicam que modelo é inadequado, isto é, que é necessário adicionar ao
modelo termos de ordem superior, considerar uma transformação da variável x ou da variável y (ou
ambas ), ou considerar outras variáveis explicativas.
Exemplo 6.3.8 A seguir é apresentado a análise residual para o modelo de regressão ajustado os
dados de exemplo 6.3.1.
Na tabela 6.4, são apresentados os valores observados e ajustados de Y para cada valor de x que
aparece no conjunto aos dados . Esses valores foram obtidos com o aplicativo MINITAB.
Tabela 6.4: Dados do exemplo 6.3.1, valores ajustados, resíduos e resíduos padronizados,
Supermercado Número Vendas Valor Resíduo Resíduo padronizado
√
de clientes Semanais Ajustado (ŷi ) ei = yi − ŷi di = ei / QM R
1 907 11,20 10,3356 0,86438 1,72804
2 926 11,05 10,5015 0,54852 1,09658
3 506 6,84 6,8350 0,00499 0,00997
4 741 9,21 8,8865 0,32351 0,64675
5 789 9,42 9,3055 0,11449 0,22888
6 889 10,08 10,1785 -0,09848 -0,19688
7 874 9,45 10,0475 -0,59754 -1,19457
8 510 6,73 6,8699 -0,13993 -0,27974
9 529 7,24 7,0358 0,20421 0,40824
10 420 6,12 6,0843 0,03574 0,07145
11 679 7,63 8,3452 -0,71525 -1,42989
12 872 9,43 10,0301 -0,60008 -1,19965
13 924 9,46 10,4840 -1,02402 -2,04718
14 607 7,64 7,7167 -0,07671 -0,15335
15 452 6,92 6,3636 0,55639 1,11232
16 729 8,85 8,7817 0,06827 0,13648
17 794 9,33 9,3492 -0,01916 -0,03831
18 844 10,23 9,7856 0,44435 0,88833
19 1010 11,77 11,2348 0,53523 1,07000
20 621 7,41 7,8389 -0,42892 -0,85749
Na gura 6.9, são apresentado os grácos da análise residual do exemplo 6.3.1. A gura 6.9a mostra um
gráco de probabilidade normal dos resíduos. Como esses resíduos estão localizados aproximadamente
ao longo de uma linha reta, conclui-se que não há uma forte indicação de que a suposição de normalidade
dos erros não seja adequada. Na gura 6.9b, mostra o gráco de resíduos com os valores ajustados
(ŷi ) , enquanto na gura 6.9c, representa-se número de clientes (xi ). Nenhum desses grácos fornecem
indicação de algum problema sério quanto à adequação do modelo. Finalmente, na gura 6.9d é
representado o gráco de resíduos com os valores ajustados. O padrão do gráco é semelhante ao
da gura 6.9b. Mas, a gura 6.9d, mostra uma observação (o supermercado 13)os resíduos foram do
intervalo (−2, 2) o qual poderia ser considerado como um valor atípico.
Figura 6.9: Gráco de resíduos (ei ) para o exemplo 6.3.1 : (a) de probabilidade normal, (b) ei contra
ŷi (c) ei contra xi e (d) resíduos padronizados (di ) contra ŷi .
Coeciente de determinação (R2 )
A quantidade:
SQreg SQR
R2 = =1− (6.36)
SQT SQT
recebe o nome de coeciente de determinação que é usado para julgar a adequação do modelo de
regressão. Mas, no caso em que as variáveis X e Y sejam variáveis aleatórias distribuídas de maneira
conjunta, R2 é o quadrado do coeciente de correlação entre X e Y. Da identidade da análise de
variância, dadas em (6.25)-(6.26), temos que 0 ≤ R2 ≤ 1. Daí, o coeciente de determinação pode ser
interpretado como a proporção da variabilidade presente nas observações da variável resposta Y, que
é explicada pela variável independente X no modelo de regressão. A proporção não explicada pela
variável regressora X, recebe o nome de coeciente de não determinação e é dada por 1 − R2 .
Exemplo 6.3.9 Para os dados dos supermercados do exemplo 6.3.1, determinar R2 .

Da equação (6.36) tem-se:

SQreg 46, 8371
R2 = = = 0, 912
SQT 51, 3605
Esse resultado signica que o modelo ajustado explicou 91,2% da variação na variável resposta Y
(vendas semanais). Isto é, 91,2% da variabilidade de Y é explicada pela variável regressora X (número
de clientes).
A estatística R2 deve ser empregada com cuidado, já que sempre é possível fazer R2 igual a um
mediante a adição ao modelo de um número suciente de termos. Por exemplo, podemos obter um
ajuste "perfeito"para os n pontos com um polinômio de grau n − 1. Além disso, R2 sempre aumenta
por meio da adição de novas variáveis explicativas, o que não implica, necessariamente em que o novo
modelo seja melhor que o anterior. Ao menos que a soma de quadrados dos residuais desse novo modelo
esteja diminuído de uma quantidade igual ou menor que o quadrado médio residual do modelo original.
Dessa forma, o novo modelo terá o quadrado médio do residual maior que o anterior, devido à perda
de graus de liberdade no erro. Portanto, o novo modelo será pior que o anterior.
Existem várias idéias errôneas quanto a R2 . Em geral, R2 não mede a magnitude da inclinação da
reta de regressão. Um grande valor de R2 não implica em um valor alto para inclinação da reta de
regressão. Por outro lado, R2 não mede a adequação do modelo, já que, isto pode ser inacionado de
maneira articial com a adição ao modelo de termos polinomiais em X de maior ordem. A magnitude
de R2 pode ser grande mesmo que X e Y estejam relacionados de forma não linear. Por exemplo, o R2
para a equação de regressão da gura 6.5b é relativamente grande, mesmo que a aproximação linear
seja pobre. Finalmente, mesmo que R2 seja grande, não, implica necessariamente, que o modelo de
regressão proporcione previsões precisas de observações futuras.
6.4 Análise de correlação

Conforme foi mencionado no inicio deste capítulo a análise de regressão é usada quando tem-se interesse
em estabelecer o tipo de relação que há entre uma variável dependente e uma ou mais variáveis
independentes. Mas, quando tem-se interesse estabelecer o grau dessa relação é usada a análise de
correlação.
No desenvolvimento da análise de regressão foi suposto que X seja uma variável controlada (ou xa) e
medida com erro desprezível, e que Y é uma variável aleatória. Muitas aplicações da análise de regressão
envolvem situações em que tanto X quanto Y são variáveis aleatórias. Neste casos, a suposição usual
é que as observações (Xi , Yi ), i = 1, . . . , n são variáveis aleatórias distribuídas de maneira conjunta
obtidas da distribuição f (x, y).
Por exemplo, suponha que se deseja desenvolver um modelo de regressão que relacione a resistência ao
corte dos pontos de soldadura com o diâmetro dos mesmos. Nesse exemplo, não é possível controlar o
diâmetro de soldadura. O que pode ser feito é selecionar ao acaso n pontos de soldadura e observar o
diâmetro (Xi ) e a resistência ao corte (Yi ) de cada um deles. Portanto, (Xi , Yi ) são variáveis aleatórias
distribuídas de maneira conjunta.
Suponha que a distribuição conjunta de Xi e Yi tenha uma distribuição normal bivariada cuja função
de densidade é dada por
( "µ ¶ µ ¶ µ ¶µ ¶#)
1 1 x − µ1 2 y − µ2 2 x − µ1 y − µ2
f (x, y) = p exp + − 2ρ
2πσ1 σ2 1 − ρ2 2(1 − ρ2 ) σ1 σ2 σ1 σ2
(6.37)
onde µ1 e σ12 são a média e variância de X e µ2 e σ22 são a média e variância de Y e, ρ é coeciente de
correlação entre X e Y. O coeciente de correlação é denido como:
E[(X − µ1 )(Y − µ1 )]
ρ= (6.38)
σ1 σ2
O coeciente de correlação é uma quantidade adimensional que mede a força da associação linear entre
duas variáveis aleatórias.
De (6.37) é possível demonstrar que a função de densidade condicional de Y para um valor dado X = x
é dado por  Ã !2 
1  1 yi − β0 − β1 x 
f (y|x) = √ exp − (6.39)
2πσY |x  2 σY2 |x 
onde
σ2
β0 = µ2 − µ1 ρ , (6.40)
σ1
σ2
β1 = ρ (6.41)
σ1
e a variância da distribuição condicional de Y para um X = x é dado por:
σY |x = σ22 (1 − ρ2 ). (6.42)
Isto é, a distribuição condicional de Y dado X = x é normal com média
E(Y |X = x) = β0 + β1 x (6.43)
e variância σY2 |x . Portanto, a média da distribuição condicional dado X = x (E(Y |X = x) é o modelo
de regressão linear simples. Além disso, existe uma relação entre o coeciente de correlação ρ e a
inclinação β1 . Na equação (6.41), observe que se ρ = 0, existe β1 = 0, que implica na não existência
de regressão de Y sobre X. Isto é, o conhecimento de X não é suciente para prever Y.
É possível demonstrar que os estimadores de máxima verossimilhança dos parâmetros β0 e β1 são:
β0 = Ȳ − β̂1 X̄ (6.44)
e Pn
Yi (Xi − X̄) SXY
β1 = Pi=1n 2
= (6.45)
i=1 (Xi − X̄) SXX
Note que os estimadores do intercepto e da inclinação dados acima são idênticos as equações (6,9)
e (6.10) respectivamente, os quais foram obtidos pelo método de mínimos quadrados onde se supõe
que a variável X é uma variável controlável. Isto é, o modelo de regressão Y e X com distribuição
conjunta normal bivariada, é equivalente ao modelo na qual X não é uma variável aleatória. Portanto,
os métodos já apresentados na seção anterior podem ser empregados para análise de modelos onde X
e Y são variáveis aleatórias com distribuição normal bivariada.
É possível realizar inferência sobre o coeciente de correlação ρ desse modelo. Um estimador de ρ é o
coeciente de correlação amostral, representado por r e denido por
Pn
Yi (Xi − X̄)
i=1 SXY
r=s =√ (6.46)
Pn P
n SXX SY Y
(Xi − X̄) 2 (Yi − Ȳ ) 2
i=1 i=1
Das equações (6.45) e (6.46) é fácil demonstrar que:

µ ¶1/2
SY Y
β̂1 = r. (6.47)
SXX
Portanto, a inclinação β̂1 é igual ao coeciente de correlação amostral r multiplicado por um fator
de escala que é a raiz quadrada do quociente entre uma medida da dispersão dos valores de Y (SY Y )
e a medida equivalente da dispersão dos valores de X (SXX ). No entanto, apesar de β̂1 e r estarem
diretamente relacionados, eles fornecem diferentes tipos de informação. O coeciente de correlação
amostral r mede a força da associação linear entre X e Y, enquanto β̂1 mede a alteração esperada em
Y quando X sofre uma variação unitária. No caso em que X não é uma variável aleatória, o coeciente
de correlação r deixa de ter sentido, uma vez que a magnitude de r depende da escolha feita para o
espaçamento dos valores de X. Da equação (6.47), é possível demonstrar que:
SXX β̂1 SXY SQreg

r2 = β̂12 = = = R2 .
SY Y SY Y SQT
onde R2 é o coeciente de determinação denido na equação (6.36). Isto é o coeciente de determinação

R2 é igual ao quadrado do coeciente de correlação amostral entre X e Y.
Em análise de correlação, freqüentemente, o interesse testar se o coeciente de correlação é igual a zero,
já que, ρ = 0 signica ausência de relacionamento linear entre Y e X. As hipóteses a serem testadas
são:
H0 : ρ = 0 (6.48)
H1 : ρ 6= 0.
A estatística de teste apropriada é √

r n−2
T = √ (6.49)
1 − r2
que tem distribuição t-Student com n − 2 graus de liberdade se H0 : ρ = 0 é verdadeira. Logo, a
hipótese nula deverá ser rejeitada se |Tobs | ≤ tα/2, n−2 . Esse teste é equivalente ao teste de hipóteses
H0 : β1 = 0, apresentado na seção anterior.
O procedimento para o teste das hipóteses
H0 : ρ = ρ0 (6.50)
H1 : ρ 6= ρ0 .
onde ρ0 6= 0, é um pouco mais complicado. Para amostras de tamanho moderado grande (n ≥ 30), a
estatística
1 1+r
Zr = arctanh r = ln (6.51)
2 1−r
tem distribuição aproximadamente normal com média
1 1+ρ
µZr = arctanh ρ = ln
2 1−ρ
e variância
σZ2 r = (n − 3)−1 .
Portanto, para testar a hipóteses H0 : ρ = 0 a estatística de teste apropriada é:
Z = (arctanh r − arctanh ρ0 ) (n − 3)1/2 . (6.52)
Se H0 : ρ = ρ0 é verdadeira, a estatística Z tem, aproximadamente, distribuição normal padrão.

Portanto, H0 deverá ser rejeitada se |Zobs | ≥ zα/2 .
Além disso, é possível construir um intervalo aproximado de 100(1−α)% de conança para o coeciente
de correlação ρ, que é dado por:
µ · ¸ · ¸¶
zα/2 zα/2
IC(ρ; 1 − α) = tanh arctanh r − √ ; tanh arctanh r + √ , (6.53)
n−3 n−3
onde
ew − e−w
tanhw = .
ew + e−w
Exemplo 6.4.1 Suponha que se tenha interesse em medir a força da relação linear de dois produtos
diferentes com relação ao preço em várias cidades do mundo. O preço de uma caixa de suco com seis
latas de uma certa marca (X) e de uma libra de frango (Y ) foram determinados em um supermercado
localizado em uma amostra aleatória de nove cidades. Supondo que o preço da caixa de suco e de
uma libra de frango são variáveis aleatórias com distribuição conjunta normal bivariada verique se
há relação linear entre X e Y . Os resultados são apresentados na tabela 6.5:
Tabela 6.5: Preço (em dólares) de uma caixa de suco e de uma libra de frango em nove cidades.
Caixa com seis Uma libra
Cidade sucos (X) de frango (Y )
Frankfurt 3,27 3,06
Hong Kong 2,22 2,34
Londres 2,28 2,27
Manila 3,04 1,51
México 2,33 1,87
Nova York 2,69 1,65
París 4,07 3,09
Sidney 2,78 2,36
Tokyo 5,97 4,85
Dos dados da tabela 6.5, são obtidos os valores seguintes:

n
X n
X n
X
n = 9; Xi = 28, 65; X̄ = 3, 183; Xi2 = 28, 65 = 102, 66; SXX = 11, 4594; Yi = 23, 00;
i=1 i=1 i=1
n
X n
X
Ȳ = 2, 5566; Yi2 = 67, 132; SY Y = 8, 3522; Xi Yi = 81, 854; SXY = 8, 6437
i=1 i=1
Com a equação (6.46)

8, 6437
r=p = 0, 883.
(11, 4594)(8, 3522)
0 coeciente de correlação r = 0, 883, entre o preço de uma caixa de sucos e de uma libra de frango
indica que há uma forte associação entre essas variáveis. Um maior preço da caixa de suco está
associado fortemente com um preço maior de uma libra de frango. Para vericar se essa associação é
signicativa, testa-se as hipóteses seguintes:
H0 : ρ = 0 (não relação linear entre X e Y )

H1 : ρ 6= 0 (há relação linear entre X e Y )
O valor calculado para a estatística do teste foi

√ √
r n−2 0, 883 9 − 2
Tobs = √ =p = 4, 98.
1 − r2 1 − (0, 883)2
Para α = 0, 05, tem-se que t0,025,7 = 2, 365 < Tobs = 4, 98, logo, rejeita-se H0 : ρ = 0 ao nível de
signicância de α = 5%. Isto é, há evidência estatística da existência de um relacionamento linear
signicativa entre o preços de suco e frango nas diferentes cidades.
6.5 Exercícios
1. Uma determinada peça que compõe aparelhos de ar condicionado tem sido produzida periodi-
camente em lotes de tamanhos variados. O fabricante deseja estudar a relação existente entre o
tamanho do lote (X) e o número de horas de trabalho necessárias para a produção do lote (Y ).
Nos últimos 6 meses, 25 lotes foram produzidos observando-se os valores apresentados na tabela
6.6.
Tabela 6.6: Tamanho do lote e Número de horas de trabalho de 25 lotes.

Tamanho do Número de horas de Tamanho do Número de horas de
Lote Lote (X) Trabalho (Y ) Lote Lote (X) Trabalho (Y )
1 80 399 14 20 113
2 30 121 15 110 435
3 50 221 16 100 420
4 90 376 17 30 212
5 70 361 18 50 268
6 60 224 19 90 377
7 120 224 20 110 421
8 80 352 21 30 273
9 100 353 22 90 468
10 50 157 23 40 244
11 40 160 24 80 342
12 70 252 25 70 323
13 90 389
(a) Construa o diagrama de dispersão e interprete-o.

(b) Supondo que X e Y tenha distribuição conjunta normal bivariada, estime o coeciente de
correlação e verique estatísticamente se existe relação linear entre as variáveis X e Y. (Use
α = 0, 05)
(c) Ajuste os dados a uma reta de regressão para a relação entre as variáveis X e Y.
(d) Considerando a reta regressão ajustada dada no item (c). Estime o número médio de horas
de trabalho para produzir um lote de 70 peças. Obtenha também uma estimativa por
intervalo, de 98% de conança.
2. É esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa relação
uma nutricionista selecionou 16 mulheres entre 40 e 79 anos, observou em cada uma delas a idade
(X) e massa muscular (Y ).
(a) Construa um diagrama de dispersão e interprete-o.

(b) Ajuste uma linha de regressão para a relação entre as variáveis massa muscular (Y ) e idade
(X).
(c) Faça uma análise residual e verique as suposições do modelo de regressão linear.
(d) Verique estatísticamente se há relação entre X e Y. Use α = 0, 05
(e) Considerando a reta ajustada dada no item (b), estime a massa muscular média de mulheres
com 50 anos idade.
Tabela 6.7: Massa muscular e idade de 16 mulheres

Massa muscular Idade Massa muscular Idade
82 71 65 76
91 91 84 65
100 43 116 45
68 67 76 58
87 56 97 45
73 73 100 53
78 68 105 49
80 56 77 78
(f) Estimar mediante um intervalo, um intervalo de 90% de conança, a , massa muscular de

uma mulher com 50 anos de idade.
(g) Supondo que X e Y tenha distribuição conjunta normal bivariada, estime o coeciente de
correlação.
(h) Obtenha um intervalo de 95% de conança para o coeciente de correlação de X e Y. O que
você pode dizer ao respeito do item (d).
3. Um experimento foi feito com a nalidade de estudar a relação existente entre a densidade do
óleo de milho (em gr/L) e temperatura de ebulição ( em graus centígrados). Para uma amostra
aleatória de 10 observações foram obtidos os seguintes resultados.
Densidade (Y ) 910 915 867 908 902 875 889 899 878 869
Temperatura (X) 30 25 100 30 40 80 60 40 75 90
(a) Ajuste os dados a um modelo de regressão linear simples e interprete as estimativas dos
parâmetros do modelo.
(b) Efetue a análise de variância e expresse suas conclusões com um nível de signicância de
5%.
(c) Calcule e interprete o coeciente de determinação e não determinação do modelo.
(d) Estimar, mediante um intervalo de 90% de conança, a densidade média de óleo de milho,
a uma temperatura de 60o C. Interprete o resultado.
(e) Estimar, mediante um intervalo de 90% de conança, a densidade de óleo de milho, a
uma temperatura de 60o C . Interprete seus resultados ? (Você poderia dizer porque o
comprimento deste intervalo é maior que o item (d)).
(f) Com nível de signicância de 5%, você pode armar, quando a temperatura é 0o C, que a
densidade média do óleo de milho é superior a 920 gr/L?
(g) Provar com α = 0, 01, se existe evidência estatística que permite armar que a cada incre-
mento da temperatura em 1o C, a densidade média de óleo de milho decresce em média
mais de 0,6 gr/L.
(h) Estimar mediante um intervalo de 90% de conança a variância da distribuição de densidades
de óleo de milho, para uma temperatura de 45o C .
(i) Para α = 0, 05, pode-se armar que a densidade média de óleo de milho é superior 900 gr/L,
quando a temperatura é 60o C?
(j) Supondo que Y e X tenha distribuição normal bivariada: (i) estime e interprete o coeciente
de correlação entre Y e X. (ii) Pode-se concluir para α = 0, 05, que a correlação existente
entre a densidade do óleo de milho e a temperatura é diferente de -0,9 ?
4. O gerente de comercialização de uma cadeia de supermercados gostaria de determinar o efeito

do espaço en estantes sobre as vendas de ração para animais de estimação. Selecionou-se uma
amostra aleatória de 12 supermercados de igual tamanho e os resultados são apresentados a
seguir:
Tabela 6.8: Espaço em estantes e vendas de ração para animais de estimação em 12 supermercados
Espaço em estantes (X ) Vendas semanais,(Y )
Loja (pés) (centos de dólares)
1 5 1,6
2 5 2,2
3 5 1,4
4 10 1,9
5 10 2,4
6 10 2,6
7 15 2,3
8 15 2,7
9 15 2,8
10 20 2,6
11 20 2,9
12 20 3,1
(a) Construa o diagrama de dispersão e interprete-o.

(b) Supondo que existe uma relação linear entre X e Y, obtenha a linha de regressão ajustada.
E interprete as estimativas do parâmetro.
(c) Faça um estudo da adequação do modelo ajustado.
(d) Ao nível de signicância de 5%, verique se existe relação linear entre as variáveis X e Y.
(e) Considerando a reta ajustada dada no item (b), estime a venda média semanal em lojas
com espaço em estantes de 8 pés .
(f) Estimar mediante um intervalo de 90%, a venda semanal de uma loja com espaço em estantes
de 8 pés.
(g) Supondo que Y e X tem distribuição conjunta normal bivariada, estime e interprete o
coeciente de correlação entre Y e X.
Bibliograa
[1] Bussab, W. O. e Morettin, P.A. (1987). Estatística Básica, 4a Ed., São Paulo.
[2] Botter, D.A. , Paula, G.A., Liete, J.G. e Cordani, L.k. (1996). Noções de Estatística. São
Paulo:IME/USP.
[3] Montgomery, D.C. e Runger, G.C. (1996) Applied statistics and probability for engineers John
Wiley &Sons, Inc.
[4] Montgomery, D.C. e Peck, E.A. (1992) Introduction to linear regression analysis John Wiley
&Sons, Inc.
[5] Montgomery, D.C. (1991) Design and analysis of experiments John Wiley &Sons, Inc.
[6] Moore David S. (1995).The Basic Practice of Statístics
[7] Fernadez, P.J. (1973). Introbução à teória de probabilidades. Rio de Janeiro: Livro Técnico.
[8] Meyer, Paul, L. (1977),Probabilidade: aplicações à estatística Livros técnicos e cienticos editora
s.a.
[9] Peres , C.A., Saldiva, C.D. (1982). Planejamento de Experimentos 5a Sinape, São Paulo,
206
Apêndice A
Tabelas Estatísticas
Tabela A: normal padrão
Tabela B: Qui-quadradot-Student
Tabela C: t-Student
Tabela D: F -Snedecor
207
APÊNDICE A. TABELAS ESTATÍSTICAS 208
Rz 2
Tabela A: Distribuição acumulada da normal padrão: Φ(z) = −∞
√1 e−t /2 dt
2π
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56750 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59484 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67365 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72241
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76731 0,77035 0,77337 0,77637 0,77935 0,78231 0,78524
0,8 0,78815 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
1,0 0,84135 0,84375 0,84614 0,84850 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90148
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92786 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95544 0,95637 0,95728 0,95819 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97671
2,0 0,97725 0,97778 0,97831 0,97882 0,97933 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98746 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99586 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99737
2,8 0,99745 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
3,0 0,99865 0,99869 0,99874 0,99878 0,99882 0,99886 0,99889 0,99893 0,99897 0,99900
3,1 0,99903 0,99906 0,99910 0,99913 0,99916 0,99918 0,99921 0,99924 0,99926 0,99929
3,2 0,99931 0,99934 0,99936 0,99938 0,99940 0,99942 0,99944 0,99946 0,99948 0,99950
3,3 0,99952 0,99953 0,99955 0,99957 0,99958 0,99960 0,99961 0,99962 0,99964 0,99965
3,4 0,99966 0,99968 0,99969 0,99970 0,99971 0,99972 0,99973 0,99974 0,99975 0,99976
3,5 0,99977 0,99978 0,99978 0,99979 0,99980 0,99981 0,99982 0,99982 0,99983 0,99984
3,6 0,99984 0,99985 0,99985 0,99986 0,99986 0,99987 0,99987 0,99988 0,99988 0,99989
3,7 0,99989 0,99990 0,99990 0,99990 0,99991 0,99991 0,99992 0,99992 0,99992 0,99993
3,8 0,99993 0,99993 0,99993 0,99994 0,99994 0,99994 0,99994 0,99995 0,99995 0,99995
3,9 0,99995 0,99995 0,99996 0,99996 0,99996 0,99996 0,99996 0,99996 0,99997 0,99997
Tabela B:Pontos críticos(χ2α,v ) da distribuição qui-quadrado. P (W ≥ χ2α,v ) = α
v\α 0,995 0,990 0,975 0,950 0,900 0,500 0,100 0,050 0,025 0,010 0,005
1 0 0 0 0 0,02 0,45 2,71 3,84 5,02 6,63 7,88
2 0,01 0,02 0,05 0,10 0,21 1,39 4,61 5,99 7,38 9,21 10,60
3 0,07 0,11 0,22 0,35 0,58 2,37 6,25 7,81 9,35 11,34 12,84
4 0,21 0,3 0,48 0,71 1,06 3,36 7,78 9,49 11,14 13,28 14,86
5 0,41 0,55 0,83 1,15 1,61 4,35 9,24 11,07 12,83 15,09 16,75
6 0,68 0,87 1,24 1,64 2,2 5,35 10,64 12,59 14,45 16,81 18,55
7 0,99 1,24 1,69 2,17 2,83 6,35 12,02 14,07 16,01 18,48 20,28
8 1,34 1,65 2,18 2,73 3,49 7,34 13,36 15,51 17,53 20,09 21,95
9 1,73 2,09 2,7 3,33 4,17 8,34 14,68 16,92 19,02 21,67 23,59
10 2,16 2,56 3,25 3,94 4,87 9,34 15,99 18,31 20,48 23,21 25,19
11 2,6 3,05 3,82 4,57 5,58 10,34 17,28 19,68 21,92 24,72 26,76
12 3,07 3,57 4,4 5,23 6,3 11,34 18,55 21,03 23,34 26,22 28,3
13 3,57 4,11 5,01 5,89 7,04 12,34 19,81 22,36 24,74 27,69 29,82
14 4,07 4,66 5,63 6,57 7,79 13,34 21,06 23,68 26,12 29,14 31,32
15 4,60 5,23 6,26 7,26 8,55 14,34 22,31 25,00 27,49 30,58 32,8
16 5,14 5,81 6,91 7,96 9,31 15,34 23,54 26,3 28,85 32 34,27
17 5,7 6,41 7,56 8,67 10,09 16,34 24,77 27,59 30,19 33,41 35,72
18 6,26 7,01 8,23 9,39 10,86 17,34 25,99 28,87 31,53 34,81 37,16
19 6,84 7,63 8,91 10,12 11,65 18,34 27,2 30,14 32,85 36,19 38,58
20 7,43 8,26 9,59 10,85 12,44 19,34 28,41 31,41 34,17 37,57 40
21 8,03 8,9 10,28 11,59 13,24 20,34 29,62 32,67 35,48 38,93 41,4
22 8,64 9,54 10,98 12,34 14,04 21,34 30,81 33,92 36,78 40,29 42,8
23 9,26 10,2 11,69 13,09 14,85 22,34 32,01 35,17 38,08 41,64 44,18
24 9,89 10,86 12,4 13,85 15,66 23,34 33,2 36,42 39,36 42,98 45,56
25 10,52 11,52 13,12 14,61 16,47 24,34 34,38 37,65 40,65 44,31 46,93
26 11,16 12,2 13,84 15,38 17,29 25,34 35,56 38,89 41,92 45,64 48,29
27 11,81 12,88 14,57 16,15 18,11 26,34 36,74 40,11 43,19 46,96 49,64
28 12,46 13,56 15,31 16,93 18,94 27,34 37,92 41,34 44,46 48,28 50,99
29 13,12 14,26 16,05 17,71 19,77 28,34 39,09 42,56 45,72 49,59 52,34
30 13,79 14,95 16,79 18,49 20,6 29,34 40,26 43,77 46,98 50,89 53,67
40 20,71 22,16 24,43 26,51 29,05 39,34 51,81 55,76 59,34 63,69 66,77
50 27,99 29,71 32,36 34,76 37,69 49,33 63,17 67,5 71,42 76,15 79,49
60 35,53 37,48 40,48 43,19 46,46 59,33 74,4 79,08 83,3 88,38 91,95
80 51,17 53,54 57,15 60,39 64,28 79,33 96,58 101,88 106,63 112,33 116,32
90 59,2 61,75 65,65 69,13 73,29 89,33 107,57 113,15 118,14 124,12 128,3
100 67,33 70,06 74,22 77,93 82,36 99,33 118,5 124,34 129,56 135,81 140,17
120 83,85 86,92 91,57 95,7 100,62 119,33 140,23 146,57 152,21 158,95 163,65
v : Graus de liberdade.
Tabela C: Pontos críticos (tα,v ) da distribuição t-Student: P (T ≥ tα,v ) = α
v\α 0,40 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005
1 0,325 1,000 3,078 6,314 12,706 31,821 63,657 127,321 318,309 636,619
2 0,289 0,816 1,886 2,920 4,303 6,965 9,925 14,089 22,327 31,599
3 0,277 0,765 1,638 2,353 3,182 4,541 5,841 7,453 10,215 12,924
4 0,271 0,741 1,533 2,132 2,776 3,747 4,604 5,598 7,173 8,610
5 0,267 0,727 1,476 2,015 2,571 3,365 4,032 4,773 5,893 6,869
6 0,265 0,718 1,440 1,943 2,447 3,143 3,707 4,317 5,208 5,959
7 0,263 0,711 1,415 1,895 2,365 2,998 3,499 4,029 4,785 5,408
8 0,262 0,706 1,397 1,860 2,306 2,896 3,355 3,833 4,501 5,041
9 0,261 0,703 1,383 1,833 2,262 2,821 3,250 3,690 4,297 4,781
10 0,260 0,700 1,372 1,812 2,228 2,764 3,169 3,581 4,144 4,587
11 0,260 0,697 1,363 1,796 2,201 2,718 3,106 3,497 4,025 4,437
12 0,259 0,695 1,356 1,782 2,179 2,681 3,055 3,428 3,930 4,318
13 0,259 0,694 1,350 1,771 2,160 2,650 3,012 3,372 3,852 4,221
14 0,258 0,692 1,345 1,761 2,145 2,624 2,977 3,326 3,787 4,140
15 0,258 0,691 1,341 1,753 2,131 2,602 2,947 3,286 3,733 4,073
16 0,258 0,690 1,337 1,746 2,120 2,583 2,921 3,252 3,686 4,015
17 0,257 0,689 1,333 1,740 2,110 2,567 2,898 3,222 3,646 3,965
18 0,257 0,688 1,330 1,734 2,101 2,552 2,878 3,197 3,610 3,922
19 0,257 0,688 1,328 1,729 2,093 2,539 2,861 3,174 3,579 3,883
20 0,257 0,687 1,325 1,725 2,086 2,528 2,845 3,153 3,552 3,850
21 0,257 0,686 1,323 1,721 2,080 2,518 2,831 3,135 3,527 3,819
22 0,256 0,686 1,321 1,717 2,074 2,508 2,819 3,119 3,505 3,792
23 0,256 0,685 1,319 1,714 2,069 2,500 2,807 3,104 3,485 3,768
24 0,256 0,685 1,318 1,711 2,064 2,492 2,797 3,091 3,467 3,745
25 0,256 0,684 1,316 1,708 2,060 2,485 2,787 3,078 3,450 3,725
26 0,256 0,684 1,315 1,706 2,056 2,479 2,779 3,067 3,435 3,707
27 0,256 0,684 1,314 1,703 2,052 2,473 2,771 3,057 3,421 3,690
28 0,256 0,683 1,313 1,701 2,048 2,467 2,763 3,047 3,408 3,674
29 0,256 0,683 1,311 1,699 2,045 2,462 2,756 3,038 3,396 3,659
30 0,256 0,683 1,310 1,697 2,042 2,457 2,750 3,030 3,385 3,646
40 0,255 0,681 1,303 1,684 2,021 2,423 2,704 2,971 3,307 3,551
50 0,255 0,679 1,299 1,676 2,009 2,403 2,678 2,937 3,261 3,496
60 0,254 0,679 1,296 1,671 2,000 2,390 2,660 2,915 3,232 3,460
80 0,254 0,678 1,292 1,664 1,990 2,374 2,639 2,887 3,195 3,416
90 0,254 0,677 1,291 1,662 1,987 2,368 2,632 2,878 3,183 3,402
100 0,254 0,677 1,290 1,660 1,984 2,364 2,626 2,871 3,174 3,390
120 0,254 0,677 1,289 1,658 1,980 2,358 2,617 2,860 3,160 3,373
v : Graus de liberdade.
Tabela D: Pontos críticos (fα,v1 ,v2 ) da distribuição F-Snedecor. Para α=0,10.
Graus de liberdade do numerador (v1 )

v2 1 2 3 4 5 6 7 8 9 10 12 15 20 30 40 60 120
1 39,86 49,50 53,59 55,83 57,24 58,20 58,91 59,44 59,86 60,19 60,71 61,22 61,74 62,26 62,53 62,79 63,06
2 8,53 9,00 9,16 9,24 9,29 9,33 9,35 9,37 9,38 9,39 9,41 9,42 9,44 9,46 9,47 9,47 9,48
3 5,54 5,46 5,39 5,34 5,31 5,28 5,27 5,25 5,24 5,23 5,22 5,20 5,18 5,17 5,16 5,15 5,14
4 4,54 4,32 4,19 4,11 4,05 4,01 3,98 3,95 3,94 3,92 3,90 3,87 3,84 3,82 3,80 3,79 3,78
5 4,06 3,78 3,62 3,52 3,45 3,40 3,37 3,34 3,32 3,30 3,27 3,24 3,21 3,17 3,16 3,14 3,12
6 3,78 3,46 3,29 3,18 3,11 3,05 3,01 2,98 2,96 2,94 2,90 2,87 2,84 2,80 2,78 2,76 2,74
7 3,59 3,26 3,07 2,96 2,88 2,83 2,78 2,75 2,72 2,70 2,67 2,63 2,59 2,56 2,54 2,51 2,49
8 3,46 3,11 2,92 2,81 2,73 2,67 2,62 2,59 2,56 2,54 2,50 2,46 2,42 2,38 2,36 2,34 2,32
9 3,36 3,01 2,81 2,69 2,61 2,55 2,51 2,47 2,44 2,42 2,38 2,34 2,30 2,25 2,23 2,21 2,18
10 3,29 2,92 2,73 2,61 2,52 2,46 2,41 2,38 2,35 2,32 2,28 2,24 2,20 2,16 2,13 2,11 2,08
11 3,23 2,86 2,66 2,54 2,45 2,39 2,34 2,30 2,27 2,25 2,21 2,17 2,12 2,08 2,05 2,03 2,00
12 3,18 2,81 2,61 2,48 2,39 2,33 2,28 2,24 2,21 2,19 2,15 2,10 2,06 2,01 1,99 1,96 1,93
13 3,14 2,76 2,56 2,43 2,35 2,28 2,23 2,20 2,16 2,14 2,10 2,05 2,01 1,96 1,93 1,90 1,88
14 3,10 2,73 2,52 2,39 2,31 2,24 2,19 2,15 2,12 2,10 2,05 2,01 1,96 1,91 1,89 1,86 1,83
15 3,07 2,70 2,49 2,36 2,27 2,21 2,16 2,12 2,09 2,06 2,02 1,97 1,92 1,87 1,85 1,82 1,79
16 3,05 2,67 2,46 2,33 2,24 2,18 2,13 2,09 2,06 2,03 1,99 1,94 1,89 1,84 1,81 1,78 1,75
17 3,03 2,64 2,44 2,31 2,22 2,15 2,10 2,06 2,03 2,00 1,96 1,91 1,86 1,81 1,78 1,75 1,72
18 3,01 2,62 2,42 2,29 2,20 2,13 2,08 2,04 2,00 1,98 1,93 1,89 1,84 1,78 1,75 1,72 1,69
19 2,99 2,61 2,40 2,27 2,18 2,11 2,06 2,02 1,98 1,96 1,91 1,86 1,81 1,76 1,73 1,70 1,67
20 2,97 2,59 2,38 2,25 2,16 2,09 2,04 2,00 1,96 1,94 1,89 1,84 1,79 1,74 1,71 1,68 1,64
21 2,96 2,57 2,36 2,23 2,14 2,08 2,02 1,98 1,95 1,92 1,87 1,83 1,78 1,72 1,69 1,66 1,62
22 2,95 2,56 2,35 2,22 2,13 2,06 2,01 1,97 1,93 1,90 1,86 1,81 1,76 1,70 1,67 1,64 1,60
23 2,94 2,55 2,34 2,21 2,11 2,05 1,99 1,95 1,92 1,89 1,84 1,80 1,74 1,69 1,66 1,62 1,59
24 2,93 2,54 2,33 2,19 2,10 2,04 1,98 1,94 1,91 1,88 1,83 1,78 1,73 1,67 1,64 1,61 1,57
25 2,92 2,53 2,32 2,18 2,09 2,02 1,97 1,93 1,89 1,87 1,82 1,77 1,72 1,66 1,63 1,59 1,56
26 2,91 2,52 2,31 2,17 2,08 2,01 1,96 1,92 1,88 1,86 1,81 1,76 1,71 1,65 1,61 1,58 1,54
27 2,90 2,51 2,30 2,17 2,07 2,00 1,95 1,91 1,87 1,85 1,80 1,75 1,70 1,64 1,60 1,57 1,53
28 2,89 2,50 2,29 2,16 2,06 2,00 1,94 1,90 1,87 1,84 1,79 1,74 1,69 1,63 1,59 1,56 1,52
29 2,89 2,50 2,28 2,15 2,06 1,99 1,93 1,89 1,86 1,83 1,78 1,73 1,68 1,62 1,58 1,55 1,51
30 2,88 2,49 2,28 2,14 2,05 1,98 1,93 1,88 1,85 1,82 1,77 1,72 1,67 1,61 1,57 1,54 1,50
40 2,84 2,44 2,23 2,09 2,00 1,93 1,87 1,83 1,79 1,76 1,71 1,66 1,61 1,54 1,51 1,47 1,42
60 2,79 2,39 2,18 2,04 1,95 1,87 1,82 1,77 1,74 1,71 1,66 1,60 1,54 1,48 1,44 1,40 1,35
120 2,75 2,35 2,13 1,99 1,90 1,82 1,77 1,72 1,68 1,65 1,60 1,55 1,48 1,41 1,37 1,32 1,26

v2 1 2 3 4 5 6 7 8 9 10 12 15 20 30 40 60 120
1 161,5 199,5 215,7 224,6 230,2 234 236,8 238,9 240,5 241,9 243,9 245,9 248 250,1 251,1 252,2 253,2
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19,46 19,47 19,48 19,49
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 8,62 8,59 8,57 8,55
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80 5,75 5,72 5,69 5,66
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56 4,50 4,46 4,43 4,40
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,94 3,87 3,81 3,77 3,74 3,70
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 3,38 3,34 3,30 3,27
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15 3,08 3,04 3,01 2,97
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 2,86 2,83 2,79 2,75
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77 2,70 2,66 2,62 2,58
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 2,65 2,57 2,53 2,49 2,45
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 2,47 2,43 2,38 2,34
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2,46 2,38 2,34 2,30 2,25
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2,39 2,31 2,27 2,22 2,18
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,33 2,25 2,20 2,16 2,11
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2,28 2,19 2,15 2,11 2,06
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,31 2,23 2,15 2,10 2,06 2,01
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2,19 2,11 2,06 2,02 1,97
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2,16 2,07 2,03 1,98 1,93
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12 2,04 1,99 1,95 1,90
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,25 2,18 2,10 2,01 1,96 1,92 1,87
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,15 2,07 1,98 1,94 1,89 1,84
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,20 2,13 2,05 1,96 1,91 1,86 1,81
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,11 2,03 1,94 1,89 1,84 1,79
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 2,01 1,92 1,87 1,82 1,77
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,15 2,07 1,99 1,90 1,85 1,80 1,75
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,13 2,06 1,97 1,88 1,84 1,79 1,73
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,12 2,04 1,96 1,87 1,82 1,77 1,71
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,10 2,03 1,94 1,85 1,81 1,75 1,70
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,01 1,93 1,84 1,79 1,74 1,68
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,92 1,84 1,74 1,69 1,64 1,58
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,84 1,75 1,65 1,59 1,53 1,47
120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,96 1,91 1,83 1,75 1,66 1,55 1,50 1,43 1,35
v2 : Graus de liberdade do denominador.


v2 1 2 3 4 5 6 7 8 9 10 12 15 20 30 40 60 120
1 647,8 799,5 864,2 899,6 921,9 937,1 948,2 956,7 963,3 968,6 976,7 984,9 993,1 1001,4 1005,6 1009,8 1014,0
2 38,51 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40 39,41 39,43 39,45 39,46 39,47 39,48 39,49
3 17,44 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42 14,34 14,25 14,17 14,08 14,04 13,99 13,95
4 12,22 10,65 9,98 9,60 9,36 9,20 9,07 8,98 8,90 8,84 8,75 8,66 8,56 8,46 8,41 8,36 8,31
5 10,01 8,43 7,76 7,39 7,15 6,98 6,85 6,76 6,68 6,62 6,52 6,43 6,33 6,23 6,18 6,12 6,07
6 8,81 7,26 6,60 6,23 5,99 5,82 5,70 5,60 5,52 5,46 5,37 5,27 5,17 5,07 5,01 4,96 4,90
7 8,07 6,54 5,89 5,52 5,29 5,12 4,99 4,90 4,82 4,76 4,67 4,57 4,47 4,36 4,31 4,25 4,20
8 7,57 6,06 5,42 5,05 4,82 4,65 4,53 4,43 4,36 4,30 4,20 4,10 4,00 3,89 3,84 3,78 3,73
9 7,21 5,71 5,08 4,72 4,48 4,32 4,20 4,10 4,03 3,96 3,87 3,77 3,67 3,56 3,51 3,45 3,39
10 6,94 5,46 4,83 4,47 4,24 4,07 3,95 3,85 3,78 3,72 3,62 3,52 3,42 3,31 3,26 3,20 3,14
11 6,72 5,26 4,63 4,28 4,04 3,88 3,76 3,66 3,59 3,53 3,43 3,33 3,23 3,12 3,06 3,00 2,94
12 6,55 5,10 4,47 4,12 3,89 3,73 3,61 3,51 3,44 3,37 3,28 3,18 3,07 2,96 2,91 2,85 2,79
13 6,41 4,97 4,35 4,00 3,77 3,60 3,48 3,39 3,31 3,25 3,15 3,05 2,95 2,84 2,78 2,72 2,66
14 6,30 4,86 4,24 3,89 3,66 3,50 3,38 3,29 3,21 3,15 3,05 2,95 2,84 2,73 2,67 2,61 2,55
15 6,20 4,77 4,15 3,80 3,58 3,41 3,29 3,20 3,12 3,06 2,96 2,86 2,76 2,64 2,59 2,52 2,46
16 6,12 4,69 4,08 3,73 3,50 3,34 3,22 3,12 3,05 2,99 2,89 2,79 2,68 2,57 2,51 2,45 2,38
17 6,04 4,62 4,01 3,66 3,44 3,28 3,16 3,06 2,98 2,92 2,82 2,72 2,62 2,50 2,44 2,38 2,32
18 5,98 4,56 3,95 3,61 3,38 3,22 3,10 3,01 2,93 2,87 2,77 2,67 2,56 2,44 2,38 2,32 2,26
19 5,92 4,51 3,90 3,56 3,33 3,17 3,05 2,96 2,88 2,82 2,72 2,62 2,51 2,39 2,33 2,27 2,20
20 5,87 4,46 3,86 3,51 3,29 3,13 3,01 2,91 2,84 2,77 2,68 2,57 2,46 2,35 2,29 2,22 2,16
21 5,83 4,42 3,82 3,48 3,25 3,09 2,97 2,87 2,80 2,73 2,64 2,53 2,42 2,31 2,25 2,18 2,11
22 5,79 4,38 3,78 3,44 3,22 3,05 2,93 2,84 2,76 2,70 2,60 2,50 2,39 2,27 2,21 2,14 2,08
23 5,75 4,35 3,75 3,41 3,18 3,02 2,90 2,81 2,73 2,67 2,57 2,47 2,36 2,24 2,18 2,11 2,04
24 5,72 4,32 3,72 3,38 3,15 2,99 2,87 2,78 2,70 2,64 2,54 2,44 2,33 2,21 2,15 2,08 2,01
25 5,69 4,29 3,69 3,35 3,13 2,97 2,85 2,75 2,68 2,61 2,51 2,41 2,30 2,18 2,12 2,05 1,98
26 5,66 4,27 3,67 3,33 3,10 2,94 2,82 2,73 2,65 2,59 2,49 2,39 2,28 2,16 2,09 2,03 1,95
27 5,63 4,24 3,65 3,31 3,08 2,92 2,80 2,71 2,63 2,57 2,47 2,36 2,25 2,13 2,07 2,00 1,93
28 5,61 4,22 3,63 3,29 3,06 2,90 2,78 2,69 2,61 2,55 2,45 2,34 2,23 2,11 2,05 1,98 1,91
29 5,59 4,20 3,61 3,27 3,04 2,88 2,76 2,67 2,59 2,53 2,43 2,32 2,21 2,09 2,03 1,96 1,89
30 5,57 4,18 3,59 3,25 3,03 2,87 2,75 2,65 2,57 2,51 2,41 2,31 2,20 2,07 2,01 1,94 1,87
40 5,42 4,05 3,46 3,13 2,90 2,74 2,62 2,53 2,45 2,39 2,29 2,18 2,07 1,94 1,88 1,80 1,72
60 5,29 3,93 3,34 3,01 2,79 2,63 2,51 2,41 2,33 2,27 2,17 2,06 1,94 1,82 1,74 1,67 1,58
120 5,15 3,80 3,23 2,89 2,67 2,52 2,39 2,30 2,22 2,16 2,05 1,94 1,82 1,69 1,61 1,53 1,43

v2 1 2 3 4 5 6 7 8 9 10 12 15 20 30 40 60 120
1 4052 4999,5 5403 5625 5764 5859 5928 5981 6022 6056 6106 6157 6209 6261 6287 6313 6339
2 98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,39 99,40 99,42 99,43 99,45 99,47 99,47 99,48 99,49
3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23 27,05 26,87 26,69 26,50 26,41 26,32 26,22
4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,37 14,20 14,02 13,84 13,75 13,65 13,56
5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,89 9,72 9,55 9,38 9,29 9,20 9,11
6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,72 7,56 7,40 7,23 7,14 7,06 6,97
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,47 6,31 6,16 5,99 5,91 5,82 5,74
8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,67 5,52 5,36 5,20 5,12 5,03 4,95
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,11 4,96 4,81 4,65 4,57 4,48 4,40
10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,71 4,56 4,41 4,25 4,17 4,08 4,00
11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,40 4,25 4,10 3,94 3,86 3,78 3,69
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,16 4,01 3,86 3,70 3,62 3,54 3,45
13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 3,96 3,82 3,66 3,51 3,43 3,34 3,25
14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,80 3,66 3,51 3,35 3,27 3,18 3,09
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,67 3,52 3,37 3,21 3,13 3,05 2,96
16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,55 3,41 3,26 3,10 3,02 2,93 2,84
17 8,40 6,11 5,18 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,46 3,31 3,16 3,00 2,92 2,83 2,75
18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 3,37 3,23 3,08 2,92 2,84 2,75 2,66
19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,30 3,15 3,00 2,84 2,76 2,67 2,58
20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,23 3,09 2,94 2,78 2,69 2,61 2,52
21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31 3,17 3,03 2,88 2,72 2,64 2,55 2,46
22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26 3,12 2,98 2,83 2,67 2,58 2,50 2,40
23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21 3,07 2,93 2,78 2,62 2,54 2,45 2,35
24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 3,03 2,89 2,74 2,58 2,49 2,40 2,31
25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 2,99 2,85 2,70 2,54 2,45 2,36 2,27
26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09 2,96 2,81 2,66 2,50 2,42 2,33 2,23
27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06 2,93 2,78 2,63 2,47 2,38 2,29 2,20
28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03 2,90 2,75 2,60 2,44 2,35 2,26 2,17
29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00 2,87 2,73 2,57 2,41 2,33 2,23 2,14
30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,84 2,70 2,55 2,39 2,30 2,21 2,11
40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,66 2,52 2,37 2,20 2,11 2,02 1,92
60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,50 2,35 2,20 2,03 1,94 1,84 1,73
120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,56 2,47 2,34 2,19 2,03 1,86 1,76 1,66 1,53

Vicente Garibay Cancho - Noções de Estatística e Probabilidade

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Vicente Garibay Cancho - Noções de Estatística e Probabilidade

Încărcat de

Drepturi de autor:

Formate disponibile

UNIVERSIDADE FEDERAL DE OURO PRET0

INSTITUTO DE CIÊNCIAS EXATAS E BIOLÓGICAS

Noções de Estatística e Probabilidade

Prof: Vicente Garibay Cancho

-Ouro Preto, 5 de Agosto de 2004-

5 Inferência Estatística 133

6 Análise de regressão e correlação 177

6.4 Análise de correlação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198

Referências Bibliográcas 205

A Tabelas Estatísticas 207

1.1 Introdução e Denição de Estatística

1.2 Populações e Amostras

• população: todos os eleitores do Brasil

amostra: 2000 eleitores entrevistados em uma pesquisa pelo IBOPE.

amostra: 30 peças sorteadas ao acaso da produção de um dia maquina.

amostra: 20 artigos sorteados ao acaso para inspeção.

1.3 Parâmetro e Estatística

1.4 Etapas do Método de Análise Estatística

i) Formulação do problema e denição de um objetivo

ii) Planejamento do experimento.

iii) Recolha de dados.

iv) Análise de dados.

v) Estabelecimento de inferência estatística acerca da população (com base na informação amostral).

1.4.1 Formulação do problema

1.4.2 Planejamento do experimento

1.4.3 Recolha dos dados.

1.4.4 Análise de dados

1.4.5 Estabelecimento de inferência estatística acerca da população

Figura 1.1: Etapas do Método de Análise Estatística.

Lê-se somatório de Xi , de i = 1 a i = n. O i denomina-se índice de adição da somatório.

1.5.1 Propriedades das somatórios

1.6 Somatório double

por linhas temos:

por colunas temos:

2. Na seguinte tabela tem-se a quantidade em toneladas de açúcar transportada desde os depósitos

Se Xij : é quantidade em toneladas de açúcar transportada desde o depósito i aos supermercados

(a) Da quantidade total de açúcar transportada aos supermercados.

2.2 Classicação dos Dados

2.2.1 Dados qualitativos

2.2.2 Dados quantitativos

2.3 Organização e Representação de Dados

Considerando o número total de alunos consultados (n = 40 alunos), as freqüências relativas são

Tabela 2.1: Distribuição de alunos desaprovados numa disciplina no semestre 2003/1

Figura 2.1: Distribuição de alunos desaprovados no semestre 2003/1.

2.3.2 Organização de dados quantitativos

Figura 2.2: Distribuição de alunos desaprovados no semestre 2003/1

Ao ordenar os dados em ordem crescente tem-se:

Tabela 2.2: Distribuição de freqüências do número de emergências atendidas pelo hospital

Número de Frequência Freqüência Freqüência

De maneira similar ao exemplo 2.3.1, as freqüências absolutas são o resultado de um processo de

Figura 2.3: Distribuição de alunos desaprovados no semestre 2003/1

2. Determinar o comprimento ou amplitude (A) dos dados, isto é,

Figura 2.4: Distribuição do número de emergências atendidas pelo hospital

3. Determinar a amplitude de cada intervalo de classe ( h):

(a) Freqüência acumulada absoluta ( Fi ):

(b) Freqüência acumulada relativa ( Fri ):

(c) Freqüência acumulada percentual ( Pi ):

(d) Densidade acumulada ( Di ):

Para obter a tabela de distribuição de freqüências, procede-se da seguinte maneira:

De maneira similar obtém-se os outros limites de classe e suas marcas de classe.

Tabela 2.3: Distribuição da quantidade de hemoglobina de 40 animais

Quantidade de Hb Xi0 fi fri pi di = phi Fi Fri Pi

Polígono de freqüências acumuladas (ogiva)

Figura 2.5: Distribuição da quantidade de hemoglobina de animais expostos a um produto tóxico

Referências Bibliográcas 205

1.1 Introdução e Denição de Estatística

i) Formulação do problema e denição de um objetivo

2.2 Classicação dos Dados

A demonstração dessas propriedades ca com exercício paro o leitor.

2.5.5 Coeciente de variabilidade

Observação 2.5.2 O coeciente de variabilidade geralmente é expressado em percentuais, isto é multiplica-

Exemplo 2.6.1 (Exemplo de construção de um Boxplot) Com a nalidade de aumentar o peso

Figura 2.10: Gráco de Boxplot para o regime alimentar

Figura 2.11: Gráco de Boxplot para o regime alimentar

Da gura 2.12, tem-se

(a) Qual é a variável de estudo? Classique-a.

(a) Classique os dados obtidos.

(a) Calcule e interprete a mediana, 10 quartil e 30 quartil . Comente a armação do fabricante.

(a) classique as variáveis em qualitativa nominal ou ordinal.

(a) Qual é a variável em estudo? Classique-a.

i. O experimento pode repetir-se, indenidamente sem mudar as condições. .