Documente Academic
Documente Profesional
Documente Cultură
1 Introdução 2
1.1 Introdução e Denição de Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Populações e Amostras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Parâmetro e Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4 Etapas do Método de Análise Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4.1 Formulação do problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4.2 Planejamento do experimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4.3 Recolha dos dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4.4 Análise de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4.5 Estabelecimento de inferência estatística acerca da população . . . . . . . . . . 4
1.5 Somatório . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.5.1 Propriedades das somatórios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.6 Somatório double . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.7 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2 Análise Descritiva 8
2.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2 Classicação dos Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2.1 Dados qualitativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2.2 Dados quantitativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3 Organização e Representação de Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3.1 Organização de dados qualitativos . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3.2 Organização de dados quantitativos . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4 Medidas de Posição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4.1 Média . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4.2 Média geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
i
2.4.3 Média harmônica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.4.4 Mediana (M d) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.4.5 Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.4.6 Percentil e quartil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.5 Medidas de Dispersão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.5.1 Amplitude (A) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.5.2 Intervalo interquartil (d) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.5.3 Variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.5.4 Desvio padrão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.5.5 Coeciente de variabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.5.6 Medidas de variabilidade para dados agrupados . . . . . . . . . . . . . . . . . . 31
2.6 Boxplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.7 Exercícios Resolvidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.8 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3 Introdução à Probabilidade 48
3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.2 Conceitos Básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.2.1 Experimentos aleatórios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.2.2 Espaço amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.2.3 Eventos aleatórios e operações . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.3 Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.3.1 Denição clássica ou a priori . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.3.2 Denição frequentista ou a posteriori . . . . . . . . . . . . . . . . . . . . . . . . 52
3.3.3 Denição axiomática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.4 Probabilidade Condicional e Independência . . . . . . . . . . . . . . . . . . . . . . . . 55
3.5 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.6 Exercícios Resolvidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.7 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4 Variáveis Aleatórias 74
4.1 Introdução e Denição de Variável Aleatória . . . . . . . . . . . . . . . . . . . . . . . . 74
4.2 Variáveis Aleatórias Discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.2.1 Função de probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
ii
4.2.2 Função de distribuição acumulada de uma variável aleatória discreta . . . . . . 76
4.3 Variáveis Aleatórias Contínuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.3.1 Função de probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.3.2 Função de distribuição acumulada de uma variável aleatória contínua . . . . . . 80
4.4 Valor Esperado e Variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4.4.1 Propriedades do valor esperado e variância de uma variável aleatória . . . . . . 84
4.5 Principais Modelos Discretos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.5.1 Ensaio e distribuição de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.5.2 Distribuição Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.5.3 Distribuição Hipergeométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
4.5.4 Distribuição de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
4.6 Principais Modelos Contínuos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
4.6.1 Distribuição uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
4.6.2 Distribuição exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.6.3 Distribuição normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
4.7 Distribuições Amostrais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.7.1 Distribuição da média amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
4.7.2 Forma da distribuição da média amostral quando a população não é normal . . 109
4.7.3 Distribuição da diferença de duas médias amostrais . . . . . . . . . . . . . . . . 110
4.7.4 Distribuição amostral de uma proporção amostral . . . . . . . . . . . . . . . . . 111
4.8 Distribuições Utilizadas na Inferência Estatística . . . . . . . . . . . . . . . . . . . . . 113
4.8.1 Distribuição Qui-quadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
4.8.2 A distribuição t-Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.8.3 Distribuição F-Snedecor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
4.9 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
iii
5.3.3 Para amostras grandes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
5.4 Intervalo de Conança para uma Proporção Populacional . . . . . . . . . . . . . . . . 139
5.4.1 Determinação do tamanho da amostra para estimação de uma proporção popu-
lacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
5.5 Intervalo de Conança para a Variância (σ 2 ) . . . . . . . . . . . . . . . . . . . . . . . . 142
5.6 Intervalo de Conança para a Diferença de Médias (µ1 − µ2 ) . . . . . . . . . . . . . . . 143
5.6.1 Quando as variâncias σ12 e σ22 são conhecidos . . . . . . . . . . . . . . . . . . . 143
5.6.2 Quando σ12 = σ22 = σ 2 , mas desconhecidos . . . . . . . . . . . . . . . . . . . . . 143
5.6.3 Quando as variâncias são desconhecidas e diferentes . . . . . . . . . . . . . . . 144
5.7 Intervalo de Conança para Razão de Variâncias . . . . . . . . . . . . . . . . . . . . . 145
5.8 Teste de Hipóteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
5.8.1 Conceitos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
5.8.2 Testes unilaterais e bilaterais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
5.8.3 Procedimento básico de teste de hipóteses . . . . . . . . . . . . . . . . . . . . . 155
5.9 Teste de Hipóteses para uma Média Populacional . . . . . . . . . . . . . . . . . . . . . 155
5.10 Teste de Hipóteses para uma Variância Populacional . . . . . . . . . . . . . . . . . . . 159
5.11 Teste de Hipótese para a Diferença de Médias Populacionais (µ1 − µ2 ) . . . . . . . . . 161
5.12 Teste de Hipóteses para a Igualdade de Duas Variâncis Populacionais . . . . . . . . . . 163
5.13 Teste Hipóteses para uma Proporção Populacional, para Amostras Grandes . . . . . . 166
5.14 Teste de Hipóteses de Igualdade de Duas Proporções Populacionais para Amostras Grandes167
5.15 Nível Descritivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
5.16 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
iv
1
Apêndice 206
Introdução
2
CAPÍTULO 1. INTRODUÇÃO 3
1.5 Somatório
Dado um conjunto de observações de alguma característica ou variável X , representada por X1 , X2 , . . . , Xn ,
a soma, X1 + X2 + · · · + Xn , é expressado, em forma abreviada como:
n
X
Xi .
i=1
P
n P
n
2. Se c é uma constante qualquer, então cXi = c Xi
i=1 i=1
3.
n
X n
X n
X n
X
(Xi + Yi − Zi ) = Xi + Yi − Zi
i=1 i=1 i=1 i=1
P
n P
n
4. Xi = Xj
i=1 j=1
Tabela 1.1: Leituras da pressão sanguínea sistólica de um individuo tomadas em 5 visitas por 4
observadores
Número de visitas número de médicos
1 2 3 4
1 118 112 116 118
2 120 116 112 112
3 114 120 112 117
4 118 116 118 116
5 118 108 122 116
um sistema de dois subíndices, isto é, usam-se um subíndice para o número de visitas e outro para o
número de médicos. Em tais situações é freqüente utilizar as letras i e j para indicar o número da
linha e o número da coluna, respectivamente. A cada observação denota-se por Xij que indica o dado
da i-ésima linha e j -ésima coluna. No conjunto de dados da tabela 1.1, X34 = 117, X32 = 120, por
exemplo.
Considere agora, os diversos tipos de soma, por exemplo, a soma dos elementos da terceira linha é
P4
X3j . (na linha 3, o primeiro subíndice é xo, o que muda é o segundo subíndice).
j=1
Para somar todos elementos da tabela 1.1, pode-se proceder de duas maneiras, primeiro somar os
elementos correspondentes a cada linha e logo determinar a soma dessas somas ou somar cada coluna
e logo somar essas somas.
CAPÍTULO 1. INTRODUÇÃO 6
4
X 4
X 4
X 4
X 4
X 5 X
X 4
X1j + X2j + X3j + X4j + X5j = Xij
j=1 j=1 j=1 j=1 j=1 i=1 j=1
No exemplo:
5 X
X 4
Xij = 464 + 460 + 463 + 468 + 464 = 2319.
i=1 j=1
4 X
X 5
Xij = 588 + 572 + 580 + 579 = 2319.
j=1 i=1
Em geral, suponha que a tabela 1.1, tenha n linhas e m colunas, então, soma de todos elementos da
tabela é:
Xn X m
Xij .
i=1 j=1
1.7 Exercícios
1. Vericar as seguintes expressões:
P
n P
n
1 P
n
(a) [Xi (Xi + X̄) + (Xi − X̄)2 ] = 2 Xj2 , se X̄ = n Xi .
i=1 j=1 i=1
P
n
1 P
n
(b) (Xi − X̄) = 0, se X̄ = n Xi .
i=1 i=1
Pn P
n
1 P
n
(c) Xi (Xi − X̄) = (Xi − X̄)2 . se X̄ = n Xi .
i=1 i=1 i=1
Pn Pn
1 P
n
1 P
n
(d) (Xi − X̄)(Yj − Ȳ )2 = 0, se X̄ = n Xi e Ȳ = n Yi
i=1 j=1 i=1 i=1
P
n P
n
1 P
n
(e) [Xi (Xi + X̄) − X̄ 2 ] = Xi2 , se X̄ = n Xi .
i=1 i=1 i=1
Análise Descritiva
2.1 Introdução
O objetivo da estatística descritiva, já identicado anteriormente, é o de representar de uma forma
compreensível a informação contida nos dados. A necessidade de um esforço de classicação desses
dados e de síntese da informação neles contida resulta da incapacidade que, normalmente, a mente
humana tem de assimilar e interpretar conjuntos signicativos de dados que sejam apresentados de
uma forma desorganizada.
A forma de representar a informação contida numa amostra ou numa população depende antes de
tudo, da escala na qual são expressos os dados que a integram. Por essa razão, antes de analisar as
técnicas de estatística descritiva mais freqüentemente utilizadas, é apresentado uma classicação dos
dados (ou variáveis).
Qualitativo ordinal
Para esses tipos de dados é possível estabelecer uma relação de ordem entre as possíveis categorias,
por exemplo, grau de instrução de funcionários de uma empresa (1 0 grau, 20 grau, superior), opinião
de um grupo de pessoas sobre um programa de TV( ruim, regular, bom, muito bom).
8
CAPÍTULO 2. ANÁLISE DESCRITIVA 9
Qualitativo nominal
Nesses tipos de dados não há uma relação de ordem entre as possíveis categorias. Por exemplo: cor de
preferência, lugar de procedência dos estudantes de uma universidade.
Quantitativos discretos
São dados que tem um número nito ou innito enumerável de possíveis valores. Usualmente são
associados a processos de contagem, onde o resultado é representado mediante um número inteiro. Por
exemplo; número de alunos por sala de aula, número de lhos por família na cidade de Ouro Preto,
etc.
Quantitativos contínuos
São dados que têm um número innito não enumerável de possíveis valores e são representados por
números de um intervalo real. Por exemplo: Altura do aluno da turma 21, peso de crianças recém
nascidas num hospital universitário etc.
Exemplo 2.3.1 A 40 alunos que foram reprovados em alguma disciplina do semestre anterior. per-
guntado em quais disciplinas tinham sido reprovados e as respostas foram as seguintes:
Cálculo II Cálculo II Cálculo I Álgebra Estatística Estatística Cálculo II
Biologia Química Cálculo II Estatística Cálculo I Estatística Álgebra
Álgebra Estatística Cálculo II Álgebra Álgebra Cálculo I Cálculo I
Estatística Cálculo II Cálculo II Cálculo II Estatística Cálculo I Estatística
Genética Mecânica Economia Estatística Cálculo I Bioquimica Cálculo II
Cálculo I Fisica Cálculo II Quimica Física
A freqüência absoluta são o resultado de um processo de contagem das respostas obtidas entre os
40 alunos consultados. Assim, por exemplo, 10 alunos desaprovaram na disciplina de Cálculo II, 7
desaprovaram em cálculo I, etc. Observa-se que a soma das freqüências absolutas é igual ao número
total de alunos consultados ou também chamada de tamanho da amostra a qual será denotado por n.
P
k
Suponha que um conjunto de dados qualitativos tenha k categorias (no exemplo k = 5) então fi = n
i=1
CAPÍTULO 2. ANÁLISE DESCRITIVA 10
Para uma análise mais simples da informação é conveniente a representação dos dados mediante grá-
cos. Como foi dito anteriormente, existe uma grande diversidade de representações grácas, sendo
as mais simples e freqüentes os grácos de barras (horizontais e verticais) e os grácos circulares (ou
"pizza"). Para a elaboração do gráco de barras é construído um sistema de eixos cartesianos XY . No
eixo vertical se forma uma escala para representar a magnitude de algum tipo de freqüência; em geral,
utilizam-se as freqüências percentuais. No eixo horizontal, uma escala para representar as respostas
obtidas mediante barras verticais. A amplitude de cada barra é a mesma e é deixando um espaço
entre cada barra. A altura de cada barra deve ser igual à magnitude da freqüência correspondente a
cada um dos dados e que é representada no eixo vertical. É conveniente colocar rótulos aos eixos que
permitam entender melhor a informação. O gráco de barras verticais para os dados do exemplo 2.3.1,
é apresentado na gura 2.1.
Para a elaboração de grácos circulares devem ser calculados os ângulos de cada região circular que
são associados a cada resposta. Para isto, multiplica-se cada freqüência relativa por 360. Por exemplo,
para o caso de cálculo II, o ângulo da região circular utilizada para representar essa resposta é α1 =
360fr1 = 360×0, 25 = 90o . Uma vez determinados os ângulos das regiões o gráco é construído partindo
do eixo de referência, usualmente o eixo associado 0o ou 90o e representando as regiões circulares uma
a uma. Para uma adequada identicação é conveniente colocar um rótulo de identicação ao lado de
cada região e a freqüência que correspondente a cada resposta. O gráco circular para os dados do
exemplo 2.3.1 é apresentado na gura 2.2.
CAPÍTULO 2. ANÁLISE DESCRITIVA 11
Podem ser utilizados, também, efeitos tridimensionais para obter uma melhor apresentação. Por
exemplo, o gráco anterior pode ser mostrado como:
Para organizar e representar dados qualitativos ordinais, geralmente, ordena-se as categorias dos
dados em ordem de maior a menor hierarquia.
Para dados quantitativos discretos cujo número de resultados possíveis não é grande ( não é maior que
12 ou 15), a informação pode ser classicada e representada diretamente sem perda de informação da
mesma.
Nesses casos, primeiro ordena-se a informação segundo sua magnitude e, em seguida obtém-se as
freqüências absolutas associadas a cada valor observado. As freqüências relativas e percentuais são
obtidas de forma similar à descrita na seção anterior.
Para representar, gracamente um conjunto de dados quantitativos discretos é construído um sistema
de eixos cartesianos XY . No eixo vertical, utiliza-se uma escala para representar a magnitude de algum
tipo de freqüência; em geral consideram-se as freqüências percentuais. No eixo horizontal, utiliza-se
uma escala para representar os valores observados. Logo, para cada um dos dados na escala horizontal
levanta-se um segmento de reta vertical cuja magnitude é determinada pela freqüência correspondente.
Exemplo 2.3.2 Com a nalidade de estudar o número de emergências que chegam a um hospital por
dia, o administrador de um hospital selecionou uma amostra 50 dias, ao acaso, dos arquivos de um
hospital. Os dados são os seguintes:
CAPÍTULO 2. ANÁLISE DESCRITIVA 12
2 2 1 1 3 4 6 7 0 0 0 1 1 1 2 2 1 0
0 0 0 5 5 1 2 2 1 1 1 2 1 3 4 4 4 1
2 1 1 1 2 2 2 4 5 0 0 0 2 1
dias observou-se que o número de emergências foi igual a 3, etc. Na tabela 2.2, tem-se a correspondente
distribuição de freqüências. E, na gura 2.4, é mostrada a representação gráca dos dados do exemplo
2.3.2.
Quantitativos contínuos
Quando os dados em estudo são do tipo quantitativo contínuo, que assume muitos valores distintos,
é conveniente agrupá-los em intervalos de classe. Mesmo correndo o risco de perder algum detalhe
manifestado na ordenação de valores individuais, há vantagem em resumir os dados originais em uma
distribuição de freqüência, onde os valores observados não mais aparecerão individualmente, mas agru-
pados em classe.
Quando se considera intervalos de classe de igual amplitude, o procedimento é o seguinte:
1. Deve-se estabelecer o número de intervalos de classe ( k ) que se vai utilizar. Tal número é
recomendado que esteja entre 5 e 15. Não existe uma regra xa para determinar o número ótimo
de intervalos. O critério do pesquisador tem um papel importante na determinação do mesmo.
Como referência, pode-se utilizar a regra de Surges, que indica que o número de intervalos de
classe é dado por:
k = 1 + 3, 3 log10 (n),
onde n é o número de observações (ou tamanho da amostra). [O valor k deve ser arredondado
ao número inteiro mais próximo].
A = Xmax − Xmin ,
onde Xmax é o valor da observação de maior magnitude e Xmin a observação de menor magnitude.
CAPÍTULO 2. ANÁLISE DESCRITIVA 14
É necessário levar em conta que as freqüências estão associadas aos intervalos e não às observações,
como foi considerado anteriormente para dados qualitativos e quantitativos discretos.
Para representar gracamente, a informação pode ser usada qualquer tipo de freqüência. Em especial,
recomenda-se utilizar a freqüência relativa ou percentual que permite analisar a informação indepen-
dente do número de observações. Além disso, é possível comparar os resultados com os obtidos em
estudos similares sempre que os intervalos de classe forem iguais, ou, ao menos, similares.
O procedimento descrito anteriormente pode ser aplicado também quando se tem dados quantitativos
discretos cujo número de resultados possíveis é grande ( maior que 20 ) e sua representação gráca,
através dos procedimentos descritos na seção anterior não é apropriada.
Exemplo 2.3.3 Os seguintes dados representam a quantidade de hemoglobina (Hb) em g/dl encon-
trados em 40 animais expostos a um produto tóxico.
5,2 10,2 7,0 7,1 10,2 8,3 9,4 9,2 5,4 8,1
6,5 7,1 6,6 7,8 6,8 7,2 8,4 9,6 8,7 7,3
8,5 5,7 6,4 10,1 8,2 9,0 7,8 8,2 7,8 6,6
5,3 6,2 9,1 8,6 7,0 7,7 8,3 7,5 9,8 7,5
Histograma de freqüência
Primeiramente é construído um sistema de eixos cartesianos XY. No eixo vertical, é usada uma escala
para representar a magnitude do tipo freqüência. Em geral, utilizam-se as freqüências relativas ou
percentuais ou densidades. No eixo horizontal é usada uma escala para representar os intervalo de
classe. Logo, para cada intervalo de classe na escala horizontal é construído um retângulo cuja altura
é determinada pela freqüência usando. Por exemplo, com as freqüências percentuais da tabela 2.3, é
obtida a seguinte representação gráca:
Polígono de freqüências
No sistema de eixos cartesianos XY , no eixo vertical é usada uma escala para representar a magnitude
de algum tipo de freqüência. Em geral, consideram-se as freqüências relativas ou percentuais. No
eixo horizontal é usada uma escala para os valores da variável em estudo. Logo, plotam-se os pontos
(Xi0 , fri ), i = 1, . . . , k. É considerando, também, dois intervalos adicionais: um anterior ao primeiro
e outro posterior ao último intervalo de classe, cada um deles com uma freqüência zero. Por último,
os pontos plotados são unidos por uma linha reta obtendo, assim, um polígono de freqüências. Por
exemplo, com as freqüências percentuais da tabela 2.3 tem-se:
No sistema de eixos cartesianos XY , no eixo vertical é usada uma escala para representar a freqüência
acumulada. Em geral, consideram-se as freqüências relativas ou percentuais. No eixo horizontal é usada
CAPÍTULO 2. ANÁLISE DESCRITIVA 17
uma escala para os valores da variável em estudo. Logo, plotam-se os pontos (LSi , Fri ), i = 1, . . . , k. É
considerando, adicionalmente, o ponto (LI1 , Fr0 ), com Fr0 = 0. Por último, unem-se os pontos plotados
obtendo um polígono de freqüências acumuladas (ogiva). Por exemplo, com as freqüências percentuais
da tabela 2.3, tem-se a ogiva mostrada na gura 2.7
2.4.1 Média
A média de um conjunto de observações é denida como a soma de todas as observações dividida pelo
número de observações. Isto é,
N
1 X
Média populacional : µ = Xi (2.1)
N
i=1
Xn
1
Média Amostral : X̄ = Xi (2.2)
n
i=1
onde
Xi : Valor da i-ésima observação da variável em estudo.
CAPÍTULO 2. ANÁLISE DESCRITIVA 18
N : Tamanho da população.
n: Tamanho da amostra.
Essa medida de posição apresenta a desvantagem de ser fortemente inuenciada por valores discrepan-
tes, isto é, valores muito pequenos ou muito elevados. Portanto, nesse caso essa medida já não será
um valor representativo do conjunto de dados.
Propriedades
1. A soma dos desvios das observações em relação à média é igual a zero. Isto é,
n
X
(Xi − X̄) = 0
i=1
2. A soma de quadrados dos desvios das observações em relação à média é mínima, ou seja,
n
X
(Xi − X̄)2 , é um valor minímo.
i=1
Isto é,
n
X n
X
2
(Xi − X̄) ≤ (Xi − k)2 , k ∈ R.
i=1 i=1
CAPÍTULO 2. ANÁLISE DESCRITIVA 19
Figura 2.7: Polígono de freqüências acumuladas (ogiva) para a quantidade de hemoglobina de animais
expostos a um produto tóxico
3. Para k 6= 0 ∈ R.
• Se Yi = Xi ± k, então Ȳ = X̄ ± k,
• Se Yi = kXi , então Ȳ = k X̄ ,
Xi X̄
• Se Yi = k , então Ȳ = k,
onde
Xi0 : O i-ésima marca de classe da variável em estudo.
fi : Freqüência absoluta do intervalo i.
fri :Freqüência relativa do intervalo i.
k : Número de intervalos de classe.
N : Tamanho da população.
n: Tamanho da amostra.
CAPÍTULO 2. ANÁLISE DESCRITIVA 20
onde
Xi : Valor observado i da variável em estudo.
fi : Freqüência absoluta do valor observado i
fri :Freqüência relativa do valor observado i.
k : Número de valores da variável em estudo.
Exemplo 2.4.2 Considere os dados do exemplo 2.3.3, que representam a quantidade de hemoglobina
(Hb) em g/dl encontrados em 40 animais expostos a um produto tóxico.
5,2 10,2 7,0 7,1 10,2 8,3 9,4 9,2 5,4 8,1
6,5 7,1 6,6 7,8 6,8 7,2 8,4 9,6 8,7 7,3
8,5 5,7 6,4 10,1 8,2 9,0 7,8 8,2 7,8 6,6
5,3 6,2 9,1 8,6 7,0 7,7 8,3 7,5 9,8 7,5
P
n
Xi
i=1
X̄ =
n
5, 2 + 10, 2 + · · · + 7, 5 311.4
= = = 7, 785 g/dl.
40 40
Logo, a quantidade média de hemoglobina em animais expostos a um produto tóxico é 7,785 g/dl
Os resultados anteriores (obtidos em (a) e (b)) não são iguais. Isto porque em (b) foram usadas as
marcas de classe como valores representativos das observações. Quando tem-se dados agrupados em
TDF, a média é obtida assumindo que a marca de classe é igual à média das observações classicadas
em cada intervalo. Obviamente, na prática, isto ocorre raras vezes e, portanto, o valor obtido é uma
aproximação do valor da média obtida como a soma de cada uma das observações.
Média ponderada
Exemplo 2.4.3 Suponha que os custos de produção e as quantidades produzidas por três liais A, B
e C de uma empresa são:
Custo de produção (Xi ) Quantidade produzida (Wi )
Filial unidades monetárias (u.m) (número de unidades)
A 1,20 500
B 1,60 200
C 1,05 900
O custo médio de produção por unidade produzida para a empresa em seu conjunto é:
(500)(1, 20) + (200)(1, 60) + (900)(1, 05) 1865
X̄p = = = 1, 1656 (u.m)
500 + 200 + 900 1600
Esse valor indica que o custo médio de produção por artigo para a empresa é de 1,1656 unidades
monetárias por cada unidade produzida. Se, ao invés dessa média, fosse calculada a média aritmética,
1, 20 + 1, 60 + 1, 05 3, 85
X̄ = = = 1, 2833 (u.m)
3 3
Esse valor indicaria que o custo de produção por artigo das liais é de 1,2833 unidades monetárias,
supondo de que as três liais produzem a mesma quantidade de artigos. Para nosso exemplo essa
suposição não é verdadeira.
Essa média é usada na elaboração de números índices e para o cálculo de taxa média de variação.
Exemplo 2.4.4 Suponha que uma fábrica teve um incremento em sua produção de: 15% no ano
1998, 10% em 1999 e 16% em 2001. Achar o crescimento médio anual.
Essa média tem a particularidade de que os valores discrepantes a afetam em menor intensidade as
outras médias.
20 120
V̄ = 10 10 = 3 = 40 km/h
30 + 60
É interessante observar que essa média pode ser calculada como uma média harmônica de 30 e 60 ,
isto é:
2
X̄H = 1 1 = 40 km/h.
30 + 60
2.4.4 Mediana (M d)
É uma medida de posição que divide o conjunto de observações, previamente ordenadas de acordo a
sua magnitude (crescente ou decrescente), em dois grupos de tal modo que 50% das observações são
menores que a mediana e os outros 50% são maiores.
Suponha que Y1 , Y2 , . . . , Yn seja um conjunto de n observações ordenadas em forma crescente, isto é,
Y1 ≤ Y2 ≤ · · · ≤ Yn . A mediana denida como
(
Y n+1 , se n impar
Md = 2
Y n +Y n +1
2
2
2
, se n par
CAPÍTULO 2. ANÁLISE DESCRITIVA 23
Exemplo 2.4.6 Consideram-se duas amostras constituídas pelos dados apresentados a seguir e já
ordenadas:
Y 4 +Y 4 +1
Y2 +Y3
a)Y1 = 2, 0,Y2 = 3, 2, Y3 = 4, 5, Y4 = 4, 6 n = 4; é par então M d = 2
2
2
= 2 = 4, 5
b)Y1 = 2,Y2 = 3, Y3 = 5, Y4 = 6, Y5 = 10; n = 5 é ímpar então M d = Y 5+1 = Y3 = 5.
2
Propriedades
Isto é,
n
X n
X
|Xi − M d| ≤ |Xi − h|, h ∈ R.
i=1 i=1
2. Para k 6= 0 ∈ R.
• Se Yi = Xi ± k, então M dY = M dX ± k,
• Se Yi = kXi , então M dY = kM dX ,
Xi M dX
• Se Yi = k , então M dY = k ,
A mediana para dados quantitativos contínuos agrupados em TDF é obtida da seguinte forma:
· ¸
n/2 − Fi−1
M d = LIi + h
fi
onde
i: é classe mediana, posição (n + 1)/2.
a classe mediana é o intervalo de classe onde
na coluna das Fi superou o 50% dos dados.
LIi : limite inferior da classe mediana.
Fi−1 : freqüência acumulada absoluta da classe
anterior à classe mediana.
fi freqüência absoluta da classe mediana
Exemplo 2.4.7 Considerando os dados da TDF do exemplo 2.4.2, o intervalo que contém a classe
mediana é i = 3 uma vez que a freqüência absoluta dessa classe é maior que 50% dos dados ( maior a
20 ). Portanto
µ ¶ µ ¶
n/2 − F2 20 − 10
me = LI3 + h = 7, 0 + (0, 9) = 7, 75 g/l
f2 12
Esse resultado indica que 50% dos animais expostos a um certo tóxico têm quantidades de hemoglobina
menor que 7,75 g/dl e os outros 50% dos animais observados têm quantidades de hemoglobina superior
a 7,75 g/dl.
CAPÍTULO 2. ANÁLISE DESCRITIVA 24
2.4.5 Moda
A moda de um conjunto de observações é denida como o valor, classe ou categoria que ocorre com
maior freqüência. A moda populacional é denotada por M o e a moda amostral denotada por mo.
Propriedades
2. Aplica-se tanto para dados do tipo qualitativo quanto para do tipo quantitativo.
A moda para dados quantitativos contínuos agrupados em TDF é obtida da seguinte forma:
· ¸
d1
mo = LIi + h
d1 + d2
onde
i: classe modal. A classe modal é idenditicada
pela freqüência absoluta (fi ) com maior valor.
LIi : limite inferior da classe modal.
d1 : é a diferença entre a freqüência absoluta da
classe modal e freqüência absoluta anterior, ou seja, d1 = (fi − fi−1 ).
d2 é a diferença a freqüência absoluta da classe modal
e freqüência absoluta posterior à classe modal,
ou seja, d2 = (fi − fi+1 ).
Exemplo 2.4.9 Considerando os dados da TDF do exemplo 2.4.2, o intervalo que contém a classe
modal é i = 3 uma vez que é o intervalo de classe de maior freqüência absoluta (f3 = 12). Portanto,
i = 3, d1 = f3 − f2 = 12 − 6 = 6 e d2 = f3 − f4 = 12 − 9 = 3
· ¸ · ¸
d1 6
mo = LIi + h = 7, 0 + (0, 9) = 7, 6 g/dl.
d1 + d2 6+3
Esse valor indica que a quantidade de hemoglobina mais freqüente entre os animais observados estão
ao redor de 7,6 g/dl.
CAPÍTULO 2. ANÁLISE DESCRITIVA 25
Exemplo 2.4.10 A seguir são apresentada 20 observações do tempo de falha, em horas de um ma-
terial, 204 228 252 300 324 444 624 720 816 912 1176 1296 1392 1488 1512 2520 2856 3192 3528
3710
A mediana, já que n = 20 é pa é:
912 + 1176
M d = Q2 =
2
O primeiro quartil deve ter 25% dos dados abaixo dele ou, nesse exemplo, pelo menos 5 observações
abaixo dele, e 75% dos dados acima dele ou menos de 15 de observações de seu valor acima dele. A
quinta e sexta observação satisfazem essa denição de modo que Q1 é denido como a média dessas
observações
324 + 444
Q1 = = 384
2
Similarmente, o terceiro quartil deve ter s 75% dos dados abaixo dele ou pelo menos 15 observações
abaixo de seu valor, e 25% dos dados acima ou pelo menos 5 observações acima dele. As observações
15 e 16 satisfazem essa denição. Portanto,
1512 + 2520
Q1 = = 2016
2
Denição 2.4.1 (Percentil) O percentil Pp , é um valor que divide um conjunto de observações or-
denados de forma crescente (ou decrescente) em duas partes, o 100p% dessas observações com valores
inferiores (superiores) a Pp , e o 100(1−p)% com valores superiores (inferiores) a Pp . Sendo 0 < p < 1.
Observe que:
Q1 = P0,25
Q3 = P0,75
O percentil Pp para dados quantitativos contínuos agrupados em TDF é obtido da seguinte forma:
· ¸
np − Fi−1
Pp = LIi + h, 0 < p < 1
fi
onde
CAPÍTULO 2. ANÁLISE DESCRITIVA 26
i: classe percentil,
a classe percentil é o intervalo de classe onde se supera
por primeira vez o (np) dos dados, isto é, Fi > np ou Fri > p
LIi : limite inferior da classe percentil.
Fi−1 : freqüência acumulada absoluta da classe
anterior à classe percentil.
fi freqüência absoluta da classe percentil
Exemplo 2.4.11 Considerando os dados da TDF do exemplo 2.4.2, o valor do percentil P0,8 encontra-
se na classe i = 5 pois sua freqüência acumulada é maior de nk = 40 × 0, 8 = 32. Isto é, F5 = 35 >
nk = 32. Portanto,
· ¸ · ¸
32 − F4 32 − 31
P0,8 = LI5 + h = 8, 8 + (0, 9) = 8, 98 g/dl
f5 5
Esse valor indica que em 80% dos animais observou-se uma quantidade menor que 8,89 g/dl e no 20%
restante dos animais observou-se uma quantidade superior a 8,89 g/dl.
A = Xmax − Xmin .
Para as três amostras de resistência à tensão dadas anteriormente, a amplitude da primeira amostra
é A1 = 165 − 130 = 35, para a segunda amostra é A2 = 0, enquanto para a terceira amostra é
A3 = 205 − 90 = 115. Desses resultados é claro que, quanto maior for a amplitude, maior será a
variabilidade nos dados.
CAPÍTULO 2. ANÁLISE DESCRITIVA 27
2.5.3 Variância
É uma medida de dispersão absoluta das observações. É dada pela soma das diferenças quadráticas
das observações em relação a sua média dividida pelo número total de observações. A variância
populacional é denotada pela letra grega σ 2 e variância amostral por S 2
Populacional:
P
N P
N P
N
(Xi − µ)2 Xi2 − N µ2 Xi2
i=1 i=1 i=1
σ2 = = = − µ2 .
N N N
Amostral:
2
P
n
P
n P
n P
n Xi
(Xi − X̄)2 Xi2 − nX̄ 2 Xi2 − i=1
n
2 i=1 i=1 i=1
S = = = .
n−1 n−1 n−1
CAPÍTULO 2. ANÁLISE DESCRITIVA 28
onde
Xi : Valor da i-ésima observação da variável em estudo.
X̄ : Média amostral.
µ: Média populacional.
N : Tamanho da população.
n: Tamanho da amostra.
Populacional:
v v v
uN uN uN
uP uP 2 uP 2
u (Xi − µ)2 u 2 u
√ t i=1 t i=1 Xi − N µ t i=1 Xi
σ= σ2 = = = − µ2 .
N N N
Amostral:
v
v v u n
P
2
uP uP u n Xi
u n u n u P
√ u (Xi − X̄)2 u Xi2 − nX̄ 2 u
t Xi2 − i=1n
t t
S = S 2 = i=1 = i=1 = i=1 .
n−1 n−1 n−1
As unidades de medida da variância são iguais ao quadrado das unidades de medida da variável. Assim,
se X é medido em libras por polegada quadrada (psi), a unidade da variância amostral são (psi)2 . O
desvio padrão tem a propriedade de medir a variabilidade nas mesmas unidades que a variável de
interesse X .
Exemplo 2.5.1 Na tabela 2.4, são apresentados as quantidades necessárias para cálculo da variância
e do desvio padrão amostral, para os dados da amostra 1.
A variância amostral é:
790 790
S2 = = = 158 (psi)2 .
6−1 5
Enquanto que, o desvio padrão é: √
S= 158 = 12, 57 psi.
Alternativamente pode ser calculado a variância amostral utilizando a fórmula alternativa dada na
denição de S 2 : 2
P
n
P
n Xi
Xi2 − i=1
n
i=1
S2 = . (2.7)
n−1
CAPÍTULO 2. ANÁLISE DESCRITIVA 29
888
x̄ = 6 = 148
Exemplo 2.5.2 Na tabela 2.5, são apresentadas as quantidades necessárias para cálculo da variância
usando a fórmula (2.7).
Observação 2.5.1 A variância e o desvio padrão são utilizados para comparar a variabilidade de con-
juntos de dados expressados nas mesmas unidades, com médias que sejam aproximadamente similares.
Exemplo 2.5.3 Deseja-se comparar a renda mensal do ano 2000 de duas empresas.
Empresa A: µA = 450.000 2 = 2.500
σA
Empresa B: µB = 400.000 2 = 5.000
σB
Então pode-se armar que a renda mensal em 2000 da empresa B apresenta maior variabilidade que
2 < σ2 )
da empresa A (σA B
CAPÍTULO 2. ANÁLISE DESCRITIVA 30
Exemplo 2.5.4 A variância e o desvio padrão amostral para os dados das três amostras de alheação
de alumínio-lítio do exemplo desta são apresentados abaixo:
Populacional:
σ
CV =
µ
onde
µ: Média populacional.
σ : Desvio padrão populacional.
Amostral:
S
cv =
X̄
onde
X̄ : Média amostral.
S : Desvio padrão amostral
Exemplo 2.5.5 Considere a altura (em metros) e peso (em kg) de uma amostra de alunos.
Pode-se observar que as características (altura e peso)tem diferentes unidades e nada pode ser dito a
respeito de sua variabilidade, mas,
0, 085
cvAltura = × 100% = 5%
1, 70
7
cvP eso = × 100% = 10%
70
Os alunos são duas vezes mais dispersos quanto ao peso do que à altura.
Exemplo 2.5.6 Considere os pesos (em kg) de uma amostra de meninos de 11 anos de idade e de
uma amostra de homens de 25 anos de idade.
Média Desvio Padrão
Homens 66 ,0 4,5
Meninos 36,0 4,5
Aparentemente as duas amostras tem a mesma variabilidade, porem,
4, 5
cvH = × 100% = 6, 8%
66, 0
4, 5
cvM = × 100% = 12, 5%
36, 0
Os pesos dos meninos apresentam uma dispersão maior que dos adultos.
Amplitude
A = LSk − LI1
onde LSk é o limite superior da k -ésima classe e LI1 é o limite inferior da primeira classe.
Variância
Populacional:
P
k P
k P
k 0
(Xi0 − µ)2 fi Xi 02 fi − N µ2 Xi 2 fi
i=1 i=1 i=1
σ2 = = = − µ2 .
N N N
Amostral: " #2
P
k
Xi0 fi
P
k P
k P
k 0 i=1
(Xi0 − X̄)2 fi Xi 02 fi − nX̄ 2 Xi 2 fi − n
i=1 i=1 i=1
S2 = = = .
n−1 n−1 n−1
onde Xi0 é a i-ésima a marca de classe (ou ponto médio do intervalo de classe), fi é a i-ésima freqüência
absoluta, n é o tamanho da amostra e N é o tamanho da população. Para dados quantitativos
discretos organizados em TDF as expressões para a variância são similares mas considerando Xi0 = Xi .
CAPÍTULO 2. ANÁLISE DESCRITIVA 32
Desvio padrão
√ √
Populacional: σ= σ2 Amostral: S= S2
Exemplo 2.5.7 Considere a TDF do exemplo 2.4.2, referente a quantidade de hemoglobina (g/dl) de
animais expostos a certo tóxico:
Amplitude
A = 10, 6 − 5, 2 = 5, 4
Variância:
2518, 54 − (313, 3)2 /40
S2 = = 1, 6569 (g/dl)2
39
Desvio padrão:
S = 1, 2872 g/dl
Esse resultado indica que a quantidade de hemoglobina em animais expostos a certo tóxico apresenta
uma dispersão em relação a sua média (7,8325) de 1, 2872 g/dl.
Coeciente de variabilidade:
S 1, 2872
cv = = = 0, 1643
X̄ 7, 8325
Esse valor indica que a quantidade de hemoglobina em animais expostos a um certo tóxico, apresenta
uma variabilidade relativa de 16, 43%.
2.6 Boxplot
O boxplot é um gráco que fornece uma visualização da distribuição dos dados, além de permitir de-
tectar rapidamente uma possível assimetria dessa distribuição. Sua construção é baseada nas seguintes
medidas: na mediana, no primeiro e terceiro quartis, e nos valores extremos. A forma desse gráco
tem as seguintes características (veja a gura 2.9):
a) A caixa ("box") é delimitada pelo primeiro (Q1 ) e terceiro (Q3 ) quartis. A linha interior da caixa
corresponde a mediana (me = Q2 ).
b) A partir dos limites da caixa, considera-se duas linhas auxiliares que distam 1,5 o intervalo
interquartil d = Q3 − Q1 . Essas linhas não aparecerão no gráco nal. Elas servem para
caracterizar os valores discrepantes que são os valores menores que Q1 − 1, 5d ou valores maiores
que Q3 + 1, 5d. Os valores discrepantes serão representados no gráco com asteriscos (∗).
CAPÍTULO 2. ANÁLISE DESCRITIVA 33
c) Os limites do gráco, representados por uma linha à direita e à esquerda ("bigodes") da caixa,
correspondem ao maior e ao menor valores não discrepantes do conjunto de dados.
Observação 2.6.1 A caixa contém 50% dos valores (25% de cada lado da mediana). Outros 50% dos
valores estão praticamente divididos entre o "bigode"direito e "bigode"esquerdo.
Observação 2.6.2 O boxplot também pode-se representar em forma vertical, como mostra a gura
2.11.
4,4 5,2 4,5 4,6 4,1 4,3 4,3 4,8 5,0 4,4
4,7 2,5 3,6 3,8 4,9 5,4 4,5 4,7 3,1 4,2
3,9 5,7 5,3 4,5 4,7 3,3 3,7 4,3 4,9 5,0
4,5 4,7 3,4 4,3 3,9 5,6 5,3 4,8 4,0 3,5
4,2 4,3 5,0 6,3 4,6 4,2 3,6 3,8 4,0
(a) Construa a tabela de distribuição de freqüências com intervalos de classe do mesmo com-
primento e usando a regra de Sturges.
(b) Interpretar:
(i) A marca de classe do segundo intervalo.
(ii) A freqüência absoluta de segundo intervalo de classe.
(iv) A freqüência relativa percentual do terceiro intervalo de classe.
(v) A freqüência acumulada relativa do quarto intervalo de class.
(c) Desenhe o histograma e polígono de freqüências relativas.
(d) Que porcentagem de donas de casa assistem televisão mais de 4,8 horas diárias?(considere
a TDF)
(e) Qual é a quantidade mínima de horas que uma dona de casa deve assistir televisão para
pertencer aos 14,2% das donas de casa que menos assistem televisão?
Solução
a) Construção da tabela de distribuição de freqüências absolutas e relativas:
n = 49 k = 1 + 3, 3 log(49) = 6.57765
⇒ k = 7 (arredondamento simples)
A 3, 8
= h= = 0, 542857 ≈ 0, 6
k 7
(arredondamento por excesso ao um número igual ao de cifras decimais dos dados)
(3) Cálculos dos limites dos intervalos de classe
LI1 = Xmin = 2, 5, LS1 = LI1 + h = 2, 5 + 0, 6 = 3, 1
LI2 = LS1 , LS2 = LI2 + h = 3, 1 + 0, 6 = 3, 7
LI3 = LS2 , LS3 = LI3 + h = 3, 7 + 0, 6 = 4, 3
LI4 = LS3 , LS4 = LI4 + h = 4, 3 + 0, 6 = 4, 9
LI5 = LS4 , LS5 = LI5 + h = 4, 9 + 0, 6 = 5, 4
LI6 = LS5 , LS6 = LI6 + h = 5, 4 + 0, 6 = 6, 0
LI7 = LS6 , LS7 = LI7 + h = 6, 0 + 0, 6 = 6, 7
(4) Obtenção das marcas de classe (Xi0 ). É possível mostrar que a marca de classe satisfaz as
seguintes relações que são de muita utilidade.
LIi + LSi h h
Xi0 = 0
; Xi+1 = Xi0 + h; LSi = Xi0 + ; LIi = Xi0 −
2 2 2
CAPÍTULO 2. ANÁLISE DESCRITIVA 36
Por exemplo:
LIi + LSi 3, 1 + 3, 7
Xi0 = = = 3, 4.
2 2
Desse modo calcula-se as marcas de classe restantes.
(5) Efetua-se a contagem para alocar cada observação (dado) ao intervalo que lhe corresponde.
Determina-se as freqüências absolutas (fi ). Dos dados obtemos: f1 = 1, f2 = 6, f3 = 11,
f4 = 19, f5 = 9, f6 = 2, f7 = 1.
(6) Determinação das freqüência relativas(fri ) para cada intervalo ”i”
Pk
fri = fni , Além disso, i=1 fri .
fr1 = 1/49 = 0, 020, fr2 = 0, 122, . . . , fr7 = 0, 020
(7) Determinação das freqüências acumuladas absolutas(Fi )
Fi = Fi−1 + fi , i = 1, 2, . . . , k , com Fk = n.
F1 = 1, F2 = 1 + 6 = 7, F3 = 7 + 11 = 18, . . . , F7 = 49 = n
(8) Determinação das freqüências acumuladas relativas (Fri )
Tem-se as seguintes relações para Fri :
P
Fri = ij=1 frj ; Fr1 = fr1 , Fr1 = Fn1 , Fri = Fri−1 + fri , i = 1, . . . , k
Fr1 = 1/49 = 0, 020, Fr2 = 0, 020 + 0, 122 = 0, 142, . . . , Fr7 = 1
Na tabela 2.6, são apresentados a distribuição de freqüências do número de horas por dia que as
49 donas de casa entrevistadas assistem televisão:
Tabela 2.6: Distribuição do número de horas diárias que as 49 donas de casa entrevistadas assistem
televisão
Número de horas Xi0 fi fri pi Fi Fri Pi
2, 5 ` 3, 1 2,8 1 0,020 2,00 1 0,020 2,00
3, 1 ` 3, 7 3,4 6 0,122 12,20 7 0,142 14,20
3, 7 ` 4, 3 4,0 11 0,224 22,40 18 0,367 36,70
4, 3 ` 4, 9 4,6 19 0,388 38,80 37 0,755 75,50
4, 9 ` 5, 5 5,2 9 0,184 18,40 46 0,939 93,90
5, 5 ` 6, 1 5,8 2 0,041 4,10 48 0,979 97,9
6, 1 ` 6, 7 6,4 1 0,020 2,00 49 1,00 100
Total 49 1,00 100,0
(i) X20 = 3, 4; há 6 donas de casa que em média assistem televisão 3,4 horas por dia.
(ii) f4 = 19; há 19 donas de casa assistem televisão entre 4,3 e 4,8 horas por dia.
(iii) p3 = 22, 4%; 22,4% das donas de casa assistem TV entre 3,8 e 4,3 horas por dia.
(iv) P4 = 75, 5%; 75,5 % das donas de casa entrevistadas assistem TV menos de 4,8 horas ao
dia.
(c) A partir da tabela 2.6, são construídos o histograma e o polígono de freqüências relativas em
porcentagens.
CAPÍTULO 2. ANÁLISE DESCRITIVA 37
(d) Para determinar a percentagem de donas de casa que assistem TV mais de 4,8 horas considere
o gráco do histograma de freqüência de densidade para esses dados. Essa freqüência é área
hachurada no gráco de densidade da gura 2.12, o qual é completamente determinada se obtemos
o valor de x.
Figura 2.12: Gráco de distribuição de densidade do números de horas que as donas de casa assistem
TV.
Inicialmente na gura 2.13, é representado o boxplot para os comprimentos de peixes machos e fêmeas.
Dessa gura, pode-se observar que há diferenças nos comprimentos de peixes machos e fêmeas. O valor
mediano dos comprimentos dos peixes estão próximos, mas as medidas dos comprimentos dos peixes
machos apresentam maior variabilidade que as dos peixes fêmeas.
Na tabela 2.7, são apresentados algumas medidas descritivas, para os dados do exemplo. A tabela
conrma as armações feitas inicialmente.
2.8 Exercícios
1. Os seguintes dados são resultados de uma amostra aleatória de quantidade de hemoglobina (Hb)
no sangue, em g/dl (gramas por decilitro),encontrados em 30 pacientes entre 15 - 20 anos, que
foram ao laboratório central de um Hospital:
20.8 27.8 26.2 21.6 23.3 23.5 26.1 26.5 20.0 24.7 21.7 28.2
25.0 23.4 24.5 27.9 25.7 24.8 26.8 25.5 25.3 22.3 21.2 26.0
23.8 22.5 23.7 24.9 25.2 24.4
3. Uma Empresa Farmacêutica classica os seus empregados de acordo com o grau de instrução,
assim foi obtido dos seguintes resultados:
Grau de instrução N o de empregados Gastos total mensal
com remunerações
Primeiro grau 15 1950
Segundo grau 35 6650
Nível Superior 50 14000
(a) Que medida de posição recomendamos para a variável grau de instrução dos empregados?
(b) Achar a remuneração mensal média dos empregados.
(c) Se a empresa decidir dar um aumento mensal aos empregados de acordo com os seguinte
critérios e apartir de 01/05/2000
(i) Cada empregado terá um aumento de 40 u.m. mensais
CAPÍTULO 2. ANÁLISE DESCRITIVA 40
4. A continuação apresenta-se o rendimento (%) de uma reação para a fabricação de uma substância
química, em 80 bateladas consecutivas produzidas por uma industria:
81,8 87,1 82,7 79,8 81,3 79,5 88,5 75,9 81,6 73,9
85,5 87,1 82,0 79,3 82,5 87,1 83,0 87,3 79,7 82,0
83,6 84,5 80,4 78,1 86,4 76,7 83,7 78,4 76,0 80,9
80,2 78,9 77,4 78,5 82,9 81,9 80,7 78,4 78,0 81,4
84,6 79,5 83,2 80,5 80,7 79,0 90,9 79,9 86,8 80,1
83,2 78,2 80,4 85,5 85,5 79,3 83,0 78,1 83,4 83,6
85,7 86,8 86,5 83,8 86,8 83,5 79,9 76,6 84,3 78,5
74,4 71,8 79,1 82,1 84,5 78,4 80,7 70,7 78,5 85,2
(a) Construa uma tabela de freqüências com intervalos de classe do mesmo comprimento con-
siderando que k=7.
(b) Obtenha e interprete:
(i) A marca de classe do quarto intervalo de classe.
(ii) A freqüência absoluta do segundo intervalo de classe.
(iii) A freqüência acumulada percentual do segundo intervalo de classe.
(c) Desenhe o histograma de freqüências percentuais e descreve as principais características dos
dados.
(d) Obtenha e interprete a média, mediana, moda e desvio padrão.
5. Para cinco volumes de uma solução foram medidos os tempos de aquecimento em um mesmo
bico de gás e as respectivas temperaturas. O resultado foi a seguinte:
Tempo (min.): 22 20 19 23 17
Temperatura (0C): 75 80 78 84 78
Qual das duas variáveis apresenta uma maior variabilidade? Justique.
6. Um artigo publicado na Food Tecnology Journal (1956), descreve um estudo sobre o conteúdo
de protopectina em tomates durante o armazenamento. Para o qual considerou-se dois períodos
de armazenamento e analisou-se as amostras de nove lotes de tomates em cada período, obtendo-
se os dados abaixo:
Tempo de lotes
armazenamento. 1 2 3 4 5 6 7 8 9
7 Dias 1802.0 107.4 278.8 1275 544.0 672.2 818.0 406.8 461.6
21 dias 415.5 485.4 377.6 270.4 467.8 272.1 394.1 336.4 371.2
(d) Desenhe o Boxplot para cada um dos tempos de armazenamento. Quais são as principais
diferenças?
(e) Considerando os ítens (b) a (d) , descreva as principais diferenças nos tempos de armaze-
namento.
7. Um hospital maternidade está planejando a ampliação dos leitos para recém nascidos. Para
tal, fez um levantamento dos últimos 50 nascimentos obtendo a informação sobre o número de
dias que os bebes permanecem no hospital, antes de terem alta. Os dados, já ordenados, são
apresentados a seguir:
1 1 1 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3
3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 5
5 5 5 5 5 6 7 7 8 15
8. O índice de germinação é um dos principais fatores para denir a qualidade de sementes. Ele
é determinado em um experimento cientíco conduzido pelo fabricante e regulamentado pelos
órgãos scalizadores. Um fabricante arma que o índice de germinação de suas sementes de milho
é mais de 85%. Para vericar tal armação uma cooperativa de agricultura sorteou 100 amostras
com 100 sementes em cada uma e anotou a porcentagem de germinação em cada amostra. Os
resultados estão na tabela de abaixo.
% de germinação Freqüência
70 ` 75 5
75 ` 80 20
80 ` 85 40
85 ` 90 18
90 ` 95 12
95 ` 100 5
9. Uma maquina foi regulada para fabricar placas de 5 mm de espessura, em média, com uma
variabilidade relativa de, no máximo, 3%. Iniciada a produção, foi colhida aleatoriamente uma
amostra de tamanho 50, que forneceu a seguinte tabela de distribuição de freqüência com inter-
valos do mesmo comprimento.
CAPÍTULO 2. ANÁLISE DESCRITIVA 42
10. Um biólogo esta investigando qual o acasalamento de um determinado tipo de caramujo que
produz o maior número mediano de ovos eclodidos. Nesse sentido desenvolve um experimento
em que três grupos são investigados: Grupo1 (1 macho e 1 fêmea), Grupo 2 (2 machos e 1 fêmea)
e Grupo 3 (1 macho e 2 fêmeas). Para cada grupo, 20 acasalamento são feitos e observados o
número de ovos postos eclodidos após 14 dias de permanência. Os Boxplots correspondentes são
apresentados na gura 2.14.
(a) Qual grupo produz o maior número mediano de ovos eclodidos? Forneça uma estimativa
desse número mediano de ovos eclodidos
(b) Qual são as principais diferenças entre os 3 grupos ?. Justique.
11. Uma empresa química arma que nenhum de seus funcionários estão contaminado por chumbo,
para vericar isto a empresa faz um exame de rotina em 36 funcionários escolhido ao acaso,
CAPÍTULO 2. ANÁLISE DESCRITIVA 43
(a) Construa uma tabela de distribuição de freqüências de classe usando a regra de Sturges
(k = 1 + 3, 3 log10 (n) ) para determinar o número de intervalos de classe .
(b) Calcule as medidas de posição e diga se o nível deste metal entre os funcionários é preocu-
pante. Justique.
(c) Determine a porcentagem de funcionários que se encontra no intervalo (X̄ − S; X̄ + S) .
12. O teste do pezinho é feito para se constatar em recém nascidos uma doença genética chamada
de fenicetonúria. Este teste consiste em dosar a quantidade de um aminoácido, a fenilalanina,
que em quantidades altas no organismo pode causar dano às células, principalmente as cerebrais.
Numa maternidade, em um mesmo dia, o teste foi feito em 30 recém nascidos obtendo as seguintes
concentrações de fenilalanina em µ mol / L
133,92 174,12 170,88 244,81 142,26 206,73 156,25
224,29 145,59 214,26 175,06 205,72 144,94 171,73
147,69 168,12 182,64 186,24 206,96 143,82 173,31
116,44 208,01 110,29 197,26 212,34 180,76 189,12
167,96 144,07
(a) Construa uma tabela de distribuição de freqüências e a representação gráca dos dados
acima considerando a freqüência relativa em porcentagens. Comente as principais caracte-
rísticas destes dados.
(b) a concentração de fenilalanina permitida é de 70 a 210 µmol / L para um recém nascido
sadio. Determine a porcentagens crianças que se encontra nessa faixa.
(c) Calcule e interprete as medidas de posição para esses dados.
(d) Numa outra maternidade a concentração de fenilalanina média foi de 2,99mg/dl e variância
de S 2 = 0, 084mg 2 /dl2 . Qual das maternidade obteve maior variabilidade dos dados ?.
Justique.
13. O número de pessoas praticam a auto-medicação no Brasil são alarmantes. Para se constatar
que essa atitude é praticada por pessoas de todos os níveis sócio-econômicos e graus de instrução,
foi feito entrevistas com 20 pessoas de uma cidade do interior de Minas. Os dados obtidos foram
organizados na tabela abaixo:
CAPÍTULO 2. ANÁLISE DESCRITIVA 44
14. O cloranfenicol é um antibiótico bacteriostático, pois inibe a síntese protéica. Apesar de agir
somente em ribosomas bacterianos, este antibiótico produz efeitos colaterais e até a morte de
pessoas com sensibilidade a esta família de antibiótico. Um grupo de 1400 pacientes com infecção
por estreptococos tratado com o cloranfenicol e 800 foram retratadas com um novo antibiótico
obtendo-se os seguintes dados relacionados com o aparecimento de efeitos colaterais e óbitos.
Clorannicol Novo Antibiótico
Não apresentaram 1279 613
Apresentaram 116 184
Óbito 5 3
(a) Classique a variável em estudo. Qual dos dois antibióticos oferece menores riscos para a
saúde dos pacientes?Justique.
15. Em um laboratório de análises clínicas revelou os dados sobre o nível de glicose no soro de 50
pessoas que solicitaram esse exame. Os dados obtidos apresentados abaixo são em mg de glicose
por decilitros de soro:
181,93 145,09 132,92 124,88 118,96 110,48 100,04 89,65
181,17 143,78 130,83 124,83 118,39 108,02 95,33 88,51
167,83 141,89 129,83 122,01 116,00 105,87 95,07 85,10
152,06 137,96 129,53 121,57 115,13 103,62 93,66 83,12
149,56 136,37 128,84 121,26 114,55 102,16 92,94 80,98
145,62 134,48 124,96 119,65 111,90 100,99 92,72 78,49
62,32 76,73
(a) Construa uma tabela de freqüências usando a regra de Sturges para determinar o número
de intervalo de classe.
(b) Faça o histograma de freqüências relativas e comente as principais características dos dados.
CAPÍTULO 2. ANÁLISE DESCRITIVA 45
(c) Uma pessoa é considerado saudável, se o nível de glicose é maior o igual a 30mg/dl mais
menor a 110 mg/dl. Qual é a porcentagens de pessoas saudáveis? (considere a TDF).
(d) Calcule e interprete média, mediana, 1o quartil e 3o quartil.
(e) Determina a porcentagens de pessoas que se encontram no intervalo [Q1 − 1, 5d; Q3 + 1, 5d),
onde d = Q3 − Q1 .
16. Uma farmácia de manipulação encomendou lotes de ácido acetisalicílico(AAS) de duas empresas
(A e B). Na análise da pureza da matéria prima constatou-se que havia ácido salicílico misturado
ao AAS. Amostras dos lotes foram retiradas (100 mg), analisadas e organizadas na tabela abaixo:
Empresa A Empresa B
Lotes % de Pureza Lote % de Pureza
1 96.793 1 93.808
2 98.381 2 94.651
3 96.590 3 93.073
4 96.458 4 95.169
5 97.335 5 95.376
6 95.778 6 94.606
7 94.941 7 94.410
8 97.578 8 93.691
9 94.764 9 95.614
10 96.197 10 94.194
17. Num hospital foi realizado exames para se determinar o nível de colesterol em pacientes com peso
acima do normal. Os dados obtidos dos 36 pacientes examinados estão relacionados a seguir, em
mg/dl.
180,31 213,99 227,53 246,87 264,67 275,18 182,41 214,41 235,22
254,43 266,19 288,08 188,43 218,06 235,40 257,57 266,52 290,89
191,71 219,67 237,98 260,42 269,72 292,66 204,24 220,42 241,23
262,83 271,95 327,64 212,81 225,22 246,38 264,42 274,00 336,47
18. Na análise de vacinas contra a febre amarela, constatado uma possível fraude no volume espe-
cicado no rótulo dessas vacinas. Foram analisadas 30 ampolas de 0.50 ml, dando os seguintes
resultados:
0,591 0,521 0,495 0,546 0,503 0,456 0,592 0,511 0,491
0,543 0,503 0,448 0,573 0,508 0,482 0,540 0,502 0,435
0,563 0,505 0,481 0,531 0,500 0,424 0,549 0,505 0,476
0,529 0,497 0,400
CAPÍTULO 2. ANÁLISE DESCRITIVA 46
19. Em um laboratório de pesquisa genéticas foi feito cruzamentos entre camundongos pretos e
albinos, o objetivo da pesquisa era se saber quais as cores dos lhotes e suas proporção; os dados
obtidos foram organizados abaixo:
Preto Marrom albino marrom preto marrom albino preto
Albino Preto preto preto preto preto preto marrom
Preto Albino preto albino marrom preto albino preto
Preto Preto marrom preto albino preto preto albino
20. Hidatidose é uma doença causada por helmintos do gênero Echinococcus. O quadro abaixo
mostra pacientes com cisto ciático operados em Azul ( Província de Bueno Aires, Argentina
)segundo grupos etários.
Grupos etários No de pacientes operados
0 ` 10 29
10 ` 20 76
20 `30 88
30 ` 40 52
40 `50 42
50 ` 60 23
60 ` 70 12
Fonte: Adaptado do livro "Patologia"de Luís Rey
(a) Faça a representação gráca dos dados considerando a freqüência relativas em percentuais
e descreva as principais características.
(b) Calcule e interprete 1o quartil, mediana e 3o quartil.
(c) Qual é a idade média dos pacientes com cisto ciático operados em Azul.
(d) De acordo com os dados, qual o percentual que pacientes operados com menos de 18 anos.
21. Para cada uma das doses 0,20 0,32 0,50 e 0,80 (mg/cm2 ) de um determinado inseticida foram
submetidos seis grupos, cada um com dez besouros, e observado o número de sobreviventes. Os
dados são resumidos na tabela abaixo.
0,20 0,32 0,50 0,80
7 9 10 6 7 9 6 4 8 1 3 2
8 9 9 7 8 4 5 6 3 2 6 5
Para cada dose calcule a proporção de sobreviventes e calcule a média, mediana, desvio padrão
e quartis para o número de sobreviventes. Compare o número médio com o número mediano de
sobreviventes segundo as doses. Comente.
CAPÍTULO 2. ANÁLISE DESCRITIVA 47
22. Um experimento é conduzido para comparar dois regimes alimentares no que diz respeito ao
aumento de peso. Vinte indivíduos são distribuídos ao acaso entre dois grupos em que ao primeiro
deles foi dado a dieta A e ao segundo a dieta B. Decorrido certo intervalo de tempo verica-se
que os aumentos de peso correspondentes foram as seguintes:
Dieta A -1,0 0,0 2,1 3,1 3,3 4,3 5,2 5,5 5,0 6,8
Dieta B 2,5 3,0 4,0 5,7 6,0 6,9 7,0 7,2 7,3 8,1
Análise os dados descritivamente e comente as principais diferenças.
23. Uma empresa construtora de equipamentos para indústria alimentar pretende adquirir termos-
tatos para comandar a abertura de um certo tipo de fornos, contemplando a possibilidade de
os adquirir a um dos fornecedores A ou B. O fornecedor B vende os termostatos mais caros,
invocado que são mais áveis do mercado. Num ensaio de 9 termostatos de fornecedor A e 11
do fornecedor B, todos regulados à mesma temperatura, as temperaturas observadas de abertura
dos fornos foram as seguintes.
Fornecedor A 423 425 401 430 417 425 416 421 419
Fornecedor B 419 414 422 435 418 421 429 410 406 418 421
Você acha que o termostato do fornecedor B é mais conável que do fornecedor A?. Justique
porque?
24. A qualidade de rebites é tanto melhor quanto maiores sua resistência média e sua homogeneidade.
Com a nalidade de vericar qual das marcas A e B são melhores, 8 rebites da marca A foram
ensaiados ao cisalhamento que forneceu uma média de 37,09 e desvio padrão de 4,05, ao passo
que rebites da marca B forneceu, nas mesmas unidades, os seguintes valores: 38,5 39,0 40,7 37,8
41,4. A gura 2.15 mostra o gráco do boxplot das cargas de ruptura das marcas A e B. Com a
informação acima qual das marcas de rebites é melhor em pelo menos um aspecto? Justique.
Capítulo 3
Introdução à Probabilidade
3.1 Introdução
A representação dos dados em forma sintética e compreensível, que foi o tema central do capítulo
anterior, é um passo necessário, mas limitado, para viabilizar a utilização dos mesmos na análise e
interpretação de processos ou na tomada de decisões.
Nesse capítulo é apresentado um conjunto de conceitos básicos da teoria de probabilidade, que constitui
a parte fundamental sobre a qual se assenta a inferência estatística. Essa seria uma justicativa
atribuída à teoria de probabilidade, mas, seu objetivo principal é modelar fenômenos ou processos
nos quais interfere o acaso, pois faz dela um instrumento imprescindível para uma compressão dos
fenômenos da natureza.
48
CAPÍTULO 3. INTRODUÇÃO À PROBABILIDADE 49
distintos. O número de pacientes que chegam a um hospital, num intervalo de tempo de uma hora, num
dia varia de dia para dia. O número de lâmpadas que queimarão, 50 horas depois de 200 delas serem
instaladas, não pode ser previsto com certeza. A estes experimentos denominamos de experimentos
aleatórios(ε).
iii. Cada experimento tem vários resultados possíveis que são descritas com antecedência e com
precisão. Por exemplo em ε1 tal conjunto é {1, 2, 3, 4, 5, 6} e, em ε2 , é {cara, coroa}.
O espaço amostral é denotado por Ω. Assim, por exemplo, os espaços amostrais associados aos respec-
tivos experimentos dos exemplos 3.2.1-3.2.2, são:
ε1 : Ω1 = {1, 2, 3, 4, 5, 6}
ε2 : Ω2 = {C, K} , C =cara e K = corõa
ε3 : Ω3 = {R1 , . . . , R30 }, Ri representa cada aluno: Pedro, João, Maria, etc.
ε4 : Ω4 = {HHH, HHF, HF H, F HH, HM M, M HM, M M F, F F F }
ε5 : Ω5 = {CCC, CCK, CKC, KCC, CKK, KCK, KKC, KKK}
ε6 : Ω5 = {t ∈ R; t ≥ 0}
ε7 : Ω6 = {AA, AB, BA, BB}
CAPÍTULO 3. INTRODUÇÃO À PROBABILIDADE 50
Denição 3.2.2 A união dos eventos A e B é o evento que ocorre se pelo menos um dos eventos A
ou B ocorre.
Denição 3.2.3 A intersecção dos dois eventos A e B é o evento que ocorre se e somente se ambos
ocorrem.
Exemplo 3.2.4 Considere uma urna que contem bolas numeradas de 1 a 15. Uma bola é extraída
da urna, sejam os eventos:
A: o número observado é múltiplo de 5 ;
B: o número observado é ímpar.
CAPÍTULO 3. INTRODUÇÃO À PROBABILIDADE 51
Então, Ω = {1, 2 . . . , 15} , A = {5, 10, 15} e B = {1, 3, 5, 7, 9, 11, 13, 15}. Assim,
ou seja, um ponto amostral pertence a A ∪ B se ele é ímpar ou se é múltiplo de 5. Para que um ponto
amostral pertença a A ∩ B é necessário que ele seja ímpar e múltiplo de 5, logo, A ∩ B = {5, 15}.
Denição 3.2.5 Dois eventos A e B denidos no mesmo espaço amostral, são mutuamente exclusivos
se não podem ocorrer juntos. Ou seja, a ocorrência de um exclui a ocorrência do outro. Em símbolos,
A ∩ B = ∅.
O evento que contém todos os elementos de um espaço amostral e que, portanto, coincide com o
espaço amostral é chamado evento seguro. Essa designação reete o fato de que, na realização de um
experimento aleatório correspondente, um dos resultados nele contido ocorre com certeza. O evento
impossível representa-se através de um conjunto que não contém nenhum elemento do espaço amostral.
Tal conjunto é representado por um conjunto vazio, ou seja, ∅.
3.3 Probabilidade
O conceito de probabilidade pode ser denido de diferentes maneiras. Apresenta-se seguidamente três
denições distintas: a clássica, a frequentista e a axiomática.
P (A ∪ B) = P (A) + P (B)
Solução O experimento aleatório é "lançar dois dados". O espaço amostral associado a esse experi-
mento aleatório é
(1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)
(2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)
(3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
Ω=
(4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)
(5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
(6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)
onde cada ponto amostral é da forma (w1 , w2 ), sendo w1 o ponto amostral correspondente ao resultado
do primeiro dado w2 , ao do segundo dado.
Sejam os seguintes eventos:
A= {(w1 , w2 ) ∈ Ω; w1 + w2 = 7} = obter soma 7
B= {(w1 , w2 ) ∈ Ω; w1 + w2 = 6} = obter soma 6
C= {(w1 , w2 ) ∈ Ω; w1 + w2 > 5} = obter soma maior que 5
D= {(w1 , w2 ) ∈ Ω; w1 > w2 } = o resultado do primeiro dado ser maior que do segundo.
Uma simples contagem permite determinar nA = 6, nB = 5 nC = 26 e nD = 15. Então,
6 5
(a) P (A) = 36 (b) P (B) = 36
26 15
(c) P (C) = 36 (d) P (D) = 36
artigos defeituosos. Uma forma de responder essas questões é obter alguns dados empíricos com a
intenção de estimar as probabilidades.
Suponha que seja realizado um experimento n vezes (n grande) e o evento A ocorra exatamente
r ≤ n vezes. Então, a freqüência relativa de vezes que ocorreu o evento A, ”frA = nr ”, é a estimação
da probabilidade que ocorra o evento A, ou seja,
r
P (A) = .
n
Essa estimação da probabilidade por freqüência relativa de um evento A, nr , é próxima da verdadeira
probabilidade de ocorrência do evento A quando n tende ao innito, isto é,
r
P (A) = lim frA = lim .
n→∞ n→∞ n
É imediato vericar, de acordo com a denição frequentista apresentada, que as probabilidades ainda
satisfazem as propriedades apresentadas anteriormente.
Exemplo 3.3.2 Suponha que uma moeda balanceada é lançado 1000 vezes. Os resultados desse ex-
perimento são apresentados na tabela 3.1
Em um total de 1000 lançamentos ocorreram 508 caras, isto é, a freqüência relativa é aproximadamente
0,5. Portanto, baseada na denição frequentista, a probabilidade de cara em um lançamento de uma
moeda balanceada é 0,5.
Toda a teoria elementar da probabilidade está construída sob a base destes três simples axiomas.
A seguir, são apresentados propriedades que são conseqüência imediata dos axiomas acima.
P (A) ≤ P (B)
P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
Exemplo 3.3.3 Na tabela 3.2 mostrada a seguir, são apresentados a composição por raça e sexo de
uma população de certo país
Caso P (B) = 0, P (A|B) pode ser denido arbitrariamente. Nesse texto será usado P (A|B) = P (A)
Exemplo 3.4.1 Selecionamos uma semente, ao acaso, uma a uma e sem reposição, de uma sacola
que contém 10 sementes de ores vermelhas e 5 de ores brancas. Qual é a probabilidade de que:
CAPÍTULO 3. INTRODUÇÃO À PROBABILIDADE 56
Sejam os eventos:
V1 : "a primeira semente selecionada é vermelha"
V1c : "a primeira semente selecionada é branca"
V2 : "a segunda semente selecionada é vermelha"
V2c : "a segunda semente selecionada é branca"
10
(a) A probabilidade de que a primeira semente seja vermelha é 15 = 23 . Pois há 10 sementes de ores
vermelhas em um total de 15; isto é, P (V1 ) = 32 .
5
(b) A probabilidade de que a segunda semente seja branca se a primeira foi vermelha é 14 , já que
5
ainda existem 5 sementes brancas em um total de 14; isto é, P (V2c |V1 ) = 14 .
9
(c) A probabilidade de que a segunda seja vermelha se a primeira foi vermelha é 14 , já que ainda
9
existem 9 sementes vermelhas em um total de 14, isto é,P (V2 |V1 ) = 14 .
Da denição de probabilidade condicional e do teorema 3.3.1 podem ser mostrados o seguintes resul-
tados:
1. P (∅|B) = 0
CAPÍTULO 3. INTRODUÇÃO À PROBABILIDADE 57
2. o A ⊂ Ω então
P (Ac |B) = 1 − P (A|B) ou P (A|B) = 1 − P (Ac |B)
P (A|B) ≤ P (C|B)
Exemplo 3.4.2 Em uma cidade, a probabilidade de chuva no primeiro dia de setembro é 0,50 e a
probabilidade de chuva nos dois primeiros dias de setembro é 0,40. Se no primeiro dia de setembro
choveu, qual é a probabilidade que no dia seguinte não chova ?
Solução: denem-se os eventos: A : Chove no primeiro dia setembro. B : Chove no segundo dia de
setembro. Do enunciado do problema tem-se : P (A) = 0, 50 e P (A ∩ B) = 0, 40. A probabilidade
pedida é P (B c |A). Pelo teorema 3.4.1, tem-se:
P (A ∩ B) 0, 40
P (B c |A) = 1 − P (B|A) = 1 − =1− = 0, 20.
P (A) 0, 50
Exemplo 3.4.3 Uma faculdade, em seu primeiro ano de funcionamento tem três cursos: Ciências,
Administração e Engenharia. A classicação dos alunos por sexo, é apresentada na tabela a seguir.
(a) Sabe-se que o estudante escolhido é do sexo masculino, qual é a probabilidade de que ele curse
Ciências?
(b) Sabe-se que o estudante curse Engenharia, qual é a probabilidade de que seja do sexo feminino?
(c) Sabe-se que o estudante é do sexo feminino, qual é a probabilidade de que curse Ciências ou
Administração?
P (A ∩ B) = P (A)P (B|A).
Exemplo 3.4.4 No exemplo 3.4.1, suponha que se tenha interesse em determinar a probabilidade de
que as duas sementes selecionadas sejam brancas
Solução: O evento é V1c ∩ V2c : "a primeira e a segunda sementes de ores são brancas"
5 4 2
P (V1c ∩ V2c ) = P (V1c )P (V2c |V1c ) = × =
15 14 21
Exemplo 3.4.5 Dois currais A e B têm 1000 cabeças de gado cada um. Existe uma epidemia que
afeta os cascos e a boca do gado. 20% dos animais do curral A têm doença e 75% dos animais do
curral B estão sadios. Escolhe-se um gado ao acaso .
(a) Qual é a probabilidade de que o gado escolhido venha do curral A e tenha afecção aos cascos e a
boca?
(b) Dos animais do curral B, afetados pela doença o 70% são menores de um ano. Qual é a proba-
bilidade que o gado escolhido venha do curral B, tenha a doença e seja maior de um ano?
P (A ∩ B) = P (A)P (B).
Exemplo 3.4.6 Em uma escola 20% dos alunos tem problemas visuais, 8% problemas auditivos e 4%
tem problemas visuais e auditivos. Seleciona-se um aluno dessa escola ao acaso:
(b) se o aluno selecionado tem problemas visuais, qual é a probabilidade de que tenha problemas
auditivos?
(c) qual é a probabilidade de não ter problemas visuais ou o ter problemas auditivos ?
V Vc total
A 0,04 0,04 0,08
Ac 0,16 0,76 0,92
total 0,20 0,80 1,00
(a) P (V )P (A) = 0, 2 × 0, 08 = 0, 16
P (V ∩ A) = 0, 04.
Como P (V ∩ A) 6= P (V )P (A), A e V não são independentes.
P (A∩V ) 0,04
(b) P (A|V ) = P (V ) = 0,20 = 0, 20
(c) P (V c ∪ A) = P (V c ) + P (A) − P (V c ∩ A) = 0, 8 + 0, 08 − 0, 04 = 0, 84
Uma conseqüência imediata da denição 3.4.2 é o teorema seguinte:
O teorema mostra que se os eventos A e B são independentes então os complementares também são
independentes. ( A demonstração é deixada para o leitor)
Exemplo 3.4.7 Sejam A e B dois eventos independentes, tais que a probabilidade de que ocorram
simultaneamente os dois eventos é 1/6 e a probabilidade de que nenhum dos eventos ocorra é 1/3.
Determine P (A) e P (B).
1 1
Solução: Do enunciado tem-se: P (A ∩ B) = 6 e P (Ac ∩ B c ) = 3
Se A e B são independentes, então
1
P (A ∩ B) = P (A)P (B) = (3.3)
6
Assim sendo Ac e B c são também independentes (pelo teorema 3.4.3.iii). Isto é,
1
= P (Ac ∩ B c ) = P (Ac )P (B c ) = [1 − P (A)][1 − P (B)]
3
1
= 1 − P (A) − P (B) + P (A)P (B) = 1 − P (A) − P (B) + . O qual implica
6
5
P (B) = − P (A). (3.4)
6
Substituindo (3.4) em (3.3) vem:
· ¸
5 1
P (A) − P (A) =
6 6
5 1
P (A)2 − P (A) + = 0.
6 6
CAPÍTULO 3. INTRODUÇÃO À PROBABILIDADE 61
Resolvendo a equação do segundo grau encontra-se P (A) = 1/3 ou P (A) = 1/2. Logo, o conjunto de
soluções é: {P (A) = 1/3, P (B) = 1/2} ou {P (A) = 1/2, P (B) = 1/3}.
Exemplo 3.4.8 Um atirador acerta 80% de seus disparos e outro (na mesmas condições de tiro),
70%. Qual é a probabilidade de acertar se ambos atiradores disparam simultaneamente o alvo? Consi-
dere que o alvo foi acertado quando pelo menos uma das duas balas tenha feito impacto no alvo.
Solução: sejam os eventos: Bi : "o atirador i acerta o alvo, i = 1, 2". P (B1 ) = 0, 80 e P (B2 ) = 0, 70.
Logo,
Exemplo 3.4.9 A probabilidade de que falhe um motor em um avião é 0,10. Com quantos motores
deve estar equipado um avião par ter uma seguridade de 0,999 de que o avião voe? (Suponha que é
suciente que um motor funcione para que o avião se mantenha em vôo)
n
[
0, 999 = P (A) = P ( Mi ) = 1 − [1 − P (M1 )] [1 − P (M2 )] . . . [1 − P (Mn )] = 1 − [0, 1]n .
i=1
Logo, (0, 1)n = 0, 001. Daí, tem-se n = 3. Portanto, o avião deve ser equipado com três motores.
CAPÍTULO 3. INTRODUÇÃO À PROBABILIDADE 62
k
X
P (A) = P (Bi )P (A|Bi ) = P (B1 )P (A|B1 ) + · · · + P (Bk )P (A|Bk )
i=1
P (A) = P (A ∩ B1 ) + P (A ∩ B2 ) + · · · + P (A ∩ Ak )
= P (B1 )P (A|B1 ) + P (B2 )P (A|B2 ) + · · · + P (Bk )P (A|Bk )
k
X
P (A) = P (Bi )P (A|Bi ).
i=1
CAPÍTULO 3. INTRODUÇÃO À PROBABILIDADE 63
P (Bi )P (A|Bi )
P (Bi |A) =
P
k
P (Bi )P (A|Bi )
i=1
Exemplo 3.5.1 Das pacientes de uma clínica de Ginecologia com idade acima de 40 anos, 70% são
ou foram casadas e 30% são solteiras. E sendo solteira, a probabilidade de ter um distúrbio hormonal
no último ano é 20% enquanto para as demais a probabilidade aumenta para 40%. Se um paciente é
escolhido ao acaso de todas as pacientes da clínica,
(b) se a paciente escolhida resultou ter distúrbio hormonal qual é probabilidade dela ser solteira?
P (S)P (D|S) 0, 30 × 0, 20 3
P (S|D) = = =
P (D) 0, 34 17
3 14 7
(a) P (A ∩ B) = P (B)P (A|B) = = = 0, 7 (pela regra do produto).
4 15 10
P (A ∩ B) 7/10 14
(b) P (B|A) = = = (da denição de probabilidade condicional)
P (A) 17/20 17
P (Ac ∩ B c ) P (Ac ∩ B c ) 1/10 2
(c) P (Ac |B c ) = c
= = 3 = .
P (B ) 1 − P (B) 1− 4 5
14 1
(d) P (Ac |B) = 1 − P (A|B) = 1 − = (pelo teorema 3.4.1.3)
15 15
CAPÍTULO 3. INTRODUÇÃO À PROBABILIDADE 66
3. Os membros de um clube são médicos ou são advogados , 40% dos membros são médicos enquanto
que 30% das mulheres, são médicas. 50% dos médicos e 30% dos advogados ganham mais de
R$ 100.000 por ano. Porem, somente 20% das mulheres médicos e 10% das mulheres advogadas
ganham mais de R$ 100.000, por ano. Se um membro do clube é sorteado ao acaso,
(a) Deve-se calcular P (B), aplicando o teorema de probabilidade total 3.5.1. O evento B é
equivalente a: B = (A ∩ B) ∪ (Ac ∩ B). Logo,
P (A)P (B|A) 0, 6 × 0, 9 54
P (A|B) = = = 0, 87
P (B) 0, 62 62
5. O gerente da empresa EX viaja em um avião de 6 motores para assistir a uma reunião importante
em EEUU. A probabilidade de que motor falhe é de 0,10 e cada um funciona independentemente
dos outros. Precisa-se de que pelo menos um motor de cada lado do avião funcione. Qual é a
probabilidade que o gerente esteja ausente na reunião por causa de um acidente com seu avião?
Solução: Sejam os eventos:
Mi : O i-ésimo motor funciona perfeitamente i = 1, . . . , 6.
A: O gerente esteja ausente na reunião por causa do acidente.
Ac : O gerente não esteja ausente na reunião por causa do acidente.
Deve-se determinar a probabilidade do evento A,isto é,
A segunda igualdade da equação acima deve-se ao teorema 3.4.4. Substituindo este resultado em
(3.8) temos que:
P (A) = 1 − 0, 998001 = 0, 001999.
CAPÍTULO 3. INTRODUÇÃO À PROBABILIDADE 68
6. A probabilidade de fechamento de cada relê do circuito apresentado na gura 3.4 é dado por p.
Se todos os relê funcionarem independentemente, Qual é a probabilidade de que haja corrente
entre os terminais L e R.?
Solução: Sejam os eventos:
Ri : O relê i está fechado, i = 1, . . . , 6.
A: A corrente passa por L e R.
Do enunciado do problema tem-se: P (Ri ) = p e A = (R1 ∩R2 )∪(R3 ∩R4 )∩(R5 ∩R6 ) (observe que
(R1 ∩ R2 ), (R3 ∩ R4 ) e (R5 ∩ R6 ) não são mutuamente exclusivos (disjuntos)). Se B1 = R1 ∩ R2 ,
B2 = R3 ∩ R4 e B3 = R5 ∩ R6 . Portanto,
P (A) = P (B1 ∪ B2 ∪ B3 ) = P (B1 )+P (B2 )+P (B3 )−P (B1 ∩B2 )−P (B1 ∩B3 )−P (B2 ∩B3 )+P (B1 ∩B2 ∩B
T
3
Mas, P (Bi ) = p2 , i = 1, 2, 3; P (Bi ∩ Bj ) = p4 , i 6= j = 1, 2, 3 e P ( Bi ) = p6 . Daí tem-se:
i=1
3.7 Exercícios
1. Determine um possível espaço amostral para experimentos descritos abaixo:
(a) Um posto tem dois tipos de vacina (A e B). Três vacinas são selecionadas , uma de cada vez,
ao acaso e com reposição , observando-se (i) o número de vacinas do tipo A; (ii) o número
de vacinas do tipo B.
(b) Lança-se duas moedas e anota-se a conguração
(c) Conta-se o número de peças produzidas em um dia numa industria
(d) Observa-se uma lâmpada até que se queime
(e) Inspeciona-se três peças para vericar se são defeituosas ou não
2. Sejam A, B e C três eventos quaisquer no espaço amostral Ω. Expresse cada um dos eventos em
termos de operações entre A, B e C.
CAPÍTULO 3. INTRODUÇÃO À PROBABILIDADE 69
3. Um número é escolhido ao acaso, dentre os números 1,2,. . . ,50. Qual é a probabilidade de que o
número escolhido seja divisível por 6 ou por 8?
5. Uma urna contém 30 bolas numeradas de 1 a 30. Três bolas são sorteadas ao acaso da urna.
Qual é a probabilidade de que a soma dos números sorteados seja par?
7. Em um determinado exame de seleção foram propostos dois problemas. Sabendo-se que 132
indivíduos acertaram o primeiro, 86 erraram o segundo, 120 acertaram os dois e 54 acertaram
apenas um problema, qual a probabilidade de que um indivíduo escolhido ao acaso dentre os que
zeram o exame:
8. Um número é escolhido ao acaso entre os inteiros de 1 a 20 ( isto é, todos tem a mesma proba-
bilidade ). Considere os eventos: A : o número é múltiplo de 3 ; B : o número é ímpar.
9. Um restaurante popular oferece dois tipos de refeições: salada completa ou um prato a base de
carne. 20% dos fregueses do sexo masculino preferem salada e 30% das mulheres preferem carne .
75% dos fregueses são homens. Um freguês é escolhido ao acaso. Considere os seguintes eventos:
H: freguês é homem; M : freguês é mulher; A: freguês prefere salada ; B: freguês prefere carne.
Calcule as probabilidades: P (H ∩ A), P (A|H), P (H ∪ B) e P (A).
10. Duas ambulâncias são mantidas em um posto para atender emergência. Devido a vários proble-
mas, como manutenção pôr exemplo, a probabilidade que cada ambulância esteja disponível é
0,9. A disponibilidade de uma ambulância é independente da outra.
11. Dois tipos de vacina foram aplicados em uma população de tal forma que 60% das pessoas
receberam vacina do tipo A e as 40% restante receberam vacina do tipo B. Sabendo que a vacina
do tipo A fornece 70% de imunização e a B fornece 80%, determine a probabilidade de que uma
pessoa escolhida ao acaso, (i) esteja imunizado dado que foi vacinada por A; (ii) esteja imunizado;
(iii) tenha sido vacinada pôr A dado que não esteja imunizado.
12. Um pedagogo deseja investigar se a "aversão"pela estatística está relacionada com o sexo. Um
teste investigando atitude é administrado a 2000 estudantes para determinar seus níveis de ansi-
edade em relação à resolução de problemas de estatística . Cada estudante é classicado quanto
a nível (alto ou baixo) de ansiedade e quanto ao sexo. Os resultados são apresentados na tabela
abaixo.
(a) Se um aluno é selecionado qual é a probabilidade de que seja homem e tenha nível de
ansiedade baixo?
(b) Se o aluno selecionado é do sexo feminino, qual é a probabilidade de que tenha nível de
ansiedade baixo?
(c) Com base nesses dados verique se o sexo e o nível de ansiedade são independentes.
13. O senhor X pode ir para sua casa usando a estrada A e a estrada B. Na estrada A ele tem
probabilidade 0,25 de se atrasar devido a engarrafamento, enquanto que na estrada B essa pro-
babilidade vale 0,35. Se ele escolhe o caminho A com probabilidade 0,7 e o caminho B com
probabilidade 0,3: (i) Qual é a probabilidade de que ele se atrase devido a engarrafamento ?, (ii)
se ele se atrasou qual é a probabilidade de que o senhor X tenha escolhido a estrada A.?
14. A probabilidade de uma pessoa contrair meningite durante certo ano é 0,001 se ela for vacinada
0,005 se ela não for vacinada. Se 95% da população for vacinada , (i) qual é a probabilidade de
uma pessoa contrair meningite? (ii) se uma pessoa contrair meningite, qual a probabilidade dela
ter sido vacinada?
15. Numa sorveteria 25% dos clientes são mulheres e o restante são homens. Dentre os homens 30%
gostam de um novo sabor (jiló caramelizado) e, dentre as mulheres, apenas 20%. Escolhendo-se
um cliente ao acaso
(a) qual é a probabilidade dele ser homem e gostar desse novo sabor?
(b) qual é a probabilidade de ser mulher ou não gostar desse novo sabor ?
(c) qual é a proporção de clientes que gostam do novo sabor ?
(d) se o cliente escolhido resultou mulher, qual é a probabilidade de que goste do novo sabor ?
CAPÍTULO 3. INTRODUÇÃO À PROBABILIDADE 71
16. Em uma universidade o 70% dos estudantes são de ciências e o 30% são de letras. Dos estudantes
de ciências, 60% são homens e os de letras, 40% são homens. Escolhe-se ao acaso um estudante.
Calcular a probabilidade que:
18. Um pesquisador desenvolveu um teste para detectar um certo tipo de doença. Ele usa o teste em
pacientes com ou sem a doença. Suponha que ele aplica o teste em uma população onde a taxa
de incidência da doença é igual a 2%. Sabe-se que em indivíduos sem a doença, a probabilidade
do resultado do teste ser positivo é de 5% (taxa de falso positivo), enquanto que em indivíduos
com a doença, a probabilidade do resultado do teste ser negativo é 20% (taxa de falso negativo).
Selecionando-se um indivíduo, ao acaso, dessa população,
19. Num laboratório há três gaiolas. Na gaiola I há 2 coelhos pardos e 3 brancos, a gaiola II tem 4
coelhos pardos e 3 brancos e a gaiola III contem 5 coelhos pardos e 5 brancos . Seleciona-se, ao
acaso, uma gaiola e tira-se um coelho ao acaso desta gaiola.
20. No circuito elétrico dado na gura 3.5, em que consiste tensão entre os pontos A e B, determine
a probabilidade de passar corrente entre A e B, sabendo-se que a probabilidade de cada chave
estar fechada é 0,5 e que cada chave está aberta ou fechada independente de qualquer outra.
21. Em uma fábrica, a máquina 1 produz por dia o dobro de peças que máquina 2. Sabe-se que 4%
das peças fabricadas pela maquina 1 tendem a ser defeituosas, enquanto 7% de defeituosas são
produzidas pela máquina 2. A produção diária das maquinas é misturada.
(a) Selecionando-se ao acaso uma peça da produção das maquinas, qual é a probabilidade que
a peça seja defeituosa ?
(b) Se a peça sorteada resultou (em (a)) ser não defeituosa, qual á probabilidade de que ela seja
da maquina 1?
(c) Se selecionamos uma amostra de 3 peças, qual é a probabilidade de que as 2 sejam defeituosas
? (considere que amostra é com reposição)
CAPÍTULO 3. INTRODUÇÃO À PROBABILIDADE 72
22. Uma cidade tem 30.000 habitantes e três jornais: A, B, e C. Uma pesquisa de opinião revela que
12.000 lêem A, 8.000 lêem B, 7.000 lêem A e B, 6.000 lêem C, 4.500 lêem A e C, 1.000 lêem B e
C e 500 lêem A, B e C. Seleciona-se, ao acaso, um habitante dessa cidade. Qual a probabilidade
de que ele leia: (a) pelo menos um jornal. (b) somente um jornal.
23. Os problemas de assédio sexual têm recebido muita atenção nos últimos anos. Em uma pesquisa,
420 trabalhadores (240 dos quais homens) consideram que uma simples batida no ombro como
uma forma de assedio sexual, enquanto 580 trabalhadores (380 dos quais homens) não consideram
isso como assédio sexual. Escolhido aleatoriamente um dos trabalhadores pesquisados, determine:
(a) a probabilidade de obter alguém que não considere um simples tapa no ombro uma forma
de assedio sexual.
(b) De escolher um homem ou alguém que não considere uma simples batida no ombro como
uma forma de assédio sexual.
24. Dois processadores, um do tipo A e outro do tipo B são colocados em teste por 50 mil horas. A
probabilidade que um erro de cálculo aconteça em um processador do tipo A é de 2/60, no tipo
B, 1/80 e em ambas, 1/1000. Qual é a probabilidade de que somente o processador A ou apenas
o processador B tenha apresentado erro.?
25. Uma montadora trabalha com 2 fornecedores (A e B) de uma determinada peça. As chances de
que uma peça proveniente dos fornecedores A e B esteja fora das especicações são 10% e 5%
respectivamente. A montadora recebe 30% das peças do fornecedor A e 70% de B.
(a) Se uma peça do estoque inteiro é escolhida ao acaso, calcule a probabilidade de que ela
esteja fora das especicações.
(b) Se uma peça do estoque inteiro é escolhida ao acaso e verica-se que ela está fora das
especicações, de qual fornecedor ela é mais provável de ter vindo ?
26. Suponha que A e B são eventos independentes associados a um mesmo experimento aleatório,
a P (A ∪ B) é de 0,6 enquanto que a probabilidade de que somente A ocorra é de 0, 2. Qual é
probabilidade de que somente ocorra o evento B.?
27. Três maquinas A B e C apresentam, respectivamente, 10%, 20% e 30% de defeituosos na sua
produção. Se as três maquinas produzem igual quantidade de peças e retiramos duas peças ao
acaso da produção global qual é a probabilidade que as duas sejam perfeitas.?
CAPÍTULO 3. INTRODUÇÃO À PROBABILIDADE 73
28. Um dado é viciado de tal forma que a probabilidade de dar "seis"é 1/5, sendo os demais resultados
equiprováveis. Jogando-se esse dado juntamente com o dado normal, calcule a probabilidade de
que
Variáveis Aleatórias
Denição 4.1.1 (Variável aleatória) Seja Ω o espaço amostral associado a um experimento alea-
tório. Uma variável aleatória, X , é uma função que tem como domínio em Ω e como contradomínio
um subconjunto dos números reais,RX ⊂ R.
74
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 75
Ω = {a1 , a2 , a3 , . . .}
Para o exemplo, os valores possíveis da variável X são 0, 1, 2, ..., e os valores possíveis da variável Y
serão números reais não negativos. Ou seja, o contradomínio das variáveis X , Y são:
RX = {x; x = 0, 1, 2, 3, ...}
RY = {y; y ≥ 0, y²R}
• Variáveis aleatórias continuas. Aquelas variáveis cujo contradomínio é um conjunto innito não
enumerável. No exemplo anterior, Y é uma variável aleatória continua pois seu contradomínio
RY é o conjunto innito não enumerável com innitos de elementos.
1. P [X = xi ] = f (xi ) ≥ 0, se xi ∈ Rx ;
2. 0 ≤ f (xi ) ≤ 1, se xi ∈ Rx ;
P
3. f (xi ) = 1.
xi ∈RX
Exemplo 4.2.1 Suponha que 3 artigos são retirados ao acaso um a um e sem reposição de uma caixa
que contém 10 unidades das quais 2 são defeituosos. Seja a variável aleatória, X : Número de artigos
não defeituosos na amostra. Determinar a função de probabilidade de X .
Ω = {D1 D2 D3c , D1 D2c D3 , D1c D2 D3 D1 D2c D3c , D1c D2 D3c , D1c D2c D3 , D1c D2c D3c },
e {D1c D2c D3 }, e valor 3, tem apenas um evento a ele associado, ou seja, {D1c D2c D3c }. Segue, então, as
probabilidades associadas aos valores X
f (1) = P [X = 1] = P [(D1 , D2 , D3c ) ∪ (D1 , D2c , D3 ) ∪ (D1c , D2 , D3 )]
= P [(D1 , D2 , D3c ) + P [(D1 , D2c , D3 )] + P [(D1c , D2 , D3 )]
= (2/10)(1/9)(8/8) + (2/10)(8/9)(1/8) + (8/10)(2/9)(1/8) = 1/15
Denição 4.2.1 Seja X uma variável aleatória discreta com contradomínio RX = {x1 , x2 , . . . } e
função de probabilidade f (xi ) = P (X = xi ). Seja x ∈ R, a função de distribuição acumulada de X
denotado por F (x), é denida como:
X X
F (x) = P (X ≤ x) = f (xi ) = P (X = xi ) onde xi ∈ RX
xi ≤x xi ≤x
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 77
Exemplo 4.2.2 Considere o exemplo 4.2.1. Determine a função de distribuição da variável aleatória
X : número de artigos não defeituosos. Ou seja, F (x).
Se x < 1 F (x) = P (X ≤ x) = 0
X 1
Se x = 1 F (1) = P (X ≤ 1) = P (X = xi ) = P (X = 1) = f (1) =
15
xi ≤1
X 1 1
Se 1 ≤ x < 2 F (x) = P (X ≤ x) = P (X = xi ) = P (X = 1) = =
15 15
xi ≤x
X 1 7 8
Se x = 2 F (2) = P (X ≤ 2) = P (X = xi ) = P (X = 1) + P (X = 2) = + =
15 15 15
xi ≤2
X 1 7 8
Se 2 ≤ x < 3 F (x) = P (X ≤ x) = P (X = xi ) = P (X = 1) + P (X = 2) = + =
15 15 15
xi ≤x
X
Se x = 3 F (3) = P (X ≤ 3) = P (X = xi ) = P (X = 1) + P (X = 2) + P (X = 3)
xi ≤3
1 7 7
= + + =1
15 15 15X
Se x ≥ 3 F (3) = P (X ≤ x) = P (X = xi ) = P (X = 1) + P (X = 2) + P (X = 3) = 1
xi ≤x
Observação 4.2.1 Pode-se observar, que se x ∈ [1; 2), então F (x) = F (1), se x ∈ [2; 3), F (x) =
F (2). Em geral, se x ∈ [xl ; xl+1 ), então F (x) = F (xl ), onde xl e xl+1 são elementos de Rx .
Sendo F (x) a FDA da variável aleatória discreta X com contradomínio RX , deve satisfazer as seguintes
propriedades:
3.
lim F (x)= 0 e lim F (x) = 1.
x→−∞ x→+∞
(i) P (X ≤ a) = F (a).
(ii) P (X ≥ a) = 1 − P (X < a)
(iii) P (a < X ≤ b) = F (b) − F (a)
(iv) P (a ≤ X ≤ b) = F (b) − F (a) + P (X = a)
(v) P (a < X < b) = F (b) − F (a) − P (X = b)
Calcular: (a) P (1 < X ≤ 3); (b) P (X ≥ 2); (c) A função de probabilidade da variável aleatória X .
1. f (x) ≥ 0, se x²R
R∞
2. −∞ f (x) dx = 1
Rb
3. Seja o evento A = {x/ a ≤ x ≤ b}. Assim, P [A] = P [x²A] = P [a ≤ x ≤ b] = a f (x) dx
Exemplo 4.3.1 Suponha que o tempo de produção de um artigo (em minutos) é uma variável alea-
tória (v.a.) X que tem como função densidade de probabilidade:
½ (5−x)
f (x) = 4 , se 2 ≤ x ≤ 4 (4.3)
0 caso contrário
Da gura pode-se observar que a função, f (x) ≥ 0 (é não negativa) para x ∈ R. Para que seja uma
função de densidade é preciso vericar se a área sob eixo x e a função f (x) é igual a 1. Isto é, a integral
de −∞ a +∞ deve ser igual a um.
Z ∞ Z 2 Z 4 Z ∞ Z 4
f (x) dx = f (x) dx + f (x) dx + f (x) dx = f (x) dx
−∞ −∞ 2 4 2
Z 4
5−x 1 x2
= dx = (5x − ) |42 = 1
2 4 4 2
Logo, a probabilidade do tempo de produção de um artigo escolhido ao acaso ser menor que 3 minutos
é a probabilidade do evento: A = {x ∈ RX ; x < 3}, ou seja,
Z 3 Z 2 Z 3 Z 3
P (A) = P (X < 3) = f (x) dx = f (x) dx + f (x) dx = f (x) dx
−∞ −∞ 2 2
Z 3
5−x 1 x2 5
= dx = (5x − ) |32 = .
2 4 4 2 8
Se x > 4 tem-se:
Z x Z 2 Z 4 Z x Z 4
F (x) = f (t)dt = f (t)dt + f (t)dt + f (t)dt = f (t)dt = 1
−∞ −∞ 2 4 2
| {z } | {z }
0 0
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 81
Observação 4.3.2 A FDA, além de caracterizar uma variável aleatória contínua X , permite o cálculo
de probabilidades de eventos da forma (a ≤ X ≤ b), onde a < b ∈ R . Isto é
P (a ≤ X ≤ b) = P (X ≤ b) − P (X ≤ a)
Exemplo 4.3.3 Considere A FDA, exemplo 4.3.2, obtenha: P (X < 3) e P (2, 5 ≤ X < 3, 5)
9 − (5 − 3)2 5
P (X < 3) = F (3) = = .
9 8
9 − (5 − 3, 5)2 9 − (5 − 2, 5)2
P (2, 5 ≤ X < 3, 5) = F (3, 5) − F (2, 5) = − = 0, 5.
9 9
3. Z x Z x
lim F (x)= lim f (t)dt = 0 e lim F (x) = lim f (t)dt = 1
x→−∞ x→−∞ −∞ x→+∞ x→+∞ −∞
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 82
Exemplo 4.3.4 Suponha que o tempo de vida de um microorganismo seja uma variável aleatória X
com a seguinte FDA: ½ x
1 − ke− 2 , x ≥ 0
F (x) =
0, x<0
(a) Uma vez que F (x) é uma função contínua, para todo x ∈ R, tem-se que: F (0) = 0, ou seja,
1 − ke−0 = 0, o qual resulta em k = 1. Logo,
½ x
1 − e− 2 , x ≥ 0
F (x) =
0, x<0
é a FDA de X
(b1 ) P (X ≥ 2) = 1 − P (X < 2) = 1 − F (2) = 1 − [1 − e−1 ] = e−1 .
(b2 ) P (2 < X ≤ 4) = F (4) − F (2) = 1 − e−2 − (1 − e−1 ) = e−1 − e−2 .
(b3 ) P (X > −1) = 1 − P (X ≤ −1) = 1 − 0.
(c) Da propriedade 5, da FDA contínua, tem-se:
½ 1 − x2
d 2e , x≥0
f (x) = F (x) =
dx 0, x<0
Logo, (
d 1 − y−1
4e
4 , y≥1
f (y) = FY (y) =
dy 0, y<1
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 83
Nessa denição supõe-se que somatório e a integral convergem. Em caso contrário dizemos que o valor
esperado da variável aleatória X não existe.
Denição 4.4.2 (Valor esperado de uma função de variável aleatória) Seja Y = g(X), sendo
g(.) uma função real e contínua na variável aleatória X . O valor esperado de g(X), é denida como:
Denição 4.4.3 (Variância de uma variável aleatória) Seja X uma variável aleatória com fun-
ção de probabilidade f (x), com média E(X) = µX , a variância da variável aleatória, X , denotado por
V ar(X) = σ 2 é denida como o valor esperado da variável aleatória (X − µX )2 .
1. E(a) = a.
2. E(aX) = aE(X)
3. E(aX ± b) = aE(X) ± b
5. V ar(a) = 0
6. V ar(aX) = a2 V ar(X)
Exemplo 4.4.1 Suponha que tem-se 3 caixas (C1 , C2 e C3 ) com dois tipos de ampolas (A e B ). A
caixa C1 contem 40 ampolas dos quais 10 são do tipo A e 30 de B , a caixa C2 tem 20 ampolas do tipo
A e 20 do tipo B e a caixa C3 , somente tem ampolas do tipo B . Sorteia-se ao acaso, uma ampola de
cada caixa e dene-se a variável aleatória Y como número de ampolas escolhidos do tipo B.
Solução:
(a) Seja Bi : a ampola do tipo B escolhida da caixa i e Ai : a ampola do tipo A escolhida da
caixa i Logo, o espaço amostral é Ω = {A1 A2 B3 , A1 B2 B3 , B1 A2 B3 , B1 B2 B3 },
wi A1 A2 B3 A1 B2 B3 B1 A2 B3 B1 B2 B3
P ({wi }) 40 × 40 × 1 40 × 40 × 1 40 × 40 × 1 40 × 20
10 20 10 20 30 20 30
40 × 1 Portanto, a variável aleató-
Y ({wi }) 1 2 2 3
ria Y , assume os valores 1, 2 e 3. Da tabela anterior as probabilidades associadas aos valores de Y são
as seguintes:
1
f (1) = P [Y = 1] = P (A1 A2 B3 ) = .
8
4
f (2) = P [Y = 2] = P ({A1 B2 B3 } ∪ {B1 A2 B3 }) = P ({A1 B2 B3 }) + P ({B1 A2 B3 }) = .
8
3
f (3) = P [Y = 3] = P ({B1 B2 B3 }) = .
8
1
Se as variáveis aleatórias X e Y são independentes a distribuição conjunta de probabilidades de X e Y ( f (x, y)) é
igual ao produto de cada uma das distribuições marginais ( fX (x) e fY (y).) Isto é, f (x, y) = fX (x)fY (x))
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 85
X 1 4 3
E(X) = yf (y) = 1 × + 2 × + 3 × = 2, 25
y
8 8 8
X 1 4 3
E(X 2 ) = y 2 f (y) = 12 × + 22 × + 32 × = 5, 5
y
8 8 8
µy = E(Y ) = 2, 25
σy2 = V ar(Y ) = E(Y 2 ) − µ2y = 5, 5 − 2, 252 = 0, 4375
Exemplo 4.4.2 Suponha que as vendas diárias de uma Drogaria (em dezenas de milhares de dólares)
é uma variável aleatória com função de densidade;
x, se, 0≤x<1
f (x) = 2 − x, se, 1≤x<2
0, caso contrário
(a) A probabilidade de que as vendas da Drogaria seja maior de 5.000 dólares mais não superior a
1.5.000 dólares.
(c) Se o lucro diário é denido pela função Y = 0, 2X − 0, 1, calcule a média e variância do lucro
diário.
Esses valores indicam que a longo prazo (um número elevado de dias), espera-se que os lucros diários da
drogaria mostrem um comportamento com uma média de 1.000 dólares e uma variância 0,0067(dezenas
de milhares de dólares)2 .
Seja a variável aleatória X , denida como o número de sucessos num ensaio de Bernoulli. Então, o
contradomínio de X é dado por RX = {1, 0}. Isto é, X(S) = 1 se o resultado do ensaio é sucesso e
X(F ) = 0, se o resultado é fracasso. A variável aleatória assim denida chama-se variável aleatória de
Bernoulli. Sejam P (E) = p e P (F ) = q = 1 − p as probabilidade de sucesso e fracasso respectivamente.
A distribuição de probabilidade da variável aleatória X de Bernoulli, é chamada de distribuição de
Bernoulli, e é dada por
x 0 1
f (x) = P [X = x] q p
A distribuição de Bernoulli pode, também ser expressa como uma função f (x), dada por
½ x
p (1 − p)1−x , x = 0, 1
f (x) = P [X = x] =
0, caso contrário.
µX = E(X) = 0 × q + 1 × p = p.
2
σX = V ar(X) = E(X 2 ) − µ2x = 02 × q + 12 × p − p2 = p(1 − p)
Denota-se por X ∼ bernoulli(p) para indicar que a variável aleatória X tem distribuição Bernoulli
com parâmetro p.
(ii) Os ensaios são independentes. Isto é, o resultado (sucesso ou fracasso) de qualquer ensaio é
independente do resultado de qualquer outro ensaio.
Exemplo 4.5.1 Suponha um experimento onde uma moenda é lançada três vezes e suponha que p
seja a probabilidade de cara. Seja X a variável aleatória que representa o número de caras obtidas ao
nal dos três lançamentos. Achar a distribuição de probabilidade de X.
Solução. O espaço amostral para experimento de lançar uma moeda três vezes é:
Ω = {KKK, KKC, KCK, CKK, KCC, CKC, CCK, CCC}.
A notação X ∼ B(n, p), é usado para indicar que a variável X tem distribuição Binomial com parâ-
metros n e p.
Se X ∼ B(n, p) então:
(a) E(X)=np.
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 89
(b) Var(X)=np(1-p)
Exemplo 4.5.2 Suponha que o nascimentos de menino e menina seja igualmente prováveis e que o
nascimento de qualquer criança não afeta a probabilidade do sexo do próximo nascimento. Determine
a probabilidade de:
Exemplo 4.5.3 O professor da disciplina de Estatística e probabilidade elaborou uma prova de múlti-
pla escolha, constituída de 10 questões, cada uma com 4 alternativas. Suponha que todos estudantes que
irão a fazer a prova não assistem as aulas e não estudaram para a mesma (o que é muito freqüente).
O professor estabeleceu que para aprovar deve acertar ao menos 6 questões. Se 100 alunos se apresen-
taram, quantos alunos foram aprovados na disciplina?
Solução. Uma vez que todos os estudantes, que farão a prova não assistem as aulas ou não estudaram,
a escolha de cada resposta em cada uma das 10 questões será feita ao acaso. Portanto, a escolha da
resposta de cada questão é considerada de um ensaio de Bernoulli, com
1 3
p = Probabilidade de acertar a resposta correta = , q = 1 − p = .
4 4
A variável aleatória denida, X : número de questões respondidas corretamente nas 10 questões com
RX = {0, 1, . . . , n}, tem distribuição Binomial. Isto é, X ∼ B(10, 1/4).
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 90
½ ¡10¢ ¡ 1 ¢x ¡ 3 ¢10−x
, x = 0, 1, . . . , 10,
P [X = x] = x 4 4
0, caso contrário
Para ser aprovado o estudante deve responder ao menos 6 questões corretas. Isto é, a probabilidade
de ser aprovado a prova é.
10 µ ¶ µ ¶x µ ¶10−x
X 10 1 3
P (X ≥ 6) = = 0, 0197.
x 4 4
x=6
Portanto, dos 100 alunos que se apresentaram para a prova, seriam aprovados 100(0, 0197) ≈ 2 alunos.
O sorteio de uma amostra de n elementos de uma população pode ser considerada como um experimento
que consiste de n ensaios (ou experimento) de Bernoulli. Os n ensaios serão independentes nos seguintes
casos:
(a) Quando os elementos da amostra são sorteados com ou sem reposição de uma população innita.
Obviamente, o resultado de um sorteio qualquer é independente do outro sorteio e a proporção
p de sucessos (P (S) = p) permanece constante em cada sorteio. Então, é aplicável a distribuição
Binomial.
(b) Quando os elementos da amostra são sorteados com reposição de uma população nita. Suponha
que a população tenha N elementos, dos quais k são de certa classe que temos interesse. Dene-
se, assim, a variável X : numero de elementos da classe de interesse na amostra de tamanho
n.
Os sorteios individuais são ensaios de Bernoulli, onde elemento da classe de nosso interesse cor-
responde "sucesso"e o experimento de tomar uma amostra de tamanho n com reposição consiste
nos n ensaios independentes de Bernoulli onde p = P (sucesso) = Nk ; isto é, X tem distribuição
binomial, µ ¶ · ¸x · ¸
n k k n−x
f (x) = 1− , x = 1, . . . , n
x N N
Exemplo 4.5.4 Numa população grande de Drosophila, o 25% das moscas tem mutação de asas.
Seleciona-se, aleatoriamente 300 moscas da população para uma exame de mutação de asas. A variável
aleatória X é denida como o número de moscas que têm mutação na amostra. Determinar o valor
esperado e a variância de X
Como a população é grande (innita), não interessa se amostragem é com ou sem reposição, portanto,
X tem distribuição Binomial com parâmetros n = 300 e p = 0, 25, isto é X ∼ B(300, 0, 25)
A função de probabilidade de X é
µ ¶
300
f (x) = (0, 25)x (0, 75)300−x , x = 0, 1, . . . , n
x
A média
E(X) = np = 300 × 0, 25 = 75
Variância
3 225
V ar(X) = np(1 − p) = 75 × =
4 4
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 91
A variável aleatória assim denida chama-se variável aleatória Hipergeométrica e sua função de pro-
babilidade é: M N −m
( x )( n−x )
, x = 0, 1, . . . , min{n, M }
f (x) = P (X = x) = (Nn )
0, caso contrário
A notação X ∼ H(N, M, n), indica que a variável aleatória X tem distribuição Hipergeométrica com
parâmetros N , M e n.
(a) E(X) = n M
N
(b) V ar(X) = n M
N (1 −
M N −n
N )( N −1 )
Exemplo 4.5.5 Suponha que o gerente de credito de um estabelecimento recebe 10 pedidos de credito,
dos quais 4 têm documentação incompleta e devem ser devolvidas aos clientes. Escolhe-se, ao acaso 5
pedidos sem reposição obter:
Seja X : número de pedidos de crédito devolvidos numa amostra de 5 pedidos . Neste caso considera-se
"sucesso", se o pedido de credito é devolvido . Portanto X ∼ H(10, 4, 5), ou seja,
4 6
(x)(5−x)
, x = 0, 1, 2, 3, 4
f (x) = P (X = x) = (10)
0, 5 caso contrário
Exemplo 4.5.6 Foram colocados em uma caixa 100 peças, 40 dos quais foram fabricadas pela indus-
tria B e as outras pela indústria A. Retiradas, sem reposição, 8 peças, qual é a probabilidade de que
sejam 4 da indústria A?
Os eventos discretos gerados num intervalo contínuo (unidade: comprimento, área, volume, tempo,
etc.) formam um processo de Poisson com parâmetro λ se satisfazer as seguintes propriedades:
1. O número médio de ocorrência dos eventos numa unidade de medida (comprimento, área, volume,
tempo, etc.) é conhecido e igual a λ.
2. A ocorrência de um evento numa unidade de medida h não afeta a ocorrência ou a não ocorrência
em outra unidade de medida h contígua. Isto é, a ocorrência dos eventos em unidades de medida
contíguas são independentes.
Denição 4.5.2 Uma variável discreta X tem distribuição de Poisson com parâmetro µ se sua função
de probabilidade é dada por
e−µ µx
f (x) = , x = 0, 1, 2, . . . , (4.5)
x!
onde
X numero de eventos discretos em t unidades de medida.
λ é a média de eventos discretos em uma unidade de medida.
t número de unidade de medida.
µ = λt é a média de eventos discretos em t unidades de medidas.
A notação X ∼ Po (µ) é para indicar que a variável aleatória X tem distribuição de Poisson com
parâmetro µ. A média e a variância de variável aleatória com distribuição de Poisson com parâmetros
µ são:
E(X) = µ
V ar(X) = µ.
Exemplo 4.5.7 Suponha que a central telefônica de empresa de grande porte recebe, em média, 3
chamadas cada 4 minutos. Qual é probabilidade que a central recepcione 2 ou menos chamadas em um
intervalo de 2 minutos?
Solução: Se, X: número de chamadas que recebe a central telefônica da empresa em intervalos de 2
minutos, então X ∼ Po (µ = λt). Aqui, λ = 3/4 = 0.75, t = 2, então µ = λt = 0, 75 × 2 = 1, 5. Daí,
X ∼ Po (1, 5) ou seja, a variável aleatória X tem a seguinte função de probabilidade:
e−1,5 1, 5x
f (x) = P [X = x] = , x = 0, 1, . . . .
x!
1,52
P (X ≤ 2) = P [X = 0] + P [X = 1] + P [X = 2] = e−1,5 [1 + 1, 5 + 2 ] = 0, 808847.
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 94
Exemplo 4.5.8 Sabe-se que um líquido particular contem certas bactérias a razão de 4 bactérias por
cm3 . Uma amostra de 1cm3 desse líquido é tomado. (a) Qual é a probabilidade que a amostra não
contenha nenhuma bactéria.? (b) Qual é a probabilidade de que em 0, 5cm3 do líquido haja pelo menos
uma bactéria?
Solução: (a) Seja a variável aleatória X : número de bactérias em 1cm3 do líquido. Aqui λ = 4, t = 1
e µ = λt = (4)(1) = 1. Então X ∼ Po (4). A função de probabilidade da variável aleatória X é dada
por:
4x e−4
f (x) = P (X = x) = , x = 0, 1, . . . .
x!
P (X = 0) = e−4 = 0, 0183
(b) X : O número de bactérias em 0, 5cm3 do liquido. Aqui λ = 4, t = 0, 5 e µ = λt = (4)(0, 5) = 2.
Então X ∼ Po (2).
2x e−2
f (x) = P (X = x) = , x = 0, 1, . . . .
x!
P (X ≥ 1) = 1 − P (X < 1) = 1 − P (X = 0) = 1 − e−2 = 0, 864.
Será mostrado agora, a distribuição de Poisson como um limite da distribuição Binomial, com µ = np é
considerado que p = P (S) é sucientemente pequena (p −→ 0) e n é sucientemente grande (n −→ ∞),
de tal forma que np permaneça constante. A distribuição binomial para x sucessos em n ensaio de
Bernoulli é dada por: µ ¶
n x n−x
P [X = x] = p q , x = 0, . . . , n.
x
µ
Considera-se µ = np. Logo p = n e q = 1 − p = 1 − nµ . Substituindo-se na função de probabilidade
tem-se:
n! µ µ
P [X = x] = ( )x (1 − )n−x
x!(n − x)! n n
n! µ x (1 − nµ )n
= × ×
(n − x)!nx x! (1 − nµ )x
µ
n(n − 1)(n − 2) . . . (n − (x − 1))(n − x)! µx (1 − n )n
= × ×
nx (n − x)! x! (1 − nµ )x
µ
1 2 x+1 µx (1 − n )n
= (1 − )(1 − ) . . . (1 + )× ×
n n n x! (1 − nµ )x
x
(1) Se n −→ ∞, então n −→ 0 e, x+1
n −→ 0
µ
(2) p = n é pequeno (p −→ 0), então (1 − nµ )x −→ 1
(3) sabe-se que (1 − nµ )n = e−λ se n −→ ∞.
Observação 4.5.1 Da forma como foi obtido essa aproximação, a distribuição de Poisson pode ser uti-
lizado para aproximar probabilidades de uma distribuição Binomial quando n é sucientemente grande
(n −→ ∞ ) e p é muito pequeno (p −→ 0 ). Na prática considera-se que a aproximação é aceitável se
np < 5 ou n(1 − p) < 5. Nesse caso, considera-se que X ∼ Po (np).
Exemplo 4.5.9 Uma vacina imuniza contra polio num 99,99%. Supondo que a vacina foi adminis-
trada a 10.000 pessoas.
Solução: X número de pessoas não imunizadas nas 10.000 vacinadas. RX = {0, 1, . . . , 10.000}. A
probabilidade que uma pessoa não seja imunizado é 0,0001, ou seja P (S) = p = 0, 0001 e n = 10.000,
portanto X ∼ B(10.000, 0, 0001)
Y = X1 + · · · + Xn ,
Exemplo 4.5.10 Em uma fábrica foram registrados em três semanas a média de acidentes: 2,5 na
primeira semana, 2 na segunda semana e 1,5 na terceira semana. Suponha que o número de acidentes
por semana segue um processo de Poisson. Qual é a probabilidade de que haja 4 acidentes nas três
semanas?
Solução:
Denem-se as variáveis aleatórias com distribuição de Poisson com parâmetro µi , (i = 1, 2, 3).
X1 : Número de acidentes na primeira semana.
X2 : Número de acidentes na segunda semana.
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 96
Figura 4.5: Função de: (a) densidade e (b) distribuição acumulada, da distribuição uniforme
A média e a variância de uma variável aleatória X, com distribuição exponencial são dadas por:
A notação X ∼ Ex(λ) indica que a variável aleatória X tem distribuição exponencial com parâmetro
λ.
Na gura 4.6, é apresentado o gráco da densidade
A função da distribuição acumulada de uma variável aleatória contínua com distribuição exponencial
com parâmetro λ: ½
0, x≤0
F (x) = x (4.11)
1 − e− λ , x > 0
Exemplo 4.6.1 O tempo de vida (em horas) de um transistor é uma variável aleatória X com f.d.p
½ x
1 − 500
f (x) = 500 e , x>0
0, x≤0
(b) Qual é a probabilidade de que o tempo de vida seja maior do que a média
(c) Se um transistor em particular há durado mais 300 horas. Qual é a probabilidade de que dure
outras 400 horas?
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 98
Denição 4.6.3 (Distribuição normal) Uma variável aleatória contínua X tem distribuição nor-
mal com média µ e variância σ 2 , se sua função de densidade é dado por:
1 1 x−µ 2
f (x) = √ e− 2 ( σ ) , x ∈ R (4.12)
2πσ
Usaremos a notação X ∼ N (µ, σ 2 ), para indicar que X tem distribuição normal com parâmetros µ e σ 2 .
A função de densidade da normal é representada na gura 4.8. Algumas propriedades da distribuição
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 99
1. E(X) = µ e V ar(X) = σ 2 .
2. A curva é simétrica em torno da média µ.
3. É assintótica em relação ao eixo horizontal.
4. A área total sob a curva é igual a um portanto, cada metade da curva tem 0, 5 da área total.
A gura 4.9 apresenta o comportamento da função de densidade para valores diferentes da média µ e
variâncias iguais. A variância é uma medida de dispersão ou de variabilidade da variável aleatória. A
maior variância, maior variabilidade. Isso pode ser observado gracamente na gura 4.10.
Denição 4.6.4 (Distribuição normal padrão ou reduzida) Se Z é uma variável aleatória que
tem distribuição normal com média µ = 0 e variância σ 2 = 1, então Z é chamado de variável aleatória
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 100
Teorema 4.6.1 (Transformação linear de uma variável normal) Se X é uma variável aleatória
normal com média µ e variância σ 2 , então a variável, Y = a + bX tem distribuição normal com média,
µY = a + bµ e variância, σY2 = b2 σ 2 .
A tabela de distribuição normal padrão (veja apêndice A) fornece a probabilidade da variável normal
padrão Z assumir um valor menor ou igual a z . Isto é,
Φ(z) = P (Z ≤ z).
Essa probabilidade é representada pela área sombreada na gura 4.11. A função Φ(z) também recebe
o nome de distribuição acumulada da distribuição normal padrão. A tabela A do apêndice A fornece
os valores de Φ(z), para valores 0 ≤ z < 3, 99 (os valores para Φ(z), para −3, 99 ≤ z ≤ 0 são obtidos
por simetria).
Solução: Para o cálculo de probabilidades sob a distribuição de variáveis aleatórias contínuas (normal
padrão) torna-se indiferente o uso de sinais < ou ≤ bem como > ou ≥, então temos:
(a)
µ ¶
70 − 90 X −µ 90 − 90
P (70 ≤ X < 90) = P ≤ ≤ = P (−2 ≤ Z ≤ 0)
10 σ 10
= P (Z ≤ 0) − P (Z ≤ −2) = P (Z ≤ 0) − [1 − P (Z ≤ 2)]
= 0, 5 − [1 − 0, 97725] = 0, 47725
(b)
µ ¶
−30 X − 90 30
P (|X − 90| ≤ 30) = P (−30 ≤ X − 90 ≤ 30) = P ≤ ≤ = P (−3 ≤ Z ≤ 3)
10 10 10
= P (Z ≤ 3) − P (Z ≤ −3) = 2P (Z ≤ 3) − 1 = 2 × 0, 99865 − 1 = 0, 9973
(c)
−2a 2a
P (90 − 2a ≤ X ≤ 90 + 2a) = P (−2a ≤ X − 90 ≤ 2a) = P ( ≤Z≤ )
10 10
a a
= 2P (Z ≤ ) − 1 = 0, 99 ⇒ P (Z ≤ ) = 0, 995
5 5
a
Portanto 5 = 2, 57 → a = 12, 85.
Exemplo 4.6.4 Os níveis de colesterol sérico em homens de 18 a 24 anos de idade tem distribuição
normal com média de 178,1 mg/mL e desvio padrão de 40,7 mg/mL. Os dados se baseiam na "National
Health Survey". Escolhido aleatoriamente um homem entre 18 e 24 anos, determine:
(a) a probabilidade de que seu nível de colesterol esteja entre 200 mg/mL e 250 mg/mL.
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 103
(b) o nível de colesterol para ser incluído nos 10% dos homens com menor nível de colesterol.
Solução: Seja a variável X : "nível de colesterol sérico em homens com idade entre 18 a 24 anos."X ∼
N (178, 1; 40, 72 ).
³ ´
200−178,1 X−µ 200−178,1
(a) P (200 ≤ X ≤ 250) = P 40,7 ≤ σ ≤ 40,7 = P (0, 54 ≤ Z ≤ 1, 77) =
³ ´
x0 −178,1
Portanto, 0, 10 = P (X < x0 ) = P Z < 40,7 , ⇒ P (Z < −z0 ) = 0, 10, sendo −z0 =
x0 −178,1
40,7 . Da observação 4.6.1, tem-se que P (Z ≤ z0 ) = 0, 90. Isso implica em z0 = 1, 28. Daí
x0 −178,1
40,7 = −1, 28 =⇒ x0 = 126, 004
e variância n
X
σY2 = a21 σ12 + a22 σ22 · · · + a2n σn2 = a2i σi2 .
i=1
Exemplo 4.6.5 Uma empresa desenvolve um conjunto restrito de atividades,Xi (i = 1, 2, 3). Suponha
que o lucro Y (em unidades monetárias) associado às diferentes atividades é dado pela seguinte equação:
Y = 2X1 + 3X2 + X3 . Considerado que as diferentes atividades da empresa são variáveis aleatórias
independentes com distribuição normal tais que: X1 ∼ N (10, 5), X2 ∼ N (15, 20) e X3 ∼ N (12, 10),
qual é a probabilidade de que empresa tenha um lucro de no máximo, 80 unidades monetárias.?
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 104
Exemplo 4.6.6 Suponha que a carga máxima suportada X1 por um pilar de concreto armado durante
sua vida é uma variável aleatória normal com média 110 kg e desvio padrão de 16 kg, além disso admite-
se que sua resistência é outra variável aleatória X2 , com distribuição normal com média 215 kg e desvio
padrão de 30 kg. Qual é a probabilidade de ruptura desse pilar?.
Exemplo 4.6.7 O peso de peixes pescados por uma embarcação tem distribuição normal com média
de 4,5 kg e desvio padrão 0,5 kg. Se os peixes são embaladas em caixas que contem 20 peixes, qual é a
probabilidade de que o peso total dos peixes contidos numa caixa seja maior de 92 kg?
Solução: Seja a variável aleatória, X : peso de um peixe. Então X ∼ N (4, 5, (0, 5)2 ), e seja Y : o peso
total da caixa com 20 peixes, então Y = X1 +X2 +· · ·+Xn , onde Xi é o peso do i-ésimo peixe na caixa.
Assim, Xi ∼ N (4, 5, (0, 5)2 ), i = 1, . . . , 20. Pelo corolário 4.6.1, Y ∼ (20 × 4, 5, 20 × (0, 5)2 ) = N (90, 5)
Y − 90 92 − 90
P (Y > 92) = P ( √ > √ ) = P (Z > 0, 89) = 1 − p(Z ≤ 0, 89) = 1 − 0, 81327 = 0, 18673
5 5
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 105
1. Quando a amostra provem de uma população innita2 e quando a amostra é sorteada ao acaso
com reposição de uma população nita.
2. Quando as amostras se sorteia sem reposição de uma população nita, evidentemente não satisfaz
a denição da amostra aleatória, pois as variáveis aleatórias X1 , . . . , Xn não são independentes.
Porem, se o tamanho da amostra é muito pequena em comparação com o tamanho da população,
a denição é satisfeita aproximadamente.
Exemplo 4.7.1 De uma população normal com média 10 e variância 12 selecionou-se uma amostra
aleatória, X1 , X2 , . . . , X10 . Calcular
P (X1 − X5 + X8 ≥ 13).
Solução: Se X, é uma variável aleatória da população normal, X ∼ N (10, 12). Então, por ser
X1 , . . . , X10 uma amostra aleatória, satisfaz: (a) Xi , i = 1, . . . , 10 são variáveis aleatórias indepen-
dentes e (b) Xi ∼ N (10, 12). Se, Y = X1 − X5 + X8 , então Y ∼ N (µY , σY ) por ser variáveis aleatórias
normais independentes (pela teorema 4.6.2) onde
Denição 4.7.2 (Estatística) Um estatística é uma variável aleatória que depende somente da amos-
tra observada
P
n
Exemplo 4.7.2 Sejam X1 , . . . , Xn uma amostra aleatória de uma população X , então X̄ = 1
n Xi
i=1
1 P
n
e S2 = n−1 (Xi − X̄)2 são estatísticas.
i=1
a) Se a amostragem é com reposição de uma população nita (ou amostragem com ou sem reposição
em uma população innita).
2 σ2
µX̄ = µX e σX̄ = X
n
b) Se a amostragem é sem reposição de uma população nita com N elementos.
2 ·
σX
¸
2 N −n
µX̄ = µX e σX̄ =
n N −1
Exemplo 4.7.3 Um auditor de uma empresa deseja determinar a quantidade de produtos existentes
no estoque da empresa. Para isso determinou para cada produto do inventario, a diferença (X) entre
o número artigos registrados e o número de artigos realmente existente. Se o inventario consta de 5
artigos e os valores de X em milhares de dólares são:
P roduto A B C D E
X 0 −1 0 1 2
obter a distribuição amostral de X̄ para amostragem com ou sem reposição, quando n = 2
Portanto,
2 6
E(X) = = 0, 4 e E(X 2 ) = = 1, 2
5 5
2 = E(X − µ )2 = E(X 2 ) − E(X)2 = 1, 2 − (0, 4)2 = 26
com o qual: µX = E(X) = 0, 4 e σX X 25 = 1, 04
Considerando o teorema 4.7.1 tem-se que a média e variância da distribuição da média amostral
com N = 5, n = 2 é:
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 107
Para determinar a distribuição da média amostral deve-se determinar todas as amostras possíveis, suas
respectivas médias e suas probabilidades de ocorrência considerando 2 casos:
Quando a seleção dos elementos da amostra se efetua com probabilidades iguais, o número de amostras
possíveis é igual á:
µ ¶ µ ¶
N 5
Número de amostras possíveis = = == 10
n 2
onde N é o tamanho da população e n é o tamanho da amostra. As amostras possíveis se apresentam
na tabela seguinte:
Amostra Valores Média
possível observados de X amostral x̄ probabilidade
1
A, B (0; −1) −0, 5 0, 1 = 10
A, C (0;0) 0,0 0,1
A, D (0;1) 0,5 0,1
A, E (0;2) 1,0 0,1
B, C (-1;0) -0,5 0,1
B, D (-1;1) 0,0 0,1
B, E (-1;2) 0,5 0,1
C, D (0;1) 0,5 0,1
C, E (0;2) 1,0 0,1
D, E (1;2) 1,5 0,1
Sendo a seleção com probabilidades iguais, todas as amostras possíveis tem a mesma probabilidade de
ocorrência , e portanto a probabilidade de um valor da média amostral será igual a probabilidade de
1
seleção de cada amostra ( 10 ) multiplicada por o número de amostras que geram dito valor.
Logo,a função de probabilidade da média amostrais X̄, é:
0, 1, se x̄ = 1, 5
0, 2, se x̄ = −0, 5; 0, 0; 1, 0
f (x̄) =
0, 3, se x̄ = 0, 5
0, 0, caso contrário
Quando a seleção dos elementos da amostra se efetua com probabilidades iguais, o número de amostras
possíveis é igual a N n = 52 = 25, onde N é o tamanho da população e n é o tamanho da amostra. As
amostras possíveis se apresentam na seguinte tabela:
Amostra Valores Média
possível observados de X amostral probabilidade
1
A, A 0; 0 0, 0 0, 04 = 25
A, B 0;-1 -0,5 0,04
A, C 0;0 0,0 0,04
A, D 0;1 0,5 0,04
A, E 0;2 1,0 0,04
B, A -1;0 -0,5 0,04
B, B -1;-1 -1,0 0,04
B, C -1;0 -0,5 0,04
B, D -1;1 0,0 0,04
B, E -1;2 0,5 0,04
C, A 0;0 0,0 0,04
C, B 0;-1 -0,5 0,04
C, C 0;0 0,0 0,04
C, D 0;1 0,5 0,04
C, E 0;2 1,0 0,04
D, A 1;0 0,5 0,04
D, B 1;-1 0,0 0,04
D, C 1;0 0,5 0,04
D, D 1;1 1,0 0,04
D, E 1;2 1,5 0,04
E, A 2;0 1,0 0,04
E, B 2;-1 0,5 0,04
E, C 2;0 1,0 0,04
E, D 2;1 1,5 0,04
E, E 2;2 2,0 0,04
1
25 , se x̄ = −1, 0; 2, 0
4
se x̄ = −0, 5
25 ,
6
25 , se X̄ = 0, 0; 0, 5
f (X̄) = 5
25 , se X̄ = 1, 0
2
25 , se x̄ = 1, 5
0, casso contrario
Daí tem-se que:
X 1 2
E(X̄) = ) + ... + (1, 5)( ) = 0, 4
x̄i f (x̄i ) = (−1, 0)(
25 25
X
2 2 1 2
E(X̄ ) = 2
x̄i f (x̄i ) = (−1, 0) ( ) + ... + (1, 5)2 ( ) = 0, 68
25 25
µx̄ = E[X̄] = 0, 4 e σx̄2 = E[X̄ 2 ] − µ2x̄ = 0, 68 − (0, 4)2 = 0, 52
No exemplo anterior, conseguimos enumerar as possíveis amostras e assim obter sua função de
probabilidade da média amostral. Nem sempre isso será possível, por exemplo se X tem distribuição
de Poisson com parâmetro µ = 5, uma amostra aleatória de tamanho 2 desta população, X1 e X2
continuaram sendo independentes e identicamente distribuídos com função de probabilidade, Po (5).
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 109
Mas, é complicado enumerar todas as possíveis amostras de tamanho 2, portanto é difícil de determinar
a distribuição de probabilidade da média amostral.
2
X̄ ∼ N (µX , σX /n).
Embora este resultado seja de extrema importância, eles são relativamente limitado, já que, somente
permite especicar a distribuição da média amostral no caso de uma população normal. Na prática,
muitas vezes não temos informação a respeito da distribuição das variáveis que constituem a amostra,
o que nos impede utilizar o resultado apresentado. Felizmente, satisfeitas certas condições pode ser
mostrado que para uma amostra sucientemente grande, a distribuição de probabilidade da média
amostral pode ser aproximada por uma distribuição normal, com média e variância iguais àquelas
calculadas anteriormente. Este fato é um dos teoremas mais importantes da estatística e probabilidade
e é denominado o teorema central do limite.
A continuação enuncia-se o teorema central do limite considerando que a população é innita.
Teorema 4.7.2 (Teorema Central do Limite) Seja X1 , . . . , Xn uma amostra aleatória de tama-
2 , nita. Então a média amostral, X̄ ,
nho n retirada de uma população com média µX é variância σX
tem distribuição aproximadamente normal com média µX e variância σX 2 /n, para n sucientemente
Neste texto consideraremos que o tamanho de amostra é sucientemente grande quando n ≥ 30.
Exemplo 4.7.4 Suponha que na produção em série de um artigo, o peso é uma variável aleatória
com uma média de 950 g e uma variância de 1600 g 2 . Seleciona-se aleatóriamente e com reposição 36
artigos, calcular a probabilidade que a média amostral seja maior de 965 g.
Se as populações onde foram retiradas as amostras não tiveram distribuição normal, pelo teorema 4.7.2,
segue válido o resultado se os tamanhos amostrais n e m são sucientemente grandes, isto é n ≥ 30 e
m ≥ 30.
Exemplo 4.7.5 Suponha que numa central de correios (A) o peso (em gramas) das cartas tem dis-
tribuição normal com média 350 g e desvio padrão de 56,27 g.
(a) Qual deve ser o tamanho da amostra para que a probabilidade de que o peso médio das carta
dera do peso médio verdadeiro em menos de 15 g, seja igual a 0,9426
(b) Em outra central de correio (B) encontrou-se que os peso (em gramas) das cartas tem distribuição
normal com média de 320 g e desvio padrão de 50 g. Retiram-se ao acaso 20 cartas de cada central
de correios, qual é probabilidade de que o peso médio das cartas retiradas do correio A seja maior
ao peso médio das cartas do correio B em pelo menos 10 g?
Solução: Seja, X : peso das cartas do correio A, então X ∼ N (350, (56, 27)2 )
(a) X̄ ∼ N (350, (56, 27)2 /n), do enunciado do problema temos que determinar n =?, tal que, P (|X̄ −
µ| < 15) = 0, 9426
|X̄ − µ| √
P (|X̄ − µ| < 15) = P ( √ < 15/56, 27/ n)
σ/ n
√
= P (|Z| ≤ 0, 2666 n) = 0, 9426,
que é equivalente a:
P (|Z| < z0 ) = P (−z0 ≤ Z ≤ z0 ) = P (Z ≤ z0 ) − P (Z ≤ −z0 )
= 2P (Z ≤ z0 ) − 1 = 0, 9426
√
portanto P (Z ≤ z0 ) = 0, 9713, da tabela normal padrão, temos que, z0 = 1, 90. Portanto, 0, 2666 n =
1, 90, n = 51.
(b) Y o peso de cartas do correio B, então, Y ∼ N (320, 502 ), que implica em
n = 20 X̄ ∼ N (350, (56, 27)2 /20)
m = 20 Ȳ ∼ N (320, 502 /20),
56, 272 502
X̄ − Ȳ ∼ N (350 − 320, + ) = N (30, 283, 31)
20 20
P
n
1. Y = Xi tem distribuição Binomial com parâmetros n e p.
i=1
Y P
n
2. A proporção amostral de sucessos é: p̂ = n = Xi /n = X̄. De (1) a distribuição de probabili-
i=1
dade de p̂ é: µ ¶
y n y
P (p̂ = ) = p (1 − p)n−y .
n y
E para n sucientemente grande ( teorema 4.7.2), tem distribuição aproximadamente normal
com média p e variância pq
n . Isto é,
pq
p̂ ∼ N (p, ).
n
Exemplo 4.7.6 Uma empresa tem um número grande de funcionários. A probabilidade de que um
empregado selecionado ao acaso, participe de um programa de treinamento é 0,40.
(a) Se 10 funcionários são escolhidos ao acaso, qual é a probabilidade que proporção de participantes
seja
(b) suponha que 100 funcionários escolhidos ao acaso, participaram do treinamento qual é a proba-
bilidade de que proporção de participantes do programa seja maior que 50%?
Observação 4.7.2 Os resultados de acima são válidas tambén nos seguintes casos:
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 112
Exemplo 4.7.7 Informações anteriores mostram que 10% do lote de peças para uma máquina são
defeituosos. Suponha que um lote de 5000 peças foi adquirido. Seleciona-se uma amostra de 400 peças,
ao acaso e sem reposição. Que proporção da amostra terá
Solução: Seja a variável aleatória Y : número de peças defeituosas na amostra e P (sucesso) = p = 0, 10.
A população é nita pois N = 5000 e p̂ = Yn é a proporção de defeituosos na amostra. Já que, n = 400,
grande, a variável
r aleatória, p̂ tem distribuição aproximadamente normal com média µp̂ = 0, 10 e desvio
³ ´ r ³ ´
(0,10)(0,90) 5000−400
padrão, σp̂ = pq n
N −n
N −1 = 400 5000−1 = 0, 0144.
(a)
0, 09 − 0, 10 p̂ − p 0, 10 − 0, 10
P (0, 09 < p̂ < 0, 10) = P <q <
0, 0144 pq N −n 0, 0144
n ( N −1 )
= P (−0, 69 < Z < 0) = P (Z ≤ 0) − P (Z ≤ −0, 69)
= 0, 5 − 0, 2451 = 0, 2549.
à !
(b) P (p̂ < 0, 08) = P q p̂−p < 0,08−0,10
= P (Z < −1, 39) = 0, 0823.
pq N −n
( ) 0,0144
n N −1
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 113
tem distribuição Qui-quadrado com k graus de liberdade e sua função de densidade é dada por:
1 k w
f (w) = k/2
w 2 −1 e− 2 , w > 0 (4.19)
Γ(k/2)2
Γ(a) = (a − 1)Γ(a − 1)
√
Γ(1/2) = π
Γ(a) = (a − 1)!, para a enteiro
A notação W ∼ χ2(k) é usada para indicar que a variável W tem distribuição Qui-quadrado com k
graus de liberdade.
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 114
Propriedades
Se W ∼ χ2(k)
Na tabela B do apêndice A, tem-se os pontos críticos da distribuição W ∼ χ2(k) , denotado por χ2α,k tal
que a probabilidade Z ∞
2
P (W > χα,k ) = f (w)dw
χ2α,k
Essa probabilidade é representada pela área sombreada da gura 4.14. Para ilustrar o uso da tabela
B, observe que as áreas α estão na primeira linha e na primeira coluna estão os graus de liberdade
k. Portanto, o valor de χ2 com 10 graus de liberdade e com área (probabilidade) 0,05 à direita é
χ20,05,10 = 18, 31. Isto é,
P (W > χ20,05,10 ) = P (W > 18, 31) = 0, 05.
Exemplo 4.8.1 Se X é uma variável aleatória χ2(17) , obtenha: (a) P (X ≥ 8, 67); (b)P (X ≤ 867);
(c) P (6, 41 < X < 27, 59); (d) o valor de a tal que P (X < a) = 0, 025.
Solução
(a) P (X ≥ 8, 67) = P (X ≥ χ20,95,17 ) = 0, 95.
(b) P (X ≤ 867) = 1 − P (X ≥ 8, 67) = 1 − 0, 95 = 0, 05.
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 115
Teorema 4.8.2 Seja X1 , . . . , Xn uma amostra aleatória de uma população normal com média µ e
variância, σ 2 . Então a variável aleatória
P
n
(Xi − X̄)2
i=1
W = (4.20)
σ2
segue uma distribuição Qui-quadrado com n − 1 graus de liberdade.
³ ´
Prova: A variável Zi = Xi −µ
∼ N (0, 1), i = 1, . . . , n independentes entre si. Pela denição da
σ
n ³
P ´2 ³ ´2
Xi −µ 2 e X̄−µ
distribuição Qui-quadrado, tem-se σ ∼ χ(n)
√
σ/ n
∼ χ2(1) , mas
i=1
n µ
X ¶ X n µ ¶2 µ ¶
Xi − µ 2 Xi − X̄ X̄ − µ
= + √
σ σ σ/ n
|i=1 {z } i=1
| {z } | {z 2
}
χ2(n) χ2(n−1) χ(1)
Pelo teorema 4.8.1, W tem distribuição Qui-quadrado com n − 1 graus de liberdade. Uma forma
equivalente da variável W, em (4.20), é:
(n − 1)S 2
W = ∼ χ2(n−1)
σ2
Exemplo 4.8.3 Suponha que o tempo de atendimento por cliente em uma loja tem distribuição
normal com variância de 0,81. Se uma amostra aleatória de 21 clientes foi retirada, obtenha: (a)
P (S 2 < 1, 272); (b) P (0, 50625 < S 2 < 1, 272);
(b)
µ ¶
2 (21 − 1)(0, 50625) (n − 1)S 2 (21 − 1)(1, 272)
P (0, 50625 < S < 1, 272) = P < <
0, 81 σ2 0, 81
= P (12, 5 < W < 31, 41) = P (W > 12, 5) − P (W > 31, 41),
Nesse caso, na tabela χ2(20) , não há a probabilidade associada ao valor 12,5. Porém, essa probabilidade
pode ser aproximada mediante um processo de interpolação linear da seguinte forma:
onde
(12, 5 − 19, 34)(0, 90 − 0, 5)
α = 0, 5 + = 0, 896522.
12, 44 − 19, 34
Portanto, P (0, 50625 < S 2 < 1, 272) = P (W > 12, 5) − P (W > 31, 41) = 0, 896522 − 0, 05 = 0, 846522
tem distribuição t-Student com k graus de liberdade. A função de densidade de probabilidade é dado
por:
µ ¶−(k+1)/2
Γ( k+1
2 ) t2
f (t) = 1+
(kπ)1/2 Γ( k2 ) k
A notação T ∼ t(k) é usada para indicar que a variável T tem distribuição t-Student com k graus de
liberdade.
Na gura 4.15 é apresentado o gráco da função de densidade de probabilidade, para k = 5, 10, 20
graus de liberdade.
Propriedades Se T ∼ t(k) .
(a)
E(T ) = 0
k
V ar(T ) = , k>2
k−2
A tabela C, do apêndice A proporciona os pontos críticos da distribuição t-Student. Seja tα,k o valor da
variável aleatória T com k graus de liberdade para o qual tem-se uma área (probabilidade) α. Portanto,
tα,k é um ponto crítico na cauda superior da distribuição t-Student com k graus de liberdade. Este
ponto crítico aparece na gura 4.16. Na tabela C do apêndice, os valores de α encontram-se na primeira
linha da tabela, enquanto os graus de liberdade aparecem na primeira coluna da parte esquerda. Para
ilustrar o uso da tabela, observe que o valor de t-Student com 10 graus de liberdade que tem área de
0,05 à direita é t0,05,10 . Isto é,
Figura 4.16: Pontos críticos, tα,k , da distribuição t-Student com k graus de liberdade
Como, a distribuição t-Student é simétrica com respeito a zero (média), tem-se que t1−α,k = −tα,k .
Isto é, o valor da variável T que corresponde a uma área igual (1 − α) à direita (e, portanto, uma área
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 118
de α à esquerda) é igual ao negativo do valor de T, que tem área α na cauda direita da distribuição.
Em conseqüência, t0,95,10 = −t0,05,10 = −1, 812.
Exemplo 4.8.4 Seja T uma variável aleatória com distribuição t-Student com 12 graus de liberdade
(gl). Determine:
Solução: Se T ∼ t(12)
(a) Da tabela t-Student tem-se: P (T > 1, 356) = 0, 10. Pela simetria da distribuição t-Student tem-se;
P (T > 1, 356) = P (T < −1, 356) = 0, 10. Portanto,
(b) P (0, 695 < T < 2, 179) = P (T > 0, 695) − P (T > 2, 179) = 0, 25 − 0, 025 = 0, 225
(c) P (−2, 179 < T < 2) = P (T > −2, 179) − P (T > 2). Mas na tabela t-Student não há o valor de
2 para 12 graus de liberdade (ou seja, não há tα,12 ). Porem, essa quantidade pode ser aproximado
mediante uma interpolação linear.
daí tem-se:
(0, 05 − 0, 025)(2 − 2, 179)
α = 0, 025 + = 0, 036272.
1, 782 − 2, 179
Logo,
P (−2, 179 < T < 2) = P (T > −2, 179) − P (T > 2) = 1 − P (T > 2, 179) − P (T > 2)
= 1 − 0, 025 − 0, 036272 = 0, 938728.
(c)
P (−1, 782 < T < 1, 782) = P (T > −1, 782) − P (T > 1, 782) = 1 − P (T < 1, 782) − P (T > 1, 782)
= 1 − 2P (T > 1, 782) = 1 − (2)(0, 05) = 0, 90.
Teorema 4.8.3 Seja X1 . . . , Xn uma amostra aleatória de tamanho n de uma população normal com
média µ e variância σ 2 (desconhecida). Assim, a variável aleatória
X̄ − µ
T = √
S/ n
Exemplo 4.8.5 De uma população normal com média µ, seleciona-se uma amostra aleatória de
tamanho 16 sendo a variância amostral igual a 2,25. Qual é probabilidade de que média amostral dira
da média real numa quantidade maior que 0,7543?
Logo, µ ¶
|X̄ − µ| 0, 7543
P √ > √ = P (|T | > 1, 341)
S/ n 2, 25/ 16
P (|T | > 1, 341) = 1 − P (−1, 341 ≤ T ≤ 1, 341) = 1 − [P (T > −1, 341) − P (T > 1, 341)]
= 1 − [1 − P (T < 1, 341) − P (T > 1, 341) = 1 − [1 − 2P (T > 1, 341)]
= 2P (T > 1, 341) = 2 × 0, 10 = 0, 20
Teorema 4.8.4 Seja X1 , . . . , Xn uma amostral aleatória de tamanho n de uma população com carac-
terística X, que tem distribuição normal com média µ1 e variância σ 2 (desconhecida). Seja Y1 , . . . , Ym
outra amostra aleatória de tamanho m, de uma população com característica Y que tem distribuição
normal com média µ2 e variância σ 2 (desconhecida). Se X e Y são independentes, a variável aleatória:
X̄ − Ȳ − (µ1 − µ2 )
T = q ,
Sp2 ( n1 + n1 )
(n−1)S12 +(m−1)S22
segue uma distribuição de t-student com n + m − 2 graus de liberdade, onde Sp2 = n+m−2 , e
é conhecida com a variância ponderada.
Além disso,
(n − 1)S12 2 (m − 1)S22
W1 = ∼ χ(n−1) e W2 = ∼ χ2(m−1)
σ2 σ2
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 120
(n − 1)S12 + (m − 1)S22
W = W1 + W2 = ∼ χ2(n+m−2) (4.22)
σ2
Além disso, as variáveis Z em (4.21) e W em (4.22) são independentes. Pela denição da distribuição
t-Student tem-se:
X̄−Ȳ −(µ1 −µ2 )
q
1 1
Z σ n +n X̄ − Ȳ − (µ1 − µ2 )
T =q =r 2 +(m−1)S 2
= q ∼ t(n+m−2) ,
W
n+m−2
(n−1)S1
σ2
2 Sp2 ( n1 + n1 )
n+m−2
(n−1)S12 +(m−1)S22
onde Sp2 = n+m−2 .
A notação F ∼ F (k1 , k2 ) indica que que a variável aleatória F tem distribuição F-Snedecor, com graus
de liberdade k1 e k2 .
Propriedades
Se F ∼ F (k1 , k2 ) então
k2 2k22 (k1 + k2 − 2)
µ= , k2 > 2 e σ 2 = , k2 > 4
k2 − 2 k1 (k2 − 2)2 (k2 − 4)
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 121
Os pontos críticos da distribuição F -Snedecor são apresentados na tabela D do apêndice. Seja fα,u,v o
ponto crítico da distribuição F com graus de liberdade numerador u e graus de liberdade denominador
v , tal que a probabilidade de que variável aleatória F seja maior que este valor é
Z ∞
P (F > fα,u,v ) = h(f )df = α
fα,u,v
Isto é ilustrado na gura 4.17. Por exemplo se u = 5 e v = 10, então da tabela C do apêndice, tem-se:
Figura 4.17: Pontos críticos, fα,u,v e , f1−α,u,v da distribuição F-Snedecor com u e v graus de liberdade
A tabela D contém, somente pontos críticos na cauda superior (valores de fα,u,v , para α ≤ 0, 25) da
distribuição F. Os pontos críticos na cauda inferior f1−α,u,v podem ser obtidos da seguinte forma:
1
f1−α,u,v = .
fα,v,u
Por exemplo, para determinar o ponto crítico na cauda inferior f0,95,5,10 observe que:
1 1
f0,95,5,10 = = = 0, 211.
f0,05,10,5 4, 74
(a) Se Y ∼ F (8, 12) obtenha: (a1) P (Y > 2, 85); (a2) P (2, 85 < Y < 4, 50); (a3) y1 se P (y1 < Y <
2, 95) = 0, 94
Teorema 4.8.5 Seja X1 , . . . , Xn uma amostra de tamanho n retirada de uma população, X que tem
distribuição normal com média µ1 (desconhecida) e variância, σ12 . Seja Y1 , . . . , Ym uma amostra de
tamanho m de uma população, Y , com distribuição normal com média µ2 (desconhecida) e variância
σ22 e se X e Y são independentes, a variável aleatória,
S12 /σ12
F =
S22 /σ22
segue uma distribuição F-Snedecor com n − 1 e m − 1 graus de liberdade.
Exemplo 4.8.7 Suponha que duas máquinas A e B produzem em forma independente um mesmo
artigo. A maquina A é regulado produzir artigos com peso médio µ (desconhecido) e variância σ12 = 5.
Enquanto a maquina B foi regulada a produzir artigos com média µ a variância σ22 = 4. Da produção
da máquina A foi escolhidas ao acaso, uma amostra aleatória de n = 11 artigos e da máquina B uma
amostra aleatória m = 12 artigos. Supondo que os pesos dos artigos produzidos pelas máquinas A e B
S2
seguem uma distribuição normal determine o valor de k tal que, P ( S12 > k) = 0, 05.
2
4.9 Exercícios
1. O Departamento de Matemática é formado por 35 professores, sendo 21 homens e 14 mulhe-
res. Uma comissão de 3 professores será constituída, sorteando-se, ao acaso, três membros do
departamento. Considere a variável aleatória X : número de mulheres na comissão. Determine:
(a) A probabilidade a comissão ser formada por pelo menos duas mulheres.
(b) O valor esperado e variância de X .
(c) A função de distribuição acumulada de X .
(d) A distribuição de probabilidades, valor esperado e a variância da variável |1 − 2X|
3. Considere no exercício 2, que escolha foi com reposição. Determina a função de probabilidades
da variável aleatória e a esperança de X e compare com os resultados do exercício anterior.
4. Num lote de 400 lâmpadas por experiências passadas se sabe que 20% são defeituosos. Do lote
sortia-se uma amostra (sem reposição) de 3 lâmpadas. (i) Qual é probabilidade de obter no
máximo 1 defeituosos na amostra. (ii) se cada lâmpada tem um custo de 1,5 unidades monetária
(u.m) e vende-se a 3 u.m , qual é o lucro esperado na amostra.
5. Uma empresa Química paga a seus estagiários de acordo com o ano de curso do estudante. Para
obter o salário mensal pago por 30 horas semanais, multiplica-se o salário mínimo pelo ano de
curso do estagiário. Dessa forma, o estudante do primeiro ano ganha um salário mínimo, o
do segundo recebe dois e assim por diante até o quinto ano. A empresa vai empregar 2 novos
estagiários e admitimos que todos os anos têm igual número de estudantes interessados no estágio
(considere a população de candidatos muito grande de modo a não haver diferença entre escolher
com e sem reposição). Determinar:
6. Suponha que D, o número de medicamentos vendidos em uma semana, seja uma variável aleatória
com a seguinte função de probabilidade:
½ Cd2
f (d) = P (D = d) = d! ; d = 1, 2, 3, 4
0; caso contrário
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 124
(a) Determine: (i) A constante C para que f(d) seja a função de probabilidade de D. (ii) o
número médio de medicamentos vendidos. (iii) a probabilidade do número de medicamentos
vendidos em uma semana seja no máximo três peças.
(b) Se cada medicamento vendido o representante ganha uma comissão de R$ 12,00 e se o custo
do medicamento é de R$ 3,00, qual é o lucro esperado em uma semana?
(a) Determine a constante k para que f (x) seja uma função de densidade de probabilidade de
X.
(b) Determine e interprete E(X) e V ar(X),
(c) Qual é a probabilidade de um microprocessador dure mais de 5 anos em uma escolha alea-
tória?
(d) Determine a função de distribuição acumulada da variável tempo de vida,
(e) Se um microprocessador há durando mais de 7 anos, qual é a probabilidade que dure outros
2 anos?
9. Uma industria produz artigos cujos pesos (em kg) é uma variável aleatória contínua X, que tem
a seguinte função de densidade de probabilidade
x−8 ; 8≤x≤9
f (x) = 10 − x ; 9 < x < 10
0 ; caso contrário
10. Sabe-se que com determinado tratamento alcança 60% de curas para certa doença quando o
mesmo é administrado a pacientes em condições bem denidas. Se tratamento for aplicado a 20
pacientes nessas condições, qual é probabilidade de que:
11. O teste de DNA, feito numa clínica, tem 99.99% de conabilidade nos resultados. Durante o
último ano, num hospital, esse exame foi requisitado por 200 pessoas para a comprovação de
paternidade. Com esses dados, calcule:
12. Um fármaco usado para combater intoxicação causada pelo mercúrio, causa, em 45% dos paci-
entes, efeitos colaterais. Num teste feito em 10 pessoas contaminadas por mercúrio, obtenha:
13. Num teste de laboratório para se medir a taxa de glicose no sangue, constatou-se que 25% das
pessoas que zeram o teste tinham glicose em torno de 100 mg/dl. Calcule a probabilidade de:
(a) Em 10 pessoas que zeram o teste, mais de 9 tenham glicose em torno de 100 mg/dl.
(b) Em 50 pessoas que zeram o teste, haja entre 5 e 10 pessoas com glicose em torno de 100
mg/dl.
14. Uma universidade processa 100.000 avaliações em determinado semestre, em ocasiões anteriores
mostraram, que o 0,1% de todas avaliações estavam equivocadas. Suponha que uma pessoa
faz cinco disciplinas nesta universidade em um semestre. Qual é a probabilidade que todas as
avaliações estejam corretas?
15. Um exame de múltipla escolha consiste em 10 questões, cada uma com cinco possibilidades de
escolha. A aprovação exige no mínimo 50%. Qual a chance de aprovação, se
(a) O candidato comparece ao exame sem saber absolutamente nada, apelando apenas para o
palpite.
(b) O candidato estudou suciente para poder eliminar três escolhas, devendo então apenas
entre as duas escolhas restante.
16. Um time Mineiro de futebol tem probabilidade 0,70 de vitórias sempre que joga. Se o time atuar
4 vezes determine a probabilidade de que vença:
17. Um corpo se encontra em repouso, no ponto (0,0). Lança-se um dado e por cada número primo
que aparece o corpo se movimenta uma unidade de distância à direita, em caso contrário uma
unidade à esquerda. Calcular a probabilidade que após 10 lançamentos o corpo se encontre:
18. Um atirador faz três disparos a um alvo. Em cada um dos disparos a probabilidade de acertar
é igual a 3/4. Acerta-se uma vez recebe R$50, 0, se acerta duas vezes recebe R$70, 0, se acerta
três vezes recebe R$100,0 e nenhum dos disparos acertou o alvo, tem que pagar R$700. Calcular
o lucro esperado.
19. Uma mulher de 47 anos pretendia ter lhos através de inseminação articial. Uma junta de
técnicos da área zeram testes para se saber qual o risco que ela poderia correr. Foi diagnosticado
que, por ser uma mulher muito saudável, o único risco era de nascer uma criança com alguma
doença genética. Assim, foi dado a probabilidade de 0,1 para ocorrer o nascimento de uma
criança doente. Supondo que ela tenha 6 lhos, qual a probabilidade de 2 nascerem doentes.(
Calcule usando a distribuição Poisson e a distribuição Binomial )
20. O número de partículas emitidas por uma fonte radiativa, durante o período especicado, é uma
variável aleatória de Poisson. Se a probabilidade de não houver emissões for igual a 1/3, qual é
a probabilidade de que 2 ou mais emissões ocorram?
21. Laminas de metal apresentam defeitos no cromado, segundo uma distribuição de Poisson, com
uma média de um defeito por m2 . Essas laminas são usadas para construção de janelas para
uma instalação industrial cuja dimensão são de, 150 cm × 200 cm.
(a) Em um grupo 10 dessas janelas qual é a probabilidade de que no máximo 4 delas não tenha
nenhum defeito?
(b) Em um grupo de 3 dessas janelas, qual é a probabilidade de total de falhas nesse grupo seja
no máximo três?
22. Em uma fabrica, a maquina 1 produz por dia o dobro de peças que a maquina 2 e, a maquina
3 o triplo da maquina 1. Sabe-se que 6% das peças fabricadas pela maquina 1 tendem a ser
defeituosas, e o 4% das peças produzidas pela maquina 2 tendem a ser defeituosas, enquanto
8% de peças defeituosas da maquina 3. A produção diária é misturada. Extraída uma amostra
aleatória (com reposição) de 20 peças, qual é a probabilidade de que essa amostra contenha:
23. Foi analisada uma cultura de bactérias para se obter o número médio de bactérias por mm2 .
Os dados obtidos, levaram a se prever a probabilidade de não se encontrar nenhuma bactéria
escolhendo-se, aleatoriamente, um 1mm2 na placa de cultura que é igual a 0.006734. Calcule,
assim, o valor médio de bactérias por mm2 , sabendo que a variável "no de bactérias /mm2 da
placa de cultura"constitui uma distribuição de Poisson.
24. Em uma comunidade isolada no himalaia, foram feitas medições de nível de colesterol no sangue
nos moradores locais. O valor da média encontrado foi de 178 mg/dl e um desvio padrão igual a
10 mg/dl. Supondo que o nível de colesterol dessa população tem distribuição normal obtenha:
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 127
(a) a probabilidade de um morador dessa comunidade apresentar taxa de colesterol igual a 180
mg/dl.
(b) a probabilidade de um morador se encontrar entre 168 e 188 mg/dl.
25. Um vendedor de automóveis sabe que o número de carros vendidos por dia em sua loja comporta-
se como uma variável de Poisson cuja média é 2 nos dias de bom tempo, e é 1 nos dias chuvosos.
Se em 70% dos dias faz bom tempo, qual é a probabilidade de que em certo dia do ano sejam
vendidos pelo menos três automóveis?
26. Considere um experimento que consiste em contar o número de partículas alfa emitidas, num
intervalo de tempo de um segundo. Sabe-se por experiências passada que, em média, 3 de
tais partículas são emitidas por segundo. Determinar a probabilidade de que não mais de duas
partículas alfa sejam emitidas em um quarto de segundos.
27. Um determinado fármaco, usado para combater infecção, foi usado em cobaias para se vericar
sua ecácia. Foi usado quantidades variáveis do fármaco que se assemelha de uma variável
aleatória com distribuição normal. Assim, foi obtida a probabilidade de 99.9% de que os animais
foram tratados com uma quantidade de fármaco igual ou menor a 171 mg. Calcule a média de
fármaco utilizado nas cobaias, sabendo que por estudos similares σ = 5 mg.
28. A dureza H de uma peça de aço pode ser pensada como sendo uma variável aleatória com
distribuição uniforme no intervalo (50,90) da escala de Rochkwel. Qual é a probabilidade que a
peça tenha dureza entre 55 e 60.
29. O petróleo é separado por destilação nas frações, listados na tabela seguinte
Fração Temperatura de destilação ( 0 C ) Preço de venda por galão (US $)
Gás Menos de 20 C1
Petróleo éter 20 |− 60 C2
Ligroin 60 |− 100 C3
Suponha que C dólares é o custo de produzir um galão de petróleo e a temperatura de destilação
T está distribuído uniformemente em [0, 100]. Achar o lucro esperado (por galão) pelas frações.
30. Suponha que um fabricante tenha que decidir entre dois processos de fabricação de certa com-
ponente eletrônica. O custo do processo A é de c dólares e do processo B é kc dólares por
unidade de componente, onde k > 1. Os tempos de falhas das componentes eletrônicas pode ser
consideradas como uma variável aleatória exponencial com média de falha de 200 horas para os
fabricados pelo processo A e 300 horas para B . Admita-se, além disso, que se a componente dure
menos de 400 horas, pagará uma multa de D dólares. Que processo deverá usar ?
31. O 5% das lâmpadas produzidas por certa maquina são defeituosos. O tempo de vida,T, de uma
lâmpada defeituosa é uma variável exponencial com média 0,5 ano, enquanto que o tempo de
vida T1 de uma lâmpada não defeituosa é uma variável aleatória exponencial com média 2 anos.
Calcular a probabilidade de uma lâmpada:
32. Certo tipo de fusível tem duração de vida que segue uma distribuição exponencial com tempo
médio de vida de 100 horas. Cada peça tem um custo de 10,0 unidades monetárias (u.m) e se
durar menos de 20 horas, existe um custo adicional de 8.0 u.m.
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 128
33. A fabrica de pneu "DURAMAS"produz um tipo de pneus que tem uma vida útil média de 80.000
km e um desvio padrão de 8.000 km. Supondo que essa vida útil tem distribuição normal :
34. Um combustível para foguetes vai a conter certo porcentagem (chamado de X) de um componente
especial. As especicações exigem que X esteja compreendido entre 30 a 35 por cento. O
fabricante terá um lucro liquido no combustível (por galão ) que é a seguinte função de X :
−0, 10 por galão se 30 < x < 35
T (X) = 0, 05 por galão se 33 ≤ x < 40 ou 25 ≤ x ≤ 30
0, 10 caso contrário
Se X ∼ N (33, 9). Calcular (a) a função de probabilidade de T (X), (b) E(T (X)).
35. Um teste de aptidão feito por pilotos de aeronaves em treinamento inicial requer que uma série
de operações seja realizada em uma rápida sucessão. Suponha que o tempo necessário para
completar o teste seja distribuído de acordo com uma Normal de média 90 minutos e desvio
padrão 20 minutos.
(a) Para passar no teste, o candidato deve completá-lo em menos de 80 minutos. Se 65 candi-
datos tomam o teste, quantos são esperados passar no teste?
(b) Se os 5% melhores candidatos serão alocados para aeronaves maiores, quão rápido deve ser
o candidato para que obtenha essa posição?
36. Estudos meteorológicos indicam que a precipitação pluviométrica mensal em períodos de seca
numa certa região pode ser considerada como seguindo a distribuição Normal de média 30 mm
e variância 16 mm2 .
(a) Qual a probabilidade de que a precipitação pluviométrica mensal no período da seca esteja
entre 24mm e 38mm?
(b) Qual seria o valor da precipitação pluviométrica de modo que exista apenas 10% de chance
de haver uma precipitação inferior a esse valor?
(c) Construa um intervalo central em torno da média que contenha 80% dos possíveis valores
de precipitação pluviométrica.
37. Numa certa população, o peso dos homens tem distribuição normal com média 75kg e desvio
padrão 10kg, enquanto que o das mulheres é também normal com média 60kg e desvio padrão
4kg.
(a) Sorteando-se um homem qualquer, qual é a probabilidade dele ter peso acima de 65kg?
(b) Sorteando-se uma mulher qualquer, qual é a probabilidade dela ter peso acima de 65kg?
(c) Qual é a probabilidade de uma pessoa ter peso acima de 65kg, sendo ela sorteada de um
grupo em que o número de mulheres é o dobro do de homens?.
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 129
38. O diâmetro X de rolamentos de esfera fabricados por uma certa fábrica tem distribuição normal
com média 0,614 cm e desvio padrão 0,0025. O lucro T de cada esfera depende de seu diâmetro,
e T = 0, 10 se a esfera é boa, isto é, se (0, 61 < X < 0, 618); T=0,05 se a esfera é recuperável,
isto é, se (0, 608 < X < 0, 61) ou (0, 618 < X < 0, 62); T=-0,10 se a esfera é defeituosa, isto é,
(X < 0, 6080 ou X > 0, 620). Calcular:
39. Supondo que numa população de pessoas normais a pressão de pulso é uma variável aleatória tem
distribuição normal com média 40 mmHg e desvio padrão 16 mmHg. Se uma pessoa é selecionada
dessa população obtenha:
40. Em uma espécie animal, a taxa normal de hemoglobina é uma variável aleatória com distribuição
normal com média µ = 150g/L de sangue e variância, σ = 144g/L de sangue. Se uma animal
dessa espécie é selecionada ao acaso, qual a probabilidade de que a taxa de hemoglobina normal,
estar entre 146 e 153 g/L.?
41. Um estudo feito em duas cidades (A e B) de Minas obteve o valor médio e o desvio padrão da
concentração de glicose no sangue de pessoas que não apresentavam distúrbios siológicos em
relação a concentração de glicose no sangue.
Cidade A µ1 = 104.8mg/100mL de sangue σ1 = 6.4mg/100mL de sangue.
Cidade B µ2 = 102.3mg/100mL de sangue σ2 = 4.9mg/100mL de sangue.
Admitindo que a concentração de glicose no sangue de pessoas das duas cidades tem distribuição
normal,
(a) calcule a probabilidade de uma pessoa da cidade A ter a concentração de glicose no sangue
seja pelo menos 100 mg/100mL de sangue.
(b) calcule a probabilidade de uma pessoa da cidade B ter a concentração de glicose no sangue
pelo menos 100 mg/100mL de sangue.
(c) Retirando-se uma pessoa de amostra contendo a proporção de 1:3 para moradores da cidade
A e B, Qual a probabilidade dessa pessoa ter a concentração de glicose seja pelo menos 100
mg/100mL de sangue
(a) se uma pessoa é sorteada ao acaso de cada uma das cidades, qual é probabilidade que a
concentração de glicose da pessoa da cidade A seja maior ao da pessoa da cidade de B.?
42. A concentração de uma substância X no sangue tem distribuição normal com média 10 mg e
desvio padrão 2 mg por unidade de volume. É considerado doente o indivíduo que tenha uma
dosagem menor que 6,0 mg ou maior que 13,5 mg.
(a) Se um indivíduo é escolhido ao acaso, qual é a probabilidade dele ser considerado doente ?
(b) Em 100 pessoas escolhidas ao acaso, qual é a probabilidade de observamos no máximo 2
doentes?.
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 130
43. A capacidade máxima de um elevador é de 500 kg. Se a distribuição dos pesos dos usuários
é suposta normal com média 70 kg e desvio padrão 10 kg. Qual é probabilidade de que 10
passageiros ultrapassem esse limite ?.
44. Um braço mecânico consta de três partes. Suponha que X, Y e Z são produzidos por diferentes
fabricas e cuja longitude de cada um estão dado por : X ∼ N (12, 0, 02), Y ∼ N (24, 0, 03) e
Z ∼ N (18, 0, 04), onde a média está dado em centímetros e variância em centímetros quadrados.
Calcular a probabilidade do braço esteja compreendido entre 53.8 y 54.2.
45. Uma corretora de negocia título na Bolsa de Valores e utiliza um modelo probabilístico para
avaliar o lucro seus lucros. Suas aplicações nanceiras de compra e venda atingem três áreas:
agricultura, industria e comércio. Admite que o seguinte modelo representa o comportamento
do lucro diário da corretora ( em milhares de dólares)L = 3LA + 5LI + 4LC , com LA , LI e LC
representando respectivamente os lucros diários nos setores de agricultura, industria e comércio.
As distribuições de probabilidade dessas variáveis aleatórias são LA ∼ N (3, 5), LI ∼ N (6, 9) e
LC ∼ N (4, 16). Supondo independência entre os três setores, qual será a probabilidade de um
lucro diário acima de 50 mil ?.
46. O tempo gasto no exame de uma universidade tem distribuição normal com média 100 minutos
e desvio padrão 10 minutos.
47. A dimensão de hastes metálicas fabricadas em série é uma variável aleatória normalmente dis-
tribuída com média 60 cm e variância 4 cm. Ao se coletar uma amostra aleatória de 10 valores
determine:
(a) A probabilidade de que a média amostral esteja situada entre 59,5 a 60,5 cm.
(b) A probabilidade de que variância amostra seja inferior a 3 cm.
(c) Refaça os cálculos indicados nos ítens (a) e (b) supondo uma amostra com n=20.
48. Se tomarmos uma amostra de 20 elementos de uma variável aleatória X tal que X ∼ N (µ, σ 2 )
e se nesta amostra obtivermos S = 5. Com que probabilidade podemos armar que a média da
amostra não se afaste de em mais de uma unidade.
49. Suponhamos que uma central atacadista tenha como média para o montante de vendas o valor
de 150 OTN's e como desvio padrão o valor 10 OTN's . Suponha ainda que 20% das vendas
efetuadas tenha valor superior a 170 OTN's. Nestas condições ao se coletar uma amostra de 100
clientes calcular:
CAPÍTULO 4. VARIÁVEIS ALEATÓRIAS 131
(a) A probabilidade de que a média encontrada na amostra se distância da média real em mais
de 2 unidades .
(b) A probabilidade de que a amostra apresente mais de 26 clientes que efetuem compras com
valor superior a 170 OTN's
50. Admitimos que em um lote de 800 motores apresente 200 com um determinado defeito. Ao
coletarmos uma amostra de 50 motores sem reposição, qual é a probabilidade de que a mesma
apresente menos de 10 motores com defeito.
51. Constatou-se que um lote de 20.000 faturas de uma grande cadeia de lojas apresenta média de
4,5 OTN's e como desvio padrão o valor 0,5 OTN's , sendo ainda que 30% das mesmas superior
a 0,5 OTN's. Tomada uma amostra (sem reposição) de 225 faturas, calcular:
(a) A probabilidade de que a média amostral se afastar em 0,01 OTN's da média real .
(b) Qual a probabilidade de que dentre as 225 faturas observadas mais de 60 apresentem um
valor superior a 5,0 OTN's
52. A maquina de empacotar um determinado produto o faz segundo uma distribuição normal, com
média µ e desvio padrão 10 gr.
(a) Em quanto deve ser regulado o peso médio para que apenas 10% dos pacotes tenham menos
do que 500.
(b) Com a maquina assim regulada qual é a probabilidade de que o peso total de 4 pacotes
escolhidos ao acaso seja inferior a 2 kg ?
53. No exercício anterior, após a maquina estar regulada programou-se uma carta de controle de
qualidade. De hora em hora, será retirada uma amostra de 4 pacotes, e estes serão pesados. Se
a média da amostra foi inferior a 4095 gr ou superior a 520 gr, para-se a produção para reajustar
a máquina isto é, reajustar o peso médio.
54. Uma empresa recebe certo componente em grandes lotes. Sabendo-se que o fornecedor envia
lotes com 10% de peças defeituosas, qual é a probabilidade de numa amostra com 100 ítens, a
proporção defeituosa ser
55. Cerca de 15% dos bares em Ouro preto vendem ado a seus clientes. Determine a probabilidade
de, numa amostra aleatória de 64 bares:
56. Sabendo-se que 70% da população ativa do Brasil ganha menos de 3 salários mínimos, qual é a
probabilidade de que uma amostra aleatória com 900 pessoas apresentar:
(a) mais de 67% das pessoas da amostra recebendo menos de 3 salários mínimos ?
(b) mais que 72% ou menos que 68% da amostra ganhando menos que 3 salários mínimos?
(c) Entre 540 a 720 pessoas com renda menor que 3 salários mínimos ?
57. Suponha que tem-se 2 processos (A e B) para produzir um artigo, e que o tempo médio de
produção para o processo A é 300 horas e desvio padrão 16 horas, enquanto que para o processo
B tem o tempo médio de 306 horas e uma desvio padrão de 12 horas. Se sorteiam-se uma amostra
aleatória de 64 artigos produzidos com processo A e 49 produzidos com o processo B, calcular a
probabilidade que:
58. Suponha que uma empresa de comercialização tem 2 lojas A , B e que porcentagens de clientes
que consideram que a atenção dada é boa na loja A de 70% entanto que na loja B é de 63%.
Para avaliar a opinião dos clientes enquanto ao atendimento seleciona-se amostras aleatórias de
tamanhos: 50 para a loja A e 60 para a loja B, calcular a probabilidade de que a proporção de
clientes satisfeitos pela atenção recebida pela loja A na amostra supere aos dados pela loja B em
menos de 0,05% se:
59. Suponha que os pesos de artigos produzidos por uma maquina tem distribuição normal com
média µ e variância 25 gr. Se escolhe ao acaso 16 artigos, calcular:
60. Suponha que 2 maquinas A e B produzem um mesmo artigo e que os pesos por artigo (em gramas)
tem distribuição normais com médias: µ1 = 550 e µ2 = 565 e variâncias: σ12 = 144 e σ22 = 256
respectivamente. Escolhe-se ao acaso 21 artigos produzidos pela maquina A e 31 produzidos pela
maquina B, calcular :
(a) a probabilidade de que o peso médio de produção da amostra da maquina A seja maior do
peso médio dos produzidos pela maquina B em mais de 2 gr.
S12
(b) P (1, 08563 ≤ S22
≤ 1, 4344)
Capítulo 5
Inferência Estatística
5.1 Introdução
A inferência estatística é o processo que consiste em utilizar os resultados de uma amostra para tirar
conclusões gerais de uma ou mais características de uma população. Ela compreende: estimação de
parâmetros e teste de hipóteses estatística.
θ̂ = h(X1 , . . . , Xn )
que forneça uma estimativa de θ. θ̂ é conhecido como um estimador, e um valor numérico particular
assumido pelo estimador é conhecido como uma estimativa. Note que θ̂ pode ser tratado como uma
variável aleatória, pois é uma função dos dados amostrais. O estimador θ̂ fornece uma regra, ou
fórmula, que diz como se pode estimar o θ verdadeiro. Assim, ao se admitir que
1
θ̂ = (X1 + X2 + · · · + Xn ) = X̄
n
133
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 134
temos que X̄, a média amostral, é um estimador do valor médio verdadeiro (ou populacional), µ. Se
em um caso especico, X̄ = 50, tem-se uma estimativa de µ. O estimador θ obtido anteriormente nos
fornece uma única estimativa (pontual) de θ.
IC(θ; 1 − α) = ( T1 ; T2 )
X̄ − µ
Z= √ ∼ N (0, 1).
σ/ n
¡ ¢
Figura 5.1: Distribuição normal padrão P −zα/2 < Z < zα/2 = 1 − α.
De (5.1)
X̄ − µ σ σ
−zα/2 < √ < zα/2 ⇒ X̄ − zα/2 √ < µ < X̄ + zα/2 √
σ/ n n n
Um erro muito comum que se comente ao interpretar o intervalo de conança é dizer que a probabilidade
de µ estar no intervalo é 1 − α . O erro resulta do fato de que µ não é uma variável aleatória e sim um
parâmetro que caracteriza uma população. Ou seja, µ não varia e portanto, não tem uma distribuição
de probabilidade. Deve car claro o que é aleatório (antes de que seja obtida a amostra e calculada os
valores) é o intervalo. Portanto, o correto seria dizer que a probabilidade do intervalo a ser escolhido
conter o verdadeiro valor da média é igual a 1 − α. Outra interpretação considerada é a seguinte:
obtendo várias amostras e, para cada uma delas, calculando o correspondente intervalo de conança
para µ, teremos que um 100(1 − α)% das amostras conterão o valor de µ e 100α% das amostras não
conterão a média populacional.
Exemplo 5.3.1 Um pesquisador deseja estimar, com 99% de conança a média da força máxima
de um certo músculo de um grupo de indivíduos. Ele considera que os valores da força muscular
estão distribuídos normalmente com variância de 144. Com esta nalidade selecionou-se uma amostra
aleatória de 15 indivíduos da mesma faixa etária e do mesmo peso e obteve-se que X̄ = 84, 3. Qual é
o intervalo?
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 136
Da tabela normal padrão temos que zα/2 = z0,005 = 2, 57. Substituindo em (5.2) temos que
µ ¶
12 12
IC(µ; 0, 99) = 84, 3 − 2, 57 √ ; 84, 3 + 2, 57 √
15 15
= (84, 3 − 7, 9628; 84, 3 + 7, 9628)
= (76, 3372; 92, 2672.)
A interpretação deste intervalo de conança é: dado o coeciente de conança de 99%, a longo prazo, em
99 de 100 casos, intervalos como (76, 3372; 92, 2672) conterão a média verdadeira da força máxima de um
certo músculo do grupo de indivíduos. Note, porém, que não se pode dizer que é 99% a probabilidade
do intervalo especico (76, 3372; 92, 2672) conter a média verdadeira (µ) da força máxima de um certo
músculo, pois, esse intervalo agora esta xado, não é mais aleatório. Logo µ ou se encontra nele ou
não se encontra: a probabilidade de o intervalo xado especico incluir o verdadeiro µ é portanto, de
1 ou 0.
(a) Se σ é desconhecido e n ≥ 30, pode-se utilizar o desvio padrão amostral S para aproximar σ.
(b) No caso que a população é nita de N elementos e σ é conhecido e amostragem é sem reposição,
o intervalo de (1 − α)100% de conança para µ é:
à r r !
σ N −n σ N −n
IC(µ; 1 − α) = X̄ − zα/2 √ ; X̄ + zα/2 √ . (5.3)
n N −1 n N −1
Se σ é desconhecido e n ≥ 30, por (a) o intervalo é
à r r !
S N −n S N −n
IC(µ; 1 − α) = X̄ − zα/2 √ ; X̄ + zα/2 √ . (5.4)
n N −1 n N −1
Exemplo 5.3.2 De um lote de 2200 lâmpadas foram sorteadas 81 lâmpadas ao acaso, o tempo médio
de duração das lâmpadas sorteadas foi 3200 horas com um desvio padrão de 900 horas. Construa um
intervalo de 95% de conança para o tempo médio das lâmpadas do lote.
Solução: Já que 1 − α = 0, 95, temos da tabela normal padrão zα/2 = z0,025 = 1, 96.
Como X̄ = 3200, S = 900 n = 81 e N = 2200 (tamanho da população nita), pela observação 5.3.1.b,
tem-se:
à r r !
S N −n s N −n
IC(µ; 1 − α) = X̄ − zα/2 √ ; X̄ + zα/2 √
n N −1 n N −1
à r r !
(1, 96)(900) 2200 − 81 (1, 96)(900) 2200 − 81
= 3200 − √ ; 3200 + √
81 2200 − 1 81 2200 − 1
= (3008; 3396).
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 137
A determinação do tamanho da amostra for muito importante, uma vez que, se a amostra for muito
pequena não será signicativa e, se a amostra for muito grande estão desperdiçando recursos. Utiliza-
se o intervalo de conança para calcular tamanho de uma amostra. Do intervalo de conança para a
média populacional µ ¶
σ σ
IC(µ; 1 − α) = X̄ − zα/2 √ ; X̄ + zα/2 √
n n
deseja-se que o comprimento do intervalo seja o mais curto possível, para isso tem-se duas opções:
Dessas duas opções, a primeira não é recomendável porque aumenta-se α,que é o risco de que µ não
esteja no intervalo.
Há uma conseqüência interessante que se desprende da relação entre o erro máximo de estimação (
diferença entre o estimador e o parâmetro) e o risco (α denido anteriormente) que é a determinação
do tamanho da amostra. O comprimento ou amplitude do intervalo é:
σ
L = 2zα/2 √ .
n
Dessa equação é possível obter n se o erro máximo de estimação E , o risco α e a variância populacional
são conhecidos. Ou seja,
2 σ2
zα/2
n=
E2
q
N −n
Se a amostragem é sem reposição, é introduzido o fator de correção de população nita: N −1 , de
onde: r
σ N −n
E = zα/2 √ ,
n N −1
que ao resolver em n, tem-se
2 σ2
N zα/2
n= 2 σ2 .
E 2 (N − 1) + zα/2
n
Se o tamanho da população nita N é muito maior em comparação com n (isto é, N < 0, 10) o fator
de correção de população nita pode ser ignorado.
Exemplo 5.3.3 Uma rma construtora deseja estimar a resistência média das barras de aço utiliza-
das na construção de casas. Qual o tamanho amostral necessário para garantir que haja um risco de
0,001 de ultrapassar um erro de 5 kg ou mais na estimação ? O desvio padrão da resistência para este
tipo de barra é estimado em 25 kg.
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 138
Solução: E = 5kg, σ = 25kg. Como o risco de ultrapassar esse erro é de 0,001, então, γ = 1 − α =
1 − 0, 001 = 0, 999. Logo, z0,0005 = 3, 29. Daí, tem-se
2 σ2
z0,0005 (3, 29)2 (252 )
n= = = 270, 6025 ≈ 271.
E2 53
X̄ − µ
T = √ ,
S/ n
tem distribuição t-Student com n − 1 graus de liberdade. Seguindo o procedimento anterior, para o
nível de conança xado,100(1 − α)% tal que 0 < α < 1 , pode-se encontrar um valor de t α2 ,n−1 , tal
que µ ¶
X̄ − µ
P −t α2 ,n−1 < √ < t α ,n−1 = 1 − α, (5.5)
S/ n 2
onde t α2 ,n−1 , é obtido da tabela de distribuição t-Student com n − 1 graus de liberdade. Logo, o
intervalo de conança para µ, com coeciente de conança 100(1 − α)% é dado por:
µ ¶
S S
IC(µ; 1 − α) = X̄ − t α2 ,n−1 √ ; X̄ + t α2 ,n−1 √ . (5.6)
n n
Exemplo 5.3.4 Suponha que o gerente de produção de uma companhia que fornece petróleo para
calefação de uso doméstico, deseja estimar o consumo médio anual(em galões) em casas onde moram
somente uma família, numa área geográca particular. Seleciona-se uma amostra de 36 casas em que
moram somente uma família e o consumo médio para essa amostra resultou x̄ = 1.122, 7 galões e um
desvio padrão de s = 295, 72 galões. Se o gerente de produção deseja ter 95% de conança de que
o intervalo obtido inclua o consumo médio anual de petróleo para calefação em casas de famílias que
moram nessa área geográca.
Solução: Suponha que X : consumo de petróleo para calefação por família é tal que X ∼ N (µ, σ 2 ).
Para , 1 − α = 0, 95, α = 0, 05. Da tabela t-Student com 35 graus de liberdade tem-se que t α2 ,n−1 =
t0,025,3−1 = 2, 03. Substituindo em (5.6)
µ ¶
295, 7 295, 72
IC(µ; 0, 99) = 1.122, 7 − 2, 03 √ ; 1.122, 7 + 2, 03 √
36 36
= (1.122, 7 − 100, 5; 1.122, 7 + 100, 5) = (1, 223, 2; 1022, 2.)
Conclui-se com 95% de conança, que a quantidade média de petróleo consumida ao ano está entre
1.022,2 e 1.222,75 galões. O intervalo de conança de 95% estabelece que existe uma seguridade de
95% de que a amostra selecionada é uma na qual a média populacional µ está localizada dentro do
intervalo.
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 139
Exemplo 5.3.5 Um provedor de acesso à internet está monitorando a duração do tempo das conexões
de seus clientes com o objetivo de dimensionar seu equipamento. Suponha que são desconhecidos a
média e a distribuição de probabilidade desse tempo, mas a variância, por analogia com outra serviços
é considerada como sendo igual a 50 (minutos)2 . Uma amostra de 500 conexões resultou num valor
observado médio de 25 minutos. O que dizer da verdadeira média com conança de 95%.
O Teorema Central do Limite garante que para amostras sucientemente grandes X̄ ∼ N (µ; σ 2 /n).
Então o intervalo de conança aproximado de 95% para o tempo médio de conexões, será dado por
µ ¶ Ã r r !
σ σ 50 50
IC(µ; 0, 95) = X̄ − zα/2 √ ; X̄ + zα/2 √ = 25 − 1, 96 ; 25 + 1, 96
n n 500 500
= (25 − 0, 62; 25 + 0, 62) = (24, 38; 25, 62). (5.7)
Uma outra abordagem é baseada no fato de que a expressão p(1 − p) assume o valor máximo igual 1/4
quando 0 ≤ p ≤ 1 . Como mostra a gura 5.3 abaixo.
Exemplo 5.4.1 Um estudo foi feito para determinar a proporção de famílias em uma comunidade
que tem telefone (p). Uma amostra de 200 famílias é selecionada, ao acaso, e 160 armam ter telefone.
Que dizer de p com 95% de conança?
Exemplo 5.4.2 O serviço social de um município deseja determinar a proporção de famílias com
uma renda familiar inferior a R$ 200,00. Estudos anteriores indicam que esta proporção é de 20%.
(a) Que tamanho de amostra se requer para assegurar uma conança de 95% que o erro máximo de
estimação desta proporção não ultrapasse o 0,05?
(b) Em quanto variara o tamanho da amostra se o erro máximo permissível é reduzido a 0,01.?
(n − 1)S 2
W = ∼ χ2(n−1)
σ2
Ou seja, a variável aleatória W tem distribuição Qui-quadrado com n-1 graus de liberdade.
Para um nível de conança (1 − α) × 100% , é possível determinar χ21− α ,n−1 e χ2α ,n−1 , valores
2 2
da distribuição Qui-quadrado com n − 1 graus de liberdade, como é mostrado na gura.
³ ´ µ ¶
(n − 1)S 2
P χ21− α ,n−1 < W < χ2α ,n−1 = P χ21− α ,n−1 < < χ2
α
,n−1 = 1 − α
2 2 2 σ2 2
tem distribuição normal padrão. Considerando este resultado e seguindo o mesmo procedimento para
o caso da média populacional, apresentada na seção 5.3, pode-se deduzir o intervalo de conança para
µ1 − µ2 , para um nível de conança (1 − α) × 100% xado. Ou seja,
¡ ¢
P −zα/2 < Z < zα/2 = 1 − α.
Exemplo 5.6.1 Em um estudo em crianças com retardo mental, a 11 meninas e a 10 meninos, após
um ano de educação especial acompanhado de terapia, foi aplicado um teste de conhecimentos. A média
para meninas foi de 67,0 e para as meninos foi de 61,5 (em uma escala de 0 a 100). Supondo que as
qualicações obtidas pelas meninas e meninos em estudo seguem uma distribuição normal com desvio
padrão σ1 = 11 e σ2 = 10. Achar um intervalo de 90% de conança para µ1 − µ2 .
Solução: Para o nível de conança 1 − α = 0, 90 temos que α = 0, 10. Obtemos da distribuição normal
padrão o valor zα/2 = 1, 64, X̄ = 67, 0, n = 11, Ȳ = 61, 5 e m = 10. Substituindo em (5.12) o intervalo
para µ1 − µ2 é dado por
à r r !
121 100 121 100
IC(µ1 − µ2 ; 0, 90)) = 67, 0 − 61, 5 − 1, 64 + ; 67 − 61, 5 + 1, 64 +
11 10 11 10
= (−2, 038; 13, 038).
X̄ − Ȳ − (µ1 − µ2 )
T = q ,
Sp2 ( n1 + n1 )
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 144
(n−1)S 2 +(m−1)S 2
segue uma distribuição de t-student com n + m − 2 graus de liberdade, onde Sp2 = 1
n+m−2
2
é conhecida com a variância ponderada. Neste caso o intervalo de conança para µ1 − µ2 , com0 um
nível de conança (1 − α) é dado por:
à r r !
2
1 1 2
1 1
IC(µ1 − µ2 ; 1 − α) = X̄ − Ȳ − tα/2,n+m−2 Sp ( + ); X̄ − Ȳ + tα/2,n+m−2 Sp ( + )
n m n m
(5.13)
Exemplo 5.6.2 O gerente de um banco está interessado em analisar a diferenças entre os saldos
médios das contas à ordem de duas agências. De cada uma delas foi recolhida uma amostra aleatória
de saldos ( milhões de unidades monetárias), tendo-se registrado os seguintes resultados:
Agência n Média Variância
A 10 17,8 30,3
B 13 14,2 28,7
Supondo que saldos das agências tenha distribuição normal com variâncias iguais, mas desconhecidas.
Determine um intervalo de 95% de conança para µ1 − µ2 .
Solução:Do enunciado do exemplo tem-se: n = 10, X̄ = 17, 8, S12 = 30, 7, m = 13, Ȳ = 14, 2,
(n −1)S 2 +(n −1)S 2
S22 = 28, 7 portanto a variância ponderada é, Sp2 = 1 n+m−2 1 2 2
= (10−1)30,7+(13−1)28,7
10+13−2 = 29, 39.
Como 1 − α = 0, 95, t0,025,21 = 2, 08. Logo, substituindo (5.13) temos um intervalo de 95% de conança
para µ1 − µ2 é dado por:
à r
1 1
IC(µ1 − µ2 ; 0, 95) = 17, 8 − 14, 2 − 2, 08 29, 39( + )
10 13
r !
1 1
; 17, 8 − 14, 2 + 2, 08 29, 39( + )
10 13
= (−1, 14; 8, 34)
X̄ − Ȳ − (µ1 − µ1 )
T0 = q ∼ t(ν)
S12 S22
n + m
2
2
S1 S2
n
+ m2
onde ν = 2
S1
!2
2
S2
!2 − 2. Ou seja que T 0 tem distribuição t-Student com ν graus de liberdade.
n m
n+1
+ m+1
Exemplo 5.6.3 Um artigo publicado no Food Technology Journal (1956) descreve um estudo sobre
conteúdo de protopectina em tomates durante o armazenamento. Para o qual foram considerados dois
períodos de armazenamento e analisou-se as amostras de nove lotes de tomates em cada período. Os
dados sumariados apresentam-se a continuação:
Tempo de armazenamento Média Desvio Padrão
7 Dias 792 495,0
21 Dias 372,3 73,3
Considerando que o conteúdo de propectina para os tempo de armazenamento tenha distribuição nor-
mal e que as variâncias verdadeiras são diferentes construa um intervalo de conança do 95%, para
diferença de médias entre o tempo de armazenamento de 7 dias e 21 dias.
2
2
S1 S2
+ m2 2
n (4952 /9+732 /9)
Da tabela t-Student com ν = !
2 2
S1
!
2 2
S2
−2 = (4952 /9)2 (732 /9)2
−2 ≈ 8, 0395 = 8 graus de liberdade
9+1
+ 9+1
n m
n+1
+ m+1
e nível de conança 1−α = 0, 95 obtém-se que t00,025,8 = 2, 306. Logo, substituindo em (5.14) o intervalo
é calculado, ou seja:
à r r !
4952 733 4952 733
IC(µ1 − µ2 , 0, 95) = 729 − 3172 − 2, 306 + ; 729 − 3172 + 2, 306 +
9 9 9 9
= (48, 06; 791, 34).
2
µ 2
¶
σ2 S2 S22
IC( 2 ; 1 − α) = f1 2 ; f2 2 . (5.15)
σ1 S1 S1
onde f1 e f2 são valores da distribuição F-Snedecor com n − 1 e m − 1 graus de liberdade mostradas
1
na gura 5.4, sendo f1 = f e f2 = fα/2,n−1,m−1 .
α/2,m−1,n−1
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 146
Exemplo 5.7.1 Dois catalisadores podem ser usados em um processo químico em bateladas. Oito
bateladas foram preparadas usando o catalaisador 1, resultado em rendimento médio de 86 e uma
variância de 46,5. Dezessete batelados foram preparados com o catalisador 2, resultando um rendimento
médio de 90 e uma variância de 23,4. Considerando que as medidas dos rendimentos sejam distribuidas
aproximadamente normal. Determinar um intervalo do 90% de conança para razão de variâncias dos
rendimentos do catalisador 1 e o catalisador 2.
Solução: Do enunciado temos que n = 8, S12 = 46, 5, m = 17, S22 = 23, 4 e da tabela F-Snedecor
1
obtemos que f1 = f0,05,7,16 = 1/2, 61 = 0, 376 e f2 = f0,05,16,7 = 3, 49. Substituindo essas quantidade
σ12
em (5.15) temos que um intervalo de 90% de conança para a razão de variâncias, σ22
:
µ ¶
σ2 46, 5 46, 5
IC( 12 ; 0, 90) = 0, 376 × ; 3, 49 × = (0, 7478; 6, 935).
σ2 23, 4 23, 4
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 147
Exemplo 5.8.1 Considere que uma industria compra de um certo fabricante, pinos cuja resistência
média à ruptura é especicada em 60 kgf (valor nominal da especicação). Em um determinado dia,
a indústria recebeu um grande lote de pinos e a equipe técnica da industria deseja vericar se o lote
atende as especições.
É claro que equipe técnica não espera que todos os pinos tenham examente uma resistência de 60 kgf.
Alguma variabilidade em torno deste valor é esperada. A partir de experiência anterior a indústria
sabe que a resistência à ruptura dos pinos desse fabricante segue uma distribuição normal com desvio
padrão σ = 5kgf e esta variabilidade é adequada para a industria. O interesse da industria consiste,
então, em determinar se a resistência média dos pinos que constituem o lote entregue pelo fabricante
pode ser ou não considerado igual a 60 kgf.
Do dito anteriormente considere que a resistência dos pinos do lote é uma variável aleatória X , tal que
, X ∼ N (µ, 25). Observe que equipe técnica da industria deseja testar:
H0 : µ = 60 (5.16)
A seguir é apresentada a denição formal de hipótese estatística.
Denição 5.8.1 Uma hipótese estatística é uma armação sobre os parametros de uma ou mais ca-
racteristícas da população
Em todo problema de teste de hipóteses, duas hipóteses complementares são consideradas. A hipótese
que foi destacada na equação (5.16) denominada de hipótese nula, sendo representanda por H0 ,
(pois ela expressa que não há mudança). A outra hipótese, que será aceita caso H0 seja rejeitada, é
denominada hipótese alternativa e é denotada por H1 . Tem-se
Rejeitar H0 ⇒ Acietar H1
Aceitar H0 ⇒ Rejeitar H1
No exemplo, a hipótese alternativa H1 é
H1 : µ 6= 60 (5.17)
Essa hipótese é chamada de hipótese composta porque especica mais de um valor para o parâmetro.
No caso que especique somente um único valor, a hipótese é chamada de hipótese simples, por exemplo
a hipótese dada em (5.16).
Para realizar-se um teste de uma hipótese estatística retira-se uma amostra da população em
estudo e com base na observação dos resultados dessa amostra toma-se a decisão de aceitar H0 ou de
rejeitar H0 .
Suponha que a equipe técnica da indústria tenha decidido retirar uma amostra aleatória de tamanho
n = 16, do lote recebido, medir a resistência de cada pino e calcular a resistência média X̄ (estimador
25
de µ). Além disso, X̄ ∼ N (µ, 16 ). Para quais valores de X̄ a equipe técnica deve rejeitar H0 e portanto
não aceitar o lote?
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 148
Denição 5.8.2 A variável aleatória cujo valor é utilizado para determinação da decisão a ser tomada
em um teste de hipóteses é denominada estatística de teste
Se o lote está fora de especicação , isto é , H1 : µ 6= 60, espera-se que X̄ seja inferior ou superior a 60
kgf.
Suponha que equipe técnica tenha decidido adotar a seguinte regra: rejeitar H0 se X̄ for maior que 62.5
kgf e ou menor que 57.5 kgf. O conjunto Rc = {X̄ < 57, 5 ou X̄ > 62.5} é o conjunto de valores para
os quais rejeita-se H0 : µ = 0, 5, sendo denominado região de rejeição ou região crítica do teste.
Os valores de X̄ que não pertencem ao intervalo [57,5 ; 62,5], constituem a região de aceitação
(Ra = Rcc ). Os valores que estão na fronteiras entre a região crítica e a região de aceitação, são
denominados valores críticos. Portanto, a regra consiste em, rejeitar H0 a favor de H1 se o valor
assumido pela estatística de teste pertencer a região crítica. Isto é, se ocorrer o evento (X̄ ∈ Rc ),
rejeita-se H0 . Caso contrário, se o valor assumido por X̄ pertencer a região de aceitação Rcc , isto é, se
o evento (X̄ ∈ Rcc ), ocorrer não rejeitar H0 .
O procedimento de tomada de decisão em um teste de hipóteses pode resultar em dois tipos de con-
clusões incorretas. Por exemplo, é possível que a resistência média dos pinos que constituem o lote
seja, de fato, igual a 60 kgf. Mas, pode acontecer que para os pinos selecionados para a composição
da amostra aleatória, o valor observado para a estatística de X̄ pertence a região crítica. Neste caso a
hipótese nula H0 seria rejeitada em favor da hipótese alternativa H1 , quando H0 é de fato verdadeiro.
Essa forma de conclusão incorreta é denominada de erro tipo I.
Por outro lado, poderia ocorrer situações na qual a hipótese H0 é falsa, ou seja, na realidade a resistência
média do lote de pinos é diferente de 60 kgf e a média amostral observada x̄ pertença a região de
aceitação, levando a aceitação de H0 sendo ela falsa. Esta forma de conclusão incorreta é denominada
de erro tipo II. Em resumo, em um teste de hipótese, podem ocorrer dois tipos de erros:
Portanto, ao testar qualquer hipótese estatística, existem quatro situações diferentes que determinam
se a decisão nal é correta ou incorreta. Essas situações aparecem na tabela 5.1.
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 149
Dado que a decisão tomada em um teste de hipóteses é baseada em variáveis aleatórias (estatística de
teste), é possível calcular as probabilidades dos erros tipos I e II da tabela 5.1.
A probabilidade de erro tipo I é denominada de nível de signicância do teste será denotada por α.
Isto é,
α = P (Erro tipo I) = P (rejeitar H0 | H0 é verdadeiro)
No exemplo 5.8.1, o erro tipo I irá ocorrer se X̄ < 57, 5 ou X̄ > 62, 5 quando a resistência média no
lote de pinos for µ = 60 kgf. Para este exemplo, observe que, se H0 é verdadeira, isto é, H0 : µ = 60
então,X̄ tem distribuição normal com média µ = 60 e σX̄ = √σn = 1, 25. Portanto, a probabilidade do
erro tipo I é calculada como:
α = P (X̄ < 57, 5 ou X̄ > 62, 5|H0 : µ = 60) = P (X̄ < 57, 5) + P (X̄ > 62, 5|H0 : µ = 60)
X̄ − µ 57, 5 − 60 X̄ − µ 62, 5 − 60
= P( < ) + P( < )
σX̄ 1, 25 σX̄ 1, 25
= P (Z < −2) + P (Z > 2) = 0, 02275 + 0, 02275 = 0, 0455.
Este resultado, que está ilustrado na gura 5.6, signica que há 4,55% de chance que uma amostra
aleatória extraida do lote de peças de pinos leve à rejeição da hipóteses nula H0 : µ = 60, quando a
verdadeira resistência média dos pinos é, de fato, igual a 60 kgf.
Figura 5.6: Região crítica e nível de signicância para o teste de H0 : µ = 60 contra H1 : α 6= 60 com
n = 16
Ao analisar a gura 5.6, pode-se observar que é possível diminuir α ao aumentar a amplitude da região
de aceitação. Por exemplo, se no caso dos pinos, a região de aceitação fosse constituída pelo intervalo
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 150
X̄ − µ 57, 5 − 60 X̄ − µ 62, 5 − 60
α = P( < ) + P( < )
σX̄ 1, 0 σX̄ 1, 0
= P (Z < −2, 5) + P (Z > 2, 5) = 0, 00621 + 0, 00621 = 0, 01242.
Para o exemplo 5.8.1, o erro tipo II irá ocorrer se 57, 5 ≤ X̄ ≤ 62, 5 quando a resistência média do
lote é diferente de 60 kgf. Portanto, para que seja possível calcular o valor de β , deve-se considerar um
valor particular para µ sob a hipótese alternativa. Como exemplo, suponha que é muito importante
para a indústria rejeitar a hipótese nula H0 : µ = 60, quando a resistência dos pinos do lote µ for, igual
a 56,5 kgf ou igual a 63,5 kgf. Nessa situação, para vericar se o teste é de fato adequado, a industria
poderia calcular o valor de β para µ = 56, 5 e µ = 63, 5 e então avaliar se esse valor é sucientemente
baixo.
25
O cálculo de β para µ = 63, 5. Nesse caso, X̄ ∼ N (63, 5, 16 ). Portanto, a probabilidade de erro tipo II
é calculada como:
Esse resultado, que está ilustrado na gura 5.7, signica que para o teste de H0 : µ = 60 contra
H1 : µ 6= 60, com base na amostra de tamanho n = 16, quando o valor verdadeiro da resistência média
dos pinos é µ = 63, 5, a probabilidade de que a hipóteses nula (que neste caso é falsa) não seja rejeitada
é igual a 21,186%. Devido à simetria da distribuição normal, quando a verdadeira média é µ = 56, 5,
a probabilidade de erro tipo II é igual 21,186%.
A probabilidade de cometer erro tipo II aumenta rapidamente à medida que o valor verdadeiro de µ
se aproxima do valor estabelecido sob a hipótese H0 . Para ilustrar essa armação, calcula-se o valor
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 151
de β para o exemplo 5.8.1, no caso que o valor verdadeiro da resistência média dos pinos é µ = 61 e
que o teste de H0 : µ = 60 contra H1 : µ 6= 60 é conduzido baseando-se em uma amostra de tamanho
n = 16, ou seja,
β = P (57, 5 ≤ X̄ ≤ 62, 5|H1 : µ = 61)
= P (X̄ < 56) + P (X̄ > 64) = P (Z ≤ 1, 20) − P (Z ≤ −2, 80)
= 0, 88493 − 0, 00256 = 0, 88237.
Esse resultado, que esta ilustrado na gura 5.8, signica que, para o teste de H0 : µ = 60 contra
H1 : µ 6= 60, com base em amostras de tamanho n = 16, quando o valor verdadeiro da resistência
média é igual a 61kgf, há 88,237% de chance que hipótese nula (que é falsa) não seja rejeitada.
Figura 5.8: Probabilidade do erro tipo II(β ) para o teste de: H0 : µ = 60 contra H1 : µ 6= 60 com
n = 16 e µ = 61
Portanto, a probabilidade de erro tipo II é muito maior para o caso em que a média verdadeira é
µ = 61 do que para a situação em que µ = 63, 5 kgf. No entanto, esse tipo de resultado não causa
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 152
muita preocupação. Isso porque apenas diferenças de maior magnitude entre o valor verdadeiro de µ e
o valor estabelecido sob H0 são consideradas signicativas sob o ponto de vista prático, devendo então
ser detectadas com elevada probabilidade.
A probabilidade do erro tipo II também depende do tamanho da amostra (n). Para ilustrar este fato,
refaz-se o cálculo de β, para exemplo 5.8.1, considerando que a hipótese nula é H0 : µ = 60 e a
verdadeira média é µ = 63, 5 e que o tamanho da amostra aumenta de n = 16 para n = 25.
57, 5 − 63, 5
z1 = = −6 e
1
62, 5 − 63, 5
z2 = = −1.
1
Logo,
β = P (−6 ≤ Z ≤ −1)
= P (Z ≤ −1) − P (Z ≤ −6) = 0, 15866 − 0, 0000 = 0, 15866.
Esse resultado é ilustrado na gura 5.9. Observa-se que o aumento do tamanho da amostra resulta em
uma diminuição da probabilidade do erro tipo II.
Figura 5.9: Probabilidade do erro tipo II(β ) para o teste de: H0 : µ = 60 contra H1 : µ 6= 60 com
n = 25 e µ = 63, 5
A tabela 5.2 sumariza os resultados apresentados anteriormente conjuntamente com outros resultados
obtidos de forma similar:
A tabela 5.2 mostra as seguintes características dos testes de hipóteses:
(i) Os erros tipo I e II estão relacionados. Se o tamanho de amostra permanece constante, uma dimi-
nuição da probabilidade de ocorrência de um dos erros implica em um aumento da probabilidade
da ocorrência do outro erro.
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 153
(ii) A probabilidade de ocorrência do erro tipo I pode ser reduzida por meio de uma escolha apro-
priada da região crítica.
(iv) O valor de β aumenta à medida que valor verdadeiro de µ se aproxima do valor estabelecido sob
a hipótese H0 .
(iv) Em geral, um aumento no tamanho da amostra reduz tanto α quanto β , desde que os valores
críticos sejam mantidos constantes.
O ideal seria minimizar tantos o erros do tipo I quanto os do tipo II. Mas, infelizmente, para qualquer
tamanho de amostra dado, não é possível minimizar ambos erros simultaneamente. A abordagem
clássica deste problema considera que o erro tipo I é provavelmente ser o mais sério que o erro tipo II.
Para tenta-se manter a probabilidade de cometer erro tipo I em um nível razoavelmente baixo, como
0,01, 0,05 ou 0,10 e então minimizar quanto possível a probabilidade do erro tipo II.
H0 : µ = 60,
H1 : µ 6= 60
onde µ é a resistência média dos pinos do lote. Suponha que o valor verdadeiro da média é µ = 63, 5.
Para o tamanho da amostra n = 16, com região de aceitação 57, 5 ≤ X̄ ≤ 62, 5 foi vista que β = 0, 21186
(veja tabela 5.2). Logo, o poder do teste correspondente é:
O poder do teste é uma medida capacidade do teste para detectar uma possível diferença existente entre
o valor estabelecido para o parâmetro sob a hipótese H0 e o valor assumido pelo parâmetro. Observe
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 154
que o primeiro teste tem poder igual a 0,78814, para detectar a diferença entre resistência igual 60
kgf e a outra de 63,6 kgf estabelecida pela hipótese alternativa. Isso signica que, se a verdadeira
resistência média dos pinos é 63,5 kgf, esse teste rejeitará de maneira correta H0 : µ = 60 e detectará
essa diferença em 78,814% das vezes que for utilizado. O poder do segundo teste é um pouco maior
(0,84135), como já era de se esperar, porque o tamanho da amostra é maior que aquele utilizado no
primeiro. O poder de um teste pode ser aumentado por meio do aumento de n ou do aumento do nível
de signicância α.
H0 : µ = µ0
H1 : µ 6= µ0
onde µ0 é uma constante conhecida, o teste é chamada de teste bilateral, pois é importante detectar
diferenças a partir do valor hipotético da média µ0 que se encontre em qualquer lado de µ0 . Em um
teste desse tipo a região crítica é dividida em duas partes, com a mesma probabilidade em cada cauda
da distribuição da estatística de teste. O teste considerado no exemplo 5.8.1 é um teste bilateral . Em
muitos problemas tem-se interesse em testar hipóteses do tipo:
H0 : µ = µ 0
H1 : µ < µ 0 .
Neste caso tem-se um teste unilateral esquerdo, porque a região de rejeição não é dividida em
duas partes, cando localizada apenas na cauda esquerda da distribuição da estatística de teste. Para
exemplicar, considere o seguinte problema.
Exemplo 5.8.2 Uma região do país é conhecida por ter uma população obesa. A distribuição de
probabilidade do peso dos homens dessa região entre 20 e 30 anos é normal com média de 90 kg
e desvio padrão de 10 kg. Um endocrinologista propõe um tratamento para combater a obesidade que
consiste de exercícios físicos, dietas e ingestão de um medicamento. Ele arma que com seu tratamento
o peso médio da população da faixa em estudo diminuirá num período de três meses.
H0 : µ = 90 kg
H1 : µ < 90 kg
H0 : µ = µ0
H1 : µ > µ0
No teste unilateral direito a região crítica ca localizada na cauda direita da estatística de teste. Para
uma situação onde seria apropriado realizar um teste unilateral direito, considere o seguinte exemplo
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 155
Exemplo 5.8.3 Um fabricante de uma certa peça arma que o tempo médio de vida das peças pro-
duzidas é de 1000 horas. Suponha que os engenheiros de produção têm interesse em vericar se a
modicação do processo de fabricação aumenta a duração das peças.
H0 : µ = 1000 horas
H1 : µ > 1000 horas
sendo µ é o tempo médio de vida das peças produzidas pelo novo processo.
H0 : θ = θ0 ,
H1 : θ < θ0 ou θ > θ0 ou θ 6= θ0 (qualquer alternativa)
Nas seguintes seções serão apresentados procedimentos básicos de teste de hipóteses para uma média
populacional, diferenças de duas médias populacionais, variância populacional, igualdade de variâncias
populacionaias, uma proporção populacional e a diferença de duas proporções populacionais.
H0 : µ = µ0
H1 : µ < µ0
X̄ − µ0
Z= √ ∼ N (0, 1).
σ/ n
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 156
Da tabela normal padrão obtém-se zα para um nível de signicância α xado (veja a gura 5.10)
Figura 5.10: Região crítica para teste de hipóteses unilateral de uma média.
k−µ z√
ασ z√
ασ
Tem-se, √0
σ/ n
= zα . Daí k = µ0 + n
. Logo, Rc = {X̄ ≤ µ0 + n
}.
z√
ασ
(iv) Conclusão: se x̄ ∈ Rc = {X̄ ≤ µ0 + n
}, rejeita-se H0 , em caso contrário não se rejeita H0 .
Método alternativo
Um método alternativo prático é trabalhar diretamente na escala Z (veja a gura 5.10) de seguinte
forma:
(i)
H0 : µ = µ0
H1 : µ < µ0
Exemplo 5.9.1 Um comprador de tijolos acha que a qualidade dos tijolos está diminuindo. De
experiências anteriores, considera-se a resistência média ao desmoronamento de tais tijolos é igual a
200 kg, com um desvio padrão de 10 kg. Uma amostra de 100 tijolos, escolhidos ao acaso, forneceu
uma média de 195 kg. Ao nível de signicância de 5%, pode-se armar que a resistência média ao
desmoronamento diminuiu?
Solução Seja µ é a resistência média ao desmoronamento dos tijolos. Nesse caso, tem-se interesse em
testar as seguintes hipóteses:
(i)
H0 : µ = 200 kg
H1 : µ < 200 kg.
(ii) A estatística do teste é X̄. Sendo n = 100, sob H0 , X̄ tem distribuição N (200; 100
100 ) = N (200; 1).
(iii) A região crítica: Rc = {X̄ ≤ k} onde k é tal que P (X̄ ≤ k|H0 ) = α ou seja,
X̄ − µ0 k − 200
P( √ ≤ ) = P (Z ≤ k − 200) = 0, 05.
σ/ n 10/10
Assim, zα = k − 200 = −1, 64. Logo, k = 198, 36. O que resulta então, a Rc = {X̄ ≤ 198, 36}.
(iv) Do enunciado do problema a média amostral é x̄ = 195 ∈ Rc = {X̄ ≤ 198, 36}. Nesse caso,
rejeita-se H0 ao nível de signicância de 5%.
Método alternativo: uma solução alternativa ao problema obtém-se como segue: No passo (iii)
a região crítica na escala Z é da forma Rc = {z ∈ Z ∼ N (0, 1); Z ≤ zα }. Para α = 0, 05 tem-se
zα = −1, 64. Então, Rc = {z ∈ Z ∼ N (0, 1); Z ≤ −1, 64}.
No passo (iv) ao ínves de calcular x̄, obtém-se o valor da estatística do teste com os dados,
X̄ − µ0 195 − 200
Zobs = √ = = −5.
σ/ n 1
Como Zobs = −5 < zα = −1, 64, rejeita-se H0 ao nível de signicância de 5%.
Procedimento geral
A seguir é apresentado o procedimento geral de teste de hipóteses para uma média populacional
considerando o procedimento alternativo descrito acima.
H0 : µ = µ0 (ou µ ≥ µ0 ) H0 : µ = µ0 (ou µ ≤ µ0 ) H0 : µ = µ0
(i)
H1 : µ < µ0 H1 : µ > µ 0 H1 : µ 6= µ0
(ii) A estatística do teste é:
X̄ − µ0
Z= √ , (5.18)
σ/ n
onde n representa o tamanho da amostra através da qual é calculada o valor da média amostral
X̄. Quando H0 é verdadeira, a estatística de teste segue uma distribuição normal padrão ou reduzida.
Esse resultado é válido também, quando o tamanho da amostra é sucientemente grande para qualquer
população.
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 158
X̄ − µ0
T = √ , (5.19)
S/ n
sendo S o desvio padrão amostral calculado com as n observações da amostra aleatória.
Se H0 é verdadeira, a estatística (5.19) segue uma distribuição t-Student com n − 1 graus de liberdade.
(iii) As regiões críticas, para um nível de signicância α xado, são os valores da distribuição da
estatística do teste (Z ou t(n − 1)) se a hipóteses nula é verdadeira.
Figura 5.11: Regiões críticas para testes de hipóteses de uma média populacional :(a) unilateral es-
querdo, (b) unilateral direito e (c) bilateral
Para o teste de hipóteses unilateral esquerdo, a região crítica ou região de rejeição é representada
pela parte hachurada da gura 5.11.a. Ela concentra valores na cauda esquerda da distribuição da
(z) (t)
estatística do teste, isto é, o conjunto, tal que: Rc = {c ∈ Z ∼ N (0, 1); Z ≤ −c} ou Rc : {c ∈ T ∼
t(n − 1); T ≤ −c}. Para o teste unilateral direita (ou de cauda direita), a região crítica é representada
(z)
pela parte hachurada da gura 5.11.b, e representa o conjunto de valores tal que Rc = {c ∈ Z ∼
(t)
N (0, 1); Z ≥ c} ou Rc : {c ∈ T ∼ t(n−1); T ≥ c}. Para o teste bilateral, a região crítica é representada
(z)
pela parte hachurada da gura 5.11.c, e representa o conjunto de valores tal que Rc = {c ∈ Z ∼
(t)
N (0, 1); |Z| ≤ c} ou Rc : {c ∈ T ∼ t(n − 1); |T | ≤ c}.
(iv) Rejeita-se H0 , ao nível de signicância, α se a estatística do teste observada (calculada com os
(z) (t)
dados da amostra) pertenece à região crítica, ou seja, se Zobs ∈ Rc ou Tobs ∈ Rc .
Exemplo 5.9.2 (Teste para um média populacional) No exemplo 5.8.2, suponha que 25 ho-
mens na faxia etária entre 20 e 30 anos escolhidos ao acaso dessa população, foram tratados com
o novo tratamento durante um período de três meses. Sendo o peso medio dos 25 homens igual a 84
kg, pode-se armar que o novo medicamento no combate da obesidade é ecaz. Use α = 0, 05.
Solução: Seja X : Peso de homens da faixa etária entre 20 e 30 anos numa região do pais. Pelo
enunciado tem-se, X ∼ N (90, 100). Deseja-se vericar as seguintes hipóteses:
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 159
onde n é tamanho da amostra e S 2 é variância amostral calculada a partir das n observações amostrais.
A estatística de teste, apresentada (5.20), tem distribuição qui-quadrado com n − 1 graus de liberdade
se a hipótese nula for verdadeira.
Figura 5.13: Região crítica para teste de hipóteses de uma variância populacional: (a) unilateral
esquerdo, (b) unilateral direito e (c) bilateral
(iii) A região crítica para o teste de hipóteses unilateral é a parte hachurada da gura 5.13.a, que
concentra valores na cauda esquerda da distribuição da estatística do teste, isto é, o conjunto tal que
:Rc = {χ2n−1 ≤ χ21−α,n−1 }. Para o teste unilateral de cauda direita , a região crítica é representada
pela parte hachurada da gura 5.13.b, e representa o conjunto de valores da distribuição qui-quadrado
com n − 1 graus de liberdade, tal que Rc = {χ2n−1 ≥ χ2α,n−1 }. Para o teste bilateral a região crítica é
representada pela parte hachurada da gura 5.13.c, e representa o conjunto de valores da distribuição
qui-quadrado, estatística de teste, tal que Rc = {χ2n−1 ≤ χ21−α/2,n−1 ou χ2n−1 ≥ χ2α/2,n−1 }.
(iv) Rejeita-se H0 , ao nível de signicância α, se a estatística de teste observada (calculada com os
dados da amostra) pertence à região crítica, ou seja, se Wobs ∈ Rc .
Exemplo 5.10.1 (Teste hipóteses para uma variância populacional) No exemplo 5.8.2, supo-
nha que tem-se interesse em vericar se houve mudança no desvio padrão dos pesos na população. Com
essa nalidade, 15 homens na faixa etária entre 20 e 30 anos foram escolhidos ao acaso dessa popula-
ção. O desvio padrão dos 15 homens resultou em 8,5 kg. Use α = 0, 05.
Solução: Como no exemplo 5.9.2, seja X : Peso de homens da faixa etária entre 30 e 30 anos numa
região do pais. Portanto, X ∼ N (90, 100), deseja-se vericar as seguintes hipóteses:
H0 : σ = 10 =⇒ H0 : σ 2 = 100,
H1 : σ 6= 10 =⇒ H1 : σ 2 6= 100
Figura 5.14: Região crítica para teste de hipóteses: H0 : σ 2 = 100 contra H1 : σ 2 6= 100
Como no caso da construção de intervalos de conança para a diferença de duas médias populacionais,
considere que X1 , . . . , Xn é uma amostral aleatória de tamanho n de uma população com característica
X, que tem distribuição normal com média µ1 e variância σ12 . Considere que Y1 , . . . , Ym é uma amostra
aleatória de tamanho m, de uma população com característica Y que tem distribuição normal com
média µ2 e variância σ22 . Se X e Y são independentes foram apresentadas distribuições amostrais para
a diferença das médias amostrais, quando as variâncias populacionais conhecidas e quando não são
conhecidos mais iguais. Suponha que tem-se interesse em vericar se existe ou não uma diferença
signicativa entre as médias populacionais µ1 e µ2 . O procedimento básico de teste, neste caso é a
seguinte:
(i) As hipóteses estatística são:
H0 : µ1 − µ2 = ∆ H0 : µ1 − µ1 = ∆ H0 : µ1 − µ2 = ∆
H1 : µ1 − µ2 < ∆ H1 : µ1 − µ2 > ∆ H1 : µ1 − µ2 6= ∆
onde ∆ é uma constante conhecida. Observa-se se ∆ = 0 tem-se o teste de hipóteses para a igualdade
de duas médias populacionais.
(iii) A estatística do teste é:
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 162
X̄ − Ȳ − ∆ ∼
Z= q 2 sob H0 N (0, 1) (5.21)
σ1 σ22
n + m
X̄ − Ȳ − ∆ ∼
T =q sob H0 t(n + m − 2), (5.22)
Sp2 ( n1 + m
1
)
(n−1)S 2 +(m−1)S 2
onde Sp2 = 1
n+m−2
2
, sendo S12 e S22 são as variâncias amostrais calculadas com as n e m das
amostras da população X e população Y, respectivamente.
X̄ − Ȳ − ∆ ∼
T0 = q 2 sob H0 t(ν), (5.23)
S1 S22
( n + m)
2
2
S1 S2
n
+ m2
onde ν = 2
S1
!2 2
S2
!2 − 2.
n m
n+1
+ m+1
Os passos (iii) e (iv) do procedimento de teste de hipóteses, são similares ao procedimento de teste de
hipóteses para uma média populacional.
Exemplo 5.11.1 (Teste de hipóteses para diferença de duas médias populacionais) Estuda-
se o conteúdo de nicotina de duas marcas de cigarros (A e B ), obtendo-se os seguintes resultados.
A 17; 20; 23; 20
B 18; 20; 21; 22; 24
Admitindo que o conteúdo de nicotinas das duas marcas tem distribuição normal e que as variâncias
populacionais são iguais, com α = 0, 05, pode-se armar que existe alguma diferença signicativa no
conteúdo médio de nicotina nas duas marcas?
H0 : µ1 = µ2 ⇐⇒ H0 : µ1 − µ2 = 0
H1 : µ1 6= µ2 ⇐⇒ H1 : µ1 − µ2 6= 0
(ii) A estatística do teste é dada em (5.22), pois as variâncias são iguais mais desconhecidas, ou seja
X̄ − Ȳ ∼
T =q sob H0 t(n + m − 2),
Sp2 ( n1 + 1
m)
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 163
X̄ − Ȳ 20 − 21
Tobs = q =q ¡ ¢ = −0, 641
Sp2 ( n1 + 1
m)
38 1
7 4 + 1
5
Como, Tobs 6∈ Rc , não se rejeita H0 . Portanto, não existe diferença signicativa no conteúdo médio de
nicotina nas duas marcas de cigarro ao nível de signicância de α = 0, 05.
Figura 5.16: Região crítica para teste de hipóteses: H0 : σ12 = σ22 contra H1 : σ12 6= σ22
Exemplo 5.12.1 Um artigo publicado na Food Tecnology Journal (1956), descreve um estudo
sobre o conteúdo de protopectina em tomates durante o armazenamento. Considerou-se dois períodos
de armazenamento e analisou-se as amostras de nove lotes de tomates em cada período, obtendo-se os
dados abaixo:
Tempo de armazenamento Média Desvio Padrão
7 Dias 792 495,0
21 Dias 372,3 73,3
Admitindo que os conteúdos de protopectina para os 2 tempos de armazenamento tenha distribuição
normal.
(a) Pode-se armar que as variâncias verdadeira de conteúdo de protopectina nos dois tempos de
armazenamento são similares (ou homogêneas)? Use α = 0, 10
(b) Com probabilidade de cometer erro tipo I de 0,05, pode-se armar que o conteúdo médio de
protopectina em tomates com tempo de 7 dias de armazenamento supera o conteúdo médio de
protopectina em tomates armazenadas durante 21 dias em mais de 150 unidades ?
(c) Construa e interprete um intervalo de 90% de conança para a razão de variâncias verdadeiras
do conteúdo de protopectina armazenadas por um período de tempo de 7 dias e 21 dias.
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 165
(i)
H0 : σ12 = σ22 , versus H1 : σ12 6= σ22
X̄ − Ȳ − 150
T0 = q 2 ,
S1 S22
( n + m)
2
2
S1 S2
n
+ m2
tem distribuição t-Student com ν = 2
S1
!2
2
S2
!2 − 2, graus de liberdade.
n m
n+1
+ m+1
Para α = 0, 05 e
¡ 2 ¢2
495 /9 + (732 /9)
ν= (4952 /9)2 (732 /9)2
− 2 ≈ 8, 0395 = 8,
9+1 + 9+1
Observa-se que esse intervalo de 90% de conança não contém o valor de um, portanto pode-se armar
com 90% de conança que as variâncias do conteúdo de protopectina de tomates armazenadas em
períodos de 7 dias e 21 dias não são homogêneas e essa mesma conclusão foi obtida através do proce-
dimento de teste de hipóteses. Em geral pode-se utilizar intervalos de conança para testar hipóteses
bilaterais.
H0 : p = p 0 H0 : p ≥ p 0 H0 : p ≤ p 0
H1 : p 6= p0 H1 : p < p0 H1 : p > p0 ,
A estatística de teste é :
p̂ − p0 ∼
Z=q sob H0 N (0, 1), (5.25)
p0 (1−p0 )
n
ou seja, a estatística do teste (5.25) tem distribuição normal padrão. Na expressão acima, p̂ a proporção
amostral calculada com as n observações amostrais (n ≥ 30).
Exemplo 5.13.1 Um estudo é realizado para determinar a relação entre uma certa droga e certa
anomalia em embriões de frango. Injetou-se 50 ovos fertilizados com a droga no 400 dia de incubação.
No vigésimo dia de incubação, os embriões foram examinados e 7 apresentaram a anomalia. Suponha
que deseja-se averiguar se a proporção verdadeira é inferior a 25% com um nível de signicância de
0,05.
Solução: Seja Y : número de embriões que apresentam anomalia nos 50 ovos fertilizados com a droga.
Então, Y ∼ B(50, p), onde p é proporção populacional (ou verdadeira) de embriões que apresentam
anomalia. Deseja-se vericar as seguintes hipóteses:
Como Zobs < −1, 64, rejeita-se H0 . Conclui-se ao nível de signicância de 5% que a proporção de
embriões que apresentam anomalia ao serem fertilizados com a droga é signicativamente inferior a
25%.
X Y X+Y
que tem distribuição normal padrão se H0 for verdadeira. Onde pˆ1 = n, pˆ2 = n e p̄ = n+m .
Exemplo 5.14.1 Um experimento foi conduzido com a nalidade de estudar a efetividade da vacina
Salk contra a pólio. Para isso, considerou-se um grupo de 100 camundongos com as mesmas caracterís-
ticas (idade, peso, etc), os quais foram distribuídos ao acaso em dois grupos iguais. Ao primeiro grupo
aplicou-se uma vacina similar sem o composto mais importante da vacina salk (placebo), e observou-se
que 40 dos 50 camundongos foram imunizados. No outro grupo aplicou-se a vacina salk e observou-se
que 45 dos 50 foram imunizados. Pode-se armar que a vacina Salk é efetiva contra a pólio. Use
α = 0, 05.
Como pˆ1 = 45 40
50 = 0, 90 e pˆ2 = 50 = 0, 80 e p̄ =
45+40
100 = 0, 95 a estatística apresentada em (5.26),
avaliada com os dados amostrais é,
pˆ1 − pˆ2 0, 90 − 0, 80
Zobs = q =q = 2, 294.
p̄(1 − p̄)( n1 + 1
m)
1
0, 95 × 0, 05( 50 + 1
50 )
Como Zobs ∈ Rc rejeita-se H0 . Conclui-se, ao nível de signicância de 5% que a vacina Salk é efetiva
contra pólio.
(ii) os dados amostrais podem contradizer a hipótese nula em maior ou menor grau.
O nível descritivo denotado por α∗ ( ou P-value ) constitui uma medida do grau com que os dados
amostrais contradizem a hipótese nula. A sua denição é a seguinte: o nível descritivo corresponde à
probabilidade da estatística de teste tomar um valor igual ou mais extremo do que aquela que, de fato,
é observado. Alternativamente, pode-se denir o nível descritivo como o menor nível de signicância
para o qual a estatística de teste determina a rejeição da hipótese nula H0 . Note-se que, tal como a
estatística de teste, o nível descritivo é calculado admitindo que H0 seja verdadeira.
Exemplo 5.15.1 No exemplo 5.13.1, a estatística de teste observada é, ZObs = −1, 7963 (recorde-se
que o nível de signicância do teste era α = 0, 05 e o correspondente valor crítico z0,05 = −1, 64).
Portanto, o nível descritivo é de 3,62% que indica a probabilidade de encontrarmos valores da estimativa
mais desfavoráveis à hipótese nula. Note que o valor do nível descritivo se relaciona diretamente com
o nível signicância.
Nesse exemplo, se o nível de signicância fosse xado em qualquer valor igual ou superior a 3,62%, a
conclusão seria pela rejeição de H0 ao passo que valores inferiores a 3,62% conduziriam à aceitação da
hipótese nula. O signicado do nível descritivo é ilustrado na gura 5.19,
Figura 5.19: Valor do nível descritivo para testar: H0 : p = 0, 25 contra H1 : p < 0, 25.
Como é evidente, quanto menor for o valor do nível descritivo maior será o grau com que a hipótese
nula é contradita. Dada a relevância da informação contida no nível descritivo, é recomendável a sua
inclusão explícita nos resultados de qualquer teste de hipóteses. Por exemplo, muito mais esclarecedor
do que dizer que uma hipóteses nula foi rejeitada, ao nível de signicância de 5%, é armar que isso
sucedeu e que o nível descritivo foi de 0,3%.
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 170
Para os testes de hipóteses na qual a distribuição normal é a estatística do teste, o nível descritivo
nesta caso é dado por:
2(1 − Φ(|zobs| )); para teste bilateral
∗
α = 1 − Φ(zobs ); para teste unilateral de cauda superior
Φ(zobs ); para teste unilateral de cauda inferior
onde zobs é o valor da estatística do teste e Φ( ) é a função da distribuição acumulada normal padrão
denida no capítulo anterior.
5.16 Exercícios
1. Com a nalidade de estudar os efeitos do feijão no consumo humano examinou-se o incremento de
peso de 20 indivíduos ao nal de 3 dias. O pesquisador por experiências anteriores conhece que
variância do incremento de peso de qualquer grupo de pessoas é 16 gramas. Os dados apresenta-se
a continuação:
8,0 20,4 15,1 11,2 16,0 12,5 19,2 17,4 14,2 19,3
19,2 16,6 10,1 8,1 18,0 9,5 13,1 21,2 15,0 16,2
(a) Construa um intervalo do 98% de conança para o incremento de peso médio verdadeiro.
(b) Suponha que deseja-se saber quantos indivíduos tem que ser examinados, para que o erro
da média amostral não exceda 1,5 gr, com 99% de conança.
2. Uma pesquisa é feita com a nalidade de estimar a proporção de estudantes da UFOP, usuários
de algum tipo de droga (p) com um margem de erro de três pontos percentuais, a porcentagem
de estudantes usuários de algum tipo de droga. Supondo que se pretende um nível de conança
de 99% nos resultados, quantos estudantes devem ser pesquisados ?.
(a) Suponha que tenhamos uma estimativa com base em estudo anterior, que mostrou que 67%
dos estudantes tinham consumido algum tipo de droga.
(b) Suponha que não tenhamos qualquer informação que possa sugerir o valor de p.
(c) Sabendo-se que a amostra obtida no item (a), forneceu uma estimativa de que 70% dos
estudantes tinham consumido algum tipo de droga, obtenha e interprete um intervalo de
95% de conança para a verdadeira proporção de estudantes que consumem algum tipo de
droga.
3. Um artigo publicado no Journal Of Heat Transfer (1974) descreve um novo método para medir
a condutividade térmica do ferro Armco. Ao utilizar uma temperatura de 100o F e uma potência
de entrada de 550 W, resultaram as seguintes medições de condutividade (em Btu/hr-ft-o F):
41,60; 41,48; 42,34; 41,95; 41,86; 42,18; 42,26; 41,48; 42,04; 41,72. Supondo que a condutividade
térmica a 100o F e 550 W se distribui normalmente com desvio padrão, σ = 0, 30Btu/hr−f t−o F .
Obtenha um intervalo do 95% de conança da condutividade média deste material.
4. De um lote de 2200 lâmpadas foram sorteadas 81 lâmpadas ao acaso, o tempo médio de duração
das lâmpadas sorteadas foi de 3200 horas e um desvio padrão de 900 horas. Construa um intervalo
de 95% de conança para o tempo médio das lâmpadas do lote (suponha que tempo de duração
das lâmpadas é normal).
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 171
5. A resistência média à tensão de uma bra sintética é uma característica importante de qualidade
de interesse do fabricante, o qual deseja encontrar um intervalo de 95% de conança para estimar
a média. O fabricante supõe, com base na resistência à tensão está distribuída aproximadamente
normal. Embora, se desconheça a resistência média à tensão e seu desvio padrão. Selecionou-se
uma amostra aleatória de 16 troços de bra e determinou-se sua resistência (em psi, lb/plg2). A
média e desvio padrão amostrais resultaram respectivamente; 49,86 psi e 1,66 psi. Que dizer ao
respeito à resistência média da bra sintética?.
6. Uma rma construtora deseja estimar a resistência média das barras de aço utilizadas na cons-
trução de casas. Qual tamanho amostral se requer para garantir que haja um risco de 0,001 de
ultrapassar um erro de 5 kg ou mais na estimação? O desvio padrão da resistência para este tipo
de barra é considerado 25 kg.
7. Uma psicóloga elabora um novo teste de percepção espacial e deseja estimar o escore médio
alcançado por pilotos do sexo masculino. Quantas pessoas ela deve testar para o que o erro da
média amostral não exceda 2,0 pontos, com 95% de conança ?. Estudo anterior mostro sugere
que σ = 21, 2.
8. As alturas de estudantes mulheres do primeiro ano de uma universidade têm distribuição normal
com média de 1,65 m, e desvio padrão de 0,5 m. Quantas estudantes devem ser pesquisadas,
se queremos estimar a porcentagem das que têm mas 1,60 m. de altura ?. Admita um nível de
conança de 99% , em que o erro não supere 2,5 pontos percentuais.
10. Uma agência governamental está encarregada de scalizar a contaminação de um certo produto
alimentício, através da análise de uma amostra dos pacotes desse produto. Uma porcentagem de
contaminação de 7% é considerado tolerável. Se a porcentagem de contaminação for maior que
este valor o produtor deverá ser atuado. Uma norma da agência estabelece que, se no exame de
20 pacotes desse produto forem detectados pelo menos 4 pacotes contaminados, então a fabrica
deve ser multado. Seja p a proporção de contaminação do produto.
11. O encarregado do controle de trafego aéreo da Companhia de aviação ASA arma que 95% dos
vôos dessa Companhia chegam ao lugar de destino no máximo com 30 minutos de atraso. Uma
instituição de defesa do consumidor recebeu queixas dos clientes da ASA que armam que a
porcentagem de vôos que chegam no máximo com 30 minutos de atraso é muito menor. Eles
examinam uma amostra selecionada ao acaso de 200 registros de vôos da ASA e vericaram que
182 vôos chegaram no máximo com 30 minutos de atraso.
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 172
(a) Formule as hipóteses nula e alternativa . Faça o teste usando o nível descritivo (P-value)
(b) Construa um intervalo do 98% de conança para a verdadeira proporção .
12. As companhias de seguros estão cando preocupados com o fato de que o número crescente
de telefones celulares resulte em maior colisões de carros; estão por isso, pensando em cobrar
prêmios mais elevados para os motorista que utilizam celulares. Desejamos estimar, com um
margem de erro de três pontos percentuais, a porcentagem de motoristas que falam ao celular
enquanto estão dirigindo. Supondo que se pretende um nível de conança de 95% nos resultados,
quantos motoristas devem ser pesquisados ?.
(a) Suponha que tenhamos uma estimativa com base em estudo anterior, que mostrou que 18%
dos motoristas falavam ao celular.
(b) Suponha que não tenhamos qualquer informação que possa sugerir o valor de .
13. O rótulo de remédio contra resfriado Dozenol indica a presença de 600 mg de acetaminofem em
cada onça uida. A Food and Drug Administration (FDA) selecionou aleatoriamente 65 amostra
de uma onça e constatou que o conteúdo médio de acetaminofen é de 585 mg, com um desvio
padrão de 21 mg. Ao nível de signicância de 1%, testa a armação da Medassist Pharmaceutical
Company de que a média populacional é igual a 600 mg.
14. Determinou-se o custo de operação por cliente para cada uma de 12 organizações. Os 12 valores
têm média de $2133 e desvio padrão de $345 .Ao nível de 0,01 de signifcância, teste a armação
de uma acionista, que se queixa de que a média para todas as organizações desse tipo excede $
1800 por cliente.
15. Em um estudo de 71 fumantes que estavam procurando deixar de fumar utilizando uma terapia
especial, 32 não estavam fumando uma após o tratamento. Ao nível de 0,10 de siginicância, teste
a armação de que, dos fumantes que procuram deixar de fumar com aquela terapia, a maioria
está fumando um após o tratamento. Esses resultados sugerem que a terapia não é ecaz?
16. A Medassit Pharmaceutical Company utiliza uma maquina para encher frascos com um remédio,
de tal maneira que o desvio padrão dos pesos é de 0,15 oz. Testou-se uma nova maquina em 71
frascos e, para essa amostra, o desvio padrão é 0,12 oz. A Dayton Machine Company, fabricante
da nova maquina, arma que ela enche os frascos com menor variação.
(a) Teste a armação da Dayton Machine Company, ao nível de 0,05 de signicância de. Se a
máquina na Dayton está sendo usanda como experiência, deve-se cogitar de sua aquisição ?
(b) Determine um intervalo de 95% de conança para o desvio padrão dos pesos nos frascos.
17. Pesquisadores de Johns Hopkins zeram um estudo de empregadas da IBM que estavam gravidas.
De 30 empregadas que lidavam com éter-glicol, 10 tiveram aborto (espontâneo) mas, de 750 que
não estavam expostas ao éter-glicol, apenas 120 abortaram.
(a) No nível de 0,01 de signicância, teste a armação de que as mulheres expostas ao éter-glicol
apresentam maior taxa de aborto.
(b) Qual é o nível descritivo para o teste de hipóteses em (a) ?.
18. A empresa "Duramas"garante que, se os pneus forem utilizados com condições normais, têm uma
vida média superior a 40000 km. Uma amostra constituída por 30 pneus utilizados nas condições
acima referidas proporcionou os seguintes resultados: X̄ = 43200 km e S = 8000 km. Teste, ao
nível de signicância de 5% se os pneus têm a vida média que o fabricante reivindica.
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 173
19. Um certo analgésico adotado em determinado hospital é ecaz em 70% dos casos. Um grupo de
médicos chineses em vista a esse hospital arma que a utilização da acupuntura produz melhores
resultados. A direção do hospital resolve testar o método alternativo em 80 pacientes sorteados
ao acaso, com a nalidade de adotá-lo em denitivo se ele apresentar eciência satisfatória numa
proporção de casos maior que do anestésico atual. Seja p a probabilidade de que a o método de
acupuntura apresente a eciência satisfatória quando aplicada a um paciente.
(a) Formule este problema como um problema de testes de hipóteses especicando as hipóteses
nula e alternativa.
(b) Quais os erros de tipo I e II (em palavras) ?
(c) Supondo que o critério para rejeitar a hipóteses nula seja: número de pacientes, com re-
sultado satisfatório, no mínimo 64, qual é a probabilidade do erro tipo I ? Interprete o
resultado.
(d) Se dentre os 80 pacientes submetidos à nova técnica em 69 deles apresentaram eciência
satisfatória, qual é a decisão a ser tomada ?. (Use α = 0, 01)
20. Uma companhia de cigarros anuncia que o índice médio de nicotina dos cigarros que fabrica
apresenta-se abaixo de 23 mg por cigarro. Um laboratório realiza 6 análises desse índice, obtendo:
27; 24; 21; 25; 26; 22. Sabe-se que o índice de nicotina se distribui normalmente, com variância
igual a 4,86 mg 2 .
21. Um fabricante de um certo tipo de aço especial arma que seu produto tem um severo serviço
de controle de qualidade, traduzido pelo desvio padrão da resistência à tensão que não é maior
do que 5 kg por cm2 . Um comprador, querendo vericar a veracidade da armação, tomou uma
amostra de 11 cabos e submeteu-a a um teste de tensão. Os resultados foram as seguintes:
x̄ = 263 e S 2 = 48. Esses resultados trazem alguma evidência contra a armação do fabricante?
Use α = 0, 05.
22. Karl Pearson, que elaborou muitos conceitos importantes em estatística, coletou dados sobre
crimes que 1909. Dos condenados por incêndio criminoso, 50 bebiam 43 eram abstêmios. Dos
condenados por crime de fraude, 63 bebiam e 144 eram abstêmios. Com o nível de 0,01 de
signicância, teste a armação de que a proporção dos que bebem entre os incidiarios é maior
do que proporção dos bebedores condenados por fraude. A bebida parece ter algum efeito sobre
o tipo de crime?. Por que?
(a) Construa um intervalo de 99% de conança para diferença de médias de absorção do medi-
camento A e B.
(b) No nível de 1% de signicância, pode-se armar que absorção dos medicamentos são os
mesmos ?
(c) Teste o item (a) usando o nível descritivo ?
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 174
24. Dividem-se 50 pacientes de epilepsia em duas amostra aleatórias iguais, Ao grupo A se lhe deu
tratamento que incluía doses diárias de vitamina D. Ao grupo B se lhes deu o mesmo tratamento
com exceção que não recebeu vitamina D ao invés recebeu placebo em seu lugar. Os dados
sumariados do número de ataques experimentados são apresentados na tabela embaixo:
Tratamento Média Variância
Vitamina D 15 8
Placebo 24 18
(a) Pode-se armar que as variâncias do número ataques dos 2 tratamentos são similares ou
homogêneos. Use a=0,10.
(b) Há suciente evidência que indique que a vitamina D reduz o número de ataques epilépticos
?. Use a=0,05.
(c) Construa um intervalo do 95% para diferença de médias de ataques do tratamento com
vitamina D e com placebo.
25. Um artigo publicado no Journal of Sport Science (1987) apresenta os resultados de uma pesquisa
sobre o nível de hemoglobina dos jogadores do jockey sobre gelo na olimpíada de Canada. Os
resultados que aparecem no artigo são as seguintes (em g/dl):
15,3 16,0 14,5 16,2 14,9 15,7 15,3 14,6 14,5 16,2
15,7 16,0 15,0 15,7 16,2 14,7 14,8 14,6 15,6 15,2
Outro pesquisador mediu o nível de hemoglobina de 20 pessoas normais não esportistas escolhidos
ao acaso. Os dados (em g/dl) são os seguintes:
12,5 13,0 10,3 11,6 10,6 11,2 13,4 10,2
11,8 14,0 11,2 11,9 12,2 10,9 11,1 9,8
Supondo que os dados têm distribuições normal.
(a) Pode-se armar que a variâncias do nível de hemoglobina em pessoas esportistas e não
esportistas são as mesma. Use a=0,10.
(b) Determine um intervalo de 95% de conança para a razão de variâncias do nível de hemo-
globina entre os que são esportistas os que não são .
(c) Com probabilidade de cometer erro tipo I de 0,05, você poderia armar que existe alguma
diferença no nível de hemoglobina entre pessoas esportistas e não esportistas. ?
(d) Considerando o item (a), construa um intervalo de 95% de conança para diferença de
médias do nível de hemoglobina entre pessoas esportistas e não esportistas.
26. Uma pesquisa é feita com a nalidade de vericar se ltros de cigarros realmente diferença, ou
apenas são truques de venda sem qualquer efeito real. A continuação apresentam-se os dados
sumariados dos conteúdos alcatrão e nicotina em uma amostra aleatória de cigarros tamanho
padrão, com ltro e sem ltro. Todas as medidas em miligramas.
Com ltro Sem ltro
Alcatrão Nicotina Alcatrão Nicotina
Tamanho da amostra 21 21 8 8
Média 13,3 0,94 24,0 1,65
Desvio padrão 3,7 0,31 1,7 0,16
Supondo que os dados tem distribuição normal.
(a) Construa e interprete um intervalo de 98% de conança para desvio padrão da quantidade
de nicotina em cigarros com ltro.
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 175
27. Em estudo recente de 22.000 médicos, metade tomou doses regulares de aspirina, e à outra
metade foi administrado um placebo. O estudo se estendeu por seis anos, a um custo total de $
4,4 milhões. Entre os que tomaram aspirina, 104 tiveram ataque cardíacos, e dos que receberam
um placebo 189 tiveram ataques.
(a) Esses resultados mostram uma redução estatisticamente signicativa dos ataques cardíacos
no grupo que tomaram aspirina ?. (Use o nível descritivo).
(b) Construa e interprete um intervalo do 98% de conança para a proporção de médicos que
tomaram aspirina e não tiveram ataques cardíacos.
28. Uma peça de um certo equipamento elétrico é fornecido, sob encomenda, por duas empresas
externas (A e B ). A dimensão desta peça é uma característica de qualidade importante no
momento da montagem do produto. Para examinar se há diferença nas dimensões das peças da
empresa A e empresa B, forem extraídas amostras aleatórias das respectivas fabricas, obtendo-se
os dados abaixo (em mm):
Empresa A Empresa B
12,5 12,6 12,4 12,8 12,7 12,6 13, 0 13,1 13,0 13,2 13,1 12,7
12,6 12,5 12,6 12,4 12,3 12,7 13,0 12,1 12 ,9 12,9
Supondo que os dados tem distribuição aproximada normal.
(a) Para um nível de signicância de 5%, pode-se armar que variâncias são homogêneas ?
(b) Considerando o item (a), Existe diferencias signicativas entre a média da dimensão forne-
cida pêlos dois fornecedores ?. Use α = 0.05.
(c) Obtenha o nível descritivo do teste em (b).? Qual é sua conclusão ?
(d) Obtenha e interprete um intervalo de 95% de conança para a diferença de media da di-
mensão do fornecedores A e B.
29. Numa determinada empresa industrial, uma peça é fabricada automaticamente, em grandes
quantidades, por duas maquinas A e B, que se distinguem apenas pelo fato da maquina B ser
mais velha (e mais usada) do que a maquina A. Com a nalidade de avaliar se as duas maquinas
estão produzindo peças da mesma qualidade, avaliou-se o tempo (em segundos) de operação de
cada maquina em produzir uma peça e, também foi vericado se peça satisfaz os requerimentos de
Engenharia (se a peça é defeituosas ou não). Da linha de produção da maquina A obteve-se uma
amostra aleatória de 31 peças e, da maquina B uma amostra aleatória de 41 peças obtendo-se
os seguintes resultados .
Maquina Tempo médio Variância No de peças defeituosos
A 45,020 31,393 6
B 48,041 6,758 6
CAPÍTULO 5. INFERÊNCIA ESTATÍSTICA 176
(a) Pode-se dizer, ao nível de 5% de signicância, que o tempo médio de operação da maquina
B supera o tempo médio de operação da maquina A em mais de 2 segundos ?
(b) Quais são os pressupostos necessários para a resolução de item (a) ?
(c) Para um nível de 5% de signicância, pode-se armar que maquina A produz a mesma
proporção de peças defeituosas que a maquina B ?.
(d) Qual é o nível descritivo em (c), ? Qual é sua conclusão ?
30. Um experimento é conduzido para comparar dois regimes alimentares no que diz ao aumento de
peso. Vinte indivíduos são distribuídos ao acaso entre dois grupos em que ao primeiro deles foi
dada a deita A ao segundo a B . Decorrido certo intervalo de tempo verica-se que os aumentos
de peso correspondentes foram os seguintes:
A -1,0 0,0 2,1 3,1 3,3 4,3 5,2 5,5 5,0 6,8
B 2,5 3,0 4,0 5,7 6,0 7,0 7,2 7,3 6,9 8,1
Supondo que incrementos de peso tem distribuição normal.
(a) Construa e interprete um intervalo do 95% de conança para o desvio padrão do incremento
do peso de indivíduos alimentados com a dieta B .
(b) Ao um nível de 10% de signicância pode-se armar que as variâncias verdadeiras dos
incrementos de pesos de pessoas alimentadas com a dieta A e B são similares ?
(c) Com probabilidade de cometer erro tipo I de 0,05, você poderia armar que dieta B é melhor
que a dieta A.
(d) Considerando o item (b), construa um intervalo de 95% de conança para diferença de
médias do incremento de peso de pessoas alimentadas com dieta B e A .
Capítulo 6
6.1 Introdução
Em diversas áreas de aplicação, freqüentemente há interesse em estudar a relação entre duas variáveis,
como quantidade de fertilizante; e a produção com o uso do fertilizante, a concentração de uma droga
injetada em um animal de laboratório e o batimento do coração após a injeção; a dureza de um plástico
tratado com calor durante diferentes períodos de tempo , etc. A natureza e o grau de relação entre
variáveis podem ser analisadas pelas técnicas de Regressão e Correlação respectivamente, mesmo que
essas técnicas estão relacionadas têm propósitos e interpretações diferentes como será mostrado mais
adiante.
O termo regressão foi introduzido pelo cientista inglês Francis Galton em 1880. Em um famoso ensaio,
Galton vericou que embora houvesse uma tendência de pais altos terem lhos altos e pais baixos terem
lhos baixos, a altura média dos lhos de uma dada altura tendia a se deslocar ou "regredir"até a altura
média da população como um todo. Em outras palavras, a altura dos lhos de pais extraordinariamente
altos ou baixos tende a se mover para a altura média da população. A lei de regressão universal de
Galton foi conrmada por seu amigo Karl Pearson, que coletou mais de mil registros de alturas dos
membros de uma família. Ele vericou que a altura média dos lhos de um grupo de pais altos era
inferior à altura de seus pais e que a altura média dos lhos de um grupo de pais baixos era superior
à altura de seus pais. Assim, tanto os lhos altos quanto os baixos "regrediram"em direção à altura
média de todos os homens.
A moderna interpretação da regressão é, porém, bem diferente. Em linha gerais, podemos dizer:
a análise de regressão ocupa-se do estudo da dependência de uma variável, a variável dependente
(ou variável resposta), em relação a uma ou mais variáveis, as variáveis explicativas (ou variáveis
independentes), com o objetivo de estimar e/ou prever a média (da população) ou valor médio da
variável dependente em termo dos valores conhecidos ou xos das variáveis explicativas.
A análise de correlação, por outro lado, consiste na medição do grau ou intensidade de associação
entre duas variáveis. Quando se pode demonstrar que a variação de uma variável está de algum modo
associada com a variação da outra, então podemos dizer que as duas variáveis estão correlacionadas.
Uma correlação pode ser positiva (quando ao aumentar uma variável a outra também aumenta) ou
negativa ( quando ao aumentar uma variável a outra diminui). Por outro lado, se a variação de uma
variável não corresponde em absoluto à variação da outra, então não existe nenhuma associação e
portanto, nenhuma correlação entre as duas variáveis. Assim por exemplo, se um investigador deseja
determinar o grau de associação que existe entre a biomassa do toplacton e a quantidade de clorola
177
CAPÍTULO 6. ANÁLISE DE REGRESSÃO E CORRELAÇÃO 178
"x", o investigador retira repetidas amostras de água do lugar amostrado na lagoa e mede a clorola
"x"e a biomassa em cada amostragem. Nessa situação, o investigador não tem controle sobre uma ou
outra variável, já que os valores de clorola "x"e da biomassa encontrados em cada amostra serão "os
que natureza lhe provê". Portanto, deduz-se que as duas variáveis acima são aleatórias e a análise de
correlação é o procedimento estatístico adequado.
Tabela 6.1: Número de clientes e vendas semanais para uma amostra de 20 supermercados.
Supermercado No de clientes (X ) Vendas semanais (Y )
1 907 11,20
2 926 11,05
3 506 6,84
4 741 9,21
5 789 9,42
6 889 10,08
7 874 9,45
8 510 6,73
9 529 7,24
10 420 6,12
11 679 7,63
12 872 9,43
13 924 9,46
14 607 7,64
15 452 6,92
16 729 8,95
17 794 9,33
18 844 10,23
19 1010 11,77
20 621 7,41
Na gura 6.1, é apresentado o diagrama de dispersão das vendas semanais e o número de clientes. O
diagrama é somente um gráco em que cada par (xi , yi ) está representado como um ponto no sistema
de coordenadas bidimensionais. A análise desse diagrama indica que uma curva não passa exatamente
CAPÍTULO 6. ANÁLISE DE REGRESSÃO E CORRELAÇÃO 179
11
10
Vendas semanais
9
8
7
6
Numero de clientes
por todos os pontos, mas existe uma forte evidência que os pontos estão dispersos de maneira aleatória
em torno de uma linha reta. Portanto, é razoável supor que a média da variável aleatória Y , está
relacionada com X pela seguinte relação
E(Y |X = x) = µY |x = β0 + β1 x
Y = µY |x + ε = β0 + β1 x + ε, (6.1)
onde ε é o erro aleatório. É importante observar que ε leva em conta a falha desse modelo em se
ajustar exatamente aos dados. Isso pode ser devido ao efeito de outras variáveis que afetam as vendas
semanais. O modelo (6.1) recebe o nome de modelo de regressão linear simples, pois tem somente
uma variável explicativa ou variável regressora ou variável independente . Em muitas situações, os
modelos desse tipo surgem de uma relação teórica. Em outras, não há nenhum conhecimento teórico
da relação existente entre x e y. A seleção dos modelos se baseia na análise do diagrama de dispersão,
tal como foi feito com os dados de vendas semanais. Nesses casos, o modelo de regressão se considera
como um modelo empírico.
Em geral, a variável resposta pode estar relacionada com k variáveis explicativas X1 , . . . Xk
obedecendo à equação :
Y = β0 + β1 X1 + · · · + βk Xk + ε, (6.2)
Em nosso exemplo, as variáveis X1 , . . . Xk poderia ser, por exemplo, número de promoções por semana,
formas de pagamento e outras.
CAPÍTULO 6. ANÁLISE DE REGRESSÃO E CORRELAÇÃO 180
A equação (6.2) é denominada modelo de regressão linear múltipla, porque envolve mais uma variável
explicativa. O adjetivo "linear"é usado para indicar que o modelo é linear nos parâmetros β1 , . . . , βk
e não porque Y é função linear dos X 's. Por exemplo, uma expressão da forma Y = βo + β1 log X1 +
β2 X23 + ε é um modelo de regressão linear múltipla, mas o mesmo não acontece com a equação Y =
β0 + β1 X1β2 + β3 X22 + ε.
Na seção seguinte é apresentado o caso mais simples em que apenas duas variáveis estarão envolvidas,
o qual corresponde à regressão linear simples.
2. Os erros são não correlacionados, ou seja, o valor de um erro não depende de qualquer outro erro.
3. A variável explicativa X é controlada pelo experimentador e é medida sem erro, ou seja, não é
uma variável aleatória.
E(Y |X = x) = µY |x = β0 + β1 x. (6.4)
Este critério de estimação dos coecientes de regressão é conhecido como método de mínimos qua-
drados. Ao utilizar o modelo (6.3), é possível expressar as n observações da amostra como:
yi = β0 + β1 xi + εi , i = 1, . . . , n. (6.5)
Os estimadores de mínimos quadrados (EMQ) de β0 e β1 denotados por β̂0 e β̂1 devem satisfazer as
seguintes equações:
n
X
∂Q
| = −2 (yi − β̂0 − β̂1 xi ) = 0, (6.7)
∂β0 β̂0 ,β̂1
i=1
n
X
∂Q
| = −2 (yi − β̂0 − β̂1 xi )xi = 0.
∂β1 β̂0 ,β̂1
i=1
As equações (6.8) recebem o nome de equações normais de mínimos quadrados. A solução dessas
CAPÍTULO 6. ANÁLISE DE REGRESSÃO E CORRELAÇÃO 182
P
n P
n
xi yi
onde x̄ = i=1
n e ȳ = i=1
n .
Portanto, a linha de regressão estimada ou ajustada é :
ŷ = β̂0 + β̂1 x
e estima a média da variável dependente para um valor da variável explicativa X = x, µY |x . Note que
cada par de observações satisfaz a relação:
yi = β̂0 + β̂1 xi + ei , i = 1, . . . , n
onde ei = yi − yˆi recebe o nome de resíduo. O resíduo descreve o erro no ajuste do modelo na i-ésima
observação. Nesta seção, utilizamos os resíduos para o estudo da adequação do modelo ajustado.
Conforme o ponto de vista da notação, em certas situações é conveniente ter notações especiais no
MRLS. Dados (x1 , yi ), . . . , (xn , yn ) sejam:
µ n ¶2
P
Xn X n X n xi Xn
2 2 i=1
Sxx = (xi − x̄) = (xi − x̄)xi = xi − = x2i − nx̄2 ,
n
i=1 i=1 i=1 i=1
µ n ¶µ n ¶
P P
Xn Xn Xn x i yi Xn
i=1 i=1
Sxy = (xi − x̄)(yi − ȳ) = (xi − x̄)yi = xi yi − = xi yi − nx̄ȳ,
n
i=1 i=1 i=1 i=1
µ n ¶2
P
Xn X n X n yi X n
2 2 i=1
Syy = (yi − ȳ) = (yi − ȳ)yi = yi − = yi2 − nȳ 2 .
n
i=1 i=1 i=1 i=1
Exemplo 6.3.1 Considere os dados do exemplo 6.2.1, apresentado ao inicio desta seção, no qual o
gerente de supermercado estava interessado em estimar as vendas médias semanais de cada supermer-
cado, dado o número de clientes por cada supermercado.
Conforme já visto na gura 6.1, existe indicação da existência de um relacionamento linear entre as
vendas semanais (Y ) e o número de clientes (X ) dos supermercados. Para determinar o modelo de
regressão estimada foram calculados as seguintes quantidades:
CAPÍTULO 6. ANÁLISE DE REGRESSÃO E CORRELAÇÃO 183
n = 20
n
X
xi = 907 + 926 + · · · + 621 = 14.623; x̄ = 731, 15
i=1
Xn
yi = 11, 20 + 11, 05 + · · · + 7, 41 = 176, 11; ȳ = 8, 8055
i=1
Xn
x2i = (907)2 + (926)2 + · · · + (621)2 = 11.306.209
i=1
n
X
yi2 = (11, 20)2 + (11, 05)2 + · · · + (7, 41)2 = 1.602, 0971
i=1
n
X
xi yi = (907)(11, 20) + (11, 05)(926) · · · + (7, 41)(621) = 134.127, 90
i=1
n
X
Sxx = x2i − n(x̄)2 = 11.306.209 − 20(731, 15)2 = 614.603
i=1
n
X
Sxy = xi yi − n(x̄)(ȳ) = 134.127, 90 − 20(8, 8055)(731, 15) = 5.365, 08
i=1
Xn
Syy = yi2 − n(ȳ)2 = 1.609, 0971 − 20(8, 8055) = 51, 3605.
i=1
11
10
Vendas semanais
9
8
7
6
Numero de clientes
Figura 6.3: Gráco de dispersão da venda semanal e o número de clientes, e o modelo de regressão
ajustado: ŷ = 2, 423 + 0, 00873x
venda de um supermercado quando o número de clientes for X = 600. Claro que essas estimações estão
sujeitas a um erro, isto é, é pouco provável que uma venda futura seja exatamente 7661 dólares quando
o número de clientes do supermercado seja 600. Em seções subseqüentes, será visto como utilizar os
intervalos de conança e as previsões para descrever o erro ao fazer estimações a partir do modelo de
regressão.
E(β̂1 ) = β1 (6.12)
σ2
V ar(β̂1 ) = . (6.13)
Sxx
E(β̂0 ) = β0 (6.14)
· ¸
1 x̄2
V ar(β̂0 ) = σ 2 + . (6.15)
n Sxx
σ 2 x̄
Cov(β̂0 , β̂1 ) = − (6.16)
Sxx
CAPÍTULO 6. ANÁLISE DE REGRESSÃO E CORRELAÇÃO 185
Para realizarmos inferências com relação aos parâmetros do MRLS β0 e β1 , é necessário estimar o
parâmetro σ 2 que aparece nas expressões de V ar(β̂0 ) e V ar(β̂1 ). O parâmetro σ 2 , que é a variância do
termo aleatório ε no MRLS, reete a variação aleatória ao redor da verdadeira linha de regressão.
Os resíduos, ei = yi − yˆi são empregados na estimação de σ 2 . A soma de quadrados residuais ou soma
de quadrados dos erros, denotado por SQR é:
n
X n
X
SQR = e2i = (yi − yˆi )2
i=1 i=1
Pode-se demonstrar que o valor esperado da soma de quadrados dos residuais SQR, é dado por:
E(SQR) = (n − 2)σ 2
Portanto,
SQR
σˆ2 = , (6.17)
n−2
é um estimador não viciado de σ 2 , isto é, E(σˆ2 ) = σ 2 . A quantidade SQR
n−2 é denominado quadrado
médio residual (QM R).
Uma fórmula mais conveniente para o cálculo da SQR é dada por:
SQR = Syy − β̂1 Sxy . (6.18)
Exemplo 6.3.2 Com os dados do exemplo 6.3.1, é feita a estimação da variância σ 2 . Nesse caso,
Syy = 51, 3605, Sxy = 5.365, 08 e β̂1 = 0, 00873.
Denição 6.3.1 No modelo de regressão linear simples, o erro padrão estimado da inclinação é
dado por: s
σ̂ 2
EP (βˆ1 ) =
Sxx
e o erro padrão do intercepto é dado por:
s · ¸
1 X̄ 2
EP (βˆ0 ) = σ̂ 2 +
n Sxx
Suponha que se deseje testar a hipótese de que a inclinação é igual a uma constante representada por
β1,0 . As hipóteses apropriadas são:
H0 : β1 = β1,0 (6.19)
H1 : β1 6= β1,0
onde é considerada uma alternativa bilateral. Mas se os ε ∼ N (0, σ 2 ), de maneira imediata é possível
demonstrar que a variável Yi ∼ N ID(β0 + β1 xi , σ 2 ). Da equação (6.10) observa-se que β̂ é uma com-
binação linear de variáveis aleatórias normais independentes e conseqüentemente, β̂1 ∼ N (β1 ; σ 2 /Sxx ).
Além disso, (n − 2)σ̂ 2 /σ 2 tem distribuição qui-quadrado com n − 2 graus de liberdade e β̂1 é indepen-
dente de σ̂ 2 . Como resultado destas propriedades, a estatística
β̂1 − β1,0
T =p , (6.20)
σ̂ 2 /Sxx
tem distribuição t-Student com n − 2 graus de liberdade sob H0 : β1 = β1,0 . Rejeita-se H0 se
H0 : β0 = β0,0 (6.21)
H1 : β0 6= β0,0
usamos a estatística
β̂0 − β0,0
T =q (6.22)
2
σ̂ 2 [ n1 + Sx̄xx ]
que tem distribuição t-Student com n − 2 graus de liberdade. Rejeitamos a hipóteses nula se |Tobs | >
tα/2, n−2 .
Um caso particular muito importante das hipóteses dadas em (6.19) é:
H0 : β1 = 0 (6.23)
H1 : β1 6= 0
Esse teste está relacionado com a signicância do modelo de regressão. Deixar de rejeitar H0 : β1 = 0
é equivalente a concluir que não há nenhuma relação linear entre X e Y. Na gura 6.4, é ilustrada essa
CAPÍTULO 6. ANÁLISE DE REGRESSÃO E CORRELAÇÃO 187
situação. Note que esse resultado pode implicar que X é pouco importante para explicar a variação Y
e o melhor estimador de Y para qualquer X é Ŷ = Ȳ (gura 6.4a ), ou que a verdadeira relação entre
X e Y não é linear (gura 6.4b). Como alternativa, se H0 : β1 = 0 é rejeitado, implica que X tem
importância ao explicar a variabilidade de Y (veja a gura 6.5). Contudo, a rejeição de H0 : β1 = 0
pode signicar que o modelo linear é adequado (gura 6.5a), ou que, mesmo havendo um efeito linear
de X , melhores resultados podem ser obtidos com a adição de termos polinomiais de ordem maior em
X (gura 6.5b).
Exemplo 6.3.3 Aqui é apresentado o teste de signicância para o MRLS para os dados do exemplo
6.3.1.
CAPÍTULO 6. ANÁLISE DE REGRESSÃO E CORRELAÇÃO 188
As hipóteses são
H0 : β1 = 0
H1 : β1 6= 0.
β̂1 0, 00873
Tobs = p =p = 13, 65.
2
σ̂ /Sxx 0, 2513/614.603
Como Tobs = 13, 65 > t0,03,18 = 2, 101, rejeita-se a hipótese H0 : β1 = 0. Portanto, conclui-se ao nível
de signicância de 5%, que existe uma relação linear signicativa entre o número de clientes e as vendas
semanais.
Para testar a signicância do modelo de regressão ( H0 : β1 = 0,) pode-se utilizar o método conhecido
como análise de variância. O método consiste em decompor a variabilidade da variável resposta em
componentes mais manejáveis. Considere a seguinte identidade:
e que SQreg/σ 2 e SQR/σ 2 são variáveis aleatórias qui-quadrado independentes com 1 e n − 2 graus
de liberdade respectivamente. Portanto, se a hipótese nula H0 : β1 = 0 é verdadeira, a estatística
SQreg/1 QM reg
F = = , (6.28)
SQR/(n − 2) QM R
tem distribuição F com 1 e (n − 2) graus de liberdade. Portanto, rejeita-se H0 se F0bs > Fα, 1, n−2 . As
quantidades QM reg = SQreg/1 e QM R = SQR/(n−2) são denominadas respectivamente quadrado
médio devido à regressão e quadrado médio devido aos residuais. O procedimento do teste é
usualmente representado em uma tabela de análise de variância, como mostrada na tabela 6.2 abaixo.
Exemplo 6.3.4 A seguir é apresentado o procedimento de análise de variância para testar se de fato
existe relação linear entre o número de clientes (X) e as vendas semanais (Y), no modelo proposto
para os dados do exemplo 6.3.1. (Use α = 0, 05)
Relembre que Syy = 51, 3605, β̂1 = 0, 00873, Sxy = 5.365, 08 e n = 20. A soma de quadrados da
regressão é
SQreg = β̂1 Sxy = (0, 00873)(5.365, 08) = 46, 8371
enquanto a soma de quadrados dos residuais é:
β̂1
T =p , (6.29)
σ̂ 2 /Sxx
CAPÍTULO 6. ANÁLISE DE REGRESSÃO E CORRELAÇÃO 190
é equivalente ao teste F da equação (6.28). Elevando ao quadrado ambos membros da equação (6.29)
e considerando que σ̂ 2 = QM R, tem-se que:
Observe que o termo T 2 da equação (6.30) é idêntico à F da equação 6.28. É verdade, em geral, que
o quadrado de uma variável aleatória t-Student com ν graus de liberdade é uma variável aleatória F,
com um e ν graus de liberdade no numerador e denominador , respectivamente. Portanto, o teste
que utiliza T é equivalente ao teste baseado em F. Mas, o teste t é um pouco mais exível , pois que
permite testar hipóteses unilaterais, enquanto que o teste F é restrito ao teste bilateral.
De modo similar, um intervalo de 100(1 − α)% de conança para a inclinação β0 é dado por:
s s
1 x̄2 1 2
x̄
IC(β0 ; 1 − α) = β̂0 − t α2 , n−2 QM R[ + ] ; β̂0 + t α2 , n−2 QM R[ + ] (6.32)
n Sxx n Sxx
Exemplo 6.3.5 A seguir é obtido um intervalo de 95% de conança para a inclinação do MRLS com
os dados do exemplo 6.3.1,
CAPÍTULO 6. ANÁLISE DE REGRESSÃO E CORRELAÇÃO 191
Relembre que n = 20, β̂1 = 0, 00873, Sxx = 614, 603 e QM R = 0, 2513. Para 1 − α = 0, 95, tem-se
t0,025, 18 = 2, 101. Então da equação (6.31), vem:
à r r !
QM R QM R
IC(β1 ; 0, 95) = β̂1 − t0,025,18 ; β̂1 + t0,025,18
Sxx Sxx
à r r !
0, 2513 0, 2513
= 0, 00873 − 2, 101 ; 0, 00873 + 2, 101
614.603 614.603
= (0, 00873 − 0, 00134; 0, 00873 + 0, 00134)
Ou seja,
IC(β1 ; 0, 95) = (0, 00739; 0, 01007).
Considerando que a suposição de que os εi ∼ N ID(0, σ 2 ) é válida, pode-se demonstrar que E(µ̂Y |x0 ) =
µ̂Y |x0 . A variância de µ̂Y |xo é:
· ¸
2 1 (x0 − x̄)2
V ar(µ̂Y |xo ) = σ + .
n Sxx
Além disso, µ̂Y |xo tem distribuição normal. Já que β̂0 e β̂1 são normalmente distribuídos. Também
podemos demonstrar que a variável aleatória
µ̂Y |xo − µY |xo
T =r h i
2
QM R n1 + (x0S−x̄)
xx
tem distribuição t-Student com n − 2 graus de liberdade. Portanto, um intervalo de 100(1 − α)% de
conança para µY |x0 é dado
s s
1 (x0 − x̄)2 1 (x0 −x̄)2
IC(µ̂Y |x ; 1 − α) = µ̂Y |xo − t α2 , n−2 QM R[ + ]; µ̂Y |xo + t α2 , n−2 QM R[ + ]
n Sxx n Sxx
(6.33)
Observe que o comprimento de intervalo de conança para µ̂Y |x é mínimo quando x0 = x̄ e aumenta.
à medida que |x0 − x̄| aumenta.
Exemplo 6.3.6 Para o problema dos supermercados do exemplo 6.3.1, suponha que tem-se interesse
em construir um intervalo de 95% de conança da venda, média, semanal para todos supermercados
com 600 clientes.
CAPÍTULO 6. ANÁLISE DE REGRESSÃO E CORRELAÇÃO 192
No modelo ajustado µ̂Y |x0 = 2, 423 + 0, 00873x0 . Para x0 = 600, obtém-se µ̂Y |x0 = 7, 661. Também,
Portanto, a partir do intervalo construído, conclui-se, com 95% de conança, que as vendas médias
semanais poderiam variar de 7.369 dólares a 7.953 dólares para supermercados com 600 clientes.
Ao repetir os cálculos anteriores para valores diferentes de x0 , obtém-se os limites de conança para
cada µY |x0 . Na gura 6.6, é mostrado o diagrama de dispersão com o modelo de regressão ajustado
e os correspondentes limites de conança de 95% (bandas de conança). Observe que o comprimento
do intervalo de conança para µY |x0 aumenta a medida que |x0 − x̄| aumenta.
Figura 6.6: Diagrama de dispersão dos dados dos supermercados do exemplo 6.3.1, conjuntamente com
a linha de regressão ajustada e as bandas de conança do 95% para µY |x0 .
dado que Y0 é independente de Ŷ0 . Se é usado QM R como estimador de σ 2 , pode-se demonstrar que
Y0 − Ŷ0
T =r h i
(x0 −x̄)2
QM R 1 + n1 + Sxx
tem distribuição t-Student com n − 2 graus de liberdade. Portanto um intervalo de 100(1 − α)% de
conança para uma futura observação é dado por:
s s
1 (x − x̄)2 1 (x − x̄)2
0 0
IC(Y0 ; 1 − α) = Ŷ − t α2 , n−2 QM R[1 + + ]; Ŷ + t α2 , n−2 QM R[1 + + ]
n Sxx n Sxx
(6.35)
Observe que o comprimento do intervalo de conança para a nova observação é mínimo quando x0 = x̄
e aumenta a medida que |x0 − x̄| aumenta. Ao comparar as equações (6.35) e (6.33) observa-se que o
comprimento do intervalo de predição em que X = x0 é sempre maior que o comprimento do intervalo
de conança para a resposta média obtido quando X = x0 . Esse resultado é conseqüência do fato
de que o intervalo de previsão depende tanto do erro associado ao ajuste do modelo quanto do erro
associado à observação futura.
Exemplo 6.3.7 Para ilustrar a construção de um intervalo de previsão, considere os dados do exem-
plo 6.3.1 e suponha agora, tem-se interesse em encontrar um intervalo de previsão de 95% das vendas
semanais de um supermercado com 600 clientes.
Portanto, a partir do intervalo construído, conclui-se, com 95% de conança, que as vendas médias
semanais poderiam variar de 6.577 dólares a 8.745 dólares para um supermercado que tem 600 clientes.
Ao repetir os cálculos anteriores para diferentes valores de x0 , podemos obter os intervalos de previsão
de 95%, que estão representados na gura 6.7. Observe que esse gráco também apresenta os limites
de conança do 95% para µY |x0 , calculados com os dados do exemplo 6.3.1. Isto ilustra que os limites
de previsão sempre são mais amplos que os limites de conança da µY |x0 .
Figura 6.7: Digrama de dispersão dos dados dos supermercados do exemplo 6.3.1, conjuntamente com
a linha de regressão ajustada e as bandas de conança do 95% para µY |x0 (CI) e Y0 (ICP).
Análise residual
ei = yi − ŷi , i = 1, . . . , n
onde yi é uma observação real de Y e ŷi é o valor correspondente estimado através do modelo de
regressão. Freqüentemente a análise de resíduos é útil para vericar a suposição de que os erros são
CAPÍTULO 6. ANÁLISE DE REGRESSÃO E CORRELAÇÃO 195
não correlacionados e têm uma distribuição que é aproximadamente normal com média zero e variância
constante, assim como para determinar se é necessária a adição de termos adicionais ao modelo.
A análise da adequação do modelo será feita pelo gráco de resíduos. Como uma vericação aproxi-
mada da normalidade, pode-se construir os histogramas de freqüências dos resíduos ou um gráco de
probabilidade normal dos resíduos. Muitos programas computacionais produzem grácos de probabili-
dade normal dos resíduos (por exemplo, Minitab), já que, os tamanhos das amostra em um modelo de
regressão geralmente são pequenos para que os histogramas sejam de utilidade por isso que o gráco
de probabilidade é o método preferido. Além desses métodos grácos, existem procedimentos de testes
para vericar a normalidade, como por exemplo o teste de aderência, teste de Shapiro-Wilk, teste de
Kolgomorov, entre outras.
Também é possível padronizar os resíduos mediante o cálculo de:
ei
di = √ , i = 1, . . . , n
QM R
Se os erros tem distribuição normal, então aproximadamente 95% dos resíduos padronizados devem
pertencer ao intervalo (−2, 2). Os resíduos fora desse intervalo podem indicar a presença de um valor
atípico ("outlier"). Isto é, uma observação que não é comum do restante da massa de dados. Na
literatura, foram propostas várias regras para descartar valores atípicos. Porém , muitas vezes, os
"outliers"fornecem informações importantes sobre situações pouco usuais que são de interesse para o
pesquisador e não devem ser descartadas. Para um estudo de valores atípicos, veja Montgomery e
Peck, (1992).
Figura 6.8: Padrões para grácos de resíduos: (a) satisfatório, (b) funil, (c) laço duplo, (d) não linear.
Geralmente é útil fazer um gráco dos resíduos (i) com uma seqüencia no tempo (se é conhecida); (ii)
CAPÍTULO 6. ANÁLISE DE REGRESSÃO E CORRELAÇÃO 196
em relação aos ŷ e (iii) em função da variável independente x. Usualmente, esses grácos tem aspecto
similar aos quatro padrões gerais que aparecem na gura 6.8. O padrão (a) dessa gura representa a
situação ideal, enquanto que os padrões (b), (c) e (d) representam anomalias. Se os resíduos aparecem
como em (b), a variância das observações pode aumentar com o tempo ou com a magnitude de Y ou
X . Usualmente uma transformação nos dados sobre a resposta Y elimina este problema. Entre as
√
transformações mais usadas para estabilizar a variância se inclui o emprego de: y , ln y ou 1/y. (veja
Montgomery e Peck (1992) para mais detalhes). Se um gráco dos resíduos com o tempo tem o aspecto
da gura 6.8b, então a variância das observações aumenta com o tempo. Os grácos dos resíduos com
ŷ ou com x, semelhantes (c) também indicam uma desigualdade da variância. Grácos dos resíduos
semelhantes ao de gura 6.8d, indicam que modelo é inadequado, isto é, que é necessário adicionar ao
modelo termos de ordem superior, considerar uma transformação da variável x ou da variável y (ou
ambas ), ou considerar outras variáveis explicativas.
Exemplo 6.3.8 A seguir é apresentado a análise residual para o modelo de regressão ajustado os
dados de exemplo 6.3.1.
Na tabela 6.4, são apresentados os valores observados e ajustados de Y para cada valor de x que
aparece no conjunto aos dados . Esses valores foram obtidos com o aplicativo MINITAB.
Tabela 6.4: Dados do exemplo 6.3.1, valores ajustados, resíduos e resíduos padronizados,
Supermercado Número Vendas Valor Resíduo Resíduo padronizado
√
de clientes Semanais Ajustado (ŷi ) ei = yi − ŷi di = ei / QM R
1 907 11,20 10,3356 0,86438 1,72804
2 926 11,05 10,5015 0,54852 1,09658
3 506 6,84 6,8350 0,00499 0,00997
4 741 9,21 8,8865 0,32351 0,64675
5 789 9,42 9,3055 0,11449 0,22888
6 889 10,08 10,1785 -0,09848 -0,19688
7 874 9,45 10,0475 -0,59754 -1,19457
8 510 6,73 6,8699 -0,13993 -0,27974
9 529 7,24 7,0358 0,20421 0,40824
10 420 6,12 6,0843 0,03574 0,07145
11 679 7,63 8,3452 -0,71525 -1,42989
12 872 9,43 10,0301 -0,60008 -1,19965
13 924 9,46 10,4840 -1,02402 -2,04718
14 607 7,64 7,7167 -0,07671 -0,15335
15 452 6,92 6,3636 0,55639 1,11232
16 729 8,85 8,7817 0,06827 0,13648
17 794 9,33 9,3492 -0,01916 -0,03831
18 844 10,23 9,7856 0,44435 0,88833
19 1010 11,77 11,2348 0,53523 1,07000
20 621 7,41 7,8389 -0,42892 -0,85749
Na gura 6.9, são apresentado os grácos da análise residual do exemplo 6.3.1. A gura 6.9a mostra um
gráco de probabilidade normal dos resíduos. Como esses resíduos estão localizados aproximadamente
ao longo de uma linha reta, conclui-se que não há uma forte indicação de que a suposição de normalidade
CAPÍTULO 6. ANÁLISE DE REGRESSÃO E CORRELAÇÃO 197
dos erros não seja adequada. Na gura 6.9b, mostra o gráco de resíduos com os valores ajustados
(ŷi ) , enquanto na gura 6.9c, representa-se número de clientes (xi ). Nenhum desses grácos fornecem
indicação de algum problema sério quanto à adequação do modelo. Finalmente, na gura 6.9d é
representado o gráco de resíduos com os valores ajustados. O padrão do gráco é semelhante ao
da gura 6.9b. Mas, a gura 6.9d, mostra uma observação (o supermercado 13)os resíduos foram do
intervalo (−2, 2) o qual poderia ser considerado como um valor atípico.
Figura 6.9: Gráco de resíduos (ei ) para o exemplo 6.3.1 : (a) de probabilidade normal, (b) ei contra
ŷi (c) ei contra xi e (d) resíduos padronizados (di ) contra ŷi .
A quantidade:
SQreg SQR
R2 = =1− (6.36)
SQT SQT
recebe o nome de coeciente de determinação que é usado para julgar a adequação do modelo de
regressão. Mas, no caso em que as variáveis X e Y sejam variáveis aleatórias distribuídas de maneira
conjunta, R2 é o quadrado do coeciente de correlação entre X e Y. Da identidade da análise de
variância, dadas em (6.25)-(6.26), temos que 0 ≤ R2 ≤ 1. Daí, o coeciente de determinação pode ser
interpretado como a proporção da variabilidade presente nas observações da variável resposta Y, que
é explicada pela variável independente X no modelo de regressão. A proporção não explicada pela
variável regressora X, recebe o nome de coeciente de não determinação e é dada por 1 − R2 .
onde µ1 e σ12 são a média e variância de X e µ2 e σ22 são a média e variância de Y e, ρ é coeciente de
correlação entre X e Y. O coeciente de correlação é denido como:
E[(X − µ1 )(Y − µ1 )]
ρ= (6.38)
σ1 σ2
O coeciente de correlação é uma quantidade adimensional que mede a força da associação linear entre
duas variáveis aleatórias.
De (6.37) é possível demonstrar que a função de densidade condicional de Y para um valor dado X = x
é dado por à !2
1 1 yi − β0 − β1 x
f (y|x) = √ exp − (6.39)
2πσY |x 2 σY2 |x
onde
σ2
β0 = µ2 − µ1 ρ , (6.40)
σ1
σ2
β1 = ρ (6.41)
σ1
e a variância da distribuição condicional de Y para um X = x é dado por:
σY |x = σ22 (1 − ρ2 ). (6.42)
Isto é, a distribuição condicional de Y dado X = x é normal com média
E(Y |X = x) = β0 + β1 x (6.43)
e variância σY2 |x . Portanto, a média da distribuição condicional dado X = x (E(Y |X = x) é o modelo
de regressão linear simples. Além disso, existe uma relação entre o coeciente de correlação ρ e a
inclinação β1 . Na equação (6.41), observe que se ρ = 0, existe β1 = 0, que implica na não existência
de regressão de Y sobre X. Isto é, o conhecimento de X não é suciente para prever Y.
É possível demonstrar que os estimadores de máxima verossimilhança dos parâmetros β0 e β1 são:
β0 = Ȳ − β̂1 X̄ (6.44)
e Pn
Yi (Xi − X̄) SXY
β1 = Pi=1n 2
= (6.45)
i=1 (Xi − X̄) SXX
Note que os estimadores do intercepto e da inclinação dados acima são idênticos as equações (6,9)
e (6.10) respectivamente, os quais foram obtidos pelo método de mínimos quadrados onde se supõe
que a variável X é uma variável controlável. Isto é, o modelo de regressão Y e X com distribuição
conjunta normal bivariada, é equivalente ao modelo na qual X não é uma variável aleatória. Portanto,
os métodos já apresentados na seção anterior podem ser empregados para análise de modelos onde X
e Y são variáveis aleatórias com distribuição normal bivariada.
É possível realizar inferência sobre o coeciente de correlação ρ desse modelo. Um estimador de ρ é o
coeciente de correlação amostral, representado por r e denido por
Pn
Yi (Xi − X̄)
i=1 SXY
r=s =√ (6.46)
Pn P
n SXX SY Y
(Xi − X̄) 2 (Yi − Ȳ ) 2
i=1 i=1
CAPÍTULO 6. ANÁLISE DE REGRESSÃO E CORRELAÇÃO 200
Portanto, a inclinação β̂1 é igual ao coeciente de correlação amostral r multiplicado por um fator
de escala que é a raiz quadrada do quociente entre uma medida da dispersão dos valores de Y (SY Y )
e a medida equivalente da dispersão dos valores de X (SXX ). No entanto, apesar de β̂1 e r estarem
diretamente relacionados, eles fornecem diferentes tipos de informação. O coeciente de correlação
amostral r mede a força da associação linear entre X e Y, enquanto β̂1 mede a alteração esperada em
Y quando X sofre uma variação unitária. No caso em que X não é uma variável aleatória, o coeciente
de correlação r deixa de ter sentido, uma vez que a magnitude de r depende da escolha feita para o
espaçamento dos valores de X. Da equação (6.47), é possível demonstrar que:
H0 : ρ = 0 (6.48)
H1 : ρ 6= 0.
H0 : ρ = ρ0 (6.50)
H1 : ρ 6= ρ0 .
onde ρ0 6= 0, é um pouco mais complicado. Para amostras de tamanho moderado grande (n ≥ 30), a
estatística
1 1+r
Zr = arctanh r = ln (6.51)
2 1−r
tem distribuição aproximadamente normal com média
1 1+ρ
µZr = arctanh ρ = ln
2 1−ρ
e variância
σZ2 r = (n − 3)−1 .
CAPÍTULO 6. ANÁLISE DE REGRESSÃO E CORRELAÇÃO 201
Exemplo 6.4.1 Suponha que se tenha interesse em medir a força da relação linear de dois produtos
diferentes com relação ao preço em várias cidades do mundo. O preço de uma caixa de suco com seis
latas de uma certa marca (X) e de uma libra de frango (Y ) foram determinados em um supermercado
localizado em uma amostra aleatória de nove cidades. Supondo que o preço da caixa de suco e de
uma libra de frango são variáveis aleatórias com distribuição conjunta normal bivariada verique se
há relação linear entre X e Y . Os resultados são apresentados na tabela 6.5:
Tabela 6.5: Preço (em dólares) de uma caixa de suco e de uma libra de frango em nove cidades.
Caixa com seis Uma libra
Cidade sucos (X) de frango (Y )
Frankfurt 3,27 3,06
Hong Kong 2,22 2,34
Londres 2,28 2,27
Manila 3,04 1,51
México 2,33 1,87
Nova York 2,69 1,65
París 4,07 3,09
Sidney 2,78 2,36
Tokyo 5,97 4,85
0 coeciente de correlação r = 0, 883, entre o preço de uma caixa de sucos e de uma libra de frango
indica que há uma forte associação entre essas variáveis. Um maior preço da caixa de suco está
associado fortemente com um preço maior de uma libra de frango. Para vericar se essa associação é
signicativa, testa-se as hipóteses seguintes:
Para α = 0, 05, tem-se que t0,025,7 = 2, 365 < Tobs = 4, 98, logo, rejeita-se H0 : ρ = 0 ao nível de
signicância de α = 5%. Isto é, há evidência estatística da existência de um relacionamento linear
signicativa entre o preços de suco e frango nas diferentes cidades.
CAPÍTULO 6. ANÁLISE DE REGRESSÃO E CORRELAÇÃO 203
6.5 Exercícios
1. Uma determinada peça que compõe aparelhos de ar condicionado tem sido produzida periodi-
camente em lotes de tamanhos variados. O fabricante deseja estudar a relação existente entre o
tamanho do lote (X) e o número de horas de trabalho necessárias para a produção do lote (Y ).
Nos últimos 6 meses, 25 lotes foram produzidos observando-se os valores apresentados na tabela
6.6.
2. É esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa relação
uma nutricionista selecionou 16 mulheres entre 40 e 79 anos, observou em cada uma delas a idade
(X) e massa muscular (Y ).
3. Um experimento foi feito com a nalidade de estudar a relação existente entre a densidade do
óleo de milho (em gr/L) e temperatura de ebulição ( em graus centígrados). Para uma amostra
aleatória de 10 observações foram obtidos os seguintes resultados.
Densidade (Y ) 910 915 867 908 902 875 889 899 878 869
Temperatura (X) 30 25 100 30 40 80 60 40 75 90
(a) Ajuste os dados a um modelo de regressão linear simples e interprete as estimativas dos
parâmetros do modelo.
(b) Efetue a análise de variância e expresse suas conclusões com um nível de signicância de
5%.
(c) Calcule e interprete o coeciente de determinação e não determinação do modelo.
(d) Estimar, mediante um intervalo de 90% de conança, a densidade média de óleo de milho,
a uma temperatura de 60o C. Interprete o resultado.
(e) Estimar, mediante um intervalo de 90% de conança, a densidade de óleo de milho, a
uma temperatura de 60o C . Interprete seus resultados ? (Você poderia dizer porque o
comprimento deste intervalo é maior que o item (d)).
(f) Com nível de signicância de 5%, você pode armar, quando a temperatura é 0o C, que a
densidade média do óleo de milho é superior a 920 gr/L?
(g) Provar com α = 0, 01, se existe evidência estatística que permite armar que a cada incre-
mento da temperatura em 1o C, a densidade média de óleo de milho decresce em média
mais de 0,6 gr/L.
(h) Estimar mediante um intervalo de 90% de conança a variância da distribuição de densidades
de óleo de milho, para uma temperatura de 45o C .
(i) Para α = 0, 05, pode-se armar que a densidade média de óleo de milho é superior 900 gr/L,
quando a temperatura é 60o C?
CAPÍTULO 6. ANÁLISE DE REGRESSÃO E CORRELAÇÃO 205
(j) Supondo que Y e X tenha distribuição normal bivariada: (i) estime e interprete o coeciente
de correlação entre Y e X. (ii) Pode-se concluir para α = 0, 05, que a correlação existente
entre a densidade do óleo de milho e a temperatura é diferente de -0,9 ?
Tabela 6.8: Espaço em estantes e vendas de ração para animais de estimação em 12 supermercados
Espaço em estantes (X ) Vendas semanais,(Y )
Loja (pés) (centos de dólares)
1 5 1,6
2 5 2,2
3 5 1,4
4 10 1,9
5 10 2,4
6 10 2,6
7 15 2,3
8 15 2,7
9 15 2,8
10 20 2,6
11 20 2,9
12 20 3,1
[1] Bussab, W. O. e Morettin, P.A. (1987). Estatística Básica, 4a Ed., São Paulo.
[2] Botter, D.A. , Paula, G.A., Liete, J.G. e Cordani, L.k. (1996). Noções de Estatística. São
Paulo:IME/USP.
[3] Montgomery, D.C. e Runger, G.C. (1996) Applied statistics and probability for engineers John
Wiley &Sons, Inc.
[4] Montgomery, D.C. e Peck, E.A. (1992) Introduction to linear regression analysis John Wiley
&Sons, Inc.
[5] Montgomery, D.C. (1991) Design and analysis of experiments John Wiley &Sons, Inc.
[7] Fernadez, P.J. (1973). Introbução à teória de probabilidades. Rio de Janeiro: Livro Técnico.
[8] Meyer, Paul, L. (1977),Probabilidade: aplicações à estatística Livros técnicos e cienticos editora
s.a.
[9] Peres , C.A., Saldiva, C.D. (1982). Planejamento de Experimentos 5a Sinape, São Paulo,
206
Apêndice A
Tabelas Estatísticas
Tabela B: Qui-quadradot-Student
Tabela C: t-Student
Tabela D: F -Snedecor
207
APÊNDICE A. TABELAS ESTATÍSTICAS 208
Rz 2
Tabela A: Distribuição acumulada da normal padrão: Φ(z) = −∞
√1 e−t /2 dt
2π
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56750 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59484 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67365 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72241
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76731 0,77035 0,77337 0,77637 0,77935 0,78231 0,78524
0,8 0,78815 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
1,0 0,84135 0,84375 0,84614 0,84850 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90148
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92786 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95544 0,95637 0,95728 0,95819 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97671
2,0 0,97725 0,97778 0,97831 0,97882 0,97933 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98746 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99586 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99737
2,8 0,99745 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
3,0 0,99865 0,99869 0,99874 0,99878 0,99882 0,99886 0,99889 0,99893 0,99897 0,99900
3,1 0,99903 0,99906 0,99910 0,99913 0,99916 0,99918 0,99921 0,99924 0,99926 0,99929
3,2 0,99931 0,99934 0,99936 0,99938 0,99940 0,99942 0,99944 0,99946 0,99948 0,99950
3,3 0,99952 0,99953 0,99955 0,99957 0,99958 0,99960 0,99961 0,99962 0,99964 0,99965
3,4 0,99966 0,99968 0,99969 0,99970 0,99971 0,99972 0,99973 0,99974 0,99975 0,99976
3,5 0,99977 0,99978 0,99978 0,99979 0,99980 0,99981 0,99982 0,99982 0,99983 0,99984
3,6 0,99984 0,99985 0,99985 0,99986 0,99986 0,99987 0,99987 0,99988 0,99988 0,99989
3,7 0,99989 0,99990 0,99990 0,99990 0,99991 0,99991 0,99992 0,99992 0,99992 0,99993
3,8 0,99993 0,99993 0,99993 0,99994 0,99994 0,99994 0,99994 0,99995 0,99995 0,99995
3,9 0,99995 0,99995 0,99996 0,99996 0,99996 0,99996 0,99996 0,99996 0,99997 0,99997
APÊNDICE A. TABELAS ESTATÍSTICAS 209
v\α 0,995 0,990 0,975 0,950 0,900 0,500 0,100 0,050 0,025 0,010 0,005
1 0 0 0 0 0,02 0,45 2,71 3,84 5,02 6,63 7,88
2 0,01 0,02 0,05 0,10 0,21 1,39 4,61 5,99 7,38 9,21 10,60
3 0,07 0,11 0,22 0,35 0,58 2,37 6,25 7,81 9,35 11,34 12,84
4 0,21 0,3 0,48 0,71 1,06 3,36 7,78 9,49 11,14 13,28 14,86
5 0,41 0,55 0,83 1,15 1,61 4,35 9,24 11,07 12,83 15,09 16,75
6 0,68 0,87 1,24 1,64 2,2 5,35 10,64 12,59 14,45 16,81 18,55
7 0,99 1,24 1,69 2,17 2,83 6,35 12,02 14,07 16,01 18,48 20,28
8 1,34 1,65 2,18 2,73 3,49 7,34 13,36 15,51 17,53 20,09 21,95
9 1,73 2,09 2,7 3,33 4,17 8,34 14,68 16,92 19,02 21,67 23,59
10 2,16 2,56 3,25 3,94 4,87 9,34 15,99 18,31 20,48 23,21 25,19
11 2,6 3,05 3,82 4,57 5,58 10,34 17,28 19,68 21,92 24,72 26,76
12 3,07 3,57 4,4 5,23 6,3 11,34 18,55 21,03 23,34 26,22 28,3
13 3,57 4,11 5,01 5,89 7,04 12,34 19,81 22,36 24,74 27,69 29,82
14 4,07 4,66 5,63 6,57 7,79 13,34 21,06 23,68 26,12 29,14 31,32
15 4,60 5,23 6,26 7,26 8,55 14,34 22,31 25,00 27,49 30,58 32,8
16 5,14 5,81 6,91 7,96 9,31 15,34 23,54 26,3 28,85 32 34,27
17 5,7 6,41 7,56 8,67 10,09 16,34 24,77 27,59 30,19 33,41 35,72
18 6,26 7,01 8,23 9,39 10,86 17,34 25,99 28,87 31,53 34,81 37,16
19 6,84 7,63 8,91 10,12 11,65 18,34 27,2 30,14 32,85 36,19 38,58
20 7,43 8,26 9,59 10,85 12,44 19,34 28,41 31,41 34,17 37,57 40
21 8,03 8,9 10,28 11,59 13,24 20,34 29,62 32,67 35,48 38,93 41,4
22 8,64 9,54 10,98 12,34 14,04 21,34 30,81 33,92 36,78 40,29 42,8
23 9,26 10,2 11,69 13,09 14,85 22,34 32,01 35,17 38,08 41,64 44,18
24 9,89 10,86 12,4 13,85 15,66 23,34 33,2 36,42 39,36 42,98 45,56
25 10,52 11,52 13,12 14,61 16,47 24,34 34,38 37,65 40,65 44,31 46,93
26 11,16 12,2 13,84 15,38 17,29 25,34 35,56 38,89 41,92 45,64 48,29
27 11,81 12,88 14,57 16,15 18,11 26,34 36,74 40,11 43,19 46,96 49,64
28 12,46 13,56 15,31 16,93 18,94 27,34 37,92 41,34 44,46 48,28 50,99
29 13,12 14,26 16,05 17,71 19,77 28,34 39,09 42,56 45,72 49,59 52,34
30 13,79 14,95 16,79 18,49 20,6 29,34 40,26 43,77 46,98 50,89 53,67
40 20,71 22,16 24,43 26,51 29,05 39,34 51,81 55,76 59,34 63,69 66,77
50 27,99 29,71 32,36 34,76 37,69 49,33 63,17 67,5 71,42 76,15 79,49
60 35,53 37,48 40,48 43,19 46,46 59,33 74,4 79,08 83,3 88,38 91,95
80 51,17 53,54 57,15 60,39 64,28 79,33 96,58 101,88 106,63 112,33 116,32
90 59,2 61,75 65,65 69,13 73,29 89,33 107,57 113,15 118,14 124,12 128,3
100 67,33 70,06 74,22 77,93 82,36 99,33 118,5 124,34 129,56 135,81 140,17
120 83,85 86,92 91,57 95,7 100,62 119,33 140,23 146,57 152,21 158,95 163,65
v : Graus de liberdade.
APÊNDICE A. TABELAS ESTATÍSTICAS 210
v\α 0,40 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005
1 0,325 1,000 3,078 6,314 12,706 31,821 63,657 127,321 318,309 636,619
2 0,289 0,816 1,886 2,920 4,303 6,965 9,925 14,089 22,327 31,599
3 0,277 0,765 1,638 2,353 3,182 4,541 5,841 7,453 10,215 12,924
4 0,271 0,741 1,533 2,132 2,776 3,747 4,604 5,598 7,173 8,610
5 0,267 0,727 1,476 2,015 2,571 3,365 4,032 4,773 5,893 6,869
6 0,265 0,718 1,440 1,943 2,447 3,143 3,707 4,317 5,208 5,959
7 0,263 0,711 1,415 1,895 2,365 2,998 3,499 4,029 4,785 5,408
8 0,262 0,706 1,397 1,860 2,306 2,896 3,355 3,833 4,501 5,041
9 0,261 0,703 1,383 1,833 2,262 2,821 3,250 3,690 4,297 4,781
10 0,260 0,700 1,372 1,812 2,228 2,764 3,169 3,581 4,144 4,587
11 0,260 0,697 1,363 1,796 2,201 2,718 3,106 3,497 4,025 4,437
12 0,259 0,695 1,356 1,782 2,179 2,681 3,055 3,428 3,930 4,318
13 0,259 0,694 1,350 1,771 2,160 2,650 3,012 3,372 3,852 4,221
14 0,258 0,692 1,345 1,761 2,145 2,624 2,977 3,326 3,787 4,140
15 0,258 0,691 1,341 1,753 2,131 2,602 2,947 3,286 3,733 4,073
16 0,258 0,690 1,337 1,746 2,120 2,583 2,921 3,252 3,686 4,015
17 0,257 0,689 1,333 1,740 2,110 2,567 2,898 3,222 3,646 3,965
18 0,257 0,688 1,330 1,734 2,101 2,552 2,878 3,197 3,610 3,922
19 0,257 0,688 1,328 1,729 2,093 2,539 2,861 3,174 3,579 3,883
20 0,257 0,687 1,325 1,725 2,086 2,528 2,845 3,153 3,552 3,850
21 0,257 0,686 1,323 1,721 2,080 2,518 2,831 3,135 3,527 3,819
22 0,256 0,686 1,321 1,717 2,074 2,508 2,819 3,119 3,505 3,792
23 0,256 0,685 1,319 1,714 2,069 2,500 2,807 3,104 3,485 3,768
24 0,256 0,685 1,318 1,711 2,064 2,492 2,797 3,091 3,467 3,745
25 0,256 0,684 1,316 1,708 2,060 2,485 2,787 3,078 3,450 3,725
26 0,256 0,684 1,315 1,706 2,056 2,479 2,779 3,067 3,435 3,707
27 0,256 0,684 1,314 1,703 2,052 2,473 2,771 3,057 3,421 3,690
28 0,256 0,683 1,313 1,701 2,048 2,467 2,763 3,047 3,408 3,674
29 0,256 0,683 1,311 1,699 2,045 2,462 2,756 3,038 3,396 3,659
30 0,256 0,683 1,310 1,697 2,042 2,457 2,750 3,030 3,385 3,646
40 0,255 0,681 1,303 1,684 2,021 2,423 2,704 2,971 3,307 3,551
50 0,255 0,679 1,299 1,676 2,009 2,403 2,678 2,937 3,261 3,496
60 0,254 0,679 1,296 1,671 2,000 2,390 2,660 2,915 3,232 3,460
80 0,254 0,678 1,292 1,664 1,990 2,374 2,639 2,887 3,195 3,416
90 0,254 0,677 1,291 1,662 1,987 2,368 2,632 2,878 3,183 3,402
100 0,254 0,677 1,290 1,660 1,984 2,364 2,626 2,871 3,174 3,390
120 0,254 0,677 1,289 1,658 1,980 2,358 2,617 2,860 3,160 3,373
v : Graus de liberdade.
APÊNDICE A. TABELAS ESTATÍSTICAS 211