Documente Academic
Documente Profesional
Documente Cultură
1. HIPÓTESE ESTATÍSTICA
Na prática, o maior problema enfrentado por engenheiros e cientistas não é estimar os parâmetros populacionais
como a média e o desvio padrão, por exemplo, mas descrever um método que gere conclusões confiáveis a partir de
um conjunto de dados. Veja os exemplos as seguir:
Um engenheiro pode ter que conferir se há diferença de massa entre dois lotes de cimento da mesma marca,
baseado em dados amostrais.
Um cientista pode ter que investigar se a ingestão de refrigerante aumenta o risco de infarto, com base em
evidências experimentais.
Um estudante de ciências sociais, ao avaliar os resultados do censo, pode desejar saber se há alguma relação
entre o poder aquisitivo e a estatura de uma comunidade.
Cada um desses casos envolve uma conjectura a respeito daquilo que se deseja saber, ou seja, uma hipótese.
A inferência estatística engloba os procedimentos de tomada de decisão, com base em dados experimentais,
sobre a aceitação ou a rejeição da hipótese postulada. A hipótese estatística é uma afirmação ou conjectura sobre
uma ou mais populações (Walpole et al., 2009).
É impossível afirmar, com 100% de certeza que uma determinada hipótese estatística é verdadeira ou falsa, a
menos que se faça uma investigação em toda população. Todavia, trabalhar com todos os dados de uma
população é muito oneroso e exaustivo, por isso é comum retirar uma amostra aleatória e a partir dela fazer
análises que forneçam evidências amostrais suficientes para aceitar ou refutar a hipótese sobre a população
como um todo.
2. HIPÓTESES
3. TIPOS DE ERROS
Pelo fato de se trabalhar com resultados amostrais para se fazer inferência sobre uma população, o processo está
sujeito a erros, ou seja, pode-se tomar decisões corretas ou erradas, por exemplo:
O quadro abaixo resume bem as possibilidades de erros e acertos, para tanto considere que:
Realidade
H0 verdadeira H0 falsa
Decisão correta Erro do tipo II
Aceitar H0
(1-a) (b )
Decisão
Erro do tipo I Decisão correta
Rejeitar H0
(a ) (1-b)
Risco do produtor: risco associado à possibilidade de erro do tipo I, ou seja, quando um lote bom é rejeitado.
Risco do consumidor: risco associado à possibilidade de erro do tipo II, ou seja, quando um lote ruim é
aceito.
4. NÍVEL DE SIGNIFICÂNCIA
O nível de significância indica qual a probabilidade de erro se está disposto a aceitar, por exemplo, a = 1%,
significa que a probabilidade de aceitar o erro do tipo I é de 1%. Pela distribuição normal, uma área de 0,01 abaixo
da curva normal corresponde ao escore padrão de 2,58. Na prática, os valores mais adotados são:
a = 1% z = 2,58
a = 5% z = 1,64
5. ESTATÍSTICA DE TESTE
A estatística de teste é o cálculo do escore padrão que será usado para comparar com o nível de significância
determinado no problema. No entanto, há dois casos distintos para o cálculo da estatística de teste. Quando o
desvio padrão da população for conhecido usa-se a distribuição normal; quando o desvio padrão populacional for
desconhecido recomenda-se usar a distribuição t-Student, indicada para amostras menores ou iguais a 30.
onde: onde:
6. REGIÃO CRÍTICA
A região crítica é aquela onde os valores da estatística dos testes conduzem à rejeição da hipótese nula (H0). A
área delimitada por essa região é definida como o nível de significância e sua direção é a mesma da hipótese
alternativa (H1).
H 0 : µ = µ0 H 0 : µ = µ0 H 0 : µ = µ0
H1 : µ < µ 0 H1 : µ > µ 0 H1 : µ ≠ µ 0
Se o valor da estatística do teste cair dentro da região crítica deve-se rejeitar H0.
Ao rejeitar a hipótese nula (H0) existe uma forte evidência nos dados de sua falsidade.
Ao aceitar a hipótese nula (H0) não existe uma forte evidência amostral significativa para rejeitar H0.
1. Formulação de H0 e H1.
H 0 : µ = µ0
µ < µ0
H1 : µ > µ 0
µ ≠ µ
0
4. Comparação do valor teste, zcal ou tcal , com o valor tabelado, ztab ou ttab .
Exemplo 01 (Teste de significância para a média). Uma amostra aleatória de 100 registros de mortes em
Cabrobó da Serra durante o ano passado revelou uma expectativa de vida de 72 anos. Assumindo um desvio padrão
de 9 anos, isso parece indicar que a média da expectativa de vida hoje é maior do que 70 anos? Adote um nível de
significância de 0,05.
a) Defina as hipóteses:
f) Conclusão
Exemplo 02 (Teste de significância para a média). Um novo fabricante de Cabrobrolândia desenvolveu um novo
traço de concreto com carga de ruptura de 8 MPa com desvio padrão de 0,5 MPa. Teste a hipótese de que m = 8
MPa contra a alternativa de que m ≠ 8 MPa, se uma amostra aleatória de 50 vigas de concreto foi testada e
descobriu-se uma carga de ruptura de 7,8 MPa. Adote um nível de significância de 0,01.
a) Defina as hipóteses:
e) Conclusão
a) Defina as hipóteses:
e) Conclusão
9. TESTE DO QUI-QUADRADO
Até aqui temos estudado testes paramétricos, testes de hipóteses com relação a um parâmetro populacional ou a
comparação entre dois parâmetros. Todavia, há casos em que os testes não dependem de um parâmetro
populacional nem de suas estimativas. É nesse cenário que surge o teste do Qui-quadrado. Esse teste é usado
quando o objetivo é comparar freqüências observadas com freqüências esperadas e podem ser divididos em três
grupos:
Teste de adequação do ajustamento: indicado para verificar se as freqüências observadas concordam ou não
com as freqüências teóricas esperadas.
Teste de aderência: indicado quando se deseja testar a natureza da distribuição amostral, ou seja, verificar se
determinado conjunto de dados tem uma boa ou má aderência a um determinado modelo de distribuição de
probabilidade (normal, binomial, Poisson etc)
Teste de independência (tabela de contingência): indicado quando se deseja verificar a relação entre duas
ou mais variáveis de forma que as frequências observadas podem ser observadas através de uma tabela de
contingência.
1. Determina as hipóteses:
H 0 : F0 = Fe
H1 : F0 ≠ Fe
3. Calcule a estatística:
2
χ cal = ∑
2
k
( Fo − Fe )
i =1 Fe
6. Conclusão:
Se χ cal 2 ≤ χ tab 2 , aceita-se H 0 .
Se χ cal 2 > χ tab 2 , rejeita-se H 0 .
a) Defina as hipóteses:
b) Calcule a estatística:
2
k
χ cal 2 = ∑
( Fo − Fe )
i =1 Fe
χ tab 2 = χα ,ϕ 2
ϕ = k − 1 : quando as frequências esperadas podem ser calculadas sem as estimativas dos parâmetros
populacionais a partir das distribuições amostrais.
ϕ = k − 1 − m : quando para a determinação das frequências esperadas, m parâmetros tiverem suas
estimativas determinadas a partir das distribuições amostrais.
e) Conclusão
Exemplo 02 (Teste de independência – tabela de contingência). Cabrobó da Serra é uma cidade que tem
crescido bastante. No intuito de investigar se há relação entre o nível de renda e a escolaridade dos Cabroboenses,
Francisvaldo fez um censo a partir de uma amostra de 200 moradores, como mostra a tabela abaixo. Verifique se há
independência entre a renda e a escolaridade para um nível de significância de 1%.
Nível de escolaridade
Nível de renda
Fundamental Médio
Pobre 56 42
Rico 38 44
a) Defina as hipóteses:
b) Calcule a estatística:
2
k
( Fo − Fe )
χ cal 2 = ∑
i =1 Fe
( soma.da.linha.i )( soma.da.coluna. j )
Feij =
total.de.observações
ϕ = (l − 1)(c − 1) , onde l (linha) e c (coluna)
χ cal 2
C=
χ cal 2 + n
f) Conclusão
Questão 01 (Walpode, 2009). Uma indústria elétrica fabrica lâmpadas cuja vida útil tem distribuição
aproximadamente normal com média de 800 horas e desvio padrão de 40 horas. Teste a hipótese de que m = 800
horas contra a alternativa m ≠ 800 horas, se uma amostra aleatória de 30 lâmpadas tem média de vida de 768 horas
e determine o valor de a abaixo do qual a média não é significante.
Questão 02 (Walpode, 2009). Afirma-se que um automóvel é dirigido, em média, mais de 20.000 quilômetros por
ano. Para testar essa afirmação, uma amostra aleatória de 100 proprietários de automóveis registra os quilômetros
viajados. Você concordaria com essa afirmação, se esta amostra mostrasse uma média de 23.500 quilômetros e
desvio padrão de 3.900 quilômetros? Use um valor P em sua conclusão?
Questão 03 (Walpode, 2009). Em uma pesquisa feita na Escola de Medicina da Universidade da Califórnia,
afirmou-se que os ratos com média de vida de 32 meses viveriam por mais ou menos 40 meses se 40% das calorias
de suas refeições fossem substituídas por vitaminas e proteínas. Há alguma razão para acreditarmos que m< 40 se
64 ratos colocados sob essa dieta têm uma média de vida de 38 meses com desvio padrão de 5,8 meses? Use um
valor P em sua conclusão.
Questão 04 (Walpode, 2009). Teste a hipótese de que o conteúdo médio de recipientes de certo lubrificante é dez
litros, se os conteúdos de uma amostra aleatória de dez recipientes são 10,2; 10,1; 10,3; 10,1; 9,8; 9,9; 10,4; 10.3 e
9.8 litros. Use o nível de significância 0,01 e assuma que a distribuição dos conteúdos dos recipientes é normal.
Questão 05 (Walpode, 2009). A altura média de estudantes calouras do sexo feminino de certa universidade é
162,5 cm, com desvio padrão de 6,9 cm. Há alguma razão para acreditar que houve uma mudança na média das
alturas se uma amostra de 50 mulheres na atual classe de calouros tem altura média de 165,2 cm? Use um valor P
em sua conclusão. Assuma que o desvio padrão continua o mesmo.
Questão 06 (Lopes, 2003). Teste para α = 5% se há alguma relação entre as notas escolares e o salário.
Notas Escolares
Salário
Alta Baixa Média
Alto 18 5 17
Médio 26 16 38
Baixo 6 9 15
Questão 07 (Lopes, 2003). Com o objetivo de investigar a relação entre a situação do emprego no momento em
que se aprovou um empréstimo e se saber se o empréstimo está, agora, pago ou não, o gerente de uma financeira
selecionou ao acaso 100 clientes obtendo os resultados da tabela abaixo. Teste a hipótese nula de que a situação de
emprego e a de empréstimo são variáveis independentes, com α = 5% .
Situação de empregado
Estado atual do empréstimo
Empregado Desempregado
Em mora 10 8
Em dia 60 22
Questão 08 (Walpole, 2009). Em um experimento para estudar a relação entre hipertensão e o hábito de fumar, os
seguintes dados forma obtidos de 180 indivíduos. Teste a hipótese de que a presença ou ausência da hipertensão
depende dos hábitos relacionados ao fumo. Use um nível de significância de 0,05.
Questão 09 (Walpole, 2009). Uma amostra aleatória de 90 adultos é classificada de acordo com o gênero e o
número de horas que eles assistem à televisão durante a semana. Use o nível de significância de 0,01 e teste a
hipótese de que o tempo gasto com televisão é independente do gênero do telespectador.
Gênero
Masculino Feminino
Mais de 25 horas 15 29
Menos de 25 horas 27 19
Questão 10 (Walpole, 2009- adaptada). Um perito criminal conduziu uma investigação para determinar se a
incidência de certos tipos de crime varia de acordo com a região de uma cidade grande. Os tipos de crime de
interesse são: agressão, arrombamento, roubo e homicídio. A tabela a seguir mostra o número de crimes cometidos
em quatro áreas da cidade no ano passado. Pode-se concluir, com base nesses dados, num nível de significância de
0,01, que a ocorrência desses tipos de crime depende da área da cidade?
REFERÊNCIA BIBLIOGRÁFICA
GABARITO
Questão 01
z = -1,64 Questão 06
P = 0,10 Resposta: aceitar Ho
Questão 02 Questão 07
z = 8,97; sim, m >20.000 km; P = 0,001 Resposta: aceitar Ho
Questão 03 Questão 08
z = -2,76; sim, m <40 meses; P = 0,0029 Resposta: rejeitar Ho
Questão 04 Questão 09
t = 0,77; não rejeitar H0 Resposta: rejeitar Ho
Questão 05 Questão 10
Resposta: rejeitar Ho
z = 2,77; rejeitar H0 e concluir que m≠162,5.
“Porque Deus amou o tanto o mundo, que deu o seu único Filho, para que todo aquele que nele crer não morra,
mas tenha a vida eterna” João 3.16