Documente Academic
Documente Profesional
Documente Cultură
1 Para formular uma hipótese é preciso ter em consideração diversos aspectos, entre outros, os seguintes:
Os termos devem ser claros e concretos para dar o sentido operacional ao especificar as variáveis;
Ter uma referência empírica, pois sem ela é apenas um juízo de valor e a hipótese não poderá ser submetida
a verificação;
Devem ser específicas não apenas quanto ao problema, mas, em termos de indicadores para medir as
variáveis e manter a consistência entre fatos e as hipóteses;
Devem estar relacionadas com os recursos, as técnicas disponíveis e com o marco teórico da investigação.
2No procedimento geral de formulação e teste de uma hipótese são seguidos os seguintes passos:
Definir um problema no contexto de um sistema e, nesse contexto, identificar o parâmetro de interesse.
Especificar as hipóteses nula e alternativa apropriadas ao caso.
Escolher um nível de significância consistente com o problema e os objetivos da pesquisa.
Selecionar a estatística de teste adequada ou consistente com a realidade.
Fixar a região crítica do teste.
Escolher uma amostra e calcular o valor da estatística de teste.
Decidir, com base nos resultados do teste e o critério de decisão adotado, sobre a rejeição ou não de H0.
"nenhuma diferença" entre os grupos – formulada com o intuito de ser rejeitada, e a hipótese
alternativa (HA) qualquer hipótese que contrarie a HO, com a declaração desejada para concluir
como verdadeira ao rejeitar a hipótese nula. A ideia de se estabelecer uma hipótese nula é frequente
no raciocínio não-estatístico, como no caso de um processo criminal, onde o réu é suposto inocente
(Ho: o réu é inocente) até que se prove o contrário (HA: o réu é culpado).
Os exemplos que seguem ilustram a parte formal, e de maneira geral, relativa a formulação
de uma hipótese científica, isto é, de uma afirmação sobre a característica de um parâmetro da
população alvo de investigação, destacando-se a escolha da medida de comprimentos de uma peça,
em cada ação possível, de condições de aceitação com base na medida escolhida.
HO : 𝛼 = 6,0 𝑐𝑚
HA: 𝛼 ≠ 6,0 𝑐𝑚
É possível definir outras hipóteses:
HO : 𝛼 = 6,0 𝑐𝑚
1
HA : 𝛼 ≠ 6,0 𝑐𝑚
HO : 𝛼 = 6,0 𝑐𝑚
2
HA: 𝛼 > 6,0 𝑐𝑚
HO : 𝛼 = 6,0 𝑐𝑚
3
HA: 𝛼 < 6,0 𝑐𝑚
HO : 𝛼 = 6,0 cm
4
HO : 𝛼 = 6,5 𝑐𝑚
Em todos casos a HO é simples, enquanto as HA são compostas, 1, 2, e 3; casos como os das
situações 2 e 3 são chamados testes unilaterais.
Exemplo 1. Em um experimento se tem o interesse de adquirir um novo equipamento. Seja
𝜇𝑂 a média do desempenho do equipamento novo que poderá ser adquirido se for mais eficaz que
o equipamento em uso.
A formulação de hipótese nula 𝜇 = 𝜇𝑂 e a hipótese alternativa 𝜇 > 𝜇𝑂
HO : 𝜇 = 𝜇𝑂
HA : 𝜇 > 𝜇𝑂
O pesquisador, auxiliado pela regra de decisão, poderá distinguir entre as duas hipóteses, com
apoio no estimador de máxima verossimilhança do parâmetro, como, por exemplo, a média
aritmética 𝑋̅, e sempre baseado na hipótese alternativa HA.
Para tal propósito, define a região de rejeição ou região crítica (RC) cujo complemento é a
região de aceitação (RA). Se a média amostral for maior que o valor crítico XC há evidência para
assumir que a média da população é maior que 𝜇𝑂 . A figura que segue delimita a RC > XC que leva
a rejeitar a hipótese HO na região de rejeição.
Para cada tipo de hipótese se determina uma região de rejeição, sempre conforme a hipótese
HA.
A região crítica RC = {𝑋̅>XC2 ou 𝑋̅<XC1}, sendo XC1 e XC2 os valores críticos para o teste
bilateral:
Independente dos valores críticos utilizados para
Região de
aceitação determinar a região crítica, as decisões tomadas estão
sujeitas a erros; erros que podem ser de dois tipos
Região de
rejeição conforme se sintetizam no quadro que segue, ao rejeitar a
HO, quando ela é verdadeira (Erro tipo 1 ou ) e não
rejeitar a HO quando ela é falsa (Erro tipo II ou ):
XC1 𝜇𝑂 XC2
Aceitar HO Rejeitar HO
Se a hipótese HO for verdadeira e não rejeitada ou falsa e rejeitada, a decisão estará correta.
No entanto, se a hipótese HO for rejeitada sendo verdadeira (Erro tipo I), ou se não for rejeitada
sendo falsa (Erro tipo II), a decisão estará errada; a probabilidade de cometer o erro tipo I é denotada
pela letra (alfa); o segundo é chamado de Erro do Tipo II e a probabilidade de cometê-lo é
denotada pela letra grega . Tem-se:
Onde P é a probabilidade de que a estatística, como variável aleatória, tenha valor extremo
em relação ao observado (estatística) quando a hipótese HO é verdadeira. Ao considerar o teste
unilateral expresso pelas hipóteses:
HO : 𝜇 = 𝜇𝑂
HA : 𝜇 < 𝜇𝑂
A região de rejeição é determinada pelos seguintes valores críticos RC={𝑋̅ > XC2 ou 𝑋̅ < XC1},
sendo a interpretação dos erros expressa por:
= P(𝑋̅ < XC| = O
= P(𝑋̅ > XC| = O
O ideal seria que ambas probabilidades de e sejam próximas de zero; no entanto, o que
se registra é que a medida que se diminui o valor de , o valor de aumenta. Essa relação inversa
é ilustrada na seguinte figura:
-Z/2 0 Z/2
Os valores -Z/2 e Z/2 são as áreas à
esquerda e à direita, respectivamente, sob a curva normal padrão, com valor de /2
Considerando o teste unilateral à direita
HO : 𝜇 = 𝜇𝑂
HA : 𝜇 > 𝜇𝑂 Rejeição HO
Não Rejeição HO
0 Z
𝜇 < 𝜇𝑂 Z < - Z Z Z
𝜇 > 𝜇𝑂 Z > Z Z Z
Região de P valor
Região de Não rejeição de HO Rejeição
Não rejeição de HO P valor
Rejeição
Região de
Rejeição Região de
P valor P valor Rejeição
Região de
P valor Rejeição
0 Z Zobs 0 Zobs Z
Se o valor P for menor que o nível de significância considerado (), então Zobs está na região
crítica e, por tanto, será rejeitada a HO. Em outros sentido, se o valor de P for maior que o nível de
significância, não se rejeitará a HO. Além disso, quanto menor for o P valor, mais distante se estará
da hipótese nula. Dessa forma, o P – valor tem mais informações sobre a evidência contra HO e,
dessa forma, o experimento terá mais informações para decidir com o apropriado nível de
significância ().
O P valor pode ser interpretado como o menor valor do nível de significância para o qual se
rejeita HO; dessa forma, se o nível de significância () que se propõe para o teste for menor que o
P valor não se rejeitará a HO.
Por vezes, a região de rejeição de um teste com nível de significância apresenta a seguinte
forma:
Rejeitar HO se e somente se W(X) c
em que W(X) é a estatística do teste e c é a constante escolhida de modo que o teste tenha
nível de significância . O valor P para o ponto amostral x é definido:
𝑠𝑢𝑝
P(x) = P[W(X)W(X) C
em que é um parâmetro pertencente ao espaço paramétrico sob a hipótese nula HO.
No exemplo que segue se calcula o P valor do teste de médias; teste bilateral, no corpo da
tabela de distribuição normal:
P-valor = P[Z >|Zobs|] + P[Z< - |Zobs|] = P[Z>2,25] + P[Z < - 2.25]=0,0122+0,0122=0,0244
Região de
Aceitação 0,95
0,025 0,025
P|Z < - 2,25| P|Z < - 2,25|
Pode-se concluir que, para qualquer nível de significância maior que 0,0244, há evidências
para rejeitar a HO.
Exemplo 3. Um setor utiliza determinada peça importada que deve satisfazer certas
exigências técnicas. Uma delas é a resistência à tração; um atributo variável conforme cada país
que fabrica essa peça. Para determinados países se especifica (grupo A) a resistência é de 44,0 kg
com o desvio padrão de 1,2 kg. Para outros países (grupo B) a média é de 48,0 kg com desvio
padrão de 1,6 kg. Um lote de peças é oferecido com a resistência média calculada em 45,0 de uma
amostra de 25 peças. Qual é a previsão para tomar a decisão de origem das peças? O pais produtor
será aquele para o qual a média da amostra mais se aproxime da média da população, com a seguinte
regra de decisão:
Se 𝑥̅ 46,0 (o ponto médio entre 44,0 e 48,0 ), então, pode-se concluir que as peças tem
origem no grupo de países A; caso contrário, para 𝑥̅ > 46,0, as peças são do grupo B. A regra de
decisão é ilustrada como segue:
Países A B
𝑥̅ = 45,0
44,0 46,0 48,0 X
É possível errar na decisão com a média de 45,0 kg calculada de uma amostra de 25 peças ao
decidir que as peças são dos países A, podendo-se cometer dois tipos de erros:
Erro de tipo I: decidir as peças são de A quando na realidade são de B o que ocorre quando
uma amostra de 25 peças de B apresentar média inferior ou igual a 46,0 kg.
Erro de tipo II: decidir que as peças são de B, quando na realidade eles são de A. Isso ocorre
quando uma amostra de 25 peças de A apresenta média superior a 46,0 kg.
São definidas, para auxiliar a decisão, duas hipóteses:
HO: As peças são de origem B, isto é, a resistência de cada peça segue uma distribuição com
média = 44,0 e desvio padrão = 1,2.
H1: As peças são de origem A, isto é, a resistência das peças apresentam média = 48,0 e
desvio padrão = 1,6
Define-se a região crítica (RC) correspondente aos valores menores de 46,0 expressa pela
seguinte expressão:
RC = {y IR| y 46,0}
Expressão que permite calcular a probabilidade de se cometer cada um dos tipos de erros:
P (erro I) = P(𝑋̅ RC| HO é verdadeira) = .
P (erro II) = P(𝑋̅ ≠ RC| H1 é verdadeira) = .
Se HO for verdadeira, ou seja, as peças têm procedência de B, a média terá distribuição
aproximadamente normal, com média 48,0 e desvio padrão igual a 1,6⁄ = 0,32.
√25
𝑋̅ ≅ N (48,0 1,6), denotando por Z a variável:
P (erro I) = P(𝑋̅ RC| HO é verdadeira).
= P(𝑋̅ 46 || X ≅ N(48 1,6).
= P ( Z 46,0 − 48,0⁄0,24).
= P (Z - 2 / 0,24 = -8,33.
= P (Z - 8,33) =
De modo análogo, quando HA for a alternativa verdadeira, tem-se:
𝑋̅ ≅ N (44,0 1,2), denotando por Z a variável:
P (erro II) = P(𝑋̅ RC| H1 é verdadeira)
= P(𝑋̅ > 46
Exemplo 4. Um setor de uma indústria, como um dos componentes das máquinas que
produzem, utiliza uma peça importada que satisfaz determinadas exigências; uma delas é a
resistência à tração. As especificações do país A afirma que a resistência média à tração é de 145
kg, com desvio padrão de 12 kg; para o país B é de 155 kg e desvio padrão de 20 kg. É de interesse
conhecer a origem de peças misturadas a partir de uma amostra de 25 peças. Qual regra de decisão
deve ser usada para especificar se as peças são de pais A ou B? A possível regra de decisão seria:
Se 𝑥̅ ≤ 150 – o ponto médio entre 145 e155, então as peças são do país A, caso contrário,
isto é 𝑥̅ > 150, as peça são do pais B; esta regra de decisão (RD) é ilustrada na seguinte figura:
Foi obtida uma amostra de 25 peças com média de ̅𝑥 = 148 para escolher o pais de origem
das peças; nessa decisão é possível cometer dois tipos de erros, assim:
Erro de tipo I: dizer que as peças são de A quando na realidade são de B. Isso ocorre quando
uma amostra de 25 peças de B apresenta média 𝑥̅ inferior ou igual a 150 kg.
Erro de tipo II: dizer que as peças são de B, quando na realidade eles são de A. Isso ocorre
quando uma amostra de 25 peças de A apresenta média 𝑥̅ superior a 150 kg.
A definição das hipóteses:
HO: as peças são de origem B o que equivale a dizer que a resistência de cada peça segue uma
distribuição com média = 155 e desvio padrão = 20.
HA: as peças são de A, com média = 145 e desvio padrão = 12
A região crítica RC corresponde aos valores menores que 150, isto é:
RC = [y IR| y 150]
A probabilidade de se cometer cada um dos erros pode ser expressa por:
P(erro I) = P(𝑋̅ RC | HO é verdadeira =
P(erro II) = P(𝑋̅ RC | HA é verdadeira =
Se HO for verdadeira quando as peças forem de B, a vaiável 𝑋̅ terá distribuição
aproximadamente normal, com média 155 e desvio padrão igual a 20⁄ = 4, o que equivale:
√25
X N(155, 16)
Denotando por Z a vaiável aleatória com distribuição N(0, 1), tem-se:
P(erro I) = P (𝑋̅ RC| H0 é verdadeira
= P (𝑋̅ RC| 𝑋̅ N(155, 16)
= P ( Z 150 − 155⁄4 ) = P (Z - 1,24) = 0,10565 = 10,56% =
De forma similar, quando HA for a alternativa verdadeira, tem-se para a variável 𝑋̅
𝑋̅ N (145; 5,76)
P(erro II) = P(𝑋̅ RC| é verdadeira
= P(𝑋̅ > 150| 𝑋̅ N (145; 5,76)
= P ( Z 150 − 145⁄2,4 ) = P (Z > 2,08) = 0,01876 = 1,88%= .
As estimativas dos erros mostram, com a regra de decisão adotada, que se estará cometendo
o erro tipo I com maior probabilidade do que o erro tipo II; assim se estará privilegiando a afirmativa
de que as peças são de A. O resumo do teste H0: = 155, HA: = 145, com RC = [− ∞, 150].
Decisão
RC
Origem das peças 𝑋̅
150
A B
Erro tipo II
A Sem erro
= 1,88%
Erro tipo I
B Sem erro
= 10,56%
Se as peças forem de B e a amostra tiver média superior a 150 não se cometera erro; mas, se
média for inferior a 150, então as peças serão de A e se estará cometendo um erro de 10,56%
Em cada regra de decisão se for escolhido um valor 𝑥̅ c inferir a 150 as probabilidades de e
mudarão; se 𝑥̅ c for menor do que 150, observar-se-á diminuição de e aumento de , devendo
existir um ponto em que e sejam iguais; esse ponto é 𝑥̅ c = 148,75, em que = = 5,94.
Escolhido um valor de 𝑥̅ c se pode encontrar as probabilidades e de cometer cada tipo de
erro; mas, pode-se proceder de modo inverso: fixar um dos erros, como por exemplo, de , e
encontrar a regra de decisão correspondente à probabilidade de erro tipo I igual a . Assim, ao fixar
em 5%, a regra de decisão correspondente:
5% = P(erro I) = P(𝑋̅ 𝑥̅ c|𝑋̅ N(155, 16)
= P(Z 1,645)
Com a transformação para a normal padrão, tem-se:
𝑥̅ c−155
- 1,645 = -1,645 x 4 = 𝑥̅ c – 155; 𝑥̅ c = 148,42
4
Dessa forma, a regra de decisão será: se 𝑥̅ for inferior a 148,42, então o lote de peças é de A;
caso contrário é de B. Com essa regra de decisão, a probabilidade do erro tipo II será:
= P(erro II) = P(𝑋̅ > 148,42|𝑋̅ (145; 5,76)
P(Z > 1,435) = 7,93%, com a seguinte expressão gráfica dos erros de tipo I e II:
A
B
= 0,05 = 0,0793
𝑥̅ c
=145 -148,42 =155
RC
A decisão a tomar não é apenas entre duas possíveis populações, ainda que frequente, mas
com foco em uma população, conforme se ilustra com o mesmo exemplo 4, para o caso de peças
do país B. A hipótese que interessa é:
HO: as peças são de origem B ( = 155 e = 20)
Se não for verdadeira, a alternativa pode ser expressa como:
HA: as peças não são de origem B ( e desconhecidos)
Nessas condições não se pode especificar os parâmetros sob a hipótese alternativa HA; as
peças se não forem de origem B, poderão ser de outros países. A especificação da hipótese
alternativa depende do nível de informação que se tem do problema. Por exemplo, admite-se que a
indústria do país B seja a mais seja a mais desenvolvida. Neste caso, a hipótese alternativa seria:
HA: as peças não são de origem B ( < 155 e qualquer).
A melhor alternativa, diante as muitas hipótese, alternativas, é fixar , a probabilidade do
erro de tipo I (rejeitar H0 quando ela for verdadeira). Ao fixar = 0,5, e nesse caso a regra de
decisão depende da informação de H0:
Se 𝑥̅ for superior a 148,42, então o lote de peças é de origem B; caso contrário, não é de
origem B.
É possível reescrever as hipóteses, nessa situação, como segue:
H0: = 155
HA: < 155
O cálculo de β depende do valor de μ, que não é especificado; mas, é possível considerar a
seguinte e importante função.
A função característica de operação (função CO) do teste acima é definida como:
β(μ) = P(aceitar H0|μ) = P⎯(X > 148,42|μ).
Onde β(μ) é a probabilidade de aceitar H0 considerada como uma função de
Com frequência considera-se a função π (μ) = 1 – β (μ) – chamada função poder do teste, que
é a probabilidade de se rejeitar H0 como uma função de .
Admitindo-se como hipótese alternativa (não há razão para acreditar que a resistência média
das peças de B seja maior ou menor do que a de outros países).
HA: as peças não são de origem B (μ 155).
Agora, a regra de decisão deverá indicar dois pontos 𝑥̅ c1 e 𝑥̅ c2, tais que:
Se 𝑥̅ estiver entre esses dois pontos 𝑥̅ c1 e 𝑥̅ c2, se terão peças de origem B; se 𝑥̅ estiver fora do
intervalo, então não são de origem B.
Ao fixar , a probabilidade do erro I, existirão muitos valores que satisfazem a essa condição,
dando-se preferência às 𝑠𝑜𝑙𝑢çõ𝑒𝑠 𝑥̅ c1 e 𝑥̅ c2 simétricas em relação à média.
Ao fixar em 5%, tem-se:
0,05 = P(erro I) = P(𝑋̅ < 𝑥̅ c1 ou 𝑋̅ > 𝑥̅ c2| 𝑋̅ N(155, 16).
= P(Z < - 196 ou Z > 1,96.
- 1,96 = (𝑥̅ c1 – 155 / 4 e 𝑥̅ c1 = 147,16.
1,96 = (𝑥̅ c2 – 155 / 4 e 𝑥̅ c2 = 162,84.
Portanto, nesse caso, a região de rejeição da hipótese H0 está definida por:
RC = {𝑥̅ IR | 𝑥̅ < 147,16 ou 𝑥̅ > 162,84}.
Conforme apresentado acima, tem-se que, dependendo do nível de informação que se tem
do problema, podem-se ter regras de decisão unilaterais ou bilaterais.
Seja o caso de determinar qual de dois procedimentos ou meios, representados por Ci, é o
mais eficaz para atender o objetivo (O) de, por exemplo, aumento da produção (Q) proposto para
ser alcançado em determinado período de tempo.
Exemplo: Um experimento com o interesse em decidir se, por exemplo, o atributo tem, por
exemplo, o comprimento de 46 kg ou diferente de 35 kg. Os casos são ilustrados ( = média da
população):
HO: = 46 (teste simples)
HA: 38; (teste composto)
ou, ainda: HA: 46; HA: < 46: testes compostos unilaterais.
HA : = 50; teste simples.
A regra de decisão permite distinguir entre as duas hipóteses a partir do estimador de máxima
verossimilhança, isto é, do estimador com base em uma amostra que fornece a melhor informação
possível sobre um parâmetro desconhecido de interesse na população, do parâmetro sempre baseada
na hipótese HA.
O objetivo do teste estatístico de hipóteses é fornecer uma metodologia que permita constatar
se os dados amostrais trazem evidências que apoiem ou não a formulação da hipótese estatística.
Um exemplo hipotético, a partir de uma situação simples, permite ter uma ideia de teste de uma
hipótese.
H0: = 38,0
HA: 38,0
Seleção do teste; o teste é de média 3 da população [E(x) = ] com distribuição normal
[xN(, 2], variância conhecida e fixa [var(x) = 2]. 4
3
Trata-se do teste de t (Student). É um dos testes de hipótese mais frequente na pesquisa, utilizado para
fazer comparações de duas estimativas (comparações independentes ou ortogonais, isto é, quando cada
média aparece apenas em uma comparação) e obter inferências dos parâmetros da população (médias de
tratamentos, p. ex.), com base na análise de estimativas amostrais com são a média e o desvio-padrão.
4
Para estas condições (pressupostos) e quando H0 é verdadeiro, tem-se:
x N ( ,
2
)
n
Distribuição do teste; baseado no conhecimento acerca da média da população que se
supõe tem distribuição normal com variância conhecida, bem como na
representatividade da amostra dessa população, sabe-se, também, que a distribuição do
teste tem distribuição normal com média 0 e variância 1.
Em teoria existem muitos valores para o teste de t, um para cada amostra de 50
elementos. Na prática se obteve uma amostra para o teste e tomada de decisão.
Regra de decisão. O critério indica rejeitar a hipótese se o valor estimado da estatística
do teste se encontra na região de rejeição; será aceita a hipótese se o valor estiver na
região de aceitação, conforme mostra a Figura 25 e o Gráfico 38 para o caso ilustrado
no exemplo.
=1
=0
/2 /2
-2,01 2,01
Região de aceitação
Região (1 - ) Região
Rejeição Rejeição
36,8 38,0
t 1,10
59,2
50
Decisão estatística; com base na regra de decisão não se pode rejeitar a hipótese nula,
uma vez que a estimativa – 1,10 não se encontra na região de rejeição.
O valor estimado não é significativo ao nível de 5%, conclui-se, portanto, que o valor
médio de enzima de 36,80 se encontra dentro do padrão de concentração normal que
essa amostra apresenta.
5
As linhas de fronteiras ou os valores críticos compreendem conceitos importantes na decisão com o teste
de hipótese. Parte desses conceitos se refere ao nível de significância () e aos dois tipos de erros (ver
Quadro 34), relacionados com informações teóricas como segue:
= P(erro Tipo I) = P (Rejeitar H0| H0 é verdadeira)
= P(erro Tipo II) = P (Aceitar H0| H0 é falsa).
Supondo-se que x N(, 1), então x N(, 1 ) e
50
P( x 21,34) ou x 52,26 | 38 )
21,34 38,00 52,26 38,00
( ) 1 ( )
59,2 59,2
50 50
Com relação ao erro Tipo II, não se terá um único valor, mas, uma função; para cada valor da HA se calcula
um . Conhecer a probabilidade indicada por é importante para determinar a potência do teste, isto é, a
probabilidade de rejeitar H0 quando HA é verdadeira; essa probabilidade é dada pela expressão: 1- .
2.1 Propósito. Saber se é possível concluir que a estimativa da média da população da
qual se obteve a amostra é diferente de 120 unidades, valor indicado como referência
pela literatura pertinente para as condições “normais” desse tipo de experimento.
2.2 Procedimento. As hipóteses são definidas como (introdução dos conceitos de
hipótese nula, H0 e de hipótese alternativa, HA):
H0: = 120 9a
HA: 120 9b
2.3 Pressuposto: a estatística do teste segue a distribuição t de Student, com n-1 graus
de liberdade. A regra de decisão pode ser definida para um nível de significância de 5%
(; teste bilateral, portanto /2 = 2,50%).
2.4 Obtenção de dados. O procedimento para a coleta dos dados, com a sua
justificativa técnico-científica e operacional indicada no projeto.
A fundamentação do processo de decisão, no teste de hipótese (Figura 25 e Gráfico
37), é ilustrada com os seguintes exemplos.
Um pesquisador quer comparar a produtividade média de uma nova variedade de milho
( x NOVA ) com a produtividade média de uma variedade tradicional ( xTRAD ). Para esse fim,
define a seguinte hipótese de nulidade:
x NOVA xTRAD
H0:
x NOVA xTRAD 0 11
Numa pesquisa propõe-se testar uma nova droga (ND) para o tratamento de
determinado tipo de câncer. A referência se ilustra com base em pesquisa documental
de experiências anteriores. Nestas, os pacientes com esse tipo de câncer sobreviviam,
em média ( y ND ) 24,8 meses, com um desvio padrões de 28,2 meses.
Para testar se a nova droga aumenta a sobrevivência, o produto será testado numa
amostra de 80 pacientes com diagnósticos recentes; esses pacientes são monitorados
até o óbito e registrada a sobrevivência média, expressa por y ND .
A hipótese nula é:
y ND 28,20
H0: y 13
ND 28,20 0
HA: y ND 28,2 14
6 Ao tratar da lógica, o pesquisador deve-se lembrar que o conceito se refere às formas de argumentação
válidas, ao interesse de uma classe especial de inferência que, para o caso considerado no texto corresponde
à inferência estatística -coleta, síntese, análise e modelagem para uma população, a partir de uma amostra,
de uma hipótese científica. Nesse contexto é oportuno e necessário ter alguns cuidados para não chegar a
conclusões pseudocientíficas baseadas em falácias de “lógicas”, tais como as que incluem, entre outros
procedimentos:
Basear uma conclusão para a tomada de decisão em resultados gerados de amostras não representativas
da população objeto de estudo; o argumento que pretende justificar o valor de uma verdade de uma
asserção ou frase para afirmar ou negar algo contida na hipótese, não é consistente.
Omitir ou distorcer fatos que poderiam gerar outras conclusões.
Defender resultados e conclusões pela tentativa de “provar” que as outras estão erradas.
Pretender defender conclusões que não podem ser testadas com base em dados de uma realidade.
Em sentido estrito, essa lógica pode ser representada na formulação do problema de decisão,
em que a escolha racional, baseada na teoria de decisões, em geral, maximiza um valor esperado
de uma função de utilidade associada aos possíveis resultados dessa tomada.
Em sentido prático, a lógica se insere no contexto do problema geral e nos objetivos, conforme
se ilustra com o seguinte exemplo:
A teoria estatística fornece meios para minimizar o erro na tomada de decisão, (pré)-definido,
conforme seja a natureza do problema sintetizado pelo nível de significância ou . Esse nível
corresponde ao erro tipo I ( é a probabilidade de rejeitar H0 sendo tal hipótese verdadeira,
conforme ilustrado nos Quadro 34 e 37).
Decisão correta
Erro do tipo I ( ): Continua com a
tecnologia tradicional e com a poupança Continua com a tecnologia tradicional e
com a poupança
DECISÃO
Aceitar H0
Exemplo 1.
A especificação do peso médio padrão do produto (...) é de 8,0g, com um valor de
variação (c) de 0,5g para o nível crítico. Admite-se que a amostra de 10 elementos
provém de uma distribuição normal com variância fixa e conhecida [em sua forma
reduzida é N(0, 1)].
Portanto, a região crítica, com este pressuposto, é x < 7,5 (8,0 – 0,5) e x > 8,5 (8,0 +
0,5).
O nível de significância é definido por:
P( x < 7,5 ou x > 8,5 | =8,0)
7,5 8,0 8,5 8,0
= ( ) ( ) 0,114 11,4%
1 0,1
10
H0: = 8,0
HA: 8.
Neste caso a região crítica bilateral, em que o nível de significância se divide em dois,
é definida por: x < (8,0 – c) ou x < (8,0 + c).
Esta situação poderá indicar certo equilíbrio ou compromisso entre consumidor e
fabricante desse produto (Figura 25).
Como o pesquisador se orienta para definir suas hipóteses nula e alternativa? As seguintes
regras empíricas ou procedimentos práticos sintetizam parte dessa orientação (DANIEL 1999; p.
247; adequado ao texto):
a) Sempre, as referências de orientação são: o problema de pesquisa, os objetivos e as conclusões
que se espera gerar como resultado do teste de hipótese. Neste sentido, se o que interessa na
pesquisa não é a diferença ( R), mas, se é menor ( < R) ou maior ( < R), então, esse
interesse será a orientação a seguir na definição da hipótese.
b) As hipóteses nulas (H0) devem conter proposições de igualdade ou desigualdade (=, ou );
no caso das desigualdades, implica que consta de um número infinito de hipóteses.
O teste de hipótese se faz no ponto da igualdade, uma vez que se for possível mostrar a rejeição
de H0 em um ponto do limite, em qualquer outro se mantém o resultado.
c) A H0 é a proposição que deve ser testada a partir da definição de uma hipótese alternativa
(HA); essa definição é feita com base em dados da realidade objeto de estudo.
d) As H0 e HA são complementares contendo, com detalhes, todos os possíveis valores que os
parâmetros – funções de valores da população e suas estimativas ou estatísticas-funções de
valores amostrais, possam assumir.
Conforme apresentado nestas Orientações (...), o resultado de um teste de hipótese não é
definitivo nem absoluto. Assim aceitar H0 indica que esta é apoiada nos dados, sem a interpretação
de ser “verdadeira”, mas, que pode ser aceita (pode ser verdadeira) dado um conjunto de condições
da realidade, do processo (p. ex., erros e probabilidades admitidas) e dos objetivos do estudo. Dessa
forma, aceitar H0 implica ter presente esse conjunto de limitações ou de circunstâncias, sem que tal
aceitação implique demonstração (DANIEL, op. cit.; p. 248).
A parte que segue apresenta outros exemplos e discussões de aspectos teóricos aplicados nesses
exemplos.
Exemplo 2.
Numa pesquisa de mercado a variável x representa o peso de um pacote de (...), suposta com
a distribuição normal [(N(, 1)]. O processo está definido para = 500g. Numa amostra
aleatória de 25 pacotes se registrou x = 528g. Quer-se saber, ao nível de significância de 5%,
se o processo está afinado (está sob o controle da qualidade).
H0: x0 = 500g.
HA: x0 500g.
Nível de significância () = 5%. Número de elementos da amostra (n) = 25.
A estatística de teste é:
x x0 528 500
Zˆ 140
1 1
n 25
Para = 0,05 (teste bilateral: = 0,025), no corpo da tabela normal reduzida Z se
2
tem o valor 1,96; portanto a região de rejeição será Z < -1,96 ou Z > 1,96. Sendo o valor
estimado Z ( Ẑ ) de 140, maior que a referência na tabela normal reduzida (1,96), então,
rejeita-se H0, contra HA: x0 500g ao nível de 5%; significa que, com base nessa
amostra e o nível de significância, há evidência de que o processo de empacotamento
não está conforme o critério de qualidade que se segue ao defini-lo pelo valor de x0.
Em termos gerais, não seria rejeitada H0 se qualquer valor calculado no teste estiver
contido no intervalo definido entre 527,61 e 528,39. Esse intervalo de confiança 7 não
compreende o valor (critério de qualidade) especificado para o peso médio dos pacotes
de 500g.
Um dos pressuposto do teste aplicado acima é em relação à variância: conhecida e fixa.
Entretanto, a aplicação do teste pode ser feita nos casos de não se conhecer a variância
da população, mas esta pode ser estimada desde que a amostra seja grande (n > 30
elementos).
Exemplo 3
Em um experimento foram coletados dados de dois tratamentos. Deseja-se saber se as
médias dessas duas populações amostradas para esses tratamentos são diferentes.
Admite-se (são os pressupostos da técnic) que as populações da qual foram obtidas as
amostras (amostragem aleatória) têm distribuições normais e são independentes:
7
Não se rejeita a H0 se, e somente se:
x0 a x x0 a
n n
xa x0 x a
n n
em que x0 é o critério de referência da população (no exemplo, o valor 500g) e a é o valor da tabela Z para
o nível de significância pré-estabelecido na pesquisa.
x2 = 99 unidades / ml; s2 = 29 unidades / ml.
n2 = 21.
O critério de decisão é de 5%.
As hipóteses são:
H0: 1 = 2 ou 1 - 2 = 0.
HA: 1 2.
A estatística que o pesquisador poderá utilizar para este teste, 8 com uma amostra
considerada grande, tem distribuição t de Student com (n1 + n2 – 2) graus de liberdade.
Para 35 graus de liberdade (16 + 21 – 2) e = 0,05 (teste bilateral), o valor de referência
na tabela t é de 2,0301. Receitar-se-á H0 a menos que: - 2,0301 < t calculado < 2,0301.
Neste exemplo não se conhecem as variâncias das populações, porém se assume que
sejam iguais; isto, apesar das estimativas, a partir de amostras diferentes, apresentar
resultados diferentes. Dessa forma é necessário determinar uma variância “ajustada”,
sp assim:
15 (32) 2 20 (29) 2
s
2
919,43
15 20
Com a estimativa sp se calcula a estatística t :
(118,00 99,00) 0
t 1,89
919,43 919,43
16 21
A estimativa do teste t não permite rejeitar a H0 porque seu valor se encontra na região
de aceitação: - 2,0301 < 1,89 < 2,0301. Isto significa que estatisticamente as médias
desses experimentos são iguais.
8
A estatística para comparação de médias de duas populações independentes e distribuição normal é
definida por:
( x 1 x 2 ) ( 1 2 ) x1 x 2
t
2 2
s s 1 1
sp
n1 n2 n1 n
( n 1 1)s 12 ( n 2 1)s 22
em que : s p
n1 n 2 2
Exemplo 4
No exemplo que segue não é possível assumir que as variâncias sejam iguais, além de
elas não serem conhecidas.
O pesquisador está interessado em saber se duas populações amostráveis diferem com
respeito ao valor médio de (...).
Para tal propósito são obtidas duas amostras com as seguintes estimativas:
x 1 = 56,5 (...). s1 = 16,7 (...). n1 = 20.
x 2 = 42,9 (...). s2 = 11,6 (...).n2 = 14.
As hipóteses nula e alternativa são:
9
O teste de hipótese para diferenças entre pares é definido:
d d
t
sd
em que, d é a diferença entre os pares e s d s d n é o erro padrão da diferença. Aceitar H0 significa
admitir que a variável tem distribuição t de Student, com n - 1 graus de liberdade.
que possam acusar diferenças estranhas (ao experimento, à pesquisa) na comparação de duas séries
de dados dispostas em pares homogêneos (p. ex., por sexo, por idade, por origem, por estado etc.)
apenas evidenciado a causa de variação, em lugar de fazer a análise com os dados individuais.
Exemplo 5
Numa amostra de 14 pessoas foi registrada a concentração de colesterol antes e depois de
um programa de exercícios e dietas (...) com os resultados apresentados na Tabela 10.
Variância s 2d 690,90
Com esses dados se pode concluir que o programa de exercício e dietas é eficiente (para
o cliente)?
(d d ) 2 n 11 d i2 (i 1 d i ) 2
n n n
i
s 2
d
n 1 n (n 1)
Em termos de hipótese se pode inferir que o programa oferece suficiente evidência se
for possível rejeitar a H0; esta mostra que a mudança na concentração é zero ou positiva,
portanto, especificada como:
H0: d 0
Com a hipótese alternativa:
HA: d < 0
A regra de decisão para = 5% e 13 graus de liberdade tem como referência o valor
crítico de t = 1,7709 (teste unilateral). Portanto, rejeita-se H0 se o valor calculado de t
for menor que o valor crítico (Figura 28).
-0,41
=5%
A estimativa do teste de t é:
10,86 0
t 0,41
690,90
A decisão estatística é de aceitar a H0 uma vez que o valor estimado de t se encontra na
região de aceitação. Isto significa que o programa, com seus exercícios e dietas, não
tem efeito significativo, ao nível de 95% de confiança, na redução da concentração de
colesterol.
Exemplo 6
Um pesquisador deseja verificar se há aassociação entre três grupos (A, p. ex. classe
alta; B, classe média e C, classe pobre) de jovens (...) com relação ao uso de drogas.
Para tal proposito entrevistou 160 pessoas, sendo 41 do grupo A, 44 do grupo B e 75
10
O teste qui-quadrado é definido pela seguinte expressão:
(O i E i ) 2
2 i 1
n
Ei
do grupo C, admitindo-se apenas duas respostas: sim (é dependente) ou não (não é
dependente do uso de drogas).
Os resultados dessa entrevista são apresentados na Tabela 11. Na pesquisa há um
número diferente de entrevistados nos três grupos sociais, bem como proporções
diferentes dos dependêntes e não-dependentes do uso de droga.
Os dados são do tipo categórico pois, cada jovem entrevistado é classificado em apenas
uma categoria.
Neste exemplo, pode-se usar o teste do 2 com duas hipóteses:
H0: não há associação entre o nível social representado por esses três grupos e a
dependência do uso de droga.
HA: há associação entre o nivel social e a dependência do uso de droga.
Tabela 12 Resultados da entrevista de três gupos sociais com relação a dependência do uso de
drogas.
GRUPO A GRUPO B GRUPO C TOTAL
Oi 18 16 20
SIM 54
Ei 13,84 14,85 25,31
Oi 23 28 55
NÃO 106
Ei 27,16 29,15 49,69
TOTAL 41 44 75 160
A estimativa da freqüência esperada (Ei) de cada célula é o resultado da multiplicação
do total de sua coluna (Tc) pelo total de sua linha (Tl), dividido pelo total geral (N).
b) Calcular a estaística do 2 conforme se indica a seguir (ver nota de rodapé 10; a
fórmula para este cálculo):
11
Ilustração da distribuição e síntese da Tabela do2:
P(2 n’, a) = 1 -
n 2 2
2 2 2
’ 0,90 0,95
0,975
0,99
0,995
1 2,706 3,841 5,024 6,635 7,879
2 4,605 5,991 7,378 9,210 10,597
3 6,241 7,815 9,348 11,345 12,838
4 7,779 9,488 11,143 13,277 14,860
5 9,236 11,070 12,832 15,086 16,750
6 10,645 12,592 14,449 16,812 18,549
7 12,017 14,067 16,013 18,475 20,278
8 13,362 15,507 17,535 20,090 21,955
9 14,684 16,919 19,023 21,666 23,589
10 15,987 18,307 20,483 23,209 25,188
... ... ... ... ... ...
20 28,412 31,410 34,170 37,566 39,997
... ... ... ... ...
40 51,805 55,758 59,342 63,691 66,766
O valor estimado do 2 está na aréa de acietação, portanto não se rejeita a H0,
concluindo-se que nas populações representadas pelos grupos estudados não há
associação entre o nível social e a dependência do uso de droga.
Deve-se observar que caso 20% ou mais das células apresentem freqüências esperadas
menores que 5 ou se tenha uma ou mais freqüências esperadas com valores menores ou
igual a um (1), não se dve usar o teste do 2.
Uma possível solução é o agrupamento de linhas e colunas, desde que tal processo tenha
sentido.
A parte que segue ilustra a aplicação do teste do 2 para algumas situações especiais
como tabelas 2 x 2, n x 2 e m x n, em que o procedimento é simplificado.
Quando os dados são apresentados em tabelas de duas linhas por duas colunas podem
ser utilizadas fórmulas simplificadas em que apenas se requerem das freqüências
observadas.
Neste caso há duas possibilidades: quando N > 40 e para 20 N 40. 12
Exemplo 7
A tabela de contingência que segue (Tabela 13) sintetiza os dados de experimento
com (...).
12
Para facilitar o entendimento das fórmulas do 2 se apresenta o quadro com os seguintes símbolos:
Grupo A Grupo B Total
Grupo C a b T1
Grupo D C D T2
Total T3 T4 N
2 (ad bc)2 N
χN 40 T 1.T 2.T 3.T 4
[| a.d b.c | N ]
χ220N 40 2
T 1.T 2.T 3.T 4
6 10 16
Doente
(c) (d) (T2)
13 18 31
Total
(T3) (T4) (N)
As hipóteses são:
H0: a proporção de animais (...) acometidospela doença (...) é igual entre entre os dois
grupos;
HA: essa proporção é diferente.
A estimativa do teste de 2, de acordo com a fórmula indicada na npota de rodapé 11,
é
[ | (7 x10) (8 x 6) | 31 ]2 x 31
2
χ 2 0,023
15 x16 x13 x18
Exemplo 8
O lançamento de um dado 1000 vezes gerou a seguinte tabela de freqüência (Tabela
11). Deseja-se saber se o dado utilizado nesse experimento é um “dado perfeito”, isto
é, cada lado tem a mesma probabilidade de ocorrência.
As hipóteses são:
H0: P (x = i) = 1 6 , para i = 1, 2... 6.
Para o caso de H0 ser aceita a probabilidade de cada valor ou classe é representada por
pi e o valor esperado para o número da observação em cada classe é Ei = n pi (n é o
tamanho da amostra, neste exemplo, 1000). Com estas informações se elabora a Tabela
12:
Tabela 12 Resultado do lançamento de um dado 1000 vezes e valores esperados.
Xi Oi pi Ei=npi
1 176 1 166,67
6
2 174 1 166,67
6
3 168 1 166,67
6
4 171 1 166,67
6
5 151 1 166,67
6
6 160 1 166,67
6
Em geral os valores das colunas 2a (Oi) e 4a. (Ei), mesmo quando se aceita H0 não serão
os mesmos. É necessário medir o afastamento entre essas duas colunas e saber até que
ponto é razoável para se aceitar H0.
Isto significa que Xi 2k--1, em que k é o número de classes (neste caso 6) e é o
número de parâmetros estimados (no exemplo 0).
A região de rejeição é definida para 2 > a, em que a é dado por: P(2 > a) = .
Deve-se rejeitar H0 se o valor observado de 2 for muito alto, dentro da região crítica.
A Tabela 13 sintetiza as operações para estimar o 2
Tabela 13 Resultado do lançamento de um dado 1000 vezes, valores esperados e teste de 2.
Xi Oi pi Ei=npi (Oi-Ei)2/Ei
1 176 1
6
166,67 0,416
2 174 1
6
166,67 0,322
3 168 1 166,67 0,011
6
Exemplo 7
As hipóteses são:
nível de significância () e graus de liberdade do numerador (n’1) e denominador (n’2), aceitando-
se a hipótese nula: não há diferença entre as médias, quando F̂ for inferior a F .
O documento deve trazer a informação necessária das implicações de aceitar a hipótese de
nulidade.
Se o valor da estimativa do teste for maior que o da tabela de referência, ao nível de significância
estabelecido (), existe evidência contra (rejeição) a hipótese de nulidade.
O pesquisador deve indicar quais são as médias que apresentarão diferenças, utilizando testes
específicos.
Entre os testes de hipóteses que, conforme seja a natureza do problema de pesquisa, poderão ser
utilizados na pesquisa, têm-se:
a) Antes de fazer o teste, o pesquisador estabelece qual é o nível de significância.
b) Teste de Tukey baseado na amplitude total estudentizada.
Esta classe de teste deve ser utilizada na pesquisa quando se pretende fazer comparações
múltiplas de todo e qualquer contraste entre duas médias.
Deve ser utilizado quando o número de observações for o mesmo em todos os “tratamentos”
ou estimativas de médias.
c) Teste de Duncan, baseado na amplitude múltipla.
Este teste se aplica quando se requer fazer comparações múltiplas com amostras e número de
tratamentos consideráveis (p. ex., maior que 6) e em que o teste de análise de variância não é
significativo, em termos estatísticos.
d) Comparações ortogonais. Semelhante ao teste de comparações independentes, porém com
comparações planejadas e com uma forma especial de aplicação da análise de variância.
e) Tabela de contingência utilizada quando é prevista no projeto a coleta simultânea de duas
(ou mais variáveis) variáveis e se deseja testar a hipótese que as frequências de ocorrências
nas várias categorias de uma variável são independentes das frequências na segunda (outra)
variável.
Os exemplos que seguem ilustram o conceito de hipótese, a técnica de teste e aspectos gerais
de interpretação com as técnicas auxiliares na tomada de discussão.
Apresentam-se vários casos ilustrativos de como obter inferências acerca dos parâmetros da
população mediante o exame das estimativas amostrais desses parâmetros.
Exemplo 1
De um experimento foram registrados os seguintes valores de mudança de peso (kg):
xi: -1,8, -1,8, -1,4, -0,4, -1,2, -0,9, 0,2, 0,7, 0,9, 1,7;
n = 10; = 10.
As hipóteses são:
H0: = 0 kg; ( é o parâmetro)
HA: 0 kg.
Solução:
10
x
i 1
i
n = - 0,40
10
s ( xi x ) 2 /( n 1)
2
i 1
s = 1,22
= sx 1,22 0,39
10
n´= n – 1 = 10 – 1 = 9
IC x t n´, s x
- 0,401,83 (0,39) = -0,400,714
Linf.= -1,114 (limite inferior)
Lsup.=0,314 (limite superior)
Exemplo 2
Um comerciante deseja decidir se deve aceitar ou não um determinado produto. Está
disposto a aceitá-lo se pelos menos 80% deles satisfazem certas características do
“controle de qualidade” que se aplica ao mesmo.
Para tomar tal decisão com base em critérios científicos, extrai uma amostra de 10
exemplares que são submetidos ao teste (medições) e sobre tais resultados decide. Esse
processo pode ser visto como um experimento binomial com n = 10 provas
independentes, em que determinado exemplar selecionado ao acaso e que compõem o
lote da amostra satisfaz ou não as especificações desejadas.
A hipótese nula a ser testada, neste cenário, é:
H0: p = 0,80
A regra de decisão é aceitar H0, desde que o número de exemplares aceitáveis pelo
controle da qualidade seja pelo menos 7. Neste caso, qual é a probabilidade de rejeitar
H0 quando for verdadeira? Qual é, qual é a probabilidade ( p ) de cometer um erro do
tipo I ou a probabilidade de que x seja menor do que 7, dado que p = 0,8 numa amostra
de 10 elementos.
Em termos simbólicos o problema pode ser sintetizado como segue:
Neste caso, a probabilidade de um erro do tipo I para o novo critério de decisão, é dada pela
expressão:
Exemplo 3
Uma pesquisa deve considerar certa população, com 85% de famílias. Selecionar uma
amostra de 12 famílias para fazer uma entrevista por telefono, com três possibilidades:
a) encontrar a alguém em caso de entre 7 famílias selecionadas;
b) encontrar a alguém em casa de entre 5 famílias ou menos selecionadas;
c) encontrar a alguém em caso de 8 ou mais famílias selecionadas para o estudo.
Solução:
Se em 15% das famílias não se encontra a ninguém em casa, qual é a probabilidade de
que a entrevista não obtenha resposta em cinco de 12 chamadas? Em termos simbólicos
e para o primeiro caso, o problema se reduz a:
p(x 5) - p(x 4)
1 – 0,9993 = 0,0007
Exemplo 4
Hipótese para duas amostras com o critério bi-caudal. Os pesos registrados em dois processos
produtivos. O interesse da pesquisa é verificar se há diferenças entre os dois processos,
definidos pelas seguintes séries de dados:
xi: 41, 34, 36, 40, 25, 31, 37, 34, 30, 38
n = 11; n´ = 10.
yi: 52, 57, 62, 55, 64, 57, 56, 55;
n = 8; n´ = 7.
H0: x - y = 0 ou x = y
HA: x y
mx = 34,45
my = 57,25
mx m y
t
s x y
t 34,45 57,25 11,40
2
A referência, na tabela t, para n´x + n´y graus de liverdade (17) e o nível de significância
de 5% () é 2,11; portanto, rejeita-se H0.
Exemplo 4
Ilustra e a aplicação de outro teste estatístico, com novos conceitos da inferência. Trata-se
da estatística de Tukey. A técnica consiste em situar as médias em ordem decrescente e
calcular todas as diferenças, conforme se ilustra com o exemplo da Tabela 10.
Tabela 10 Disposição dos dados ordenados para estimar as diferenças entre medias pelo teste de
Tukey.
TRAT.
MÉDIA
x A xi xC x j xD xB
(n=10)
A 3,71 0,07 NS 0,23* 0,27*
C 3,67 0,27* 0,50*
D 3,44 0,54*
W=0,13
B 3,17
NS = diferença que não é significativa ao nível . * é significativa.
Na Tabela de referência do teste de Tukey para o nível de significância de 5%, p. ex., e
4 tratamentos e 36 graus de liberdade do resíduo (n-1=9; 9 x 4 = 36), encontra-se o
valor 3,79 (q) que será utilizado na seguinte fórmula do teste Tukey:
= W q ( tratamentos ,n ) s x 3,79
0,18 = 0,134
10
Tratamento A C D B
Médias 3,71 3,67 3,44 3,17
Relativo 117,03 115,77 108,52 100,00
A amostra está composta (n) por 10 elementos, o teste é o de Student ( t ) para uma
hipótese bicaudal, concernente à média aritmética, com os seguintes dados de variação de
peso registrados num experimento da pesquisa:
s x 1,18
10 0,37 (estimativa do erro da média).
A estimativa de t, dada pela seguinte expressão, é:
tabela, aceita-se a hipótese nula (H0), admitindo-se que a média é zero. Se a estimativa
da média é zero não faz sentido calcular um intervalo para essa medida. Contudo, se
for feito esse cálculo, a média estará num intervalo em torno de zero, conforme se
constata a seguir:
O intervalo de confiança ( IC ) para a estimativa da média é dados pela seguinte
expressão:
14
A ilustração que segue apresenta uma síntese da tabela de valores unicaudais dos percentis da distribuição t de Student
n´ = GL t80 t90 t95 t99
2 1,061 1,886 2,920 6,965
4 0,914 1,533 2,132 3,747
6 0,906 1,440 1,943 3,143
8 0,889 1,397 1,859 2,896
10 0,879 1,372 1,812 2,764
15 0,866 1,341 1,753 2,602
20 0,860 1,325 1,724 2,528
30 0,854 1,310 1,697 2,457
40 0,854 1,303 1,684 2,423
50 0,849 1,290 1,676 2,403
100 0,845 1,290 1,660 2,364
0,842 1,282 1,655 2,326
IC x t ( 2) s x
Esta expressão define dois limites: um limite inferior ( LI ) e outro superior ( LS ) para
determinado nível de significância, com os seguintes valores:
0,40 0,84
Os dados, para este segundo exemplo, são de uma amostra de ganho de peso, com as
seguintes estimativas:
s x 0,56
12 = 0,16
t x 0,78
sx 0,16 = 4,87**
t 0,05(1), 11 = 1,79
Para este resultado do teste se rejeita a hipótese nula, sendo o intervalo definido por:
LI = 0,50
LS = 1,06