Documente Academic
Documente Profesional
Documente Cultură
E ESTATSTICA
Toledo - 2015
PARTE I
Introduo Estatstica
A estatstica um processo que permite a anlise e a interpretao de dados
provenientes de uma ou mais amostras, com o objetivo de inferir caractersticas de
populaes. Sendo aplicvel a qualquer ramo do conhecimento onde se manipulam
dados experimentais.
1. O Crescimento e o Desenvolvimento da Estatstica Moderna
Historicamente, o crescimento e o desenvolvimento da estatstica moderna podem
ser relacionados a trs fenmenos isolados a necessidade do governo de coletar dados
sobre os cidades, o desenvolvimento da teoria da probabilidade e o advento da
informtica.
Dados tm sido coletados atravs de toda a histria. Nas civilizaes Egpcias,
Grega e Romana, dados primrios eram coletados com propsito de taxaes e
finalidades militares. Na idade Mdia, igrejas registram dados e informaes sobre
nascimentos, mortes e casamentos. Nos Estados Unidos, a Constituio de 1790
determinava a realizao de censo a cada 10 anos. Atualmente, informaes numricas
so necessrias para cidades e organizaes de qualquer natureza, e de qualquer parte
do globo.
2. Estatstica Descritiva versus Inferncia Estatstica
A estatstica pode ser dividida em duas partes:
2.1 - Estatstica Descritiva
Ocupa-se da organizao, sumarizao e descrio de um conjunto de dados.
Esta anlise serve como um primeiro guia ao pesquisador, fornecendo informaes
sobre a qualidade de seus dados e indicando algumas tendncias (se existirem) e, em
geral, no tem um fim em si prpria, exceto o caso do censo.
2.2 - Estatstica Inferencial
uma etapa da estatstica que cuida da coleta, reduo, anlise, modelagem e
interpretao dos dados.
O objetivo da estatstica inferencial (ou indutiva) o de tirar concluses com
base nos resultados observados em amostras extradas dessas populaes.
O prprio termo indutiva decorre da existncia de um processo de induo,
isto , um processo de raciocnio e que partindo-se do conhecimento de uma parte,
procura-se tirar concluses sobre a realidade no todo.
3. Pesquisa Estatstica
Pesquisa um conjunto de atividades orientadas para a busca de um
determinado conhecimento. Para merecer qualificativo de cientfica a pesquisa deve ser
feita de modo sistematizada, utilizando para isto mtodos prprios e tcnicas especfica.
A pesquisa cientfica se distingue de outras modalidades quaisquer de pesquisa pelo
mtodo, pela tcnica, por estar voltada para a realidade emprica e pela forma de
comunicar o conhecimento.
populao
amostra
Tratamento
dos dados
inferncia
Cada uma essas passagens merece um estudo aprofundado e tem caractersticas
prprias.
3.3.1 - Populao
o conjunto de interesse final para a pesquisa. Em geral o conjunto do qual a
amostra retirada.
3.3.2 - Amostra
Chamaremos de amostra qualquer subconjunto da populao de interesse, quer
os dados tenham sido coletados de um estudo observacional, quer sejam provenientes de
um experimento realizado sob certas condies de controle.
3.3.3 - Tratamento dos Dados
Conjunto de tcnicas usadas para descrever os dados observados.
3.3.4 - Inferncia
Conjunto de mtodos que permitem inferir o comportamento de uma populao
a partir do conhecimento da amostra
3.3.5 - Clculo de Probabilidade
Teoria matemtica que deduz a partir de um modelo, as propriedades de um
fenmeno aleatrio.
Terminologia Estatstica
Populao
Amostra
Unidade experimental
Quantitativa
s
Qualitativas
Nominais
Ordinais
Discretas
Contnua
PARTE II
Tcnicas De Amostragem
POPULAO
Erro!
1. Amostra Aleatria
N o nmero de indivduos da populao (N conhecido ou desconhecido)
Os problemas de amostragem so:
1) Como coletar a amostra?
2) Quanto vale n?
3) Tcnica de amostragem a ser utilizada?
O elemento fundamental em Estatstica a estimativa. Isto , em uma
pesquisa muitas vezes h a necessidade de se fazer previses: Luis Incio Lula da Silva,
vai ganhar a eleio com uma margem de 2,5% de erro; a inflao do ms que vem deve
chegar aos 17%. Em quase todos os casos, a estimativa est associada a uma pesquisa
ou a uma verificao de caractersticas, que devido custos acessveis com resultados
satisfatrios, no realizada sobre todos os elementos da populao, mas sim sobre uma
parte dela, chamada de amostra. Assim, um dos objetivos da estatstica tirar
concluses sobre o todo (populao) a partir das informaes fornecidas por parte
representativa do todo (amostra). Assim, realizadas as fases de descrio dos dados.
(estatstica descritiva), feita uma anlise dos resultados, obtidos atravs dos mtodos
da Estatstica Inferencial ou Indutiva, que tem por base a induo, inferncia de dados
com induo da preciso, obtida por meio da teoria da probabilidade.
Quanto mais se conhecer sobre a populao, melhores sero as informaes
colhidas pela observao de uma amostra. Por exemplo, uma cozinheira para verificar
se o ensopado que ela est preparando tem ou no uma quantidade de sal desejada,
experimenta apenas uma colher de ensopado, pois se sabe que a distribuio do sal em
todo o ensopado homognea, e de qualquer lugar que se tivesse retirado a amostra do
ensopado, ela seria representativa. Mas nem sempre a escolha de uma amostra
representativa imediata. A maneira de se escolher os elementos para compor uma
amostra denominada Amostragem.
Menor custo;
Menor tempo;
Maior amplitude do universo;
Menor erro da medida.
Exerccio:
N = 20 alunos de uma turma da FAG
n = 7 alunos escolhidos aleatoriamente (amostra)
1 2 3 4 5 6 7 Amostra 1
Amostra 2
muitas vezes no podemos avaliar de antemo o desvio padro da varivel nos diversos
estratos.
RESUMO:
utilizada quando existir diferenas (populao heterognea) entre diversas partes
da populao.
Essas diferenas denominaro os estratos.
MTODOS DE ESCOLHA
1) Determinamos o tamanho da populao N;
2) Definimos:
We = Ne
N
Onde:
N o tamanho da populao;
Ne tamanho do estrato;
We a proporo de cada estrato.
Para e = 1, 2, .. e
ne = n*We
Tal que Ne = N
E =1
Onde:
n o tamanho da amostra;
ne tamanho da amostra por estrato;
We a proporo da populao por estrato.
Exemplo:
SOLTEIROS
50
OUTROS
40
N = 300 pessoas
n = 60 pessoas amostra total
CASADOS
210
N1 = 50 solteiros;
N2 = 210 casados;
N3 = 40 outros
N = 300
W1 = N1 = 50
N 300
proporo de solteiros
W2 = N2 = 210
proporo de casados
300
W3 = N3 = 40
proporo de outros
N
300
Logo a amostra por estrato ser:
n1 = nW1 = 60 (50/300)
= 10
n2 = nW2 = 60 (210/300)
= 42
n3 = nW3 = 60 (40/300)
= 8
n = 60 total
10
Solteiros
escolhidos por
m.s.a.
8 Outros
escolhido
por m .s.a.
42 casados
escolhidos
por m.s.a.
Solteiros (10)
Elementos = 50 (Ram) +1 =
Escolhido =
Casados (42)
Elementos = 210 (Ram) +1 =
Escolhido =
Outros (8)
Elementos = 40 (Ram) +1 =
Escolhido =
3.3 - Amostragem sistemtica
Quando os elementos da populao se apresentam ordenados e a retirada dos
elementos da amostra feita periodicamente, temos uma amostragem sistemtica.
Assim por exemplo em uma linha de produo, podemos a cada dez itens produzidos,
retirar um para pertencer a uma amostra da produo diria.
A principal vantagem da amostragem sistemtica est na grande facilidade na
determinao dos elementos da amostra. O perigo em adot-la est na possibilidade da
existncia de ciclos de variao da varivel de interesse, especialmente se o perodo
desses ciclos coincidir com o perodo de retirada dos elementos da amostra.
10
0km
1km
Cascavel
190km
Foz
N = 190
n = 30 (foi determinado)
R = 190 = 6,33 6
30
a=4
escolhido aleatoriamente
12
EXERCCIOS
1. Os associados de uma cooperativa esto organizados em um arquivo, por ordem
alfabtica. Qual a maneira mais rpida de amostra 1/3 do total de fichas de
associados?
2. Um pesquisador tem dez gaiolas que contm, cada uma, seis ratos. Como o
pesquisador pode selecionar dez ratos para uma amostra?
3. Para levantar dados sobre o nmero de filhos por casal, em uma comunidade, um
pesquisador organizou um questionrio que enviou, pelo correio, a todas as
residncias. A resposta ao questionrio era facultativa, pois o pesquisador no tinha
condies de exigir a resposta. Nesse questionrio perguntava-se o nmero de filhos
por casal morador na residncia. Voc acha que os dados assim obtidos tm algum tipo
de tendenciosidade? Justifique.
4. Um pesquisador pretende levantar dados sobre o nmero de moradores por
domiclio, usando a tcnica de amostragem simples sistemtica. Para isso, o
pesquisador visitar cada domiclio selecionado. Se nenhuma pessoa estiver presente
na ocasio da visita, o pesquisador exclura o domiclio da amostra. Esta ltima
determinao introduz tendenciosidade. Por qu?
5. Dada uma populao de 40 alunos, descreva uma forma de obter uma amostra
casual simples de 6 alunos.
6. Organize uma lista com 10 nomes de pessoas em ordem alfabtica. Depois
descreva uma forma de obter uma amostra sistemtica de 5 indivduos.
7. Em uma pesquisa de mercado para servios odontolgicos tomou-se a lista
telefnica, onde os nomes dos assinantes esto organizados em ordem alfabtica do
ltimo sobrenome, e se amostrou o dcimo de cada 10 assinantes. Critique esse
procedimento.
8. Por que os estatsticos estudam amostra e no populaes?
9. Como podemos dizer que uma determinada amostra representa adequadamente a
populao?
10. Para as questes a seguir imagine um experimento em que se dividam os elementos
em dois grupos: Um grupo experimental e um grupo de controle.
a) Por que os grupos devem ser to semelhante quanto possvel?
b) As pessoas devem saber em que grupo esto?
c) Qual o melhor sistema de dividir os indivduos pelos dois grupos
11. Diferencie Estatstica Descritiva de Estatstica Inferencial.
12. Defina e diferencie com suas palavras Variveis Quantitativas de Variveis
Qualitativas com suas respectivas subdivises.
13
14
PARTE III
Exemplo:
Tabela 01: Casos registrados de intoxicao humana segundo a causa
determinante. Brasil, 1993
Causa
Freqncia
Acidente
29.601
Abuso
2.604
Suicdio
7.965
Profissional
3.735
Outras
1.959
Ignorada
1.103
Fonte: Mensrio Estatstico 259/260
15
16
1.418.050
1.361.203
2.779.253
71
67
67
70
65
65
66
70
64
67
68
66
68
64
65
67
66
69
68
65
69
68
67
68
67
67
67
66
66
29
30
30
31
31
32
33
34
35
36
36
37
37
37
37
38
38
38
40
41
43
44
44
45
45
45
46
47
48
49
50
51
53
54
54
56
58
62
65
17
Grfico de Ordenadas
Para a sua construo traada uma reta horizontal (ou vertical) que servir de base;
a partir de pontos com a mesma distncia nesta reta, constroem-se traos
perpendiculares, cujo comprimento seja proporcional a frequncia.
Grfico em Barras
O grfico em barras a representao em que sobre o eixo vertical constroem-se
retngulos para as diferentes categorias da nossa varivel, com largura apropriada e
altura proporcional as respectivas freqncias de cada categoria. As barras no so
justapostas ou ligadas, pois na maioria das vezes as categorias das variveis qualitativas
no apresentam relao de continuidade.
Grfico em Colunas
A construo do grfico em colunas semelhante ao em barras, com uma nica
diferena, os retngulos sero sustentados no eixo horizontal.
Pictograma
O grfico pictograma semelhante ao grfico em colunas, com a diferena que no
lugar de retngulos sero figuras que representaram as distribuies de freqncia.
Dot Plot
o grfico onde, no eixo horizontal marca-se com espaamentos iguais cada
categorias da varivel e verticalmente a estas, desenha-se pontos, sendo que, a
quantidade de pontos em cada categoria igual ao valor da freqncia absoluta desta.
Este grfico no usual e recomendado apenas, quando as freqncias so pequenas.
18
2.2.2
Histograma
Este um grfico usado para apresentar dados organizados em intervalos, utilizado
principalmente para representar a distribuio de variveis contnuas.
-
fi
h
ou
di =
hi
h
Polgono de freqncias
a representao grfica de uma distribuio de freqncias por meio de um
polgono.
Para a sua construo, trace o sistema de eixo cartesianos; marque os pontos
mdios de cada classe no eixo horizontal (ponto mdio de um intervalo a soma dos
extremos do intervalo dividido por dois); no eixo vertical coloque as freqncias; faa
pontos na interseco do ponto mdio de cada intervalo com sua respectiva freqncia;
una todos estes pontos por segmentos de reta.
Ogiva
o grfico que representa a distribuio da freqncia absoluta acumulada. Sua
construo semelhante ao do polgono de freqncias, com a diferena que
consideraremos a freqncia absoluta acumulada.
EXERCCIOS
1.
20
PARTE IV
Medidas de Posio
1. Introduo
Atravs de tabelas e grficos construdos anteriormente, vimos como resumir e
apresentar um conjunto de dados. Contudo, podemos resumir ainda mais este conjunto,
apresentando um ou alguns valores que representam todo o conjunto. Esses valores
so chamados de medidas de posio.
2. Medidas de Tendncia Central
So valores estabelecidos num ponto central em torno do qual os dados se
distribuem. As medidas de tendncia central que iremos estudar so: mdia aritmtica,
mediana e moda.
2.1 - Mdia Aritmtica
a soma de todos os elementos em nosso conjunto de dados dividido pelo total
de elementos. Isto ,
n
x
x=
i =1
n
Onde n o total de elementos no conjunto de dados.
A mdia aritmtica um valor que pode substituir todos os valores da varivel, isto
, o valor que a varivel teria se em vez de varivel ela fosse constante.
2.1.1
2.1.2
2.1.3
21
x n + x n + 2
Md ( x) =
Neste exemplo: X1 = 6/2 = 3 (3O termo) e X2 = (6+2)/2 = 4 (4O termo), logo a mediana
:
Md =
7+8
= 7,5
2
Observe que este um valor terico, pois no figura entre os dados originais.
2.2.1 Vantagens do emprego da mediana
A mediana no influenciada por valores extremos.
2.2.2 Desvantagens do emprego da mediana
A mediana uma medida que exige uma ordenao de categorias, da mais
alta a mais baixa, assim ela s pode ser obtida para variveis qualitativas
ordinais ou para as quantitativas, jamais para variveis qualitativas
nominais;
No inclui todos os valores da distribuio;
22
Mn.
Q1
Md
Q3
Mx.
Onde:
- O 1O Quartil (Q1) significa que 25% dos dados so inferiores a Q1, ou que 75% dos
dados so superiores a Q1.
- O 3O Quartil (Q3) significa que 75% dos dados so inferiores a Q3, ou que 25% dos
dados so superiores a Q3.
Em geral Q1 < Me < Q3.
Q1 =
X n +1 + 0.75 X n +1 X n +1
+1
4
4
4
Q3 =
3.
4
4
23
*n
100
24
Se No
Modificar L, arredondando seus valores para o inteiro mais prximo.
25
PARTE IV
S2 =
(x
i =1
x) 2 . fi
n 1
n
x
i
1 n 2 i =1
2
S =
xi n (para dados amostrais)
n 1 i =1
( )
OBSERVAO:
O desvio Padro representa a maneira mais comum de se medir a variao
de um conjunto de observaes. Para duas amostras, a que apresentar um desvio
padro maior acusar uma maior disperso.
Quanto menor o desvio padro, mais os valores da varivel se aproximam
de sua mdia.
Quanto maior a varincia e desvio padro, maiores so os indcios de
heterogeneidade entre os elementos do conjunto.
27
X < Md < Mo
assimetria negativa ou a esquerda
Mo < Md < X
assimetria positiva ou a direita
X = Md = Mo
distribuio simtrica
Para determinar o grau de assimetria, uma regra muito utilizada :
COEFICIENTE DE ASSIMETRIA DE PEARSON
X MO
1o Caso: AS =
2o Caso: AS =
3 Caso: AS =
Q1 + Q3 2 Md
Q3 Q1
3( x x% )
28
1.6 - Curtose
Denomina-se curtose o grau de achatamento da distribuio em relao a curva normal.
Uma distribuio nem chata, nem delgada, chama-se : mesocrtica
EXERCCIOS
1. Uma amostra de 50 estudantes apontou o seguinte rol de notas de Estatstica
(avaliao de 0 a 100).
30 35 35 39 41 41 42 45 47 48
50 52 53 54 55 55 57 59 60 60
61 64 65 65 65 66 66 66 67 68
69 71 73 73 74 74 76 77 77 78
80 81 84 85 85 88 89 91 94 97
a) Qual a amplitude total desta amostra? vivel construir uma distribuio por
intervalos de classe?
b) Em quantas classes poderemos agrupar esse conjunto de dados?
c) Qual ser o tamanho dos intervalos de classe?
d) Construa a tabela de distribuio de freqncia por classes. Inicie a primeira
classe com 30.
e) Construa os histogramas de freqncias absolutas e relativas.
f) Quantos alunos obtiveram notas maiores ou iguais a 70?
g) Analisando a tabela e os grficos, redija um breve relatrio sobre as notas desta
turma de estudantes.
h) Calcule a mdia amostral e interprete.
i) Calcule e interprete a moda.
j) Calcule e interprete a mediana.
k) Determine os quartis. Represente os resultado usando o BOX-PLOT.
l) Determine a Varincia, Desvio Padro e Coeficiente de Variao. Interprete.
m) A Distribuio Simtrica? Justifique calculando o grau de assimetria e
interprete o BOX-PLOT.
n) Faa um comentrio final utilizando todos as informaes obtidas nos itens
acima e faa suas consideraes finais.
2. Para se estudar o desempenho de duas companhias corretoras de aes,
selecionou-se de cada uma delas amostras aleatrias das aes negociadas. Para
cada ao selecionada, computou-se a porcentagem de lucro apresentada durante
um perodo fixado de tempo. Os dados esto a seguir:
Quadro 1. Porcentagem de lucro de aes negociadas de duas corretoras
Corretora A
Corretora B
45 54 62 61 54 64
57 58 58 50 51 49
70 48 64 55 65 65
52 59 59 55 61 65
59 51 55 60 62 63
65 59 48 55 60 70
60 55 40 55 66 65
55 69 58 63 64 75
Determine:
a) A mdia, mediana, moda e quartis de cada corretora. Interprete os resultados;
b) Que corretora tem as aes menos dispersas?
c) Que corretora tem as aes mais homogneas?
30
14
16
21
12
13
15
12
31
32
33
PARTE VI
x=
x f
i =1
onde:
fi a frequncia de cada classe;
xi o ponto mdio de cada classe.
Exemplo 1: Calcular a mdia dos dados da distribuio do salrio mdio de 36
funcionrios de uma empresa.
Salrio
fi
4 | 8
10
8 |12
12
12 | 16
16 | 20
20 | 24
Total
36
34
Quartil 1
n
' Fa
4
h
Q1 = Liq1 +
f q1
onde:
Liq1 o limite inferior da classe do 1 quartil (em uma distribuio de frequncia chamase de classe do 1 quartil classe que possui 25% dos elementos abaixo de seu valor);
' Fa a frequncia acumulada da classe vizinha anterior classe quartilitica;
n o tamanho da amostra;
f q1 a frequncia de classe do 1 quartil;
h a amplitude do intervalo de classe do 1 quartil.
Quartil 3
3n
' Fa
4
h
Q3 = Liq 3 +
fq3
onde:
Liq3 o limite inferior da classe do 3 quartil (em uma distribuio de frequncia chamase de classe do 1 quartil classe que possui 75% dos elementos abaixo de seu valor);
' Fa a frequncia acumulada da classe vizinha anterior classe quartilitica;
n o tamanho da amostra;
f q 3' a frequncia de classe do 3 quartil;
h a amplitude do intervalo de classe do 3 quartil.
35
' Fa
100
h
Pi = LPi +
f Pi
onde:
LPi o limite inferior da classe do Percentil Pi , em que i = 1, 2, 3, . . . 99;
' Fa a frequncia acumulada da classe vizinha anterior classe do percentil;
n o tamanho da amostra;
f Pi a frequncia de classe do Percentil;
h a amplitude do intervalo de classe do Percentil.
S2 =
(x
i =1
x) 2 . fi
n 1
Onde:
x a mdia amostral
xi representa cada dado amostral (ou intervalo de classe amostral)
f i a frequncia de cada classe
f. Detectando outliers
Um boxplot pode ser formado para indicar explicitamente a presena de outliers.
Definio: Qualquer observao distante mais do que 1,5(Q3 Q1) do quarto mais
prximo um outlier. Um outlier extremo se estiver a mais de 3.(Q3 Q1) do quarto
mais prximo. Caso contrrio moderado.
36
EXERCCIOS
1) Na empresa Mercury Ltda foi observada a distribuio de funcionrios do setor de servios
gerais com relao ao salrio semanal, conforme mostra a distribuio de frequncia:
Pede-se:
(a) salrio mdio semanal dos funcionrios.
(b) desvio padro, o coeficiente de variao e a moda dos salrios semanais dos funcionrios.
(c) Se o empresrio divide os funcionrios em trs categorias, com relao ao salrio, de sorte
que: Os 25% menos produtivos sejam da categoria A; Os 25% seguintes sejam da categoria B e
Os 25% seguintes, sejam da categoria C;
Pede-se determinar os limites dos salrios das categorias A;B e C
(d) Esboce o box-plot da distribuio e comente-o.
2) Uma distribuio simtrica unimodal apresenta mediana igual a 36dm e coeficiente de
variao em torno de 20%. Determine a varincia dessa distribuio.
3) Lanado um dado 50 vezes, obteve-se a seguinte distribuio:
xi
fi
1
6
2
11
3
6
4
7
5
9
6
11
a) Determinar a mdia, mediana, moda e quartis da distribuio;
b) Determinar a varincia, desvio padro e valor do coeficiente de variao.
c) A distribuio Homognea? simtrica?
d) A distribuio mesocurtca?
e) Podemos dizer que a distribuio tem um comportamento normal? Por qu?
4) Num teste aplicado a 30 alunos, obteve-se a seguinte distribuio de pontos:
Pontos
35|45
45|55
55|65
65|75
75|85
N de alunos
1
3
8
3
3
a) Determinar a mdia, mediana, moda e quartis da distribuio;
b) Determinar a varincia, desvio padro e valor do coeficiente de variao.
c) A distribuio Homognea? simtrica?
d) Calcule o coeficiente de curtose.
e) O que Podemos dizer a respeito da distribuio? Interprete os resultados.
85|95
2
37
PARTE VII
Probabilidade
1. Introduo
A maneira mais comum de medirmos as incertezas relacionadas com eventos
(por exemplo, resultado de um pleito eleitoral, resultados obtidos com a ingesto de um
novo medicamento) consiste em atribuir-lhes probabilidades ou especificar as chances
de ocorrncia do evento.
Dentre os diversos conceitos de probabilidade, o de maior aplicao a
interpretao frequencial: A probabilidade de um evento a proporo do nmero de
vezes que eventos do mesmo tipo ocorrem a longo prazo.
38
A B
Interseco
A B
Complementar
Exemplo:
Seja o experimento: lanamento de um dado e os eventos:
A= nmero par no dado;
B= nmero maior que 2 no dado;
C= nmero 6;
1. D os eventos complementares;
2. D as reunies;
3. D as interseces;
39
3. P ( A B ) = P( A) + P( B) P( A B).
Seja S um espao amostral finito e equiprovvel e A um determinado evento, ou
seja, um subconjunto de S. A probabilidade P(A) de ocorrncia do evento A ser
calculada pela frmula:
n( A)
n( S )
onde: n (A) = nmero de elementos de A e n (S) = nmero de elementos do espao de
prova S.
P ( A) =
40
2.3 Uma urna possui 6 bolas azuis, 10 bolas vermelhas e 4 bolas amarelas. Tirandose uma bola com reposio, calcule as probabilidades seguintes:
a) sair bola azul.
41
Teremos ento:
P ( A / B) = n ( A B) / n (B)
onde AB = interseo dos conjuntos A e B.
Esta frmula importante, mas pode ser melhorada.
Vejamos:
Ora, a expresso acima, pode ser escrita sem nenhum prejuzo da elegncia, nem do
rigor, como:
P(A/B) = [n(AB)/n(S)] . [n(S)/n(B)]
P(A/B) = P(AB) . 1/P(B)
Vem, ento: P(A / B) = P (AB) /P (B), de onde conclumos finalmente:
P(A B) = P ( A / B ) .P ( B )
Esta frmula denominada Lei das Probabilidades Compostas.
Esta importante frmula, permite calcular a probabilidade da ocorrncia simultnea dos
eventos
A
e
B,
sabendo-se
que
j
ocorreu
o
evento
B.
Se a ocorrncia do evento B, no mudar a probabilidade da ocorrncia do evento A,
ento P(A/B) = P(A) e, neste caso, os eventos so ditos independentes, e a frmula
acima fica:
Exemplo:
1) Uma urna possui cinco bolas vermelhas e duas bolas brancas. Calcule as
probabilidades de:
42
a) em duas retiradas, sem reposio da primeira bola retirada, sair uma bola vermelha
(V) e depois uma bola branca (B).
b) em duas retiradas, com reposio da primeira bola retirada, sair uma bola vermelha e
depois uma bola branca.
P ( B / A) = P ( B )
5. Teorema Bayes
um processo usado para calcular a probabilidade a posteriori.
Definio: Sejam E1, E2, E3, . . . , Ek eventos mutuamente exclusivos, tais que:
P(E1) + P(E2) + P(E3) + . . . + P(Ek) = 1.
Seja A um evento qualquer, que se sabe ocorrer em conjunto com, ou em
conseqncia de, um dos eventos Ei. Ento a probabilidade de ocorrncia de um evento
Ei dada a ocorrncia de A, dada por:
P( Ei / A) =
P( Ei A)
P( Ei ) P( A / Ei )
=
P( A)
P( E1 ) P( A / E1 ) + P( E 2 ) P( A / E 2 ) + .... + P( E k ) P( A / E k )
43
EXERCCIOS
1. Determine a probabilidade de cada evento:
a) Um nmero par aparecer no lanamento de um dado no viciado;
b)Um rei aparecer, ao extrair-se uma carta de um baralho;
c) Pelo menos uma cara aparecer no lanamento de trs moedas;
d) Pelo menos uma cara aparecer no lanamento de n moedas;
e) Duas copas aparecerem, ao retirarem-se duas cartas de um baralho;
f) Uma carta de copas e uma de ouros aparecerem ao extrarem-se duas cartas de um
baralho.
R:
a) 1/2
b) 1/13
c) 7/8
d) (2n 1)/2n
e) 1/17
f) 13/204
2. Um nmero escolhido entre 20 inteiros ao acaso, de 1 a 20. Qual a
probabilidade de o nmero escolhido:
a) ser par?
b) Ser mpar?
c) Ser primo?
d) Quadrado perfeito?
R:
a) 1/5
b) 1/10
c) 3/10
d) 6/25
3. Uma urna contm 20 bolas numerads de 1 a 20. seja o experimento retirada de
uma bola, e considere os eventos:
A = { a bola retirada possui um mltiplo de 2}
B = {a bola retirada possui um mltiplo de 5}
Determine a probabilidade do evento AB
R:
3/5
4. Dois dados, um verde e um vermelho, so lanados e observados os nmeros das
faces de cima:
a) Qual a probabilidade de ocorrerem nmeros iguais?
b) Qual a probabilidde de ocorrerem nmeros diferentes?
c) Qual a probabilidade de a soma dos nmeros ser 7?
d) Qual a probabilidade de a soma dos nmeros ser 12?
e) Qual a probabilidade de a soma dos nmeros ser menor ou igual a 12?
f) Qual a probabilidade de aparecer um nmero 3 em ao menos um dado?
R:
a) 1/6
b) 5/6
c) 1/6
d) 1/36
e) 1
f) 11/36
b)
c)
d)
R:
44
45
14. Uma urna contm cinco bolas brancas e seis pretas. Trs bolas so retiradas.
Calcular a probabilidade de:
a) Serem todas pretas;
b) Ser exatamente uma branca;
c) Ser ao menos uma preta.
R:
a)4/33
b) 5/11
c) 31/33
15. Em uma classe, existem cinco alunos do 4 ano, quatro do 2 ano e trs do 3
ano. Qual a probabilidade de serem sorteados dois alunos de 2 ano, trs do 4
e dois do 3?
R:
5/22
16. A e B jogam 120 partidas de xadrez, das quais A ganha 60, B ganha 40 e 20
terminam empatadas. A e B concordam em jogar 3 partidas. Determinar a
probabilidade de:
a) A ganhar todas as trs;
b) Duas partidas terminarem empatadas;
c) A e B ganharem alternadamente.
R:
a) 1/8
b) 5/72
c) 5/36
17. A probabilidade de trs jogadores marcarem um pnalti so respectivamente:
2 4 7
, e
3 5 10
Se cada um cobrar uma nica vez, qual a probabilidade de:
a) Todos acertarem?
b) Apenas uma acertar?
c) Todos errarem?
R:
a) 28/75
b) 1/6
c) 1/50
18. Numa bolsa temos cinco moedas de R$ 1,00 e quatro de R$ 0,50. Qual a
probabilidade de, ao retirarmos duas moedas, obtermos R$ 1,50?
R:
5/9
3
e de seu
19. A probabilidade de uma mulher estar viva daqui 30 anos de
4
3
marido, . Calcular a probabilidade de:
5
a) Apenas o homem estar vivo;
b) Somente a mulher estar viva;
c) Ambos estarem vivos.
R:
a) 3/20
b) 3/10
c) 9/20
20. Uma caixa A contm oito peas, das quais trs so defeituosas, e uma caixa B
contm cinco peas, das quais duas so defeituosas. Uma pea retirada
aleatoriamente de cada caixa.
a) Qual a probabilidade p de que ambas as peas no sejam defeituosas?
b) Qual a probabilidade p de que uma pea seja defeituosa e a outra no?
c) Se uma pea defeituosa e a outra no, qual a probabilidade p de que a
pea defeituosa venha da caixa A?
R:
a) 3/8
b) 19/40
c) 9/19
46
21. Temos duas caixas: na primeira h trs bolas brancas e sete pretas; e na segunda,
uma bola branca e cinco pretas. De uma caixa escolhida ao acaso, seleciona-se
uma bola e verifica-se que preta. Qual a probabilidade de que a caixa onde
for extrada a bola seja a primeira? E a segunda?
R:
21/46
25/46
22. A probabilidade de um indivduo de classe A comprar uma carro de
R:
3
, de B
4
1
1
e de C
. A probabilidade de o indivduo de classe A comprar um carro
5
20
1
3
3
da marca D
; de B comprar da marca D
e de C
. Em certa loja
10
5
10
comprou-se um carro da marca D. qual a probabilidade de que o indivduo da
classe B o tenha comprado?
4/7
23. Em certo colgio, 5% dos homens e 2% das mulheres tem mais do que 1,80m de
altura. Por outro lado, 60% dos estudantes so homens. Se um estudante
escolhido ao acaso e tem mais de 1,80m de altura qual a probabilidade de que
o estudante seja mulher?
R:
4/19
24. Trs mquinas, A, B e c, produzem respectivamente 40%, 50% e 10% total de
peas de uma fbrica. As porcentagens de peas defeituosas nas respectivas
mquinas so 3%, 5% e 2%. Uma pea sorteada ao acaso e verifica-se que
defeituosa. Qual a probabilidade de que a pea tenha vindo da mquina B?
R:
25/39
25. A industria Alpha Ltda., fabricante de esferas metlicas, possui trs mquinas,
M1, M2 e M3, responsveis por 25%, 40% e 35%, respectivamente, de sua
produo diria. Por sua vez, as respectivas taxas de unidades defeituosas so de
1%, 2% e 3%. Tendo um item sido retirado, ao acaso, da produo diria de
600.000 unidades, e se verificando que apresenta defeito, pede-se a
probabilidade de ser proveniente de Mi (i = 1, 2, 3).
R:
M1 = 11,9%
M2 = 38,10%
M3 = 50%
26. A circulao da estrada que liga a cidade Alpha cidade Betha cortada por trs
sinais luminosos, no sincronizados, cuja distancia entre si de 2,5km. Os sinais
tm ciclo de um minuto, com durao para o sinal verde de 30, 30 e 40
segundos, respectivamente. Se um carro percorre a estrada, velocidade de
60km/h, observando a todos os sinais, qual a probabilidade de no ser parado
por nenhum deles?
R:
1/6
27. A caixa A tem 9 cartas numeradas de 1 a 9. A caixa B tem 5 cartas numeradas
de 1 a 5. Uma carta escolhida ao acaso e uma carta retirada. Se o nmero
par, qual a probabilidade de que a carta sorteada tenha vindo de A?
R:
10/19
47
28. Uma caixa tem 3 moedas: uma no viciada, outra com 2 caras e uma terceira
1
viciada, de modo que a probabilidade de ocorrer cara nesta moeda de . Uma
5
moeda selecionada ao acaso da caixa. Saiu cara. Qual a probabilidade de que a
3 moeda tenha sido selecionada?
R:
2/17
29. Um certo programa pode ser usado com uma entre duas sub-rotinas A e B,
dependendo do problema. A experincia tem mostrado que a sub-rotina A
usada 40% das vezes e B usada 60% das vezes. Se A usada, existe 75%
de chance que o programa chegue a um resultado dentro do limite de tempo. Se
B usada, a chance de 50%. Se o programa foi realizado dentro do limite de
tempo, qual a probabilidade de que a sub-rotina A tenha sido escolhida?
R:
50%
30. A probabilidade de que um atleta A ultrapasse 17,30m num nico salto triplo
de 0,7. O atleta d 4 altos. Qual a probabilidade de que pelo menos num dos
saltos ultrapasse 17,30m?
R:
99,19%
48
PARTE VIII
1.1
1.2
b)
p( xi ) = 1
i =1
49
p( xi )
xi x
( x ) = x = E( x ) =
xi . p( xi )
i =1
propriedades da mdia
i ) E (k ) = k , com k constante;
ii ) E (kX ) = kE ( X );
iii ) E ( X Y ) = E ( X ) E (Y );
n
n
iv) E X i = { E ( X i )};
i =1 i =1
v) E (aX b) = aE ( X ) b, com a e b constantes;
vi ) E ( X ) = E ( X ) E ( ) = = 0;
50
Var( x ) = 2 ( x ) = { E( x 2 ) [ E( x )2 ]}
onde:
E( x 2 ) =
[( xi 2 ). p( xi ) ]
i =1
E( x ) =
[( xi ). p( xi ) ]
i =1
Notao:
Var( x ), V ( x ), 2 , x2 , 2
propriedades da mdia
51
( x ) = 2( x )
Usando a tabela de distribuio normal, vemos que no intervalo de ( ) a
( + ) o grau de concentrao de probabilidades em torno da mdia de 68%; no
intervalo de ( 2 ) a ( + 2 ) , o grau de concentrao de probabilidades em torno
da mdia de 95% e essa concentrao de 99,7% no intervalo de ( 3 ) a
( + 3 ) .
Exemplificando, se dissermos que a altura mdia ( ) do homem brasileiro
adulto de 1,70m e desvio Padro ( ) 5cm, estaremos dizendo que entre;
1,65m e 1,75m encontramos 68% da populao masculina adulta brasileira
1,60m e 1,80m encontramos 95% da populao masculina adulta brasileira
1,55m e 1,85m encontramos 99,7% da populao masculina adulta brasileira
i =1 j =1
p( X = xi ,Y = yi ) = 1
52
P( X
j =1
= xi ,Y = y j ), i = 1, 2 ,..., m
e
m
i =1
j =1
P( X = x ) =
i =1
p ( xi , y j ) = 1
P (Y = y j ) = P ( X = xi , Y = y j ), j = 1, 2,..., n
i =1
e
n
j =1
j =1
P(Y = yi ) =
i =1
p( xi , y i ) = 1
7. Distribuies Condicionais
Definio:
P( X = xi ;Y = y j )
P( X = xi / Y = y j ) =
,
P( Y = y j )
j = fixo
i = 1, 2 ,..., m
i = fixo
j = 1, 2,..., n
p( y = y j ) 0
Definio:
P( Y = y j / X = xi ) =
P( X = xi ;Y = y j )
P( X = xi )
p( X = xi ) 0
Definio:
m
p ( xi ; y j )
i =1
i =1
p( y j )
p( xi ; y j )
j =1
j=1
p ( xi )
P( X / Y = y j ) = xi .p(x i /y i ) = x i
j = fixo
i = 1, 2,..., n
Definio:
P (Y / X = xi ) = yi .p(y i /x i ) = y j
i = fixo
j = 1, 2,..., m
53
As variveis aleatrias X e Y so
P( X = xi , Y = y j ) = P ( X = xi ).P (Y = y j ) ,
independentes
se
somente se
par
( xi , y j ), i = 1,2,..., m e j = 1,2,..., n
cov( X , Y )
x y
Tambm:
x, y
x y
1 1 +1
a) Quando > 0, cov( X , Y ) > 0. O diagrama de disperso : ( +1)
y
54
EXERCCIOS
1. Uma urna tem 4 bolas brancas e 3 pretas. Retiram-se 3 bolas sem reposio. Seja
X: nmero de bolas brancas, determinar a distribuio de probabilidade de X.
55
R:
3
2
56
b) COV(X, Y)
c) coeficiente de correlao ()
R: 0,28
R: 0,533
57
PARTE IX
DISTRIBUIO GEOMTRICA
Seja X nmero de tentativas necessrias ao aparecimento do primeiro sucesso.
Assim a varivel x tem distribuio geomtrica:
Frmula:
P(X = x) = q x 1 . p
Onde:
x= nmero de tentativas necessrias ao aparecimento do primeiro sucesso;
p = probabilidade de sucesso;
q = a probabilidade de Fracasso;
Parmetros da distribuio Geomtrica.
1
Esperana:
E(x) = (x) =
p
58
Varincia
Var(x) = 2 (x) =
q
p2
DISTRIBUIO DE PASCAL
Suponha que um experimento aleatrio repetido independentemente at que um
evento A ocorra pela r-sima vez.
Seja X: nmero de repeties necessrias para que A ocorra pela r-sima vez.
Assim a varivel x tem distribuio de Pascal:
P(X = x) = p r .q x r .C x 1
Frmula:
r 1
Onde:
x = nmero de repeties;
r = nmero de sucessos;
p = probabilidade de sucesso;
q = a probabilidade de Fracasso;
Parmetros da distribuio de Pascal
r
Esperana:
E(x) = (x) =
p
rq
Varincia:
Var(x) = 2 (x) = 2
p
DISTRIBUIO HIPERGEOMTRICA
Consideremos uma populao com N elementos das quais r tm uma
determinada caracterstica. Retiramos dessa populao, sem reposio, uma amostra de
tamanho n.
Seja X: nmero de sucessos na amostra
Assim a varivel x tem distribuio Hipergeomtrica:
Combinaes sucessos
Cr ,x .C N r
Frmula:
P(X = x) =
Combinaes fracassos
n x , 0 x n e
C N ,n
xr
Combinaes da Amostra
Onde:
Onde: p =
r
n
59
DISTRIBUIO DE POISSON
Consideremos a probabilidade de ocorrncia de sucessos em um determinado
intervalo.
Hipteses:
H1: A probabilidade de uma ocorrncia em um intervalo t ( S, ou...) constante e
proporcional ao tamanho do intervalo. Isto :
P( X = 1,t ) = t
P( X > 1,t ) = 0
x!
Onde:
EXERCCIOS
1. Uma moeda jogada 10 vezes. Calcule as seguintes probabilidades:
a) de dar pelo menos duas caras;
R: 98,93%
b) de ocorrer seis caras;
R: 20,51%
c) de no dar nenhuma coroa;
R: 0,098%
d) de dar pelo menos uma coroa;
R: 99,90%
e) de no dar 5 caras e 5 coroas
R: 75,39%
2. Admitindo que o nascimento de meninos e meninas sejam iguais, calcule a
probabilidade de um casal com seis filhos ter quatro filhos homens e duas
mulheres.
R: 23,44%
60
R: 9,16%
R: 82,64%
12. Numa urna h 40 bolas brancas e 60 bolas pretas. Retiram-se 20 bolas. Qual a
probabilidade de que ocorram no mnimo 2 bolas brancas, considerando as
extraes:
b) sem reposio;
R: 99,98%
c) com reposio.
R: 99,94%
13. Uma urna contm 10 bolas brancas e 40 pretas.
a) Qual a probabilidade de que a 6 bola retirada com reposio, seja a 1 bola
branca?
R: 6,55%
b) Qual a probabilidade de que de 16 bolas retiradas, sem reposio, ocorram 3
brancas?
R: 29,33%
c) Qual a probabilidade de que a 15 bola extrada com reposio seja a 6 branca?
R: 1,72%
d) Qual a probabilidade de que em 30 bolas retiradas com reposio, ocorram no
mximo 2 brancas?
R: 4,41%
14. A mdia de chamadas telefnicas numa hora trs. Qual a probabilidade de:
a) Receber exatamente trs chamada numa hora?
R: 22,41%
b) Receber quatro ou mais chamadas em 90 minutos?
R: 65,8%
15. Certo posto de Bombeiros recebe em mdia trs chamadas por dia. Calcular a
probabilidade de:
a) receber quatro chamadas num dia;
R: 16,8%
b) receber trs ou mais chamadas num dia.
R: 57,67%
16. Uma loja atende em mdia dois cliente por hora. Calcule a probabilidade de em
uma hora:
a) atender exatamente dois cliente;
R: 27%
b) atender trs clientes.
R: 18%
17. Suponha 400 erros de impresso distribudos aleatoriamente em um livro de 500
pginas. Encontre a probabilidade de que dada pgina contenha:
a) nenhum erro;
R: 44,9%
b) exatamente dois erros.
R: 14,37%
18. Se 5% das lmpadas de certa marca so defeituosas, ache a probabilidade de
que, numa amostra de 100 lmpadas, escolhidas ao acaso, tenhamos:
a) nenhuma defeituosa;
R: (0,95)100
100
b) trs defeituosas;
R: (0,05) 3 (0,95) 97
3
62
1
. Se ele atirar seis vezes,
3
R: 32,92%
R: 8,78%
R:
2 70
63
PARTE X
2.
f ( x)dx = 1 .
Definio:
Seja X um v.a. contnua. A distribuio de probabilidade ou funo de
densidade de probabilidade (fdp) de X ser, ento, uma funo f(x) tal que, para
quaisquer dois nmeros a e b com a b,
b
P(a X b) = f ( x)dx
a
Figura 1: A rea sobre a curva expressa a funo densidade de probabilidade de uma fdp.
64
Proposio:
Se X uma varivel aleatria contnua, ento qualquer nmero c, P(X=c)=0.
Alm disso, para quaisquer dois nmeros a e b com a< b,
Definio:
A funo distribuio acumulada F(X) de uma va contnua X definida para
cada nmero x por
x
F ( x) = P( X x) =
f ( y )dy,
A importncia da fdc neste caso, assim cimo no das vas discretas, que as
probabilidades dos diversos intervalos podem ser calculadas por uma frmula ou lidas
de uma tabela de F(x).
Proposio:
Seja X uma va contnua com fdp f(x) e fdc F(x). Ento, para qualquer nmero a,
P( X > a) = 1 F (a )
e, para quaisquer dois nmeros a e b com a < b,
P (a X b) = F (b) F (a )
Proposio:
Se X for uma va contnua com fdp f(x) e fdc F(x) ento, para qualquer x em que a
derivada F(x) existir, F(x)=f(x).
65
Propriedades de F(x)
1.0 F ( x) 1;
2. lim F ( x) = 0;
x
3.lim F ( x) = 1;
x
x f ( x)dx
4. Varincia Matemtica:
Definio:
A varincia de uma varivel aleatria contnua X com fdp f(x) e mdia
VAR( X ) = x2 = E ( X 2 ) [ E ( X )]2
onde:
E( X ) =
2
f ( x)dx
Distribuio
Contnuas
Conjunta
de
Duas
Variveis
Aleatrias
66
Definio
Seja X e Y vas contnuas. Ento, f(x, y) a funo de densidade de probabilidae de
P[( X , Y ) A] = f ( x, y )dxdy
A
Definio:
As funes densidade de probabilidade marginal de X e Y, representadas
respectivamente por f x ( x) e f y ( y ) , so dadas por
f X ( x) =
f ( x, y )dy
f ( x, y )dx
fY ( y ) =
Definio:
Duas variveis aleatrias X e Y so independentes se, para cada par de valores x e y,
f ( x, y ) = f X ( x) fY ( y ) quando X e Y so contnuas. Caso contrrio so denominadas
dependentes.
67
Distribuies Condicionais
Definio:
Sejam X e Y duas vas contnuas com fdp conjunta f(x,y) e fdp marginal de X, f x ( x) .
Ento, para qualquer valor x de X para o qual f x ( x) > 0 , a funo densidade de
f ( x, y )
f x ( x)
< y <
Covarincia
Quando duas variveis aleatrias X e Y no so independentes, geralmente de
interesse avaliar quo fortemente esto relacionadas uma com a outra.
Definio:
A Covarincia entre duas vas X e Y
Cov( X , Y ) = E[( X x )(Y y )] =
(x
)( y Y ) f ( x, y )dxdy
X, Y contnuas.
Correlao
O coeficiente de correlao ( ) entre X e Y, representado por Corr (X,Y), X ,Y , ou
simplismente , definido por
cov( X , Y )
x y
Tambm:
x, y
x y
Onde:
1 1 +1
68
PARTE XI
O valor de k :
b
kdx = 1
a
Logo:
1
se a x b
f ( x) = b - a
0 se x < a ou x > b
Parmetros:
ESPERANA MATEMTICA: A Esperana de X o ponto mdio do intervalo
b+a
[a, b]:
E( X ) =
2
VAR( X ) =
(b a ) 2
12
69
2. DISTRIBUIO NORMAL
O nome normal deve-se ao fato de que muitas distribuies de freqncias de
erros de observaes e mensuraes podem ser descritas por uma distribuio dessa
natureza.
A distribuio de probabilidade normal tem importncia na inferncia estatstica
por trs razes:
As medidas produzidas em diversos processos aleatrios seguem esta
distribuio;
Probabilidades normais podem ser usadas freqentemente como aproximaes
de outras distribuies de probabilidade, como a Binomial e de Poisson;
As distribuies estatsticas da amostra, como a mdia e a proporo, seguem
freqentemente a distribuio normal, independentemente da distribuio da populao.
A funo f(x) chamada funo densidade de probabilidade (f.d.p.) de uma
distribuio normal definida por:
f ( x) =
1 x
O grfico de f(x) ;
P ( a x b) =
a 2
1 x
dx
70
Embora a curva normal esteja definida de menos infinito (-) mais infinito
(+), pode-se observar que quase a totalidade dos casos cai entre -3 e +3 desvios
padro, ou seja, 97,74% dos casos. Este fato ilustrado na figura a seguir.
linear de X para Z:
Xi
Z2 =
71
72
3. DISTRIBUIO EXPONENCIAL
A distribuio exponencial freqentemente usada em estudos de confiabilidade
como sendo o modelo para o tempo at a falha de um equipamento muito utilizado
para componentes eletrnicos.
O tempo de vida at a falha de um semicondutor pode ser modelado por uma
varivel aleatria exponencial com mdia de 40.000h, por exemplo.
A varivel X, que igual distncia entre contagens sucessivas de um processo
de Poisson, com mdia > 0, tem uma distribuio exponencial com parmetro .
e x se x 0
f ( x) =
0 se x < 0
A funo de distribuio acumulada de X, fdc, :
1 e x se x 0
F ( x) =
se
se x < 0
0
O grfico da f.d.p. de X :
P(T>t0) = e t0
P(Tt0)=1 e t0
Parmetros:
ESPERANA MATEMTICA: A Esperana de X o ponto mdio do intervalo
1
[a, b]:
E( X ) =
73
EXERCCIOS
1. A dureza de uma pea de ao pode ser pensada como uma varivel aleatria com
distribuio uniforme no intervalo de [50, 70] da escala de Rockwel segundo a
f.d.p. dada:
1
se 50 h 70
F(h) = 20
0 se h < 50 ou h > 70
Calcular a probabilidade de que uma pea tenha dureza entre 55 e 60.
R:
2. Uma varivel aleatria contnua X, com distribuio exponencial [0, +), tem
f.d.p. dada por:
k x
e se x 0
f ( x) = 2
0 se x < 0
a) calcular o valor de k.
R: K=2
3. O dimetro de um cabo eltrico uma varivel aleatria contnua com f.d.p.
dada por:
R:
k (2 x x 2 ) se 0 x 1
f ( x) =
0 se x < 0 ou x > 1
a) determinar K.
b) calcular a E(x) e Var(x).
c) calcular P(0 x )
a) K=3/2
b) 5/8 e 19/320
c) 5/16
R: a)
b) 2,58
c) 4/3
d) 8/9
5. Uma fbrica de TV determinou que a vida mdia dos tubos de sua fabricao
de 800 horas de uso contnuo e segue distribuio exponencial. Qual a
probabilidade de que a fabrica tenha de substituir um tubo gratuitamente, se
oferecer uma garantia de 300 horas de uso?
R:
0,3127
74
7. Sendo f(x) = 6
0 se x < 0
a) K;
b) P {8 3 < x < 10 + 6 )
R:
a) K=4
b) 0,00674
calcular
2e 2 x se x 0
representa a distribuio do ndice de acidez (X)
8. A f.d.p. f ( x) =
0 se x < 0
de um determinado produto alimentcio. O produto consumvel se este for
menor que 2. O setor de fiscalizao do I.A.L. aprendeu 30 unidades do mesmo.
Qual a probabilidade de que pelo menos 10% da amostra esteja imprpria para
consumo?
R:
0,02172
9. O dimetro X de uma cabo de TV uma varivel aleatria contnua com f.d.p.
3
2
(2 x x ) se 0 x 1
dada por : f ( x) = 2
0 se x < 0 ou x > 1
A probabilidade de um cabo sair com dimetro defeituoso dada por p1 = 0,5125
P(X0,5). Se 25 cabos so produzidos, qual a probabilidade de que:
a) Pelo menos 2 sejam defeituosos?
b) Exatamente 6 sejam defeituosos?
R:
a)0,97261
b) 0,1633
10. Foi feito um estudo sobre a altura de uma faculdade, observando-se que ela se
distribua normalmente com mdia de 1,72m e desvio Padro de 5cm. Qual a
porcentagem dos alunos com altura:
a) entre 1,67m e 1,77m?
b) entre 1,62m e 1,82m?
c) entre 1,57m e 1,87m?
d) acima de 1,90m?
R:
a) 68,27%
b) 95,45%
c) 99,73%
d) 0,02%
11. Um estudo das modificaes percentuais dos preos, no atacado, de produtos
industrializados, mostrou que h distribuio normal com mdia de 50% e
desvio padro de 10%. Qual a porcentagem dos artigos que:
a) sofreram aumentos superiores a 75%?
b) sofreram aumentos entre 30% e 80%?
75
R:
a) 0,626
b) 97,59%
76
R:
c) Exatamente um ms?
d) Mais de trs semanas?
a) 0,2212
b) 0,0323
c) 0
d) 0,4724
77
PARTE X
Inferncia Estatstica: Estimativa por Ponto e
Intervalos De Confiana
10.1 - INTRODUO
O objetivo da Estatstica o de conhecer populaes por meio das informaes
amostrais. Como as populaes so caracterizadas por medidas numricas descritivas,
denominadas parmetros, a estatstica diz respeito realizao de inferncias sobre
esses parmetros populacionais desconhecidos. Parmetros populacionais tpicos so a
mdia ( X
ou
evento populacional.
Os mtodos para realizar inferncias a respeito dos parmetros pertencem a duas
categorias:
populacional.
EXEMPLO:
Uma amostra aleatria de 200 alunos de uma universidade de 20.000 estudantes
revelou nota mdia amostral de 5,2. logo: x = 5,2 uma estimativa pontual da
verdadeira mdia dos 20.000 alunos.
78
principais
caractersticas
de
um
estimador
referem-se
no-
EXEMPLOS:
da cidade Y;
79
seja, X : N ;
, ou
).
x
seja uma distribuio
/ n
IC (x, (1 )%) = P x Z
x + Z
= 1
n
n
Ou
Geometricamente:
= n-1
2
1-
Z
2
Z
2
t
Os intervalos de confiana mais frequentemente utilizados so os de 90%, 95% e
99%. No quadro a seguir so apresentados os valores de Z requeridos para alguns
intervalos.
80
: nvel de significncia
Z: distribuio Normal
0,20
0,80
1,28
0,15
0,85
1,44
0,10
0,90
1,65
0,05
0,95
1,96
0,025
0,975
2,24
0,01
0,99
2,58
problemas prticos.
Quando desconhecemos 2, devemos estimar seu valor com base na amostra
disponvel. Neste caso, calcula-se a estimativa do desvio padro a partir da amostra por:
2
xi
1 n 2 i =1
2
S =
xi n
n 1 i =1
a raiz quadrada da
Varincia S .
Como o desvio-padro (s) uma varivel aleatria, a substituio simples e pura
do parmetro por s somente ser justificvel para amostras grandes, ou seja, n 30.
Em caso contrrio, introduz-se uma correo a qual consiste em usar a varivel tde
81
x
com n-1 g.l. ser dada por:
s/ n
S
IC ( , (1 a )%) = P x t .
n 1,
n
2
x + t
n 1,
2
P ( Z / 2 Z Z / 2 ) = 1 obtendo-se P f Z
pq
p f + Z
n
pq
= 1
n
P f Z
Sendo f =
f (1 f )
p f + Z
n
f (1 f )
= 1
n
A distribuio Chi-quadrado
Seja Z1; Z2; . . . ; Zn, n variveis aleatrias normais padro. Definimos a varivel
aleatria chi- quadrado como:
2 = Z12 + Z 22 + + Z n2
82
f( X 2i )
= n-1
1-
X2inferior
X2
X2superior
usar-se-
famlia
das
distribuies
chi-quadrado
2 .
Seja
ento
S2 (n 1)
IC ( 2 , (1 a)%) = P 2
2
[ n 1; /2]
S2 (n 1)
= 1
2[ n 1;(1 /2)]
S2 (n 1)
= 1
2[ n 1;(1 / 2)]
Exerccios:
1. Considerando uma amostra de 4 elementos extrada de uma populao com
distribuio normal forneceu mdia de 8,2 e desvio padro de 0,4. Construir um
intervalo de confiana para a mdia dessa populao com 95% e 99% de
confiana. Interprete os resultados.
83
25,2
25,6
25,3
25,0
25,4
5. Em uma amostra aleatria simples com 200 edifcios com 5 anos, em certa
cidade, 55% apresentaram problemas estticos relevantes aps entrega da obra.
Construir um IC para a proporo de edifcios da cidade que apresentaram
problemas estticos relevantes nos 5 primeiros anos. Use (1 ) = 95%.
13
13
15
15
17
14
15
14
16
14
84
10. Sabe-se que a variao das dimenses fornecidas por uma mquina independem
dos ajustes dos valores mdios. Duas amostras de dimenses das peas
produzidas forneceram:
Amostra 01: 12,2
12,4
12,1
12
12,7
13,7
13,9
14,1
13,9
12,4
85
PARTE XI
Teste de Hipteses
1. Introduo
Uma hiptese estatstica uma alternativa a respeito de um parmetro de uma
distribuio de probabilidade. Por exemplo, podemos formular a hiptese que a
produtividade diferente de 2,5 peas/hora. Formalmente isso escrito como:
H 0 : = 2,5 peas/hora
H1 : 2,5 peas/hora
H0 chamada de hiptese nula e H1 de hiptese alternativa. Nesse caso, a
alternativa formulada bilateral, mas tambm podem ser estabelecidas alternativas
unilaterais, tais como:
H 0 : = 2,5 peas/hora
86
n
Passo 3: Regio Crtica
O valor da estatstica do teste, no caso, o valor Z, calculado supondo que a
hiptese nula (H0) verdadeira. No entanto, o valor calculado pode estar associado a
uma probabilidade de ocorrncia muito baixa. Nesse caso, a hiptese nula deve ser
rejeitada e aceitamos a hiptese alternativa.
A regio crtica a regio onde H0 rejeitada. A rea da regio crtica igual ao
nvel de significncia (), que estabelece a probabilidade de rejeitar H0 quando ela
verdadeira.
Por exemplo, se utilizarmos o nvel de significncia de 5%, a probabilidade de
rejeitar H0 quando ela verdadeira igual a 5%. Na prtica, os valores usuais de alfa
so = 0,01;
0,05 ou 0,10.
Tipos de testes:
1. Unilateral direita
H 0 : = 0
H1 : > 0
2. Unilateral esquerda
H 0 : = 0
H1 : < 0
87
3. Bilateral
H 0 : = 0
H1 : 0
Passo 5: Concluso
Aceitar H0, implica que a hiptese nula no pode ser rejeitada!
Rejeitar H0 implica que temos evidencias estatsticas para rejeit-la com um risco
conhecido: .
2. H1 : b) > 0
c)
0
x 0
88
x 0
s
n
6. Regras de deciso
ou |t |> t , rejeita-se H 0 .
2
Exemplo1:
Uma populao tem desvio padro conhecido, sendo igual a 5mm. Se uma amostra de
50 elementos, obtida dessa populao, tem mdia igual a 46mm; podemos afirmar que a
media dessa populao superior a 43mm, ao nvel de significncia de 1%?
Exemplo 2:
Um fabricante afirma que a tenso mdia de ruptura dos cabos produzidos por
sua companhia no inferior a 500kgf. Uma amostra de 7 cabos foi ensaiada, obtendose os resultados (em kgf)
490
495
480
493
475
478
485
89
1. H 0 : 1 2 = d 0
a ) 1 2 < d 0
2. H1 : b) 1 2 > d 0
c) d
1
2
0
( x1 x2 ) d 0
12
n1
22
n2
6. Regras de deciso
(a ) a) se z < z , rejeita-se H 0 ;
(b) b) se z > z , rejeita-se H 0 ;
(c) c) se |z |> z , rejeita-se H 0 .
2
so desconhecidos e
supostamente iguais.
1. H 0 : 1 2 = d 0
90
a ) 1 2 < d 0
2. H1 : b) 1 2 > d 0
c) d
1
2
0
t=
( x1 x2 ) d 0
1 1
s 2p +
n1 n2
Onde:
s 2p =
6. Regras de deciso
Exemplo 4:
Dois tipos de solues qumicas foram ensaiados para se determinar os pH. Os
resultados obtidos foram:
soluo A:
7,50
7,54
7,51
7,53
7,50
soluo B:
7,49 7,50
7,51
7,52
7,50
7,51
so desconhecidos e
supostamente diferentes.
1. H 0 : 1 2 = d 0
a ) 1 2 < d 0
2. H1 : b) 1 2 > d 0
c) d
1
2
0
91
( x1 x2 ) d 0
s12 s22
+
n1 n2
v=
s12 s22
+
n1 n2
2
s12 s22
n1 + n2
n1 1 n2 1
6. Regras de deciso
Exemplo 5:
Uma mesma distancia foi medida 5 vezes por certo instrumento, antes e aps
sofrer uma calibrao.
antes: 100,8 101,3 100,6 99,5 100,1
depois: 100,5 100,4 100,5 100,3 100,3
Testar a hiptese de que no existe diferena entre os resultados obtidos antes e
aps a calibrao do instrumento. Usar = 5%.
1. H 0 : 1 2 = d 0
a ) 1 2 < d 0
2. H1 : b) 1 2 > d 0
c) d
1
2
0
92
Onde s =
(d
d )2
n 1
d=
d d0
s
n
d
n
d i = x1i x2i
6. Regras de deciso
Amostras
Operrio A
10,1
10,4
10,2
10,5
9,9
10,0
Operrio B
9,8
10,0
10,1
10,0
10,1
9,5
5.
1. H 0 : 2 = 2 0
a ) 2 < 02
2. H1 : b) 2 > 02
c) 2 2
0
93
2 =
(n 1) s 2
02
6. Regras de deciso
(a ) a ) se 2 < 21 , rejeita-se H 0 ;
(b) b) se 2 > 2 , rejeita-se H 0 ;
(c) c) se 2 < 21 , ou 2 > 2 , rejeita-se H 0 .
2
Exemplo 7:
As chapas de ao produzidas por certa indstria tm uma especificao tal que a
varincia de suas espessuras (em mm) no deve ser superior a 0,0009mm2. Uma
indstria de 10 chapas tem espessura (em mm):
3,15
3,18
3,15
3,12
3,14
3,13
3,17
3,16
3,15
3,16
6.
Teste
para
populacionais 1 e
2
igualdade
de
duas
varincias
22 .
1. H 0 : 12 = 22
a ) 12 < 22
2. H1 : b) 12 > 22
c) 2 2
1
2
94
F=
s12
s22
6. Regras de deciso
A distribuio F de Snedecor
Sejam as v.a. independentes v21 e v22 , ento:
F (v1 , v2 ) = Fv1 ,v2
v2
v
=
= 2 1
v
2
v1
2
v2
v2
A distribuio F de Snedecor depende de dois parmetros:
v1 e v2 ,
so encontrados em
F1
1
(v1 , v2 )
Exemplo 8:
Foram testadas as durabilidades (em km) dos pneus das marcas A e B, obtendose para 5 pneus de cada marca os resultados:
marca A: 30000
32000
28000
26000
31000
marca B: 25000
30000
20000
21000
23000
95
7.
1. H 0 : p = p0
a ) p < p0
2. H1 : b) p > p0
c) p p
0
p p0
p0 (1 p0 )
n
6. Regras de deciso
Exemplo 9:
Para determinarmos se certo tipo de tratamento para evitar a corroso eficiente,
45 tubos de um total de 50 apresentaram resultados satisfatrios. Sabe-se que o
tratamento considerado eficiente se pelo menos 95% dos tubos apresentarem resultado
satisfatrio. Qual a concluso, ao nvel de significncia de 5%?
Exerccios
1. Os indivduos de um pas apresentam altura mdia de 170cm e desvio padro de 3cm.
Uma amostra de 80 indivduos apresentou mdia de 168,5cm. Podemos afirmar, ao
nvel de 1%, que essa amostra formada por indivduos daquele pas? R. Rejeita H0.
2. Lana-se uma moeda 100 vezes e observa-se que ocorrem 35 caras. Baseado nesse
resultado, podemos afirmar, ao nvel de 5%, que a moeda no honesta? R. Rejeita H0.
96
3. O salrio dos empregados metalrgicos gira em torno de 4,5 salrios mnimos, com
desvio padro de 0,5 salrios. Uma industria contrata 75 empregados, com um salrio
mdio de 4,3 s.m. Ao nvel de 10% podemos afirmar que essa indstria paga salrios
inferiores a mdia?R. Rejeita H0.
4. Um exame padro de inteligncia tem sido usado por vrios anos com mdia de 85
pontos e desvio padro de 5 pontos. Um grupo de 40 estudantes e ensinado, dando-se
nfase a resoluo de testes. Se esse grupo obtm mdia de 88 pontos no exame, h
razoes para se acreditar que a nfase dada mudou o resultado do teste ao nvel de 10%?
R. Rejeita H0.
5. Um fabricante de droga medicinal afirma que ela 80% ou mais eficaz na cura de
uma alergia, em um determinado perodo. Em uma amostra de 200 pacientes, a droga
curou 150 pessoas. Testar ao nvel de 10% se a pretenso do fabricante legtima.
R. Rejeita H0.
6. Em 600 lanamentos de um dado, obteve-se o ponto seis em 123 lanamentos. Aos
nveis de 5 e 1% de significncia, h razo para se desconfiar de que o dado seja viciado
quanto ao ponto seis? R. Rejeita H0, No Rejeita H0.
7. A resistncia a quebra de um fio usado na fabricao de material moldvel necessita
ser no mnimo 100psi. Experincia passada indicou que o desvio padro da resistncia a
quebra foi de 2psi. Uma amostra de nove espcimes testada e a resistncia mdia a
quebra b98psi. A fibra deve ser julgada como aceitvel ao nvel de 5% de
significncia? R.Rejeita H0.
8. Um teste de impacto Izod foi feito em 20 corpos de prova de tubo de PVC. O padro
ASTM para esse material requer que a resistncia ao impacto Izod seja maior que
1, 0 ft lb / in. A mdia e o desvio padro obtidos da amostra foram x = 1,25 e s = 0,25,
respectivamente. Teste H0 : = 1,0 versus H1 : > 1,0, usando = 0,01 e retire
concluses. R. Rejeita H0.
9. Uma mquina automtica de enchimento usada para encher garrafas com detergente
lquido. Uma amostra aleatria de 20 garrafas resulta em uma varincia da amostra do
volume de enchimento de s2 = 0,0153. Se a varincia do volume de enchimento exceder
0,01, existir a uma proporo inaceitvel de garrafas cujo enchimento no foi completo
e cujo enchimento foi em demasia. H evidencia nos dados da amostra sugerindo que o
fabricante tenha um problema com garrafas cheias com falta e excesso de detergente?
R.No Rejeita H0.
10. Dois tipos de plsticos so adequados para por um fabricante de componentes
eletrnicos. A resistncia a quebra desse plstico importante. sabido que
1 = 2 = 1,0 psi. A partir de uma amostra aleatria de tamanho n1 = 10 e n2 = 12,
obtemos x1 = 162,5 e x2 = 155,0. A companhia no adotara o plstico 1, a menos que
sua resistncia media a quebra exceda aquela do plstico 2 por, no mnimo, 10 psi.
Baseados na informao da amostra, eles deveriam usar o plstico 1? Use = 5%.
R. Rejeita H0.
97
15. Lana-se uma moeda 100 vezes e observa-se que ocorrem 40 caras. Baseado nesse
resultado, podemos afirmar, ao nvel de 5% que a moeda no honesta?
R. A moeda desonesta. Rejeita H0.
16. Uma pea ao ser fabricada, foi planejada de tal maneira que uma de suas dimenses
10cm. A varincia do processo produtivo de 0,0095cm2. Se uma amostra de 40 peas
fornece essa dimenso mdia igual a 10,05cm, devemos rejeitar a hiptese nula de que
x = 10cm, em favor da alternativa 10cm? (Usar = 0,05).
R. Rejeita H0.
17. Uma fbrica produz certo tipo de reguladores de presso. Esses reguladores so
produzidos para suportar uma presso de 20atm. Um ensaio realizado com uma
amostra de 7 reguladores de presso e verificou-se que as presses suportadas so (em
atm)
19,5 18,9 19,0 19,1 18,9 19,3 19,0
98
Com base no ensaio realizado, podemos concluir que a presso suportada na realidade
menor que 20atm? Usar = 0,01.
R. Rejeita H0.
18. Duas amostras de tubos de ao das marcas A e B foram ensaiadas e as resistncias
mdias obtidas foram de 40kgf/mm2 e 35kgf/mm2, com varincias de 5,0 e 4,0
(kgf/mm2)2,respectivamente. Sabendo-se que foram ensaiados 15 tubos de cada marca,
h evidencia, ao nvel de 1% de que a resistncia mdia dos tubos da marca A seja
maior que a de marcaB? Supor que as varincias populacionais sejam iguais.
R. Rejeita H0.
19. Duas mquinas A e B produzem parafusos, e sabe-se que as varincias dos
comprimentos dos parafusos so 25mm2 e 20mm2, respectivamente. Uma amostra de 40
parafusos da mquina A apresentou comprimento mdio de 30mm, enquanto que uma
amostra de 50 parafusos da mquina B apresentou mdia de 25mm. Existe uma
diferena significativa entre os comprimentos mdios dos parafusos fabricados pelas
duas mquinas, ao nvel de 5%?
R. Rejeita H0.
20. Foram ensaiadas vlvulas das marcas A e B, e verificou-se que os tempos de vida
(em h) foram
marca A:
1500 1450 1480 1520 1510
marca B:
1000 1300 1180 1250
Pode-se concluir, ao nvel de significncia de 1%, que o tempo mdio de vida das
vlvulas de marca A supera o de B em mais de 300h? Supor que os desvios padres
populacionais so diferentes.
R. No possvel. No Rejeita H0.
99
PARTE XII
ANOVA (Anlise de Varincia)
1. Introduo
Um problema que se apresenta com maior freqncia do que outro na anlise estatstica
o de avaliar se duas ou mais amostras diferem significativamente com relao a alguma
varivel.
Em funo disso, necessrio um mtodo estatstico para solucionar problemas dessa
natureza. Um dos mtodos mais utilizados para solucionar tais problemas conhecido como
Variao dentro dos grupos (within-group variation): diferena entre cada indivduo
em relao mdia das observaes do grupo ao qual pertence (tambm chamado de
erro de amostragem).
100
1.1
Uma anlise de varincia s deve ser aplicada a um conjunto de dados quando este
atender
quatro
pressuposies:
aditividade,
independncia,
normalidade
Para que a independncia seja garantida os erros ou desvios eij, devidos ao efeito de
fatores no controlados, devem ser independentes para isso, necessrio que as parcelas
tenham sido escolhidas levando-se em considerao os critrios de aleatorizao,
delineamento e esquema amostral.
Para analisar a normalidade dos dados, estes devem se ajustar a uma distribuio
normal de probabilidades, ou seja, os erros ou desvios eij, devidos ao efeito de fatores
no controlados, devem possuir uma distribuio normal de probabilidade. Quando se
verifica a falta de normalidade dos dados, usamos transformaes matemticas, para
que os mesmos sejam normalmente distribudos.
Estudando a Homocedasticidade, ou seja, a homogeneidade de varincias,
verificaremos que os erros ou desvios eij devidos ao efeitos no controlados, devem
possuir uma varincia comum 2. Isto significa que a variabilidade das repeties de um
tratamento deve ser semelhante outros tratamentos, isto , os tratamentos devem
possuir varincias homogneas.
Constatada a hetorecedasticidade, devemos verificar se ela regular ou irregular.
Transformao logartmica -
x;
x / 100 ;
log x ou ln x
101
1.2
Testes de Hipteses
versus
H1: Para pelo menos um Tratamento as mdias no so iguais, existe efeito tratamento
(Hiptese alternativa).
A rejeio de H0 implica a aceitao da hiptese alternativa H1.
Ao testarmos as hipteses podemos cometer dois tipos de erros, os quais so: rejeitar
H0, quando ela verdadeira (erro tipo I) ou aceitar H0, quando ela falsa (erro tipo II).
Dos dois tipos de erros o mais importante o do tipo I. A probabilidade de cometermos
o erro do tipo I chamada de nvel de significncia (). Os nveis de significncia mais usuais
so 5% e 1%.
O quadro a seguir resume a natureza dos erros envolvidos no processo de deciso
quando testamos as hipteses:
1.3
H0 Verdadeira
H1 Falsa
Rejeio H0
Erro do Tipo I
Deciso correta
Aceitao H0
Deciso correta
Erro Tipo II
102
.....
kj
x11
x 21
x 31
.....
x k1
x 12
x 22
x 32
.....
x k2
x 13
x 23
x 33
.....
x k3
ni
x 1n
x 2n
x 3n
.....
x kn
Somas
X1
X2
X3
.....
Xk
Total
Mdias
X1
X2
X3
Xk
i = 1, 2, 3, . . ., k
j = 1, 2, 3, . . . , ni
Assim xij denota o valor da j-sima observao sujeito ao i-simo tratamento.
A mdia dos valores observados no i-simo grupo ser
ni
xi =
ij
i =1
i = 1, 2,..., k
ni
X=
1 k ni
xij
n i =1 j =1
ou
X=
1 k
ni xi
n i =1
H 0 = 1 = 2 = 3 = = k
* E a alternativa de que pelo menos um par de mdias seja diferente:
H1 = p q
para p q
103
k ni
xij
i =1 j =1
C=
n
k ni
SQTot = xij2 C
i =1 j =1
4 - Calcula-se a variao entre os tratamentos atravs da soma do quadrado dos
tratamentos (SQTrat);
2
ni
xij
i =1
SQTrat =
C
ni
i
SQTrat
k 1
QM Re s =
SQ Re s
nk
g.l.
Entre Tratamentos
k -1
SQTrat
QMTrat =
SQTrat
k 1
n-k
SQRes
QM Re s =
SQ Re s
nk
n-1
SQTot
(Resduo)
Total
Quadrado Mdios
Teste F (Fcal)
Fcal =
QMTrat
QM Re s
104
H 0 = 1 = 2 = 3 = = k =
contra
H1 = p q
Exemplo:
Foi realizado um experimento para analisar o efeito de certo polmero na
resistncia da madeira. Foi testado 4 tipos de polmeros A;B;C e D em 3 amostras de
madeira. O quadro a seguir mostra a resistncia (kgf) obtida. Faa a anlise de varincia
para verificar se existe diferena significativa entre os polmeros.
1.4
25
35
41
60
32
28
35
67
27
33
38
59
O teste F significativo, para mais que dois tratamentos, nos permite, apenas tirar
concluses muito gerais com relao ao comportamento dos tratamentos, indicando que
entre eles existem efeitos diferentes sobre a varivel analisada, nada nos informando
sobre quais os melhores (ou piores) tratamentos.
Para verificar esta diferena entre tratamentos, uma das maneiras a utilizao dos
procedimentos de comparaes mltiplas ou teste de comparaes de mdias.
Entre eles podemos citar: O teste t, Dunnett, Bonferroni, Scheff (contraste
ortogonais) e Tukey, Duncam, SNK, Scott-Knott (comparaes Mltiplas). Veremos
alguns deles.
105
1.4.1
Teste t de Student
J visto anteriormente nos testes de Hiptese, o teste t de Student serve para
testar mdias de dois tratamentos ou mdias de dois grupos de tratamentos (caso em que
o contraste tem mais de duas mdias envolvidas).
Quando aplicamos o teste t a um contraste qualquer, estamos interessados em
verificar se a estimativa do contrate difere ou no de zero ( valor que a constante deveria
assumir, se a hiptese de nulidade fosse verdadeira).
Ento, testamos H0: Y= 0
vs
H1: Y 0
1.4.2
O teste de Tukey
Serve para testar quaisquer dois contrastes entre duas mdias de tratamentos. O
nmero de contrastes que podem ser testados consiste no nmero de combinaes das
mdias, duas a duas. Assim, num experimento com 5 tratamentos, podemos testar at 10
contrastes. O teste exato quando temos o mesmo nmero de repeties nos
tratamentos.
um teste bastante rigoroso, e por isso, geralmente testado ao nvel de 5% de
probabilidade e atualmente um dos mais utilizados.
Aplicao do Teste:
Calcular a diferena mnima significativa do teste, representado por , da
i)
seguinte forma:
=q
QMRes
repeties
em que:
do resduo ( na vertical);
QMRes Quadrado Mdio Residual da ANAVA;
ii)
| Yi |=| m k m 1 |
106
iii)
( Y ) , com a
Observao:
1 Para a aplicao do teste de Tukey, as mdias no precisam ser colocadas em ordem
decrescente de valores. No entanto, se utilizarmos a ordem decrescente, a aplicao do
teste a mais simples.
EXEMPLO:
1 Fazer o teste de comparao de mdias de Tukey para o exemplo anterior referente
ao efeito do polmero na resistncia de certa madeira.
1.4.3
Teste de Dunnett
Este teste utilizado quando as nicas comparaes que interessam ao
Aplicao do Teste:
v)
QMRes
repeties
em que:
107
| Y1 |=| m 1 m controle |
| Y |=| m m
|
2
| Y
k 1
vii)
controle
|=| m k 1 m controle |
( Y ) , com a
Exemplo
1 Considerando o tratamento C como resistncia padro, fazer o teste de comparao
de mdias de Dunnett para o exemplo anterior referente ao efeito do polmero na
resistncia de certa madeira.
1.5
grande, de modo que a sensibilidade de deteco das diferenas nos tratamentos seja
reduzida por causa de um valor inflacionado da varincia, um plano melhor pode ser
bloquear a variao devida a essas unidades e, ento reduzir a variao extrnseca para
aquela calculada para blocos menores ou mais homogneos. Por exemplo, suponha que
estamos interessados em testar o efeito de trs catalisadores no rendimento de uma
reao. Digamos que realizamos o teste em 3 dias, fazendo cada um catalizador em dias
diferentes. Como a variao diria pode interferir na eficincia do catalizador, podemos
considerar cada dia como um bloco, e consequentemente diminuir o erro experimental.
O mais objetivo dos delineamentos de blocos aleatorizados aquele no qual
atribumos aleatoriamente cada tratamento uma vez para cada bloco. Tal esquema
experimental chamado de delineamento completamente aleatorizado em blocos, e
cada bloco constitui uma nica rplica dos tratamentos.
108
Totais
TRATAMENTOS
...
...
x11
x 12
...
x 1j
...
K1J
T1
x 21
x 22
...
x 2j
...
K2J
T2
...
...
...
...
...
...
...
...
x i1
x i2
...
x ij
...
KiJ
T3
...
...
...
...
...
...
x k1
x k2
...
x kj
...
Totais
B1
B2
...
Bj
...
K kJ
Tk
BJ
H1 = p q
para p q
k J
xij
i =1 j =1
C=
kJ
k J
SQTot = xij2 C
i =1 j =1
109
k 2
Ti
SQTrat = i =1 C
(SQBloc);
2
J
Bj
j =1
SQBloc =
C
k
SQTrat
;
k 1
QMBloc =
SQBloc
J 1
QM Re s =
SQ Re s
(k 1)( J 1)
g.l.
Quadrado Mdios
Entre Tratamentos
k -1
SQTrat
QMTrat =
SQTrat
k 1
Fcal =
QMTrat
QM Re s
Entre Blocos
J-1
SQBloc
QMBloc =
SQBloc
J 1
Fcal =
QMBloc
QM Re s
(k-1)(J-1)
SQRes
Jk- 1
SQTot
QM Re s =
(Resduo)
Total
Teste F (Fcal)
SQ Re s
( k 1)( J 1)
110
Exemplo: Quatro mquinas diferentes M1, M2, M3 e M4 esto sendo consideradas para a
produo de certo produto. Para comparar as mquinas, decidiu-se que seis operadores
diferentes sero usados em um delineamento em blocos completamente aleatorizado. As
mquinas foram atribudas de forma aleatria para cada operador. A operao da
mquina requer destreza fsica, e j foi antecipado que haver diferena entre os
operadores na velocidade em que cada um opera a mquina. A quantidade de tempo (em
segundos) foi registrada para a montagem do produto.
Teste a hiptese H0, no nvel se significncia de 0,05, de que as mquinas
trabalham na mesma mdia de velocidade.
Operador
Mquina
1.6
42,5
39,3
39,6
39,9
42,9
43,6
39,8
40,1
40,5
42,3
42,5
43,1
40,2
40,5
41,3
43,4
44,9
45,1
41,3
42,2
43,5
44,2
45,9
42,3
fatores
usando
observaes
repetidas
em
delineamento
completamente
tratamento define uma clula em nossa tabela. Ento, temos ab clulas, cada uma com
n observaes. Denotando por xijk a k-sima observao feita no i-simo nvel do fator A
e no j-simo nvel do fator B, as abn observaes so mostradas a seguir.
B
A
1
.
.
.
a
Total
1
x111
x112
.
.
.
x11n
x211
x212
.
.
.
x21n
.
.
.
x a11
2
x 121
x 122
.
.
.
x12n
x 221
x 222
.
.
.
x 22n
.
.
.
x a21
...
...
...
...
...
...
...
...
...
...
...
...
...
.
.
.
...
b
x 1b1
x 1b2
.
.
.
x1bn
x 2b1
x 2b2
.
.
.
x 2bn
.
.
.
x ab1
x a12
x a22
...
x ab2
.
.
.
.
.
.
x a1n
x a2n
B1
B2
Total
A1...
A2...
.
.
.
Aa...
.
.
.
...
...
x abn
Bb
Y...
ij e varincia 2 .
1. H 0' : 1 = 2 = ... = a = 0,
H1' : pelo menos um dos i' s diferente de zero.
2. H 0'' : 1 = 2 = ... = b = 0,
H1'' : pelo menos um dos 'j s diferente de zero.
112
a b n
xijk
i =1 j =1 k =1
C=
iJk
a b n
SQTot = xijk 2 C
i =1 j =1 k =1
fator A (SQFatorA);
2
b n
xijk
a
j =1 k =1
SQFatorA =
C
nb
i =1
fator B (SQFatorB);
113
2
a n
xijk
b
SQFatorB = i =1 k =1 C
an
j =1
Determina-se
Quadrado
Mdio
para:
FatorA
(QMTFatorA),
FatorB
QMFatorA =
SQFatorA
;
a 1
QMFatorB =
SQFatorB
;
b 1
QMInteraoAxB =
QM Re s =
SQInteraoAxB
(a 1)(b 1)
SQ Re s
ab(n 1)
g.l.
Soma dos
Quadrado Mdio
Teste F (Fcal)
quadrados
Efeito principal
Fator A
a-1
SQ F atorA
Fator B
b-1
SQFatorB
(a-1)(b-
SQ FatorA x B
QMFatorA =
SQFatorA
a 1
Fcal =
QMFatorA
QM Re s
QMFatorB =
SQFatorB
b 1
Fcal =
QMFatorB
QM Re s
Interao de dois
fatores AxB
Fcal =
QMInteraoAxB
QM Re s
114
1)
QMInteraoAxB =
SQInteraoAxB
( a 1)(b 1)
Dentro das
amostras (Resduo)
ab(n-1)
SQRes
Total
abn- 1
SQTot
QM Re s =
SQInteraoAxB
( a 1)(b 1)
Temperatura
(graus)
500
550
600
O1
227
221
187
208
174
202
Forno
O2
214
259
181
179
198
194
O3
225
236
232
198
178
213
O4
260
229
246
273
206
219
Exerccios:
1 - Para testar a tenso de ruptura de tijolos similares de seis furos de 3 olarias
diferentes,
foram colhidos 3 tijolos de cada olaria para a verificao. Exercendo uma presso em
cada tijolo para constatar a resistncia, foram obtidos os dados abaixo. Pode-se afirmar
que existe diferena significativa da tenso de ruptura entre os tijolos das olarias? Faa
uma comparao de mdias de Tukey a 5%.
R: no existe diferena.
115
3 - A anemia uma doena que afeta muitas pessoas e que pode ter diversas origens.
Pretendendo-se avaliar possveis diferenas entre diferentes tratamentos de estados
anmicos, planejou-se uma experincia com 120 indivduos anmicos, divididos
aleatoriamente em trs grupos de 40, aos quais se atribuiu a cada um, um dos
tratamentos. O primeiro tratamento era constitudo apenas por uma dieta rica em ferro.
O segundo tratamento combinava um suplemento de ferro com a dieta do primeiro
tratamento e o ltimo acrescentava um complexo vitamnico. No sentido de avaliar
possveis diferenas entre os tratamentos, efetuou-se uma ANAVA com base nos
valores de hemoglobina dos 120 indivduos aptos um perodo de 3 meses de tratamento.
Os resultados da ANAVA encontram-se na tabela seguinte. Complete a tabela nos
espaos apropriados.
116
117
118