Documente Academic
Documente Profesional
Documente Cultură
Em experimentos compostos por n repeties sucessivas e independentes de B p, estar-se interessado no nmero total de sucessos, sendo irrelevante a sequncia particular de resultados parciais que levou a tal resultado global. Vamos pois definir a funo real que associa a cada elemento de 3 o numero de sucessos corespondente. Para o caso n=3 esta funo est representada na tabela abaixo: X() FFF 0 FFS 1 FSF 1 SFF 1 FSS 2 SFS 2 SSF 2 SSS 3
A funo X uma varivel aleatria. Ela assume valores em X = {0 1 2 3 }. Podemos ento deduzir a funo de distribuio de probabilidade da varivel aleatria X: P{X=0} = P{FFF} = q
3
interessante notar que, coerentemente, P{X=0} + P{X=1} + P{X=2} + P{X=3} = q + 3pq + 3p q + p = (p+q) = 1 Para n=4, cada elemento do 3 se desdobra em 2, com FFF gerando FFFF e FFFS, FFS gerando FFSF e FFSS e assim 4 por diante. O nmero de elementos de 4 2 =16 e 4 = { 0 1 2 3 4 }. Para determinar, por exemplo, P{X=2}, temos que contar o nmero de sequncias em 4 que apresentam exatamente 2 sucessos: vez que cada uma dessas 6 sequncias tem probabilidade p q , temos P{X=2} = 6p q .
2 2 2 2 3 2 2 3 3
. Assim, uma
Departamento de Estatstica - IMECC - UNICAMP ME 323 - Introduo Teoria da Probabilidade - Prof. Amorim Primeiro Semestre de 2013
Generalizando para n qualquer, temos n com 2 elementos, X={0 1 2 3 n} e { E, coerentemente { }
( )
n
A associao estreita da distribuio de probabilidades da varivel aleatria X assim definida (nmero de sucessos em n repeties independentes de Bp) com o binmio de Newton, sugeriu o seu nome: distribuio binomial. Dizemos que essa varivel aleatria tem distribuio binomial com parmetros n e p, ou X~b(n, p). Exemplos: 1 Em dez arremessos de uma moeda, qual a probabilidade de se obter exatamente 5 caras? Seja X o nmero de caras em dez arremessos de uma moeda. Ento X~b(10, 0,5), e: { }
( )
2 Qual a probabilidade de que em 20 arremessos de um dado se obtenha o 6 exatamente 4 vezes? Vamos binarizar o experimento D6, definindo o resultado 6 como S e os demais como F, e X o n~mero de Ss em 20 repeties. Ento X~b(20, 1/6) e { } ( ) ( ) ( ) ( )
3 Em determinada linha de produo, cada item produzido tem probabilidade 0,001 de sair com algum defeito desqualificante. Os itens so embalados em pacotes com 1000 unidades cada. Pegue um desses pacotes ao acaso. Qual a probabilidade de que o pacote mais que dois itens defeituosos? Como cada item produzido pode ser defeituoso ou no, podemos considerar a produo de cada item coo um experimento aleatrio binrio. O nmero de defeituosos num lote de mil itens produzidos vamos cham-lo de X segue ento uma distribuio b(1000, 0,001), com ( ) { } , portanto P{X=0} = 0,999
1000
= 0,3677
999
P{X=1} = 10000,0010999
2
= 0,3681
998
0 = 0,1840
Conclumos que cerca de 8% dos pacotes contero mais que dois itens defeituosos. 4 No exemplo acima imagine um lote com 50 pacotes. Quantos deles contm mais que dois itens defeituosos cada? Na produo de um pacote (contendo mil itens, lembra-se?), a probabilidade dele sair com mais de 2 itens defeituosos 0,0802. Novamente, temos um experimento binrio dentro de nosso problema. Em cinquenta pacotes, seja Y o nmero deles naquela condio (vamos cham-los pacotes tipo A3). Ento
Departamento de Estatstica - IMECC - UNICAMP ME 323 - Introduo Teoria da Probabilidade - Prof. Amorim Primeiro Semestre de 2013
Y~b(50, 0,0802). Essa questo no admite, pois, uma resposta fechada. O nmero de pacotes com mais de 2 defeituosos no lote uma varivel aleatria que pode, em princpio, assumir qualquer valor no conjunto {0 1 2 3 4 49 50}. Vejamos com que probabilidades:
y P{y} 0 0,0153 1 0,0667 2 0,1424 3 0,1988 4 0,2037 5 0,1634 6 0,1069 7 0,0586 8 0,0275 9 0,0112 10 0,0040
Note como no nos preocupamos em representar na tabela valores de Y maiores que 10 e nem, na figura, valores de Y maiores que 20. Embora em princpio Y possa assumir valores at 50, a probabilidade de um lote com mais que 20 pacotes do tipo A3 de apenas 65,5 trilionsimos. 5 O aluno A domina 70% do programa oficial de Matemtica do colegial, e isto significa que, de todas as questes que podem ser formuladas cobrindo aquele material, ele capaz de responder corretamente 70%. Outro aluno, B, sabe 50%. Duas listas de 10 questes so selecionadas ao acaso e independentemente, de um lote de milhares de questes cobrindo de forma homognea o programa oficial de matemtica do segundo grau. Uma dada ao aluno A e a outra a B. Qual a probabilidade de que A tire uma nota menor que B? Primeiro vamos convencionar que (a) a nota do aluno igual ao nmero de questes respondidas corretamente; (b) o aluno sempre responde corretamente a questo que sabe, e no consegue responder a que no sabe; (c) no h parcialmente certo. Sejam X e Y as notas de A e B, respectivamente. Ento X~b(10, 0,70) e Y~b(10, 0,50). Elas so independentes, logo P{X=x e Y=y} = P{X=x}P{Y=y} =
( ) ( )
A tabela abaixo mostra a distribuio conjunta de X e Y. Nas margens, as distribuies marginais de X e de Y. A diagonal principal, sombreada, indica as possibilidades de empate, com respectivas probabilidades. Abaixo da diagonal principal, os resultados em que X>Y; acima, Y>X. somando as respectivas parcelas, temos P{X>Y} = 0,7529, P{=Y} = 0,1178 e P{X<Y} = 0,1293.
P{X=x} P{Y=y} 0 1 2 3 x 4 5 y P{X=x} 0 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 1 0,0000 0,0000 0,0000 0,0001 0,0004 0,0010 2 0,0000 0,0000 0,0001 0,0004 0,0016 0,0045 3 0,0000 0,0000 0,0002 0,0011 0,0043 0,0121 4 0,0000 0,0000 0,0003 0,0018 0,0075 0,0211 5 0,0000 0,0000 0,0004 0,0022 0,0090 0,0253 6 0,0000 0,0000 0,0003 0,0018 0,0075 0,0211 7 0,0000 0,0000 0,0002 0,0011 0,0043 0,0121 8 0,0000 0,0000 0,0001 0,0004 0,0016 0,0045 9 0,0000 0,0000 0,0000 0,0001 0,0004 0,0010 10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0000 0,0001 0,0014 0,0090 0,0368 0,1029
Departamento de Estatstica - IMECC - UNICAMP ME 323 - Introduo Teoria da Probabilidade - Prof. Amorim Primeiro Semestre de 2013
6 7 8 9 10 P{Y=y}
30
52
70
20
22
24
26
28
32
34
36
38
40
42
44
46
48
50
54
56
58
60
62
64
66
68
72
74
76
78
A equipe sabe, portanto, que caso a taxa original ainda persista, o nmero de respostas favorveis na pesquisa ser algo em torno de 50. Um resultado muito acima 50 seria prova que a taxa de apoio ao prefeito teria aumentado desde a posse. Por outro lado, um resultado muito abaixo de 50 comprovaria o contrrio. A ideia aqui a seguinte: como resultado igual a, por exemplo, 75, probabilisticamente incompatvel com Ho ( p=0,50), sua ocorrncia nos obrigaria a abandonar a hiptese nula Ho: em favor da alternativa H1: p>0,50. Da mesma forma, um resultado x=22, por exemplo, sendo tambm fortemente incompatvel com a hiptese nula, tambm nos obrigaria a rejeitar Ho, agora em favor de H1: p<0,50. Por outro lado,
80
Departamento de Estatstica - IMECC - UNICAMP ME 323 - Introduo Teoria da Probabilidade - Prof. Amorim Primeiro Semestre de 2013
valores prximos de 50, como x=46 ou x=53, por exemplo, sendo perfeitamente compatveis com Ho, no nos autorizariam a rejeitar Ho. A equipe formula ento uma regra de deciso: Valores muito grandes de X conclua que p cresceu desde a posse. Valores muito pequenos de X conclua que p decresceu desde a posse. Valores de X prximos do centro da distribuio X conclua que a pesquisa no trouxe evidncia estatstica de que p tenha se alterado desde a posse. O problema de como formular uma deciso objetiva e clara a partir dos dados da pesquisa parece resolvido, a menos de uma questo de ordem quantitativa: a partir de que valor de x se considera muito grande? Ou muito pequeno? Em outras palavras, quais so os valores crticos de corte? Para isto vamos introduzir o conceito de erros tipo I e tipo II.
Se voc acha que esta probabilidade suficientemente pequena, ento confirme a escolha de critrios: X pequeno demais se menor que 40, ou grande demais se maior que 60. No intervalo, considere que o resultado no caiu longe demais do centro da distribuio e conclua que ele no permite rejeitar Ho. Diga para o prefeito que, com base no resultado da pesquisa com 100 eleitores no houve evidncia suficiente para descartar Ho.
Departamento de Estatstica - IMECC - UNICAMP ME 323 - Introduo Teoria da Probabilidade - Prof. Amorim Primeiro Semestre de 2013
Na figura acima repetimos o grfico da funo de distribuio de probabilidades de uma b(100, 0,50), concentrando o foco ainda mais, e demarcando em verde a regio de no rejeio de H o, e em vermelho a regio de rejeio. A figura acima mostra a distribuio do resultado X quando Ho verdadeira. Vemos que a regra de deciso arbitrada deixa mesmo uma pequena probabilidade (no caso igual a 0,0352) do resultado cair na regio de rejeio, induzindo uma deciso errada. Poderamos reduzir esta probabilidade de erro tipo I, alargando a regio de no rejeio. Alargando a regio de no rejeio para {35X65} a probabilidade de erro tipo I cairia para 0,0009 (verifique os clculos), mas isto pode no ser muito bom. Pode ser pssimo. Existe um antagonismo entre os erros tipo I e tipo II, de forma que reduzir um implica em aumentar o outro. Alargando muito a regio de no rejeio, melhora-se a proteo contra a possibilidade de uma rejeio indevida de Ho, mas torna muito difcil a rejeio de Ho quando esta deixou de ser verdadeira. Para mostrar isto, vejamos o que aconteceria se, por exemplo, p houvesse crescido para 0,60. Sob essa condio, X~b(100, 0,60), com distribuio representada na figura abaixo, ainda com a definio por cores das regies de no rejeio e de rejeio de Ho. Vemos agora que a probabilidade de rejeio de Ho cresceu para 0,4621 e conclumos que, a probabilidade de no rejeio de H o quando p j cresceu para 0,60, ainda de frustrante 0,5379. A probabilidade de erro tipo II quando p=0,60 , portando, igual a 0,5379.
0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0
30
52
70
20
22
24
26
28
32
34
36
38
40
42
44
46
48
50
54
56
58
60
62
64
66
68
72
74
76
78
Casou houvssemos optado por uma maior proteo contra erro tipo I, alargando a regio de no rejeio de {40X60} para {35X65} probabilidade de erro tipo II seria (calcule) 0,8697. A probabilidade de erro tipo I geralmente representada pela letra grega , e o nvel de significncia do teste. Essa situao experimental muito insatisfatria, com probabilidade de erro tipo II elevada demais (teste muito pouco sensvel) para proteo razovel contra erro tipo I (com =0,35), mesmo com grande variao de p, s se se resolve investindo mais no experimento, aumentando o tamanho amostral n. Para n=1000 a definio de regio de no rejeio como {470X530} leva a =0,0537 enquanto que a probabilidade de erro tipo II para p=0,60 praticamente igual a zero (4,24 milionsimos).
80
Departamento de Estatstica - IMECC - UNICAMP ME 323 - Introduo Teoria da Probabilidade - Prof. Amorim Primeiro Semestre de 2013
Exerccios 1. Duas urnas tem 10 bolas cada. As bolas so idnticas, exceto na cor. Em U1 3 so pretas e as demais, brancas. Em U2 so 4 pretas e 6 brancas. Dois operadores atuam independentemente em uma urna cada, sorteando ao acaso uma bola, registrando a cor e devolvendo a bola urna, antes de repetir o experimento binrio. Cada operador repete a operao 10 vezes, registrando em X e em Y, respectivamente, o nmero de bolas pretas sorteadas. Calcule (use o computador): a. A matriz de probabilidades P{X=x e Y=y} b. P{X>Y}, P{X=Y} e P{X<y} c. Recalcule (a) e (b) se o nmero de bolas sorteadas da urna 1 for 9 e da urna 2, 11. Voc quer testar Ho: p=0,25 contra a alternativa H1: p0,25, com base em uma pesquisa por amostragem aleatria com n=400. a. b. c. 3. Determine a regio de no rejeio {aXb} para =P{erro tipo I}=0,05 (ou valor mais prximo possvel). Para esta escolha, calcule a probabilidade de erro tipo II, para p=0,30, p=0,35 e p=0,40. Refaa (a) e (b) para =0,10 e para =0,01.
2.
Voc quer testar Ho: p=0,25 contra a alternativa H1: p0,25, com base em uma pesquisa por amostragem aleatria. Com =0,05, qual deve ser o tamanho amostral para que a probabilidade de erro tipo I seja menor que 0,05 em p=0,30? Construa um teste para a hiptese nula Ho: p=0,10, com =0,05 ou valor mais prximo possvel que d probabilidade de rejeio de Ho igual a 0,80 quando p=0,12. Para este teste, trace a curva de P{rejeio de Ho} como funo de p.
4.