A Distribui o Binomial

Departamento de Estatstica - IMECC - UNICAMP ME 323 - Introduo Teoria da Probabilidade - Prof.
Amorim Primeiro Semestre de 2013

Fascculo 1 ltima atualizao 18/03/13 17:00hs A distribuio binomial
Um experimento dito binrio se o conjunto de todos os seus resultados possveis possuir apenas dois elementos. Tal o caso do arremesso de uma moeda; o conjunto de todos os resultados possveis o seu espao amostral ={cara, coroa}. O arremesso de uma moeda um experimento aleatrio binrio particular, no sentido de que os dois resultados tem a mesma probabilidade. No caso geral, representamos o espao amostral por ={F, S} para fracasso e sucesso, com P{S}=p e P{F} = 1-p = q, com p(0, 1) p+q=1. Alguns experimentos so intrinsecamente binrios, como o caso do arremesso de uma moeda. Outros, no intrinsecamente binrios, como o arremesso de um dado, podem ser, em certas circunstncias, convenientemente binarizados. no caso do arremesso de um dado em que um resultado 6 significa sucesso e os demais fracasso. Nesse caso, o arremesso de um dado pode ser tratado como um experimento binrio, com P{S}=1/6. O jogo da Sena um experimento aleatrio com =50.063.860 resultados possveis. Do ponto de vista do apostador, contudo, existem apenas dois resultados possveis: Sucesso, com probabilidade ( ) , ou fracasso. Genericamente representaremos os experimentos binrios por Bp. Conceitualmente to simples e to presentes no dia a dia, eles o, a porta de entrada natural no estudo da Teoria da Probabilidade. Conforme veremos, experimentos aleatrios complexos e de grande interesse terico e prtico podem ser compostos combinando-se repeties sob diversos esquemas, de um mesmo experimento binrio. Vamos tratar aqui do experimento composto por n repeties sucessivas e independentes de um mesmo experimento binrio B p, com n pr fixado. Ao experimento composto assim formado, representaremos por . Para estudar essa famlia de experimentos, vamos comear por baixo, com n=3. O espao amostral tem, nesse caso, 8 elementos: 3 = {F, S}{F, S}{F, S} = {FFF FFS FSF SFF FSS SFS SSF SSS} Partindo de P{S}=p, a probabilidade de qualquer evento unitrio de 3 pode ser determinado: P{FFF} = q
3
P{FFS} = P{FSF} = P{SFF} = pq
P{FSS} = P{SFS} = P{SSF} = p q e P{SSS} = p
Em experimentos compostos por n repeties sucessivas e independentes de B p, estar-se interessado no nmero total de sucessos, sendo irrelevante a sequncia particular de resultados parciais que levou a tal resultado global. Vamos pois definir a funo real que associa a cada elemento de 3 o numero de sucessos corespondente. Para o caso n=3 esta funo est representada na tabela abaixo: X() FFF 0 FFS 1 FSF 1 SFF 1 FSS 2 SFS 2 SSF 2 SSS 3
A funo X uma varivel aleatria. Ela assume valores em X = {0 1 2 3 }. Podemos ento deduzir a funo de distribuio de probabilidade da varivel aleatria X: P{X=0} = P{FFF} = q
3
P{X=1} = P{ FFS FSF SFF } = 3pq
P{X=2} = P{ FSS SFS SSF } = 3p q e P{X=3} = P{SSS} = P
interessante notar que, coerentemente, P{X=0} + P{X=1} + P{X=2} + P{X=3} = q + 3pq + 3p q + p = (p+q) = 1 Para n=4, cada elemento do 3 se desdobra em 2, com FFF gerando FFFF e FFFS, FFS gerando FFSF e FFSS e assim 4 por diante. O nmero de elementos de 4 2 =16 e 4 = { 0 1 2 3 4 }. Para determinar, por exemplo, P{X=2}, temos que contar o nmero de sequncias em 4 que apresentam exatamente 2 sucessos: vez que cada uma dessas 6 sequncias tem probabilidade p q , temos P{X=2} = 6p q .
2 2 2 2 3 2 2 3 3
. Assim, uma
Departamento de Estatstica - IMECC - UNICAMP ME 323 - Introduo Teoria da Probabilidade - Prof. Amorim Primeiro Semestre de 2013
Generalizando para n qualquer, temos n com 2 elementos, X={0 1 2 3 n} e { E, coerentemente { }
( )
n
A associao estreita da distribuio de probabilidades da varivel aleatria X assim definida (nmero de sucessos em n repeties independentes de Bp) com o binmio de Newton, sugeriu o seu nome: distribuio binomial. Dizemos que essa varivel aleatria tem distribuio binomial com parmetros n e p, ou X~b(n, p). Exemplos: 1 Em dez arremessos de uma moeda, qual a probabilidade de se obter exatamente 5 caras? Seja X o nmero de caras em dez arremessos de uma moeda. Ento X~b(10, 0,5), e: { }
( )
2 Qual a probabilidade de que em 20 arremessos de um dado se obtenha o 6 exatamente 4 vezes? Vamos binarizar o experimento D6, definindo o resultado 6 como S e os demais como F, e X o n~mero de Ss em 20 repeties. Ento X~b(20, 1/6) e { } ( ) ( ) ( ) ( )
3 Em determinada linha de produo, cada item produzido tem probabilidade 0,001 de sair com algum defeito desqualificante. Os itens so embalados em pacotes com 1000 unidades cada. Pegue um desses pacotes ao acaso. Qual a probabilidade de que o pacote mais que dois itens defeituosos? Como cada item produzido pode ser defeituoso ou no, podemos considerar a produo de cada item coo um experimento aleatrio binrio. O nmero de defeituosos num lote de mil itens produzidos vamos cham-lo de X segue ento uma distribuio b(1000, 0,001), com ( ) { } , portanto P{X=0} = 0,999
1000
= 0,3677
999
P{X=1} = 10000,0010999
2
= 0,3681
998
P{X=2} = 499.5000,001 0,999 e
0 = 0,1840
P{X>2} = 1 0,3677 0,3681 0,1840 = 0,0802
Conclumos que cerca de 8% dos pacotes contero mais que dois itens defeituosos. 4 No exemplo acima imagine um lote com 50 pacotes. Quantos deles contm mais que dois itens defeituosos cada? Na produo de um pacote (contendo mil itens, lembra-se?), a probabilidade dele sair com mais de 2 itens defeituosos 0,0802. Novamente, temos um experimento binrio dentro de nosso problema. Em cinquenta pacotes, seja Y o nmero deles naquela condio (vamos cham-los pacotes tipo A3). Ento
Y~b(50, 0,0802). Essa questo no admite, pois, uma resposta fechada. O nmero de pacotes com mais de 2 defeituosos no lote uma varivel aleatria que pode, em princpio, assumir qualquer valor no conjunto {0 1 2 3 4 49 50}. Vejamos com que probabilidades:
y P{y} 0 0,0153 1 0,0667 2 0,1424 3 0,1988 4 0,2037 5 0,1634 6 0,1069 7 0,0586 8 0,0275 9 0,0112 10 0,0040
Na figura abaixo, a representao grfica da distribuio de probabilidades b(50, 0,0802)

0.25 0.20 P{Y=y} 0.15 0.10 0.05 0.00 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 y (nmero de pacotes com mais que dois itens defeituosos)
Note como no nos preocupamos em representar na tabela valores de Y maiores que 10 e nem, na figura, valores de Y maiores que 20. Embora em princpio Y possa assumir valores at 50, a probabilidade de um lote com mais que 20 pacotes do tipo A3 de apenas 65,5 trilionsimos. 5 O aluno A domina 70% do programa oficial de Matemtica do colegial, e isto significa que, de todas as questes que podem ser formuladas cobrindo aquele material, ele capaz de responder corretamente 70%. Outro aluno, B, sabe 50%. Duas listas de 10 questes so selecionadas ao acaso e independentemente, de um lote de milhares de questes cobrindo de forma homognea o programa oficial de matemtica do segundo grau. Uma dada ao aluno A e a outra a B. Qual a probabilidade de que A tire uma nota menor que B? Primeiro vamos convencionar que (a) a nota do aluno igual ao nmero de questes respondidas corretamente; (b) o aluno sempre responde corretamente a questo que sabe, e no consegue responder a que no sabe; (c) no h parcialmente certo. Sejam X e Y as notas de A e B, respectivamente. Ento X~b(10, 0,70) e Y~b(10, 0,50). Elas so independentes, logo P{X=x e Y=y} = P{X=x}P{Y=y} =
( ) ( )
A tabela abaixo mostra a distribuio conjunta de X e Y. Nas margens, as distribuies marginais de X e de Y. A diagonal principal, sombreada, indica as possibilidades de empate, com respectivas probabilidades. Abaixo da diagonal principal, os resultados em que X>Y; acima, Y>X. somando as respectivas parcelas, temos P{X>Y} = 0,7529, P{=Y} = 0,1178 e P{X<Y} = 0,1293.
P{X=x} P{Y=y} 0 1 2 3 x 4 5 y P{X=x} 0 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 1 0,0000 0,0000 0,0000 0,0001 0,0004 0,0010 2 0,0000 0,0000 0,0001 0,0004 0,0016 0,0045 3 0,0000 0,0000 0,0002 0,0011 0,0043 0,0121 4 0,0000 0,0000 0,0003 0,0018 0,0075 0,0211 5 0,0000 0,0000 0,0004 0,0022 0,0090 0,0253 6 0,0000 0,0000 0,0003 0,0018 0,0075 0,0211 7 0,0000 0,0000 0,0002 0,0011 0,0043 0,0121 8 0,0000 0,0000 0,0001 0,0004 0,0016 0,0045 9 0,0000 0,0000 0,0000 0,0001 0,0004 0,0010 10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0000 0,0001 0,0014 0,0090 0,0368 0,1029
6 7 8 9 10 P{Y=y}
0,0002 0,0003 0,0002 0,0001 0,0000 0,0010
0,0020 0,0026 0,0023 0,0012 0,0003 0,0098
0,0088 0,0117 0,0103 0,0053 0,0012 0,0439
0,0235 0,0313 0,0274 0,0142 0,0033 0,1172
0,0410 0,0547 0,0479 0,0248 0,0058 0,2051
0,0492 0,0657 0,0575 0,0298 0,0070 0,2461
0,0410 0,0547 0,0479 0,0248 0,0058 0,2051
0,0235 0,0313 0,0274 0,0142 0,0033 0,1172
0,0088 0,0117 0,0103 0,0053 0,0012 0,0439
0,0020 0,0026 0,0023 0,0012 0,0003 0,0098
0,0002 0,0003 0,0002 0,0001 0,0000 0,0010
0,2001 0,2668 0,2335 0,1211 0,0282 1,0000
Como se v, B pode bem acabar com nota superior de A.
Testes de Hipteses e o Conceito de Significncia Estatstica

Vamos usar a distribuio binomial no contexto de pesquisa de opinio para introduzir o conceito de teste de hipteses e de significncia estatstica, que sero mais tarde estendidos a um contexto mais geral. Contexto: O prefeito de uma grande cidade foi eleito com 50% dos votos. Alguns meses depois da posse ele quer saber se a percentagem p de eleitores que votariam nele se a eleio tivesse, por algum motivo, que ser repetida, seria os mesmos 50% ou se seria diferente. No contexto de teste de hipteses estatsticas, a hiptese conservadora, de que nada mudou, denominada hiptese nula (Ho), a outra, a hiptese alternativa (H1). Nesse exemplo, temos: Ho : p = 0,50 e H1 : p 0,50 Para esclarecer esta dvida o prefeito aciona o Departamento de Estatstica da Secretaria de Planejamento. O Estatstico Chefe decide, juntamente com a sua equipe, fazer uma pesquisa de opinio por amostragem aleatria, com uma amostra de n=100 eleitores. Assim, se a taxa de apoio ao prefeito continua em 50%, eles sabem que o nmero de respostas favorveis vamos represent-lo por X ser uma varivel aleatria com distribuio b(100, 0,50), representada na figura abaixo. Nela valores de X inferiores a 20 ou superiores a 80 no foram representados para permitir maior detalhamento da -10 regio central. Os 40 valores excludos do grfico totalizam probabilidade igual a apenas 2,70210 .
0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0
30
52
70
20
22
24
26
28
32
34
36
38
40
42
44
46
48
50
54
56
58
60
62
64
66
68
72
74
76
78
A equipe sabe, portanto, que caso a taxa original ainda persista, o nmero de respostas favorveis na pesquisa ser algo em torno de 50. Um resultado muito acima 50 seria prova que a taxa de apoio ao prefeito teria aumentado desde a posse. Por outro lado, um resultado muito abaixo de 50 comprovaria o contrrio. A ideia aqui a seguinte: como resultado igual a, por exemplo, 75, probabilisticamente incompatvel com Ho ( p=0,50), sua ocorrncia nos obrigaria a abandonar a hiptese nula Ho: em favor da alternativa H1: p>0,50. Da mesma forma, um resultado x=22, por exemplo, sendo tambm fortemente incompatvel com a hiptese nula, tambm nos obrigaria a rejeitar Ho, agora em favor de H1: p<0,50. Por outro lado,
80
valores prximos de 50, como x=46 ou x=53, por exemplo, sendo perfeitamente compatveis com Ho, no nos autorizariam a rejeitar Ho. A equipe formula ento uma regra de deciso: Valores muito grandes de X conclua que p cresceu desde a posse. Valores muito pequenos de X conclua que p decresceu desde a posse. Valores de X prximos do centro da distribuio X conclua que a pesquisa no trouxe evidncia estatstica de que p tenha se alterado desde a posse. O problema de como formular uma deciso objetiva e clara a partir dos dados da pesquisa parece resolvido, a menos de uma questo de ordem quantitativa: a partir de que valor de x se considera muito grande? Ou muito pequeno? Em outras palavras, quais so os valores crticos de corte? Para isto vamos introduzir o conceito de erros tipo I e tipo II.
Erro Tipo I e Erro Tipo II

Em problemas de deciso como esse existem dois tipos opostos de erro. Incorre-se em erro tipo I quando se rejeita uma hiptese nula correta. O erro tipo II consiste em no rejeitar Ho quando ela j no verdadeira. O esquema clssico de Teste de Hipteses define regras de deciso buscando controlar a probabilidade de erro tipo I. Vejamos como isto se d. No exemplo acima, vamos arbitrariamente estabelecer as seguintes regras de deciso: No rejeite Ho se 40X60, e rejeite caso contrrio. Neste caso, qual a probabilidade de se rejeitar Ho no caso em que Ho verdadeira, ou seja, p=0,5? Ora, basta calcularmos 1 P{40 X 60}, sob Ho, isto , sob a hiptese de que Xb(100, 0,50). { } { } ( ) ( )
Portanto, com esta regra de deciso, temos
Se voc acha que esta probabilidade suficientemente pequena, ento confirme a escolha de critrios: X pequeno demais se menor que 40, ou grande demais se maior que 60. No intervalo, considere que o resultado no caiu longe demais do centro da distribuio e conclua que ele no permite rejeitar Ho. Diga para o prefeito que, com base no resultado da pesquisa com 100 eleitores no houve evidncia suficiente para descartar Ho.
0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75
Na figura acima repetimos o grfico da funo de distribuio de probabilidades de uma b(100, 0,50), concentrando o foco ainda mais, e demarcando em verde a regio de no rejeio de H o, e em vermelho a regio de rejeio. A figura acima mostra a distribuio do resultado X quando Ho verdadeira. Vemos que a regra de deciso arbitrada deixa mesmo uma pequena probabilidade (no caso igual a 0,0352) do resultado cair na regio de rejeio, induzindo uma deciso errada. Poderamos reduzir esta probabilidade de erro tipo I, alargando a regio de no rejeio. Alargando a regio de no rejeio para {35X65} a probabilidade de erro tipo I cairia para 0,0009 (verifique os clculos), mas isto pode no ser muito bom. Pode ser pssimo. Existe um antagonismo entre os erros tipo I e tipo II, de forma que reduzir um implica em aumentar o outro. Alargando muito a regio de no rejeio, melhora-se a proteo contra a possibilidade de uma rejeio indevida de Ho, mas torna muito difcil a rejeio de Ho quando esta deixou de ser verdadeira. Para mostrar isto, vejamos o que aconteceria se, por exemplo, p houvesse crescido para 0,60. Sob essa condio, X~b(100, 0,60), com distribuio representada na figura abaixo, ainda com a definio por cores das regies de no rejeio e de rejeio de Ho. Vemos agora que a probabilidade de rejeio de Ho cresceu para 0,4621 e conclumos que, a probabilidade de no rejeio de H o quando p j cresceu para 0,60, ainda de frustrante 0,5379. A probabilidade de erro tipo II quando p=0,60 , portando, igual a 0,5379.
0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0
30
52
70
20
22
24
26
28
32
34
36
38
40
42
44
46
48
50
54
56
58
60
62
64
66
68
72
74
76
78
Casou houvssemos optado por uma maior proteo contra erro tipo I, alargando a regio de no rejeio de {40X60} para {35X65} probabilidade de erro tipo II seria (calcule) 0,8697. A probabilidade de erro tipo I geralmente representada pela letra grega , e o nvel de significncia do teste. Essa situao experimental muito insatisfatria, com probabilidade de erro tipo II elevada demais (teste muito pouco sensvel) para proteo razovel contra erro tipo I (com =0,35), mesmo com grande variao de p, s se se resolve investindo mais no experimento, aumentando o tamanho amostral n. Para n=1000 a definio de regio de no rejeio como {470X530} leva a =0,0537 enquanto que a probabilidade de erro tipo II para p=0,60 praticamente igual a zero (4,24 milionsimos).
80
Exerccios 1. Duas urnas tem 10 bolas cada. As bolas so idnticas, exceto na cor. Em U1 3 so pretas e as demais, brancas. Em U2 so 4 pretas e 6 brancas. Dois operadores atuam independentemente em uma urna cada, sorteando ao acaso uma bola, registrando a cor e devolvendo a bola urna, antes de repetir o experimento binrio. Cada operador repete a operao 10 vezes, registrando em X e em Y, respectivamente, o nmero de bolas pretas sorteadas. Calcule (use o computador): a. A matriz de probabilidades P{X=x e Y=y} b. P{X>Y}, P{X=Y} e P{X<y} c. Recalcule (a) e (b) se o nmero de bolas sorteadas da urna 1 for 9 e da urna 2, 11. Voc quer testar Ho: p=0,25 contra a alternativa H1: p0,25, com base em uma pesquisa por amostragem aleatria com n=400. a. b. c. 3. Determine a regio de no rejeio {aXb} para =P{erro tipo I}=0,05 (ou valor mais prximo possvel). Para esta escolha, calcule a probabilidade de erro tipo II, para p=0,30, p=0,35 e p=0,40. Refaa (a) e (b) para =0,10 e para =0,01.
2.
Voc quer testar Ho: p=0,25 contra a alternativa H1: p0,25, com base em uma pesquisa por amostragem aleatria. Com =0,05, qual deve ser o tamanho amostral para que a probabilidade de erro tipo I seja menor que 0,05 em p=0,30? Construa um teste para a hiptese nula Ho: p=0,10, com =0,05 ou valor mais prximo possvel que d probabilidade de rejeio de Ho igual a 0,80 quando p=0,12. Para este teste, trace a curva de P{rejeio de Ho} como funo de p.
4.

A Distribui o Binomial

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

A Distribui o Binomial

Încărcat de

Drepturi de autor:

Formate disponibile

Departamento de Estatstica - IMECC - UNICAMP ME 323 - Introduo Teoria da Probabilidade - Prof.

Amorim Primeiro Semestre de 2013

P{FFS} = P{FSF} = P{SFF} = pq

P{FSS} = P{SFS} = P{SSF} = p q e P{SSS} = p

P{X=1} = P{ FFS FSF SFF } = 3pq

P{X=2} = P{ FSS SFS SSF } = 3p q e P{X=3} = P{SSS} = P

P{X=2} = 499.5000,001 0,999 e

P{X>2} = 1 0,3677 0,3681 0,1840 = 0,0802

Na figura abaixo, a representao grfica da distribuio de probabilidades b(50, 0,0802)

0,0002 0,0003 0,0002 0,0001 0,0000 0,0010

0,0020 0,0026 0,0023 0,0012 0,0003 0,0098

0,0088 0,0117 0,0103 0,0053 0,0012 0,0439

0,0235 0,0313 0,0274 0,0142 0,0033 0,1172

0,0410 0,0547 0,0479 0,0248 0,0058 0,2051

0,0492 0,0657 0,0575 0,0298 0,0070 0,2461

0,0410 0,0547 0,0479 0,0248 0,0058 0,2051

0,0235 0,0313 0,0274 0,0142 0,0033 0,1172

0,0088 0,0117 0,0103 0,0053 0,0012 0,0439

0,0020 0,0026 0,0023 0,0012 0,0003 0,0098

0,0002 0,0003 0,0002 0,0001 0,0000 0,0010

0,2001 0,2668 0,2335 0,1211 0,0282 1,0000

Como se v, B pode bem acabar com nota superior de A.

Testes de Hipteses e o Conceito de Significncia Estatstica

Erro Tipo I e Erro Tipo II

Portanto, com esta regra de deciso, temos

0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75

S-ar putea să vă placă și