Sunteți pe pagina 1din 38

Introduo Estimao

27

Introduo Estimao estimao pontual


1 - Introduo
No mdulo 1 Introduo Amostragem, foi tratado o problema da amostragem. Este um problema de grande importncia, pois como foi referido na altura, o nosso objectivo , a partir das propriedades estudadas na amostra, inferir propriedades para a Populao, nomeadamente estimar os parmetros desconhecidos, pelo que necessrio utilizar processos de amostragem que dem origem a bons estimadores e consequentemente boas estimativas, ou seja valores prximos dos parmetros a estimar. Acontece que as propriedades dos estimadores, como veremos neste mdulo, s podem ser estudadas se conseguirmos estabelecer um plano de amostragem que atribua a cada amostra seleccionada uma determinada probabilidade, e esta atribuio s pode ser feita com planos de amostragem aleatrios. Assim, importante termos sempre presente o princpio da aleatoriedade, quando vamos proceder a um estudo em que procuramos alargar para a Populao as propriedades estudadas na amostra.

2 - Distribuio de amostragem. Estimador centrado e no centrado. Preciso


Uma vez escolhido um plano de amostragem aleatrio, ao pretendermos estimar um parmetro, pode ser possvel utilizar vrias estatsticas (estimadores) diferentes. Por exemplo, quando pretendemos estudar a variabilidade presente numa Populao X, que pode ser medida pela varincia populacional 2, sabemos que podemos depois de recolher uma amostra, obter duas estimativas diferentes para essa varincia, substituindo os valores da amostra nas expresses dos estimadores

S =

i =1

(X i X)2 n1
ou

S =

(X
i=1 n

X )2

onde representamos por X1, X2, ..., Xn, variveis independentes, com distribuio

X
idntica de X e por X a mdia, ou seja, X =
i =1

Quais as razes que nos podem levar a preferir um dos estimadores relativamente ao outro? Qual o que fornece, de um modo geral, melhores estimativas? Intuitivamente desejaramos que as diferentes estimativas fornecidas por um estimador, para diferentes amostras, da mesma dimenso, no estivessem muito afastadas do parmetro que estamos a estimar! Se assim fosse teramos uma certa garantia de que

Maria Eugnia Graa Martins - DEIO

28

Introduo Estimao

a estimativa que se obtm para a amostra que se recolhe (na prtica s recolhemos uma amostra!) daria um valor aproximado do parmetro. Exemplo Consideremos o exemplo utilizado no mdulo 1 Introduo Amostragem, da populao constituda pelos deputados da X Legislatura, e suponhamos que se pretende estimar a idade mdia ou o valor mdio da caracterstica Idade (mdia das idades de todos os deputados). Vamos seleccionar 8 amostras aleatrias simples, de dimenso 10, e calcular as mdias das idades dos deputados das amostras seleccionadas:

Repare-se que as 8 mdias obtidas so diferentes umas das outras, mas esto relativamente prximas:

No esquema anterior assinalmos a posio do parmetro em estudo (48,7 anos), j que neste caso a dimenso da populao razoavelmente pequena, e facilmente se calculou a mdia das idades dos 230 deputados. Da figura anterior sobressai o seguinte: As mdias obtidas distribuem-se para um e outro lado do parmetro e A variabilidade apresentada pelas estimativas relativamente pequena, isto , as diferentes estimativas esto prximas do parmetro a estimar. Numa situao que tenha interesse, sob o ponto de vista estatstico, o parmetro em estudo desconhecido e no fcil de o calcular, como no caso deste exemplo, pelo que ter de ser estimado. Ento a pergunta que devemos fazer e para a qual vamos procurar dar resposta, a seguinte: Como se comportam, relativamente ao parmetro em estudo, todas as estimativas fornecidas por um dado estimador, para todas as amostras possveis? Como veremos a seguir, o estudo de um estimador feito atravs da sua distribuio de amostragem, ou seja, da distribuio dos valores obtidos pelo estimador, quando se

Introduo Estimao

29

consideram todas as amostras possveis, da mesma dimenso, que se podem extrair da Populao.

Distribuio de amostragem Distribuio de amostragem de um estimador a distribuio dos valores que o estimador assume para todas as possveis amostras, da mesma dimenso, da Populao. A maior parte das vezes no se consegue obter a distribuio de amostragem exacta, pois no est dentro dos limites do razovel, considerar todas as amostras possveis, mas tem-se uma distribuio aproximada, considerando um nmero suficientemente grande de amostras da mesma dimenso e calculando para cada uma delas o valor do estimador (problema a estudar posteriormente). O que que se entende por um bom estimador? Um critrio que costuma ser aplicado o de escolher um bom estimador como sendo aquele que centrado e que tem uma boa preciso. Escolhido um plano de amostragem, define-se: Estimador centrado Um estimador diz-se centrado quando o valor mdio da sua distribuio de amostragem for igual ao parmetro a estimar, ou seja, quando a mdia das estimativas obtidas para todas as amostras possveis que se podem extrair da Populao, segundo o esquema considerado, coincide com o parmetro a estimar. Quando se tem um estimador centrado, tambm se diz que no enviesado.

Maria Eugnia Graa Martins - DEIO

30

Introduo Estimao

No incio desta seco questionmos quais as razes que nos poderiam levar a preferir, para a varincia populacional, o estimador S2 relativamente a S2. Neste momento podemos dizer que o facto de S2 no apresentar enviesamento (a demonstrao desta propriedade sai fora do mbito deste curso). Aparece-nos, novamente a palavra enviesamento, que j nos tinha surgido no mdulo 1 Introduo Amostragem, mas agora noutro contexto. Efectivamente, relacionado com um processo de amostragem e com a escolha de um estimador, temos dois tipos de enviesamento: O associado com o processo de amostragem, isto , com a recolha da amostra, em que uma amostra enviesada o resultado do processo de amostragem no ser aleatrio; O associado com o estimador escolhido, para estimar o parmetro em estudo. Se o estimador no for centrado, diz-se que enviesado.

Para se evitar o enviesamento, necessrio estarmos atentos: primeiro na escolha do plano de amostragem e depois na escolha do estimador utilizado para estimar o parmetro desconhecido. O facto de utilizarmos um estimador centrado, no nos previne contra a obteno de ms estimativas, se o plano de amostragem utilizado sistematicamente favorecer uma parte da Populao (isto , fornecer amostras enviesadas).

Por outro lado, temos que ter outra preocupao com o estimador escolhido, que diz respeito preciso: Preciso Quando utilizamos um estimador para estimar um parmetro, e calculamos o seu valor para vrias amostras, obtm-se outras tantas estimativas. Estas estimativas no so iguais devido variabilidade presente na amostra. Se, no entanto, os diferentes valores obtidos para o estimador forem prximos, e o estimador for centrado, podemos ter confiana de que o valor calculado a partir da amostra recolhida (na prtica recolhe-se uma nica amostra) est prximo do valor do parmetro (desconhecido) a estimar. A falta de preciso e o problema do enviesamento da amostra so dois tipos de erro com que nos defrontamos num processo de amostragem (mesmo que tenhamos escolhido um bom estimador). No se devem, contudo, confundir. Enquanto o enviesamento se manifesta por um desvio nos valores da estatstica, relativamente ao valor do parmetro a estimar, sempre no mesmo sentido, a falta de preciso manifesta-se por uma grande variabilidade nos valores da estatstica, uns relativamente aos outros. Por outro lado, enquanto o enviesamento se reduz com o recurso a amostras aleatrias, a preciso aumenta-se aumentando a dimenso da amostra, como veremos mais tarde. Finalmente chama-se a ateno para o facto de que se o processo de amostragem originar uma amostra enviesada, aumentar a dimenso no resolve nada, antes pelo contrrio!

Introduo Estimao

31

Alis, so bem conhecidos alguns desastres, provocados por ms amostras, de que o caso seguinte um exemplo: A sondagem de 1936 do Literary Disgest (Tannenbaum, 1998) Nas eleies presidenciais de 1936 nos EUA, defrontaram-se Alfred Landon, o governador republicano do Kansas, e o presidente em exerccio Franklin D. Roosevelt. Na altura da eleio a nao no tinha ainda recuperado da Grande Depresso. O Literary Digest, um dos jornais mais respeitados da poca, conduziu uma sondagem durante duas semanas antes da eleio. Baseado nesta sondagem o jornal previu que Landon obteria 57% dos votos, contra 43% de Roosevelt. Os resultados da eleio foram 62% para Roosevelt contra 38% para Landon. Como foi possvel uma discrepncia destas? Na realidade a sondagem levada a cabo pelo Literary Digest foi uma das maiores e mais caras jamais conduzidas, baseada numa amostra de aproximadamente 2.4 milhes de pessoas. Para a mesma eleio a Gallup (Gallup Organization, www.gallup.com) baseada numa amostra muito mais pequena de aproximadamente 50000 pessoas, conseguiu prever a vitria de Roosevelt. Como foi isto possvel? Comentrio: A amostra do Literary Digest foi extrada de uma lista enorme constituda a partir do ficheiro de utentes de telefones, da listagem dos subscritores de jornais e revistas e dos membros das associaes profissionais. A partir da foi criada uma lista de 10 milhes de nomes, tendo sido enviado a cada um, um boletim de voto que deveria ser enviado para o jornal depois de preenchido. Na sua edio de 22 de Agosto de 1936, o Literary Digest apregoava: Once again, [we are] asking more than then millions voters one out of four, representing every county in the United States to settle Novembers election in October. Next week, the first answers from these ten million will begin the incoming tide of marked ballots, to be triple-checked, verified, five-times cross-classified and totaled. When the last figure has been totted and checked, if past experience is a criterion, the country will know to within a fraction of 1 percent the actual popular vote of forty million (voters). A realidade foi bem mais dura! Aps a eleio, com a credibilidade completamente desfeita e as vendas em baixo, o Literary Digest foi obrigado a fechar as portas, vtima de um passo em falso estatstico. A primeira coisa que estava errada nesta sondagem foi o processo de seleco para os nomes da lista a quem foi posta a questo, j que esta lista ficou constituda sobretudo por nomes de pessoas das classes mdia e alta. Em 1936 o telefone ainda era um luxo, assim como o era ser assinante de um jornal ou membro de uma associao profissional, numa altura em que havia 9 milhes de desempregados. Assim a amostra era grandemente enviesada e no era de modo nenhum representativa da populao. Outro problema a considerar foi o facto de 10 milhes de pessoas terem sido contactadas e s cerca de 2.4 milhes terem respondido. Este problema da no resposta provoca um novo enviesamento, que muito difcil de corrigir, j que num pas livre no se pode obrigar as pessoas a responder, mesmo pagando, o que no melhoraria a situao, pois introduziria outras fontes de enviesamento. Moral: prefervel utilizar uma amostra boa, ainda que dimenso pequena, do que uma grande amostra, mas m. Exemplo - Suponhamos que ao pretender estudar a percentagem de eleitores que votariam favoravelmente num candidato Cmara de determinada cidade, se recolhia uma amostra de 300 eleitores, dos quais 175 responderam que sim. Ento uma estimativa para a proporo pretendida seria 0.58. Se considerssemos outra amostra de 300 eleitores, suponhamos que o valor obtido para o nmero de sims tinha sido 181. Ento o valor obtido para a estatstica seria 0.60. A repetio deste processo 15

Maria Eugnia Graa Martins - DEIO

32

Introduo Estimao

vezes permitiria obter 15 valores para a estatstica, que seriam outras tantas estimativas do parmetro a estimar - percentagem de eleitores da cidade, potenciais apoiantes do tal candidato. Representando num eixo os valores obtidos, poderamos deparar-nos com vrias situaes:

Se admitirmos que o valor do parmetro 0.60, ento a situao: 1. reflecte um pequeno ou ausncia de enviesamento, pois os valores das estatstica (propores obtidas a partir das amostras) situam-se para um e outro lado do valor do parmetro, e a existncia de uma pequena variabilidade entre os resultados obtidos para as vrias amostras, que se traduz em grande preciso; no caso 2. embora se mantenha a preciso, existe um grande enviesamento, pois os valores da estatstica situam-se sistematicamente para a direita do valor do parmetro; em 3. voltamos a ter uma situao de pequeno enviesamento, mas de pequena preciso devido grande variabilidade apresentada pelos valores da estatstica; finalmente em 4. a falta de preciso da situao 3) acompanhada de um grande enviesamento. A situao 2) deste exemplo poderia ter sido obtida se a seleco dos elementos para a amostra fosse feita em eleitores do mesmo partido que o candidato Cmara, j que as amostras seriam enviesadas, e dariam origem a propores amostrais superiores ao que seria de esperar com amostras seleccionadas de entre todos os eleitores possveis. Mesmo que o estimador utilizado, ou seja, a proporo amostral seja um bom estimador do parmetro proporo populacional, e mesmo que recolhssemos amostras de dimenso razovel, os resultados sobrevalorizariam o valor do parmetro a estimar. Por outro lado uma seleco de amostras aleatrias, mas de pequena dimenso, poderia conduzir situao 3), que apresenta grande variabilidade. Fazendo analogia com o que se passa com um atirador que aponta vrias setas a um alvo, em que procurava atingir o centro do alvo, teramos

Introduo Estimao

33

Qual a dimenso que se deve considerar para a amostra? Este um problema para o qual, nesta fase, no possvel avanar nenhuma teoria, mas sobre o qual se podem tecer algumas consideraes gerais. Pode-se comear por dizer que, para se obter uma amostra que permita calcular estimativas suficientemente precisas dos parmetros a estudar, a sua dimenso depende muito da variabilidade da populao subjacente. Por exemplo, se relativamente populao constituda pelos alunos do 10 ano de uma escola secundria, estivermos interessados em estudar a sua idade mdia, a dimenso da amostra a recolher no necessita de ser muito grande j que a varivel idade apresenta valores muito semelhantes, numa classe etria muito restrita. No entanto se a caracterstica a estudar for o tempo mdio que os alunos levam a chegar de casa escola, j a amostra ter de ter uma dimenso maior, uma vez que a variabilidade da populao muito maior. Cada aluno pode apresentar um valor diferente para esse tempo. Num caso extremo, se numa populao a varivel a estudar tiver o mesmo valor para todos os elementos, ento bastaria recolher uma amostra de dimenso 1 para se ter informao completa sobre a populao; se, no entanto, a varivel assumir valores diferentes para todos os elementos, para se ter o mesmo tipo de informao seria necessrio investigar todos os elementos. Chama-se a ateno para a existncia de tcnicas que permitem obter valores mnimos para as dimenses das amostras a recolher e que garantem estimativas com uma determinada preciso exigida partida (como veremos mais frente). Uma vez garantida essa preciso, a opo por escolher uma amostra de maior dimenso, uma questo a ponderar entre os custos envolvidos e o ganho com o acrscimo de preciso. Vem a propsito a seguinte frase (Statistics: a Tool for the Social Sciences, Mendenhall et al., pag. 226): "Se a dimenso da amostra demasiado grande, desperdia-se tempo e talento; se a dimenso da amostra demasiado pequena, desperdia-se tempo e talento". Convm ainda observar que a dimenso da amostra a recolher no directamente proporcional dimenso da populao a estudar, isto , se por exemplo para uma populao de dimenso 1000 uma amostra de dimenso 100 for suficiente para o estudo de determinada caracterstica, no se exige necessariamente uma amostra de dimenso 200 para estudar a mesma caracterstica de uma populao anloga, mas de dimenso 2000, quando se pretende obter a mesma preciso. Como explicava George Gallup, um dos pais da consulta da opinio pblica (Tannenbaum, 1998),: Whether you poll the United States or New York State or Baton Rouge (Louisiana) you need the same number of interviews or samples. Its no mystery really if a cook has two pots of soup on the stove, one far larger than the other, and thoroughly stirs them both, he doesnt have to take more spoonfuls from one than the other to sample the taste accurately. A seguir vamos nomeadamente: ver dois casos importantes de estimao de parmetros,

a estimao do valor mdio (ou mdia populacional), pela mdia (amostral), e a estimao da proporo populacional pela proporo amostral.

Maria Eugnia Graa Martins - DEIO

34

Introduo Estimao

3 - Estimao do valor mdio


3.1 - Estimao do valor mdio utilizando amostras aleatrias simples (sem reposio)
Quando se pretende estimar um parmetro, uma vez definido o esquema de amostragem, considera-se uma estatstica conveniente, isto , uma funo adequada das observaes, funo esta que para cada amostra observada dar uma estimativa do parmetro que se pretende estimar. Quando o parmetro a estimar o valor mdio ou mdia populacional, que se representa por , ento natural considerar como estimador a funo mdia, que se representa por X , e que para cada amostra observada dar uma estimativa x do valor mdio .
Como que podemos saber se a mdia um bom estimador para o valor mdio?

Ser que para as diferentes amostras que podemos seleccionar da populao, as diferentes mdias dessas amostras so prximas umas das outras e do parmetro valor mdio? Se isso acontecer, temos uma certa garantia que a amostra que seleccionarmos, nos fornecer uma estimativa razovel. A resposta questo anterior dada construindo a distribuio de amostragem da mdia. So as distribuies de amostragem das estatsticas que nos vo permitir fazer inferncias sobre os parmetros correspondentes. A aleatoriedade presente no processo de seleco das amostras, faz com que se possa utilizar a distribuio de amostragem de uma estatstica para descrever o comportamento dessa estatstica, quando se utiliza para estimar um determinado parmetro. Podemos dizer que atravs da distribuio de amostragem que introduzimos a probabilidade num procedimento estatstico, em que a partir das propriedades estudadas na amostra, procuramos tirar concluses para a populao.

3.1.1 - Distribuio de amostragem da mdia, como estimador do valor mdio de uma Populao finita Distribuio de amostragem exacta
Seguidamente vamos exemplificar o processo de obteno da distribuio de amostragem da Mdia, e consequente estudo das suas propriedades como estimador do valor mdio de uma Populao finita. Vamos considerar uma Populao de dimenso suficientemente pequena, para que o problema possa ser tratado dentro dos limites do razovel. Consideremos a seguinte populao constituda pelos 9 alunos de uma classe infantil, sobre os quais se recolheram alguns dados:

Introduo Estimao

35

N 1 2 3 4 5 6 7 8 9

Aluno Maria Teresa Tiago David Rita Ana Joana Bernardo Leonor

Peso (kg) 12.5 11.6 13.4 14.1 12.0 10.8 11.9 12.7 9.6

Altura (cm) 65 68 61 64 59 69 58 61 63

N irmos 0 1 0 1 2 1 0 1 1

Algumas caractersticas numricas desta populao so:


Peso Altura N irmos Val. mdio 12.07 63.11 0.78 Desvio padro 1.34 3.57 0.67 Mn. 9.6 58 0 Mx. 14.1 69 2 Mediana 12 63 1

Esta populao to pequena, que para a estudar no tivemos necessidade de recorrer a amostras para estimar alguns parmetros desconhecidos, tais como altura mdia, peso mdio, etc. Vamos, no entanto utiliz-la para exemplificar como se pode estimar a altura mdia a partir da mdia de amostras de dimenso 3. Como a nossa Populao tem dimenso 9, vamos utilizar a mquina de calcular para seleccionar nmeros entre 1 e 9, tendo os elementos seleccionados sido o 5, o 2 e o 7, sobre os quais vamos recolher a informao relevante ou seja a altura:
N 5 2 7 Nome Rita Teresa Joana Altura 59 68 58

A mdia das alturas observadas 61.7 cm, que uma estimativa da altura mdia da Populao. Como neste caso conhecemos o valor do parmetro, podemos dizer que a estimativa est razoavelmente prxima do parmetro a estimar. Obviamente que se recolhermos outras amostras, obteremos outras estimativas. Ento vamos seleccionar mais 9 amostras de dimenso 3, com o auxlio da mquina de calcular:
Amostra 1 5 2 7 59 68 58 2 1 3 8 65 61 61 3 8 9 3 61 63 61 4 7 4 6 58 64 69 5 2 68 7 58 4 64 6 1 8 5 65 61 59 7 8 4 7 61 64 58 8 6 7 5 69 58 59 9 3 9 5 61 63 59 10 5 9 2 59 63 68

Na obteno das amostras anteriores tivemos o cuidado de fazer a seleco sem reposio, o que significa que ao obter cada amostra, um elemento seleccionado no poderia voltar a ser seleccionado. Tambm tivemos o cuidado de verificar se as amostras eram todas distintas (constitudas por pelo menos um elemento diferente). Os valores obtidos para as mdias das 10 amostras foram:
Amostra 1 61.7 2 62.3 3 61.7 4 63.7 5 63.3 6 61.7 7 61.0 8 62.0 9 61.0 10 61.5

Maria Eugnia Graa Martins - DEIO

36

Introduo Estimao

Obtivemos vrios valores diferentes como estimativas, sendo esta variabilidade resultado da variabilidade presente na amostra. Os valores apresentados pelas mdias das 10 amostras, no diferem muito entre si, nem do valor do parmetro. Mas como que podemos ter a garantia que se recolhermos outra amostra, no vamos obter como estimativa do valor mdio da altura, um valor muito diferente do verdadeiro valor do parmetro? Por outras palavras, gostaramos de poder responder seguinte questo:
Para este processo de amostragem, como que podemos concluir que a mdia um bom estimador do valor mdio (mdia populacional)?

Teremos de estudar a distribuio de amostragem da mdia, que neste caso consiste 9 em estudar como se comporta a distribuio das mdias obtidas para as = 84 3 amostras diferentes, de dimenso 3, que se podem extrair da Populao. Considerando ento todas as amostras aleatrias simples, diferentes, de dimenso 3, obtemos:
Am. 1 65 68 61 mdia Am. 64.7 22 65 59 63 mdia Am. 62.3 43 68 59 63 mdia Am. 63.3 64 61 61 63 mdia 61.7 2 65 68 64 65.7 23 65 69 58 64.0 44 68 69 58 65.0 65 64 59 69 64.0 3 65 68 59 64.0 24 65 69 61 65.0 45 68 69 61 66.0 66 64 59 58 60.3 4 65 68 69 67.3 25 65 69 63 65.7 46 68 69 63 66.7 67 64 59 61 61.3 5 65 68 58 6 65 68 61 7 65 68 63 65.3 28 65 61 63 63.0 49 68 61 63 64.0 70 64 69 61 64.7 8 65 61 64 63.3 29 68 61 64 64.3 50 61 64 59 61.3 71 64 69 63 65.3 9 65 61 59 61.7 30 68 61 59 62.7 51 61 64 69 64.7 72 64 58 61 61.0 10 65 61 69 65.0 31 68 61 69 66.0 52 61 64 58 61.0 73 64 58 63 61.7 11 65 61 58 61.3 32 68 61 58 62.3 53 61 64 61 62.0 74 64 61 63 62.7 12 65 61 61 62.3 33 68 61 61 63.3 54 61 64 63 62.7 75 59 69 58 62.0 13 65 61 63 63.0 34 68 61 63 64.0 55 61 59 69 63.0 76 59 69 61 63.0 14 65 64 59 62.7 35 68 64 59 63.7 56 61 59 58 59.3 77 59 69 63 63.7 15 65 64 69 66.0 36 68 64 69 67.0 57 61 59 61 60.3 78 59 58 61 59.3 16 65 64 58 62.3 37 68 64 58 63.3 58 61 59 63 61.0 79 59 58 63 60.0 17 65 64 61 63.3 38 68 64 61 64.3 59 61 69 58 62.7 80 59 61 63 61.0 18 65 64 63 64.0 39 68 64 63 65.0 60 61 69 61 63.7 81 69 58 61 62.7 19 65 59 69 64.3 40 68 59 69 65.3 61 61 69 63 64.3 82 69 58 63 63.3 20 65 59 58 60.7 41 68 59 58 61.7 62 61 58 61 60.0 83 69 61 63 64.3 21 65 59 61 61.7 42 68 59 61 62.7 63 61 58 63 60.7 84 58 61 63 60.7

63.7 64.7 26 65 58 61 27 65 58 63

61.3 62.0 47 68 58 61 48 68 58 63

62.3 63.0 68 64 59 63 69 64 69 58

62.0 63.7

Uma vez que o plano de amostragem considerado, foi a amostragem aleatria simples, cada amostra tem igual probabilidade (=1/84) de ser seleccionada, pelo que podemos considerar os diferentes valores obtidos para a varivel Mdia, assim como as respectivas probabilidades ou seja, estamos em condies de considerar a seguinte funo massa de probabilidade para a varivel Mdia, que vamos designar por Mdia3, para realar o facto de as amostras a partir das quais se obtiveram os seus valores, terem dimenso 3:

Introduo Estimao

37

Distribuio de Amostragem da Mdia para amostras de dimenso 3 Mdia3 Prob. Mdia3 Prob. 59.3 2/84 63.7 5/84 60.0 2/84 64.0 6/84 60.3 2/84 64.3 5/84 60.7 3/84 64.7 4/84 61.0 4/84 65.0 4/84 61.3 4/84 65.3 3/84 61.7 5/84 65.7 2/84 62.0 4/84 66.0 3/84 62.3 5/84 66.7 1/84 62.7 7/84 67.0 1/84 63.0 5/84 67.3 1/84 63.3 6/84

Algumas propriedades da distribuio de amostragem da varivel Mdia3 so:


Mdia3 Valor mdio 63.11 Desvio padro 1.79 Mnimo 59.3 Mximo 67.3 Mediana 62.83

Repare-se que: o valor mdio da varivel Mdia3 (=63.11 cm) coincide com o valor mdio da Populao Altura (=63.11 cm), de onde se recolheram as amostras; o desvio padro da varivel Mdia3 (=1.79 cm) bastante menor que o da Populao - Altura (=3.57 cm).

As propriedades anteriores permitem-nos concluir que a Mdia3, como estimador do parmetro valor mdio da Altura, um estimador centrado, j que o seu valor mdio, ou seja a mdia de todas as estimativas, para todas as amostras possveis, coincide com o parmetro a estimar. A partir da distribuio de probabilidade da Mdia3, podemos ainda concluir que a probabilidade de obtermos estimativas no intervalo [61.3 cm, 65.3 cm] de 0.75 (=63/84), assim como a probabilidade de obtermos essas estimativas no intervalo [60.0 cm, 66.7 cm] superior a 0.95 (=80/84) ou 95%. Este resultado significa que, ao recolhermos uma amostra de dimenso 3 e ao calcularmos a partir dela uma estimativa para o valor mdio, estamos confiantes, com uma confiana superior a 95%, de que essa estimativa no se afasta do parmetro a estimar de uma distncia superior a 3.6 cm, aproximadamente (63.160.0=3.1; 66.763.1=3.6). Chamamos a ateno para que a confiana anterior, no nos d a garantia de que a estimativa que ns calculamos, para a amostra seleccionada, esteja naquele intervalo. Temos f que sim! J seria azar a amostra que ns seleccionamos ser uma das 4 que d origem a estimativas fora do intervalo [60.0 cm, 66.7 cm]. Efectivamente, cerca de 5% das estimativas (=4/84) distam do parmetro mais de 3.6 cm (2 distam 3.81=63.11-59.3, 1 dista 3.89=67-63.11 e 1 dista 4.19=67.3-63.11).
Maria Eugnia Graa Martins - DEIO

38

Introduo Estimao

Se utilizarmos amostras de maior dimenso o que que ganhamos?


Repetindo o processo anterior, mas agora para amostras de dimenso 5, ser que a variabilidade apresentada pelo estimador diminui? J que temos mais informao, de esperar algum ganho na preciso do estimador! Vamos ento considerar a distribuio de amostragem da mdia para amostras de dimenso 5. O processo em tudo idntico ao considerado anteriormente, mas agora ser um pouco mais trabalhoso j que o nmero de amostras distintas, de dimenso 5, 9 que podemos extrair da Populao de dimenso 9 = 126. 5 Os resultados obtidos para a distribuio de amostragem da mdia, para amostras de dimenso 5, foram:
Mdia5 Probab Mdia5 Probab 60.4 0.008 63.2 0.063 60.6 0.008 63.4 0.071 60.8 0.008 63.6 0.056 61.0 0.016 63.8 0.056 61.2 0.016 64.0 0.048 61.4 0.032 64.2 0.048 61.6 0.024 64.4 0.048 61.8 0.040 64.6 0.024 62.0 0.040 64.8 0.024 62.2 0.056 65.0 0.024 62.4 0.063 65.2 0.016 62.6 0.048 65.4 0.016 62.8 0.063 65.8 0.008 63.0 0.079

Algumas propriedades da distribuio de amostragem da varivel Mdia5 so:


Valor mdio 63.11 Desvio padro 1.13 Mnimo 60.4 Mximo 65.8 Mediana 63.1

Mdia5

Repare-se que: o valor mdio da varivel Mdia5 coincide com o valor mdio da Populao Altura, de onde se recolheram as amostras; o desvio padro da varivel Mdia5 (=1.13) bastante menor que o da varivel Altura (=3.57) e ainda inferior ao da varivel Mdia3 (=1.79).

Concluso: a preciso do estimador aumenta, medida que se aumenta a dimenso da amostra (Recordamos que quanto menor for a variabilidade apresentada pelo estimador, maior a preciso).

Introduo Estimao

39

Na figura seguinte apresentamos as distribuies de amostragem da Mdia3 e da Mdia5:

Como se verifica, a variabilidade maior na distribuio de amostragem da mdia quando se consideram amostras de menor dimenso. Resultado terico (a demonstrao do resultado seguinte, est fora do mbito deste curso): Dada uma Populao de dimenso N, de valor mdio e varincia 2, quando se considera um plano de amostragem aleatria simples, e como estimador de a Mdia, calculada a partir de amostras de dimenso n, ento: O valor mdio da Mdia , isto , a Mdia como estimador do valor mdio um estimador centrado; A varincia da Mdia igual a

2 N -n
n ( N -1

A expresso obtida para a varincia muito interessante pela informao que contm. Nomeadamente: Confirma o que j havamos esperado, no sentido de que ao aumentar a dimenso da amostra, aumentamos a preciso do estimador (na medida em que diminui a sua variabilidade). Permite-nos ainda concluir que, para obter a mesma preciso, quando estimamos o valor mdio de Populaes da mesma dimenso, a dimenso da amostra ter de ser tanto maior, quanto maior for a variabilidade presente na Populao. Mas mais interessante, embora menos intuitivo, permite-nos concluir que se a dimenso da Populao for substancialmente maior que a da amostra, ento a preciso do estimador no depende da dimenso dessa Populao, mas unicamente da variabilidade a presente (pois (N-n) / (N-1) 1).

Maria Eugnia Graa Martins - DEIO

40

Introduo Estimao

Distribuio de amostragem aproximada


Os exemplos tratados anteriormente s tm interesse para exemplificar o processo de obter a distribuio de amostragem exacta da mdia, j que os valores considerados para a dimenso da populao e da amostra so ridiculamente pequenos. Contudo, o processo utilizado deixa-nos adivinhar o trabalho rduo que teramos se pretendssemos fazer o mesmo com populaes e amostras de dimenses razoveis! Normalmente nas situaes de interesse no se consegue obter a distribuio de amostragem exacta da mdia. Contudo o problema no grave, j que, quando se faz a amostragem sem reposio, existem algumas condies necessrias e suficientes para que se possa aproximar a distribuio da mdia pela distribuio Normal. No vamos apresentar essas condies, embora admitamos que elas esto satisfeitas e enunciamos o seguinte resultado: Suponhamos que uma amostra aleatria simples seleccionada de uma Populao de dimenso N, com valor mdio 1 e varincia 2 . Ento, se a dimenso n da amostra for suficientemente grande (um valor que usual considerar como suficientemente grande 30), a distribuio de amostragem da mdia pode ser aproximada pela distribuio 2 N - n Normal com valor mdio e varincia ( ) . A aproximao verifica-se para n N-1 amostras de dimenso suficientemente grande, independentemente da forma da distribuio da Populao(1). (1) Ao fazer esta afirmao, no podemos deixar de referir que a forma da distribuio da populao subjacente tem alguma influncia, no seguinte sentido: se tivermos duas populaes, uma aproximadamente simtrica e outra apresentando um grande enviesamento, para amostras da mesma dimenso, a aproximao melhor, quando estamos a estimar o valor mdio da populao simtrica. Para obtermos o mesmo grau de preciso da aproximao, no caso da outra populao, seria necessrio recolher uma amostra de maior dimenso.

3.1.2 - Distribuio de amostragem aproximada da mdia, como estimador do valor mdio de uma Populao finita, mas de dimenso suficientemente grande
Na maior parte dos casos em que necessrio recolher uma amostra para estudar uma caracterstica de uma Populao, no se conhece a dimenso desta. Ento costuma-se assumir que suficientemente grande de modo que se diz que se tem uma Populao de dimenso infinita. Em termos prticos costuma-se considerar que se tem uma populao de dimenso infinita quando N>20n. Nestas condies o factor (Nn)/(N-1) que aparece na expresso da varincia da Mdia toma um valor aproximadamente igual a 1,

N-n )1 N-1

2 N - n 2 ( ) n N-1 n

1 Estamos a identificar a Populao com a varivel em estudo. Por essa razo dizemos que a Populao tem valor mdio e varincia 2.

Introduo Estimao

41

pelo que temos o seguinte resultado, conhecido como Teorema Limite Central (TLC), de que o resultado anterior uma verso para Populaes finitas (que no possa ser assumida infinita, segundo as condies indicadas): Suponhamos que uma amostra aleatria simples seleccionada de uma Populao de dimenso grande, em que a varivel em estudo tem valor mdio e varincia 2. Ento, se a dimenso n da amostra for suficientemente grande (um valor que usual considerar como suficientemente grande 30), a distribuio de amostragem da mdia 2 pode ser aproximada pela distribuio Normal com valor mdio e varincia . A n aproximao verifica-se para amostras de dimenso suficientemente grande, independentemente da forma da distribuio da Populao subjacente s amostras. Mais uma vez chamamos a ateno para as seguintes propriedades, j anteriormente referidas: quanto maior for a dimenso da amostra, menor a variabilidade apresentada pelo estimador. Ao desvio padro da mdia d-se o nome de erro padro. Assim, esta propriedade pode ser enunciada do seguinte modo: quanto maior for a dimenso da amostra, menor ser o erro padro ; n alm disso, tambm conclumos que, para Populaes de dimenso suficientemente grande, esta no tem influncia sobre a variabilidade do estimador.

Em concluso, a preciso de um estimador, para Populaes de grande dimenso, no depende do tamanho da Populao, mas sim da variabilidade a presente. Quando pretendemos estimar um parmetro da Populao, para obter uma determinada preciso, a dimenso da amostra ter de ser tanto maior, quanto maior for a variabilidade existente na Populao. No entanto, se a dimenso da Populao j no for suficientemente grande, essa dimenso ter interferncia na preciso do estimador, como vimos na seco anterior.

3.2 Distribuio de amostragem da mdia, em amostragem com reposio


Ser interessante estudarmos a distribuio de amostragem da Mdia, quando se faz amostragem com reposio, de uma Populao com dimenso N e comparar com o que se passa na amostragem sem reposio, tratada anteriormente. Agora, cada elemento da Populao tem uma probabilidade constante e igual a 1/N de ser seleccionado para pertencer amostra, j que quando um elemento seleccionado, uma vez a informao recolhida, ele novamente reposto na Populao. Este processo equivalente a seleccionarmos uma amostra aleatria de dimenso n de uma populao uniforme discreta no conjunto dos valores da caracterstica a estudar da Populao, que podemos representar por x1, x2, , xN. Ento cada vez que se selecciona um elemento da Populao como se obtivssemos um valor da varivel

Maria Eugnia Graa Martins - DEIO

42

Introduo Estimao

aleatria X que assume os valores xi considerados anteriormente, com probabilidade 1/N. Seleccionar uma amostra de dimenso n significa seleccionar n variveis X1, X2, , Xn, independentes e com distribuio idntica de X. Ento a Mdia

X
X=
ser uma varivel aleatria, tal que:
i =1

O valor mdio da Mdia 2, pelo que a Mdia, como estimador do valor mdio , um estimador centrado; A varincia da Mdia igual a

2 , onde 2 a varincia da Populao. n

Resumindo, se tivermos uma populao finita de dimenso N, valor mdio e varincia 2, algumas caractersticas para a distribuio de amostragem da Mdia (de amostras de dimenso n) so: Sem reposio Valor mdio Varincia Com reposio

N -n ) N -1

<

2 n

Comparando os resultados anteriores, conclui-se que a amostragem sem reposio mais eficiente, quando se pretende estimar o valor mdio da Populao, uma vez que produz um estimador com uma varincia mais pequena, isto , que apresenta menor variabilidade.

Exemplo Considere uma populao constituda pelos elementos 1, 2, 3, 4 e 5. Pretende estimar o valor mdio desta populao, pelo que decide recolher uma amostra de dimenso 2, com reposio e calcular a sua mdia. Obtenha a distribuio de amostragem do estimador utilizado para estimar o valor mdio da populao. Resoluo: A Populao anterior constituda pelos elementos 1, 2, 3, 4 e 5, tendo cada um uma probabilidade constante e igual a 1/5 de ser seleccionado para pertencer a uma amostra:
Populao X Probabilidade 1 1/5 2 1/5 3 1/5 4 1/5 5 1/5

Propriedades da Populao:

Valor mdio = 3

Desvio padro =

2.

Propriedade do valor mdio, segundo a qual o valor mdio de uma soma de variveis aleatrias igual soma dos valores mdios das parcelas.

Introduo Estimao

43

A metodologia seguida para obter a distribuio de amostragem consiste em seleccionar todas as amostras de dimenso 2, com reposio, calcular o valor da estatstica mdia para cada uma delas e depois representar a distribuio dos valores obtidos:
Amostras (1,1) (1,2) (2,1) (1,3) (2,2) (3,1) (1,4) (2,3) (3,2) (4,1) 2.5 (1,5) (2,4) (3,3) (4,2) (5,1) 3 (2,5) (3,4) (4,3) (5,2) 3.5 (3,5) (4,4) (5,3) (4,5) (5,4) (5,5)

mdia

1.5

4.5

De acordo com a tabela anterior obtemos a seguinte distribuio de amostragem para o estimador Mdia2 (assim representado por se obter a partir de amostras de dimenso 2)
Mdia2 Probabilidade 1 1/25 1.5 2/25 2 3/25 2.5 4/25 3 5/25 3.5 4/25 4 3/25 4.5 2/25 5 1/25

1 1.5 2 2.5 3 3.5 4 4.5 5

Caractersticas da distribuio de amostragem da Mdia para amostras de dimenso 2:

Valor mdio = 3
Algumas observaes:

Desvio padro = 1

O valor mdio da distribuio de amostragem do estimador Mdia, utilizado para estimar o valor mdio da populao (igual a 3), coincide com o parmetro a estimar . O desvio padro da populao inicial igual a

2 , enquanto que o desvio padro

da mdia, calculada a partir de amostras de dimenso 2 1 ( 2 / 2 =1 resultado considerado anteriormente). Se repetirmos a metodologia seguida no processo do exemplo anterior, considerando agora amostras de dimenso 3, o problema torna-se mais trabalhoso, j que o nmero de amostras possveis 53=125. Assim, abstemo-nos de apresentar todas essas amostras, limitando-nos a apresentar a distribuio de amostragem da Mdia3:
Mdia3 Proba. 1 .008 1.33 .024 1.67 .048 2 .080 2.33 .120 2.67 .144 3 .152 3.33 .144 3.67 .120 4 .080 4.33 .048 4.67 .024 5 .008

Maria Eugnia Graa Martins - DEIO

44

Introduo Estimao

Caractersticas da distribuio de amostragem:

Valor mdio = 3
Algumas observaes:

Desvio padro = 0.816

O valor mdio da distribuio de amostragem do estimador Mdia3 utilizado para estimar o valor mdio da populao (igual a 3), coincide com o parmetro a estimar . O desvio padro da populao inicial igual a

2 , enquanto que o desvio padro

da Mdia3, calculada a partir de amostras de dimenso 3 0.816 ( 2 / 3 =0.816 o que condiz com o resultado apresentado anteriormente, de que a varincia da Mdia 2/n). A variabilidade apresentada pela distribuio de amostragem inferior obtida quando se consideram amostras de dimenso 2. Este resultado indicia que quanto maior for a dimenso da amostra, menor a variabilidade apresentada pela distribuio de amostragem.

O que acontece se a dimenso da populao for grande?


Se a dimenso da Populao for razoavelmente grande, a probabilidade de extrairmos o mesmo elemento duas vezes extremamente pequena (Por exemplo, numa populao de dimenso 1000, a probabilidade de extrairmos amostras de dimenso 2, com elementos iguais, seria 0,001). Assim, os dois processos de amostragem, com reposio e sem reposio, so praticamente equivalentes, quando estamos a estimar o valor mdio. Esta concluso vai de encontro com a que se pode obter tambm se tomarmos ateno s varincias das Mdias de amostras de dimenso n, quando se faz extraco com e sem reposio. Efectivamente o factor

Nn N n = (1 ) N1 N-1 N
que aparece na expresso da varincia num processo de amostragem aleatria simples (sem reposio) assume um valor prximo de 1, quando N razoavelmente grande e n razoavelmente pequeno, quando comparado com N. Ao quociente costuma-se chamar fraco de amostragem. J apontmos anteriormente que, em termos prticos, se considera uma Populao grande se a sua dimenso for cerca de 20 vezes superior dimenso da amostra, ou
n N

Introduo Estimao

45

seja, quando a fraco de amostragem for menor que 5%. Ento, na prtica, temos o seguinte resultado: Se a populao tiver dimenso grande, praticamente indiferente fazer a recolha da amostra com reposio ou sem reposio, quando se esto a estudar as propriedades da mdia, como estimador do valor mdio! No que diz respeito forma da distribuio de amostragem da mdia, invocando mais uma vez o Teorema Limite Central (TLC), temos: Suponhamos que uma amostra aleatria, de dimenso n, seleccionada, com reposio (se a Populao tiver dimenso N, grande, e N>20xn, a seleco pode ser feita sem reposio), de uma populao em que a varivel em estudo tem valor mdio e varincia 2. Ento, se a dimenso n da amostra for suficientemente grande (um valor que usual considerar como suficientemente grande 30), a distribuio de amostragem da mdia pode ser aproximada pela distribuio Normal com valor mdio 2 e varincia . A aproximao verifica-se para amostras de dimenso n suficientemente grande, independentemente da forma da distribuio da Populao subjacente s amostras. Assim, o modelo Normal, centrado em e com desvio padro / n , um bom modelo para o conjunto das mdias de todas as amostras aleatrias (ver na caixa anterior as condies), de dimenso n, que se podem seleccionar de uma populao com valor mdio e desvio padro :

Propriedades: quanto maior for a dimenso da amostra, menor a variabilidade apresentada pelo estimador; alm disso, tambm conclumos que, para Populaes de dimenso suficientemente grande, esta no tem influncia sobre a variabilidade do estimador.

Em concluso, a preciso de um estimador, para Populaes de grande dimenso, no depende do tamanho da Populao, mas sim da variabilidade a presente. Quando pretendemos estimar um parmetro da Populao, para obter uma determinada preciso, a dimenso da amostra ter de ser tanto maior, quanto maior for a variabilidade existente na Populao. No entanto, se a dimenso da

Maria Eugnia Graa Martins - DEIO

46

Introduo Estimao

Populao j no for suficientemente grande, essa dimenso ter interferncia na preciso do estimador, como vimos na seco anterior. O teorema limite central d-nos uma justificao terica para a grande utilizao da distribuio Normal, como modelo de fenmenos aleatrios. Quantidades tais como alturas e pesos de uma populao relativamente homognea, podem ser consideradas como somas de um grande nmero de causas genticas e efeitos devido ao meio ambiente, mais ou menos independentes entre si, cada um contribuindo com uma pequena quantidade para a soma.

O que que se entende por um valor de n suficientemente grande?


Uma questo que se pode pr a seguinte: quando queremos aplicar o teorema do limite central qual o valor de n, para que se possa utilizar a distribuio Normal, como uma boa aproximao para a distribuio de amostragem pretendida? Este valor de n depende, em certa medida, da distribuio subjacente amostra e ser tanto maior quanto mais enviesada for a distribuio da populao (o termo enviesado aplica-se como contrrio a simtrico). No entanto usual referir que um valor igual ou superior a 30 j permite fazer a aproximao com uma preciso razovel.

Nota (Moore et al. 1993): o facto de a mdia de vrias medies apresentar menor variabilidade do que uma nica medio, bastante importante em cincia. Quando Simon Newcomb mediu a velocidade da luz, fez repetidas vezes a medio do tempo necessrio para um raio de luz percorrer determinada distncia. As 64 observaes que ele reteve,
28 31 30 19 22 25 33 37 36 24 29 23 26 25 27 32 28 28 29 29 28 36 28 24 26 27 22 25 24 32 26 27 32 34 27 24 30 30 16 16 27 25 31 29 24 26 29 20 33 26 36 28 21 25 32 27 36 23 28 39 32 21 40 23

podem ser consideradas valores de 64 variveis aleatrias independentes, cada uma com uma distribuio de probabilidade que descreve a populao de todas as medies feitas utilizando o procedimento de Newcomb. Se este processo de Newcomb estiver correcto, a mdia populacional o verdadeiro valor do tempo que a luz leva a percorrer a distncia escolhida (ir do seu laboratrio no Protomac Rives at um espelho na base do Washington Monument e voltar, numa distncia total de cerca de 7400 metros). A variabilidade populacional reflecte a variao aleatria nas medies, devida a pequenas modificaes no meio envolvente, no equipamento, e no procedimento. Suponha que o desvio padro desta populao =5 segundos 10-9 (unidade utilizada nas medies). Se Newcomb tivesse feito uma nica medida, o desvio padro do resultado seria 5, pelo que uma outra medio poderia ter um valor substancialmente diferente. Tomando as 64 medies como ele fez, a mdia tem um desvio padro de 5/ 64. =0.625. O valor de 27.75 que Newcomb obteve para a mdia das suas 64 observaes muito mais fivel que o obtido a partir de uma nica observao.

Introduo Estimao

47

Exerccios 2.3.1 Considere a populao dos deputados da X Legislatura e considere os dados referentes varivel Idade. a) Calcule o valor mdio e o desvio padro das idades. b) Organize os dados na forma de uma tabela de frequncias, considerando como classes os diferentes valores obtidos para as idades (Chama-se a ateno para o facto da varivel Idade ser de natureza contnua e quando falamos, por exemplo, na classe dos 45 anos, estamo-nos a referir a um intervalo, representado pelo valor 45, que inclui todas as idades dos indivduos que acabaram de fazer 45 anos, mas ainda no fizeram 46). Calcule a probabilidade de um deputado, escolhido ao acaso, ter 40 ou menos anos. c) Obtenha uma estimativa para a probabilidade da mdia das idades de 30 deputados, seleccionados aleatoriamente (com reposio), ser igual ou menor que 45 anos. d) Obtenha uma estimativa para a probabilidade da mdia das idades de 50 deputados, seleccionados aleatoriamente (com reposio), ser igual ou menor que 45 anos. e) Compare os valores obtidos nas 3 alneas anteriores e tire concluses. Justifique as concluses a que chegou. 2.3.2 Quando pretende estimar o valor mdio de uma populao e aumenta a dimenso da amostra, a probabilidade de obter uma mdia com maior preciso:
Aumenta? Diminui? Fica na mesma?

2.3.3 Diga se a seguinte afirmao Verdadeira ou falsa: Diminui de metade o erro padro, aumentando para o dobro a dimenso da amostra. 2.3.4 Perguntou-se a 835 portugueses adultos quanto esperavam gastar nas prendas de Natal do ano em curso. A mdia obtida foi de 540 euros. a) O valor de 540 euros um parmetro ou uma estatstica? b) Identifique a populao em estudo e o parmetro de interesse. c) O facto de ter obtido 540 euros para a mdia, significa que o gasto mdio da populao nas compras de Natal tenha de ser necessariamente 540 euros? d) Acharia razovel ter obtido como mdia 540 euros, se o gasto mdio da populao, nas compras de Natal, fosse 550 euros? E se fosse 750 euros? Justifique a sua resposta. e) Admitindo que o gasto mdio da populao nas compras de Natal de 550 euros e o desvio padro dos gastos de 150 euros: i) qual a distribuio de amostragem aproximada para a mdia de amostras de dimenso 835? ii) calcule um valor aproximado para a probabilidade de obter um valor para a mdia menor ou igual a 540 euros. f) Tendo em considerao os dados da alnea anterior, calcule a probabilidade de uma pessoa, escolhida ao acaso, gastar nas suas compras 540 ou menos, euros. g) Admita agora que o gasto mdio nas compras de natal de 550 euros, mas o desvio padro dos gastos igual a 250 euros. i) Qual a distribuio de amostragem aproximada para a mdia de amostras de dimenso 835? ii) Qual a probabilidade de obter para a mdia um valor menor ou igual a 540 euros? iii) Compare o valor obtido na alnea anterior com o que obteve na alnea e) ii). Justifique as concluses a que chegou.

Maria Eugnia Graa Martins - DEIO

48

Introduo Estimao

2.3.5 Com o objectivo de verificar se efectivamente os pacotes de 150 gramas de batatas fritas da marca Fri-Fri, tinham o peso anunciado, recolheram-se aleatriamente 30 pacotes que se pesaram, tendo-se obtido os seguintes resultados:
148 143 151 156 155 158 139 148 155 144 146 141 140 145 146 139 147 147 150 148 148 148 156 149 149 147 159 154 161 146

a) Calcule a mdia dos pesos obtidos. Esse valor um parmetro ou uma estatstica? b) O facto de no ter obtido um valor para a mdia igual a 150 gramas, significa que o peso mdio dos pacotes no possa ser de 150 gramas? Justifique a sua resposta. c) Calcule o desvio padro (amostral) dos pesos obtidos. O valor que obteve uma estimativa de qu? d) Obtenha a distribuio de amostragem aproximada da mdia de amostras dimenso 30, de pesos de pacotes de batatas fritas. e) Admitindo que o peso mdio dos pacotes de batatas fritas efectivamente 150 gramas, calcule um valor aproximado para a probabilidade da mdia dos pesos de 30 pacotes ser inferior a 150 gramas. Poderia calcular o valor exacto para essa probabilidade? f) Obtenha um valor aproximado para a probabilidade da mdia dos pesos de 30 pacotes, seleccionados aleatoriamente, se afastar do pressuposto peso mdio de 150 gramas, de 2 gramas. 2.3.6 (Sugerido por Rossman, 2001) Considere as seguintes funes densidades que modelam as populaes constitudas pelos resultados obtidos (numa escala de 0 a 100) em 3 testes:

Os seguintes diagramas de pontos representam a distribuio dos valores de 3 amostras de dimenso 100, cada uma extrada de uma das 3 populaes anteriores:

Introduo Estimao

49

Amostra 1

Amostra2

Amostra3

a) Identifique a populao de onde foi seleccionada cada uma das amostras anteriores. b) Os diagramas de pontos seguintes apresentam a distribuio de 3 amostras, de dimenso 20, seleccionadas tambm das 3 populaes dadas inicialmente. Tem agora a mesma facilidade, em distinguir de que populao se seleccionou cada uma delas? Amostra 1

Amostra 2

Amostra 3

Concorda que com uma amostra de maior dimenso se consegue visualizar melhor a estrutura da populao subjacente? c) Suponha que pretende estimar o valor mdio da populao a que corresponde o modelo normal. Para cada uma das amostras seleccionadas da populao normal, calculou a mdia e obteve os valores 46,05 e 49,05. Qual destes valores pensa que foi obtido a partir da amostra de maior dimenso? Justifique a sua resposta.

Maria Eugnia Graa Martins - DEIO

50

Introduo Estimao

2.3.7 Considere a populao B do exemplo anterior e represente por e , respectivamente o seu valor mdio e desvio padro. Suponha que selecciona vrias amostras de dimenso n, representa-as graficamente, e para cada uma dessas amostras calcula a mdia e o desvio padro:

a) Faa um esquema de um histograma que represente adequadamente todas as mdias que obteve. b) Qual o modelo que pode utilizar para modelar o histograma que obteve na alnea anterior? i) Teve de fazer algumas hipteses para utilizar o modelo proposto? ii) Quais os parmetros valor mdio e desvio padro do modelo considerado? iii) Se no conhecer o desvio padro, , da populao, como que o pode estimar? c) O facto de a populao de onde se recolhem as amostras, ter uma distribuio enviesada, tem algumas consequncias na obteno da distribuio de amostragem (aproximada) da mdia? d) Explique por algumas palavras, qual a diferena entre distribuio de amostragem e distribuio da amostra. 2.3.8 (Adaptado de Velleman, 2004) Suponha que a durao de uma gravidez (humana) pode ser bem modelada por uma Normal com valor mdio igual a 266 dias e desvio padro igual a 16 dias. a) Qual a percentagem de mulheres cuja gravidez tem uma durao entre 270 e 280 dias? b) Suponha que um obstrecta presta assistncia regularmente a 60 grvidas. Qual a distribuio de amostragem da mdia do tempo de gravidez de 60 grvidas? Especifique o modelo, o seu valor mdio e o seu desvio padro. c) Qual a probabilidade de que a mdia do tempo de gravidez de 60 mulheres, seja inferior a 160 dias? 2.3.9 Um princpio bsico quando se quer investir na bolsa, o de diversificar os investimentos de modo a reduzir o risco. A figura a seguir, esquerda, mostra a distribuio dos retornos para todos os 1815 produtos da bolsa no ano de 1987. Este foi um ano negro para os investidores. O retorno mdio para os investimentos foi de -3.5%:

Na figura da direita apresenta-se a distribuio dos retornos para todas as possveis carteiras que tenham investido iguais quantidades em 5 produtos. Uma carteira uma amostra de 5 produtos e o retorno dado pela mdia dos 5 produtos escolhidos. Embora o retorno mdio seja o mesmo, qual a vantagem de investir em carteiras?

Introduo Estimao

51

4 - Estimao da proporo
4.1 - Distribuio de amostragem da proporo amostral, como estimador da proporo populacional
Anteriormente estudmos a estimao do valor mdio e vamos, neste captulo, ver como os resultados que se obtiveram podem ser traduzidos para o estudo da estimao do parmetro proporo de elementos da Populao, que satisfazem determinada propriedade ou pertencem a determinada categoria. Consideremos ento uma populao de dimenso N e seja p a proporo (desconhecida) de elementos da populao que pertencem categoria em estudo. Na metodologia que vamos utilizar, no estudo da estimao da proporo, comeamos por verificar que uma proporo uma mdia de 0s e 1s em que atribumos o valor 1 a um elemento da populao que pertena categoria em estudo e o valor 0 a um elemento que no pertena a essa categoria. Assim, a proporo p no mais do que o valor mdio desta populao cujos elementos so 0s e 1s, pelo que o estudo feito para a estimao do valor mdio ser facilmente adaptado para a estimao da proporo. Para esta populao to particular, constituda por 0s e 1s, em que a proporo populacional a mdia populacional, a proporo amostral tambm ser a mdia (amostral), que ser assim, o estimador intuitivo para a proporo populacional. Como no captulo anterior estudmos a distribuio de amostragem da mdia, tendo concludo que a mdia um bom estimador para o valor mdio, imediatamente conclumos que a proporo amostral um bom estimador para a proporo populacional. A fim de utilizar os resultados enunciados para a distribuio de amostragem da mdia, vejamos a que igual a varincia de uma populao constituda por 0s e 1s em que a percentagem de 1s p.

Valor mdio e varincia 2 da populao em estudo:


Dada uma populao de N elementos, em que cada elemento ou 0 ou 1, sendo p a percentagem de elementos 1s (elementos pertencentes categoria em estudo)
Classe 1 0 Total Freq.abs. Np N(1-p) N Freq.rel. p 1-p 1

Para esta populao, imediato que o valor mdio igual a p (=1*p+0*(1-p)), e a partir da expresso da varincia, temos que 2 = (1-p)2*p+(0-p)2*(1-p) 2 = p (1-p) O valor mdio e a varincia de uma populao constituda por 0s e 1s, em que a proporo de 1s p, igual a p e a p(1-p), respectivamente.

Maria Eugnia Graa Martins - DEIO

52

Introduo Estimao

As concluses a que chegmos no captulo anterior, permitem-nos agora enunciar os seguintes resultados (obtidos a partir dos resultados obtidos para a mdia):

Dada uma populao de dimenso N, em que p a percentagem de elementos da populao que verificam determinada caracterstica, quando se considera um esquema de amostragem aleatria simples, ou um esquema de amostragem com

reposio, e como estimador do parmetro p, a proporo amostral

, p

isto a

proporo de elementos pertencentes categoria em estudo, existente em amostras de dimenso n, ento: O estimador com p,

de p p )=p E( p

um estimador centrado, j que o seu valor mdio coincide

)= Var( p

p(1 - p) N - n ( ) no esquema de amostragem aleatria simples n N-1 p(1 - p) num esquema de amostragem aleatria com reposio. n

)= e Var( p

O resultado terico conhecido como Teorema Limite Central permite-nos, agora, apresentar o seguinte resultado: Suponhamos que se selecciona uma amostra aleatria simples de uma Populao de dimenso grande, ou que se selecciona uma amostra aleatria, com reposio de uma populao de dimenso qualquer, em que a caracterstica em estudo est presente numa proporo p (desconhecida). Ento, se a dimenso n da amostra for suficientemente grande (um valor que usual considerar como suficientemente grande 30), a distribuio de amostragem da proporo amostral aproximada pela distribuio Normal com valor mdio p e varincia

pode ser .

p(1 - p) n

Assim, o modelo Normal, centrado em p e com desvio padro

pq , onde n

representamos por q=1-p, um bom modelo para o conjunto das propores obtidas a partir de todas as amostras aleatrias (ver na caixa anterior as condies), de dimenso n, que se podem seleccionar da populao, em que a caracterstica em estudo existe com uma proporo p:

Introduo Estimao

53

Recordamos algumas das condies para aplicar o modelo anterior: a) Qualquer que seja o processo de seleco da amostra aleatria, isto , com

sempre um estimador reposio ou sem reposio, a proporo amostral p centrado da proporo populacional p, isto , o valor mdio da sua distribuio de amostragem p.
b) Se a amostragem se fizer com reposio, ento existe independncia entre a seleco dos elementos que vo constituir a amostra, na medida em que a probabilidade de um qualquer elemento ser seleccionado, no depende do elementos que j tiverem sido seleccionados. A varincia do estimador vem

p(1 - p) n

c) Se a amostragem se fizer sem reposio, ento j a dimenso N, da populao pode interferir nas propriedades do estimador, a no ser que essa dimenso seja grande, isto , N>20n, pois neste caso a probabilidade de um mesmo elemento ser seleccionado 2 vezes muito pequena. Se efectivamente N for grande, podemos ainda utilizar para a varincia da proporo amostral a expresso

p(1 - p) n

e no depende da dimenso da populao.

d) Se na amostragem sem reposio, N for grande e a dimenso da amostra for suficientemente grande, podemos aproximar a distribuio de amostragem da proporo, pela distribuio Normal. Resumindo o que acabmos de dizer, temos

Notao: No esquea que a notao para parmetro e estatstica diferente. Assim

Parmetro (populao) Proporo


Valor mdio Desvio padro

Estatstica (amostra)
p

x
s

Maria Eugnia Graa Martins - DEIO

54

Introduo Estimao

Exerccios 2.4.1 Na sua escola pretende-se averiguar qual a proporo de alunos que gostaria que se realizasse uma festa de Natal. Recolhem-se aleatoriamente 2 amostras, uma de dimenso 50 e outra de dimenso 100. Tem a garantia que a proporo de respostas favorveis realizao da festa, obtida a partir da amostra de 100 alunos, esteja mais perto da verdadeira proporo de alunos favorveis festa, do que a obtida a partir da amostra de dimenso 50? Explique a sua resposta. 2.4.2 O Conselho Directivo da escola pretende averiguar qual a percentagem de alunos que utilizaria regularmente (3 ou mais vezes por semana) a cantina, para almoar, no caso de esta comear a fornecer almoos. Encarregou uma comisso de alunos de fazer um estudo sobre este problema. Esta comisso recolheu informao junto de 100 alunos da escola e elaborou a seguinte tabela de frequncias:
Quantas vezes almoarias na Escola? N de respostas 0 10 1 12 2 18 3 40 4 12 5 8

a) b) c) d)

Identifique o parmetro em estudo. Qual a percentagem de alunos que pensam utilizar regularmente a cantina? A proporo obtida anteriormente uma estatstica ou um parmetro? Se em vez de uma amostra de dimenso 100, recolhesse uma amostra de dimenso 150, teria uma maior probabilidade de obter um valor para a proporo amostral, mais perto do parmetro? Explique.

2.4.3 Uma mquina de leitura ptica tem uma probabilidade de 1% de cometer erro(s) na leitura de uma folha. Esta mquina utilizada para processar a informao contida nas fichas dos alunos (uma ficha por cada aluno) de uma Universidade. De cada vez que a mquina utilizada, processa a leitura de lotes de 100 fichas. a) Como se distribui a proporo de fichas lidas erradamente pela mquina, por lote? b) A mquina ser rejeitada se a probabilidade de ler 3 ou mais fichas erradas, em cada utilizao, for superior a 5%. Ser de rejeitar a mquina? 2.4.4 Pretende-se averiguar qual a percentagem de alunos da escola que tm computador. Recolheu-se uma amostra de 50 alunos e verificou-se que 25% dos alunos tinham computador. a) O valor 25% um parmetro ou uma estatstica? b) Obtenha uma estimativa para a probabilidade e em 50 alunos, 30 ou mais terem computador. 2.4.5 Considere a populao de deputados da X Legislatura, que se encontra em Anexo. Seleccione aleatriamente 5 deputados, e registe as observaes na seguinte tabela:
Nmero Nome Sexo Partido Circulo Eleitoral Idade em 31/12/2001

a) Algum dos deputados seleccionados seu conhecido? b) Qual a proporo de deputados do PS na sua amostra? Esta proporo igual a 52.6% (proporo de deputados do PS na X Legislatura)?

Introduo Estimao

55

c) Se a sua resposta questo anterior foi no isso significa que a amostra enviesada? d) Pea aos seus colegas que seleccionem tambm 5 deputados e registe o valor obtido para a proporo de deputados do PS para cada amostra seleccionada. Marque os valores obtidos num grfico. Sugesto: Sugere-se uma representao grfica como a que se apresenta a seguir

onde se verifica que, por exemplo, de 10 amostras consideradas, se obteve: 1 vez, uma percentagem de 0 deputados do PS; 1 vez, uma proporo de 0.2 deputados do PS, 2 vezes uma proporo de 0.4 deputados do PS, etc. A seta indica a posio da percentagem de deputados do PS na populao considerada. e) Quantos dos seus colegas obtiveram uma percentagem de deputados do PS superior a 52.6%? E quantos obtiveram uma percentagem inferior? f) Tendo em considerao os resultados obtidos na alnea anterior, pensa que a proporo amostral um estimador centrado da proporo populacional? Sugesto: Sugere-se uma representao grfica como a que se apresenta a Reparou que: o valor obtido pela estatstica varia de amostra para amostra? A esta propriedade chamamos variabilidade amostral.
2.4.6 - Considere a populao constituda pelas pastilhas XPTO fabricadas pela XPTO Lda. Estas pastilhas podem ser de 3 cores, e pretende-se averiguar algo sobre a forma como se distribuem as cores. a) Recolha uma amostra de 25 pastilhas e registe o nmero e a proporo de pastilhas de cada uma das cores: Vermelha Amarela Azul Freq. Abs. Freq. Rel. b) A proporo de pastilhas amarelas, de entre as 25 que seleccionou, um parmetro ou uma estatstica? c) A proporo de pastilhas amarelas fabricadas pela fbrica XPTO Lda um parmetro ou uma estatstica? d) Conhece o valor da proporo de pastilhas amarelas fabricadas pela XPTO Lda? e) Conhece o valor da proporo de pastilhas amarelas existentes nas 25 pastilhas que seleccionou? Estas questes que acabamos de pr realam o facto de facilmente se poder calcular o valor de uma estatstica, mas s raramente se conhecer o valor de um parmetro. por essa razo, que um dos principais objectivos pelos quais de recolhe uma amostra, para estimar o valor do parmetro, com base no valor da estatstica. f) Suspeita que todos os seus 29 colegas obtiveram a mesma proporo de pastilhas amarelas, na amostra de 25 pastilhas que cada um recolheu? g) Admita que no seguinte diagrama de pontos se apresentam as propores de pastilhas amarelas obtidas por si e pelos seus colegas (tambm em amostras de dimenso 25):

Maria Eugnia Graa Martins - DEIO

56

Introduo Estimao

Sugira um valor para a proporo de pastilhas amarelas produzidas pela fbrica XPTO Lda. h) Admitindo que o valor da proporo de pastilhas amarelas produzidas pela fbrica era 0.5, algumas das propores obtidas no esto razoavelmente prximas desse valor. Como explica este facto? i) Suponha que em vez de 25 pastilhas, recolhia 100 pastilhas e os seus colegas faziam o mesmo. Qual dos dois diagramas de pontos seguintes, esperaria obter para representar as propores de pastilhas amarelas obtidas nas amostras de dimenso 100?

j)

Explique convenientemente a sua resposta. As propores de pastilhas amarelas obtidas nas 30 amostras recolhidas foram as seguintes:
0,39 0,42 0,43 0,43 0,45 0,45 0,45 0,45 0,47 0,47 0,48 0,49 0,49 0,49 0,49 0,5 0,5 0,5 0,51 0,51 0,51 0,52 0,53 0,54 0,54 0,54 0,55 0,56 0,56 0,6

Calcule a mdia e o desvio padro dos valores anteriores. k) Admita que a populao de onde esteve a seleccionar as amostras anteriores constituda por elementos pertencentes a uma de duas categorias: pastilhas amarelas e pastilhas no amarelas. Se uma pastilha for amarela, representa-a por 1. Caso contrrio representa-a por 0. Seja 0,5 a proporo de pastilhas amarelas. Calcule o valor mdio o desvio padro desta populao. l) Compare os valores obtidos nas duas alneas anteriores. Comente.
2.4.7 (Rossman, 2001) Em 1996, nas eleies presidenciais nos Estados Unidos, Bill Clinton recebeu 49% dos votos, enquanto Bob Dole recebeu 41% e Ross Perot 8%. Suponha que selecciona uma amostra de 100 eleitores das eleies referidas anteriormente e pergunta a cada eleitor, em quem votou. a) Tem a certeza que nos 100 eleitores vai obter 49 a favor de Clinton, 41 a favor de Dole e 8 a favor de Perot? b) Suponha que selecciona vrias amostras de 100 eleitores. Vai obter a mesma proporo de eleitores adeptos de Clinton, em todas as amostras? c) Suponha que conseguia seleccionar todas as amostras possveis, de dimenso 100, da populao de eleitores e calculava para cada uma delas a proporo de eleitores favorveis a Clinton. Que nome d distribuio dos valores obtidos anteriormente? Qual a mdia e desvio padro que esperaria obter para o conjunto de todos esses valores?

Introduo Estimao

57

d) Admita que selecciona amostras de dimenso n, com n= 50, 100, 200, 400, 500, 800, 1000, 1600, 2000 e calcula a proporo de eleitores favorveis a Clinton. i) Calcule os desvios padres das distribuies de amostragem da proporo de eleitores que votam Clinton, para cada uma das dimenses de amostras consideradas (No esquea que o valor obtido por Clinton, nas eleies referidas, foi de 49%). ii) Construa um diagrama de disperso dos valores dos desvios padres, versus os valores das dimenses das amostras consideradas. iii) Para que o desvio padro reduza de metade, de quanto que tem de aumentar a dimenso da amostra? e) Represente por p a proporo de votos recebidos por um certo candidato numa eleio. Admita que selecciona repetidamente amostras de dimenso 100 e calcula a proporo de eleitores que votariam nesse candidato. i) Calcule os desvios padres das distribuies de amostragem das propores amostrais obtidas, admitindo que o parmetro p assume cada um dos seguintes valores: 0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1. ii) Construa um diagrama de disperso dos desvios padres obtidos, versus o valor do parmetro ou proporo polpulacional p. iii) Para que valor de p obtm maior variabilidade nas propores amostrais? iv) Para que valor de p obtm menor variabilidade nas propores amostrais? Comente.

Maria Eugnia Graa Martins - DEIO

58

Introduo Estimao

5 - O modelo Normal (ou Gaussiano)


Como vimos nas seces anteriores, o modelo Normal adequado para descrever, em determinadas condies, as distribuies de amostragem das estatsticas Mdia X e , utilizadas para estimar o valor mdio e a proporo Proporo Amostral P populacional p, respectivamente. Assim, est na base de tcnicas de inferncia estatstica largamente utilizadas, nomeadamente as que dizem respeito estimao intervalar ou construo de intervalos de confiana, como veremos no mdulo 3 Intervalos de confiana. Independentemente da populao que esteja a ser objecto de estudo, vimos nas seces anteriores que, se a dimenso da amostra for suficientemente grande, o Teorema Limite Central d-nos legitimidade para utilizarmos o modelo Normal, na aproximao da distribuio de amostragem da Mdia ou da Proporo, sempre que no for conhecida a distribuio exacta. A distribuio Normal, das distribuies contnuas, a mais conhecida, foi obtida matematicamente por Gauss, como a distribuio dos erros de medidas, tendo-lhe dado o nome sugestivo de "lei normal dos erros". A partir da, astrnomos, fsicos e mais tarde, cientistas de outros campos, que manipulavam dados, verificaram que muitos dos histogramas que construam apresentavam a caracterstica seguinte: comeavam a crescer gradualmente, at atingirem um ponto mximo, a partir do qual decresciam de forma simtrica:

Este aspecto apresentado pelos histogramas, foi o suficiente para desencadear um entusiasmo pela distribuio (Populao) Normal, com funo densidade em forma de sino, a qual se admitia como subjacente aos dados. Chegou-se ao ponto de duvidar de dados, cujos histogramas no tinham aquele comportamento! Desfeito o mito da distribuio normal, podemos dizer que ela tem ainda hoje um papel importante em estatstica, j que muitos dos processos de inferncia estatstica clssica, tm por base, precisamente a distribuio Normal. Ao falarmos na distribuio Normal, estamos na realidade a referir-nos a uma famlia de distribuies, indexadas pelos parmetros e . Assim, para cada par de valores destes parmetros temos uma distribuio normal, cuja funo densidade de probabilidade tem o seguinte aspecto:

Introduo Estimao

59

Uma v.a. X com distribuio Normal de parmetros e representa-se por


XN(,)

Pode-se mostrar que:


E(X) = e Var(X) = 2

Vejamos algumas propriedades, relativamente representao grfica, da funo densidade normal, que se deduzem da sua expresso analtica f(x) =

1 2 2

exp[-

1 x ], xR: 2

simtrica relativamente ao seu valor mdio , de modo que duas curvas correspondentes a duas distribuies com o mesmo desvio padro tm a mesma forma, diferindo unicamente na localizao. tanto mais achatada, quanto maior for o valor de , de modo que duas curvas correspondentes a duas distribuies com o mesmo valor mdio, so simtricas, relativamente ao mesmo ponto, diferindo no grau de achatamento.

Para dar uma ideia da concentrao da distribuio normal, em torno do seu valor mdio, apresentamos seguidamente algumas probabilidades: P( X + )=.683 P( 2 X + 2)=.954 P( 3 X + 3)=.997

Maria Eugnia Graa Martins - DEIO

60

Introduo Estimao

distribuio normal que tem valor mdio 0 e desvio padro 1 chamamos distribuio "standard " ou reduzida, e representamos por
ZN(0,1)

Se a v.a. X tiver valor mdio e desvio padro , ento a v.a. Z = mdio 0 e desvio padro 1. Assim

X , tem valor

XN(, )

Z=

X N(0,1)

A funo distribuio da normal reduzida, tem uma notao especial. Assim, se Z for uma v.a. normal reduzida, representamos

Introduo Estimao

61

P( Z z) = (z)

Da simetria da curva normal, deduz-se imediatamente a seguinte propriedade:

(-z) = 1 (z)

Hoje em dia o clculo das probabilidades correspondentes distribuio Normal no oferece qualquer dificuldade, pois pode ser feito com as mquinas de calcular ou a folha de Excel do computador. At h bem pouco tempo, s dispunhamos de tabelas extensivas da funo distribuio da normal standard, que permitiam o clculo de quaisquer probabilidades, referentes v.a. Z (veremos mais adiante a utilizao do computador para o clculo das probabilidades da Normal). A propriedade enunciada anteriormente tambm permite concluir, que bastava haver tabelas para os valores de z0 ou de z0. Alguns exemplos P(Z1.37) = (1.37) = .9147

P(Z>1.37) = 1 - P(Z1.37) = 1 - .9147 = .0853

Maria Eugnia Graa Martins - DEIO

62

Introduo Estimao

P(-.155 <Z<1.60) = (1.60) - (-.155) = (1.60)-1+ (.155) (a tabela disponvel s tinha os valores positivos) = .9452 -1 + .5616 = .5068

Determinar o valor de z, tal que P(Zz) = .975

(z) = .975

z= -1(.975) =1.96

Determinar o valor de z tal que P(Z>z) = .025 1 - (z) = .025 z= -1(.975) = 1.96

Mas se a Normal no tiver valor mdio nulo e desvio padro 1, como fazer para ainda ser possvel utilizar as tabelas?

Para o clculo das probabilidades correspondentes a uma distribuio normal de parmetros e , vamo-nos servir das tabelas da normal reduzida, tendo em ateno a seguinte relao, j apresentada anteriormente:
XN(, )

Z=

N(0,1)

donde: P(aXb) = P(

) P(aXb) = (

) - (

Introduo Estimao

63

Se XN(4,2) P(X6) P(X 6) = (

calcular

64 ) 2

= (1) = 0.841

Se XN(, ) calcular P(-1.96X+1.96) P((-1.96 X+1.96) =


1.96 X + 1.96 ) = (1.96). (1.96) = 0.975 0.025 = .0.95

P(

Maria Eugnia Graa Martins - DEIO

64

Introduo Estimao

Exemplo - Na pastelaria "Gulosa" a quantidade de farinha F utilizada semanalmente, uma varivel aleatria com distribuio normal de valor mdio 600kg e desvio padro 40kg. Havendo no incio de determinada semana, um armazenamento de 634kg e no sendo possvel receber mais farinha durante a semana:

a) Determine a probabilidade de ruptura do stock de farinha. b) Qual deveria ser o stock, de modo que a probabilidade de ruptura fosse de .01? Resoluo:

a) Pretende-se calcular a probabilidade de ruptura do stock, isto , P(F>634), com FN(600,40) P(F > 634)=1 - P(F 634)=1 - P(Z 634 600 ) = 1 - (.85) 40 = 1- .8023 =.1977 b) P(F > s)= .01 1-( ( s 600 )=.01 40

s 600 s 600 ) = .99 = 2.326 40 40


s = 693kg

S-ar putea să vă placă și