Aula 19

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior

Raciocínio Lógico-Quantitativo para Traumatizados
Aula 19
Estimação de Parâmetros
19. Estimação de Parâmetros . ................................................................................................ 3

19.1 Introdução . ..................................................................................................................... 3
19.2 Estimador e Estimativa . ............................................................................................ 4
19.2.1 Propriedades dos Estimadores ....................................................................................... 4
19.2.2 Critérios para Escolha dos Estimadores ....................................................................... 13
19.3 Estimação por Ponto . ............................................................................................... 19
19.3.1 Estimação por Ponto da Média .................................................................................... 19
19.3.2 Estimação por Ponto da Variância ............................................................................... 19
19.3.3 Estimação por Ponto do Desvio Padrão ....................................................................... 20
19.3.4 Estimação por Ponto de uma Proporção Populacional ................................................ 20
19.3.4 Estimação por Ponto com Base em Diversas Amostras .............................................. 20
19.4 Estimação por Intervalo . ........................................................................................ 21
19.4.1 Intervalo de Confiança para a média quando o desvio-padrão é conhecido ................ 22
19.4.2 Intervalo de confiança para a média quando o desvio-padrão é desconhecido ........... 24
19.4.3 Intervalo de confiança para a variância . ..................................................................... 25
19.4.4 Intervalo de confiança para o desvio-padrão . ............................................................. 27
19.4.5 Intervalo de Confiança para uma proporção populacional . ........................................ 27
19.5 Tamanho das Amostras . ......................................................................................... 29
19.6 Memorize para a prova ............................................................................................ 32
19.7 Exercícios de Fixação ................................................................................................ 35
19.7 Gabarito . ....................................................................................................................... 41
19.8 Resolução dos Exercícios de Fixação . ................................................................ 42
Profs. Alexandre Lima e Moraes Junior 1

Erratas – Aula 15
Resolução da Questão 09:
Corrigir a última fórmula:
2
Py|x (1 |1)Px (1) 1× 10
Px|y (1 |1) = = 3 = .
Py|x (1 |1)Px (1) + Py|x (1 | 0)Px (0) 1 × + ×
2 1 1 11
3 5 3
Corrigir a última fórmula:
5 4
Py|x (1 |1)Px (1) × 20 10
Px|y (1 |1) = = 10 10 = = .
Py|x (1 |1)Px (1) + Py|x (1 | 0)Px (0) 5 × 4 + 1 × 6 26 13
10 10 10 10
“(...) Há quatro casos possíveis:
1) escolha de uma bola branca no 1º sorteio e de uma bola preta no 2º

sorteio quando a urna escolhida é a que tem 3 bolas brancas e 1 preta
(caso 1) ou
2) caso 2: escolha de uma bola preta no 1º sorteio e de uma branca no
2º sorteio quando a urna escolhida é a que tem 3 bolas brancas e 1
preta (caso 2) ou
3) escolha de uma bola branca no 1º sorteio e de uma bola preta no 2º
sorteio quando a urna escolhida é a que tem 3 bolas brancas e 3 pretas
(caso 3) ou
4) escolha de uma bola preta no 1º sorteio e de uma branca no 2º
sorteio quando a urna escolhida é a que tem 3 bolas brancas e 3 pretas
(caso 4).
(...)”

2
19. Estimação de Parâmetros
19.1 Introdução
A partir desta aula, focaremos o estudo da Inferência Estatística. Vimos que o

seu objetivo é inferir propriedades da população a partir de uma amostra.
A Inferência Estatística pode ser dividida em duas partes: estimação de

parâmetros e testes de hipóteses. Nesta aula abordaremos a estimação,
mas apenas no que diz respeito à estimação dos parâmetros de uma
distribuição populacional (você já aprendeu um pouco sobre estimação na aula
17, quando estudamos a regressão linear).
A teoria da Probabilidade fornece vários modelos probabilísticos (distribuições

de probabilidades), tais como binomial, Poisson, normal, etc. Tais modelos
representam famílias de distribuições que dependem de um ou mais
parâmetros. Por exemplo, uma distribuição normal é caracterizada pela média
e desvio-padrão σ.
Quando descrevemos uma população, fazemos isso por meio de algum modelo
probabilístico, cujos parâmetros, portanto, devem ser estimados da melhor
forma possível com base na amostra obtida.
Há duas técnicas de estimação de parâmetros: por ponto e por intervalo. Na

estimação por ponto, a estimativa do parâmetro populacional corresponde a
um único valor estimado. Na segunda técnica, constrói-se um intervalo, o qual
deverá, com probabilidade conhecida, conter o parâmetro. Neste texto
admitiremos, salvo menção em contrário, que a amostragem sempre será
aleatória.
A próxima figura é um plot dos resíduos de uma regressão linear. Vimos na

aula 17 que a média dos resíduos é zero (linha horizontal azul). As estimativas
pontuais dos resíduos são os pontos circulares. Note que cada estimativa por
ponto está situada no ponto médio de um intervalo de estimação (são as
barras verticais), o qual contém o parâmetro com uma probabilidade
conhecida (geralmente utiliza-se 95% na prática). Observe que a estimativa
mais à esquerda do gráfico (a de cor vermelha) não cruza a linha azul; desta
forma, podemos concluir que trata-se de um provável outlier.

3
0.8
0.6
0.4
0.2
resíduos
-0.2
-0.4
-0.6
-0.8
2 4 6 8 10 12 14 16 18 20
x
19.2 Estimador e Estimativa
Apresentamos os conceitos de estimador e de estimativa na aula passada.

Vamos relembrar estes conceitos rapidamente?
Um estimador (ou estatística) é qualquer função das observações de

uma amostra, que será usado no processo de estimação do parâmetro
populacional desejado. A média amostral X , por exemplo, é um estimador da
média µ de uma população. Um estimador é uma variável aleatória
caracterizada por uma distribuição de probabilidades. Chamamos de
estimativa um particular valor assumido por um estimador.
A estimação por ponto consiste em adotar a melhor estimativa possível

como sendo o valor do parâmetro. A qualidade da estimação irá depender
fundamentalmente da escolha do estimador. Assim, dentre os possíveis
estimadores que podem ser especificados para um determinado parâmetro
populacional, devemos ter a preocupação de escolher aquele que melhor
satisfaça as propriedades estatísticas de um bom estimador.
19.2.1 Propriedades dos Estimadores
Justeza ou Não Tendenciosidade
Um estimador Θ̂ é justo (ou não viesado, ou não viciado, ou não

tendencioso) se o seu valor esperado (ou média) for igual ao valor do
parâmetro θ que se pretende estimar, isto é, se
(1) ˆ ) = θ.
E (Θ
4
A Eq. (1) afirma que os valores aleatórios de um estimador justo ocorrerão em

torno do valor do parâmetro, o que é desejável (veja a figura abaixo).
Um estimador não viesado é aquele que, na média, acerta o valor

correto do parâmetro populacional.
Se o estimador for tendencioso, então a diferença
(2) ˆ −θ
E (Θ)
é o viés (tendência ou vício) do estimador Θ̂ , conforme ilustrado pela

próxima figura. Deste modo, a adoção de um estimador que não seja justo
implica um vício de estimação.

5
Exemplo (Média Amostral). Seja uma população com média µ. A média X

da amostra aleatória ( X 1 , X 2 ,..., X n ) extraída dessa população é dada por
X 1 + X 2 + ... + X n
X = .
n
Então, o valor esperado de X é
 X + X 2 + ... + X n 
E( X ) = E 1 =
 n 
1 1 1 n×
= E ( X 1 ) + E ( X 2 ) + ... + E ( X n ) = =µ
n n n n
Portanto, a média amostral é um estimador justo da média populacional

(memorize para a prova!).
Exemplo (Média Ponderada). Seja a média ponderada de uma amostra

aleatória ( X 1 , X 2 ,..., X n ) definida como
w1 X 1 + w2 X 2 + ... + wn X n
W=
n
em que as constantes w1 , w2 ,..., wn ( w1 + w2 + ... + wn = n ), são os pesos usados na

ponderação. Então, o valor esperado de W é
 w X + w2 X 2 + ... + wn X n 
E ( X ) = E 1 1 =
 n 
1 1
= [w1 E ( X 1 ) + w2 E ( X 2 ) + ... + wn E ( X n )] = [w1 + w2 + ... + wn ]= × n = µ.
n n n
6
Portanto, a média ponderada de uma amostra é um estimador justo da

média populacional µ, apesar da ponderação.
Exemplo. Seja um estimador M da média populacional µ dado pela equação
∑X i
M = i =1
.
n +1
n
Espera-se que o viés de M seja negativo, uma vez que a divisão de ∑X
i =1
i por
n+1 tende a subestimar o valor de µ.
Calculemos o valor esperado de M:
 X + X 2 + ... + X n 
E (M ) = E 1 =
 n +1 
1
= [E ( X 1 ) + E ( X 2 ) + ... + E ( X n )] = n ≠ µ.
n +1 n +1
Portanto, M é um estimador viesado da média populacional µ.
Observe que
viés(M) = E(M) - µ,
n
viés(M) = -µ= − ⇒ negativo, como antecipado.
n +1 n +1
Exemplo. Seja uma população com média µ e variância σ2. Verifique que o
estimador da variância populacional definido por
∑( X i − X )2
σˆ 2 = i=1
n
é viesado.
Nota: o entendimento da demonstração que se segue não é essencial para a

prova. Mas é importante memorizar que o estimador da variância
populacional considerado neste exemplo é viesado.
Demonstração:

7
Calculemos a esperança de σˆ 2 :
1 n  1 n  1 n 
E(σˆ ) = E ∑ (X i − X )  = E ∑ (X i − µ + µ − X )  = E ∑[(X i − µ) + ( µ − X )]2 
2 2 2
n  i=1  n  i=1  n  i=1 

1  n 
E(σˆ 2 ) = E ∑[(X i − µ) 2 + 2(X i − µ)( µ − X ) + ( µ − X ) 2 ]
n  i=1 
1  n n n 
E(σˆ 2 ) = E ∑ (X i − µ) 2 + 2∑ (X i − µ)( µ − X ) + ∑ ( µ − X ) 2 
n  i=1 i=1 i=1 
1  
n n
E(σˆ 2 ) = E ∑ (X i − µ) 2 + 2( µ − X )∑ (X i − µ) + n( µ − X ) 2 
n  i=1 i=1 
como ∑X i = nX , temos que

i=1
1  
n
E(σˆ ) =
2
E ∑ (X i − µ) 2 + 2n(µ − X )(X − µ) + n( µ − X ) 2 
n  i=1 
1  
n
E(σˆ 2 ) = E ∑ (X i − µ) 2 − 2n( µ − X )( µ − X ) + n( µ − X ) 2 
n  i=1 
1  n 
E(σˆ 2 ) = E ∑ (X − µ) 2 − 2n(µ − X ) 2 + n( µ − X ) 2 
n  i=1 i 
1  
n
E(σˆ 2 ) = E ∑ (X i − µ) 2 −n( µ − X ) 2 
n  i=1 
levando em conta que ( − X ) 2 = ( X − µ ) 2 , obtemos
1  
n
E(σˆ 2 ) = E ∑ (X i − µ) 2 −n(X − µ) 2 
n  i=1 
aplicando a expectância, obtemos
1   
n
E(σˆ 2 ) =  E ∑ (X i − µ) 2  − nE[(X − µ) 2 ].

n   i=1  
Como a esperança da soma é igual à soma das esperanças, tem-se que
1 
n
E(σˆ 2 ) = ∑ E(X i − µ) − nE[(X − µ) ] .
2 2
n  i=1 
Mas E ( X i − µ) 2 = var( X i ) = σ2 e E [( X − µ) 2 ] = var( X ) = σ2 / n . Logo,

8
1  n
σ2 
1 n −1 2
E (σˆ 2 ) = ∑σ2 − n  = × ( nσ2 − σ2 ) = σ ≠ σ2 .
n  i =1 n n n
Conclui-se que σˆ 2 é um estimador viesado da variância populacional σ2

(memorize para a prova!). Esse defeito do estimador pode ser corrigido se
multiplicarmos σˆ 2 pelo fator n /( n − 1) , o que nos leva à definição do estimador
n 2
∑(X i − X )2
S2 = σˆ = i =1
,
n −1 n −1
o qual, não por acaso, corresponde à variância amostral definida na aula

anterior.
Não é difícil mostrar que S2 é um estimador justo da variância

populacional (memorize para a prova!):
n n n −1 2
E(S 2 ) = E(σˆ 2 ) = × × σ = σ2 .
n −1 n −1 n
_______________________________________________________
Há estimadores que, embora viesados, tem seu viés diminuído quando o

tamanho da amostra aumenta, ou seja, o viés vai desaparecendo à medida
que o tamanho da amostra aumenta. Um estimador é dito assintoticamente
não viesado se
(3) ˆ ) = θ.
lim E (Θ
n→∞
Exemplo. Verifique que o estimador da média populacional µ dado por

n
M = (n + 1) −1 ∑ X i é assintoticamente não viesado.
i =1
n  n 
E(M) = ⇒ lim E(M) = µ lim  = µ ⇒ Logo, M é um estimador
n +1 n→∞ n → ∞ n +1
assintoticamente não viesado da média populacional µ.

_______________________________________________________
Eficiência
Não basta que um estimador acerte na média. Além disso, é desejável que
tenha a menor variância possível (maior precisão possível).
Um estimador é dito Eficiente ou Estimador Não Tendencioso de

Variância Mínima (ENTVM), se

9
• for não viesado;
• entre os estimadores não viesados, apresentar a menor variância.
Teorema (ENTVM). Se ( X 1 , X 2 ,..., X n ) for uma amostra aleatória proveniente

de uma população normalmente distribuída com média µ e variância σ2, então
a média amostral X será o ENTVM (ou eficiente) de µ.
Entre dois estimadores não viesados, diz-se que é relativamente mais

eficiente aquele que apresenta a menor variância.
Exemplo. Considere uma amostra aleatória de 2 elementos oriunda de uma

população com média µ e variância σ2. Determine a variância do estimador da
média populacional dado por
3 X1 + 2 X 2
W=
5
e compare esse estimador com a média amostral.
Vimos anteriormente que a média ponderada W é um estimador não viesado

de µ. Neste exemplo, sua variância é dada por
 3X + 2 X 2  1
var(W ) = var 1 = var(3 X 1 + 2 X 2 ) =
 5  25
1 13σ 2
= [9 var( X 1 ) + 4 var( X 2 )] = = 0,52σ 2 .
25 25
Por outro lado, a variância de X é 0,5σ2 (menor que a variância da média

ponderada). Neste caso, a média amostral é um estimador relativamente mais
eficiente (melhor) do que W, pois possui uma variância menor. Como o
enunciado não especificou a distribuição de probabilidades da população X, não
se pode afirmar que X seja o estimador eficiente da média populacional µ.
_______________________________________________________
Entre dois estimadores justos, vimos que é relativamente mais

eficiente aquele que apresenta a menor variância. Mas e se quisermos
comparar dois estimadores quaisquer? Qual será a métrica de comparação? A
métrica mais usada é o Erro Quadrático Médio (EQM) de estimação.
Define-se o EQM como a média da diferença quadrática (diferença ao

quadrado) entre o estimador e o valor do parâmetro:
(4) EQM (Θ ˆ − θ ) 2 ].
ˆ ) = E[(Θ
Desenvolvendo (4), demonstra-se que

10
(5) ˆ ) = var(Θ
EQM (Θ ˆ ) ]2.
ˆ ) + [viés (Θ
Ou seja,
EQM de estimação = variância do estimador + (viés do estimador)2
Daremos a prova de que (4) e (5) são equivalentes a seguir. O entendimento

da demonstração não é fundamental para a prova; mas é desejável que você
se esforce um pouco para entendê-la. Desvio a sua leitura para o texto após a
prova, se preferir.
Prova:
Desenvolvendo (4), obtemos
ˆ ) = E (Θ
EQM (Θ ˆ θ + θ 2 ) = E (Θ
ˆ 2 − 2Θ ˆ 2 ) − 2θE (Θ
ˆ ) +θ 2 ,
pois θ é um valor constante (E(θ) = θ). Somando e subtraindo [ E (Θ

ˆ )]2 ,
chegamos a:
ˆ ) = E (Θ
EQM (Θ ˆ 2 ) − [ E (Θ ˆ )]2 − 2θE (Θ
ˆ )]2 + [ E (Θ ˆ ) +θ 2
em que E (Θˆ 2 ) − [ E (Θ
ˆ )]2 = var(Θ ˆ )]2 − 2θE (Θ
ˆ ) e [ E (Θ ˆ ) + θ 2 = [ E (Θ
ˆ ) − θ ]2 . Logo, podemos
reescrever a expressão acima na forma
ˆ ) = var(Θ
EQM (Θ ˆ ) − θ ]2
ˆ ) + [ E (Θ
em que ˆ ) −θ]
[ E (Θ representa o viés do estimador. Logo,
ˆ ) = var(Θ
EQM (Θ ˆ ) ]2.
ˆ ) + [viés (Θ
A Eq. (5) mostra que o EQM tem dois componentes: o estimador erra o
valor do parâmetro em função da sua dispersão (variância) e ainda,
quando for o caso, pelo fato de não acertar na média (ser viesado).
Para dois estimadores quaisquer Θ̂1 e Θ̂ 2 , se Θ̂1 tem menor EQM do que Θ̂ 2 ,
então Θ̂1 é relativamente mais eficiente do que Θ̂ 2 .
Observe que, para dois estimadores justos, dizer que EQM é menor equivale a
dizer que a variância é menor (pois o viés é nulo).
Melhor Estimador Linear Não Viesado

11
Uma terceira propriedade desejável de um estimador é que ele seja o Melhor
Estimador Linear Não Viesado (MELNV). Para tal, o estimador tem que:
• ser não viesado;

• ser linear;
• entre os estimadores lineares e não viesados, apresentar a menor
variância.
Um estimador é linear se for obtido por meio de uma combinação linear das
observações X 1 , X 2 ,..., X n da amostra, ou seja, se é dado por
(6) ˆ = a X + a X + ... + a X ,
Θ 1 1 2 2 n n
em que os pesos ai , i = 1,2,..., n , são constantes.
A média amostral X = ( X 1 + X 2 + ... + X n ) / n é um estimador linear pois
1
a1 = a2 = ... = an = .
n
Consistência
Um estimador é consistente, se, à medida que a amostra cresce,

converge para o verdadeiro valor do parâmetro. Ou seja, quando o
tamanho da amostra vai aumentando, o viés (se existir) vai diminuindo e a
variância também. Um estimador consistente é aquele que converge para o
valor do parâmetro quando o tamanho da amostra tende a infinito.
Tendo em vista o que foi dito acima, temos que um estimador será consistente
se:
(7) ˆ ) =θ
lim E (Θ
n →∞
(8) ˆ)=0
lim var(Θ
n →∞
A média amostral é um estimador consistente da média, pois é um

estimador justo e para o qual vale
σ 2 
lim var( X ) = lim   = 0 .
n →∞ n→∞
 n 
Como

12
ˆ ˆ ˆ ) ]2,
EQM (Θ) = var(Θ) + [viés (Θ
um estimador consistente possui
ˆ ) = 0.
lim EQM (Θ
n→∞
19.2.2 Critérios para Escolha dos Estimadores
Alguns critérios têm sido propostos com o objetivo de resolver o problema da

escolha do estimador adequado. Dentre eles, podemos citar os métodos da
máxima verossimilhança, dos momentos e de Bayes. Destacamos a
importância, para a prova (e também na prática), do método da máxima
verossimilhança, que será apresentado a seguir.
Estimação por Máxima Verossimilhança
Os dicionários definem o termo verossímil como aquilo que parece ser

verdadeiro ou o que tem probabilidade de ser verdadeiro ou aquilo que se
assemelha com a realidade. Neste sentido, qual seria a idéia fundamental da
estimação por verossimilhança de um parâmetro populacional? A resposta
é a seguinte: a estimação por verossimilhança fornece a estimativa que
corresponde ao valor mais provável do parâmetro.
Vejamos a seguir como a Estatística define o conceito de estimação por

máxima verossimilhança.
O método da máxima verossimilhança consiste em adotar para o

parâmetro o valor que maximize a função de verossimilhança associada ao
resultado obtido na amostra. Mas o que é a função de verossimilhança?
Definição (Método da Máxima Verossimilhança). Seja uma população

com função densidade de probabilidade caracterizada pelo parâmetro
populacional desconhecido θ. Então a distribuição de probabilidades dessa
população pode ser denotada por f ( x;θ ) . Sejam n observações independentes
X 1 , X 2 ,..., X n (ou seja, uma amostra aleatória com n elementos provenientes da
população em questão). Então a função densidade conjunta para estas
observações, também conhecida como função de verossimilhança da
amostra, é dada por
L(θ ) = f ( x1 ;θ ) × f ( x2 ;θ ) × ... × f ( xn ;θ ) .
Note que L(θ ) é função somente do parâmetro desconhecido θ. A Estimativa

de Máxima Verossimilhança (EMV) de θ é o valor θˆ que maximiza a função
L(θ ) . A raiz da equação dL(θ ) / dθ = 0 é o ponto de máximo de L(θ ) . Em muitos
casos, é mais conveniente tomar a primeira derivada da função de log-
13
verossimilhança ln L(θ ) (logaritmo natural de L(θ ) ), a qual possui um máximo
no mesmo ponto θˆ que maximiza L(θ ) . Deste modo,
1 df ( x1 ;θ ) 1 df ( x2 ;θ ) 1 df ( xn ;θ )
+ + ... + =0
f ( x1 ;θ ) dθ f ( x2 ; θ ) dθ f ( xn ; θ ) dθ
A solução para a equação acima (θ em termos dos xk) é a estimativa de

máxima verossimilhança de θ.
Nota: no caso de uma variável aleatória discreta, a função de verossimilhança

L(θ ) é a probabilidade
Pθ ( X 1 = x1 , X 2 = x2 ,..., X n = xn ) .
Ou seja, L(θ ) é apenas a probabilidade de obter os valores amostrais

x1 , x2 ,..., xn . Logo, no caso discreto, a estimativa de máxima verossimilhança é
aquela que maximiza a probabilidade de ocorrência dos valores da amostra.
Exemplo. Um jogador de cassino trocou o seu dinheiro por dez fichas, das
quais θ são pretas e 10 – θ são brancas. Uma amostra de quatro fichas com
reposição é retirada do seu bolso e verifica-se que ela contém três fichas
brancas e uma ficha preta. Estime o parâmetro θ pelo método da máxima
verossimilhança.
Solução:
Devemos determinar a função de verossimilhança correspondente ao resultado

amostral obtido, a qual será dada pela probabilidade de, em uma amostra de n
= 4, obter-se exatamente uma ficha preta, dada em função do parâmetro
desconhecido θ. Tal probabilidade pode ser obtida pela aplicação da
distribuição binomial, em que a probabilidade de sucesso será p = θ / 10 , n = 4 e
x = 1. Designando por L(θ ) a função de verossimilhança, temos
1 3
 n x n −x  4  θ   θ  θ (10 − θ )3
L(θ ) =   p (1 − p ) =    1 −  =
 x  1  10   10  2.500
A Tabela a seguir mostra que o valor de máxima verossimilhança é θ = 3 . Logo,

a estimativa de máxima verossimilhança é θˆ = 3 .
θ L(θ) θ L(θ)
0 0 6 384/2.500
1 729/2.500 7 189/2.500
14
2 1.024/2.500 8 64/2.500
3 1.029/2.500 9 9/2.500
4 864/2.500 10 0
5 625/2.500
_______________________________________________________
O método da máxima verossimilhança pode ser usado em situações em que

haja vários parâmetros populacionais desconhecidos θ1 ,θ 2 ,...,θ k . Em tais casos,
a função de verossimilhança é uma função dos k parâmetros desconhecidos
θ1 ,θ 2 ,...,θ k e os estimadores {Θ
ˆ } de máxima verossimilhança são encontrados
i
igualando as k derivadas parciais ∂L(θ1 ,θ 2 ,...,θ k ) / ∂θi , i = 1,2,..., k , a zero e

resolvendo o sistema resultante de equações.
Exemplo. Seja X uma variável aleatória normal com média µ e variância σ2

desconhecidas. A função de verossimilhança de uma amostra aleatória
( X 1 , X 2 ,..., X n ) é
1  x −µ  1  x −µ  1  xi − µ 
2 2 2
n
1 −  1  1 −  n  1 −  
L( µ,σ2 ) = e 2 σ 
× ... × e 2 σ 
=∏ e 2 σ 
σ 2π σ 2π i=1 σ 2π
n
∑ (x i − µ )2
1
−
1 2σ 2
L( µ,σ ) =
2
e i =1
(2πσ )
2 n /2
Tomando o logaritmo natural
n
n 1
ln L( µ,σ2 ) = −
2
ln(2πσ2 ) − 2
2σ
∑(x i − µ) 2
i=1
Para encontrar o ponto de máximo dessa função, devemos obter as derivadas

de ln L( , σ 2 ) em relação a µ e σ2.
Derivando em relação a µ, obtemos:
∂ ln L(µ, σ2 ) 1 n
1 n
= 2 2 ∑ ( x i − µ) = 2 ∑(x − µ)
∂µ 2σ i=1 σ i=1
i
e igualando esse último resultado a zero e resolvendo para µ, tem-se
n n n ∑x i
(σ ) ∑ ( x i − µˆ ) = 0 ⇒
2 −1
∑( x i − µˆ ) = 0 ⇒ ∑x i − nµˆ = 0 ⇒ µˆ = i=1
= X.
i=1 i=1 i=1 n

15
O resultado obtido mostra que a média amostral de uma população
normal é o estimador de máxima verossimilhança da média
populacional µ.
Derivando em relação a σ2 e já incluindo o resultado acima, obtemos:
∂ ln L(µ,σ2 ) n 1 1 n
∂σ2
=− + ∑ ( x − µˆ )2 = 0
2 σˆ 2 4σˆ 2 i=1 i
n
n
∑ (x i − µˆ ) 2
− nσˆ 2 + ∑ ( xi − µˆ ) 2 = 0 ⇒ σˆ 2 = i=1
i =1 n
Portanto, o estimador de máxima verossimilhança para σ2 é viesado.
Exemplo. Suponha uma população com distribuição uniforme entre 0 e θ.

Retirou-se uma amostra aleatória de n valores dessa população com o objetivo
de estimar-se θ. Admita que xmax seja o maior valor obtido nessa amostra.
Calcule a EMV de θ.
Solução 1 (“intuitiva”):
Evidentemente que θ ≥ xmax . Logo, a estimativa “mais verossímil” (ou a EMV) é

adotar θˆ = x . max
Solução 2 (“detalhada”):
Sabe-se que θ ≥ xmax . A função densidade de probabilidade da distribuição

uniforme é f ( x) = 1 / θ para 0 ≤ x ≤ θ e f ( x) = 0 caso contrário.
A função de verossimilhança de uma amostra aleatória com n observações é
n
1 1
L(θ ) = ∏ = ,
i=1 θ θn
Cujo domínio é θ ≥ xmax , ou seja, o menor valor possível para o parâmetro θ é

θ = xmax . A figura abaixo mostra que o maior valor (máximo absoluto) de L(θ )
ocorre em θ = x . Portanto, a EMV é θˆ = x .
max max

16
Este exemplo indica que nem sempre é possível usar diretamente métodos de
cálculo para determinar o máximo de L(θ ) .
Já caiu em prova! (Analista da SUSEP/2002/ESAF) A função de

verossimilhança para uma amostra aleatória de tamanho n de uma distribuição
de probabilidades dependente de um parâmetro real θ vem dada por
exp{−mn + nθ } θ ≥ b
l (θ ) = 
 0 θ <b
onde m > 0 é a média das observações amostrais e b é a menor observação

amostral. Assinale a opção que corresponde a estimativa de máxima
verossimilhança de θ.
A) nm
B) b
C) m
D) nb
E) m/b
Resolução
A Estimativa de Máxima Verossimilhança (EMV) do parâmetro

populacional desconhecido θ é o valor θˆ que maximiza a função de
verossimilhança l (θ ) .
Podemos reescrever a função de verossimilhança l (θ ) como:
e − mn .e nθ θ ≥b
l (θ ) = 
 0 θ <b
17
1
Note que 0 < e −mn = < 1 pois m (média amostral) e n (tamanho da amostra)
e mn
são grandezas positivas. Além disso, e nθ é uma função exponencial crescente,
pois n >0. Portanto, o gráfico de l (θ ) é crescente para θ ≥ b , como ilustrado
pela Fig. a seguir.
O gráfico da função de verossimilhança não possui um máximo absoluto, pois

liml (θ ) = ∞ (a função é crescente para θ ≥ b ). O gabarito inicial era a alternativa
θ →∞
(B) ( θˆ = b ), o que é um flagrante absurdo. A questão foi anulada.
GABARITO: ANULADA
Propriedades dos Estimadores de Máxima Verossimilhança
O método da máxima verossimilhança é frequentemente o método de

estimação preferido pelos matemáticos e engenheiros, por ser geralmente fácil
de usar e produzir estimadores com boas propriedades estatísticas. Estas
propriedades estão resumidas a seguir. Ressaltamos que essa lista de
propriedades não é exaustiva. Citamos aquelas que são importantes para a
prova.
Propriedades:
1. Consistência;
2. Distribuição assintótica (*) normal.
(*) Assintótica significa “quando n é grande”.

18
A propriedade (1) pode ser interpretada como se segue. Quando uma amostra
de tamanho n for grande e se Θ̂ for um estimador de máxima verossimilhança
do parâmetro θ, então:
ˆ ≈θ ) e
- (i) Θ̂ é um estimador aproximadamente não tendencioso para θ ( E[Θ]
- (ii) a variância de Θ̂ é aproximadamente tão pequena quanto a variância que

se poderia obter com qualquer outro estimador.
Sendo assim, (i) e (ii) estabelecem que o estimador de máxima

verossimilhança é aproximadamente um ENTVM. Esse é um resultado
desejável. Além disso, ele é razoavelmente fácil de se obter em muitas
situações e possui distribuição assintótica normal. Isso explica porque o
método de máxima verossimilhança é largamente utilizado na prática. Para
usar a estimação de máxima verossimilhança, observe que a distribuição da
população deve ser conhecida (ou suposta).
19.3 Estimação por Ponto
19.3.1 Estimação por Ponto da Média
O melhor estimador de que dispomos para a média µ da população é a média

da amostra X . Vimos que X é um estimador consistente de µ.
19.3.2 Estimação por Ponto da Variância
Quando conhecemos a média µ da população, devemos estimar sua variância

σ2 por meio da estatística
n n
∑ (X i − µ)2 ∑X 2
i
(9) S2 = i =1
= i =1
− µ2
n n
que será um estimador não viesado (pois acerta na média) e consistente

(sua variância decresce com o aumento do tamanho da amostra).
Quando a média µ é desconhecida, o que, em geral, ocorre na prática, a

variância populacional σ2 é estimada por meio de
∑ (X i − X )2
i =1
(10) S2 =
n −1
que é um estimador justo de σ2.

19
Foi visto na aula passada que var(S 2 ) = 2σ 4 /( n − 1) . Logo, S2 é um estimador
consistente de σ2, pois
2σ 4
lim var(S 2 ) = lim = 0.
n →∞ n →∞ n − 1
19.3.3 Estimação por Ponto do Desvio Padrão
Embora S2, conforme definido em (10), seja um estimador justo da variância

populacional σ2, sua raiz quadrada S não é um estimador justo do desvio
padrão populacional σ. Isto pode ser demonstrado por absurdo, pois se E(S)
= σ, resultaria que
var(S) = E(S2) – [E(S)]2 = σ2 – σ2 = 0,
o que não tem sentido.
O viés de S como estimador de σ, entretanto, tende assintoticamente a

zero. Logo, para amostras grandes, podemos, por simplificação, adotar como
estimativa o próprio desvio padrão da amostra, calculado pela raiz quadrada
da variância amostral.
19.3.4 Estimação por Ponto de uma Proporção Populacional
Se desejarmos estimar a proporção p dos elementos da população com uma

dada característica, usaremos como estimador a proporção ou freqüência
relativa p̂ com que essa característica foi observada na amostra. Tal
procedimento, além de intuitivo, corresponde a adotar um estimador justo e
consistente, pois, conforme visto na aula passada:
f 1 np
E ( pˆ ) = E   = E ( f ) = =p
n n n
p (1 − p ) p (1 − p )
var( pˆ ) = ⇒ lim var( pˆ ) = lim = 0.
n n → ∞ n → ∞ n
19.3.4 Estimação por Ponto com Base em Diversas Amostras
Sejam k amostras e um parâmetro populacional a ser estimado. Cada amostra

fornecerá uma estimativa para o parâmetro que está sendo estimado e essas
estimativas irão diferir entre si, pois correspondem a observações de variáveis
aleatórias. Entretanto, pode-se, em geral, combinar esses resultados, obtendo-
se uma estimativa única para o parâmetro em questão.
No caso de estimação da média µ ou de uma proporção p, pode-se combinar

as estimativas se todas as amostras forem provenientes de uma mesma
20
população ou de populações infinitas com mesma média µ e mesma proporção
p. Ou seja, pode-se calcular a média ponderada das diversas médias e
freqüências relativas amostrais tomando como pesos de ponderação os
tamanhos das respectivas amostras. Isso equivale a fundir as diversas
amostras em uma única amostra maior, usando a média X e a freqüência p̂
fornecidas por essa amostra.
No caso da variância populacional σ2, deve-se realizar a ponderação

usando como pesos os graus de liberdade de cada amostra. Seja n1 o
tamanho da amostra 1, n2 o tamanho da amostra 2, ..., nk o tamanho da
amostra k (as amostras i, i = 1,2,...,k, possuem desvio padrão Si). Então a
estimativa combinada de σ2 será dada pela estatística
(n1 − 1) S12 + (n 2 − 1) S 22 + ... + (nk − 1) S k2

(11) S p2 = ,
n1 + n 2 + ... + n k − k
que possui n1 + n2 + ... + nk − k graus de liberdade.
Note-se que a estimativa (11) não será idêntica à que se obteria pela reunião
dos dados em uma amostra única, embora ambos os processos sejam válidos
nas condições acima mencionadas.
A estimativa (11) tem a vantagem de poder ser usada se as diversas amostras

forem provenientes de populações com médias diferentes, porém de mesma
variância σ2.
Se as amostras forem razoavelmente grandes, poderemos adotar S p como

uma boa estimativa para o desvio padrão σ.
19.4 Estimação por Intervalo
Até aqui, aprendemos como obter “boas” estimativas (isto é, justas e

consistentes) por ponto dos parâmetros populacionais. Contudo, se a
determinação do parâmetro for o principal objetivo, então a estimação por
ponto será insuficiente, uma vez que a probabilidade de a estimativa adotada
vir a coincidir com o verdadeiro valor do parâmetro é nula ou praticamente
nula. Assim, uma questão relevante aparece: quão próxima está a estimativa
do verdadeiro valor de um parâmetro? Uma outra abordagem é usar um
intervalo de confiança para expressar o grau de incerteza associado a
uma estimativa.
Uma estimativa do intervalo de confiança de um parâmetro desconhecido

θ é um intervalo da forma l ≤ θ ≤ u, em que os limites inferior l e superior u
dependem do valor numérico do estimador Θ̂ para uma amostra particular.
Como amostras distintas produzirão valores diferentes de Θ̂ e, por

21
conseguinte, valores diferentes para os limites l e u, esses limites são valores
de variáveis aleatórias, como L e U, respectivamente. Somos capazes de
determinar valores de L e U, a partir da distribuição amostral de Θ̂ , de tal
forma que a seguinte afirmação probabilística seja verdadeira:
P( L ≤ θ ≤ U ) = 1 − α ,
sendo 0 < α < 1 . Assim, temos uma probabilidade igual a 1 − α de selecionar

uma amostra que produzirá um intervalo contendo o valor verdadeiro
do parâmetro θ.
O intervalo observado
l ≤θ ≤ u
é chamado de intervalo com 100(1 − α )% de confiança para o parâmetro θ.

A interpretação de um intervalo de confiança é que se um número infinito de
amostras aleatórias for coletado e um intervalo com 100(1 − α )% de confiança
para θ for calculado a partir de cada amostra, então 100(1 − α )% desses
intervalos conterão o valor verdadeiro de θ.
Na prática, obtemos somente uma amostra aleatória e calculamos uma

estimativa do intervalo de confiança. Uma vez que esse intervalo
conterá ou não o valor verdadeiro de θ, não é razoável fixar um nível
de probabilidade para essa realização. A afirmação apropriada é: o
intervalo observado [l, u] contém o valor verdadeiro de θ, com
100(1 − α )% de confiança. Essa afirmação tem uma interpretação de
freqüência; ou seja, não sabemos se a afirmação é verdadeira para essa
amostra específica, mas o método usado para obter o intervalo [l, u] resulta
em afirmações corretas em 100(1 − α )% do tempo.
19.4.1 Intervalo de Confiança para a média quando o desvio-

padrão é conhecido
Suponha que o estimador X tenha distribuição amostral normal (*). Conforme

já visto neste curso, isso ocorrerá se a população for normalmente distribuída
ou, com boa aproximação, se a amostra for suficientemente grande.
(*) A hipótese de normalidade é comumente adotada na prática. Se não a

adotássemos, o estudo ficaria tremendamente complicado.
Deve-se construir um intervalo em torno de X de forma tal que esse intervalo

contenha o valor do parâmetro com confiança 1-α. Esse intervalo é simétrico
em probabilidade, pois a distribuição amostral é normal.

22
O intervalo que pretendemos construir será da forma X ± ε , em que ε = e0
denota a semi-amplitude do intervalo de confiança, conforme representado
pela figura a seguir (distribuição amostral de X ). Necessitamos apenas
determinar ε de modo tal que esse intervalo tenha nível de confiança 1-α.
Para tanto, imagine, na distribuição de X , dois pontos, −ε e +ε ,
simétricos em relação à média µ da distribuição, de tal modo que a
probabilidade de X situar-se entre esses dois pontos seja igual a 1-α. Logo,
(12) P( − ε ≤ X ≤ + ε ) = 1 − α.
A desigualdade (12) implica
−ε ≤ X e X≤ +ε ⇒ ≤ X +ε e X −ε ≤ µ
⇒ P( X − ε ≤ ≤ X + ε ) = 1 − α.
Portanto, X − ε e X + ε são os limites do intervalo de confiança simétrico em

probabilidade desejado. A determinação da semi-amplitude ε do intervalo de
confiança envolve a utilização da variável normal padronizada. Observe que
( +ε) −
= zα / 2 ,
σ/ n
σ
(13) ε = zα / 2 .
n
Portanto, a expressão do intervalo de confiança para a média µ da população,

ao nível de confiança 1-α, é dada por
σ
(14) X ± zα / 2 .
n

23
Finalmente, tem-se que
σ σ
(15) P ( X − zα / 2 ≤ ≤ X + zα / 2 ) = 1 − α.
n n
Exemplo. Considere uma amostra de 41 observações provenientes de uma

população normal com variância igual a 4,0, cuja média amostral é 40.
Construa um intervalo de 95% de confiança para a média dessa população.
Solução:
1 − α = 0,95 ⇒ α / 2 = 0,025 . A tabela da normal indica que o valor z = 1,96

corresponde à probabilidade (0,5 – 0,025) = 0,4750. Logo,
σ 2,0
ε = zα / 2 = 1,96 = 0,6122
n 41
e o intervalo de confiança será 40 ± 0,6122 , indicando que 39,3878 ≤ ≤ 40,6122

com 95% de confiança.
19.4.2 Intervalo de confiança para a média quando o desvio-

padrão é desconhecido
Quando desconhecemos o desvio padrão populacional σ, devemos estimar seu

valor por meio de
∑ (X i − X )2
i =1
S= .
n −1
Não é correto obter o intervalo de confiança para µ, ao nível de confiança 1-α,

substituindo-se σ por S na expressão (13). Observe que o uso de S em (13)
aumenta a incerteza da estimativa por intervalo, diminuindo, deste modo, o
valor do nível de confiança, que já não seria (1-α), mas sim (1-α’) < (1-α).
Como podemos resolver este problema?
Vimos que as distribuições t de Student e normal padrão estão relacionadas

pela fórmula
σ
tn −1,α / 2 = zα / 2 .
S
Sendo assim, podemos reescrever (14) como

24
σ S S
(16) X ± zα / 2 = X ± t n −1,α / 2
S n n
A Eq. (16) mostra que o uso do desvio padrão amostral S na expressão do

intervalo de confiança da média populacional impõe o uso de t n −1,α / 2 no lugar de
zα / 2 . Observe que (t n −1,α / 2 / zα / 2 ) > 1 (por exemplo, t30, 2,5% = 2,0423 > z2,5% = 1,96 ). Desta
maneira, t n −1,α / 2 funciona como um fator de correção para maior da amplitude
do intervalo de confiança, quando usamos S em vez de σ.
Exemplo. Considere uma amostra de 41 observações, provenientes de uma

população normal com média e variância desconhecidas, em que X = 40 e S =
2,0. Construa um intervalo de 95% de confiança para a média dessa
população.
Solução:
tn −1,α / 2 = t40, 2,5% = 2,0211 (vide tabela auxiliar). Logo,
S 2
ε = t n−1,α / 2 = 2,0211 × = 0,6313 (maior que o obtido no exemplo anterior!)
n 41
e o intervalo de confiança será 40 ± 0,6313 , indicando que 39,3687 ≤ ≤ 40,6313

com 95% de confiança.
19.4.3 Intervalo de confiança para a variância
Considere, na distribuição χ n2−1 , os dois particulares valores χ n2−1,1−α / 2 (qui-

quadrado inferior) e χ 2n−1,α / 2 (qui-quadrado superior), conforme ilustrado pela
figura abaixo.

25
Sabemos que os valores χ n2−1,1−α / 2 e χ 2n−1,α / 2 são tais que
(17) P( χ n2−1,1−α / 2 ≤ χ n2−1 ≤ χ n2−1,α / 2 ) = 1 − α .
Na aula anterior, vimos que
σ2
S2 = χ n2−1
n −1
o que nos permite escrever as desigualdades entre parênteses de (17) como
(n − 1) S 2
χ n2−1,1−α / 2 ≤ ≤ χ n2−1,α / 2 .
σ 2
Vamos dividir todos os membros da expressão acima por (n − 1) S 2 , e, após,

tomar os inversos. Invertendo as desigualdades, obtemos
(n − 1) S 2 (n − 1) S 2
(18) ≤σ 2 ≤
χ n2−1,α / 2 χ n2−1,1−α / 2
que é o intervalo de confiança para σ2, ao nível de 1 - α.
A Eq. (18) pode ser reescrita na forma

26
n n
∑(X i − X )2 ∑(X i − X )2
(19) i =1
≤σ 2 ≤ i =1
χ 2
n −1,α / 2 χ n2−1,1−α / 2
Exemplo. Uma amostra de onze elementos, extraída de uma população

normal, forneceu variância S2 = 7,08. Determine o intervalo de 90% de
confiança para a variância da população.
Solução:
Entrando na tabela da distribuição χ2 com 10 graus de liberdade, obtemos:
χ n2−1,1−α / 2 = χ102 ,95% = 3,94,

χ n2−1,α / 2 = χ102 ,5% = 18,3.
Logo,
(n − 1) S 2 (n − 1) S 2 10 × 7,08 10 × 7,08
≤σ 2 ≤ ⇒ ≤σ 2 ≤ ⇒ 3,8689 ≤ σ 2 ≤ 17,9695
χ 2
n −1,α / 2 χ 2
n −1,1−α / 2 18,3 3,94
Logo, 3,8689 ≤ σ 2 ≤ 17,9695 com 90% de confiança.
19.4.4 Intervalo de confiança para o desvio-padrão
De (18) decorre, com confiança 1-α, que
(n − 1) S 2 (n − 1) S 2
(20) ≤σ ≤
χ n2−1,α / 2 χ n2−1,1−α / 2
19.4.5 Intervalo de Confiança para uma proporção populacional
Vimos na aula passada que uma freqüência relativa amostral p̂ apresenta uma
distribuição binomial, cuja média é o próprio parâmetro populacional p e cuja
variância é dada por p (1 − p) / n . Sendo np ≥ 5 e n(1 − p ) ≥ 5 , aprendemos que é
possível aproximar a binomial pela normal. Como p é desconhecido,
adotaremos como condições de aproximação npˆ ≥ 5 e n(1 − pˆ ) ≥ 5 .
Sendo a amostra suficientemente grande, o intervalo de confiança para p será

da forma p̂ ± ε e, por um raciocínio análogo àquele desenvolvido para a
estimação de µ, chega-se a
p(1 − p)
(21) ε = zα / 2 .
n
27
A expressão (21) tem um problema: não conhecemos o valor de p. Para

amostras suficientemente grandes, pode-se aproximar (21) por
pˆ (1 − pˆ )
(22) ε = zα / 2 .
n
Então o intervalo de confiança para p, ao nível de confiança 1 − α , é dado por
pˆ (1 − pˆ )
(23) pˆ ± zα / 2 .
n
Exemplo. Retirou-se uma amostra de 1.000 peças de uma linha de produção

e verificou-se que 35 eram defeituosas. Estime o intervalo de confiança ao
nível de 95% da proporção de peças defeituosas fornecidas pela linha de
produção.
Solução:
n = 1.000
pˆ = f / n = 35 / 1.000 = 0,035
zα / 2 = z 2,5% = 1,96
Logo,
pˆ (1 − pˆ ) 0,035(1 − 0,035)
ε = zα / 2 = 1,96 × = 0,0114
n 1.000
0,035 − 0,0114 ≤ p ≤ 0,035 + 0,0114 ⇒ 0,0236 ≤ p ≤ 0,0464 com 95% de confiança.
Já caiu em prova! (ICMS-RJ/2010/FGV). Para estimar a proporção p de

pessoas acometidas por uma certa gripe numa população, uma amostra
aleatória simples de 1600 pessoas foi observada e constatou-se que, dessas
pessoas, 160 estavam com a gripe.
Um intervalo aproximado de 95% de confiança para p será dado por:
A) (0,066, 0,134).
B) (0,085, 0,115).
C) (0,058, 0,142).
D) (0,091, 0,109).
E) (0,034, 0,166).
Resolução
28
A freqüência relativa amostral p̂ apresenta uma distribuição binomial, cuja

média p e variância p (1 − p) / n . Sendo np ≥ 5 e n(1 − p ) ≥ 5 , é possível aproximar a
binomial pela normal. Como p é desconhecido, adotamos como condições de
aproximação np' = 1600 × 0,1 = 160 > 5 e n(1 − p') = 1600 × 0,9 = 1440 > 5 .
Como a amostra é suficientemente grande, o intervalo de confiança para p

será da forma p̂ ± ε , em que ε é dado por
pˆ (1 − pˆ ) 0,1 × 0,9
e0 = z 2,5% = 1,96 × ≈ 0,015 .
n 1600
Logo, pˆ + ε = 0,1 + 0,015 ≈ 0,115 e pˆ − ε = 0,1 − 0,015 ≈ 0,085 .
⇒ IC = (0,085, 0,115).
GABARITO: B
19.5 Tamanho das Amostras
Vimos que ε = zα / 2σ / n (semi-amplitude do intervalo de confiança para a

média populacional quando o desvio padrão populacional é conhecido). Segue-
se que
2
z σ
(24) n =  α /2  .
 ε 
A Eq. (24) será usada para determinar o tamanho da amostra necessária

para estimar a média populacional quando σ for conhecido.
Se não conhecemos o desvio padrão da população, devemos primeiramente

coletar uma amostra piloto de n’ elementos para, com base nela, obtermos
uma estimativa do desvio padrão amostral S. Em seguida, empregamos a
expressão
2
t S 
(25) n =  n '−1,α / 2 
 ε 
obtida por meio das substituições de zα / 2 por t n '−1,α / 2 e de σ por S em (24). Se

n’ ≤ n, a amostra piloto já terá sido suficiente para a estimação. Caso
contrário, devemos retirar, ainda, da população, os elementos necessários à
complementação do tamanho mínimo da amostra.

29
Já caiu em prova! (ICMS-RJ/2010/FGV). Suponha que os salários dos
trabalhadores numa certa região sejam descritos por uma variável
populacional com média desconhecida e desvio padrão igual a R$200,00. Para
se garantir, com 95% de probabilidade, que o valor da média amostral dos
salários não diferirá do valor da média populacional por mais de R$10,00, a
amostra aleatória simples deverá ter no mínimo, aproximadamente, o seguinte
tamanho:
A) 3.568.
B) 3.402.
C) 2.489.
D) 2.356.
E) 1.537.
Resolução
Dados: X − = 10 , 1 − α = 95% e σ = 200 .
X− X− 10 10
= zα / 2 ∴ = z 2,5% ∴ = 1,96∴ ≈ 2∴ n ≈ 1.600
σ/ n σ/ n 200 / n 200 / n
O valor mais próximo é o da opção E.
Nota: não é correto dizer que o valor da média amostral dos salários não
diferirá do valor da média populacional por mais de R$10,00 com 95% de
probabilidade, dado que a amostra tenha um tamanho mínimo de 1.537
elementos. A afirmação correta seria: o valor da média amostral dos salários
não diferirá do valor da média populacional por mais de R$10,00 com 95% de
confiança, dado que a amostra tenha um tamanho mínimo de 1.537
elementos. Na prática, obtemos somente uma amostra aleatória e calculamos
uma estimativa do intervalo de confiança. Uma vez que esse intervalo conterá
ou não o valor verdadeiro do parâmetro populacional µ, não é razoável fixar
um nível de probabilidade para essa realização. A afirmação apropriada é: o
intervalo observado [l, u] contém o valor verdadeiro do parâmetro µ, com
100(1 − α )% de confiança. Essa afirmação tem uma interpretação de freqüência;
ou seja, não sabemos se a afirmação é verdadeira para essa amostra
específica, mas o método usado para obter o intervalo [l, u] resulta em
afirmações corretas em 100(1 − α )% do tempo.
GABARITO: E
O tamanho da amostra necessária para estimar uma proporção

populacional p vem da expressão (22) e é dado por

30
2
z 
(26) n =  α / 2  p (1 − p ) .
 ε 
Não temos como calcular n por meio de (26), pois p é desconhecido. Como
podemos resolver este problema? Se pararmos para refletir um pouco sobre o
assunto, veremos que existem pelo menos duas saídas. A primeira é a
seguinte: para amostras suficientemente grandes, sabemos que pˆ ≈ p , haja
vista que p̂ é um estimador justo de p, e podemos utilizar a aproximação
2
z 
(27) n ≈  α / 2  pˆ (1 − pˆ ) .
 ε 
Também podemos obter um valor limitante superior para n a partir de (26), e

esta seria a segunda solução para o problema da estimação do n. Note que a
função quadrática (parábola) p(1-p) que aparece em (26) tem o seu ponto de
máximo em p =1/2. Se substituirmos p(1-p) pelo seu valor máximo, que é
1/4, o tamanho da amostra obtido será suficiente para a estimação, qualquer
que seja o p. Sendo assim, obtemos
2 2
 z  1 zα / 2
n ≤  α /2  = 2 ou
 ε  4 4ε
zα2 / 2
(28) nmax = ,
4ε 2
em que nmax denota o valor limitante superior de n.
Já caiu em prova! (Analista da SUSEP/Atuária/2010/ESAF). Deseja-se

estimar a proporção p de pessoas com determinada característica em uma
população. Um levantamento preliminar forneceu pˆ = 2 / 7 . Usando essa
estimativa, obtenha o menor tamanho de amostra aleatória simples necessária
para estimar p com um intervalo de 95% de confiança e um erro de
amostragem z pˆ qˆ / n ≤ 2% , onde qˆ = 1 − pˆ .
A) 7840
B) 2500
C) 1960
D) 9604
E) 2401
Resolução

31
Aprendemos na exposição teórica que a semi-amplitude do intervalo de
confiança para a proporção é dada por ε = zα / 2 pˆ qˆ / n . O examinador especificou
que a relação z pˆ qˆ / n ≤ 2% deve ser obedecida, a fim de que p seja estimado
com um intervalo de 95% de confiança e um erro de amostragem ε menor ou
igual a 0,02. “Moral da história”: a banca forneceu a fórmula a ser utilizada na
solução da questão! De vez em quando isso acontece.
Isolemos a incógnita n na fórmula dada:
2
1/ 2
 pˆ qˆ  2   pˆ qˆ 1/ 2   2  2 2 p
ˆ qˆ   4 
z ≤ ⇒  z   ≤ 2  ⇒ z  ≤ 4  ⇒
 n  100   n    10   n   10 
10 4 z 2 pˆ qˆ 10 4 z 2 pˆ qˆ
10 z pq ≤ 4n ⇒
4 2
ˆ ˆ ≤ n ⇒n ≥
4 4
Então o valor limitante inferior para n, denotado por nmin, é dado por
10 4 z 2 pˆ qˆ
nmin = .
4
Substituindo os valores pˆ = 2 / 7 , qˆ = 1 − pˆ = 5 / 7 e z = 1,96 (pois α=5%) na

expressão acima, obtemos
10 4 × 1,96 2 2 5
nmin = × × ,
4 7 7
utilizando as aproximações 1,96 ≅ 2 e 49 ≅ 50, chegamos ao valor aproximado
10 4 × 2 × 5 10.000
nmin ≈ = = 2.000 .
50 5
A opção C nos dá o valor mais próximo (1.960). Se você fizer as contas com a
calculadora obterá o valor exato de 1.960.
GABARITO: C
19.6 Memorize para a prova
- Um estimador (ou estatística) é qualquer função das observações de

uma amostra.
- Uma estimativa corresponde a um valor numérico assumido por um

estimador.

32
- Um estimador Θ̂ é justo ou não viesado se o seu valor esperado for
igual ao valor do parâmetro θ que se pretende estimar, isto é, se
ˆ ) = θ.
E (Θ
- Um estimador é consistente, se, à medida que a amostra cresce,

converge para o verdadeiro valor do parâmetro:
ˆ ) =θ
lim E (Θ e ˆ)=0
lim var(Θ
n →∞ n →∞
- O melhor estimador para a média µ da população é a média da amostra

X , pois X é um estimador justo e consistente de µ.
- Se a média µ da população for conhecida, devemos estimar sua variância

σ2 por meio da estatística
n n
∑ ( X i − µ) 2 ∑X 2
i
S2 = i=1
= i=1
− µ2 ,
n n
que será um estimador justo e consistente.
- Se a média µ for desconhecida, a variância populacional σ2 deverá ser

estimada por meio de
∑( X i − X )2
S2 = i=1
,
n −1
que é um estimador justo e consistente de σ2.
- O estimador da variância populacional definido por
∑( X i − X )2
σˆ 2 = i=1
n
é viesado.
- O EQM é a média do quadrado da diferença entre o estimador e o

valor do parâmetro:
ˆ − θ ) 2 ] = var(Θ)
ˆ ) = E[(Θ
EQM (Θ ˆ ) ]2.
ˆ + [viés (Θ

33
A relação acima mostra que o EQM tem dois componentes: o estimador erra o
valor do parâmetro em função da sua dispersão (variância) e ainda, quando for
o caso, pelo fato de não acertar na média (ser viesado).
- Seja a amostra aleatória X 1 , X 2 ,..., X n . Então a função densidade conjunta para

estas observações, também conhecida como função de verossimilhança da
amostra, é dada por
L(θ ) = f ( x1 ;θ ) × f ( x2 ;θ ) × ... × f ( xn ;θ ) .
- A função de verossimilhança para X 1 , X 2 ,..., X n discretas é a probabilidade
Pθ ( X 1 = x1 , X 2 = x2 ,..., X n = xn ) .
- A Estimativa de Máxima Verossimilhança (EMV) de θ é o valor θˆ que

maximiza a função L(θ ) .
- A média amostral de uma população normal é o estimador de máxima

verossimilhança da média populacional µ.
- A estatística S não é um estimador justo do desvio padrão

populacional σ. O viés de S, entretanto, tende assintoticamente a zero.
- A freqüência relativa p̂ é um estimador justo e consistente da

proporção p dos elementos da população com uma dada característica.
- Um intervalo de confiança expressa o grau de incerteza associado a uma

estimativa.
- O intervalo de confiança para a média quando o desvio-padrão

populacional é conhecido, no nível de confiança 1-α, é dado por
σ σ
X − zα / 2 ≤ ≤ X + zα / 2 .
n n
Obs.: z = 1,96 para (1-α) = 0,95 = 95%.
- - O intervalo de confiança para a média quando o desvio-padrão

populacional é desconhecido, no nível de confiança 1-α, é dado por
S S
X − t n −1,α / 2 ≤ µ ≤ X + t n −1,α / 2 .
n n
- O intervalo de confiança para σ2, ao nível de 1-α, é dado por

34
(n − 1) S 2 (n − 1) S 2
≤ σ 2
≤ ,
2
χ n−1,α / 2
2
χ n−1,1−α / 2
ou pela fórmula equivalente
n n
∑(X i − X )2 ∑(X i − X )2
i =1
≤σ2 ≤ i =1
.
χ 2
n −1,α / 2 χ n2−1,1−α / 2
- O intervalo de confiança para p, ao nível de confiança 1 − α , é dado por
pˆ (1 − pˆ ) pˆ (1 − pˆ )
pˆ − zα / 2 ≤ p ≤ pˆ + zα / 2 .
n n
- Tamanho da amostra para estimar a média populacional µ quando σ é

conhecido:
2
z σ
n =  α /2  .
 ε 
- Tamanho da amostra para estimar a proporção populacional p:
zα2 / 2
n≈ .
4ε 2
19.7 Exercícios de Fixação
1. (ICMS-RJ/2009/FGV) Para examinar a opinião de uma população sobre

uma proposta, foi montada uma pesquisa de opinião em que foram ouvidas
1680 pessoas, das quais 51,3% se declararam favoráveis à proposta.
Os analistas responsáveis determinaram que a margem de erro desse

resultado, em um determinado nível de confiança, era de 2 pontos
percentuais, para mais ou para menos.
Considerando que fosse desejada uma margem de erro de 1 ponto percentual,

para mais ou para menos, no mesmo nível de confiança, assinale a alternativa
que indique o número de pessoas que deveriam ser ouvidas.
A) 840
B) 2520
C) 3360
D) 5040

35
E) 6720
2. (ICMS-RJ/2008/FGV) Considere uma Amostra Aleatória Simples de n

unidades extraídas de uma população na qual a característica, X, estudada tem
distribuição Normal com média µ e variância σ2, ambas desconhecidas, mas
1 n
finitas. Considere, ainda, as estatísticas média da amostra, X = ∑ X i , e
n i =1
n
1
variância da amostra S 2 = ∑ ( X i − X ) 2 . Então, é correto afirmar que:
n i =1
A) X e S 2 são, ambos, não tendenciosos para a estimação da média e da

variância da população, respectivamente.
B) X é não tendencioso, mas S 2 é tendencioso para a estimação da média e
da variância da população, respectivamente.
C) X é tendencioso, mas S 2 é não tendencioso para a estimação da média e
da variância da população, respectivamente
D) X e S 2 são, ambos, tendenciosos para a estimação da média e da variância
da população, respectivamente.
E) X e S 2 são, ambos, não tendenciosos para a estimação da média e da
variância da população, mas apenas X é consistente.
3. (ICMS-RJ/2007/FGV) Uma pesquisa recente foi realizada para avaliar o

percentual da população favorável à eleição de um determinado ponto turístico
para constar no selo comemorativo de aniversário da cidade. Para isso,
selecionou-se uma amostra aleatória simples extraída de uma população
infinita. O resultado apurou 50% de intenção de votos para esse ponto
turístico.
Considerando que a margem de erro foi de 2 pontos percentuais, para mais ou

para menos, e que o nível de confiança utilizado foi de 95%, foram ouvidas,
aproximadamente:
A) 50 pessoas
B) 2.400 pessoas
C) 1.200 pessoas
D) 100 pessoas
E) 4.800 pessoas
4. (Estatística/IBGE/2010/CESGRANRIO) Para que o erro padrão da

média amostral X seja reduzido à metade, deve-se
A) multiplicar o tamanho da amostra por 2.

B) multiplicar o tamanho da amostra por 4.
36
C) multiplicar o tamanho da amostra por 16.
D) dividir o tamanho da amostra por 2.
E) dividir o tamanho da amostra por 4.
5. (Analista Técnico/SUSEP/2001/ESAF) Os itens 2,30; 4,11; 5,20; 6,30;

7,20 formam uma ordenação de uma amostra aleatória de tamanho 5 da
distribuição uniforme no intervalo [0,θ] sendo θ>0. Assinale a opção que
corresponde à estimativa de máxima verossimilhança de θ.
A) 5,20
B) 5,02
C) 7,20
D) 5,00
E) 8,00
6. (Analista Técnico/SUSEP/2001/ESAF) Tem-se duas amostras

independentes ambas de tamanho 21 de duas populações normais com a
mesma variância σ2 > 0. Deseja-se construir um intervalo de confiança para
σ2, no nível de 95%, com base numa estimativa combinada das variâncias
amostrais s12 = 0,4 e s22 = 0,6 . Se 0< a < b são duas constantes tais que P{X<a}
= 0,025 e P{X>b} = 0,025, onde X tem distribuição qui-quadrado, assinale a
resposta que corresponde ao intervalo procurado e ao número de graus de
liberdade da distribuição de X.
A) [17/b; 17/a] e 20 graus de liberdade

B) [5/3b; 5/2a] e 40 graus de liberdade
C) [17/b; 17/a] e 41 graus de liberdade
D) [20/b; 20/a] e 40 graus de liberdade
E) [5/3b; 5/2a] e 20 graus de liberdade
7. (Analista Técnico/SUSEP/2002/ESAF) Seja X uma variável aleatória

com valor esperado µ e desvio padrão σ>0. Pode-se afirmar que
A) pelo menos 75% das realizações de X pertencerão ao intervalo [µ-2σ;µ+2σ]

B) pelo menos 80% das realizações de X pertencerão ao intervalo [µ-2σ;µ+2σ]
C) pelo menos 90% das realizações de X pertencerão ao intervalo [µ-2σ;µ+2σ]
D) pelo menos 95% das realizações de X pertencerão ao intervalo [µ-2σ;µ+2σ]
E) apenas com o conhecimento de µ e σ não é possível fazer afirmação sobre o
percentual de realizações de X que cairão no intervalo [µ-2σ;µ+2σ].

37
8. (Analista/Área 3/BACEN/2006/FCC) Os preços de um determinado
produto vendido no mercado têm uma distribuição normal com desvio padrão
populacional de R$ 20,00. Por meio de pesquisa realizada com uma amostra
aleatória de tamanho 100, com um determinado nível de confiança, apurou-se,
para a média destes preços, um intervalo de confiança sendo [R$ 61,08 ; R$
68,92]. A mesma média amostral foi obtida quadruplicando o tamanho da
amostra anterior e utilizando também o mesmo nível de confiança. Nos dois
casos considerou-se infinito o tamanho da população. O novo intervalo de
confiança encontrado no segundo caso foi
A) [R$ 63,04 ; R$ 66,96]

B) [R$ 62,06 ; R$ 67,94]
C) [R$ 61,57 ; R$ 68,43]
D) [R$ 61,33 ; R$ 68,67]
E) [R$ 61,20 ; R$ 68,80]
iid
9. (Estat./IBGE/2010/CESGRANRIO) Sejam X 1 , X 2 ,..., X n ~ N ( ;σ 2 ) e
considerados dois estimadores para σ2
1 n 1 n
T1= ∑ (X − X )2 e
n −1 i =1 i
T 2= ∑ (X i − X ) 2 .
n i =1
Observe as afirmativas a seguir a respeito desses estimadores.
I – T1 é não tendencioso.
2 2(n − 1) 4
II – O erro médio quadrático de T1 é σ 4 , enquanto que o de T2 é σ .
n −1 n2
 σ2 
III – A tendência de T2 =  −  .
 n 
É (São) correta(s) a(s) afirmativa(s)
A) I apenas.
B) I e II, apenas.
C) I e III, apenas.
D) II e III, apenas.
E) I, II e III.
10. (Estatística/IBGE/2010/CESGRANRIO) Considere uma amostragem

aleatória simples, sem reposição, de uma população de tamanho muito
grande. Qual o tamanho aproximado de amostra que permite estimar a média

38
de uma variável y, cujo desvio padrão populacional é igual a 5, com margem
de erro 0,1, a um nível de confiança 95%?
A) 100
B) 400
C) 1.000
D) 4.000
E) 10.000
11. (Estatística/IBGE/2010/CESGRANRIO) Para avaliar a taxa de

desemprego em uma determinada localidade, selecionou-se uma amostra
aleatória de 900 indivíduos em idade produtiva. O resultado dessa amostra
revelou que o número de desempregados era de 36%. O intervalo de 95% de
confiança para a proporção de desempregados, nessa localidade, é
A) 36% ± 0,1%
B) 36% ± 2,6%
C) 36% ± 3,1%
D) 36% ± 3,7%
E) 36% ± 4,1%
12. (Analista/Área 2/BACEN/2010/CESGRANRIO) Em um estudo sobre a

economia informal de uma cidade, deseja-se determinar uma amostra para
estimar o rendimento médio dessa população, com um grau de confiança de
95% de que a média da amostra aleatória extraída não difira de mais de R$
50,00 da média do rendimento dessa população, cujo desvio padrão é R$
1,96
400,00. Sabendo-se que z ~ N[0,1] e que ∫
0
f ( z )dz = 0,4750 , onde f(z) é a
função de densidade de probabilidade de z, pode-se concluir que o número de
pessoas da amostra será
A) 321
B) 308
C) 296
D) 271
E) 246
(Analista Ministerial/Estatística/MPE-PE/2006/FCC) Instruções

(adaptadas): Para responder às questões de números 13 e 14, considere as
tabelas a seguir.

39
Elas fornecem alguns valores da função de distribuição F(x). A tabela 1 refere-
se à variável normal padrão, as tabelas 2 e 3 referem-se à variável t de
Student com 15 e 16 graus de liberdade, respectivamente:
Tabela 1 Tabela 2 Tabela 3

x F(x) x F(x) x F(x)
1,60 0,945 1,753 0,95 1,746 0,95
1,64 0,950 2,248 0,98 2,235 0,98
2,00 0,977 2,583 0,99 2,567 0,99
13. Um engenheiro encarregado do controle de qualidade deseja estimar a

proporção p de lâmpadas defeituosas de um lote, com base numa amostra de
tamanho 400. Sabe-se, com base em experiâncias anteriores, que p deve
estar próximo de 0,5. Usando o teorema central do limite para estimar a
amplitude do intervalo de confiança de 90% para p, podemos afirmar que tal
amplitude é, aproximadamente, igual a
A) 0,041
B) 0,045
C) 0,058
D) 0,070
E) 0,082
14. Supondo-se que a porcentagem da receita investida em educação, dos 600

municípios de uma região, tem distribuição normal com média µ, deseja-se
estimar essa média. Para tanto se sorteou dentre esses 600, aleatoriamente e
com reposição, 16 municípios e se observou os porcentuais investidos por eles
em educação. Os resultados indicaram uma média amostral de 8% e desvio
padrão amostral igual a 2%. Um intervalo de confiança para µ, com coeficiente
de confiança de 96%, é dado por
A) (8 ± 1,124)%
B) (8 ± 1,117)%
C) (8 ± 0,877)%
D) (8 ± 0,870)%
E) (8 ± 0,755)%
15. (Analista Ministerial/Estatística/MPE-PE/2006/FCC) Seja X uma

variável aleatória assumindo os valores -2 e 2, com probabilidade 1/4 e 3/4,
respectivamente. Seja µ a média de X. Então o limite superior de P[|X - µ| ≥
12 ], obtido pela desigualdade de Tchebysheff, é dado por
A) 0,40
B) 0,25
40
C) 0,20
D) 0,12
E) 0,10
(ANPEC/2009/Adaptada) Verifique se as afirmativas 16 a 20 são

verdadeiras:
16. Em uma pesquisa de opinião a proporção de pessoas favoráveis a uma

determinada medida governamental é dada por pˆ = ∑ X i / n . O menor valor de
n para o qual a desigualdade de Chebyshev resultará em uma garantia de que
P(| pˆ − p |≥ 0,01) ≤ 0,01 é 200.000.
17. Quando o número de graus de liberdade δ cresce, a distribuição χδ2

aproxima-se de uma distribuição normal com média δ e desvio padrão 2δ.
18. Um intervalo de confiança de 99% para a média µ de uma população,

calculado para uma amostra aleatória, como [2,75; 8,25], pode ser
interpretado como: a probabilidade de µ estar no intervalo calculado é de 99%.
19. Seja X 1 , X 2 ,..., X n uma amostra aleatória simples proveniente de uma

população com distribuição de Pareto cuja função densidade é dada por
f ( x) = θ (1 + x) − (θ +1) , 0 < x < ∞ , θ > 1 . Então o estimador de máxima verossimilhança
n
para θ é .
∑ log(1 + xi )
20. Se existe, todo estimador de máxima verossimilhança calculado para uma
amostra aleatória possui distribuição Normal em grandes amostras.
19.7 Gabarito
1–E
2–B
3-B
4-B
5–C
6-D
7-A
8-A
9–E
10 – E
11 – C
12 - E
13 - E
14 – A
15 – B
41
16 – FALSA
17 – FALSA
18 – FALSA
19 – VERDADEIRA
20 - VERDADEIRA
19.8 Resolução dos Exercícios de Fixação
1. (ICMS-RJ/2009/FGV) Para examinar a opinião de uma população sobre

uma proposta, foi montada uma pesquisa de opinião em que foram ouvidas
1680 pessoas, das quais 51,3% se declararam favoráveis à proposta.
Os analistas responsáveis determinaram que a margem de erro desse

resultado, em um determinado nível de confiança, era de 2 pontos
percentuais, para mais ou para menos.
Considerando que fosse desejada uma margem de erro de 1 ponto percentual,

para mais ou para menos, no mesmo nível de confiança, assinale a alternativa
que indique o número de pessoas que deveriam ser ouvidas.
A) 840
B) 2520
C) 3360
D) 5040
E) 6720
Resolução
Dados: p' = 0,513 , n = 1.680, e0 = 0,02 e e0 ' = 0,01 .

Qual é o valor de n’ (novo número de pessoas que deveriam ser ouvidas)
correspondente a e0 ' = 0,01 ?
Sabemos que
p' (1 − p' )
e0 = zα / 2 .
n
Conhecendo zα / 2 (não foi fornecido) é possível calcular n’ por meio de
2
z 
n' =  α / 2  p ' (1 − p ' ) .
 e0 ' 
Cálculo de zα / 2 :

42
0,513(1 − 0,513)
0,02 = zα / 2 ⇒ zα / 2 = 1,6401.
1680
Cálculo de n’:
2
 1,6401 
n' =   0,513(1 − 0,513) ≈ 6720,22 ⇒ alternativa (E)
 0,01 
Nota: como a estimativa p’ = 0,513 indica que p está próxima de 50%, temos
a alternativa de usar a fórmula aproximada
2 2
 z   1,6401 
n' =  α / 2  =   ≈ 6.725 ⇒ valor mais próximo é a alternativa (E).
 2e0 '   2 × 0,01 
GABARITO: E
2. (ICMS-RJ/2008/FGV) Considere uma Amostra Aleatória Simples de n

unidades extraídas de uma população na qual a característica, X, estudada tem
distribuição Normal com média µ e variância σ2, ambas desconhecidas, mas
1 n
finitas. Considere, ainda, as estatísticas média da amostra, X = ∑ X i , e
n i =1
n
1
variância da amostra S 2 = ∑ ( X i − X ) 2 . Então, é correto afirmar que:
n i =1
A) X e S 2 são, ambos, não tendenciosos para a estimação da média e da

variância da população, respectivamente.
B) X é não tendencioso, mas S 2 é tendencioso para a estimação da média e
da variância da população, respectivamente.
C) X é tendencioso, mas S 2 é não tendencioso para a estimação da média e
da variância da população, respectivamente
D) X e S 2 são, ambos, tendenciosos para a estimação da média e da variância
da população, respectivamente.
E) X e S 2 são, ambos, não tendenciosos para a estimação da média e da
variância da população, mas apenas X é consistente.
Resolução
Antes de analisarmos as alternativas lembre que
• X é um estimador justo (não tendencioso) e consistente da

média populacional µ;

43
• se definirmos o estimador da variância populacional σ2 por meio da
1 n
fórmula ∑ ( X i − X ) 2 , então esse estimador é tendencioso, porém
n i =1
consistente (vide resolução do exercício 7) e
• se definirmos o estimador da variância populacional σ2 por meio da
1 n
fórmula ∑
n − 1 i =1
( X i − X ) 2 , então esse estimador é não tendencioso
e consistente (vide resolução do exercício 7).
Atenção: o estimador S 2 do enunciado desta questão corresponde ao

estimador viesado σˆ 2 da exposição teórica. Eu usei na exposição teórica o
símbolo S 2 para denotar o estimador justo da variância populacional. Não se
confunda!
Análise das alternativas:
(A) Somente X é não tendencioso ⇒ INCORRETA.
(B) X é não tendencioso e S 2 é tendencioso ⇒ CORRETA.
(C) X é não tendencioso e S 2 é tendencioso ⇒ INCORRETA.
(D) Somente S 2 é tendencioso ⇒ INCORRETA.
(E) Somente X é não tendencioso. Além disso, S 2 também é consistente ⇒

INCORRETA.
GABARITO: B
3. (ICMS-RJ/2007/FGV) Uma pesquisa recente foi realizada para avaliar o

percentual da população favorável à eleição de um determinado ponto turístico
para constar no selo comemorativo de aniversário da cidade. Para isso,
selecionou-se uma amostra aleatória simples extraída de uma população
infinita. O resultado apurou 50% de intenção de votos para esse ponto
turístico.
Considerando que a margem de erro foi de 2 pontos percentuais, para mais ou

para menos, e que o nível de confiança utilizado foi de 95%, foram ouvidas,
aproximadamente:
A) 50 pessoas
B) 2.400 pessoas
C) 1.200 pessoas
D) 100 pessoas
44
E) 4.800 pessoas
Resolução
Como a estimativa p’ = 50%, podemos usar a fórmula aproximada
2 2
 z   1,96 
n =  α / 2  =   = 2.401 ≈ 2.400 .
 2e0   2 × 0,02 
GABARITO: B
4. (Estatística/IBGE/2010/CESGRANRIO) Para que o erro padrão da

média amostral X seja reduzido à metade, deve-se
A) multiplicar o tamanho da amostra por 2.

B) multiplicar o tamanho da amostra por 4.
C) multiplicar o tamanho da amostra por 16.
D) dividir o tamanho da amostra por 2.
E) dividir o tamanho da amostra por 4.
Resolução
O erro padrão da média X de uma amostra de n observações proveniente de

uma população de média µ e variância σ2 é dado por
σ
σ (X ) = .
n
Seja o novo erro padrão de X denotado por σ ∗ (X ) . Então
σ (X ) σ σ σ
σ ∗( X ) = = = =
∗
⇒ n∗ = 4n (deve-se multiplicar o tamanho da
2 2 n 4n n
amostra por 4).
GABARITO: B
5. (Analista Técnico/SUSEP/2001/ESAF) Os itens 2,30; 4,11; 5,20; 6,30;

7,20 formam uma ordenação de uma amostra aleatória de tamanho 5 da
distribuição uniforme no intervalo [0,θ] sendo θ>0. Assinale a opção que
corresponde à estimativa de máxima verossimilhança de θ.
A) 5,20
B) 5,02
45
C) 7,20
D) 5,00
E) 8,00
Resolução
O enunciado fornece uma amostra aleatória com cinco elementos extraídos de

uma distribuição uniforme:
{x1 = 2,30; x2 = 4,11; x3 = 5,20; x4 = 6,30; x5 = 7,20} .
O valor máximo da amostra é xmax = x5 = 7,20 . Logo, pelo que aprendemos na

exposição teórica, a EMV de θ é θˆ = x = 7,20 (alternativa C).
max
Detalhamento da resolução:
Sabemos que θ ≥ xmax . A função densidade de probabilidade da distribuição

uniforme é f ( x) = 1 / θ para 0 ≤ x ≤ θ e f ( x) = 0 caso contrário.
A função de verossimilhança de uma amostra aleatória com n observações é
n
1 1
L(θ ) = ∏ = ,
i =1 θ θn
Cujo domínio é θ ≥ xmax , ou seja, o menor valor possível do parâmetro θ é

θ = xmax . A Fig. abaixo indica que o maior valor (máximo absoluto) de L(θ )
ocorre em θ = x . Portanto, a EMV é θˆ = x = 7,20 .
max max

46
Esta questão mostra que nem sempre é possível usar diretamente métodos de
cálculo para determinar o máximo de L(θ ) .
GABARITO: C
6. (Analista Técnico/SUSEP/2001/ESAF) Tem-se duas amostras

independentes ambas de tamanho 21 de duas populações normais com a
mesma variância σ2 > 0. Deseja-se construir um intervalo de confiança para
σ2, no nível de 95%, com base numa estimativa combinada das variâncias
amostrais s12 = 0,4 e s22 = 0,6 . Se 0< a < b são duas constantes tais que P{X<a}
= 0,025 e P{X>b} = 0,025, onde X tem distribuição qui-quadrado, assinale a
resposta que corresponde ao intervalo procurado e ao número de graus de
liberdade da distribuição de X.
A) [17/b; 17/a] e 20 graus de liberdade

B) [5/3b; 5/2a] e 40 graus de liberdade
C) [17/b; 17/a] e 41 graus de liberdade
D) [20/b; 20/a] e 40 graus de liberdade
E) [5/3b; 5/2a] e 20 graus de liberdade
Resolução
Esta questão pede que o candidato determine: i) o intervalo de confiança ao

nível de 95% da variável aleatória X que possui distribuição qui-quadrado e ii)
o número de graus de liberdade de X.
Do enunciado, depreende-se que X é resultante da combinação das estatísticas

S12 e S 22 .
A estimativa combinada das variâncias amostrais s12 = 0,4 e s22 = 0,6 é dada por
(n1 − 1) s12 + (n2 − 1) s22 20 × 0,4 + 20 × 0,6

x=s =2
p = = 0,5
n1 + n2 − 2 40
a qual possui (n1 + n2 - 2) = 21 + 21 – 2 = 40 graus de liberdade ⇒ este

fato, por si só, já elimina as alternativas A, C e E.
Vimos que o intervalo de confiança de σ 2 é dado pela fórmula
(n − 1) S 2 (n − 1) S 2
≤σ2 ≤ .
χ n2−1,α / 2 χ n2−1,1−α / 2

47
A fórmula acima pode ser generalizada para o problema em questão como
(n − k ) S p2 (n − k ) S 2p
≤σ ≤
2
χ n2−1,α / 2 χ n2−1,1−α / 2
em que n = n1 + n2 .
O enunciado forneceu os qui-quadrados superior e inferior: χ n2−1,α / 2 = χ sup

2
=b e
χ n2−1,1−α / 2 = χ inf
2
= a . Portanto,
(n − k ) S p2 (n − k ) S 2p (42 − 2) × 0,5 (42 − 2) × 0,5

≤σ ≤
2
⇒ ≤σ2 ≤
χ 2
sup χ 2
inf b a
40 × 0,5 40 × 0,5 20 20
⇒ ≤σ2 ≤ ⇒ ≤σ2 ≤ .
b a b a
GABARITO: D
7. (Analista Técnico/SUSEP/2002/ESAF) Seja X uma variável aleatória

com valor esperado µ e desvio padrão σ>0. Pode-se afirmar que
A) pelo menos 75% das realizações de X pertencerão ao intervalo [µ-2σ;µ+2σ]

B) pelo menos 80% das realizações de X pertencerão ao intervalo [µ-2σ;µ+2σ]
C) pelo menos 90% das realizações de X pertencerão ao intervalo [µ-2σ;µ+2σ]
D) pelo menos 95% das realizações de X pertencerão ao intervalo [µ-2σ;µ+2σ]
E) apenas com o conhecimento de µ e σ não é possível fazer afirmação sobre o
percentual de realizações de X que cairão no intervalo [µ-2σ;µ+2σ].
Resolução
Uma rápida leitura das alternativas indica que a questão aborda o teorema
(desigualdade) de Chebyshev:
⇒ Seja X uma variável aleatória arbitrária com média µ e variância σ2. Então,
para qualquer kσ > 0 , vale
1
P[ + kσ < X < + kσ ] ≥ 1 − .
k2

48
Análise das alternativas:
(A) P[ − 2σ < X < + 2σ ] ≥ 0,75 ⇒ CORRETA. O teorema de Chebyshev afirma

1
que P[ − 2σ < X < + 2σ ] é, no mínimo, igual a 1− 2 . Logo,
2
P[ − 2σ < X < + 2σ ] ≥ 0,75 .
(B) a (D) estão INCORRETAS conforme demonstrado acima.
(E) Esta alternativa nega o teorema de Chebyshev ao dizer que não é possível,
apenas com o conhecimento de µ e σ, fazer afirmação sobre o percentual de
realizações de X que cairão no intervalo [µ-2σ;µ+2σ] ⇒ INCORRETA.
GABARITO: A
8. (Analista/Área 3/BACEN/2006/FCC) Os preços de um determinado

produto vendido no mercado têm uma distribuição normal com desvio padrão
populacional de R$ 20,00. Por meio de pesquisa realizada com uma amostra
aleatória de tamanho 100, com um determinado nível de confiança, apurou-se,
para a média destes preços, um intervalo de confiança sendo [R$ 61,08 ; R$
68,92]. A mesma média amostral foi obtida quadruplicando o tamanho da
amostra anterior e utilizando também o mesmo nível de confiança. Nos dois
casos considerou-se infinito o tamanho da população. O novo intervalo de
confiança encontrado no segundo caso foi
A) [R$ 63,04 ; R$ 66,96]

B) [R$ 62,06 ; R$ 67,94]
C) [R$ 61,57 ; R$ 68,43]
D) [R$ 61,33 ; R$ 68,67]
E) [R$ 61,20 ; R$ 68,80]
Resolução
Dados: σ = 20, n = 100, 61,08 < µ < 68,92.

49
Podemos montar o seguinte sistema de equações:
 X − e0 = 61,08

 X + e0 = 68,92
Somando as duas equações obtemos:
2 X = 130 ⇒ X = 65
Subtraindo a primeira da segunda equação temos:
2e0 = 68,92 − 61,08 = 7,84 ⇒ e0 = 3,92
Sabemos que
σ 20
e0 = zα / 2 ⇒ 3,92 = zα / 2 ⇒ zα / 2 = 1,96 .
n 100
Quadruplicando o tamanho da amostra teremos n’=400. Logo,
σ 20
e0 ' = zα / 2 ⇒ e0 ' = 1,96 ⇒ e0 ' = 1,96
n' 400
E o novo intervalo de confiança (IC) será
IC = [65,00 – 1,96 ; 65,00 + 1,96] = [63,04 ; 66,96].
GABARITO: A
iid
9. (Estat./IBGE/2010/CESGRANRIO) Sejam X 1 , X 2 ,..., X n ~ N ( ;σ 2 ) e
considerados dois estimadores para σ2
1 n 1 n
T 1= ∑
n − 1 i =1
( X i − X )2 e T 2= ∑
n i =1
( X i − X )2.
Observe as afirmativas a seguir a respeito desses estimadores.
I – T1 é não tendencioso.
2 2(n − 1) 4
II – O erro médio quadrático de T1 é σ 4 , enquanto que o de T2 é σ .
n −1 n2
 σ2 
III – A tendência de T2 =  −  .
 n 

50
É (São) correta(s) a(s) afirmativa(s)
A) I apenas.
B) I e II, apenas.
C) I e III, apenas.
D) II e III, apenas.
E) I, II e III.
Resolução
Primeiramente, é necessário investigar as propriedades dos estimadores T1 e

T2. Mas, antes disso, vamos relembrar a distribuição χ2.
iid
Seja uma amostra X 1 , X 2 ,..., X n ~ N ( ;σ 2 ) (ou seja, cada elemento da amostra é
normalmente distribuído com média µ e variância σ2) Aprendemos que a
estatística
2
X − n
 n
χ = ∑ i
2
 = ∑ Zi ,
2
n
i =1  σ  i =1
em que Zi denota a variável aleatória normal reduzida, tem distribuição χ2 com

n graus de liberdade. Vimos também que,
E ( χ n2 ) = n
var(χ n2 ) = 2n (MEMORIZE estes resultados para a prova!).
A estatística
n
 Xi − X 
2 ∑(X i − X )2
∑ 
i =1  σ 
 = i =1
σ2
,
obtida por substituição de por X na expressão de χ n2 acima tem distribuição

do tipo χ2 com n-1 graus de liberdade. Logo,
∑(X i − X )2
χ 2
n −1 = i =1
.
σ2
Cálculo da média e da variância de T1:

51
n n
∑ ( X i − X )2 ∑(X i − X )2
σ2 σ2
T1 = i =1
= i =1
= χ n2−1
n −1 σ 2
n −1 n −1
ou seja, o estimador T1, a menos da constante σ 2 /( n − 1) , tem distribuição χ2

com n-1 graus de liberdade. Então,
 σ2 2  σ2
E (T1 ) = E  χ n −1  = × (n − 1) = σ 2 ⇒ T1 é um estimador não tendencioso
 n −1  n −1
de σ (viés é nulo).
2
 σ2 2  σ4 σ4 2σ 4

var(T1 ) = var χ n −1  =
 var(χ n −1 ) =
2
× 2(n − 1) = ⇒ como
 n −1  (n − 1) (n − 1) 2 n −1
2
2σ 4
lim var(T1 ) = lim = 0 , T1 é um estimador consistente de σ2.
n →∞ n→∞ n − 1
O Erro Quadrático Médio de T1 é dado por
EQM (T1 ) = var(T1 ) + [viés (T1 ) ]2

2σ 4
EQM (T1 ) = var(T1 ) + 0 = var(T1 ) = .
n −1
Cálculo da média e da variância de T2:
n n
∑ ( X i − X )2 ∑(X i − X )2
σ2 σ2
T2 = i =1
= i =1
= χ n2−1
n σ2 n n
ou seja, o estimador T2, a menos da constante σ 2 / n , tem distribuição χ2 com

n-1 graus de liberdade. Então,
σ 2 2  σ 2 σ2
E (T2 ) = E  χ n −1  = × (n − 1) = σ −
2
≠ σ 2 ⇒ T2 é um estimador tendencioso
 n  n n
de σ . O seu viés é dado por
2
σ2  σ2  σ2
viés(T2) = E (T2 ) − σ 2 = σ 2 − −σ 2 = −
. Note que lim  −  = 0 , ou seja, o viés
n →∞
n n  n 
de T2 tende a desaparecer com o aumento do tamanho da amostra.

52
σ 2  σ 4
2
σ4 2σ 4 (n − 1)
var(T2 ) = var χ n −1  = 2 var(χ n2−1 ) = 2 × 2(n − 1) = ⇒ como
 n  n n n2
2σ 4 (n − 1) 1 1 
lim var(T2 ) = lim 2
= 2σ 4 × lim  − 2  = 0 (e lim E (T2 ) = σ 2 ), T2 é um
n →∞ n→∞ n n → ∞
n n  n→∞
estimador consistente de σ . 2
O Erro Quadrático Médio de T2 é dado por
EQM (T2 ) = var(T2 ) + [viés (T2 ) ]2

2
2σ 4 (n − 1)  σ 2  2σ 4 (n − 1) σ 4 (2n − 1) 4
EQM (T2 ) = +  −
 n  = + 2 = σ .
n2   n2 n n2
Análise das afirmativas:
(I) VERDADEIRA, pois E (T1 ) = σ 2 .

2σ 4 (2n − 1) 4
(II) VERDADEIRA, pois EQM (T1 ) = e EQM (T2 ) = σ .
n −1 n2
σ2
(II) VERDADEIRA, pois viés(T2) = − .
n
Nota: na exposição teórica, chamei o estimador T1 de S 2 e o estimador T2 de

σˆ 2 .
GABARITO: E
10. (Estatística/IBGE/2010/CESGRANRIO) Considere uma amostragem

aleatória simples, sem reposição, de uma população de tamanho muito
grande. Qual o tamanho aproximado de amostra que permite estimar a média
de uma variável y, cujo desvio padrão populacional é igual a 5, com margem
de erro 0,1, a um nível de confiança 95%?
A) 100
B) 400
C) 1.000
D) 4.000
E) 10.000
Resolução
Dados: 1 − α = 95% , σ = 5 e e0 = 0,1 .
Fórmula a ser aplicada:

53
2
z σ 
n =  α / 2  .
 e0 
Note que z2,5% = 1,96 é um valor “manjado” (MEMORIZE para a prova!).

Portanto,
2
 1,96 × 5 
n=  = 9.604 ⇒ alternativa com valor mais próximo é a letra E (n ≈
 0,1 
10.000)
GABARITO: E
11. (Estatística/IBGE/2010/CESGRANRIO) Para avaliar a taxa de

desemprego em uma determinada localidade, selecionou-se uma amostra
aleatória de 900 indivíduos em idade produtiva. O resultado dessa amostra
revelou que o número de desempregados era de 36%. O intervalo de 95% de
confiança para a proporção de desempregados, nessa localidade, é
A) 36% ± 0,1%
B) 36% ± 2,6%
C) 36% ± 3,1%
D) 36% ± 3,7%
E) 36% ± 4,1%
Resolução
Dados: n = 900, p’ = 0,36 e (1 - α) = 0,95 (que implica um zα / 2 = 1,96 ).
Sabemos que neste caso o IC será dado por:
p' (1 − p' ) 0,36(1 − 0,36)

IC = p'± zα / 2 = 36% ± 1,96 ≈ 36% ± 3,14% ⇒ alternativa com
n 900
valor mais próximo é C.
GABARITO: C
12. (Analista/Área 2/BACEN/2010/CESGRANRIO) Em um estudo sobre a

economia informal de uma cidade, deseja-se determinar uma amostra para
estimar o rendimento médio dessa população, com um grau de confiança de
95% de que a média da amostra aleatória extraída não difira de mais de R$
50,00 da média do rendimento dessa população, cujo desvio padrão é R$
1,96
400,00. Sabendo-se que z ~ N[0,1] e que ∫
0
f ( z )dz = 0,4750 , onde f(z) é a
54
função de densidade de probabilidade de z, pode-se concluir que o número de
pessoas da amostra será
A) 321
B) 308
C) 296
D) 271
E) 246
Resolução
1,96
Dados: (1 - α) = 0,95 e ∫
0
f ( z )dz = 0,4750 (que implicam um z2,5% = 1,96 ), σ =
400, e0 = 50.
Neste caso o tamanho n da amostra é dado pela fórmula
σ 400 400
e0 = z2,5% ⇒ 50 = 1,96 ⇒ n = 1,96 = 1,96 × 8 ⇒ n = 245,86 ≈ 246 .
n n 50
GABARITO: E
(Analista Ministerial/Estatística/MPE-PE/2006/FCC) Instruções

(adaptadas): Para responder às questões de números 13 e 14, considere as
tabelas a seguir.
Elas fornecem alguns valores da função de distribuição F(x). A tabela 1 refere-

se à variável normal padrão, as tabelas 2 e 3 referem-se à variável t de
Student com 15 e 16 graus de liberdade, respectivamente:
Tabela 1 Tabela 2 Tabela 3

x F(x) x F(x) x F(x)
1,60 0,945 1,753 0,95 1,746 0,95
1,64 0,950 2,248 0,98 2,235 0,98
2,00 0,977 2,583 0,99 2,567 0,99
13. Um engenheiro encarregado do controle de qualidade deseja estimar a

proporção p de lâmpadas defeituosas de um lote, com base numa amostra de
tamanho 400. Sabe-se, com base em experiâncias anteriores, que p deve
estar próximo de 0,5. Usando o teorema central do limite para estimar a
amplitude do intervalo de confiança de 90% para p, podemos afirmar que tal
amplitude é, aproximadamente, igual a
A) 0,041
B) 0,045
55
C) 0,058
D) 0,070
E) 0,082
Resolução
Dados: (1 - α) = 0,90, n = 400 e p’ ≈ 50%.
A tabela 1 indica que z = 1,64 para α/2 = 5%. Como a estimativa p’ ≈ 50%,
podemos usar a fórmula
2
z  ( z ) 2 1,64 2 1,64 2
n =  α / 2  ⇒ (2e0 ) 2 = α / 2 = ⇒ (2e0 ) = = 0,082 ⇒ alternativa (E).
 2e0  n 400 400
Atenção: a questão pede que o candidato calcule a AMPLITUDE (= dobro da

semi-amplitude e0) do intervalo de confiança.
GABARITO: E
14. Supondo-se que a porcentagem da receita investida em educação, dos 600

municípios de uma região, tem distribuição normal com média µ, deseja-se
estimar essa média. Para tanto se sorteou dentre esses 600, aleatoriamente e
com reposição, 16 municípios e se observou os porcentuais investidos por eles
em educação. Os resultados indicaram uma média amostral de 8% e desvio
padrão amostral igual a 2%. Um intervalo de confiança para µ, com coeficiente
de confiança de 96%, é dado por
A) (8 ± 1,124)%
B) (8 ± 1,117)%
C) (8 ± 0,877)%
D) (8 ± 0,870)%
E) (8 ± 0,755)%
Resolução
A questão aborda a construção do intervalo de confiança da média

populacional µ quando o desvio padrão populacional σ é desconhecido. Para
tal, deve-se utilizar a fórmula
S
X ± t n−1,α / 2 .
n
Dados: X = 8% , S = 2% , n = 16 .

56
A tabela 2 fornece o valor de t n−1,α / 2 = t15, 2% = 2,248 (entrada correspondente ao
valor F(x) = 98%, que implica α/2 = 1 – 98% = 2%). Logo,
S 2%
X ± t n−1,α / 2 = 8% ± 2,248 = 8% ± 1,124% .
n 16
GABARITO: A
15. (Analista Ministerial/Estatística/MPE-PE/2006/FCC) Seja X uma

variável aleatória assumindo os valores -2 e 2, com probabilidade 1/4 e 3/4,
respectivamente. Seja µ a média de X. Então o limite superior de P[|X - µ| ≥
12 ], obtido pela desigualdade de Tchebysheff, é dado por
A) 0,40
B) 0,25
C) 0,20
D) 0,12
E) 0,10
Resolução
A Desigualdade de Tchebysheff pode ser dada pela expressão
1
P[| X − |≥ kσ ] ≤ .
k2
Dados: i) kσ = 12 , ii) distribuição de probabilidades de X (logo é possível

calcular a média µ e o desvio padrão σ de X).
 1  3
= E ( X ) = ∑ xi f ( xi ) =  − 2 ×  +  2 ×  = 1
i  4  4
 1  3
σ 2 = E( X 2 ) − 2
= ∑ xi2 f ( xi ) − µ 2 =  (−2) 2 ×  +  2 2 ×  − 12 = 3
i  4  4
Então
kσ 12
= ⇒ k = 2.
σ 3
1
P[| X − 1 |≥ 2 3 ] ≤
⇒ P[| X − 1 |≥ 2 3 ] ≤ 0,25 ⇒ limite superior da probabilidade de
22
que X difira da média populacional por ± 2 3 é 0,25.
57
GABARITO: B
(ANPEC/2009/Adaptada) Verifique se as afirmativas 16 a 20 são

verdadeiras:
16. Em uma pesquisa de opinião a proporção de pessoas favoráveis a uma

determinada medida governamental é dada por pˆ = ∑ X i / n . O menor valor de
n para o qual a desigualdade de Chebyshev resultará em uma garantia de que
P(| pˆ − p |≥ 0,01) ≤ 0,01 é 200.000.
Resolução
A proporção de pessoas favoráveis a uma determinada medida governamental,

denotada por p̂ , é uma variável aleatória com valor esperado E ( pˆ ) = p , em que
p denota o verdadeiro valor do parâmetro populacional, e variância
var( pˆ ) = p(1 − p ) / n , em que n é o número de elementos da amostra.
Vimos que a Desigualdade de Tchebysheff pode ser dada pela expressão
1
P[| X − |≥ kσ ] ≤ .
k2
Nesta questão, podemos reescrever a desigualdade acima como
P[| pˆ − p |≥ 0,01] ≤ 0,01 .
Sendo assim, podemos calcular o valor de k:
1
= 0,01 ⇒ k = 10 .
k2
Como kσ = 0,01 ⇒ σ = 0,01 / 10 = 10 −3 ⇒ σ 2 = 10 −6 .
Note que σ 2 = var( pˆ ) = p(1 − p ) / n . Temos o valor de σ2 = 10-6. Porém, não há

condição de calcular n = p (1 − p ) / σ 2 , pois a questão não forneceu o valor da
média populacional (p). Logo, não podemos afirmar que o menor valor de n
para o qual a desigualdade de Chebyshev resultará em uma garantia de que
P(| pˆ − p |≥ 0,01) ≤ 0,01 é 200.000 (faltam dados!).
GABARITO: FALSA
17. Quando o número de graus de liberdade δ cresce, a distribuição χδ2

aproxima-se de uma distribuição normal com média δ e desvio padrão 2δ.

58
Resolução
A média da variável χδ2 é δ e a variância é 2δ. Logo, a afirmativa é FALSA,

pois diz que o desvio padrão de χδ2 é 2δ..
De acordo com Teorema Central do Limite, a família de distribuições do tipo χδ2

tende à distribuição normal com média δ e variância 2δ quando o número de
graus de liberdade δ aumenta.
GABARITO: FALSA
18. Um intervalo de confiança de 99% para a média µ de uma população,

calculado para uma amostra aleatória, como [2,75; 8,25], pode ser
interpretado como: a probabilidade de µ estar no intervalo calculado é de 99%.
Resolução
Uma estimativa do intervalo de confiança da média populacional µ

(desconhecida) é um intervalo da forma l ≤ µ ≤ u, em que os limites inferior l
e superior u dependem do valor numérico do estimador X para uma amostra
particular. Como amostras distintas produzirão diferentes estimativas para ˆ
e, por conseguinte, valores diferentes para os limites l e u, esses limites são
valores de variáveis aleatórias, como L e U, respectivamente. Da distribuição
amostral de X somos capazes de determinar valores de L e U, tais que a
seguinte afirmação probabilística seja verdadeira:
P( L ≤ ≤ U) =1−α ,
sendo 0 < α < 1 . Assim, temos uma probabilidade igual a 1 − α de selecionar uma
amostra que produzirá um intervalo contendo o valor verdadeiro do parâmetro
.
O intervalo observado
l≤ ≤u
é chamado de intervalo com 100(1 − α )% de confiança para o parâmetro µ. A

interpretação de um intervalo de confiança é que se um número infinito de
amostras aleatórias for coletado e um intervalo com 100(1 − α )% de confiança
para µ for calculado a partir de cada amostra, então 100(1 − α )% desses
intervalos conterão o valor verdadeiro de µ.
Na prática, obtemos somente uma amostra aleatória e calculamos uma

estimativa do intervalo de confiança. Uma vez que esse intervalo conterá
ou não o valor verdadeiro de µ, não é razoável fixar um nível de
59
probabilidade para essa realização. A afirmação apropriada é: o
intervalo observado [l, u] contém o valor verdadeiro de µ, com
100(1 − α )% de confiança. Essa afirmação tem uma interpretação de
freqüência; ou seja, não sabemos se a afirmação é verdadeira para essa
amostra específica, mas o método usado para obter o intervalo [l, u] resulta
em afirmações corretas em 100(1 − α )% do tempo.
GABARITO: FALSA
19. Seja X 1 , X 2 ,..., X n uma amostra aleatória simples proveniente de uma

população com distribuição de Pareto cuja função densidade é dada por
f ( x) = θ (1 + x) − (θ +1) , 0 < x < ∞ , θ > 1 . Então o estimador de máxima verossimilhança
n
para θ é .
∑ log(1 + xi )
Resolução
A função de verossimilhança é dada por:
L(θ ) = f (x1 ) × f (x 2 ) × ... × f (x n ) = θ (1 + x1) −(θ +1)θ (1 + x 2 ) −(θ +1) ...θ (1 + x n ) −(θ +1)
L(θ ) = θn [(1 + x1 )(1 + x 2 )...(1 + x n )]−( θ +1) .
Tomando o logaritmo natural de L(θ), obtemos:
ln L(θ ) = ln{θn [(1 + x1 )(1 + x 2 )...(1 + x n )]−( θ +1)}

ln L(θ ) = ln{θn } − (θ + 1)ln[(1 + x1 )(1 + x 2 )...(1 + x n )]
ln L(θ ) = n ln{θ } − (θ +1)[ln(1+ x1) + ln(1+ x 2 ) + ...+ ln(1+ x n )]
ln L(θ ) = n ln{θ } − (θ + 1)∑ ln(1 + x i )
i
A EMV será determinada por meio da equação
d ln L(θ ) d (ln θ ) 1
=0 Dica: =
dθ dθ θ
 1 n
n ˆ  − ∑ ln(1 + x i ) = 0 ⇒ θˆ =
θ  i ∑ ln(1+ x i )
Nota: a função log(.) do enunciado denota o logaritmo natural.
GABARITO: VERDADEIRA
20. Se existe, todo estimador de máxima verossimilhança calculado para uma

amostra aleatória possui distribuição Normal em grandes amostras.
Resolução
60
O Estimador de Máxima Verossimilhança possui distribuição assintótica normal

⇒ VERDADEIRA.
GABARITO: VERDADEIRA
Até a próxima aula. Bom estudo!
Alexandre e Moraes Jr.

61

Aula 19

Încărcat de

Informații document

Descriere originală:

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Aula 19

Încărcat de

Drepturi de autor:

Formate disponibile

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados

Profs. Alexandre Lima e Moraes Junior

19. Estimação de Parâmetros . ................................................................................................ 3

Profs. Alexandre Lima e Moraes Junior 1

Resolução da Questão 09:

Corrigir a última fórmula:

Resolução da Questão 10:

Corrigir a última fórmula:

Resolução da Questão 14:

“(...) Há quatro casos possíveis:

1) escolha de uma bola branca no 1º sorteio e de uma bola preta no 2º

Profs. Alexandre Lima e Moraes Junior

A partir desta aula, focaremos o estudo da Inferência Estatística. Vimos que o

A Inferência Estatística pode ser dividida em duas partes: estimação de

A teoria da Probabilidade fornece vários modelos probabilísticos (distribuições

Há duas técnicas de estimação de parâmetros: por ponto e por intervalo. Na

A próxima figura é um plot dos resíduos de uma regressão linear. Vimos na

Profs. Alexandre Lima e Moraes Junior

19.2 Estimador e Estimativa

Apresentamos os conceitos de estimador e de estimativa na aula passada.

Um estimador (ou estatística) é qualquer função das observações de

A estimação por ponto consiste em adotar a melhor estimativa possível

19.2.1 Propriedades dos Estimadores

Justeza ou Não Tendenciosidade

Um estimador Θ̂ é justo (ou não viesado, ou não viciado, ou não

A Eq. (1) afirma que os valores aleatórios de um estimador justo ocorrerão em

Um estimador não viesado é aquele que, na média, acerta o valor

Se o estimador for tendencioso, então a diferença

é o viés (tendência ou vício) do estimador Θ̂ , conforme ilustrado pela

Profs. Alexandre Lima e Moraes Junior

Exemplo (Média Amostral). Seja uma população com média µ. A média X

Então, o valor esperado de X é

Portanto, a média amostral é um estimador justo da média populacional

Exemplo (Média Ponderada). Seja a média ponderada de uma amostra

em que as constantes w1 , w2 ,..., wn ( w1 + w2 + ... + wn = n ), são os pesos usados na

Portanto, a média ponderada de uma amostra é um estimador justo da

Exemplo. Seja um estimador M da média populacional µ dado pela equação

n+1 tende a subestimar o valor de µ.

Calculemos o valor esperado de M:

Portanto, M é um estimador viesado da média populacional µ.

Nota: o entendimento da demonstração que se segue não é essencial para a

Profs. Alexandre Lima e Moraes Junior

n  i=1  n  i=1  n  i=1 

como ∑X i = nX , temos que

levando em conta que ( − X ) 2 = ( X − µ ) 2 , obtemos

aplicando a expectância, obtemos

E(σˆ 2 ) =  E ∑ (X i − µ) 2  − nE[(X − µ) 2 ].

Como a esperança da soma é igual à soma das esperanças, tem-se que

Mas E ( X i − µ) 2 = var( X i ) = σ2 e E [( X − µ) 2 ] = var( X ) = σ2 / n . Logo,

Profs. Alexandre Lima e Moraes Junior

Conclui-se que σˆ 2 é um estimador viesado da variância populacional σ2

o qual, não por acaso, corresponde à variância amostral definida na aula

Não é difícil mostrar que S2 é um estimador justo da variância

Há estimadores que, embora viesados, tem seu viés diminuído quando o

Exemplo. Verifique que o estimador da média populacional µ dado por

assintoticamente não viesado da média populacional µ.

Um estimador é dito Eficiente ou Estimador Não Tendencioso de

Profs. Alexandre Lima e Moraes Junior

Teorema (ENTVM). Se ( X 1 , X 2 ,..., X n ) for uma amostra aleatória proveniente

Entre dois estimadores não viesados, diz-se que é relativamente mais

Exemplo. Considere uma amostra aleatória de 2 elementos oriunda de uma

e compare esse estimador com a média amostral.