Sunteți pe pagina 1din 61

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados

Profs. Alexandre Lima e Moraes Junior


Raciocínio Lógico-Quantitativo para Traumatizados
Aula 19
Estimação de Parâmetros

19. Estimação de Parâmetros . ................................................................................................ 3


19.1 Introdução . ..................................................................................................................... 3
19.2 Estimador e Estimativa . ............................................................................................ 4
19.2.1 Propriedades dos Estimadores ....................................................................................... 4
19.2.2 Critérios para Escolha dos Estimadores ....................................................................... 13
19.3 Estimação por Ponto . ............................................................................................... 19
19.3.1 Estimação por Ponto da Média .................................................................................... 19
19.3.2 Estimação por Ponto da Variância ............................................................................... 19
19.3.3 Estimação por Ponto do Desvio Padrão ....................................................................... 20
19.3.4 Estimação por Ponto de uma Proporção Populacional ................................................ 20
19.3.4 Estimação por Ponto com Base em Diversas Amostras .............................................. 20
19.4 Estimação por Intervalo . ........................................................................................ 21
19.4.1 Intervalo de Confiança para a média quando o desvio-padrão é conhecido ................ 22
19.4.2 Intervalo de confiança para a média quando o desvio-padrão é desconhecido ........... 24
19.4.3 Intervalo de confiança para a variância . ..................................................................... 25
19.4.4 Intervalo de confiança para o desvio-padrão . ............................................................. 27
19.4.5 Intervalo de Confiança para uma proporção populacional . ........................................ 27
19.5 Tamanho das Amostras . ......................................................................................... 29
19.6 Memorize para a prova ............................................................................................ 32
19.7 Exercícios de Fixação ................................................................................................ 35
19.7 Gabarito . ....................................................................................................................... 41
19.8 Resolução dos Exercícios de Fixação . ................................................................ 42

Profs. Alexandre Lima e Moraes Junior 1


Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior

Erratas – Aula 15

Resolução da Questão 09:

Corrigir a última fórmula:

2
Py|x (1 |1)Px (1) 1× 10
Px|y (1 |1) = = 3 = .
Py|x (1 |1)Px (1) + Py|x (1 | 0)Px (0) 1 × + ×
2 1 1 11
3 5 3

Resolução da Questão 10:

Corrigir a última fórmula:

5 4
Py|x (1 |1)Px (1) × 20 10
Px|y (1 |1) = = 10 10 = = .
Py|x (1 |1)Px (1) + Py|x (1 | 0)Px (0) 5 × 4 + 1 × 6 26 13
10 10 10 10

Resolução da Questão 14:

“(...) Há quatro casos possíveis:

1) escolha de uma bola branca no 1º sorteio e de uma bola preta no 2º


sorteio quando a urna escolhida é a que tem 3 bolas brancas e 1 preta
(caso 1) ou
2) caso 2: escolha de uma bola preta no 1º sorteio e de uma branca no
2º sorteio quando a urna escolhida é a que tem 3 bolas brancas e 1
preta (caso 2) ou
3) escolha de uma bola branca no 1º sorteio e de uma bola preta no 2º
sorteio quando a urna escolhida é a que tem 3 bolas brancas e 3 pretas
(caso 3) ou
4) escolha de uma bola preta no 1º sorteio e de uma branca no 2º
sorteio quando a urna escolhida é a que tem 3 bolas brancas e 3 pretas
(caso 4).
(...)”

Profs. Alexandre Lima e Moraes Junior


2
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
19. Estimação de Parâmetros

19.1 Introdução

A partir desta aula, focaremos o estudo da Inferência Estatística. Vimos que o


seu objetivo é inferir propriedades da população a partir de uma amostra.

A Inferência Estatística pode ser dividida em duas partes: estimação de


parâmetros e testes de hipóteses. Nesta aula abordaremos a estimação,
mas apenas no que diz respeito à estimação dos parâmetros de uma
distribuição populacional (você já aprendeu um pouco sobre estimação na aula
17, quando estudamos a regressão linear).

A teoria da Probabilidade fornece vários modelos probabilísticos (distribuições


de probabilidades), tais como binomial, Poisson, normal, etc. Tais modelos
representam famílias de distribuições que dependem de um ou mais
parâmetros. Por exemplo, uma distribuição normal é caracterizada pela média
e desvio-padrão σ.

Quando descrevemos uma população, fazemos isso por meio de algum modelo
probabilístico, cujos parâmetros, portanto, devem ser estimados da melhor
forma possível com base na amostra obtida.

Há duas técnicas de estimação de parâmetros: por ponto e por intervalo. Na


estimação por ponto, a estimativa do parâmetro populacional corresponde a
um único valor estimado. Na segunda técnica, constrói-se um intervalo, o qual
deverá, com probabilidade conhecida, conter o parâmetro. Neste texto
admitiremos, salvo menção em contrário, que a amostragem sempre será
aleatória.

A próxima figura é um plot dos resíduos de uma regressão linear. Vimos na


aula 17 que a média dos resíduos é zero (linha horizontal azul). As estimativas
pontuais dos resíduos são os pontos circulares. Note que cada estimativa por
ponto está situada no ponto médio de um intervalo de estimação (são as
barras verticais), o qual contém o parâmetro com uma probabilidade
conhecida (geralmente utiliza-se 95% na prática). Observe que a estimativa
mais à esquerda do gráfico (a de cor vermelha) não cruza a linha azul; desta
forma, podemos concluir que trata-se de um provável outlier.

Profs. Alexandre Lima e Moraes Junior


3
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior

0.8

0.6

0.4

0.2
resíduos

-0.2

-0.4

-0.6

-0.8

2 4 6 8 10 12 14 16 18 20
x

19.2 Estimador e Estimativa

Apresentamos os conceitos de estimador e de estimativa na aula passada.


Vamos relembrar estes conceitos rapidamente?

Um estimador (ou estatística) é qualquer função das observações de


uma amostra, que será usado no processo de estimação do parâmetro
populacional desejado. A média amostral X , por exemplo, é um estimador da
média µ de uma população. Um estimador é uma variável aleatória
caracterizada por uma distribuição de probabilidades. Chamamos de
estimativa um particular valor assumido por um estimador.

A estimação por ponto consiste em adotar a melhor estimativa possível


como sendo o valor do parâmetro. A qualidade da estimação irá depender
fundamentalmente da escolha do estimador. Assim, dentre os possíveis
estimadores que podem ser especificados para um determinado parâmetro
populacional, devemos ter a preocupação de escolher aquele que melhor
satisfaça as propriedades estatísticas de um bom estimador.

19.2.1 Propriedades dos Estimadores

Justeza ou Não Tendenciosidade

Um estimador Θ̂ é justo (ou não viesado, ou não viciado, ou não


tendencioso) se o seu valor esperado (ou média) for igual ao valor do
parâmetro θ que se pretende estimar, isto é, se

(1) ˆ ) = θ.
E (Θ
Profs. Alexandre Lima e Moraes Junior
4
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior

A Eq. (1) afirma que os valores aleatórios de um estimador justo ocorrerão em


torno do valor do parâmetro, o que é desejável (veja a figura abaixo).

Um estimador não viesado é aquele que, na média, acerta o valor


correto do parâmetro populacional.

Se o estimador for tendencioso, então a diferença

(2) ˆ −θ
E (Θ)

é o viés (tendência ou vício) do estimador Θ̂ , conforme ilustrado pela


próxima figura. Deste modo, a adoção de um estimador que não seja justo
implica um vício de estimação.

Profs. Alexandre Lima e Moraes Junior


5
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior

Exemplo (Média Amostral). Seja uma população com média µ. A média X


da amostra aleatória ( X 1 , X 2 ,..., X n ) extraída dessa população é dada por

X 1 + X 2 + ... + X n
X = .
n

Então, o valor esperado de X é

 X + X 2 + ... + X n 
E( X ) = E 1 =
 n 
1 1 1 n×
= E ( X 1 ) + E ( X 2 ) + ... + E ( X n ) = =µ
n n n n

Portanto, a média amostral é um estimador justo da média populacional


(memorize para a prova!).

Exemplo (Média Ponderada). Seja a média ponderada de uma amostra


aleatória ( X 1 , X 2 ,..., X n ) definida como

w1 X 1 + w2 X 2 + ... + wn X n
W=
n

em que as constantes w1 , w2 ,..., wn ( w1 + w2 + ... + wn = n ), são os pesos usados na


ponderação. Então, o valor esperado de W é

 w X + w2 X 2 + ... + wn X n 
E ( X ) = E 1 1 =
 n 
1 1
= [w1 E ( X 1 ) + w2 E ( X 2 ) + ... + wn E ( X n )] = [w1 + w2 + ... + wn ]= × n = µ.
n n n
Profs. Alexandre Lima e Moraes Junior
6
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior

Portanto, a média ponderada de uma amostra é um estimador justo da


média populacional µ, apesar da ponderação.

Exemplo. Seja um estimador M da média populacional µ dado pela equação

∑X i
M = i =1
.
n +1

n
Espera-se que o viés de M seja negativo, uma vez que a divisão de ∑X
i =1
i por

n+1 tende a subestimar o valor de µ.

Calculemos o valor esperado de M:

 X + X 2 + ... + X n 
E (M ) = E 1 =
 n +1 
1
= [E ( X 1 ) + E ( X 2 ) + ... + E ( X n )] = n ≠ µ.
n +1 n +1

Portanto, M é um estimador viesado da média populacional µ.

Observe que

viés(M) = E(M) - µ,

n
viés(M) = -µ= − ⇒ negativo, como antecipado.
n +1 n +1

Exemplo. Seja uma população com média µ e variância σ2. Verifique que o
estimador da variância populacional definido por

∑( X i − X )2
σˆ 2 = i=1
n

é viesado.

Nota: o entendimento da demonstração que se segue não é essencial para a


prova. Mas é importante memorizar que o estimador da variância
populacional considerado neste exemplo é viesado.

Demonstração:

Profs. Alexandre Lima e Moraes Junior


7
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Calculemos a esperança de σˆ 2 :

1 n  1 n  1 n 
E(σˆ ) = E ∑ (X i − X )  = E ∑ (X i − µ + µ − X )  = E ∑[(X i − µ) + ( µ − X )]2 
2 2 2

n  i=1  n  i=1  n  i=1 


1  n 
E(σˆ 2 ) = E ∑[(X i − µ) 2 + 2(X i − µ)( µ − X ) + ( µ − X ) 2 ]
n  i=1 
1  n n n 
E(σˆ 2 ) = E ∑ (X i − µ) 2 + 2∑ (X i − µ)( µ − X ) + ∑ ( µ − X ) 2 
n  i=1 i=1 i=1 
1  
n n
E(σˆ 2 ) = E ∑ (X i − µ) 2 + 2( µ − X )∑ (X i − µ) + n( µ − X ) 2 
n  i=1 i=1 

como ∑X i = nX , temos que


i=1

1  
n
E(σˆ ) =
2
E ∑ (X i − µ) 2 + 2n(µ − X )(X − µ) + n( µ − X ) 2 
n  i=1 
1  
n
E(σˆ 2 ) = E ∑ (X i − µ) 2 − 2n( µ − X )( µ − X ) + n( µ − X ) 2 
n  i=1 
1  n 
E(σˆ 2 ) = E ∑ (X − µ) 2 − 2n(µ − X ) 2 + n( µ − X ) 2 
n  i=1 i 
1  
n
E(σˆ 2 ) = E ∑ (X i − µ) 2 −n( µ − X ) 2 
n  i=1 

levando em conta que ( − X ) 2 = ( X − µ ) 2 , obtemos

1  
n
E(σˆ 2 ) = E ∑ (X i − µ) 2 −n(X − µ) 2 
n  i=1 

aplicando a expectância, obtemos

1   
n

E(σˆ 2 ) =  E ∑ (X i − µ) 2  − nE[(X − µ) 2 ].


n   i=1  

Como a esperança da soma é igual à soma das esperanças, tem-se que

1 
n
E(σˆ 2 ) = ∑ E(X i − µ) − nE[(X − µ) ] .
2 2

n  i=1 

Mas E ( X i − µ) 2 = var( X i ) = σ2 e E [( X − µ) 2 ] = var( X ) = σ2 / n . Logo,

Profs. Alexandre Lima e Moraes Junior


8
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
1  n
σ2 
1 n −1 2
E (σˆ 2 ) = ∑σ2 − n  = × ( nσ2 − σ2 ) = σ ≠ σ2 .
n  i =1 n n n

Conclui-se que σˆ 2 é um estimador viesado da variância populacional σ2


(memorize para a prova!). Esse defeito do estimador pode ser corrigido se
multiplicarmos σˆ 2 pelo fator n /( n − 1) , o que nos leva à definição do estimador

n 2
∑(X i − X )2
S2 = σˆ = i =1
,
n −1 n −1

o qual, não por acaso, corresponde à variância amostral definida na aula


anterior.

Não é difícil mostrar que S2 é um estimador justo da variância


populacional (memorize para a prova!):

n n n −1 2
E(S 2 ) = E(σˆ 2 ) = × × σ = σ2 .
n −1 n −1 n
_______________________________________________________

Há estimadores que, embora viesados, tem seu viés diminuído quando o


tamanho da amostra aumenta, ou seja, o viés vai desaparecendo à medida
que o tamanho da amostra aumenta. Um estimador é dito assintoticamente
não viesado se

(3) ˆ ) = θ.
lim E (Θ
n→∞

Exemplo. Verifique que o estimador da média populacional µ dado por


n
M = (n + 1) −1 ∑ X i é assintoticamente não viesado.
i =1

n  n 
E(M) = ⇒ lim E(M) = µ lim  = µ ⇒ Logo, M é um estimador
n +1 n→∞ n → ∞ n +1

assintoticamente não viesado da média populacional µ.


_______________________________________________________

Eficiência

Não basta que um estimador acerte na média. Além disso, é desejável que
tenha a menor variância possível (maior precisão possível).

Um estimador é dito Eficiente ou Estimador Não Tendencioso de


Variância Mínima (ENTVM), se

Profs. Alexandre Lima e Moraes Junior


9
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
• for não viesado;
• entre os estimadores não viesados, apresentar a menor variância.

Teorema (ENTVM). Se ( X 1 , X 2 ,..., X n ) for uma amostra aleatória proveniente


de uma população normalmente distribuída com média µ e variância σ2, então
a média amostral X será o ENTVM (ou eficiente) de µ.

Entre dois estimadores não viesados, diz-se que é relativamente mais


eficiente aquele que apresenta a menor variância.

Exemplo. Considere uma amostra aleatória de 2 elementos oriunda de uma


população com média µ e variância σ2. Determine a variância do estimador da
média populacional dado por

3 X1 + 2 X 2
W=
5

e compare esse estimador com a média amostral.

Vimos anteriormente que a média ponderada W é um estimador não viesado


de µ. Neste exemplo, sua variância é dada por

 3X + 2 X 2  1
var(W ) = var 1 = var(3 X 1 + 2 X 2 ) =
 5  25
1 13σ 2
= [9 var( X 1 ) + 4 var( X 2 )] = = 0,52σ 2 .
25 25

Por outro lado, a variância de X é 0,5σ2 (menor que a variância da média


ponderada). Neste caso, a média amostral é um estimador relativamente mais
eficiente (melhor) do que W, pois possui uma variância menor. Como o
enunciado não especificou a distribuição de probabilidades da população X, não
se pode afirmar que X seja o estimador eficiente da média populacional µ.
_______________________________________________________

Entre dois estimadores justos, vimos que é relativamente mais


eficiente aquele que apresenta a menor variância. Mas e se quisermos
comparar dois estimadores quaisquer? Qual será a métrica de comparação? A
métrica mais usada é o Erro Quadrático Médio (EQM) de estimação.

Define-se o EQM como a média da diferença quadrática (diferença ao


quadrado) entre o estimador e o valor do parâmetro:

(4) EQM (Θ ˆ − θ ) 2 ].
ˆ ) = E[(Θ

Desenvolvendo (4), demonstra-se que


Profs. Alexandre Lima e Moraes Junior
10
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior

(5) ˆ ) = var(Θ
EQM (Θ ˆ ) ]2.
ˆ ) + [viés (Θ

Ou seja,

EQM de estimação = variância do estimador + (viés do estimador)2

Daremos a prova de que (4) e (5) são equivalentes a seguir. O entendimento


da demonstração não é fundamental para a prova; mas é desejável que você
se esforce um pouco para entendê-la. Desvio a sua leitura para o texto após a
prova, se preferir.

Prova:

Desenvolvendo (4), obtemos

ˆ ) = E (Θ
EQM (Θ ˆ θ + θ 2 ) = E (Θ
ˆ 2 − 2Θ ˆ 2 ) − 2θE (Θ
ˆ ) +θ 2 ,

pois θ é um valor constante (E(θ) = θ). Somando e subtraindo [ E (Θ


ˆ )]2 ,
chegamos a:

ˆ ) = E (Θ
EQM (Θ ˆ 2 ) − [ E (Θ ˆ )]2 − 2θE (Θ
ˆ )]2 + [ E (Θ ˆ ) +θ 2

em que E (Θˆ 2 ) − [ E (Θ
ˆ )]2 = var(Θ ˆ )]2 − 2θE (Θ
ˆ ) e [ E (Θ ˆ ) + θ 2 = [ E (Θ
ˆ ) − θ ]2 . Logo, podemos
reescrever a expressão acima na forma

ˆ ) = var(Θ
EQM (Θ ˆ ) − θ ]2
ˆ ) + [ E (Θ

em que ˆ ) −θ]
[ E (Θ representa o viés do estimador. Logo,
ˆ ) = var(Θ
EQM (Θ ˆ ) ]2.
ˆ ) + [viés (Θ

A Eq. (5) mostra que o EQM tem dois componentes: o estimador erra o
valor do parâmetro em função da sua dispersão (variância) e ainda,
quando for o caso, pelo fato de não acertar na média (ser viesado).

Para dois estimadores quaisquer Θ̂1 e Θ̂ 2 , se Θ̂1 tem menor EQM do que Θ̂ 2 ,
então Θ̂1 é relativamente mais eficiente do que Θ̂ 2 .

Observe que, para dois estimadores justos, dizer que EQM é menor equivale a
dizer que a variância é menor (pois o viés é nulo).

Melhor Estimador Linear Não Viesado

Profs. Alexandre Lima e Moraes Junior


11
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Uma terceira propriedade desejável de um estimador é que ele seja o Melhor
Estimador Linear Não Viesado (MELNV). Para tal, o estimador tem que:

• ser não viesado;


• ser linear;
• entre os estimadores lineares e não viesados, apresentar a menor
variância.

Um estimador é linear se for obtido por meio de uma combinação linear das
observações X 1 , X 2 ,..., X n da amostra, ou seja, se é dado por

(6) ˆ = a X + a X + ... + a X ,
Θ 1 1 2 2 n n

em que os pesos ai , i = 1,2,..., n , são constantes.

A média amostral X = ( X 1 + X 2 + ... + X n ) / n é um estimador linear pois

1
a1 = a2 = ... = an = .
n

Consistência

Um estimador é consistente, se, à medida que a amostra cresce,


converge para o verdadeiro valor do parâmetro. Ou seja, quando o
tamanho da amostra vai aumentando, o viés (se existir) vai diminuindo e a
variância também. Um estimador consistente é aquele que converge para o
valor do parâmetro quando o tamanho da amostra tende a infinito.

Tendo em vista o que foi dito acima, temos que um estimador será consistente
se:

(7) ˆ ) =θ
lim E (Θ
n →∞

(8) ˆ)=0
lim var(Θ
n →∞

A média amostral é um estimador consistente da média, pois é um


estimador justo e para o qual vale

σ 2 
lim var( X ) = lim   = 0 .
n →∞ n→∞
 n 

Como

Profs. Alexandre Lima e Moraes Junior


12
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
ˆ ˆ ˆ ) ]2,
EQM (Θ) = var(Θ) + [viés (Θ

um estimador consistente possui

ˆ ) = 0.
lim EQM (Θ
n→∞

19.2.2 Critérios para Escolha dos Estimadores

Alguns critérios têm sido propostos com o objetivo de resolver o problema da


escolha do estimador adequado. Dentre eles, podemos citar os métodos da
máxima verossimilhança, dos momentos e de Bayes. Destacamos a
importância, para a prova (e também na prática), do método da máxima
verossimilhança, que será apresentado a seguir.

Estimação por Máxima Verossimilhança

Os dicionários definem o termo verossímil como aquilo que parece ser


verdadeiro ou o que tem probabilidade de ser verdadeiro ou aquilo que se
assemelha com a realidade. Neste sentido, qual seria a idéia fundamental da
estimação por verossimilhança de um parâmetro populacional? A resposta
é a seguinte: a estimação por verossimilhança fornece a estimativa que
corresponde ao valor mais provável do parâmetro.

Vejamos a seguir como a Estatística define o conceito de estimação por


máxima verossimilhança.

O método da máxima verossimilhança consiste em adotar para o


parâmetro o valor que maximize a função de verossimilhança associada ao
resultado obtido na amostra. Mas o que é a função de verossimilhança?

Definição (Método da Máxima Verossimilhança). Seja uma população


com função densidade de probabilidade caracterizada pelo parâmetro
populacional desconhecido θ. Então a distribuição de probabilidades dessa
população pode ser denotada por f ( x;θ ) . Sejam n observações independentes
X 1 , X 2 ,..., X n (ou seja, uma amostra aleatória com n elementos provenientes da
população em questão). Então a função densidade conjunta para estas
observações, também conhecida como função de verossimilhança da
amostra, é dada por

L(θ ) = f ( x1 ;θ ) × f ( x2 ;θ ) × ... × f ( xn ;θ ) .

Note que L(θ ) é função somente do parâmetro desconhecido θ. A Estimativa


de Máxima Verossimilhança (EMV) de θ é o valor θˆ que maximiza a função
L(θ ) . A raiz da equação dL(θ ) / dθ = 0 é o ponto de máximo de L(θ ) . Em muitos
casos, é mais conveniente tomar a primeira derivada da função de log-
Profs. Alexandre Lima e Moraes Junior
13
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
verossimilhança ln L(θ ) (logaritmo natural de L(θ ) ), a qual possui um máximo
no mesmo ponto θˆ que maximiza L(θ ) . Deste modo,

1 df ( x1 ;θ ) 1 df ( x2 ;θ ) 1 df ( xn ;θ )
+ + ... + =0
f ( x1 ;θ ) dθ f ( x2 ; θ ) dθ f ( xn ; θ ) dθ

A solução para a equação acima (θ em termos dos xk) é a estimativa de


máxima verossimilhança de θ.

Nota: no caso de uma variável aleatória discreta, a função de verossimilhança


L(θ ) é a probabilidade

Pθ ( X 1 = x1 , X 2 = x2 ,..., X n = xn ) .

Ou seja, L(θ ) é apenas a probabilidade de obter os valores amostrais


x1 , x2 ,..., xn . Logo, no caso discreto, a estimativa de máxima verossimilhança é
aquela que maximiza a probabilidade de ocorrência dos valores da amostra.

Exemplo. Um jogador de cassino trocou o seu dinheiro por dez fichas, das
quais θ são pretas e 10 – θ são brancas. Uma amostra de quatro fichas com
reposição é retirada do seu bolso e verifica-se que ela contém três fichas
brancas e uma ficha preta. Estime o parâmetro θ pelo método da máxima
verossimilhança.

Solução:

Devemos determinar a função de verossimilhança correspondente ao resultado


amostral obtido, a qual será dada pela probabilidade de, em uma amostra de n
= 4, obter-se exatamente uma ficha preta, dada em função do parâmetro
desconhecido θ. Tal probabilidade pode ser obtida pela aplicação da
distribuição binomial, em que a probabilidade de sucesso será p = θ / 10 , n = 4 e
x = 1. Designando por L(θ ) a função de verossimilhança, temos

1 3
 n x n −x  4  θ   θ  θ (10 − θ )3
L(θ ) =   p (1 − p ) =    1 −  =
 x  1  10   10  2.500

A Tabela a seguir mostra que o valor de máxima verossimilhança é θ = 3 . Logo,


a estimativa de máxima verossimilhança é θˆ = 3 .

θ L(θ) θ L(θ)
0 0 6 384/2.500
1 729/2.500 7 189/2.500
Profs. Alexandre Lima e Moraes Junior
14
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
2 1.024/2.500 8 64/2.500
3 1.029/2.500 9 9/2.500
4 864/2.500 10 0
5 625/2.500
_______________________________________________________

O método da máxima verossimilhança pode ser usado em situações em que


haja vários parâmetros populacionais desconhecidos θ1 ,θ 2 ,...,θ k . Em tais casos,
a função de verossimilhança é uma função dos k parâmetros desconhecidos
θ1 ,θ 2 ,...,θ k e os estimadores {Θ
ˆ } de máxima verossimilhança são encontrados
i

igualando as k derivadas parciais ∂L(θ1 ,θ 2 ,...,θ k ) / ∂θi , i = 1,2,..., k , a zero e


resolvendo o sistema resultante de equações.

Exemplo. Seja X uma variável aleatória normal com média µ e variância σ2


desconhecidas. A função de verossimilhança de uma amostra aleatória
( X 1 , X 2 ,..., X n ) é

1  x −µ  1  x −µ  1  xi − µ 
2 2 2
n
1 −  1  1 −  n  1 −  
L( µ,σ2 ) = e 2 σ 
× ... × e 2 σ 
=∏ e 2 σ 
σ 2π σ 2π i=1 σ 2π
n
∑ (x i − µ )2
1

1 2σ 2
L( µ,σ ) =
2
e i =1

(2πσ )
2 n /2

Tomando o logaritmo natural

n
n 1
ln L( µ,σ2 ) = −
2
ln(2πσ2 ) − 2

∑(x i − µ) 2
i=1

Para encontrar o ponto de máximo dessa função, devemos obter as derivadas


de ln L( , σ 2 ) em relação a µ e σ2.

Derivando em relação a µ, obtemos:

∂ ln L(µ, σ2 ) 1 n
1 n

= 2 2 ∑ ( x i − µ) = 2 ∑(x − µ)
∂µ 2σ i=1 σ i=1
i

e igualando esse último resultado a zero e resolvendo para µ, tem-se

n n n ∑x i

(σ ) ∑ ( x i − µˆ ) = 0 ⇒
2 −1
∑( x i − µˆ ) = 0 ⇒ ∑x i − nµˆ = 0 ⇒ µˆ = i=1
= X.
i=1 i=1 i=1 n

Profs. Alexandre Lima e Moraes Junior


15
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
O resultado obtido mostra que a média amostral de uma população
normal é o estimador de máxima verossimilhança da média
populacional µ.

Derivando em relação a σ2 e já incluindo o resultado acima, obtemos:

∂ ln L(µ,σ2 ) n 1 1 n
∂σ2
=− + ∑ ( x − µˆ )2 = 0
2 σˆ 2 4σˆ 2 i=1 i
n

n
∑ (x i − µˆ ) 2
− nσˆ 2 + ∑ ( xi − µˆ ) 2 = 0 ⇒ σˆ 2 = i=1

i =1 n

Portanto, o estimador de máxima verossimilhança para σ2 é viesado.

Exemplo. Suponha uma população com distribuição uniforme entre 0 e θ.


Retirou-se uma amostra aleatória de n valores dessa população com o objetivo
de estimar-se θ. Admita que xmax seja o maior valor obtido nessa amostra.
Calcule a EMV de θ.

Solução 1 (“intuitiva”):

Evidentemente que θ ≥ xmax . Logo, a estimativa “mais verossímil” (ou a EMV) é


adotar θˆ = x . max

Solução 2 (“detalhada”):

Sabe-se que θ ≥ xmax . A função densidade de probabilidade da distribuição


uniforme é f ( x) = 1 / θ para 0 ≤ x ≤ θ e f ( x) = 0 caso contrário.

A função de verossimilhança de uma amostra aleatória com n observações é

n
1 1
L(θ ) = ∏ = ,
i=1 θ θn

Cujo domínio é θ ≥ xmax , ou seja, o menor valor possível para o parâmetro θ é


θ = xmax . A figura abaixo mostra que o maior valor (máximo absoluto) de L(θ )
ocorre em θ = x . Portanto, a EMV é θˆ = x .
max max

Profs. Alexandre Lima e Moraes Junior


16
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior

Este exemplo indica que nem sempre é possível usar diretamente métodos de
cálculo para determinar o máximo de L(θ ) .

Já caiu em prova! (Analista da SUSEP/2002/ESAF) A função de


verossimilhança para uma amostra aleatória de tamanho n de uma distribuição
de probabilidades dependente de um parâmetro real θ vem dada por

exp{−mn + nθ } θ ≥ b
l (θ ) = 
 0 θ <b

onde m > 0 é a média das observações amostrais e b é a menor observação


amostral. Assinale a opção que corresponde a estimativa de máxima
verossimilhança de θ.

A) nm
B) b
C) m
D) nb
E) m/b

Resolução

A Estimativa de Máxima Verossimilhança (EMV) do parâmetro


populacional desconhecido θ é o valor θˆ que maximiza a função de
verossimilhança l (θ ) .

Podemos reescrever a função de verossimilhança l (θ ) como:

e − mn .e nθ θ ≥b
l (θ ) = 
 0 θ <b
Profs. Alexandre Lima e Moraes Junior
17
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior

1
Note que 0 < e −mn = < 1 pois m (média amostral) e n (tamanho da amostra)
e mn
são grandezas positivas. Além disso, e nθ é uma função exponencial crescente,
pois n >0. Portanto, o gráfico de l (θ ) é crescente para θ ≥ b , como ilustrado
pela Fig. a seguir.

O gráfico da função de verossimilhança não possui um máximo absoluto, pois


liml (θ ) = ∞ (a função é crescente para θ ≥ b ). O gabarito inicial era a alternativa
θ →∞

(B) ( θˆ = b ), o que é um flagrante absurdo. A questão foi anulada.

GABARITO: ANULADA

Propriedades dos Estimadores de Máxima Verossimilhança

O método da máxima verossimilhança é frequentemente o método de


estimação preferido pelos matemáticos e engenheiros, por ser geralmente fácil
de usar e produzir estimadores com boas propriedades estatísticas. Estas
propriedades estão resumidas a seguir. Ressaltamos que essa lista de
propriedades não é exaustiva. Citamos aquelas que são importantes para a
prova.

Propriedades:

1. Consistência;
2. Distribuição assintótica (*) normal.

(*) Assintótica significa “quando n é grande”.

Profs. Alexandre Lima e Moraes Junior


18
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
A propriedade (1) pode ser interpretada como se segue. Quando uma amostra
de tamanho n for grande e se Θ̂ for um estimador de máxima verossimilhança
do parâmetro θ, então:

ˆ ≈θ ) e
- (i) Θ̂ é um estimador aproximadamente não tendencioso para θ ( E[Θ]

- (ii) a variância de Θ̂ é aproximadamente tão pequena quanto a variância que


se poderia obter com qualquer outro estimador.

Sendo assim, (i) e (ii) estabelecem que o estimador de máxima


verossimilhança é aproximadamente um ENTVM. Esse é um resultado
desejável. Além disso, ele é razoavelmente fácil de se obter em muitas
situações e possui distribuição assintótica normal. Isso explica porque o
método de máxima verossimilhança é largamente utilizado na prática. Para
usar a estimação de máxima verossimilhança, observe que a distribuição da
população deve ser conhecida (ou suposta).

19.3 Estimação por Ponto

19.3.1 Estimação por Ponto da Média

O melhor estimador de que dispomos para a média µ da população é a média


da amostra X . Vimos que X é um estimador consistente de µ.

19.3.2 Estimação por Ponto da Variância

Quando conhecemos a média µ da população, devemos estimar sua variância


σ2 por meio da estatística

n n

∑ (X i − µ)2 ∑X 2
i

(9) S2 = i =1
= i =1
− µ2
n n

que será um estimador não viesado (pois acerta na média) e consistente


(sua variância decresce com o aumento do tamanho da amostra).

Quando a média µ é desconhecida, o que, em geral, ocorre na prática, a


variância populacional σ2 é estimada por meio de

∑ (X i − X )2
i =1
(10) S2 =
n −1

que é um estimador justo de σ2.

Profs. Alexandre Lima e Moraes Junior


19
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Foi visto na aula passada que var(S 2 ) = 2σ 4 /( n − 1) . Logo, S2 é um estimador
consistente de σ2, pois

2σ 4
lim var(S 2 ) = lim = 0.
n →∞ n →∞ n − 1

19.3.3 Estimação por Ponto do Desvio Padrão

Embora S2, conforme definido em (10), seja um estimador justo da variância


populacional σ2, sua raiz quadrada S não é um estimador justo do desvio
padrão populacional σ. Isto pode ser demonstrado por absurdo, pois se E(S)
= σ, resultaria que

var(S) = E(S2) – [E(S)]2 = σ2 – σ2 = 0,

o que não tem sentido.

O viés de S como estimador de σ, entretanto, tende assintoticamente a


zero. Logo, para amostras grandes, podemos, por simplificação, adotar como
estimativa o próprio desvio padrão da amostra, calculado pela raiz quadrada
da variância amostral.

19.3.4 Estimação por Ponto de uma Proporção Populacional

Se desejarmos estimar a proporção p dos elementos da população com uma


dada característica, usaremos como estimador a proporção ou freqüência
relativa p̂ com que essa característica foi observada na amostra. Tal
procedimento, além de intuitivo, corresponde a adotar um estimador justo e
consistente, pois, conforme visto na aula passada:

f 1 np
E ( pˆ ) = E   = E ( f ) = =p
n n n

p (1 − p ) p (1 − p )
var( pˆ ) = ⇒ lim var( pˆ ) = lim = 0.
n n → ∞ n → ∞ n

19.3.4 Estimação por Ponto com Base em Diversas Amostras

Sejam k amostras e um parâmetro populacional a ser estimado. Cada amostra


fornecerá uma estimativa para o parâmetro que está sendo estimado e essas
estimativas irão diferir entre si, pois correspondem a observações de variáveis
aleatórias. Entretanto, pode-se, em geral, combinar esses resultados, obtendo-
se uma estimativa única para o parâmetro em questão.

No caso de estimação da média µ ou de uma proporção p, pode-se combinar


as estimativas se todas as amostras forem provenientes de uma mesma
Profs. Alexandre Lima e Moraes Junior
20
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
população ou de populações infinitas com mesma média µ e mesma proporção
p. Ou seja, pode-se calcular a média ponderada das diversas médias e
freqüências relativas amostrais tomando como pesos de ponderação os
tamanhos das respectivas amostras. Isso equivale a fundir as diversas
amostras em uma única amostra maior, usando a média X e a freqüência p̂
fornecidas por essa amostra.

No caso da variância populacional σ2, deve-se realizar a ponderação


usando como pesos os graus de liberdade de cada amostra. Seja n1 o
tamanho da amostra 1, n2 o tamanho da amostra 2, ..., nk o tamanho da
amostra k (as amostras i, i = 1,2,...,k, possuem desvio padrão Si). Então a
estimativa combinada de σ2 será dada pela estatística

(n1 − 1) S12 + (n 2 − 1) S 22 + ... + (nk − 1) S k2


(11) S p2 = ,
n1 + n 2 + ... + n k − k

que possui n1 + n2 + ... + nk − k graus de liberdade.

Note-se que a estimativa (11) não será idêntica à que se obteria pela reunião
dos dados em uma amostra única, embora ambos os processos sejam válidos
nas condições acima mencionadas.

A estimativa (11) tem a vantagem de poder ser usada se as diversas amostras


forem provenientes de populações com médias diferentes, porém de mesma
variância σ2.

Se as amostras forem razoavelmente grandes, poderemos adotar S p como


uma boa estimativa para o desvio padrão σ.

19.4 Estimação por Intervalo

Até aqui, aprendemos como obter “boas” estimativas (isto é, justas e


consistentes) por ponto dos parâmetros populacionais. Contudo, se a
determinação do parâmetro for o principal objetivo, então a estimação por
ponto será insuficiente, uma vez que a probabilidade de a estimativa adotada
vir a coincidir com o verdadeiro valor do parâmetro é nula ou praticamente
nula. Assim, uma questão relevante aparece: quão próxima está a estimativa
do verdadeiro valor de um parâmetro? Uma outra abordagem é usar um
intervalo de confiança para expressar o grau de incerteza associado a
uma estimativa.

Uma estimativa do intervalo de confiança de um parâmetro desconhecido


θ é um intervalo da forma l ≤ θ ≤ u, em que os limites inferior l e superior u
dependem do valor numérico do estimador Θ̂ para uma amostra particular.
Como amostras distintas produzirão valores diferentes de Θ̂ e, por

Profs. Alexandre Lima e Moraes Junior


21
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
conseguinte, valores diferentes para os limites l e u, esses limites são valores
de variáveis aleatórias, como L e U, respectivamente. Somos capazes de
determinar valores de L e U, a partir da distribuição amostral de Θ̂ , de tal
forma que a seguinte afirmação probabilística seja verdadeira:

P( L ≤ θ ≤ U ) = 1 − α ,

sendo 0 < α < 1 . Assim, temos uma probabilidade igual a 1 − α de selecionar


uma amostra que produzirá um intervalo contendo o valor verdadeiro
do parâmetro θ.

O intervalo observado

l ≤θ ≤ u

é chamado de intervalo com 100(1 − α )% de confiança para o parâmetro θ.


A interpretação de um intervalo de confiança é que se um número infinito de
amostras aleatórias for coletado e um intervalo com 100(1 − α )% de confiança
para θ for calculado a partir de cada amostra, então 100(1 − α )% desses
intervalos conterão o valor verdadeiro de θ.

Na prática, obtemos somente uma amostra aleatória e calculamos uma


estimativa do intervalo de confiança. Uma vez que esse intervalo
conterá ou não o valor verdadeiro de θ, não é razoável fixar um nível
de probabilidade para essa realização. A afirmação apropriada é: o
intervalo observado [l, u] contém o valor verdadeiro de θ, com
100(1 − α )% de confiança. Essa afirmação tem uma interpretação de
freqüência; ou seja, não sabemos se a afirmação é verdadeira para essa
amostra específica, mas o método usado para obter o intervalo [l, u] resulta
em afirmações corretas em 100(1 − α )% do tempo.

19.4.1 Intervalo de Confiança para a média quando o desvio-


padrão é conhecido

Suponha que o estimador X tenha distribuição amostral normal (*). Conforme


já visto neste curso, isso ocorrerá se a população for normalmente distribuída
ou, com boa aproximação, se a amostra for suficientemente grande.

(*) A hipótese de normalidade é comumente adotada na prática. Se não a


adotássemos, o estudo ficaria tremendamente complicado.

Deve-se construir um intervalo em torno de X de forma tal que esse intervalo


contenha o valor do parâmetro com confiança 1-α. Esse intervalo é simétrico
em probabilidade, pois a distribuição amostral é normal.

Profs. Alexandre Lima e Moraes Junior


22
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
O intervalo que pretendemos construir será da forma X ± ε , em que ε = e0
denota a semi-amplitude do intervalo de confiança, conforme representado
pela figura a seguir (distribuição amostral de X ). Necessitamos apenas
determinar ε de modo tal que esse intervalo tenha nível de confiança 1-α.
Para tanto, imagine, na distribuição de X , dois pontos, −ε e +ε ,
simétricos em relação à média µ da distribuição, de tal modo que a
probabilidade de X situar-se entre esses dois pontos seja igual a 1-α. Logo,

(12) P( − ε ≤ X ≤ + ε ) = 1 − α.

A desigualdade (12) implica

−ε ≤ X e X≤ +ε ⇒ ≤ X +ε e X −ε ≤ µ

⇒ P( X − ε ≤ ≤ X + ε ) = 1 − α.

Portanto, X − ε e X + ε são os limites do intervalo de confiança simétrico em


probabilidade desejado. A determinação da semi-amplitude ε do intervalo de
confiança envolve a utilização da variável normal padronizada. Observe que

( +ε) −
= zα / 2 ,
σ/ n

σ
(13) ε = zα / 2 .
n

Portanto, a expressão do intervalo de confiança para a média µ da população,


ao nível de confiança 1-α, é dada por

σ
(14) X ± zα / 2 .
n

Profs. Alexandre Lima e Moraes Junior


23
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior

Finalmente, tem-se que

σ σ
(15) P ( X − zα / 2 ≤ ≤ X + zα / 2 ) = 1 − α.
n n

Exemplo. Considere uma amostra de 41 observações provenientes de uma


população normal com variância igual a 4,0, cuja média amostral é 40.
Construa um intervalo de 95% de confiança para a média dessa população.

Solução:

1 − α = 0,95 ⇒ α / 2 = 0,025 . A tabela da normal indica que o valor z = 1,96


corresponde à probabilidade (0,5 – 0,025) = 0,4750. Logo,

σ 2,0
ε = zα / 2 = 1,96 = 0,6122
n 41

e o intervalo de confiança será 40 ± 0,6122 , indicando que 39,3878 ≤ ≤ 40,6122


com 95% de confiança.

19.4.2 Intervalo de confiança para a média quando o desvio-


padrão é desconhecido

Quando desconhecemos o desvio padrão populacional σ, devemos estimar seu


valor por meio de

∑ (X i − X )2
i =1
S= .
n −1

Não é correto obter o intervalo de confiança para µ, ao nível de confiança 1-α,


substituindo-se σ por S na expressão (13). Observe que o uso de S em (13)
aumenta a incerteza da estimativa por intervalo, diminuindo, deste modo, o
valor do nível de confiança, que já não seria (1-α), mas sim (1-α’) < (1-α).
Como podemos resolver este problema?

Vimos que as distribuições t de Student e normal padrão estão relacionadas


pela fórmula

σ
tn −1,α / 2 = zα / 2 .
S

Sendo assim, podemos reescrever (14) como

Profs. Alexandre Lima e Moraes Junior


24
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
σ S S
(16) X ± zα / 2 = X ± t n −1,α / 2
S n n

A Eq. (16) mostra que o uso do desvio padrão amostral S na expressão do


intervalo de confiança da média populacional impõe o uso de t n −1,α / 2 no lugar de
zα / 2 . Observe que (t n −1,α / 2 / zα / 2 ) > 1 (por exemplo, t30, 2,5% = 2,0423 > z2,5% = 1,96 ). Desta
maneira, t n −1,α / 2 funciona como um fator de correção para maior da amplitude
do intervalo de confiança, quando usamos S em vez de σ.

Exemplo. Considere uma amostra de 41 observações, provenientes de uma


população normal com média e variância desconhecidas, em que X = 40 e S =
2,0. Construa um intervalo de 95% de confiança para a média dessa
população.

Solução:

tn −1,α / 2 = t40, 2,5% = 2,0211 (vide tabela auxiliar). Logo,

S 2
ε = t n−1,α / 2 = 2,0211 × = 0,6313 (maior que o obtido no exemplo anterior!)
n 41

e o intervalo de confiança será 40 ± 0,6313 , indicando que 39,3687 ≤ ≤ 40,6313


com 95% de confiança.

19.4.3 Intervalo de confiança para a variância

Considere, na distribuição χ n2−1 , os dois particulares valores χ n2−1,1−α / 2 (qui-


quadrado inferior) e χ 2n−1,α / 2 (qui-quadrado superior), conforme ilustrado pela
figura abaixo.

Profs. Alexandre Lima e Moraes Junior


25
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior

Sabemos que os valores χ n2−1,1−α / 2 e χ 2n−1,α / 2 são tais que

(17) P( χ n2−1,1−α / 2 ≤ χ n2−1 ≤ χ n2−1,α / 2 ) = 1 − α .

Na aula anterior, vimos que

σ2
S2 = χ n2−1
n −1

o que nos permite escrever as desigualdades entre parênteses de (17) como

(n − 1) S 2
χ n2−1,1−α / 2 ≤ ≤ χ n2−1,α / 2 .
σ 2

Vamos dividir todos os membros da expressão acima por (n − 1) S 2 , e, após,


tomar os inversos. Invertendo as desigualdades, obtemos

(n − 1) S 2 (n − 1) S 2
(18) ≤σ 2 ≤
χ n2−1,α / 2 χ n2−1,1−α / 2

que é o intervalo de confiança para σ2, ao nível de 1 - α.

A Eq. (18) pode ser reescrita na forma

Profs. Alexandre Lima e Moraes Junior


26
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
n n

∑(X i − X )2 ∑(X i − X )2
(19) i =1
≤σ 2 ≤ i =1
χ 2
n −1,α / 2 χ n2−1,1−α / 2

Exemplo. Uma amostra de onze elementos, extraída de uma população


normal, forneceu variância S2 = 7,08. Determine o intervalo de 90% de
confiança para a variância da população.

Solução:

Entrando na tabela da distribuição χ2 com 10 graus de liberdade, obtemos:

χ n2−1,1−α / 2 = χ102 ,95% = 3,94,


χ n2−1,α / 2 = χ102 ,5% = 18,3.

Logo,

(n − 1) S 2 (n − 1) S 2 10 × 7,08 10 × 7,08
≤σ 2 ≤ ⇒ ≤σ 2 ≤ ⇒ 3,8689 ≤ σ 2 ≤ 17,9695
χ 2
n −1,α / 2 χ 2
n −1,1−α / 2 18,3 3,94

Logo, 3,8689 ≤ σ 2 ≤ 17,9695 com 90% de confiança.

19.4.4 Intervalo de confiança para o desvio-padrão

De (18) decorre, com confiança 1-α, que

(n − 1) S 2 (n − 1) S 2
(20) ≤σ ≤
χ n2−1,α / 2 χ n2−1,1−α / 2

19.4.5 Intervalo de Confiança para uma proporção populacional

Vimos na aula passada que uma freqüência relativa amostral p̂ apresenta uma
distribuição binomial, cuja média é o próprio parâmetro populacional p e cuja
variância é dada por p (1 − p) / n . Sendo np ≥ 5 e n(1 − p ) ≥ 5 , aprendemos que é
possível aproximar a binomial pela normal. Como p é desconhecido,
adotaremos como condições de aproximação npˆ ≥ 5 e n(1 − pˆ ) ≥ 5 .

Sendo a amostra suficientemente grande, o intervalo de confiança para p será


da forma p̂ ± ε e, por um raciocínio análogo àquele desenvolvido para a
estimação de µ, chega-se a

p(1 − p)
(21) ε = zα / 2 .
n
Profs. Alexandre Lima e Moraes Junior
27
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior

A expressão (21) tem um problema: não conhecemos o valor de p. Para


amostras suficientemente grandes, pode-se aproximar (21) por

pˆ (1 − pˆ )
(22) ε = zα / 2 .
n

Então o intervalo de confiança para p, ao nível de confiança 1 − α , é dado por

pˆ (1 − pˆ )
(23) pˆ ± zα / 2 .
n

Exemplo. Retirou-se uma amostra de 1.000 peças de uma linha de produção


e verificou-se que 35 eram defeituosas. Estime o intervalo de confiança ao
nível de 95% da proporção de peças defeituosas fornecidas pela linha de
produção.

Solução:

n = 1.000
pˆ = f / n = 35 / 1.000 = 0,035
zα / 2 = z 2,5% = 1,96

Logo,

pˆ (1 − pˆ ) 0,035(1 − 0,035)
ε = zα / 2 = 1,96 × = 0,0114
n 1.000

0,035 − 0,0114 ≤ p ≤ 0,035 + 0,0114 ⇒ 0,0236 ≤ p ≤ 0,0464 com 95% de confiança.

Já caiu em prova! (ICMS-RJ/2010/FGV). Para estimar a proporção p de


pessoas acometidas por uma certa gripe numa população, uma amostra
aleatória simples de 1600 pessoas foi observada e constatou-se que, dessas
pessoas, 160 estavam com a gripe.

Um intervalo aproximado de 95% de confiança para p será dado por:

A) (0,066, 0,134).
B) (0,085, 0,115).
C) (0,058, 0,142).
D) (0,091, 0,109).
E) (0,034, 0,166).

Resolução
Profs. Alexandre Lima e Moraes Junior
28
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior

A freqüência relativa amostral p̂ apresenta uma distribuição binomial, cuja


média p e variância p (1 − p) / n . Sendo np ≥ 5 e n(1 − p ) ≥ 5 , é possível aproximar a
binomial pela normal. Como p é desconhecido, adotamos como condições de
aproximação np' = 1600 × 0,1 = 160 > 5 e n(1 − p') = 1600 × 0,9 = 1440 > 5 .

Como a amostra é suficientemente grande, o intervalo de confiança para p


será da forma p̂ ± ε , em que ε é dado por

pˆ (1 − pˆ ) 0,1 × 0,9
e0 = z 2,5% = 1,96 × ≈ 0,015 .
n 1600

Logo, pˆ + ε = 0,1 + 0,015 ≈ 0,115 e pˆ − ε = 0,1 − 0,015 ≈ 0,085 .

⇒ IC = (0,085, 0,115).

GABARITO: B

19.5 Tamanho das Amostras

Vimos que ε = zα / 2σ / n (semi-amplitude do intervalo de confiança para a


média populacional quando o desvio padrão populacional é conhecido). Segue-
se que

2
z σ
(24) n =  α /2  .
 ε 

A Eq. (24) será usada para determinar o tamanho da amostra necessária


para estimar a média populacional quando σ for conhecido.

Se não conhecemos o desvio padrão da população, devemos primeiramente


coletar uma amostra piloto de n’ elementos para, com base nela, obtermos
uma estimativa do desvio padrão amostral S. Em seguida, empregamos a
expressão

2
t S 
(25) n =  n '−1,α / 2 
 ε 

obtida por meio das substituições de zα / 2 por t n '−1,α / 2 e de σ por S em (24). Se


n’ ≤ n, a amostra piloto já terá sido suficiente para a estimação. Caso
contrário, devemos retirar, ainda, da população, os elementos necessários à
complementação do tamanho mínimo da amostra.

Profs. Alexandre Lima e Moraes Junior


29
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Já caiu em prova! (ICMS-RJ/2010/FGV). Suponha que os salários dos
trabalhadores numa certa região sejam descritos por uma variável
populacional com média desconhecida e desvio padrão igual a R$200,00. Para
se garantir, com 95% de probabilidade, que o valor da média amostral dos
salários não diferirá do valor da média populacional por mais de R$10,00, a
amostra aleatória simples deverá ter no mínimo, aproximadamente, o seguinte
tamanho:

A) 3.568.
B) 3.402.
C) 2.489.
D) 2.356.
E) 1.537.

Resolução

Dados: X − = 10 , 1 − α = 95% e σ = 200 .

X− X− 10 10
= zα / 2 ∴ = z 2,5% ∴ = 1,96∴ ≈ 2∴ n ≈ 1.600
σ/ n σ/ n 200 / n 200 / n

O valor mais próximo é o da opção E.

Nota: não é correto dizer que o valor da média amostral dos salários não
diferirá do valor da média populacional por mais de R$10,00 com 95% de
probabilidade, dado que a amostra tenha um tamanho mínimo de 1.537
elementos. A afirmação correta seria: o valor da média amostral dos salários
não diferirá do valor da média populacional por mais de R$10,00 com 95% de
confiança, dado que a amostra tenha um tamanho mínimo de 1.537
elementos. Na prática, obtemos somente uma amostra aleatória e calculamos
uma estimativa do intervalo de confiança. Uma vez que esse intervalo conterá
ou não o valor verdadeiro do parâmetro populacional µ, não é razoável fixar
um nível de probabilidade para essa realização. A afirmação apropriada é: o
intervalo observado [l, u] contém o valor verdadeiro do parâmetro µ, com
100(1 − α )% de confiança. Essa afirmação tem uma interpretação de freqüência;
ou seja, não sabemos se a afirmação é verdadeira para essa amostra
específica, mas o método usado para obter o intervalo [l, u] resulta em
afirmações corretas em 100(1 − α )% do tempo.

GABARITO: E

O tamanho da amostra necessária para estimar uma proporção


populacional p vem da expressão (22) e é dado por

Profs. Alexandre Lima e Moraes Junior


30
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
2
z 
(26) n =  α / 2  p (1 − p ) .
 ε 

Não temos como calcular n por meio de (26), pois p é desconhecido. Como
podemos resolver este problema? Se pararmos para refletir um pouco sobre o
assunto, veremos que existem pelo menos duas saídas. A primeira é a
seguinte: para amostras suficientemente grandes, sabemos que pˆ ≈ p , haja
vista que p̂ é um estimador justo de p, e podemos utilizar a aproximação

2
z 
(27) n ≈  α / 2  pˆ (1 − pˆ ) .
 ε 

Também podemos obter um valor limitante superior para n a partir de (26), e


esta seria a segunda solução para o problema da estimação do n. Note que a
função quadrática (parábola) p(1-p) que aparece em (26) tem o seu ponto de
máximo em p =1/2. Se substituirmos p(1-p) pelo seu valor máximo, que é
1/4, o tamanho da amostra obtido será suficiente para a estimação, qualquer
que seja o p. Sendo assim, obtemos

2 2
 z  1 zα / 2
n ≤  α /2  = 2 ou
 ε  4 4ε

zα2 / 2
(28) nmax = ,
4ε 2

em que nmax denota o valor limitante superior de n.

Já caiu em prova! (Analista da SUSEP/Atuária/2010/ESAF). Deseja-se


estimar a proporção p de pessoas com determinada característica em uma
população. Um levantamento preliminar forneceu pˆ = 2 / 7 . Usando essa
estimativa, obtenha o menor tamanho de amostra aleatória simples necessária
para estimar p com um intervalo de 95% de confiança e um erro de
amostragem z pˆ qˆ / n ≤ 2% , onde qˆ = 1 − pˆ .

A) 7840
B) 2500
C) 1960
D) 9604
E) 2401

Resolução

Profs. Alexandre Lima e Moraes Junior


31
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Aprendemos na exposição teórica que a semi-amplitude do intervalo de
confiança para a proporção é dada por ε = zα / 2 pˆ qˆ / n . O examinador especificou
que a relação z pˆ qˆ / n ≤ 2% deve ser obedecida, a fim de que p seja estimado
com um intervalo de 95% de confiança e um erro de amostragem ε menor ou
igual a 0,02. “Moral da história”: a banca forneceu a fórmula a ser utilizada na
solução da questão! De vez em quando isso acontece.

Isolemos a incógnita n na fórmula dada:

2
1/ 2
 pˆ qˆ  2   pˆ qˆ 1/ 2   2  2 2 p
ˆ qˆ   4 
z ≤ ⇒  z   ≤ 2  ⇒ z  ≤ 4  ⇒
 n  100   n    10   n   10 
10 4 z 2 pˆ qˆ 10 4 z 2 pˆ qˆ
10 z pq ≤ 4n ⇒
4 2
ˆ ˆ ≤ n ⇒n ≥
4 4

Então o valor limitante inferior para n, denotado por nmin, é dado por

10 4 z 2 pˆ qˆ
nmin = .
4

Substituindo os valores pˆ = 2 / 7 , qˆ = 1 − pˆ = 5 / 7 e z = 1,96 (pois α=5%) na


expressão acima, obtemos

10 4 × 1,96 2 2 5
nmin = × × ,
4 7 7

utilizando as aproximações 1,96 ≅ 2 e 49 ≅ 50, chegamos ao valor aproximado

10 4 × 2 × 5 10.000
nmin ≈ = = 2.000 .
50 5

A opção C nos dá o valor mais próximo (1.960). Se você fizer as contas com a
calculadora obterá o valor exato de 1.960.

GABARITO: C

19.6 Memorize para a prova

- Um estimador (ou estatística) é qualquer função das observações de


uma amostra.

- Uma estimativa corresponde a um valor numérico assumido por um


estimador.

Profs. Alexandre Lima e Moraes Junior


32
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
- Um estimador Θ̂ é justo ou não viesado se o seu valor esperado for
igual ao valor do parâmetro θ que se pretende estimar, isto é, se

ˆ ) = θ.
E (Θ

- Um estimador é consistente, se, à medida que a amostra cresce,


converge para o verdadeiro valor do parâmetro:

ˆ ) =θ
lim E (Θ e ˆ)=0
lim var(Θ
n →∞ n →∞

- O melhor estimador para a média µ da população é a média da amostra


X , pois X é um estimador justo e consistente de µ.

- Se a média µ da população for conhecida, devemos estimar sua variância


σ2 por meio da estatística

n n

∑ ( X i − µ) 2 ∑X 2
i

S2 = i=1
= i=1
− µ2 ,
n n

que será um estimador justo e consistente.

- Se a média µ for desconhecida, a variância populacional σ2 deverá ser


estimada por meio de

∑( X i − X )2
S2 = i=1
,
n −1

que é um estimador justo e consistente de σ2.

- O estimador da variância populacional definido por

∑( X i − X )2
σˆ 2 = i=1
n

é viesado.

- O EQM é a média do quadrado da diferença entre o estimador e o


valor do parâmetro:

ˆ − θ ) 2 ] = var(Θ)
ˆ ) = E[(Θ
EQM (Θ ˆ ) ]2.
ˆ + [viés (Θ

Profs. Alexandre Lima e Moraes Junior


33
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
A relação acima mostra que o EQM tem dois componentes: o estimador erra o
valor do parâmetro em função da sua dispersão (variância) e ainda, quando for
o caso, pelo fato de não acertar na média (ser viesado).

- Seja a amostra aleatória X 1 , X 2 ,..., X n . Então a função densidade conjunta para


estas observações, também conhecida como função de verossimilhança da
amostra, é dada por

L(θ ) = f ( x1 ;θ ) × f ( x2 ;θ ) × ... × f ( xn ;θ ) .

- A função de verossimilhança para X 1 , X 2 ,..., X n discretas é a probabilidade

Pθ ( X 1 = x1 , X 2 = x2 ,..., X n = xn ) .

- A Estimativa de Máxima Verossimilhança (EMV) de θ é o valor θˆ que


maximiza a função L(θ ) .

- A média amostral de uma população normal é o estimador de máxima


verossimilhança da média populacional µ.

- A estatística S não é um estimador justo do desvio padrão


populacional σ. O viés de S, entretanto, tende assintoticamente a zero.

- A freqüência relativa p̂ é um estimador justo e consistente da


proporção p dos elementos da população com uma dada característica.

- Um intervalo de confiança expressa o grau de incerteza associado a uma


estimativa.

- O intervalo de confiança para a média quando o desvio-padrão


populacional é conhecido, no nível de confiança 1-α, é dado por

σ σ
X − zα / 2 ≤ ≤ X + zα / 2 .
n n

Obs.: z = 1,96 para (1-α) = 0,95 = 95%.

- - O intervalo de confiança para a média quando o desvio-padrão


populacional é desconhecido, no nível de confiança 1-α, é dado por

S S
X − t n −1,α / 2 ≤ µ ≤ X + t n −1,α / 2 .
n n

- O intervalo de confiança para σ2, ao nível de 1-α, é dado por

Profs. Alexandre Lima e Moraes Junior


34
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
(n − 1) S 2 (n − 1) S 2
≤ σ 2
≤ ,
2
χ n−1,α / 2
2
χ n−1,1−α / 2

ou pela fórmula equivalente

n n

∑(X i − X )2 ∑(X i − X )2
i =1
≤σ2 ≤ i =1
.
χ 2
n −1,α / 2 χ n2−1,1−α / 2

- O intervalo de confiança para p, ao nível de confiança 1 − α , é dado por

pˆ (1 − pˆ ) pˆ (1 − pˆ )
pˆ − zα / 2 ≤ p ≤ pˆ + zα / 2 .
n n

- Tamanho da amostra para estimar a média populacional µ quando σ é


conhecido:

2
z σ
n =  α /2  .
 ε 

- Tamanho da amostra para estimar a proporção populacional p:

zα2 / 2
n≈ .
4ε 2

19.7 Exercícios de Fixação

1. (ICMS-RJ/2009/FGV) Para examinar a opinião de uma população sobre


uma proposta, foi montada uma pesquisa de opinião em que foram ouvidas
1680 pessoas, das quais 51,3% se declararam favoráveis à proposta.

Os analistas responsáveis determinaram que a margem de erro desse


resultado, em um determinado nível de confiança, era de 2 pontos
percentuais, para mais ou para menos.

Considerando que fosse desejada uma margem de erro de 1 ponto percentual,


para mais ou para menos, no mesmo nível de confiança, assinale a alternativa
que indique o número de pessoas que deveriam ser ouvidas.

A) 840
B) 2520
C) 3360
D) 5040

Profs. Alexandre Lima e Moraes Junior


35
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
E) 6720

2. (ICMS-RJ/2008/FGV) Considere uma Amostra Aleatória Simples de n


unidades extraídas de uma população na qual a característica, X, estudada tem
distribuição Normal com média µ e variância σ2, ambas desconhecidas, mas
1 n
finitas. Considere, ainda, as estatísticas média da amostra, X = ∑ X i , e
n i =1
n
1
variância da amostra S 2 = ∑ ( X i − X ) 2 . Então, é correto afirmar que:
n i =1

A) X e S 2 são, ambos, não tendenciosos para a estimação da média e da


variância da população, respectivamente.
B) X é não tendencioso, mas S 2 é tendencioso para a estimação da média e
da variância da população, respectivamente.
C) X é tendencioso, mas S 2 é não tendencioso para a estimação da média e
da variância da população, respectivamente
D) X e S 2 são, ambos, tendenciosos para a estimação da média e da variância
da população, respectivamente.
E) X e S 2 são, ambos, não tendenciosos para a estimação da média e da
variância da população, mas apenas X é consistente.

3. (ICMS-RJ/2007/FGV) Uma pesquisa recente foi realizada para avaliar o


percentual da população favorável à eleição de um determinado ponto turístico
para constar no selo comemorativo de aniversário da cidade. Para isso,
selecionou-se uma amostra aleatória simples extraída de uma população
infinita. O resultado apurou 50% de intenção de votos para esse ponto
turístico.

Considerando que a margem de erro foi de 2 pontos percentuais, para mais ou


para menos, e que o nível de confiança utilizado foi de 95%, foram ouvidas,
aproximadamente:

A) 50 pessoas
B) 2.400 pessoas
C) 1.200 pessoas
D) 100 pessoas
E) 4.800 pessoas

4. (Estatística/IBGE/2010/CESGRANRIO) Para que o erro padrão da


média amostral X seja reduzido à metade, deve-se

A) multiplicar o tamanho da amostra por 2.


B) multiplicar o tamanho da amostra por 4.
Profs. Alexandre Lima e Moraes Junior
36
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
C) multiplicar o tamanho da amostra por 16.
D) dividir o tamanho da amostra por 2.
E) dividir o tamanho da amostra por 4.

5. (Analista Técnico/SUSEP/2001/ESAF) Os itens 2,30; 4,11; 5,20; 6,30;


7,20 formam uma ordenação de uma amostra aleatória de tamanho 5 da
distribuição uniforme no intervalo [0,θ] sendo θ>0. Assinale a opção que
corresponde à estimativa de máxima verossimilhança de θ.

A) 5,20
B) 5,02
C) 7,20
D) 5,00
E) 8,00

6. (Analista Técnico/SUSEP/2001/ESAF) Tem-se duas amostras


independentes ambas de tamanho 21 de duas populações normais com a
mesma variância σ2 > 0. Deseja-se construir um intervalo de confiança para
σ2, no nível de 95%, com base numa estimativa combinada das variâncias
amostrais s12 = 0,4 e s22 = 0,6 . Se 0< a < b são duas constantes tais que P{X<a}
= 0,025 e P{X>b} = 0,025, onde X tem distribuição qui-quadrado, assinale a
resposta que corresponde ao intervalo procurado e ao número de graus de
liberdade da distribuição de X.

A) [17/b; 17/a] e 20 graus de liberdade


B) [5/3b; 5/2a] e 40 graus de liberdade
C) [17/b; 17/a] e 41 graus de liberdade
D) [20/b; 20/a] e 40 graus de liberdade
E) [5/3b; 5/2a] e 20 graus de liberdade

7. (Analista Técnico/SUSEP/2002/ESAF) Seja X uma variável aleatória


com valor esperado µ e desvio padrão σ>0. Pode-se afirmar que

A) pelo menos 75% das realizações de X pertencerão ao intervalo [µ-2σ;µ+2σ]


B) pelo menos 80% das realizações de X pertencerão ao intervalo [µ-2σ;µ+2σ]
C) pelo menos 90% das realizações de X pertencerão ao intervalo [µ-2σ;µ+2σ]
D) pelo menos 95% das realizações de X pertencerão ao intervalo [µ-2σ;µ+2σ]
E) apenas com o conhecimento de µ e σ não é possível fazer afirmação sobre o
percentual de realizações de X que cairão no intervalo [µ-2σ;µ+2σ].

Profs. Alexandre Lima e Moraes Junior


37
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
8. (Analista/Área 3/BACEN/2006/FCC) Os preços de um determinado
produto vendido no mercado têm uma distribuição normal com desvio padrão
populacional de R$ 20,00. Por meio de pesquisa realizada com uma amostra
aleatória de tamanho 100, com um determinado nível de confiança, apurou-se,
para a média destes preços, um intervalo de confiança sendo [R$ 61,08 ; R$
68,92]. A mesma média amostral foi obtida quadruplicando o tamanho da
amostra anterior e utilizando também o mesmo nível de confiança. Nos dois
casos considerou-se infinito o tamanho da população. O novo intervalo de
confiança encontrado no segundo caso foi

A) [R$ 63,04 ; R$ 66,96]


B) [R$ 62,06 ; R$ 67,94]
C) [R$ 61,57 ; R$ 68,43]
D) [R$ 61,33 ; R$ 68,67]
E) [R$ 61,20 ; R$ 68,80]

iid
9. (Estat./IBGE/2010/CESGRANRIO) Sejam X 1 , X 2 ,..., X n ~ N ( ;σ 2 ) e
considerados dois estimadores para σ2

1 n 1 n
T1= ∑ (X − X )2 e
n −1 i =1 i
T 2= ∑ (X i − X ) 2 .
n i =1

Observe as afirmativas a seguir a respeito desses estimadores.

I – T1 é não tendencioso.
2 2(n − 1) 4
II – O erro médio quadrático de T1 é σ 4 , enquanto que o de T2 é σ .
n −1 n2
 σ2 
III – A tendência de T2 =  −  .
 n 

É (São) correta(s) a(s) afirmativa(s)

A) I apenas.
B) I e II, apenas.
C) I e III, apenas.
D) II e III, apenas.
E) I, II e III.

10. (Estatística/IBGE/2010/CESGRANRIO) Considere uma amostragem


aleatória simples, sem reposição, de uma população de tamanho muito
grande. Qual o tamanho aproximado de amostra que permite estimar a média

Profs. Alexandre Lima e Moraes Junior


38
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
de uma variável y, cujo desvio padrão populacional é igual a 5, com margem
de erro 0,1, a um nível de confiança 95%?

A) 100
B) 400
C) 1.000
D) 4.000
E) 10.000

11. (Estatística/IBGE/2010/CESGRANRIO) Para avaliar a taxa de


desemprego em uma determinada localidade, selecionou-se uma amostra
aleatória de 900 indivíduos em idade produtiva. O resultado dessa amostra
revelou que o número de desempregados era de 36%. O intervalo de 95% de
confiança para a proporção de desempregados, nessa localidade, é

A) 36% ± 0,1%
B) 36% ± 2,6%
C) 36% ± 3,1%
D) 36% ± 3,7%
E) 36% ± 4,1%

12. (Analista/Área 2/BACEN/2010/CESGRANRIO) Em um estudo sobre a


economia informal de uma cidade, deseja-se determinar uma amostra para
estimar o rendimento médio dessa população, com um grau de confiança de
95% de que a média da amostra aleatória extraída não difira de mais de R$
50,00 da média do rendimento dessa população, cujo desvio padrão é R$
1,96
400,00. Sabendo-se que z ~ N[0,1] e que ∫
0
f ( z )dz = 0,4750 , onde f(z) é a
função de densidade de probabilidade de z, pode-se concluir que o número de
pessoas da amostra será

A) 321
B) 308
C) 296
D) 271
E) 246

(Analista Ministerial/Estatística/MPE-PE/2006/FCC) Instruções


(adaptadas): Para responder às questões de números 13 e 14, considere as
tabelas a seguir.

Profs. Alexandre Lima e Moraes Junior


39
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Elas fornecem alguns valores da função de distribuição F(x). A tabela 1 refere-
se à variável normal padrão, as tabelas 2 e 3 referem-se à variável t de
Student com 15 e 16 graus de liberdade, respectivamente:

Tabela 1 Tabela 2 Tabela 3


x F(x) x F(x) x F(x)
1,60 0,945 1,753 0,95 1,746 0,95
1,64 0,950 2,248 0,98 2,235 0,98
2,00 0,977 2,583 0,99 2,567 0,99

13. Um engenheiro encarregado do controle de qualidade deseja estimar a


proporção p de lâmpadas defeituosas de um lote, com base numa amostra de
tamanho 400. Sabe-se, com base em experiâncias anteriores, que p deve
estar próximo de 0,5. Usando o teorema central do limite para estimar a
amplitude do intervalo de confiança de 90% para p, podemos afirmar que tal
amplitude é, aproximadamente, igual a

A) 0,041
B) 0,045
C) 0,058
D) 0,070
E) 0,082

14. Supondo-se que a porcentagem da receita investida em educação, dos 600


municípios de uma região, tem distribuição normal com média µ, deseja-se
estimar essa média. Para tanto se sorteou dentre esses 600, aleatoriamente e
com reposição, 16 municípios e se observou os porcentuais investidos por eles
em educação. Os resultados indicaram uma média amostral de 8% e desvio
padrão amostral igual a 2%. Um intervalo de confiança para µ, com coeficiente
de confiança de 96%, é dado por

A) (8 ± 1,124)%
B) (8 ± 1,117)%
C) (8 ± 0,877)%
D) (8 ± 0,870)%
E) (8 ± 0,755)%

15. (Analista Ministerial/Estatística/MPE-PE/2006/FCC) Seja X uma


variável aleatória assumindo os valores -2 e 2, com probabilidade 1/4 e 3/4,
respectivamente. Seja µ a média de X. Então o limite superior de P[|X - µ| ≥
12 ], obtido pela desigualdade de Tchebysheff, é dado por

A) 0,40
B) 0,25
Profs. Alexandre Lima e Moraes Junior
40
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
C) 0,20
D) 0,12
E) 0,10

(ANPEC/2009/Adaptada) Verifique se as afirmativas 16 a 20 são


verdadeiras:

16. Em uma pesquisa de opinião a proporção de pessoas favoráveis a uma


determinada medida governamental é dada por pˆ = ∑ X i / n . O menor valor de
n para o qual a desigualdade de Chebyshev resultará em uma garantia de que
P(| pˆ − p |≥ 0,01) ≤ 0,01 é 200.000.

17. Quando o número de graus de liberdade δ cresce, a distribuição χδ2


aproxima-se de uma distribuição normal com média δ e desvio padrão 2δ.

18. Um intervalo de confiança de 99% para a média µ de uma população,


calculado para uma amostra aleatória, como [2,75; 8,25], pode ser
interpretado como: a probabilidade de µ estar no intervalo calculado é de 99%.

19. Seja X 1 , X 2 ,..., X n uma amostra aleatória simples proveniente de uma


população com distribuição de Pareto cuja função densidade é dada por
f ( x) = θ (1 + x) − (θ +1) , 0 < x < ∞ , θ > 1 . Então o estimador de máxima verossimilhança
n
para θ é .
∑ log(1 + xi )
20. Se existe, todo estimador de máxima verossimilhança calculado para uma
amostra aleatória possui distribuição Normal em grandes amostras.

19.7 Gabarito

1–E
2–B
3-B
4-B
5–C
6-D
7-A
8-A
9–E
10 – E
11 – C
12 - E
13 - E
14 – A
15 – B
Profs. Alexandre Lima e Moraes Junior
41
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
16 – FALSA
17 – FALSA
18 – FALSA
19 – VERDADEIRA
20 - VERDADEIRA

19.8 Resolução dos Exercícios de Fixação

1. (ICMS-RJ/2009/FGV) Para examinar a opinião de uma população sobre


uma proposta, foi montada uma pesquisa de opinião em que foram ouvidas
1680 pessoas, das quais 51,3% se declararam favoráveis à proposta.

Os analistas responsáveis determinaram que a margem de erro desse


resultado, em um determinado nível de confiança, era de 2 pontos
percentuais, para mais ou para menos.

Considerando que fosse desejada uma margem de erro de 1 ponto percentual,


para mais ou para menos, no mesmo nível de confiança, assinale a alternativa
que indique o número de pessoas que deveriam ser ouvidas.

A) 840
B) 2520
C) 3360
D) 5040
E) 6720

Resolução

Dados: p' = 0,513 , n = 1.680, e0 = 0,02 e e0 ' = 0,01 .


Qual é o valor de n’ (novo número de pessoas que deveriam ser ouvidas)
correspondente a e0 ' = 0,01 ?

Sabemos que

p' (1 − p' )
e0 = zα / 2 .
n

Conhecendo zα / 2 (não foi fornecido) é possível calcular n’ por meio de

2
z 
n' =  α / 2  p ' (1 − p ' ) .
 e0 ' 

Cálculo de zα / 2 :

Profs. Alexandre Lima e Moraes Junior


42
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
0,513(1 − 0,513)
0,02 = zα / 2 ⇒ zα / 2 = 1,6401.
1680

Cálculo de n’:

2
 1,6401 
n' =   0,513(1 − 0,513) ≈ 6720,22 ⇒ alternativa (E)
 0,01 

Nota: como a estimativa p’ = 0,513 indica que p está próxima de 50%, temos
a alternativa de usar a fórmula aproximada

2 2
 z   1,6401 
n' =  α / 2  =   ≈ 6.725 ⇒ valor mais próximo é a alternativa (E).
 2e0 '   2 × 0,01 

GABARITO: E

2. (ICMS-RJ/2008/FGV) Considere uma Amostra Aleatória Simples de n


unidades extraídas de uma população na qual a característica, X, estudada tem
distribuição Normal com média µ e variância σ2, ambas desconhecidas, mas
1 n
finitas. Considere, ainda, as estatísticas média da amostra, X = ∑ X i , e
n i =1
n
1
variância da amostra S 2 = ∑ ( X i − X ) 2 . Então, é correto afirmar que:
n i =1

A) X e S 2 são, ambos, não tendenciosos para a estimação da média e da


variância da população, respectivamente.
B) X é não tendencioso, mas S 2 é tendencioso para a estimação da média e
da variância da população, respectivamente.
C) X é tendencioso, mas S 2 é não tendencioso para a estimação da média e
da variância da população, respectivamente
D) X e S 2 são, ambos, tendenciosos para a estimação da média e da variância
da população, respectivamente.
E) X e S 2 são, ambos, não tendenciosos para a estimação da média e da
variância da população, mas apenas X é consistente.

Resolução

Antes de analisarmos as alternativas lembre que

• X é um estimador justo (não tendencioso) e consistente da


média populacional µ;

Profs. Alexandre Lima e Moraes Junior


43
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
• se definirmos o estimador da variância populacional σ2 por meio da
1 n
fórmula ∑ ( X i − X ) 2 , então esse estimador é tendencioso, porém
n i =1
consistente (vide resolução do exercício 7) e
• se definirmos o estimador da variância populacional σ2 por meio da
1 n
fórmula ∑
n − 1 i =1
( X i − X ) 2 , então esse estimador é não tendencioso

e consistente (vide resolução do exercício 7).

Atenção: o estimador S 2 do enunciado desta questão corresponde ao


estimador viesado σˆ 2 da exposição teórica. Eu usei na exposição teórica o
símbolo S 2 para denotar o estimador justo da variância populacional. Não se
confunda!

Análise das alternativas:

(A) Somente X é não tendencioso ⇒ INCORRETA.

(B) X é não tendencioso e S 2 é tendencioso ⇒ CORRETA.

(C) X é não tendencioso e S 2 é tendencioso ⇒ INCORRETA.

(D) Somente S 2 é tendencioso ⇒ INCORRETA.

(E) Somente X é não tendencioso. Além disso, S 2 também é consistente ⇒


INCORRETA.

GABARITO: B

3. (ICMS-RJ/2007/FGV) Uma pesquisa recente foi realizada para avaliar o


percentual da população favorável à eleição de um determinado ponto turístico
para constar no selo comemorativo de aniversário da cidade. Para isso,
selecionou-se uma amostra aleatória simples extraída de uma população
infinita. O resultado apurou 50% de intenção de votos para esse ponto
turístico.

Considerando que a margem de erro foi de 2 pontos percentuais, para mais ou


para menos, e que o nível de confiança utilizado foi de 95%, foram ouvidas,
aproximadamente:

A) 50 pessoas
B) 2.400 pessoas
C) 1.200 pessoas
D) 100 pessoas
Profs. Alexandre Lima e Moraes Junior
44
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
E) 4.800 pessoas

Resolução

Como a estimativa p’ = 50%, podemos usar a fórmula aproximada

2 2
 z   1,96 
n =  α / 2  =   = 2.401 ≈ 2.400 .
 2e0   2 × 0,02 

GABARITO: B

4. (Estatística/IBGE/2010/CESGRANRIO) Para que o erro padrão da


média amostral X seja reduzido à metade, deve-se

A) multiplicar o tamanho da amostra por 2.


B) multiplicar o tamanho da amostra por 4.
C) multiplicar o tamanho da amostra por 16.
D) dividir o tamanho da amostra por 2.
E) dividir o tamanho da amostra por 4.

Resolução

O erro padrão da média X de uma amostra de n observações proveniente de


uma população de média µ e variância σ2 é dado por

σ
σ (X ) = .
n

Seja o novo erro padrão de X denotado por σ ∗ (X ) . Então

σ (X ) σ σ σ
σ ∗( X ) = = = =

⇒ n∗ = 4n (deve-se multiplicar o tamanho da
2 2 n 4n n
amostra por 4).

GABARITO: B

5. (Analista Técnico/SUSEP/2001/ESAF) Os itens 2,30; 4,11; 5,20; 6,30;


7,20 formam uma ordenação de uma amostra aleatória de tamanho 5 da
distribuição uniforme no intervalo [0,θ] sendo θ>0. Assinale a opção que
corresponde à estimativa de máxima verossimilhança de θ.

A) 5,20
B) 5,02
Profs. Alexandre Lima e Moraes Junior
45
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
C) 7,20
D) 5,00
E) 8,00

Resolução

O enunciado fornece uma amostra aleatória com cinco elementos extraídos de


uma distribuição uniforme:

{x1 = 2,30; x2 = 4,11; x3 = 5,20; x4 = 6,30; x5 = 7,20} .

O valor máximo da amostra é xmax = x5 = 7,20 . Logo, pelo que aprendemos na


exposição teórica, a EMV de θ é θˆ = x = 7,20 (alternativa C).
max

Detalhamento da resolução:

Sabemos que θ ≥ xmax . A função densidade de probabilidade da distribuição


uniforme é f ( x) = 1 / θ para 0 ≤ x ≤ θ e f ( x) = 0 caso contrário.

A função de verossimilhança de uma amostra aleatória com n observações é

n
1 1
L(θ ) = ∏ = ,
i =1 θ θn

Cujo domínio é θ ≥ xmax , ou seja, o menor valor possível do parâmetro θ é


θ = xmax . A Fig. abaixo indica que o maior valor (máximo absoluto) de L(θ )
ocorre em θ = x . Portanto, a EMV é θˆ = x = 7,20 .
max max

Profs. Alexandre Lima e Moraes Junior


46
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior

Esta questão mostra que nem sempre é possível usar diretamente métodos de
cálculo para determinar o máximo de L(θ ) .

GABARITO: C

6. (Analista Técnico/SUSEP/2001/ESAF) Tem-se duas amostras


independentes ambas de tamanho 21 de duas populações normais com a
mesma variância σ2 > 0. Deseja-se construir um intervalo de confiança para
σ2, no nível de 95%, com base numa estimativa combinada das variâncias
amostrais s12 = 0,4 e s22 = 0,6 . Se 0< a < b são duas constantes tais que P{X<a}
= 0,025 e P{X>b} = 0,025, onde X tem distribuição qui-quadrado, assinale a
resposta que corresponde ao intervalo procurado e ao número de graus de
liberdade da distribuição de X.

A) [17/b; 17/a] e 20 graus de liberdade


B) [5/3b; 5/2a] e 40 graus de liberdade
C) [17/b; 17/a] e 41 graus de liberdade
D) [20/b; 20/a] e 40 graus de liberdade
E) [5/3b; 5/2a] e 20 graus de liberdade

Resolução

Esta questão pede que o candidato determine: i) o intervalo de confiança ao


nível de 95% da variável aleatória X que possui distribuição qui-quadrado e ii)
o número de graus de liberdade de X.

Do enunciado, depreende-se que X é resultante da combinação das estatísticas


S12 e S 22 .

A estimativa combinada das variâncias amostrais s12 = 0,4 e s22 = 0,6 é dada por

(n1 − 1) s12 + (n2 − 1) s22 20 × 0,4 + 20 × 0,6


x=s =2
p = = 0,5
n1 + n2 − 2 40

a qual possui (n1 + n2 - 2) = 21 + 21 – 2 = 40 graus de liberdade ⇒ este


fato, por si só, já elimina as alternativas A, C e E.

Vimos que o intervalo de confiança de σ 2 é dado pela fórmula

(n − 1) S 2 (n − 1) S 2
≤σ2 ≤ .
χ n2−1,α / 2 χ n2−1,1−α / 2

Profs. Alexandre Lima e Moraes Junior


47
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
A fórmula acima pode ser generalizada para o problema em questão como

(n − k ) S p2 (n − k ) S 2p
≤σ ≤
2

χ n2−1,α / 2 χ n2−1,1−α / 2

em que n = n1 + n2 .

O enunciado forneceu os qui-quadrados superior e inferior: χ n2−1,α / 2 = χ sup


2
=b e
χ n2−1,1−α / 2 = χ inf
2
= a . Portanto,

(n − k ) S p2 (n − k ) S 2p (42 − 2) × 0,5 (42 − 2) × 0,5


≤σ ≤
2
⇒ ≤σ2 ≤
χ 2
sup χ 2
inf b a
40 × 0,5 40 × 0,5 20 20
⇒ ≤σ2 ≤ ⇒ ≤σ2 ≤ .
b a b a

GABARITO: D

7. (Analista Técnico/SUSEP/2002/ESAF) Seja X uma variável aleatória


com valor esperado µ e desvio padrão σ>0. Pode-se afirmar que

A) pelo menos 75% das realizações de X pertencerão ao intervalo [µ-2σ;µ+2σ]


B) pelo menos 80% das realizações de X pertencerão ao intervalo [µ-2σ;µ+2σ]
C) pelo menos 90% das realizações de X pertencerão ao intervalo [µ-2σ;µ+2σ]
D) pelo menos 95% das realizações de X pertencerão ao intervalo [µ-2σ;µ+2σ]
E) apenas com o conhecimento de µ e σ não é possível fazer afirmação sobre o
percentual de realizações de X que cairão no intervalo [µ-2σ;µ+2σ].

Resolução

Uma rápida leitura das alternativas indica que a questão aborda o teorema
(desigualdade) de Chebyshev:

⇒ Seja X uma variável aleatória arbitrária com média µ e variância σ2. Então,
para qualquer kσ > 0 , vale

1
P[ + kσ < X < + kσ ] ≥ 1 − .
k2

Profs. Alexandre Lima e Moraes Junior


48
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior

Análise das alternativas:

(A) P[ − 2σ < X < + 2σ ] ≥ 0,75 ⇒ CORRETA. O teorema de Chebyshev afirma


1
que P[ − 2σ < X < + 2σ ] é, no mínimo, igual a 1− 2 . Logo,
2
P[ − 2σ < X < + 2σ ] ≥ 0,75 .

(B) a (D) estão INCORRETAS conforme demonstrado acima.

(E) Esta alternativa nega o teorema de Chebyshev ao dizer que não é possível,
apenas com o conhecimento de µ e σ, fazer afirmação sobre o percentual de
realizações de X que cairão no intervalo [µ-2σ;µ+2σ] ⇒ INCORRETA.

GABARITO: A

8. (Analista/Área 3/BACEN/2006/FCC) Os preços de um determinado


produto vendido no mercado têm uma distribuição normal com desvio padrão
populacional de R$ 20,00. Por meio de pesquisa realizada com uma amostra
aleatória de tamanho 100, com um determinado nível de confiança, apurou-se,
para a média destes preços, um intervalo de confiança sendo [R$ 61,08 ; R$
68,92]. A mesma média amostral foi obtida quadruplicando o tamanho da
amostra anterior e utilizando também o mesmo nível de confiança. Nos dois
casos considerou-se infinito o tamanho da população. O novo intervalo de
confiança encontrado no segundo caso foi

A) [R$ 63,04 ; R$ 66,96]


B) [R$ 62,06 ; R$ 67,94]
C) [R$ 61,57 ; R$ 68,43]
D) [R$ 61,33 ; R$ 68,67]
E) [R$ 61,20 ; R$ 68,80]

Resolução

Dados: σ = 20, n = 100, 61,08 < µ < 68,92.

Profs. Alexandre Lima e Moraes Junior


49
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Podemos montar o seguinte sistema de equações:

 X − e0 = 61,08

 X + e0 = 68,92

Somando as duas equações obtemos:

2 X = 130 ⇒ X = 65

Subtraindo a primeira da segunda equação temos:

2e0 = 68,92 − 61,08 = 7,84 ⇒ e0 = 3,92

Sabemos que

σ 20
e0 = zα / 2 ⇒ 3,92 = zα / 2 ⇒ zα / 2 = 1,96 .
n 100

Quadruplicando o tamanho da amostra teremos n’=400. Logo,

σ 20
e0 ' = zα / 2 ⇒ e0 ' = 1,96 ⇒ e0 ' = 1,96
n' 400

E o novo intervalo de confiança (IC) será

IC = [65,00 – 1,96 ; 65,00 + 1,96] = [63,04 ; 66,96].

GABARITO: A

iid
9. (Estat./IBGE/2010/CESGRANRIO) Sejam X 1 , X 2 ,..., X n ~ N ( ;σ 2 ) e
considerados dois estimadores para σ2

1 n 1 n
T 1= ∑
n − 1 i =1
( X i − X )2 e T 2= ∑
n i =1
( X i − X )2.

Observe as afirmativas a seguir a respeito desses estimadores.

I – T1 é não tendencioso.
2 2(n − 1) 4
II – O erro médio quadrático de T1 é σ 4 , enquanto que o de T2 é σ .
n −1 n2
 σ2 
III – A tendência de T2 =  −  .
 n 

Profs. Alexandre Lima e Moraes Junior


50
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
É (São) correta(s) a(s) afirmativa(s)

A) I apenas.
B) I e II, apenas.
C) I e III, apenas.
D) II e III, apenas.
E) I, II e III.

Resolução

Primeiramente, é necessário investigar as propriedades dos estimadores T1 e


T2. Mas, antes disso, vamos relembrar a distribuição χ2.

iid
Seja uma amostra X 1 , X 2 ,..., X n ~ N ( ;σ 2 ) (ou seja, cada elemento da amostra é
normalmente distribuído com média µ e variância σ2) Aprendemos que a
estatística

2
X − n
 n
χ = ∑ i
2
 = ∑ Zi ,
2
n
i =1  σ  i =1

em que Zi denota a variável aleatória normal reduzida, tem distribuição χ2 com


n graus de liberdade. Vimos também que,

E ( χ n2 ) = n

var(χ n2 ) = 2n (MEMORIZE estes resultados para a prova!).

A estatística

n
 Xi − X 
2 ∑(X i − X )2
∑ 
i =1  σ 
 = i =1
σ2
,

obtida por substituição de por X na expressão de χ n2 acima tem distribuição


do tipo χ2 com n-1 graus de liberdade. Logo,

∑(X i − X )2
χ 2
n −1 = i =1
.
σ2

Cálculo da média e da variância de T1:

Profs. Alexandre Lima e Moraes Junior


51
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
n n

∑ ( X i − X )2 ∑(X i − X )2
σ2 σ2
T1 = i =1
= i =1
= χ n2−1
n −1 σ 2
n −1 n −1

ou seja, o estimador T1, a menos da constante σ 2 /( n − 1) , tem distribuição χ2


com n-1 graus de liberdade. Então,

 σ2 2  σ2
E (T1 ) = E  χ n −1  = × (n − 1) = σ 2 ⇒ T1 é um estimador não tendencioso
 n −1  n −1
de σ (viés é nulo).
2

 σ2 2  σ4 σ4 2σ 4

var(T1 ) = var χ n −1  =
 var(χ n −1 ) =
2
× 2(n − 1) = ⇒ como
 n −1  (n − 1) (n − 1) 2 n −1
2

2σ 4
lim var(T1 ) = lim = 0 , T1 é um estimador consistente de σ2.
n →∞ n→∞ n − 1

O Erro Quadrático Médio de T1 é dado por

EQM (T1 ) = var(T1 ) + [viés (T1 ) ]2


2σ 4
EQM (T1 ) = var(T1 ) + 0 = var(T1 ) = .
n −1

Cálculo da média e da variância de T2:

n n

∑ ( X i − X )2 ∑(X i − X )2
σ2 σ2
T2 = i =1
= i =1
= χ n2−1
n σ2 n n

ou seja, o estimador T2, a menos da constante σ 2 / n , tem distribuição χ2 com


n-1 graus de liberdade. Então,

σ 2 2  σ 2 σ2
E (T2 ) = E  χ n −1  = × (n − 1) = σ −
2
≠ σ 2 ⇒ T2 é um estimador tendencioso
 n  n n
de σ . O seu viés é dado por
2

σ2  σ2  σ2
viés(T2) = E (T2 ) − σ 2 = σ 2 − −σ 2 = −
. Note que lim  −  = 0 , ou seja, o viés
n →∞
n n  n 
de T2 tende a desaparecer com o aumento do tamanho da amostra.

Profs. Alexandre Lima e Moraes Junior


52
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
σ 2  σ 4
2
σ4 2σ 4 (n − 1)
var(T2 ) = var χ n −1  = 2 var(χ n2−1 ) = 2 × 2(n − 1) = ⇒ como
 n  n n n2
2σ 4 (n − 1) 1 1 
lim var(T2 ) = lim 2
= 2σ 4 × lim  − 2  = 0 (e lim E (T2 ) = σ 2 ), T2 é um
n →∞ n→∞ n n → ∞
n n  n→∞

estimador consistente de σ . 2

O Erro Quadrático Médio de T2 é dado por

EQM (T2 ) = var(T2 ) + [viés (T2 ) ]2


2
2σ 4 (n − 1)  σ 2  2σ 4 (n − 1) σ 4 (2n − 1) 4
EQM (T2 ) = +  −
 n  = + 2 = σ .
n2   n2 n n2

Análise das afirmativas:

(I) VERDADEIRA, pois E (T1 ) = σ 2 .


2σ 4 (2n − 1) 4
(II) VERDADEIRA, pois EQM (T1 ) = e EQM (T2 ) = σ .
n −1 n2
σ2
(II) VERDADEIRA, pois viés(T2) = − .
n

Nota: na exposição teórica, chamei o estimador T1 de S 2 e o estimador T2 de


σˆ 2 .

GABARITO: E

10. (Estatística/IBGE/2010/CESGRANRIO) Considere uma amostragem


aleatória simples, sem reposição, de uma população de tamanho muito
grande. Qual o tamanho aproximado de amostra que permite estimar a média
de uma variável y, cujo desvio padrão populacional é igual a 5, com margem
de erro 0,1, a um nível de confiança 95%?

A) 100
B) 400
C) 1.000
D) 4.000
E) 10.000

Resolução

Dados: 1 − α = 95% , σ = 5 e e0 = 0,1 .

Fórmula a ser aplicada:


Profs. Alexandre Lima e Moraes Junior
53
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior

2
z σ 
n =  α / 2  .
 e0 

Note que z2,5% = 1,96 é um valor “manjado” (MEMORIZE para a prova!).


Portanto,

2
 1,96 × 5 
n=  = 9.604 ⇒ alternativa com valor mais próximo é a letra E (n ≈
 0,1 
10.000)

GABARITO: E

11. (Estatística/IBGE/2010/CESGRANRIO) Para avaliar a taxa de


desemprego em uma determinada localidade, selecionou-se uma amostra
aleatória de 900 indivíduos em idade produtiva. O resultado dessa amostra
revelou que o número de desempregados era de 36%. O intervalo de 95% de
confiança para a proporção de desempregados, nessa localidade, é

A) 36% ± 0,1%
B) 36% ± 2,6%
C) 36% ± 3,1%
D) 36% ± 3,7%
E) 36% ± 4,1%

Resolução

Dados: n = 900, p’ = 0,36 e (1 - α) = 0,95 (que implica um zα / 2 = 1,96 ).

Sabemos que neste caso o IC será dado por:

p' (1 − p' ) 0,36(1 − 0,36)


IC = p'± zα / 2 = 36% ± 1,96 ≈ 36% ± 3,14% ⇒ alternativa com
n 900
valor mais próximo é C.

GABARITO: C

12. (Analista/Área 2/BACEN/2010/CESGRANRIO) Em um estudo sobre a


economia informal de uma cidade, deseja-se determinar uma amostra para
estimar o rendimento médio dessa população, com um grau de confiança de
95% de que a média da amostra aleatória extraída não difira de mais de R$
50,00 da média do rendimento dessa população, cujo desvio padrão é R$
1,96
400,00. Sabendo-se que z ~ N[0,1] e que ∫
0
f ( z )dz = 0,4750 , onde f(z) é a
Profs. Alexandre Lima e Moraes Junior
54
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
função de densidade de probabilidade de z, pode-se concluir que o número de
pessoas da amostra será

A) 321
B) 308
C) 296
D) 271
E) 246

Resolução

1,96
Dados: (1 - α) = 0,95 e ∫
0
f ( z )dz = 0,4750 (que implicam um z2,5% = 1,96 ), σ =
400, e0 = 50.

Neste caso o tamanho n da amostra é dado pela fórmula

σ 400 400
e0 = z2,5% ⇒ 50 = 1,96 ⇒ n = 1,96 = 1,96 × 8 ⇒ n = 245,86 ≈ 246 .
n n 50

GABARITO: E

(Analista Ministerial/Estatística/MPE-PE/2006/FCC) Instruções


(adaptadas): Para responder às questões de números 13 e 14, considere as
tabelas a seguir.

Elas fornecem alguns valores da função de distribuição F(x). A tabela 1 refere-


se à variável normal padrão, as tabelas 2 e 3 referem-se à variável t de
Student com 15 e 16 graus de liberdade, respectivamente:

Tabela 1 Tabela 2 Tabela 3


x F(x) x F(x) x F(x)
1,60 0,945 1,753 0,95 1,746 0,95
1,64 0,950 2,248 0,98 2,235 0,98
2,00 0,977 2,583 0,99 2,567 0,99

13. Um engenheiro encarregado do controle de qualidade deseja estimar a


proporção p de lâmpadas defeituosas de um lote, com base numa amostra de
tamanho 400. Sabe-se, com base em experiâncias anteriores, que p deve
estar próximo de 0,5. Usando o teorema central do limite para estimar a
amplitude do intervalo de confiança de 90% para p, podemos afirmar que tal
amplitude é, aproximadamente, igual a

A) 0,041
B) 0,045
Profs. Alexandre Lima e Moraes Junior
55
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
C) 0,058
D) 0,070
E) 0,082

Resolução

Dados: (1 - α) = 0,90, n = 400 e p’ ≈ 50%.

A tabela 1 indica que z = 1,64 para α/2 = 5%. Como a estimativa p’ ≈ 50%,
podemos usar a fórmula

2
z  ( z ) 2 1,64 2 1,64 2
n =  α / 2  ⇒ (2e0 ) 2 = α / 2 = ⇒ (2e0 ) = = 0,082 ⇒ alternativa (E).
 2e0  n 400 400

Atenção: a questão pede que o candidato calcule a AMPLITUDE (= dobro da


semi-amplitude e0) do intervalo de confiança.

GABARITO: E

14. Supondo-se que a porcentagem da receita investida em educação, dos 600


municípios de uma região, tem distribuição normal com média µ, deseja-se
estimar essa média. Para tanto se sorteou dentre esses 600, aleatoriamente e
com reposição, 16 municípios e se observou os porcentuais investidos por eles
em educação. Os resultados indicaram uma média amostral de 8% e desvio
padrão amostral igual a 2%. Um intervalo de confiança para µ, com coeficiente
de confiança de 96%, é dado por

A) (8 ± 1,124)%
B) (8 ± 1,117)%
C) (8 ± 0,877)%
D) (8 ± 0,870)%
E) (8 ± 0,755)%

Resolução

A questão aborda a construção do intervalo de confiança da média


populacional µ quando o desvio padrão populacional σ é desconhecido. Para
tal, deve-se utilizar a fórmula

S
X ± t n−1,α / 2 .
n

Dados: X = 8% , S = 2% , n = 16 .

Profs. Alexandre Lima e Moraes Junior


56
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
A tabela 2 fornece o valor de t n−1,α / 2 = t15, 2% = 2,248 (entrada correspondente ao
valor F(x) = 98%, que implica α/2 = 1 – 98% = 2%). Logo,

S 2%
X ± t n−1,α / 2 = 8% ± 2,248 = 8% ± 1,124% .
n 16

GABARITO: A

15. (Analista Ministerial/Estatística/MPE-PE/2006/FCC) Seja X uma


variável aleatória assumindo os valores -2 e 2, com probabilidade 1/4 e 3/4,
respectivamente. Seja µ a média de X. Então o limite superior de P[|X - µ| ≥
12 ], obtido pela desigualdade de Tchebysheff, é dado por

A) 0,40
B) 0,25
C) 0,20
D) 0,12
E) 0,10

Resolução

A Desigualdade de Tchebysheff pode ser dada pela expressão

1
P[| X − |≥ kσ ] ≤ .
k2

Dados: i) kσ = 12 , ii) distribuição de probabilidades de X (logo é possível


calcular a média µ e o desvio padrão σ de X).

 1  3
= E ( X ) = ∑ xi f ( xi ) =  − 2 ×  +  2 ×  = 1
i  4  4

 1  3
σ 2 = E( X 2 ) − 2
= ∑ xi2 f ( xi ) − µ 2 =  (−2) 2 ×  +  2 2 ×  − 12 = 3
i  4  4

Então

kσ 12
= ⇒ k = 2.
σ 3

1
P[| X − 1 |≥ 2 3 ] ≤
⇒ P[| X − 1 |≥ 2 3 ] ≤ 0,25 ⇒ limite superior da probabilidade de
22
que X difira da média populacional por ± 2 3 é 0,25.
Profs. Alexandre Lima e Moraes Junior
57
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior

GABARITO: B

(ANPEC/2009/Adaptada) Verifique se as afirmativas 16 a 20 são


verdadeiras:

16. Em uma pesquisa de opinião a proporção de pessoas favoráveis a uma


determinada medida governamental é dada por pˆ = ∑ X i / n . O menor valor de
n para o qual a desigualdade de Chebyshev resultará em uma garantia de que
P(| pˆ − p |≥ 0,01) ≤ 0,01 é 200.000.

Resolução

A proporção de pessoas favoráveis a uma determinada medida governamental,


denotada por p̂ , é uma variável aleatória com valor esperado E ( pˆ ) = p , em que
p denota o verdadeiro valor do parâmetro populacional, e variância
var( pˆ ) = p(1 − p ) / n , em que n é o número de elementos da amostra.

Vimos que a Desigualdade de Tchebysheff pode ser dada pela expressão

1
P[| X − |≥ kσ ] ≤ .
k2

Nesta questão, podemos reescrever a desigualdade acima como

P[| pˆ − p |≥ 0,01] ≤ 0,01 .

Sendo assim, podemos calcular o valor de k:

1
= 0,01 ⇒ k = 10 .
k2

Como kσ = 0,01 ⇒ σ = 0,01 / 10 = 10 −3 ⇒ σ 2 = 10 −6 .

Note que σ 2 = var( pˆ ) = p(1 − p ) / n . Temos o valor de σ2 = 10-6. Porém, não há


condição de calcular n = p (1 − p ) / σ 2 , pois a questão não forneceu o valor da
média populacional (p). Logo, não podemos afirmar que o menor valor de n
para o qual a desigualdade de Chebyshev resultará em uma garantia de que
P(| pˆ − p |≥ 0,01) ≤ 0,01 é 200.000 (faltam dados!).

GABARITO: FALSA

17. Quando o número de graus de liberdade δ cresce, a distribuição χδ2


aproxima-se de uma distribuição normal com média δ e desvio padrão 2δ.

Profs. Alexandre Lima e Moraes Junior


58
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Resolução

A média da variável χδ2 é δ e a variância é 2δ. Logo, a afirmativa é FALSA,


pois diz que o desvio padrão de χδ2 é 2δ..

De acordo com Teorema Central do Limite, a família de distribuições do tipo χδ2


tende à distribuição normal com média δ e variância 2δ quando o número de
graus de liberdade δ aumenta.

GABARITO: FALSA

18. Um intervalo de confiança de 99% para a média µ de uma população,


calculado para uma amostra aleatória, como [2,75; 8,25], pode ser
interpretado como: a probabilidade de µ estar no intervalo calculado é de 99%.

Resolução

Uma estimativa do intervalo de confiança da média populacional µ


(desconhecida) é um intervalo da forma l ≤ µ ≤ u, em que os limites inferior l
e superior u dependem do valor numérico do estimador X para uma amostra
particular. Como amostras distintas produzirão diferentes estimativas para ˆ
e, por conseguinte, valores diferentes para os limites l e u, esses limites são
valores de variáveis aleatórias, como L e U, respectivamente. Da distribuição
amostral de X somos capazes de determinar valores de L e U, tais que a
seguinte afirmação probabilística seja verdadeira:

P( L ≤ ≤ U) =1−α ,

sendo 0 < α < 1 . Assim, temos uma probabilidade igual a 1 − α de selecionar uma
amostra que produzirá um intervalo contendo o valor verdadeiro do parâmetro
.

O intervalo observado

l≤ ≤u

é chamado de intervalo com 100(1 − α )% de confiança para o parâmetro µ. A


interpretação de um intervalo de confiança é que se um número infinito de
amostras aleatórias for coletado e um intervalo com 100(1 − α )% de confiança
para µ for calculado a partir de cada amostra, então 100(1 − α )% desses
intervalos conterão o valor verdadeiro de µ.

Na prática, obtemos somente uma amostra aleatória e calculamos uma


estimativa do intervalo de confiança. Uma vez que esse intervalo conterá
ou não o valor verdadeiro de µ, não é razoável fixar um nível de
Profs. Alexandre Lima e Moraes Junior
59
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
probabilidade para essa realização. A afirmação apropriada é: o
intervalo observado [l, u] contém o valor verdadeiro de µ, com
100(1 − α )% de confiança. Essa afirmação tem uma interpretação de
freqüência; ou seja, não sabemos se a afirmação é verdadeira para essa
amostra específica, mas o método usado para obter o intervalo [l, u] resulta
em afirmações corretas em 100(1 − α )% do tempo.

GABARITO: FALSA

19. Seja X 1 , X 2 ,..., X n uma amostra aleatória simples proveniente de uma


população com distribuição de Pareto cuja função densidade é dada por
f ( x) = θ (1 + x) − (θ +1) , 0 < x < ∞ , θ > 1 . Então o estimador de máxima verossimilhança
n
para θ é .
∑ log(1 + xi )
Resolução

A função de verossimilhança é dada por:

L(θ ) = f (x1 ) × f (x 2 ) × ... × f (x n ) = θ (1 + x1) −(θ +1)θ (1 + x 2 ) −(θ +1) ...θ (1 + x n ) −(θ +1)
L(θ ) = θn [(1 + x1 )(1 + x 2 )...(1 + x n )]−( θ +1) .

Tomando o logaritmo natural de L(θ), obtemos:

ln L(θ ) = ln{θn [(1 + x1 )(1 + x 2 )...(1 + x n )]−( θ +1)}


ln L(θ ) = ln{θn } − (θ + 1)ln[(1 + x1 )(1 + x 2 )...(1 + x n )]
ln L(θ ) = n ln{θ } − (θ +1)[ln(1+ x1) + ln(1+ x 2 ) + ...+ ln(1+ x n )]
ln L(θ ) = n ln{θ } − (θ + 1)∑ ln(1 + x i )
i

A EMV será determinada por meio da equação

d ln L(θ ) d (ln θ ) 1
=0 Dica: =
dθ dθ θ
 1 n
n ˆ  − ∑ ln(1 + x i ) = 0 ⇒ θˆ =
θ  i ∑ ln(1+ x i )
Nota: a função log(.) do enunciado denota o logaritmo natural.

GABARITO: VERDADEIRA

20. Se existe, todo estimador de máxima verossimilhança calculado para uma


amostra aleatória possui distribuição Normal em grandes amostras.

Resolução
Profs. Alexandre Lima e Moraes Junior
60
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior

O Estimador de Máxima Verossimilhança possui distribuição assintótica normal


⇒ VERDADEIRA.

GABARITO: VERDADEIRA

Até a próxima aula. Bom estudo!

Alexandre e Moraes Jr.

Profs. Alexandre Lima e Moraes Junior


61

S-ar putea să vă placă și