A Distribuição Normal PDF

Departamento de Estatística - IMECC – UNICAMP
Introdução aos Modelos Probabilísticos

Prof. Sebastião de Amorim
Capítulo 3 – A Distribuição Normal
3.1 - Introdução
Experimentos compostos pela repetição, sucessiva e independente de um mesmo experimento básico geram
sequências de variáveis aleatórias X1, X2, X3, … independentes entre si, mas identicamente distribuídas. Tal é o caso,
por exemplo, da repetição de um mesmo experimento binário Bp, ou do nosso conhecido D5, o arremesso de um dado
não viciado de cinco lados. Uma questão que surge naturalmente, nesses casos, se refere à distribuição de
probabilidades da soma Sn, dos n primeiros valores observados: o número de sucessos em n repetições de Ep, ou a
pontuação total acumulada em n arremessos sucessivos e independentes de um dado.
No primeiro caso, já temos a resposta formal rigorosa. O número de sucessos em n repetições independentes e
sucessivas de Ep, o experimento composto Epn, tem distribuição binomial com parâmetros n e p, que representamos
por Sn~b(n, p), com
= = ∙ ∙ 1−
Como, nesse caso, E(Xi)=p e V(Xi)=p(1-p), esperança e variância de Sn são determinadas diretamente das propriedades
básicas: E(Sn)=np e V(Sn)=np(1-p). A figura
0,10
ao lado é uma representação gráfica da
0,08 b(100, 0,2), na faixa de 0 a 40, cuja
probabilidade total é 0,9999987. Para
0,06
valores de n muito elevados, os cálculos
0,04 exatos podem ser complicados, mesmo
com o uso de computador.
0,02
0,00 Nos casos como o D6, ou mais gerais, como

10
12
14
16
18
20
22
24
26
28
30
32
34
36
38
40
0
2
4
6
8
Dm, de um dado hipotético de m lados, os

cálculos diretos de probabilidade de Sn, a
soma dos primeiros n resultados
0,04
individuais em repetições sucessivas
do experimento aleatório elementar
0,03
ainda podem ser feitas com o auxílio
do algoritmo o apresentado no
0,02
Capítulo 2 para , embora, para m e
0,01 n grandes os valores envolvidos para a

cardinalidade de eventos como {Sn=s}
0,00 se agigantem muito rapidamente. No
110
115
120
125
130
135
140
145
150
155
160
165
170
175
180
185
190
caso de , por exemplo, existem

exatamente 152.370.928.583.799
×1062 maneiras diferentes de se obter S100=350. A divisão deste número por 6100 dá 0,0233226, que é P{S100=350}. A
figura ao lado representa P{S50=s} para . Como na figura acima, a representação se restringiu à faixa de 110 a
190, cuja probabilidade é 0,999961.
1
A semelhança de forma geral das duas figuras não é acidental, mas se constitui na manifestação de uma das
propriedades mais interessantes de toda a Matemática e, certamente, um dos resultados mais importantes da Teoria
da Probabilidade: O Teorema Central do Limite. Este teorema, em uma de suas versões mais simples, assegura que
se uma variável aleatória, como Sn, é a soma de um número n de observações sucessivas e independentes de uma
variável aleatória X, com esperança µ e variância σ2, então, na medida em que n cresce, a sua distribuição se aproxima
cada vez mais da distribuição normal (ou gaussiana), de esperança nµ e variância nσ2. Assim, no primeiro caso, com
o número de sucessos em 100 repetições de um mesmo Ep com p=0,2, devemos esperar uma distribuição
aproximadamente igual a uma normal, de esperança 20 e variância 16. No segundo caso, de 100 repetições de D6, o
resultado acumulado deve ter distribuição aproximadamente Normal, com esperança 350 e variância 291,666....
3.2 - A Distribuição Normal
Uma variável aleatória contínua X é dita ter distribuição Normal, com esperança µ e variância σ2, o que se representa
por X~N(µ, σ2), se sua f.d.p. for
1 ! $
= &'& − ∞ < <∞

#
"
√2
Uma variável aleatória com distribuição N(0, 1) é dita ter distribuição normal padrão, e é geralmente representada
por Z. Sua função de densidade de probabilidades,
,$
e $
√ *
representada por φ(z), é , para z real, e é
representa na figura ao lado. Como se vê, a normal padrão

concentra praticamente toda a probabilidade no intervalo
(-3, 3). A tabela abaixo
Evento probabilidade
dá a probabilidade de
eventos do tipo {- {−1 <Z < 1} 0,68268949
{−2< Z < 2} 0,95449974
i<Z<i}, para i=1, 2, 3, 4
{−3< Z < 3} 0,99730020
e 5.
{−4< Z < 4} 0,99993666
{-5 < Z < 5} 0,99999943
Ao final deste capítulo uma tabela mais completa traz a distribuição acumulada
da normal padrão
Φ . = / < . = 01 2
4
2
para z=0 até z=3,99, a passos de 0,01. A figura abaixo representa Φ(z), a função de distribuição acumulada de uma
variável aleatória com distribuição normal padrão.
A transformação / =
5 6
7
reduz uma variável aleatória
X~N(µ, σ2) à sua forma padrão Z~N(0, 1). Assim, a

probabilidade de eventos como {X<a} pode ser extraída da
tabela para a normal padrão, pois
X−μ x−μ x−μ

P X< = P: < > = P ?Z < A
σ σ σ
Exemplo 3.2.1 – Uma variável aleatória X tem

distribuição Normal, com esperança 100 e variância 100, portanto desvio
padrão 10. Calcule:
a- P{X<100}
Como a normal é simétrica em torno da esperança, então P{X<100}=P{X>100}=0,5.
b- P{X<110} e P{X<90}
Ora, o valor 110 está exatamente a um desvio padrão acima da

esperança, logo
X − 100 110 − 100

P X > 110 = P : > >=P Z>1 =1−P Z<1 =1−Φ 1
10 10
Da tabela tiramos Φ(1)=0,84134, portanto P{X>110)=0,1587, e, por simetria P{X<90)=0,1587.
c- P{90<X<110}
Transformando para a normal padrão, temos:
−10 X − 100 10
90 < E < 110 = 90 − 100 < E − 100 < 110 − 100 = P : < < >
10 10 10
= P −1,0 < / < 1,0 = P Z < 1,0 − P Z < −1,0 = Φ 1 − Φ −1
Como, por simetria, Φ −1 = 1 − Φ 1 temos:
85 < E < 115 = 2Φ 1 − 1 = 2 × 0,84138 − 1 = 0,6827
Aplicação do Teorema Central do Limite, na versão apresentada, para soma de variáveis aleatórias independentes e
identicamente distribuídas, nos permite resolver, de forma muito simples, uma variedade surpreendente de
problemas práticos antes intratáveis. Vejamos alguns exemplos:
3
Exemplo 3.2.2 – Seja Ep, um experimento aleatório binário, com P{s}=p, o qual é repetido sucessiva e
independentemente, gerando resultados parciais X1, X2, X3, …, variáveis aleatórias independentes e
S O = ∑OQR XQ =
identicamente distribuídas, com distribuição binária de P{X=1}=p. Vamos definir SO = ∑OQR XQ e X
O
S ,
O O
respectivamente a soma e a média aritmética dos n primeiros valores observados. Neste caso particular, Sn
é o número total de sucessos obtidos e S

XO a freqüência de sucessos, nas n primeiras repetições. Vamos
considerar valores grandes de n.
a- Seja p=0,50 (como no arremesso de uma moeda) e n=10000. Calcule P{4.900<Sn<5.100}.
A variável aleatória X, correspondente ao resultado parcial em cada repetição, tem distribuição B(0,5), portanto
E(X)=0,5 e V(X)=0,25. Sendo a soma de 10 mil observações independentes de X, Sn tem esperança 5000 e
variância 2500, logo:
4900 − 5000 SO − 5000 5100 − 5000

P 4900 < SO < 5100 = P : < < > ≈ P −2 < / < 2
50 100 100
Portanto
P 4900 < SO < 5100 ≈ Φ 2 − Φ −2 = 2Φ 2 − 1 = 0,9545
Como se pode ver, a faixa de valores realmente possíveis para o número total de Caras em dez mil arremessos
de uma moeda é surpreendentemente estreito e se situa em torno do valor médio esperado, 5000.
A propósito, através de sequência análoga de operações, obtém-se P{4850<Sn<5150} ≈ 0,9973.
b- Seja p=0,20 (como na obtenção de um 5 em D5) e n=1000. Calcule 0,18 < S

XO < 0,22 .
Neste caso, X tem esperança 0,2 e variância 0,16, logo Sn tem esperança 200 e variância 160. Sendo a soma de
mil resultados parciais, a distribuição de Sn , uma b(1000, 0,2) é bem próxima da normal de mesma esperança e
S O sendo igual a Sn dividido por n, tem também distribuição
mesma variância. Ora, se Sn~N(200, 160), então X
aproximadamente normal, com esperança e variância iguais a 0,2 e 0,00016, respectivamente. Assim,
0,18 − 0,20 S O − 0,20

X 0,22 − 0,20
0,18 < S
XO < 0,22 = P U < < V ≈ P −1,58 < / < 1,58
√0,00016 √0,00016 √0,00016
Portanto, 0,18 < S

XO < 0,22 = 2Φ 1,58 − 1 = 0,8859
Exemplo 3.2.3 – Consideremos agora sequências de repetições independentes de D5, com X1, X2, X3, …, Sn e S
XO
S O = SO ,
definidos da forma usual. Agora, E(X)=3 e V(X)=2, portanto E(Sn)=3n e V(Sn)=2n. Lembrando que X
O
SO = 3 e X X
temos W X S O = . Com n não muito pequeno podemos aproximar as distribuições, tanto de Sn
O
S O , à Normal, com esperanças e variâncias correspondentes. Assim, com n=100, E(Sn)=300, V(Sn)=200,
como de X
SO = 3 e X X
W X S O = 0,02. Desta forma, embora o conjunto de valores possíveis para S100 seja o dos inteiros
de 100 a 500, a probabilidade de S100 cair no intervalo fechado de 270 a 330 é superior a 0,95. O cálculo mental
rápido segue o roteiro: (1) O desvio padrão de Sn é raiz de 200, ou 14,1; (2) portanto o intervalo considerado,
4
[270, 330] se estende, simetricamente em torno de E(Sn), por mais que dois desvios padrões de Sn de cada lado;
(3) sendo a soma de 100 resultados intermediários, igualmente distribuídos e independentes, a distribuição de
Sn pode ser considerada aproximadamente Normal; (4) logo um intervalo de dois desvios padrões em torno de
E(Sn) terá probabilidade um pouco acima de 0,95. Um cálculo mais cuidadoso, extraindo resultados da tabela,
nos leva a P{270≤Sn ≤330}=0,965994. Um refinamento ainda usando a aproximação pela normal, conforme
discutiremos adiante, resulta P{270≤Sn ≤330} = 0,967847. O valor exato, calculado através do algoritmo
desenvolvido no Capítulo 2, estendido até n=100, é 0,969155739. O melhor resultado obtido através da
aproximação pela distribuição Normal apresentou, portanto, uma subavaliação relativa de 0,019%, desprezível
para a maioria dos fins. A propósito, existem exatamente 764.529.073.299.384x1055 maneiras diferentes – cada
uma com a mesma probabilidade, 5-100 – de se obter a soma dos 100 resultados parciais no intervalo [270, 330].
Vejamos outras questões.
a- Calcule P{S1000>3100}.
Com n=1000, E(Sn)=3000 e V(Sn)=2000. Assumindo a aproximação Normal para a distribuição de S1000, temos:
S − 3000 3100 − 3000

PS > 3100 = P : > > ≈ P Z > 2,23 = 1 − 0,9871 = 0,0129
√2000 √2000
Como se vê, em 1000 arremessos de um dado não viciado de cinco lados, o total esperado é 3000, e a
probabilidade do total superar 3100 é de apenas 1,29%.
b- Se o dado for ligeiramente tendencioso, (ver tabela), calcule

1 2 3 4 5
P(S1000)>3100 0,19 0,20 0,20 0,20 0,21
A distorção nas probabilidades altera a esperança e a variância de X. Agora, E(X)=3,04 e V(X)=1,9984, portanto,
S − 3040 3100 − 3040

PS > 3100 = P : > > ≈ P Z > 1,34 = 1 − 0,9099 = 0,0901
√1998,4 √1998,4
A distorção no dado, favorecendo ligeiramente o resultado 5 em detrimento do 1, aumenta a esperança de S1000,
elevando a probabilidade de um valor superior a 3100 de 1,29% para 9,01%.
c- De volta ao D5 não tendencioso e n=1000, determine um inteiro m, tal que P{3000–m≤Sn≤3000+m}=0,99.
O intervalo em questão é, portanto, simétrico em torno de E(Sn), com meia amplitude igual a m. Numa normal,
o intervalo simétrico em torno da esperança de probabilidade 0,99, tem meia largura igual a 2,58 desvios padrões
(da tabela, Φ(2,58)=0,995), logo 2,58 desvios padrões de S1000 é igual a m, portanto Y = 2,58√2000 ≈ 116.
d- Dois amigos, A e B disputam uma corrida de dados (para maior agilidade do processo, vamos supor que o
jogo é feito com dados simulados no computador). Em rodadas sucessivas, eles vão arremessando seus
dados e acumulando os resultados:
SO
A→ X1, X2, X3, … , Sn e X
5
SO
B→ Y1, Y2, Y3, … , Tn e Y
Qual a probabilidade de que, após 100 rodadas, B esteja liderando a corrida por mais que 10 pontos?
A solução é simples e começa com a definição de Dn = Tn – Sn, a vantagem de B sobre A após n rodadas.
Como E(Sn)=E(Tn), E(Dn)=0 enquanto que V(Dn)=V(Sn)+V(Tn)=4n. Admitindo-se que Sn e Tn tem distribuição
Normal, conclui-se que Dn~N(0, 4n) e, portanto, D100~N(0, 400); logo:
D 10
PD > 10 = P : > > ≈ P Z > 0,5 = 1 − 0,6915 = 0,3085
√400 √400
Por simetria, esta é também a probabilidade de que, após 100 rodadas, A esteja liderando por mais que 10
pontos.
e- Na corrida acima, vamos agora supor que os dados sejam ligeiramente distorcidos em favor do jogador B,
como mostra a tabela ao lado. Qual a probabilidade de B 1 2 3 4 5
ganhar uma corrida de 1000 rodadas? A 0,21 0,20 0,20 0,20 0,19
B 0,19 0,20 0,20 0,20 0,21
Agora E(Sn)=2,96 e E(Tn)=3,04, enquanto as duas variância
são iguais a 1,9984, portanto E(Dn)=0,08 e V(Dn)=3,9968n. Com 1000 rodadas, teremos E(D1000)=80 e
V(D1000)=3996,8 e
D − 80 −80
PD > 0 = P: > > ≈ P Z > −1,265 = P Z < 1,265 = Φ 1,265 = 0,897
√3996,8 √3996,8
P B vence a corrida de 1000 rodadas = P D > 0 = Φ 1,265 = 0,897
Como se vê, a ligeira distorção dá a B enorme vantagem em uma corrida prolongada. Nessas condições
vantajosas, sua probabilidade de vencer uma corrida de dez mil rodadas é Φ(4,00)=0,999968.
A qualidade da aproximação da distribuição de probabilidades de Sn associadas a D5n por N(3n, 2n) pode ser bem
apreciada através da figura abaixo. Nela as barras verticais representam os valores exatos de = , para
valores de s na região relevante, de 250 a 350, calculados através do algoritmo já apresentado, são sobrepostos por
uma linha envoltória contínua corresponde à f.d.p. da normal com esperança 300 e variância 200. A quase perfeita
0,030
0,025
0,020
0,015
0,010
0,005
0,000
250
253
256
259
262
265
268
271
274
277
280
283
286
289
292
295
298
301
304
307
310
313
316
319
322
325
328
331
334
337
340
343
346
349
coincidência entre valores exatos e aproximados pode ser apreciada. A tabela abaixo apresenta os dois grupos de
valores da probabilidade – exato e aproximado – para um conjunto selecionado de valores de d.
6
s
P{S100=s}
250 260 270 280 290 300
Valor exato 5,1960E-05 5,1129E-04 2,9794E-03 1,0406E-02 2,1967E-02 2,8164E-02
Aproximação Normal 5,4457E-05 5,1667E-04 2,9733E-03 1,0378E-02 2,1970E-02 2,8209E-02
Erro percentual 4,81 1,05 -0,20 -0,27 0,01 0,16
Exemplo 3.2.4 – As ideias acima são agora aplicadas ao problema geral de amostragem em populações
muito grandes. Quer-se estimar a taxa de ocorrência (p) de determinada característica genética em uma
população de dezenas de milhões de indivíduos. O teste é preciso, mas caro e intrusivo, portanto a amostra
deve ser a menor possível. Sabe-se que p deve estar na faixa de 10 a 25%. Uma amostra de 1200 indivíduos
é inicialmente considerada.
Considerando-se o pior caso em termos da variância, qual seria a probabilidade de um erro superior a 2
pontos percentuais na estimativa de p?
Primeiro vamos definir como Xi o resultado relativo ao i-ésimo indivíduo sorteado: Xi=1 se o indivíduo
apresenta a característica genética estudada, e Xi=0, caso contrário. Assim, Xi~B(p), e E(Xi)=p e V(Xi)=p(1-p),
onde p é a fração de indivíduos com a característica genética estudada, na população.
Com uma amostra aleatória de tamanho n, teremos X1, X2, …, Xn, independentes e com a mesma distribuição
B(p), a distribuição binária ou de Bernoulli. A soma Sn tem, então, distribuição binomial com parâmetros n
e p: Sn~b(n, p). A esperança e a variância de Sn são, respectivamente, np e np(1-p).
Pelo teorema central do limite, podemos aproximar S1200~N(1200p, 1200p(1-p)), logo
S p 1−p
pg = ~N jp, k
1200 1200
Portanto,
o s
0,02 pg − p 0,02
P |pg − p| > 0,02 = 1 − P 0,02 < pg − p < 0,02 = 1 − P < <
n p 1−p r
p pp 1 − p pp 1 − p
m 1200 1200 1200 q
o s
0,02 0,02
P |pg − p| > 0,02 ≈ 1 − P </<
n p 1−p r
p pp 1 − p
m 1200 1200 q
O pior caso (com maior probabilidade de erro superior a 2 pontos percentuais), ocorre quando a variância
é máxima. A variância depende de p e, como se sabe que p está no intervalo (0,10, 0,25), o pior caso, em
termos de variância ocorre em p=0,25, com V(X)=0,1875. Então
7
o s
−0,02 0,02 −0,02 0,02
P |pg − p| > 0,02 ≤ 1 − P </< = 1 − P: </< >
n 0,1875 r 0,0125 0,0125
p p0,1875
m 1200 1200 q
P |pg − p| > 0,02 ≤ 1 − P −1,6 < / < 1,6 = 2t1 − Φ 1,6 u = 0,1096
Portanto, nas condições e hipóteses do exercício, com uma amostra de tamanho n=1200, e sabendo a priori
que p se situa entre 10 e 25%, a probabilidade de um erro de estimativa superior a 2 pontos percentuais é,
no máximo, 10,96%. Com amostra duas vezes maior este limite superior cai – você pode fazer as contas –
para 2,36%. No outro extremo, a menor variância possível, correspondente a p=0,10, é V(X)=0,09 e
V(S1200)=75×10-6. Neste caso, com n=1200, P |pg − p| > 0,02 ≈ 0,0209 ou 2,09%; com n=2400 essa
probabilidade cai para 0,1%. Fazer todas essas contas é um bom exercício.
Alguns exercícios elementares com a Distribuição Normal
1. Seja Z~N(0, 1). Calcule

a. P{Z<a} para a = −4,0 − 1,2, 0,8, 2,2, 6,0
b. P{Z>b} para b = −3,85 − 1,27, 0,09, 1,235, 5,8
c. P{a<Z<b} para a, b = −1,27, −0,25 , −0,67, 1,25 , 0,60, 0,95
2. Seja X~N(100, 25). Calcule:

a. P{X<a} para a = 86, 104
b. P{a<X<b} para a, b = 85, 120 , 90, 98 , 92, 106
3. Sejam X1, X2, …, Xn i. i. d. N(10, 4), e
E = Yxy E , E , Ez , ⋯ , E , E = Y& E , E , Ez , ⋯ , E , | = ∑}R E} E~ = |.
Calcule
a. P{T>120} quando n=10

b. S<10,10} para n=100 e n=400
P{9,90<X
c. P{X(1)<4} para n=1, 10, 100 e 1000
d. P{X(n)>19} para n=1, 10, 100 e 1000
4. Nas condições do exercício anterior, determine o valor de n para que:

a. S<10,01}=0,95
P{9,99<X
b. P{X(1) < 2} = 0,99
c. P{X(n) > 18} = 0,99
8
Exercício 3.2.5 – Diversos aspectos importantes relativos às condições gerais de uma grande população
podem ser monitoradas com precisão e objetividade através de pesquisas nas quais apenas uma fração
ínfima dos indivíduos da população – selecionados por sorteio
Anos de
População x P{X=x}
escola aleatório – precisam ser avaliados. Este exemplo, com dados
0 5.147 0 0,0016
simulados, mostra como a escolaridade média de jovens
1 13.511 1 0,0042
2 21.875 brasileiros de 15 anos de idade, pode ser estimada de forma 2 0,0068
3 32.812 3 0,0102
rápida, econômica e muito precisa. Suponhamos inicialmente
4 46.644 4 0,0145
5 261.208 a subpopulação de jovens de 15 anos, distribuída, por anos de 5 0,0812
6 38.280 6 0,0119
escolaridade formal completados com sucesso, como na tabela
ao lado. Nela, a escolaridade média é: x~ = ∑€R x ∙ N€ =

7 76.560 7 0,0238
•
8 513.233 8 0,1595
8,30 anos, onde Nx é o número de indivíduos na subpopulação

9 1.924.812 9 0,5984
10 256.061 10 0,0796
11 26.056 estudada, com x anos de escolaridade, e N é o tamanho total 11 0,0081
12 643 12 0,0002
da subpopulação. Nesse exemplo, com dados fictícios (mas não
de todo dessemelhantes da situação real) N = ∑€R N€ = 2.216.842. O desvio
Total 3.216.842
quadrático médio de X na subpopulação, definido como S5 = ∑•

QR xQ − x
~ , pode ser, neste caso,
•
reescrito como S5 = ∑€R N€ x − x~ , é igual a 2,745, e mede o quão espalhados os indivíduos estão,
•
em termos de escolaridade, em torno da escolaridade média, 8,30.
Suponha agora um experimento aleatório: sorteio aleatório de um dos indivíduos daquele grupo. Por
sorteio aleatório, aqui, nos referimos ao sorteio no qual cada um dos indivíduos da população amostrada
tem a mesma chance de vir a ser o escolhido. Seja X, agora, a variável aleatória correspondente ao número
de anos de escolaridade do jovem selecionado. A distribuição deS probabilidades de X pode então ser
derivada da tabela à esquerda, com p€ = . A esperança de X pode então ser calculada: E X =

••
•
∑€R x ∙ P X = x = ∑€R x ∙ = ∑€R x ∙ N€ = x~. A esperança de X é igual à média populacional de x, e

••
• •
isto decorre do sorteio aleatório, que dá a cada indivíduo na população a mesma chance se ser sorteado.
De forma análoga pode-se mostrar que V X = S5 .
Estes dois resultados são importantes e abrem o caminho para a estimativa de x~, a média populacional de
x. Para isto vamos repetir o experimento acima, n vezes. Os resultados parciais são X1, X2, …, Xn,
independentes e identicamente distribuídos, com esperança x~ = 8,30 e variância S5 = 2,745.
S O = ∑OQR XQ temos E S
Fazendo X XO = x~ = 8,30, V S
XO = S5 =
,„…
e, se n não for muito pequeno, S
X
O O O
terá distribuição aproximadamente normal. Seja, por exemplo, uma amostra de n=275 indivíduos. Nesse
SO =
caso, V X S O N(8,30, 0,01), portanto o desvio padrão de X
S5 = 0,01 e X S O é 0,10 e, ao realizar a
„
amostra, a média amostral cairá a menos de 0,2 ano de distância do alvo, a média populacional x~ =
8,30anos, com probabilidade 0,95.
Este exemplo ilustra o poder da amostragem aleatória: com uma amostra de apenas 275 indivíduos, a média
de x em uma população de mais de três milhões de jovens pode ser estimada com grande precisão. Com
S cairia à metade, e o intervalo em torno de
uma amostra quatro vezes maior, n-1100, o desvio padrão de X
9
x~ com probabilidade 0,95 seria teria largura total de apenas 2 décimos de ano, ou x~ − 0,1, x~ + 0,1 . Não
é um mau resultado, considerando que a população estudada tem mais que três milhões e duzentos mil
indivíduos.
Exemplo 3.2.5 – Considere o D , experimento composto, formado por 50 arremessos sucessivos e

independentes de um dado comum de 6 lados. Sejam X1, X2, …, X50 os cinquenta resultados parciais
independentes e o resultado acumulado é dado por
T = ˆ XQ
QR
Como E(X)=3,5 e V(X)= 2,916667, temos V(T)=175 e V(T)=145,83333. As probabilidades de P{T=t} foram calculadas usando
algoritmo já descrito, para t de 0 a 300. Para P{T=175}, por exemplo primeiro determinamos o número de maneiras
diferentes existem de se obter 175 pontos em 50 arremessos de um dado. Esse número é
50
26.617.249.029.052.500.000.000.000.000.000.000.000, o qual, dividido por 6 resulta em P{T=175}=0,032930676. O
valor da f.d.p. da normal correspondente, em t=175 é 0,033035559, uma diferença de 0,32%. Este erro relativo tende a
crescer em direção às caudas da distribuição, na medida em que se afasta da esperança.
Essa distribuição de probabilidades está representada na figura abaixo.
0,035
0,030
0,025
0,020
0,015
0,010
0,005
0,000
120
125
130
135
140
145
150
155
160
165
170
175
180
185
190
195
200
205
210
215
220
225
230
Para comparação, o gráfico acima e a curva correspondente à função de densidade de probabilidades da normal
correspondente, N(175, 145,83333), são sobrepostos na mesma figura abaixo. A quase perfeita sobreposição das duas
distribuições de probabilidades atesta a convergência do total de n arremessos de um dado à normal correspondente
(de mesma esperança e mesma variância), quando n é grande.
10
0,035
0,030
0,025
0,020
0,015
0,010
0,005
0,000
120
125
130
135
140
145
150
155
160
165
170
175
180
185
190
195
200
205
210
215
220
225
230
Cálculos precisos podem ser feitos para probabilidades como P{T<180}, usando-se, em lugar dos cálculos exatos (mas
numericamente laboriosos), a aproximação normal:
P{T<180}≈P{Y<179,5} com Y~N(175, 145,83333). Para este caso, temos o valor exato P{T<180}=0,644909, que bem
aproximado por P{Y<179,5}=0,64529, com um erro relativo de apenas 0,059%
Exercício 3.2.6 – Na figura abaixo está representada a função de distribuição de probabilidades da

pontuação total em 100 arremessos de um dado comum de 6 lados. Mostre com argumentos numéricos
que essa distribuição pode ser aproximada com grande precisão da normal correspondente.
0,025
0,020
0,015
0,010
0,005
0,000
290
295
300
305
310
315
320
325
330
335
340
345
350
355
360
365
370
375
380
385
390
395
400
405
410
11
3.4 – Construindo intervalos de confiança para a esperança de X
Seja X uma variável aleatória de esperança µ, desconhecida. Considere o problema de construir um intervalo de
confiança para µ, com base em n observações independentes de X. Primeiro vamos considerar a situação mais
favorável em que a variância, σ2, é conhecida. De X1, X2, X3, …, Xn tiramos S

XO = ∑OQR XQ = SO . Vamos admitir que
O O
n é grande o suficiente para que a distribuição de S

XO possa, com segurança, ser aproximada pela Normal de esperança
σ .
O
m e variância Sabemos então que
σ σ
P :μ − 1,96 S O < ‰ + 1,96
<X > = 0,95
√n √n
Portanto
σ σ
S O − 1,96
P: X S O + 1,96
< ‰<X > = 0,95
√n √n
Podemos então concluir que, ao realizar as n observações independentes, a probabilidade do intervalo

S O − 1,96
X
7
S O + 1,96
, X
7
SO
# incluir o parâmetro µ é 0,95. Uma vez realizadas as n observações e calculado X
√O √O
S O − 1,96
poderemos afirmar, com 95% de confiança que, ‰ ∈ X
7
S O + 1,96
, X
7
#.
√O √O
Exemplo 3.3.1 – Uma variável aleatória X tem variância conhecida, σ2=12, mas esperança µ desconhecida. Com o
objetivo de se estimar µ, 300 observações independentes são feitas da variável X. A soma dos 300 valores observados
S
resultou em 7725, portanto X =
z ‹
Sz
= 25,75. A variância de A variância de X
z
é, portanto, igual a 0,04; seu
desvio padrão, 0,20. Embora, inicialmente, nada se soubesse de m, podemos agora afirmar, com 95% de confiança,
que µ é algum valor no intervalo (25,75-1,96×0,20 , 25,75+1,96×0,20) = (25,358 , 26,142).
Diz-se então que (25,358 , 26,142) é um intervalo de 95% de confiança (resumidamente, um i95%c) para µ.
3.4 – Construção de intervalos de confiança com a distribuição t de Student
Numa classe mais geral de problemas, quer-se fazer inferências sobre a esperança de uma variável aleatória, como
SO − k
na seção anterior, mas a variância de X é desconhecida. Assim, intervalos de confiança do tipo X
7
SO +
, X
√O
k # não poderão ser construídos, simplesmente porque o parâmetro σ é desconhecido.

7
√O
A saída foi encontrada por W. Gosset, que em um artigo de 1.904, sob o pseudônimo Student, deduziu a expressão
S• 6
√y. Vamos a este resultado.
5
"
algébrica da distribuição da estatística
Seja X~N(µ, σ2), e sejam X1, X2, …, Xn, n observações independentes de X, com S
S
XO = ∑OQR XQ . Já sabemos que • √n
5 6
O 7
tem distribuição N(0, 1) e utilizamos este fato para construir intervalos de confiança para µ em situações em que σ é
conhecido.
12
Com σ desconhecido, lançamos mão de s = SO

∑OQR XQ − X
O
como substituto para σ2. De fato, da mesma forma
como S
XO converge para µ na medida em que n cresce, s2 converge para σ2. A prova deste resultado não será feita
neste capítulo.
SO − k
A ideia de usar intervalos da forma X
Ž
SO + k
, X
Ž
#, com s no lugar de σ, ocorre naturalmente, mas depara
√O √O
S• 6
√n não é N(0, 1). Desta forma, não podemos tirar a constante k da tabela
5
Ž
com uma dificuldade: a distribuição de
da normal padrão, como fizemos com k=1,96, para i95%c.
Student resolveu o problema deduzindo a expressão da

função de densidade de probabilidades da variável
S• 6
aleatória TO = √n. Ela depende de n; sua dedução
5
Ž
é trabalhosa, mas elegante e relativamente simples. Ela

demanda alguns conceitos que ainda não foram tratados
e será apresentada em capítulo mais adiante. A função
de densidade de probabilidades de Tn é
• •
‘ #
fO t = 1+ # , para -∞<t<∞
$ €$ $
’ O *‘
•“”
# O
$
A função gama que aparece na expressão acima é

Γ = — t€ e ˜ dt.
4
definida como Em justa
homenagem a Gosset, a variável aleatória Tn é dita ter
distribuição t de Student, com (n-1) graus de liberdade.
A figura ao lado, representa f.d.p. da t de Student com 5 graus de liberdade, superposta à f.d.p. da normal padrão. As
semelhanças são óbvias, mas a t tem uma cauda mais pesada. Na medida em que os graus de liberdade vão
aumentando, a t vai se aproximando da normal padrão, de forma que para 100 ou mais graus de liberdade, as
diferenças são irrelevantes para a maioria das aplicações práticas. Uma tabela no final deste capítulo dá valores
críticos para a t de Student, para a construção de intervalos de 90, 95 e 99%, para graus de liberdade indo de 1 a 100.
Para tamanhos amostrais grandes, usa-se os valores críticos da N(0,1).
Exemplo 3.4.1 – Numa inspeção regular de rotina, técnicos do IMETRO, percorrendo vários pontos de venda na
cidade, selecionam uma amostra aleatória de 16 pacotes de determinado detergente, com peso líquido nominal de
1000 g. Levadas ao laboratório e analisadas, as
1024 988 985 1000 981 1006 999 986
amostras apresentaram os pesos líquidos reais na
992 975 1001 987 1012 995 998 999
tabela ao lado. Vamos construir um i95%c para o peso
médio real com que os pacotes estão sendo produzidos pelo fabricante. Temos ∑}R E} =15.928 e
S=
∑}R E} =15.858.572, logo X
.‹ ™
= 995,5g e S = S
∑QR XQ − X = S œ = 149,87g2. Da
›∑QR XQ − 16 ∙ X
tabela, tiramos F-1(0,975)=2,131, onde F-1 é a inversa da função acumulada de distribuição de probabilidades de uma
t de Student com 15 graus de liberdade. Logo, o i95%c para a média é 995,5±2,13145×p

…‹,™„
, ou (989,8, 1002,0).
13
Com base na amostra, podemos afirmar, com 95% de confiança, que os pacotes vêm sendo produzidos com peso
líquido médio no intervalo (989,8, 1002,0). Não dá, portanto, para descartar a hipótese de que a calibração na fábrica
esteja correta, ou seja, que os pacotes vem sendo produzidos com peso médio igual a 1000 g, como declarado no
rótulo do pacote.
Exemplo 3.4.1 – O tempo de resposta de um motorista de caminhão a determinado estímulo visual é medido, em
milésimos de segundo, quatorze vezes, independentemente, e em condições bem controladas. Os resultados são
dados na tabela abaixo, e são representados no diagrama de pontos.
188 187 210 190 177 192 192 180 173 179 191 187 198 170
Queremos aqui construir um intervalo de confiança para τ, o tempo médio de resposta para o motorista, sob as
˜̅ ž
condições gerais do experimento. Sabendo que T = √n tem distribuição t de Student, com n-1 graus de
Ž
liberdade, podemos então afirmar que
˜̅ ž
?−2,160 < √14 < 2,160A = 0,95
Ž
Logo,
?−2,160 ∙ < t̅ − τ < 2,160 ∙ A = 0,95

Ž Ž
√ … √ …
s s
:−t̅ − 2,160 ∙ < − < −t̅ + 2,160 ∙ > = 0,95
√14 √14
Multiplicando os termos a desigualdade por -1, temos que inverter os sinais de desigualdade. Assim:
s s
:t̅ + 2,160 ∙ > > t̅ − 2,160 ∙ > = 0,95
√14 √14
E, portanto
s s
:t̅ − 2,160 ∙ < < t̅ + 2,160 ∙ > = 0,95
√14 √14
Sabemos então que a probabilidade do intervalo aleatório t̅ − 2,160 ∙ , t̅ + 2,160 ∙ # vir a conter o parâmetro
Ž Ž
√ … √ …
desconhecido τ é igual a 0,95.
Dos valores observados, t1, t2, ..., t14, tiramos:
… …
1 1
t̅ = ˆ t Q = 186,7 e s = ˆ t Q − t̅ = 109,5
14 13
QR QR
14
Daí, construímos um intervalo de 95% de confiança para τ:
186,7 − 2,160 ∙ , t̅ + 2,160 ∙ #, ou (180,7 , 192,8).

, ,
√ … √ …
Afirmamos, então, com 95% de confiança, que – sob as condições gerais definidas para o experimento – o tempo
médio de respostado motorista, τ, está contido no intervalo (180,7 , 192,7) milissegundos.
Sobre a questão da divisão por (n-1)
No cálculo de s2, como no exemplo acima, usamos a expressão s = ∑OQR xQ − x~ . A soma de n parcelas e a
O
divisão por (n-1), e não por n, sempre causa dúvida e desconforto. Vamos explicar, primeiro no contexto de uma
população finita.
Suponha uma população de N indivíduos, aos quais estão associados valores de uma variável quantitativa, X. Sejam
X1, X2, …, XN os valores de X associados aos indivíduos 1, 2, …, N, respectivamente.
Definimos agora dois parâmetros populacionais, S

X e S , respectivamente a média e o desvio quadrático médio,
populacionais, de X:
• •
1 1
S=
X S
ˆ XQ e S = ˆ XQ − X
N N
QR QR
Devemos resistir à tendência de chamar S2 de variância de X, uma vez que esta é um parâmetro associado a uma
variável aleatória e, até o momento não há nada aleatório no esquema montado: Uma população, uma variável
quantitativa e dois parâmetros populacionais dessa variável.
Vamos agora introduzir certo esquema probabilístico: a seleção aleatória de um dos indivíduos da população e a
determinação do valor de X para esse indivíduo; seja x esse valor. Agora, x é uma variável aleatória. Se o esquema de
sorteio aleatório adotado foi tal que qualquer dos N indivíduos da população teve a mesma chance 1/N de ser
sorteado, então
• •
1 1
S
E x = ˆ ¡XQ ∙ ¢ = ˆ XQ = X
N N
QR QR
• •
1 1
S
V x =E x−X S
= ˆ £ XQ − X S
∙ ¤ = ˆ XQ − X =S
N N
QR QR
Vemos agora a associação entre V(x) e S2: se um indivíduo for selecionado ao acaso, de forma que cada indivíduo na
população tenha a mesma chance de vir a ser sorteado, e, fazendo x igual ao valor da variável X para aquele
S e S por µ e σ2, respectivamente.
indivíduo, então V(x)=S2. Vamos então, respeitando a convenção, representar X
15
Suponha agora um sorteio se n indivíduos da população, sendo n<N. Aos valores observados de X, denominaremos
x1, x2, … , xn, e seja x~ = ∑OQR xQ . Para garantir a independência entre os xi’s, podemos adotar o sorteio com
€
reposição: cada indivíduo selecionado é reposto na população, podendo inclusive vir a ser selecionado novamente.
Desta forma, após cada sorteio a população é restaurada à sua integridade, e o novo indivíduo sorteado o será em
condições exatamente idêntica às do anterior, garantindo a independência entre os resultados. Sabemos, então,
que
1 1
S = μ e V x~ =
E x~ = X S = σ
n n
Agora, vejamos o que acontece com o desvio quadrático médio amostral, ∑OQR xQ − x~ . Como veremos, sua
O
esperança não é σ2, logo, se o utilizarmos como o estimador da variância, teremos um estimador viciado. Vejamos:
Et xQ − x~ u = Et xQ − µ + µ − x~ u = Et xQ − µ + μ − x~ + 2 xQ − µ μ − x~ u
Separando os termos em colchete:
Et xQ − x~ u = Et xQ − µ u + Et μ − x~ u + 2Et xQ − µ μ − x~ u
Et xQ − x~ u = V xQ + V x~ + 2tµE xQ + µE x~ − E xQ x~ − µ u
1
Et xQ − x~ u = σ + σ + 2tµ + µ − E xQ x~ − µ u
n
n+1
Et xQ − x~ u = σ + 2µ − 2E xQ x~
n
Precisamos agora determinar E xQ x~ . Ora,
x + x + ⋯ + xQ + ⋯ + xO 1
xQ x~ = xQ = ›xQ x + xQ x + ⋯ + xQ + ⋯ + xQ xO œ
n y
Como os xi’s são independentes entre si, então E(xixj) é igual a µ2 para i≠j, e µ2+σ2 para i=j. Logo,
1 1
E xQ x~ = nμ + σ =μ + σ
n n
Podemos então concluir que
n+1 1 n+1 2 n−1

Et xQ − x~ u = σ + 2µ − 2 ¡μ + σ ¢ = σ − σ = σ
n n n n n
Portanto,
O
E ¥ˆ xQ − x~ ¦ = n − 1 σ
QR
Ou seja,
16
O
1 n−1
E ¥ ˆ xQ − x~ ¦ = σ
n n
QR
Diferente de σ2, portanto. Por outro lado,
O
1
E¥ ˆ xQ − x~ ¦ = σ
n−1
QR
∑OQR xQ − x~ como o estimador mais apropriado (não tendencioso) de σ2.

O
Usamos, então,
Note que E(xi - µ)2=σ2. Portanto, se µ não fosse desconhecido, poderíamos estimar σ2 pelo desvio quadrático amostral
médio, ∑OQR xQ − μ , cuja esperança é exatamente σ2, um estimador não tendencioso, portanto. Por não conhecer
O
µ, calculamos os desvios quadráticos das observações, não em torno de µ, mas de seu estimador, x~ = ∑OQR xQ . Isto
€
reduz um pouco a soma de quadrados pois, como é simples provar, dado um conjunto de valores reais, x1, x2, … , xn,
a soma de desvios quadráticos destes valores em torno de um número arbitrário c, ∑OQR xQ − c é mínima quando
§ = x~ = ∑O xQ . Portanto, ∑OQR xQ − x~ ≤ ∑OQR xQ − μ , com a igualdade valendo apenas quando coincidir

€ QR
x~ = μ. Como a esperança da somatória ao lado direito da desigualdade é σ2, a da esquerda tem que ser menor que
σ2. E é, como vimos: W © ∑OQR xQ − x~ ª = . Multiplicando ambos os lados por , restauramos o “equilíbrio”,
com W © ∑OQR xQ − x~ ª = .
Pronto, está explicado.
Testando hipóteses simples sobre a esperança de uma variável aleatória X
Um dos recursos básicos mais poderosos da Estatística com peça central do Método Científico, é a possibilidade que
ele oferece para se testar (cientificamente) hipóteses sobre a esperança desconhecida de uma variável aleatória. Seja
a variável aleatória
X ~ N(µ, σ2)
e n observações independentes de X:
X1, X2, … , Xn
Sejam as estatísticas Z e T definidas como:
S
X−μ S
X−μ
Z= √n e T = √n
σ s
onde
• •
1 1
S=
X ˆ XQ e s = S
ˆ XQ − X
n n−1
QR QR
A estatística Z tem distribuição N(0, 1) enquanto T tem distribuição t de Student, com n-1 graus de liberdade.
17
Considere agora que a esperança µ seja desconhecida, e que se queira testar, contra a hipótese nula
H0: µ=µ0
a hipótese alternativa
H1: µ>µ0
S grande demais é
Consideremos primeiro o caso em que o desvio padrão σ é conhecido. É claro que um valor de X
evidência contra H0, e em favor de H1. O questão aqui é, o que é “grande demais”?
S for maior que c,

Para um tratamento objetivo deste caso, devemos definir um valor crítico c tal que, se X
S não for maior que c,
consideraremos que é grande demais, e rejeitaremos H0 em favor de H1. Por outro lado, se X
consideraremos que os dados experimentais não trouxeram evidência suficiente contra H0, e não rejeitaremos, então
a hipótese nula.
Como escolher o valor crítico c? Se escolhermos c grande demais, será quase impossível rejeitar indevidamente a
hipótese nula quando ela for verdadeira, mas a probabilidade de não rejeitá-la quando ela for falsa poderá ser muito
elevada. Dizemos que o critério de decisão fica conservador demais. Por outro lado, se escolhermos um valor crítico
c pequeno, teremos o problema oposto, com elevada probabilidade de rejeitar H0 sendo esta hipótese verdadeira. A
solução é adotar uma solução de compromisso, balanceando as probabilidades dos dois erros opostos possíveis:
rejeitar uma hipótese nula verdadeira, ou não rejeitar uma hipótese nula falsa.
Para isto, vamos fixar um valor suficientemente baixo para a probabilidade de rejeitarmos H0 quando esta hipótese
for verdadeira, isto é, a esperança de X for, de fato, igual ao valor fixado µ0. Seja α este valor “suficientemente baixo”.
A constante c é então escolhida para garantir que, se H0 for verdadeira, então
S>§ =α
PX
Ora, se H0 for verdadeira, a estatística Z terá distribuição N(0, 1), então

c−μ
PS
X > § = P ?Z > √n A = α
σ
Portanto,
c−μ c−μ
Φ √n# = 1 − α e Φ 1−α = √n
σ σ
Podemos então extrair o valor crítico c, em função de µ0, σ, n e α:
c=μ + Φ 1−α .
7
√O
Fica então completamente definida uma abordagem para o problema de testar a hipótese H0: µ=µ0 , contra a hipótese
alternativa H1: µ>µ0 :
1. Escolhe-se α, um valor suficientemente pequeno para a probabilidade de se rejeitar indevidamente a

hipótese nula H0;
2. Define-se n, o número de observações a serem feitas da variável aleatória X;
18
3. Faz-se as n observações independentes de X;

4. Calcula-se a estatística T;
5. Rejeita-se H0 se T for maior do que c.
Vejamos um exemplo:
Seja X uma variável aleatória com distribuição Normal, com média µ e desvio padrão σ. A esperança de é desconhecida, mas
acredita-se que seja igual a 100. Contudo, existe uma corrente de opinião que afirma que afirma que µ é, na verdade, maior
que 100. O desvio padrão de X, é σ=4, conhecido. Para se testar a hipótese conservadora H0: µ=100, contra a hipótese
alternativa, H0: µ>100, decide-se pela abordagem experimental: serão feitas n observações independentes de X, rejeitando-
se H0 se S
X for muito grande. Como proteção contra a rejeição de H0 quando esta hipótese for verdadeira, arbitrou-se um valor
α=0,05.
Neste caso, c = μ + Φ 1 − α = 100 + × 1,645 Através de experimentos cuidadosamente controlados,

7 …
√O √O
realiza-se n=30 observações independentes de X, portanto o valor crítico c é igual a 101,2. Os 30 valores observados estão
listados na tabela abaixo. obtendo-se os valores dados na tabela ao abaixo, cuja
101,7 98,3 94,8 102,1 103,7 99,4 104,0 98,7 101,3 99,9 média é S
X = 101,78, que, sendo maior que
106,2 101,5 104,2 107,0 106,0 102,1 102,1 110,2 94,5 102,6 o valor crítico c=101,2, leva à rejeição de H0.
104,5 103,0 99,5 104,3 91,5 100,3 99,4 103,6 106,7 100,2
Testando hipótese simples sobre uma média
1. O teste de tempo de resposta a objeto em queda, realizado em sala, as distâncias percorridas pela régua desde
o repouso até a reação, em 16 medições sucessivas com o mesmo estudante, são dadas abaixo, em cm.
observação 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Distância (cm) 13 17 15 13 15 15 10 13 15 11 16 13 13 11 14 13
Seja τ o tempo médio de resposta do aluno, em milissegundos (ms). Teste
H0: τ=150 ms versus H1: τ>150 ms ao nível de significância α=0,05.
Exercícios
19
1. Em duas regiões R1 e R2 distintas estão cinco cidades, sendo duas em R1 e três em R2. Em cada cidade existe certo número de
estudantes concluindo o ensino fundamental. Uma
Tabela 1 – Número de alunos por cidade e número de questões que prova de três questões será aplicada a esses
consegue resolver corretamente
estudantes. Seja N o número de questões que um
estudante sabe resolver; N pode, então, valer 0, 1, 2
Número de questões da plrova que o Total por
Região e ou 3. A distribuição dos estudantes, por
aluno sabe responder corretamente cidade e
Cidade
0 1 2 3 por região cidade/região e nota é como mostra a Tabela 1. Um
R1 C1 1.200 1.950 2.870 2.220 8.240 experimento aleatório consiste em sortear um aluno
R1 C2 4.200 8.330 2.140 830 15.500
ao acaso, e aplicar-lhe a prova e registrando em X o
Total R1 5.400 10.280 5.010 3.050 23.740
número de questões que soube responder
R2 C3 1.260 4.320 6.950 5.370 17.900
R2 C4 827 2.895 12.840 6.870 23.432 corretamente, isto é, fazer X=N. Este experimento é
R2 C5 120 840 5.540 12.640 19.140 repetido sucessiva e independentemente, n vezes,
Total R2 2.207 8.055 25.330 24.880 60.472 S O e Sn e conforme
gerando X1, X2, X3, … , Xn e, daí, X
Total 7.607 18.335 30.340 27.930 84.212 definidos.
a. Considerando todos os alunos como um
Se
único grupo, sem distinção de região e cidade, calcule N S2, respectivamente a média e o desvio quadrático
médio de N.
b. Calcule E(X) e V(X).
c. Calcule P{X=0}\C1, isto é, a probabilidade condicional de o aluno tirar 0 dado que é da cidade 1.
d. Calcule E(X) dado C1.
e. Calcule E(X) dado R2.
f. Calcule V(X) dado R1.
g. Calcule a probabilidade que dos primeiros 20 alunos selecionados, exatamente seis respondam corretamente as
três questões.
h. Qual a probabilidade que o trigésimo aluno sorteado seja de C2, dado que ele acertou as três questões?
i. Qual a probabilidade do oitavo aluno sorteado não ser de C5, dado que ele não acertou as três questões.
j. S O como estimador de N
Para n=400, calcule a probabilidade de que, usando X S , se cometa um erro absoluto
S ; isto é, que X
superior a 1% de N S O caia fora do intervalo 0,99 ∙ N
S , 1,01 ∙ N
S
k. Nesta amostra de 400 alunos, seja n3 o número de alunos com nota perfeita. Calcule P{n3=150}
l. Ainda com n=400, construa um intervalo de probabilidade 0,95 para n0.

m. SO − N
Qual deveria ser o tamanho amostral n para que P |X S | > 0,01N
S =0,05?
2. A tabela contém dados simulados, porém com características semelhantes à situação real. Imagine que para uma prova do
ENEM, com 180 questões, hajam 4.817.768 alunos inscritos, e que esses alunos, distribuídos por número de questões que
conseguem resolver corretamente na prova, formam a tabela apresentada abaixo (ela pode ser copiada e colada numa
planilha Excel; ou pode ser copiada diretamente de EnemSimula no Teleduc). Numa prova frequentemente o aluno não tira a
nota que merece por errar – por algum descuido – alguma questão que sabe resolver bem, ou, principalmente em provas
com questões de múltipla escolha, acertar, por sorte no ‘chute’ questões que não sabe resolver. Vamos admitir que com as
questões sendo corrigidas individualmente, com avaliação completa de todo o desenvolvimento apresentado, esses
problemas podem ser completamente eliminados. Use computador para os cálculos.
3. Em média, quantas questões os alunos resolverão na prova? Denomine-a M.
4. S.
Numa escala de 0 a 100, qual será a nota média geral? Denomine-a N
5. Se um aluno for sorteado ao acaso e submetido à prova, seja X o número de questões que saberá responder corretamente.
Calcule E(X) e V(X).
20
6. SO e
Se uma amostra aleatória de n estudantes for sorteada do universo e submetida à prova, gerando X1, X2, X3, … , Xn e, daí, X
Sn e conforme definidos, determine E S
XO e V S
XO .
7. S O − M| > 2 , a probabilidade que X
Para n=1000, calcule P |X S O caia a mais que dois pontos (duas questões certas) de
distância de M.
8. S O − M| > 1 .
Para n=1000, calcule P |X
9. S O − M| > 1 = 0,05?
Qual deve ser n para que P |X
S O − M| > 2 ?
10. E no caso acima, quanto seria P |X
11. Considerando os resultados acima, comente sobre as virtudes de S
XO como um estimador barato e preciso de M.
80.000
70.000
60.000
50.000
40.000
30.000
20.000
10.000
0
0
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
160
170
180
Tabela: Distribuição geral dos alunos por número de questões da prova que sabe resolver
número número número número número número

nota de nota de nota de nota de nota de nota de
alunos alunos alunos alunos alunos alunos
0 0 30 48693 60 67899 90 36539 120 7832 150 404
1 142 31 51362 61 63942 91 33353 121 7692 151 344
2 522 32 52836 62 67424 92 33603 122 7375 152 306
3 1188 33 52438 63 62679 93 31162 123 6683 153 251
4 1944 34 55470 64 61224 94 30006 124 5950 154 214
5 3010 35 58156 65 60830 95 30163 125 5907 155 168
6 4021 36 56250 66 64751 96 28851 126 5367 156 140
7 5643 37 60134 67 60285 97 27193 127 4918 157 122
8 6799 38 58713 68 59942 98 26928 128 4364 158 97
9 8880 39 62721 69 56661 99 24009 129 4154 159 75
10 10423 40 62675 70 56570 100 24010 130 3879 160 58
11 11765 41 61629 71 56645 101 22722 131 3650 161 46
12 13530 42 62800 72 54812 102 22432 132 3386 162 37
13 15949 43 68441 73 55950 103 21826 133 3066 163 28
14 17305 44 69439 74 52262 104 20278 134 2784 164 21
15 20079 45 65852 75 53477 105 19179 135 2363 165 16
16 21631 46 65925 76 49361 106 17448 136 2312 166 11
17 24971 47 65397 77 52459 107 17540 137 2129 167 7
18 27549 48 69677 78 47002 108 16609 138 1759 168 5
19 27425 49 70524 79 49981 109 16004 139 1729 169 3
20 31799 50 66006 80 45242 110 14834 140 1421 170 2
21 31519 51 69201 81 45360 111 14014 141 1371 171 1
22 36194 52 66818 82 43634 112 13770 142 1169 172 1
23 35284 53 71403 83 45433 113 12435 143 1037 173 0
24 38375 54 70700 84 43774 114 11564 144 892 174 0
25 43203 55 70770 85 40566 115 11048 145 838 175 0
26 42531 56 67419 86 41851 116 11037 146 744 176 0
27 45963 57 68550 87 37850 117 10408 147 651 177 0
21
28 44525 58 67948 88 38946 118 9081 148 516 178 0

29 49498 59 69660 89 36070 119 8788 149 474 179 0
180 0
12. No Brasil existem cerca de 2,5 milhões de jovens cursando o terceiro ano do ensino médio. Quer-se estimar p,
a fração desses estudantes que sabe resolver a questão de geometria plana abaixo.
Suponha que p=0,50. Se 1000 estudantes forem amostrados ao acaso, qual a probabilidade de que a franção
deles que sabe resolver a questão esteja a menos que 3 pontos percentuais de 0,50?
13.
O quadrado maior tem 4m2 de área. Qual

a área do setor sombreado da figura?
22
Tabelas de probabilidades na Normal Padrão
Φ(z) = P{ Z < z } , para Z~N(0, 1)
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56750 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59484 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67365 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72241
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76731 0,77035 0,77337 0,77637 0,77935 0,78231 0,78524
0,8 0,78815 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
1,0 0,84135 0,84375 0,84614 0,84850 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90148
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92786 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93575 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95544 0,95637 0,95728 0,95819 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97671
2,0 0.977250 0,97778 0,97831 0,97882 0,97933 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98746 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99586 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99737
2,8 0,99745 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
3,0 0,99865 0,99869 0,99874 0,99878 0,99882 0,99886 0,99889 0,99893 0,99897 0,99900
3,1 0,99903 0,99907 0,99910 0,99913 0,99916 0,99918 0,99921 0,99924 0,99926 0,99929
3,2 0,99931 0,99934 0,99936 0,99938 0,99940 0,99942 0,99944 0,99946 0,99948 0,99950
3,3 0,99952 0,99953 0,99955 0,99957 0,99958 0,99960 0,99961 0,99962 0,99964 0,99965
3,4 0,99966 0,99968 0,99969 0,99970 0,99971 0,99972 0,99973 0,99974 0,99975 0,99976
3,5 0,99977 0,99978 0,99978 0,99979 0,99980 0,99981 0,99982 0,99982 0,99983 0,99984
3,6 0,99984 0,99985 0,99985 0,99986 0,99986 0,99987 0,99987 0,99988 0,99988 0,99989
3,7 0,99989 0,99990 0,99990 0,99990 0,99991 0,99991 0,99992 0,99992 0,99992 0,99993
3,8 0,99993 0,99993 0,99993 0,99994 0,99994 0,99994 0,99994 0,99995 0,99995 0,99995
3,9 0,99995 0,99995 0,99996 0,99996 0,99996 0,99996 0,99996 0,99996 0,99997 0,99997
23
Tabela Normal Extrema: Valores de P{Z>z}=1-Φ(z) para z de 2,50 a 4,69 em ppm (partes por milhão); de 4,00 a 4,99
em ppb (partes por bilhão) e de 5,00 a 7,09, em ppt (partes por trilhão)
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
2,50 6 210 6 037 5 868 5 703 5 543 5 386 5 234 5 085 4 940 4 799
2,60 4 661 4 527 4 396 4 269 4 145 4 025 3 907 3 793 3 681 3 573
2,70 3 467 3 364 3 264 3 167 3 072 2 980 2 890 2 803 2 718 2 635
2,80 2 555 2 477 2 401 2 327 2 256 2 186 2 118 2 052 1 988 1 926
2,90 1 866 1 807 1 750 1 695 1 641 1 589 1 538 1 489 1 441 1 395
3,00 1 350 1 306 1 264 1 223 1 183 1 144 1 107 1 070 1 035 1 001
3,10 968 935 904 874 845 816 789 762 736 711
3,20 687 664 641 619 598 577 557 538 519 501
3,30 483 466 450 434 419 404 390 376 362 349
3,40 337 325 313 302 291 280 270 260 251 242
3,50 233 224 216 208 200 193 185 178 172 165
3,60 159 153 147 142 136 131 126 121 117 112
3,70 108 104 100 96 92 88 85 82 78 75
3,80 72 69 67 64 62 59 57 54 52 50
3,90 48 46 44 42 41 39 37 36 34 33
4,00 32 30 29 28 27 26 25 24 23 22
4,10 21 20 19 18 17 17 16 15 15 14
4,20 13 13 12 12 11 11 10 10 9 9
4,30 9 8 8 7 7 7 7 6 6 6
4,40 5 5 5 5 4 4 4 4 4 4
4,50 3 3 3 3 3 3 3 2 2 2
4,60 2 2 2 2 2 2 2 2 1 1
4,00 31 671 30 359 29 099 27 888 26 726 25 609 24 536 23 507 22 518 21 569
4,10 20 658 19 783 18 944 18 138 17 365 16 624 15 912 15 230 14 575 13 948
4,20 13 346 12 769 12 215 11 685 11 176 10 689 10 221 9 774 9 345 8 934
4,30 8 540 8 163 7 801 7 455 7 124 6 807 6 503 6 212 5 934 5 668
4,40 5 413 5 169 4 935 4 712 4 498 4 294 4 098 3 911 3 732 3 561
4,50 3 398 3 241 3 092 2 949 2 813 2 682 2 558 2 439 2 325 2 216
4,60 2 112 2 013 1 919 1 828 1 742 1 660 1 581 1 506 1 434 1 366
4,70 1 301 1 239 1 179 1 123 1 069 1 017 968 921 876 834
4,80 793 755 718 683 649 617 587 558 530 504
4,90 479 455 433 411 391 371 352 335 318 302
5,00 286 652 272 150 258 357 245 240 232 766 220 905 209 628 198 908 188 717 179 032
5,10 169 827 161 079 152 768 144 871 137 369 130 243 123 475 117 047 110 943 105 147
5,20 99 644 94 420 89 462 84 755 80 288 76 050 72 028 68 212 64 592 61 158
5,30 57 901 54 813 51 884 49 106 46 473 43 977 41 611 39 368 37 243 35 229
5,40 33 320 31 512 29 800 28 177 26 640 25 185 23 807 22 502 21 266 20 097
5,50 18 990 17 942 16 950 16 012 15 124 14 283 13 489 12 737 12 026 11 353
5,60 10 718 10 116 9 548 9 010 8 503 8 022 7 569 7 140 6 735 6 352
5,70 5 990 5 649 5 326 5 022 4 734 4 462 4 206 3 964 3 735 3 519
5,80 3 316 3 124 2 942 2 771 2 610 2 458 2 314 2 179 2 051 1 931
5,90 1 818 1 711 1 610 1 515 1 425 1 341 1 261 1 186 1 116 1 049
6,00 986,6 927,6 872,1 819,8 770,6 724,2 680,6 639,6 600,9 564,6
6,10 530,3 498,2 467,9 439,4 412,6 387,4 363,7 341,4 320,5 300,8
6,20 282,3 264,9 248,6 233,2 218,8 205,2 192,5 180,5 169,3 158,7
6,30 148,8 139,5 130,8 122,6 114,9 107,7 100,9 94,51 88,54 82,94
6,40 77,69 72,76 68,14 63,80 59,74 55,93 52,35 49,00 45,86 42,92
6,50 40,16 37,58 35,15 32,88 30,76 28,77 26,90 25,16 23,52 21,99
6,60 20,56 19,22 17,96 16,78 15,68 14,65 13,69 12,79 11,95 11,16
6,70 10,42 9,731 9,086 8,483 7,919 7,392 6,900 6,439 6,009 5,607
6,80 5,231 4,880 4,552 4,246 3,960 3,692 3,443 3,210 2,993 2,790
6,90 2,600 2,423 2,258 2,104 1,960 1,826 1,701 1,585 1,476 1,374
7,00 1,280 1,192 1,109 1,033 0,961 0,895 0,833 0,775 0,721 0,671
24
TABELA COMPLEMENTAR
Valores Especiais ou Extremos
z Φ(z) 1-Φ(z)
0,00000 0,500000000 50%
0,25335 0,600000000 40%
0,52440 0,700000000 30%
0,67449 0,750000000 25%
0,84162 0,800000000 20%
1,28155 0,900000000 10%
1,64485 0,950000000 5%
1,95996 0,975000000 2.5%
2,32635 0,990000000 1%
2,57583 0,995000000 0,5%
3,09023 0,999000000 0,1%
3,29053 0,999500000 500 ppm*
3,71902 0,999900000 100 ppm
3,89059 0,999950000 50 ppm
4,26489 0,999990000 10 ppm
4,41717 0,999995000 5 ppm
4,75342 0,999999000 1 ppm
4,89164 0,999999500 500 ppb**
5,19934 0,999999900 100 ppb
5,32672 0,999999950 50 ppb
5,61200 0,999999990 10 ppb
5,73073 0,999999995 5 ppb
5,99781 0,999999999 1 ppb
25
Tabela t de Student
Valores de t, para P{T<t} iguais a 0,90, 0,95, 09,75 e 0,995, para t de Student com 1 a 140 graus de
liberdade. Para infinitos graus de liberdade, a t de Student coincide com a N(0, 1).
Exemplo de uso da tabela: Numa t de Stutent com 10 graus de liberdade, P{T<2,228}=0,95.
P{T<t} P{T<t}
g.l. g.l.
0,900 0,950 0,975 0,990 0,995 0,9 0,95 0,975 0,990 0,995
1 3,078 6,314 12,71 31,821 63,66 31 1,309 1,696 2,040 2,453 2,744
2 1,886 2,920 4,303 6,965 9,925 32 1,309 1,694 2,037 2,449 2,738
3 1,638 2,353 3,182 4,541 5,841 33 1,308 1,692 2,035 2,445 2,733
4 1,533 2,132 2,776 3,747 4,604 34 1,307 1,691 2,032 2,441 2,728
5 1,476 2,015 2,571 3,365 4,032 35 1,306 1,690 2,030 2,438 2,724
6 1,440 1,943 2,447 3,143 3,707 36 1,306 1,688 2,028 2,434 2,719
7 1,415 1,895 2,365 2,998 3,499 37 1,305 1,687 2,026 2,431 2,715
8 1,397 1,860 2,306 2,896 3,355 38 1,304 1,686 2,024 2,429 2,712
9 1,383 1,833 2,262 2,821 3,250 39 1,304 1,685 2,023 2,426 2,708
10 1,372 1,812 2,228 2,764 3,169 40 1,303 1,684 2,021 2,423 2,704
11 1,363 1,796 2,201 2,718 3,106 50 1,299 1,676 2,009 2,412 2,678
12 1,356 1,782 2,179 2,681 3,055 55 1,297 1,673 2,004 2,403 2,668
13 1,350 1,771 2,160 2,650 3,012 60 1,296 1,671 2,000 2,396 2,660
14 1,345 1,761 2,145 2,624 2,977 65 1,295 1,669 1,997 2,390 2,654
15 1,341 1,753 2,131 2,602 2,947 70 1,294 1,667 1,994 2,385 2,648
16 1,337 1,746 2,120 2,583 2,921 75 1,293 1,665 1,992 2,381 2,643
17 1,333 1,740 2,110 2,567 2,898 80 1,292 1,664 1,990 2,377 2,639
18 1,330 1,734 2,101 2,552 2,878 85 1,292 1,663 1,988 2,374 2,635
19 1,328 1,729 2,093 2,539 2,861 90 1,291 1,662 1,987 2,371 2,632
20 1,325 1,725 2,086 2,528 2,845 95 1,291 1,661 1,985 2,368 2,629
21 1,323 1,721 2,080 2,518 2,831 100 1,290 1,660 1,984 2,366 2,626
22 1,321 1,717 2,074 2,508 2,819 105 1,290 1,660 1,983 2,364 2,623
23 1,319 1,714 2,069 2,500 2,807 110 1,289 1,659 1,982 2,362 2,621
24 1,318 1,711 2,064 2,492 2,797 115 1,289 1,658 1,981 2,361 2,619
25 1,316 1,708 2,060 2,485 2,787 120 1,289 1,658 1,980 2,359 2,617
26 1,315 1,706 2,056 2,479 2,779 125 1,288 1,657 1,979 2,358 2,616
27 1,314 1,703 2,052 2,473 2,771 130 1,288 1,657 1,978 2,357 2,614
28 1,313 1,701 2,048 2,467 2,763 135 1,288 1,656 1,978 2,355 2,613
29 1,311 1,699 2,045 2,462 2,756 140 1,288 1,656 1,977 2,354 2,611
30 1,310 1,697 2,042 2,457 2,750 ∞ 1,282 1,645 1,960 2,353 2,576
26
Processo de Ramificação de Galton-Watson
Considere o tempo evoluindo discretamente a passos ∆t e, a cada passo uma partícula

dá origem a N novas partículas e desaparece. N é uma variável aleatória que assume
valores inteiros não negativos: ΩN= {0, 1, 2, 3, 4, …}, com probabilidades P{N=n}=pn e,
portanto, ∑4R = 1. Se N=0, a linhagem de descendência daquela partícula se
extingue. Se N>0, pelo menos uma partícula é gerada, idêntica à partícula original e o
processo continua à geração seguinte. Queremos saber qual a probabilidade do
processo, iniciando no instante t=0 com uma partícula, eventualmente se extinguir. Ou,
no complemento, continuar existindo para sempre.
Na figura ao lado, a partícula inicial (geração G0) gerou 2 partículas. Dessas, uma não gerou nenhuma partícula e sua
linhagem se extinguiu aí em G1, mas a segunda gerou três. Dessas três, a primeira gerou duas, das quais uma não
gerou nenhuma e se extinguiu aí em G3 e a outra gerou uma, que não gerou nenhuma, se extinguindo em G4; a
segunda não gerou nenhuma e a terceira gerou uma, que não gerou nenhuma. Assim, a população em cada geração
foi P0=1, P1=2, P2=3, P3=3, P4=1 e P5=0, ocorrendo então a extinção em G4 da linhagem iniciada em G0.
Olhando da geração zero, com a partícula inicial, seja θ a probabilidade do processo terminar em extinção em
alguma geração m<∞. Então θ é igual à probabilidade da partícula original desaparecer sem gerar ninguém (p0),
mais a probabilidade de gerar uma (p1) e a linhagem desta vir a eventualmente se extinguir (θ); mais a
probabilidade de gerar duas (p2) e a linhagem de cada uma dessas duas vierem a eventualmente se extinguir (θ×θ);
mais.... e assim por diante. Então:
θ = p + p . θ + p . θ + pz . θz + p… . θ… + … = ˆ } ∙θ}
}R
Ora, fazendo ¯ θ = ∑4
}R } ∙ θ } é imediato provar que:
1. g(0)= p0 e g(1)= 1
¯ ² >0, ¯ ² ³ = , ¯ ² ³ =W ´ ≥
° ° °
°± °± ±R °± ±R
2.
¯ ² > 0 Y t0, 1u , logo g(θ) é convexa neste

°$
°± $
3.
intervalo.
A figura ao lado ilustra uma curva g(θ) com suas

características fundamentais. Note que se E(N)<1, então a
curva g(θ) chega em 1 por cima da diagonal e a equação
g(θ)=θ não tem solução em (0, 1) pois g(θ) não cruza a
diagonal nesse intervalo.
Vamos brincar um pouco com N seguindo uma distribuição

de Poisson. A figura abaixo mostra a curva g(θ) para quatro
versões da distribuição de N: P(0,6), P(1), P(1,4) e P(2). Note que apenas as duas últimas configurações permitem
probabilidades de extinção menores que 1.
27
1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,0
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
Extinção
Seja Mi a população (o número de partículas) em Gi. Assim, M0=1 e M1=m com probabilidade pm, para m=0,
1, 2, … . Para os processos com p0>0, existe sempre uma chance não nula do processo vir a, eventualmente,
se extinguir.
Dizemos que um processo se extingue em Gi se esta foi sua última geração com população não nula, ou
seja, Mi>0 e Mi+1=0. Seja Ki , para i=1, 2, 3, …, o evento que corresponde ao processo, iniciando com uma
partícula em G0, se extinga exatamente na i-ésima geração. Os eventos K1, K2, K3, são disjuntos, e sejam κ0,
κ1, κ2, κ3, …, suas respectivas probabilidades.
Seja L0=K0, L1=K0∪K1…, e, genericamente, ¶ = ⋃}R ¸} , o evento correspondente à extinção do processo

antes da geração n+1, ou seja, a probabilidade do processo de ramificação, começando em G0 com uma
partícula, estar extinto em Gn+1 (ou, se extinguir antes da Gn+1). Então, ¶ = ⋃}R ¸} = MO¹ = 0 . Como
os eventos Ki são disjuntos, º = ¶ = ∑}R t¸} u = ∑}R »} .
Evidentemente, κ0=P[K0]=po. A probabilidade de K1 é igual à somatória para todo n>0 da probabilidade da partícula
original gerar n partículas e estas não gerarem nenhuma (pn.p0n), então:
4 4 4
» = t¸ u = ˆ ∙ º = t¶ u = t¸ u + t¸ u = +ˆ ∙ =ˆ ∙
R R R
Para calcular κ2 = P[K2], vamos calcular λ2 = P[L2], a probabilidade de linhagem iniciada com uma partícula em G0 não
chegar à terceira geração, isto é, P{M3=0}. Temos:
28
¶ = ¼ ¸} = ¸ ∪ t K ¿ ∩ K ∪K u
}R
Então
4 4
º = t¶ u = ˆ t¸} u = t¸ u + t K ¿
∩ K ∪K u = » +ˆ ´=y × º = +ˆ × º
}R R R
E, portanto,
4 4 4
» = t¸ u = t¶ u − t¶ u = +ˆ × º −» −» = ˆ ×º −ˆ ×
R R R
Seguindo a mesma linha de raciocínio:
z 4
ºz = t¶z u = ˆ t¸} u = t¸ u + t K ¿
∩ K ∪ K ∪ Kz u = » + ˆ ´=y × º
}R R
4
= +ˆ × º
R
E, generalizando
º = t¶ u = ˆ t¸} u = t¸ u + t K ¿ ∩ K ∪ K ∪ ⋯ ∪ KÁ u=» +ˆ ´=y × º

}R R
4
= +ˆ × º
R
= ´=y =
ÂÃ Â
!
No caso de para n=0, 1, 2, …, com λ=0,8 (portanto E(N)=0,8<1 e extinção ocorrerá com
probabilidade 1, ou seja λm→1 quando m→∞), temos:
n 1 2 3 4 5 6 7 8 9 10
κ 0,44933 0,194 0,1083 0,0680 0,0459 0,0324 0,0236 0,0175 0,0133 0,0102
n 11 12 13 14 15 16 17 18 19 20+
κ 0,0079 0,0061 0,0048 0,0038 0,0030 0,0024 0,0019 0,0015 0,0012 0,0009
A distribuição acima está representada graficamente na figura abaixo
29
0,50
0,45
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Exercícios
1. Seja um processo de ramificação de Galton-Watson, com P{N=n} dado na tabela abaixo.

a. Calcule P[K0] a probabilidade que ele se extinga em G0.
b. Calcule P[K1], a probabilidade que ele se extinga em G2.
c. Calcule a probabilidade de que ele venha a se extinguir mais cedo ou mais tarde.
n 1 2 3 4 5
pn 0,5 0,25 0,125 0,0625 0,0625
2.
30

A Distribuição Normal PDF

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

A Distribuição Normal PDF

Încărcat de

Drepturi de autor:

Formate disponibile

Departamento de Estatística - IMECC – UNICAMP

Introdução aos Modelos Probabilísticos

Capítulo 3 – A Distribuição Normal

0,00 Nos casos como o D6, ou mais gerais, como

Dm, de um dado hipotético de m lados, os

0,01 n grandes os valores envolvidos para a

caso de , por exemplo, existem

3.2 - A Distribuição Normal

= &'& − ∞ < <∞

representa na figura ao lado. Como se vê, a normal padrão

X~N(µ, σ2) à sua forma padrão Z~N(0, 1). Assim, a

X−μ x−μ x−μ

Exemplo 3.2.1 – Uma variável aleatória X tem

Como a normal é simétrica em torno da esperança, então P{X<100}=P{X>100}=0,5.

Ora, o valor 110 está exatamente a um desvio padrão acima da

X − 100 110 − 100

Da tabela tiramos Φ(1)=0,84134, portanto P{X>110)=0,1587, e, por simetria P{X<90)=0,1587.

Como, por simetria, Φ −1 = 1 − Φ 1 temos:

85 < E < 115 = 2Φ 1 − 1 = 2 × 0,84138 − 1 = 0,6827

é o número total de sucessos obtidos e S

a- Seja p=0,50 (como no arremesso de uma moeda) e n=10000. Calcule P{4.900<Sn<5.100}.

4900 − 5000 SO − 5000 5100 − 5000

P 4900 < SO < 5100 ≈ Φ 2 − Φ −2 = 2Φ 2 − 1 = 0,9545

A propósito, através de sequência análoga de operações, obtém-se P{4850<Sn<5150} ≈ 0,9973.

b- Seja p=0,20 (como na obtenção de um 5 em D5) e n=1000. Calcule 0,18 < S

0,18 − 0,20 S O − 0,20

Portanto, 0,18 < S

S − 3000 3100 − 3000

b- Se o dado for ligeiramente tendencioso, (ver tabela), calcule

S − 3040 3100 − 3040

c- De volta ao D5 não tendencioso e n=1000, determine um inteiro m, tal que P{3000–m≤Sn≤3000+m}=0,99.

Erro percentual 4,81 1,05 -0,20 -0,27 0,01 0,16

Pelo teorema central do limite, podemos aproximar S1200~N(1200p, 1200p(1-p)), logo

Alguns exercícios elementares com a Distribuição Normal

1. Seja Z~N(0, 1). Calcule

2. Seja X~N(100, 25). Calcule:

3. Sejam X1, X2, …, Xn i. i. d. N(10, 4), e

E = Yxy E , E , Ez , ⋯ , E , E = Y& E , E , Ez , ⋯ , E , | = ∑}R E} E~ = |.

a. P{T>120} quando n=10

4. Nas condições do exercício anterior, determine o valor de n para que:

ao lado. Nela, a escolaridade média é: x~ = ∑€R x ∙ N€ =

8,30 anos, onde Nx é o número de indivíduos na subpopulação

quadrático médio de X na subpopulação, definido como S5 = ∑•

em termos de escolaridade, em torno da escolaridade média, 8,30.

derivada da tabela à esquerda, com p€ = . A esperança de X pode então ser calculada: E X =

∑€R x ∙ P X = x = ∑€R x ∙ = ∑€R x ∙ N€ = x~. A esperança de X é igual à média populacional de x, e

Exemplo 3.2.5 – Considere o D , experimento composto, formado por 50 arremessos sucessivos e

Essa distribuição de probabilidades está representada na figura abaixo.

Exercício 3.2.6 – Na figura abaixo está representada a função de distribuição de probabilidades da

3.4 – Construindo intervalos de confiança para a esperança de X

favorável em que a variância, σ2, é conhecida. De X1, X2, X3, …, Xn tiramos S

n é grande o suficiente para que a distribuição de S

Podemos então concluir que, ao realizar as n observações independentes, a probabilidade do intervalo

3.4 – Construção de intervalos de confiança com a distribuição t de Student

k # não poderão ser construídos, simplesmente porque o parâmetro σ é desconhecido.

Com σ desconhecido, lançamos mão de s = SO

da normal padrão, como fizemos com k=1,96, para i95%c.

Student resolveu o problema deduzindo a expressão da

é trabalhosa, mas elegante e relativamente simples. Ela

A função gama que aparece na expressão acima é

t de Student com 15 graus de liberdade. Logo, o i95%c para a média é 995,5±2,13145×p

liberdade, podemos então afirmar que

?−2,160 ∙ < t̅ − τ < 2,160 ∙ A = 0,95