Documente Academic
Documente Profesional
Documente Cultură
Engenharia e Informtica.
Anotaes de Aula
ESTATSTICA INDUTIVA
MDULO 1 - REVISO
I. DISTRIBUIO NORMAL OU DE GAUSS
a mais importante distribuio de probabilidades, sendo aplicada em inmeros fenmenos e
utilizada para o desenvolvimento terico da Estatstica. tambm conhecida como distribuio de
Gauss, Laplace, Laplace-Gauss ou curva em sino (por lembrar o formato de um sino).
Os primeiros estudos ligados distribuio Normal foram feitos por De Moivre e, cem anos depois,
por Laplace, que consolidou as descobertas feitas at ento. Embora Gauss tenha nascido 23 anos
depois da morte de De Moivre, a distribuio e a curva normais acabaram recebendo o seu nome.
Seja X uma varivel aleatria contnua. X ter distribuio normal se:
1
x 2
1 .
. e 2 ,
< x < +
. 2
onde: = mdia de distribuio, = desvio-padro, = 3,1416, e = 2,7182
O grfico da distribuio normal a curva:
f(x) =
f(x)
50%
50%
Mo Md
3 2 1
68,27%
95,45%
99,73%
Anotaes de Aula
zo
Anotaes de Aula
zo
zo
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.0
0.1
0.2
0.3
0.4
0.0000
0.0398
0.0793
0.1179
0.1554
0.0040
0.0438
0.0832
0.1217
0.1591
0.0080
0.0478
0.0871
0.1255
0.1628
0.0120
0.0517
0.0910
0.1293
0.1664
0.0160
0.0557
0.0948
0.1331
0.1700
0.0199
0.0596
0.0987
0.1368
0.1736
0.0239
0.0636
0.1026
0.1406
0.1772
0.0279
0.0675
0.1064
0.1443
0.1808
0.0319
0.0714
0.1103
0.1480
0.1844
0.0359
0.0753
0.1141
0.1517
0.1879
0.5
0.6
0.7
0.8
0.9
0.1915
0.2257
0.2580
0.2881
0.3159
0.1950
0.2291
0.2612
0.2910
0.3186
0.1985
0.2324
0.2642
0.2939
0.3212
0.2019
0.2357
0.2673
0.2967
0.3238
0.2054
0.2389
0.2704
0.2995
0.3264
0.2088
0.2422
0.2734
0.3023
0.3289
0.2123
0.2454
0.2764
0.3051
0.3315
0.2157
0.2486
0.2794
0.3078
0.3340
0.2190
0.2518
0.2823
0.3106
0.3365
0.2224
0.2549
0.2852
0.3133
0.3389
1.0
1.1
1.2
1.3
1.4
0.3413
0.3643
0.3849
0.4032
0.4192
0.3438
0.3665
0.3869
0.4049
0.4207
0.3461
0.3686
0.3888
0.4066
0.4222
0.3485
0.3708
0.3907
0.4082
0.4236
0.3508
0.3729
0.3925
0.4099
0.4251
0.3531
0.3749
0.3944
0.4115
0.4265
0.3554
0.3770
0.3962
0.4131
0.4279
0.3577
0.3790
0.3980
0.4147
0.4292
0.3599
0.3810
0.3997
0.4162
0.4306
0.3621
0.3830
0.4015
0.4177
0.4319
1.5
1.6
1.7
1.8
1.9
0.4332
0.4452
0.4554
0.4641
0.4713
0.4345
0.4463
0.4564
0.4649
0.4719
0.4357
0.4474
0.4573
0.4656
0.4726
0.4370
0.4484
0.4582
0.4664
0.4732
0.4382
0.4495
0.4591
0.4671
0.4738
0.4394
0.4505
0.4599
0.4678
0.4744
0.4406
0.4515
0.4608
0.4686
0.4750
0.4418
0.4525
0.4616
0.4693
0.4756
0.4429
0.4535
0.4625
0.4699
0.4761
0.4441
0.4545
0.4633
0.4706
0.4767
2.0
2.1
2.2
2.3
2.4
0.4772
0.4821
0.4861
0.4893
0.4918
0.4778
0.4826
0.4864
0.4896
0.4920
0.4783
0.4830
0.4868
0.4898
0.4922
0.4788
0.4834
0.4871
0.4901
0.4925
0.4793
0.4838
0.4875
0.4904
0.4927
0.4798
0.4842
0.4878
0.4906
0.4929
0.4803
0.4846
0.4881
0.4909
0.4931
0.4880
0.4850
0.4884
0.4911
0.4932
0.4812
0.4854
0.4887
0.4913
0.4934
0.4817
0.4857
0.4890
0.4916
0.4936
2.5
2.6
2.7
2.8
2.9
0.4938
0.4953
0.4965
0.4974
0.4981
0.4940
0.4955
0.4966
0.4975
0.4982
04941
0.4956
0.4967
0.4976
0.4982
0.4943
0.4957
0.4968
0.4977
0.4983
0.4945
0.4959
0.4969
0.4977
0.4984
0.4946
0.4960
0.4970
0.4978
0.4984
0.4948
0.4961
0.4971
0.4979
0.4985
0.4949
0.4962
0.4972
0.4979
0.4985
0.4951
0.4963
0.4973
0.4980
0.4986
0.4952
0.4964
0.4974
0.4981
0.4986
3.0
3.1
3.2
3.3
3.4
0.4986
0.4990
0.4993
0.4995
0.4997
0.4987
0.4991
0.4993
0.4995
0.4997
0.4987
0.4991
0.4994
0.4995
0.4997
0.4988
0.4991
0.4994
0.4996
0.4997
0.4988
0.4992
0.4994
0.4996
0.4997
0.4989
0.4992
0.4994
0.4996
0.4997
0.4989
0.4992
0.4994
0.4996
0.4997
0.4989
0.4992
0.4995
0.4996
0.4997
0.4990
0.4993
0.4995
0.4996
0.4998
0.4990
0.4993
0.4995
0.4997
0.4998
3.5
3.6
3.7
3.8
3.9
0.4998
0.4998
0.4999
0.4999
0.5000
0.4998
0.4998
0.4999
0.4999
0.5000
0.4998
0.4999
0.4999
0.4999
0.5000
0.4998
0.4999
0.4999
0.4999
0.5000
0.4998
0.4999
0.4999
0.4999
0.5000
0.4998
0.4999
0.4999
0.4999
0.5000
0.4998
0.4999
0.4999
0.4999
0.5000
0.4998
0.4999
0.4999
0.5000
0.5000
0.4998
0.4999
0.4999
0.5000
0.5000
0.4998
0.4999
0.4999
0.5000
0.5000
Anotaes de Aula
2 PARCELA
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,3
0,4177
Exemplo 1:
O tempo necessrio para executar uma tarefa uma varivel normal de mdia 60 minutos e
desvio padro 5 minutos. Qual a proporo de vezes que o tempo necessrio ser:
a) maior que 70 minutos?
b) menor que 65 minutos?
50%
c) exatamente 40 minutos?
d) maior que 53 e menor que 62 minutos?
Soluo:
Temos: = 60 e = 5
x 60
x
Pela transformao linear z =
=
60
70
X
5
70 60
0,4772
a) x = 70
zo =
= 2,00
5
Da tabela obtemos: 0,4772
Z
Z=2,00
50%
50%
65 60
= 1,00
5
Da tabela obtemos: 0,3413
b) x = 65
zo =
60
65
X
0,3413
50%
Z
0 Z=1,00
Anotaes de Aula
d) x = 53
z=
53 60 62
0,4192
X
0,1554
Z
Z=1,40 0 Z=0,40
Exemplo 2:
As alturas dos alunos de determinada escola so normalmente distribudas com mdia
1,60 m desvio-padro 0,30 m. Encontre a probabilidade de um aluno medir:
a) Entre 1,50 e 1,80 m?
b) Mais de 1,75 m?
c) Menos de 1,48 m?
d) Qual deve ser a medida mnima para escolhermos 10% dos mais altos?
z=
x
x 1,60
=
0,30
1,50 1,60
z1 = 0,33
0,30
1,80 1,60
x2 = 1,80
z2=
z2 = 0,67
0,30
P(1,50 < x < 1,80) = P(0,33 < Z < 0,67)
a) x1 = 1,50
z1 =
Tab. : 0,1293
Tab.: 0,2486
0,33
0,2486
0,67
b) x = 1,75
z1 =
z1 = 0,5
Tab. : 0,1915
Anotaes de Aula
50%
0,5
0,1915
1,60 1,75
0,5
P(x > 1,75) = P(z > 0,5) = 0,5000 0,1915 = 0,3085 = 30,85%
1,48 1,60
0,30
P(x < 1,48) = P(z < 0,4)
c) x = 1,48
z1 =
z1 = 0,4
50%
Tab. : 0,1554
0,5
0,1554
1,48 1,60
0,4 0
P(x < 1,48) = P(z < 0,4) = 0,5000 0,1554 = 0,3446 = 34,46%
d) A operao inversa aos itens (a), (b) e (c), ou seja, dada a probabilidade, determine a
medida.
Na tabela com
P(z) = 0,4000,
encontramos
Z0 = 1,28
0,4 = 40%
0,1 = 10%
z=
Zo
1,60 X
1,28 =
x 1,60
0,30
x = 1,98 m
MDULO 2
ESTATSTICA INDUTIVA: INTRODUO E AMOSTRAGEM
INTRODUO: a parte da Estatstica que, baseando-se em resultados obtidos da anlise
de uma amostra da populao, procura concluir, sugerir ou estimar as leis de comportamento da
populao da qual a amostra foi retirada.
Os objetivos principais da Estatstica Indutiva so: tirar concluses sobre populaes atravs
de amostras extradas dessa populao, induzindo ou caracterizando uma populao atravs de
amostra e ainda dizer qual a probabilidade de erro, j que o processo de induo no exato.
Tambm atravs da Estatstica Indutiva podemos aceitar ou rejeitar hipteses que podem surgir sobre
6
Anotaes de Aula
AMOSTRAGEM
Voc no precisa beber todo o vinho
para saber que gosto ele tem!.
1. Introduo
Anotaes de Aula
Anotaes de Aula
2492
6790
5289
2160
9870
7171
6858
4092
8236
3583
7720
1489
4223
0812
8997
6509
2669
6454
4195
1533
7549
3743
7632
5589
6566
2330
1901
7577
0830
8830
5733
4971
2816
8261
7271
4730
8280
9202
9232
3809
2080
1039
7227
8506
5086
3828
3382
0104
6348
0303
7880
7600
4141
4612
7423
0586
1077
1521
8252
3298
8482
4455
9104
1062
3979
7811
8806
5563
1757
2831
6807
1822
1392
0964
2257
3309
1669
8238
2983
1508
2729
7501
4882
2244
7642
0092
0935
2605
7277
5484
1629
5565
3973
9889
3900
0377
2315
8204
0390
3485
3590
8030
4143
5579
0741
2209
7651
2677
4620
9069
4839
5189
0034
5650
5920
6332
0075
8601
0210
4326
1490
9353
3340
2082
7704
3092
1921
8383
4664
6525
6905
8387
4094
4951
9047
7127
5323
1957
3781
0199
5933
3753
0163
5101
5068
1137
1859
9717
1815
7447
7583
6043
4118
7068
1664
6450
0294
4276
6379
9278
5658
5110
9465
7252
1708
7678
6340
8820
1086
3625
3444
9137
4127
8919
2864
7274
9192
0554
8231
3995
9512
4011
1690
5627
9677
0074
0255
6333
1815
7765
6677
5458
1931
7171
3194
8676
6942
9433
8036
3222
0222
8043
2661
1832
4191
3335
6201
8690
2031
2734
1976
1587
2313
6298
4469
1645
0972
6999
6073
8617
2402
5295
5177
7315
5775
6250
7385
1191
3365
7517
9362
5474
2106
7203
8974
7373
2123
3351
1231
3961
4757
7035
5057
0546
2183
1716
9983
0967
6612
5295
1942
5192
4538
1038
3096
0417
1840
1246
1425
8536
5921
6176
3374
2709
9442
5500
3251
4675
3543
3521
2276
8902
1435
6130
8772
6307
8843
2192
4247
6612
2346
2112
0874
4859
0721
1285
8567
2897
2660
3899
7000
8131
0262
7852
2999
5306
8116
5092
9096
1263
0414
5270
5541
0578
7017
3383
5994
4014
0097
8057
5573
7478
3339
5505
6381
9396
7569
2854
8474
2086
3464
7551
9691
3167
5457
1706
3380
9562
8552
7703
9204
2152
3252
5409
2758
3389
5411
9848
1556
2963
5678
2647
6030
4247
8167
2589
7242
8472
4652
6712
0288
2800
2266
2953
9820
9
Anotaes de Aula
O uso da tabela pode ser entendido atravs do seguinte exemplo: De uma populao
constituda por 650 elementos queremos retirar uma amostra aleatria de 50. O primeiro passo
enumerar a populao de 001 a 650. A partir de um dgito escolhido ao acaso na tabela de nmeros
aleatrios vamos tomando os nmeros, sempre com 3 algarismos (pois a populao constituda por
650 elementos), at completarmos os 50 elementos necessrios para a amostra desejada.
Suponhamos que os algarismos da tabela a partir do dgito escolhido sejam: 369024927171772065...,
(percorrer a primeira linha da tabela da esquerda para a direita), os elementos sorteados para a
amostra sero os de ordem 369, 024, 171, 065, etc. Os grupos 927 e 772 no foram considerados
pois no constam da populao. Ento, so desprezados os nmeros ou grupos que so maiores do
que 650 e eventuais repeties, exceto se a amostragem seja com reposio.
2) Amostragem Sistemtica
Consiste em subdividir a populao que vai ser estudada em pequenos grupos (chamados de
conglomerados) fisicamente prximos, independentemente de eles serem homogneos ou no.
Nesses grupos, so agregados os elementos com estreito contato fsico (como casas, quarteires,
bairros, cidades, etc.).
Ao invs de numerarmos os elementos da populao para fazermos uma amostragem
aleatria, numeramos os conglomerados e sorteamos alguns deles para constiturem a amostra. Na
realidade apenas uma maneira de simplificar o trabalho.
A principal razo desse tipo de ajuntamento que muitos elementos podem ser estudados por
poucos pesquisadores.
10
Anotaes de Aula
4) Amostragem estratificada
Sexo
Masculino
Feminina
Total
Populao
58
42
100
10%
0,10 . 58 = 5,8
0,10 . 42 = 4,2
0,10 . 100 = 10
Amostra
6
4
10
II) Numeramos os alunos de 001 a 100, sendo que de 001 a 058 correspondem meninos e de
059 a 100 meninas.
II) Obtemos uma amostra aleatria ou sistemtica de cada sexo e reunimos as informaes
numa s amostra, denominada amostra estratificada.
5) Amostragem mltipla
Quando nem todos os elementos da populao tiverem uma probabilidade diferente de zero de
pertencerem amostra, dizemos que a amostragem no-probabilstica.
Este processo de amostragem subjetivo e seu regimento depende do conhecimento que o
pesquisador possui a respeito da estrutura da populao. empregada, muitas vezes, por
simplicidade ou pela impossibilidade de se obter amostragens probabilsticas.
Para a Estatstica Indutiva interessa a amostragem probabilstica, pois assim, o acaso ser o
nico responsvel por eventuais diferenas entre a populao e a amostra. No entanto, muitas vezes
11
Anotaes de Aula
no poderemos conseguir amostras probabilsticas e nesses casos o bom senso nos indicar como
proceder para que os resultados possam ser considerados e trabalhados.
Principais casos de amostragem no probabilstica:
1) Amostragem por Julgamento (ou inacessibilidade a toda a populao)
A amostra obtida na parte da populao que conhecida (ou acessvel). Ento se faz uma
distino entre populao amostrada e populao objeto.
Populao amostrada a parte da populao que acessvel e da qual retirada a amostra;
Populao objeto aquela sobre a qual pretendemos realizar o trabalho estatstico (de toda a
populao).
Se as caractersticas das variveis de interesse so as mesmas na populao amostrada e na
populao objeto, a amostragem ser equivalente a uma amostragem probabilstica. Isso muito
comum quando conclumos sobre a qualidade de um produto pelas unidades que j foram produzidas
e estendemos essa concluso para as unidades que ainda sero produzidas. Se as condies de
produo permanecerem as mesmas a concluso ser vlida.
Se o tamanho da amostra bem pequeno, a amostragem aleatria poder ser norepresentativa, ao passo que uma pessoa familiarizada com a populao pode especificar quais os
itens mais representativos da populao.
Exemplo: Uma rede de pizzarias pode querer experimentar uma nova tcnica de servio,
empregando bandejas com aquecimento. Problemas de custo podem fazer com que a experincia se
limite a duas lojas, as quais podem diferir consideravelmente em termos de tamanho, localizao,
clientela e lucratividade. Ao invs de uma seleo aleatria das duas lojas a serem usadas como
teste, ser melhor confiar no conhecimento da administrao para fazer tal escolha.
2) Amostragem a esmo ou sem norma
o caso em que o pesquisador procura ser aleatrio, sem, no entanto, utilizar um sorteio
aleatrio rigoroso.
Exemplo: Se tivermos numa caixa 15.000 parafusos e desejamos retirar uma amostra contendo
150 parafusos do mesmo modelo e tamanho, certamente no faramos uma amostragem aleatria
simples, pois seria extremamente trabalhosa, mas faramos retiradas a esmo.
Anotaes de Aula
4) Amostragem Intencional
O grande risco desse procedimento que fica sujeito ao julgamento de uma ou mais pessoas.
5) Amostragem por voluntrios
15
14
23
16
12
13
10
12
22
20
19
17
13
Anotaes de Aula
66 85 12 00 27
48 28 01 51 92
95 68 45 52 43
36 09 03 01 86
33 93 81 45 95
37 31 61 28 98
66 42 19 24 94
33 65 78 12 35
76 32 06 19 35
43 33 42 02 59
94 61 47 03 10
13 13 38 69 96
91 59 11 38 44
22 95 30 19 29
20 39 84 95 61
67 80 84 41 26
76 69 76 24 13
23 31 48 75 74
57 74 43 20 90
58 22 04 02 99
88 84 59 69 14
43 83 10 13 24
05 30 08 46 32
20 25 36 70 69
99 78 78 83 82
77 32 82 81 89
18 32 84 85 04
90 04 93 56 16
38 32 11 01 01
43 67 16 38 95
28 31 93 43 94
97 19 21 63 34
82 80 37 14 20
03 68 03 13 60
65 16 58 11 01
87 73 19 38 47
69 33 17 03 02
56 39 59 89 63
64 13 90 37 11
98 78 80 63 23
54 36 90 98 10
11 15 50 46 08
33 90 38 44 50
86 02 57 41 99
07 37 66 20 56
83 43 32 26 26
42 69 60 17 42
78 22 87 10 88
31 66 60 65 64
20 96 06 79 80
22 00 90 59 22
14 68 61 14 48
06 58 87 39 67
03 03 02 58 97
33 39 40 49 42
24 65 58 57 04
02 72 64 07 75
79 16 78 63 99
04 75 14 93 39
40 64 64 57 60
18 62 85 28 24
85 66 48 38 73
43 61 00 66 42
68 52 16 83 34
97 00 12 91 33
26 45 17 82 76
75 10 96 59 31
76 26 71 14 33
64 09 44 62 58
22 14 73 01 11
39 65 01 73 91
48 78 58 08 88
33 86 76 71 66
48 32 72 26 95
83 97 68 95 65
50 37 49 38 73
72 08 54 57 17
37 85 05 56 07
32 67 35 49 71
67 77 80 98 87
38
34
33
35
34
34
30
33
34
36
34
37
34
33
35
34
36
31
31
34
31
33
32
35
33
36
34
36
35
32
35
34
33
35
38
32
32
29
37
34
37
39
36
32
33
Pede-se:
a) Utilizando a tabela de nmeros ao acaso a partir do 11 dgito da 5 linha, tome uma
amostra de tamanho 10 e calcule o peso mdio e a varincia dos pesos das peas da
amostra;
a) Se fosse efetuada uma amostragem estratificada proporcional e a amostra fosse de 15
elementos, quantos seriam retirados de cada estrato?
b) Suponha que das 30 pea do fornecedor A tenha sido colhida uma amostra sistemtica de
5 peas e sabe-se que a 3 pea a entrar no almoxarifado faz parte da amostra. Calcule a
mdia e o desvio padro dos pesos das peas dessa amostra.
14
Anotaes de Aula
9) Uma populao est dividida em 4 estratos de tamanhos 180, 420, 240 e 360. Foi realizada
uma amostragem estratificada proporcional e foram retirados 9 elementos do menor estrato.
Qual o tamanho total da amostra?
10) Na terceira srie de um curso de Engenharia Mecatrnica existem duas turmas: a da manh
com 40 alunos e a da noite com 20 alunos. As 40 primeiras notas so dos alunos da manh e
as outras 20 so dos alunos da noite.
6,0
6,3
6,6
6,8
6,0
4,5
6,2
6,5
6,8
6,0
5,1
4,6
6,6
6,8
6,9
6,6
4,8
5,1
6,1
6,3
6,2
7,0
6,0
5,3
6,0
6,4
6,4
6,3
5,0
5,5
6,8
6,5
6,6
7,1
4,5
4,7
7,0
7,2
7,0
6,8
4,0
4,8
7,1
6,0
6,4
6,3
5,0
5,3
6,5
6,2
6,3
6,1
5,1
5,2
6,9
6,1
6,5
6,0
5,5
5,8
a) Foi retirada uma amostra aleatria de 10 notas com auxlio da tabela de nmeros ao acaso,
a partir da interseco da stima linha com a vigsima sexta coluna. Calcule a mdia e a
varincia das notas dessa amostra;
b) Se tivesse sido realizada uma amostragem estratificada uniforme de 10 notas e tivesse sido
obtida mdia 6,4 para os alunos da manh e 5,2 para os alunos da noite, em quanto voc
estimaria a mdia dos 60 alunos?
c) Se das notas dos alunos da manh fosse retirada uma amostra sistemtica de 8 notas e
soubssemos que a oitava nota (7,1) faz parte dessa amostra, qual a mdia e o desvio
padro das notas dessa amostra?
Respostas:
Anotaes de Aula
CORRELAO
1. INTRODUO:
Uma das atividades humanas que realizamos sem cessar a de associar a variao de uma varivel
variao de outra, constituindo em um dos principais mtodos de ajustamento ao ambiente em que vivemos. J
nos primeiros anos de vida, a criana capaz de associar certas expresses faciais dos pais ao seu
comportamento provvel. capaz, tambm, de associar certos rudos com determinadas atividades que se
passam no lar, e quanto maior for o nmero de associaes que seja capaz de fazer, tanto melhor ser o seu
ajustamento ao lar.
Esse relacionamento entre variveis recebe o nome de correlao. Existe uma grande quantidade de
variveis que se relacionam atravs de uma frmula matemtica, como por exemplo, a rea de um quadrado,
que depende da medida do seu lado, ou seja, a rea do quadrado igual ao valor do seu lado elevado ao
quadrado: A = l2 ; outras variveis no se relacionam atravs de uma frmula matemtica, como por exemplo,
beleza x inteligncia. Em estatstica o assunto abordado pela correlao exatamente uma tentativa de
matematizar, sem no entanto resumir por frmulas, a relao que existe entre duas variveis.
Outros exemplos estudados pela correlao:
nvel econmico x nvel escolar
cigarros x cncer
horas trabalhadas x rendimento escolar
peso x idade da pessoa
consumo da famlia x renda familiar
demanda de um produto x preo
etc....
Particularmente em psicologia esse assunto largamente aplicado em T.E.P. (tcnicas do exame
psicolgico) na medida em que avalia a preciso e a validade de testes psicolgicos,tambm em exames
vocacionais que procuram indicar a profisso futura adequada para adolescentes. O que se faz correlacionar
os resultados obtidos pelos sujeitos com os resultados esperados para cada uma das profisses e da, indicase a profisso onde a correlao apresentou o maior grau.
2. DIAGRAMA DE DISPERSO
a representao dos pares ordenados (xi ; yi), de duas variveis aleatrias X e Y, em um sistema de
coordenadas cartesianas, obtendo uma nuvem de pontos que denominamos diagrama de disperso.
Exemplo:
A tabela abaixo fornece as notas de 10 alunos de uma universidade nas
disciplinas de matemtica e estatstica:
ALUNO
01
02
03
04
05
06
07
08
09
10
N O T A S
MATEMTICA (xi)
ESTATSTICA (yi)
5,0
6,0
5,0
9,0
7,0
8,0
10,0
10,0
6,0
5,0
7,0
7,0
9,0
8,0
3,0
4,0
8,0
6,0
2,0
2,0
xi e yi so as
variveis dadas
na tabela.
16
Anotaes de Aula
notas de estatstica
10
12
notas de matemtica
Os pontos obtidos, no diagrama (nuvem de pontos), vistos em conjunto, formam uma elipse em
diagonal.
notas de estatstica
Podemos imaginar que, quanto mais fina (achatada) for a elipse, mais ela se aproximar de
uma reta. Dizemos, ento, que a correlao de forma elptica tem como imagem uma reta, sendo,
por isso, denominada correlao linear. Se essa reta for crescente, a correlao ser linear positiva
e se for decrescente, a correlao ser linear negativa.
12
10
8
6
4
2
0
10
12
notas de matemtica
y
10
8
6
4
2
0
10
17
Anotaes de Aula
y
10
8
6
4
2
Ausncia de correlao
(correlao nula)
0
2
10
1. MEDIDAS DE CORRELAO
A correlao linear procura medir a relao entre duas variveis X e Y atravs da disposio
dos pontos (x, y) em torno de uma reta. O instrumento de medida da correlao linear dado pelo
coeficiente de correlao de Pearson que varia entre 1 e +1 no seguinte esquema:
correlao aumenta
negativamente
1
|
0,75
|
0,5
|
0,25
|
correlao aumenta
positivamente
0
|
0,25
|
0,5
|
0,75
|
1
|
Anotaes de Aula
rP =
n . (x i . y i ) ( x i ) . ( y i )
[n . x i 2 ( x i ) 2 ] . [ n . y i 2 ( y i ) 2 ]
onde:
n = nmero de observaes
OBS.: O coeficiente de Correlao Linear de Pearson pode ser calculado tambm por uma Frmula
Alternativa que :
rP =
S xy
S xx .S yy
S xy = cov( x, y ) =
, onde:
n 1
cujo resultado determina o sinal e o grau da correlao das variveis;
2
(
)
x
i
S xx = (xi )2
2
(
)
y
i
S yy = (yi )2
NOTA: O Coeficiente de Pearson calculado pela primeira frmula mais preciso que o calculado pela
segunda frmula (frmula alternativa), pois trabalha com os Dados Brutos, sem transformaes, sem
arredondamentos.
Exemplo: Calcule e interprete o coeficiente de Pearson (rP) para os dados da tabela:
ALUNO BIOLOGIA (Xi) FISIOLOGIA (Yi)
1
4,5
3,5
2
6
4,5
3
3
3
4
2,5
2
5
5
5,5
6
5,5
5
7
1,5
1,5
8
7
6
35
31
19
Anotaes de Aula
Xi . Yi
15,75
27
9
5
27,5
27,5
2,25
42
156
(Xi)2
20,25
36
9
6,25
25
30,25
2,25
49
178
(Yi)2
12,25
20,25
9
4
30,25
25
2,25
36
139
Notas de Fisiologia
A) Diagrama de Disperso:
8
6
4
2
0
0
Notas de Biologia
B) Coeficiente de Pearson:
rP =
rP =
n . (x i . y i ) ( x i ) . ( y i )
[n . x i 2 ( x i ) 2 ] . [ n . y i 2 ( y i ) 2 ]
163
173,35
8 . 156 35 . 31
[ 8 . 178 35 2 ] . [ 8. 139 312 ]
rP = 0,94
20
Anotaes de Aula
20,375
24,875.18,875
20,375
21,668
rP = 0,94
rP =
rP =
Yi
0
2
4
6
8
20
Xi
0
1
2
3
4
10
(Xi)2
0
1
4
9
16
30
Xi . Yi
0
2
8
18
32
60
(Yi)2
0
4
16
36
64
120
(x i . y i ) ( x i ) . ( y i )
[n . x i 2 ( x i ) 2 ] . [ n . y i 2 ( y i ) 2 ]
n.
100
50.200
100
10000
100
100
rP = 1,00
EXERCCIOS PROPOSTOS:
1. Descreva um exemplo de correlao linear positiva e um exemplo de correlao linear negativa,
esboando para cada um o respectivo diagrama de disperso;
21
Anotaes de Aula
2. Numa pesquisa realizada sobre, nmero de cigarros fumados por dia (x) e idade da morte (y):
Medo do escuro
Tempo de convivncia
2
10
4
8
3
6
5
3
1
12
3
8
5
4
3
7
Pede-se:
a) esboar o diagrama de disperso;
b) calcular o coeficiente de Pearson;
c) interpretar os resultados.
4. De acordo com uma pesquisa em uma clnica psicolgica, levantou-se a hiptese segundo a qual o
tempo de internao dos pacientes teria uma relao com o grau de satisfao que os sujeitos tm
por sua famlia. Foi elaborado um questionrio cujo resultado identificava, em uma escala de 0 a 10, o
grau de satisfao dos sujeitos. Com base nos resultados, realize o procedimento adequado para a
confirmao ou no desta hiptese, e interprete o resultado.
X = grau de satisfao familiar
Y = tempo de internao (nmero de dias)
Artigo III.
Artigo IV.
X
Y
8
20
4
5
2
14
1
8
9
3
10
2
3
18
5
30
6
5
2
15
22
Anotaes de Aula
REGRESSO LINEAR
Como vimos na Correlao, os pares ordenados de uma tabela determinam o que
denominamos de diagrama de disperso, que representa uma correlao entre as variveis da
tabela dada.
Cabe regresso linear fazer o ajustamento da reta, ou seja, obter a equao da reta que
melhor se ajusta aos pontos dados no diagrama de disperso.
A anlise de regresso tem por objetivo descrever, atravs de uma equao matemtica, o
relacionamento entre duas variveis, partindo de n observaes das mesmas.
A varivel sobre a qual desejamos fazer uma estimativa recebe o nome de varivel
dependente (y) e a outra recebe o nome de varivel independente (x)
A equao do ajustamento de uma reta dada por: y* = a x + b, onde a e b so os
parmetros. A indicao y* devida pelo fato da eq. de regresso ter um valor aproximado ou terico.
Os valores dos parmetros a e b so obtidos pelo mtodo dos mnimos quadrados em que:
a=
n . (x i . y i ) x i . y i
2
n . x i ( x i )2
b= y ax
y
n o nmero de observaes;
, onde:
reta imagem
10
xi
x =
yi
y =
10
EXEMPLO:
A tabela a seguir indica as quantidades produzidas mensalmente de um produto e os
respectivos custos totais de produo:
quantidade produzida
custo total (R$)
xi
yi
10
200
12
230
13
270
14
290
15
280
16
300
23
Anotaes de Aula
a)
x=
a=
xi
n
xi
10
12
13
14
15
16
yi
200
230
270
290
280
300
xi . yi
2000
2760
3510
4060
4200
4800
xi2
100
144
169
196
225
256
80
1570
21330
1090
80
= 13,33
6
n . (x i . y i ) x i . y i
2
n . x i ( xi )
yi
y=
1570
= 261,66
6
6. 21330 80 . 1570
6 . 1090 80
2380
= 17
140
y* = 17x + 35
350
300
250
200
150
100
50
0
10
15
20
quantidade
custos em R$
xi
yi
10
100
11
112
12
119
13
130
14
139
15
142
24
Anotaes de Aula
Pede-se:
a) a reta que melhor se ajusta a esses dados;
b) o valor mais provvel dos custos fixos;
c) qual o custo para a quantidade de 16 bolas.
2. A tabela abaixo mostra a taxa de desemprego em porcentagem da populao economicamente
ativa de 1980 a 1992 de um determinado pas.
Pede-se:
a) a reta que melhor se ajusta a esses dados;
b) avaliar (estimar) a taxa de desemprego para o ano de 1993
Ano (xi) 80 81 82 83 84 85 86 87 88 89 90 91 92
% (yi) 2,2 4,3 4 4,3 4,9 4,5 2,4 2,6 3,8 3,2 2,6 4,5 6
3. A tabela abaixo mostra as alturas e o peso em quilogramas de uma amostra de alunos do
curso de administrao do 1 semestre.
Pede-se:
a) a reta que melhor se ajusta a esses dados;
b) avaliar a altura do aluno cujo peso 63 kg;
c) avaliar o peso do aluno cuja altura 180 cm
peso (xi) 45 60 58 55 66 58 70 68 76
altura (yi) 150 155 158 160 162 165 170 175 178
4. A tabela abaixo revela uma amostra de valores de seguro pessoal contratados em funo da
quantidade de salrios mnimos recebidos. Usando a equao de regresso linear, qual
seria o montante segurado para algum que recebe 30 salrios mnimos?
Salrios (xi)
Seguro (mil R$) (yi)
13
50
16 17 18 20 25 26 32 38 40 42
150 200 100 100 120 150 300 400 500 400
Meses
(xi)
Valores ($) (yi)
abr
41,73
mai
41,73
jun
43,98
jul
48,91
ago
53,41
set
59,06
out
66,65
nov
75,76
Pede-se:
a) a reta que melhor se ajusta a esses dados;
( y* = 4,9x + 17,15 )
b) estime o valor do BTN para o ms de dezembro do mesmo ano.
( $ 75,95 )
25
Anotaes de Aula
quantidade
custo total (R$)
a)
x=
a=
xi
yi
10
100
11
112
13
130
xi
10
11
12
13
14
15
yi
100
112
119
130
139
142
xi . yi
1000
1232
1428
1690
1946
2130
xi2
100
121
144
169
196
225
75
742
9426
955
x i = 75 = 12,5
n
12
119
n . (x i . y i ) x i . y i
n . x i ( x i )2
2
y=
14
139
15
142
y i = 742 = 123,66
n
6. 9426 75 . 742
6 . 955 75
906
105
= 8,63
160
140
120
100
80
60
40
20
0
10
15
20
quantidade de bolas
Anotaes de Aula
2.
Ano (xi) 80 81 82 83 84 85 86 87 88 89 90 91 92
% (yi) 2,2 4,3 4 4,3 4,9 4,5 2,4 2,6 3,8 3,2 2,6 4,5 6
a)
x=
a=
xi
80
81
82
83
84
85
yi
2,2
4,3
4
4,3
4,9
4,5
xi . yi
176
348,3
328
356,9
411,6
382,5
xi2
6400
6561
6724
6889
7056
7225
86
2,4
206,4
7396
87
2,6
226,2
7569
88
3,8
334,4
7744
89
3,2
284,8
7921
90
2,6
234
8100
91
4,5
409,5
8281
92
552
8464
1118
49,3
xi = 1118 = 86
n
13
4250,6 96330
n . (x i . y i ) x i . y i
n . x i 2 ( x i ) 2
b= y ax
y=
yi = 49,3 = 3,8
n
13
140,4
2366
= 0,06
y* = 0,06x 1,36
27
Anotaes de Aula
3.
peso (xi) 45
60
58
55
66
58
70 68 76
altura (yi) 150 155 158 160 162 165 170 175 178
a)
yi
150
155
158
160
162
165
170
175
178
xi . yi
xi2
6750
9300
9164
8800
10692
9570
11900
11900
13528
2025
3600
3364
3025
4356
3364
4900
4624
5776
556
1473
91604 35034
xi = 556 = 61,78
n . (x i . y i ) x i . y i
x=
a=
xi
45
60
58
55
66
58
70
68
76
n . x i2 ( x i )2
b= y ax
y=
yi = 1473 = 163,67
n
5448
6170
= 0,88
y* = 0,88x + 109,3
y* = 164,74 cm
0,88 x = 70,7
x = 80,34 kg
28
Anotaes de Aula
4.
Salrios (xi)
Seguro (mil R$) (yi)
a)
x=
a=
13
50
16 17 18 20 25 26 32 38 40 42
150 200 100 100 120 150 300 400 500 400
xi
13
16
17
18
yi
50
150
200
100
xi . yi
xi2
650
2400
3400
1800
169
256
289
324
20
100
2000
400
25
120
3000
625
26
150
3900
676
32
300
9600
1024
38
400
15200
1444
40
500
20000
1600
42
400
16800
1764
287
2470
78750
8571
xi = 287 = 26,1
n
11
n . (x i . y i ) x i . y i
2
n . x i ( xi )
b= y ax
y=
yi = 2470 = 224,5
n
11
157360
11912
= 13,2
y* = 13,2x 120
29
Anotaes de Aula
5.
Meses
(xi)
Valores ($) (yi)
abr
41,73
a)
xi
4
5
6
7
10
100
11
75,76 833,36
121
60
431,23 3440,5
492
a=
n . (x i . y i ) x i . y i
2
n . x i ( xi )
b= y ax
out
66,65
nov
75,76
36
81
y=
set
59,06
16
25
59,06 531,54
66,65 666,5
ago
53,41
xi2
xi . yi
yi
41,73 166,92
41,73 208,65
43,98 263,88
xi = 60 = 7,5
n
jul
48,91
49
x=
jun
43,98
48,91 342,37
53,41 427,28
mai
41,73
64
yi = 431,23 = 53,9
n
8. 3440,5 60 . 431,23
8.492 60
1650,2
336
= 4,9
y* = 4,9x + 17,15
y* = $ 75,95
30
Anotaes de Aula
Mdia
Varincia
Desvio padro
Parmetros
Populacionais
Estatsticas da amostra
(Estimadores)
x
s2
s
Anotaes de Aula
x =
12
36
12
=2
6
finita : x =
Nn
N1
: s x =
s
n
A frmula para o erro padro estimado da mdia quando se inclui o fator de correo
finita : s x =
s
n
Nn
, onde
N1
Nn
o fator de correo finita.
N1
s
n
Nn
57
100 16
57 84
=
.
=
.
= 14,25 . 0,9211 $ 13,13
N1
100 1
4
99
16
Anotaes de Aula
p. (1 p )
ou
n
(p) =
p. q
, pois (1 p) = q
n
Exemplo1:
Um varejista compra copos diretamente da fbrica em grandes lotes. Os copos vm
embrulhados individualmente. Periodicamente o varejista inspeciona os lotes para determinar
a proporo dos quebrados ou lascados. Se um grande lote contm 10% de quebrados ou
lascados, qual a probabilidade de o varejista obter uma amostra de 100 copos com 17% ou
mais defeituosos?
Soluo:
Temos: ( p ) = p = 10%, que a porcentagem populacional de defeitos, ento (1 p) = 90%;
n = 100
p. (1 p )
=
n
(0,10 ).(0,90 )
0,3
=
= 0,03 = 3%.
100
10
17% 10%
7%
p (p)
=
=
= 2,33
3%
3%
(p)
tab.: 0,4901
0,4901
10% 17%
0 2,33
Anotaes de Aula
sx =
43
36
43
7,17
6
x
250 260
10
=
=
= 1,39
7,17
7,17
sx
Tab.: 0,4177
0,5
1,39
1.3
0.4032
---
0.09
---
zo
250 260
0.00
0,4177
0.4177
20
36
20
10
=
(n = 36 < 5%N = 54
6
3
x ( x )
( x )
50%
740 750
3. 10
=
10
10
3
zo = 3
tab.: 0,4986
0,5
0,4986
740 750
Anotaes de Aula
Exemplo2: Uma mquina de encher sacos plsticos de leite foi ajustada para um volume
mdio de 1.000 ml, com um desvio padro de 25 ml. O ajuste deve ser sempre verificado
porque o Servio de Inspeo Federal SIF multar o fabricante se uma amostra aleatria
acusar volume mdio inferior a 950 ml e os sacos podero romper-se no transporte se
contiverem mais que 1.050 ml de leite. Se uma amostras de 25 unidades for aleatoriamente
escolhidas sem reposio de um lote de 750 sacos, qual ser:
a) O volume mdio esperado?
b) O desvio padro da distribuio amostral correspondente?
c) O nmero de amostras com volume mdio entre 990 ml e 1.010 ml?
= 25; 5%N = 0,05.750 = 37,5
n < 5%N
Temos: N = 750; n = 25;
a) o volume mdio esperado igual ao volume populacional: ( x ) = = 1000 ml
b) o desvio padro da distribuio amostral correspondente :
(x) =
25
25
25
5
5 ml
( x )
tab.: 0,4772
1010 1000
=2
5
tab.: 0,4772
zo
2.0
0,4772
990
1000
1010
0.00
0.01
0.4772
0.4778
0.02
x ( x )
990 1000
=2
5
( x )
z2 =
x ( x )
z1 =
0.4783
0,4772
Ento: P(990 < x < 1010) = P(2 < z < 2) = 2 . 0,4772 = 0,9544 = 95,44%
Portanto, o nmero de amostras com volume mdio entre 990ml e 1010ml :
n = 25 . 95,44% = 23,86 24
5. Estimao Pontual Uma estimativa pontual quando obtida de um nico valor para
um parmetro populacional. Exemplo: a mdia amostral x uma estimativa pontual para a
mdia populacional .
6. Estimao por Intervalos.
a) Uma estimativa intervalar um intervalo (ou uma amplitude) de valores usados para
estimar um parmetro populacional.
b) Nvel de confiana (ou grau de confiana ou coeficiente de confiana) a
probabilidade de que o intervalo estimado contenha o parmetro populacional.
Vimos que: Se n 30, a distribuio amostral das mdias uma distribuio normal.
35
Anotaes de Aula
O nvel de confiana c a rea sob a curva normal reduzida, entre os valores crticos
zc e zc
c
(1 )
zc
zc
z=0
E = zc .
ou E = z .
Observao: Se n 30, o desvio padro amostral s poder ser usado no lugar do desvio
padro populacional quando este for desconhecido. Neste caso,
E = zc .
ou
E = z .
2
s
n
ou
= x E
ou
= x z .
2
zc = z
c ou (1 )%
2
90% = 0,90
95% = 0,95
99% = 0,99
45%
45%=0,45
2 = 5%
90%
1,645 0 1,645
1 = 90%
2 = 5%
= 10%
47,5%
10% = 0,10
5% = 0,05
1% = 0,01
1,645
1,96
2,575
47,5%=0,475
49,5%
2 = 2,5%
95%
1,96
2 = 2,5%
49,5%=0,495
2 = 0,5%
2 = 0,5%
99%
1,96
1 = 95%
= 5%
2,57 0 2,57
1 = 99%
= 1%
Exemplo:
36
Anotaes de Aula
E = zc .
zc
s
n
= 1,96 .
1.9
1,5
36
0.00
---
z=0
zc
zc
c = 95%
47,5% = 0,4750
---
0.4750
0.4032
0.06
E = zc .
Nn
N 1
E = zc .
s
n
Nn
N 1
8. Tamanho da amostra
O tamanho da amostra para estimar a mdia, depende do grau de confiana desejado,
da quantidade de disperso entre os valores individuais da populao e certa quantidade
especfica de erro tolervel.
Para um nvel de confiana c e um erro mximo E, podemos obter o tamanho mnimo da
amostra necessria para estimar a mdia populacional a partir da frmula do erro, ou seja:
E = zc .
( n)
z .
n = c
E
z .
= c
E
z .
n= c
E
Exemplo 1 Que tamanho de amostra ser necessrio para produzir um intervalo de 90%
de confiana para a verdadeira mdia populacional, com erro de 1,0 em qualquer dos
sentidos, se o desvio padro da populao 10?
Soluo: Temos: E = 1,0; = 10; c = 90% = 0,90
zc = z = 1,645
2
zc .
1,645 . 10
=
= 272,25
1
n=
n 273
Anotaes de Aula
s = 1,5 ;
c = 95% = 0,95
zc = 1,96
zc . s
1,96 . 1,5
=
= 138,2976
0,25
E
n=
n 139
Exemplo 3 Um comprador potencial deseja estimar o valor mdio das compras por
cliente em uma loja de brinquedos em um aeroporto. Com base em dados de outros
aeroportos similares, o desvio padro de tais valores de venda estimado em cerca de =
$ 0,80. Qual o tamanho mnimo que deveria ter uma amostra aleatria se a distribuio das
vendas no for considerada normal e ele desejar estimar a mdia dos valores dentro de
$ 0,50 com uma confiana de 99%?
Soluo: Temos: E = 0,50; = 0,80 ;
2
c = 99% = 0,9
zc .
2,575 . 0,80
=
= 16,97
0,50
n=
zc = 2,575
n 17
2
I) E = zc .
= 1,645 .
= 0,7
n
20
II) x E < < x + E
5,2 0,7 < < 5,2 + 0,7
zc = 1,645
Portanto, com 90% de confiana, podemos dizer que a mdia populacional est
entre 4,5 e 5,9.
38
Anotaes de Aula
Exemplo 2 Suponha que o desvio padro da vida til de uma determinada marca de
tubo de imagem de TV conhecido e igual a = 500 horas, mas que a mdia da vida til
desconhecida. Supe-se que a vida til dos tubos de imagem tem uma distribuio
aproximadamente normal. Para uma amostra de n = 15, a mdia da vida til x = 8.900
horas de operao. Construir um intervalo de confiana de 95% para estimar a mdia da
populao.
Soluo: Temos: = 500; x = 8900; n = 15; c = 95% = 0,95
zc = 1,96 (p.36)
A distribuio normal de probabilidade pode ser usada neste caso
porque a populao normalmente distribuda e o conhecido.
500
I) E = zc .
= 1,96 .
= 253
15
n
II) x E < < x + E
8900 253 < < 8900 + 253
8647 < < 9153
Propriedades da curva t:
a) A curva tem a forma de um sino tendo maior rea nas caudas do que a curva
Normal. Isto significa que, para um dado nvel de confiana, o valor t ser um pouco
maior que o correspondente valor z;
b) A rea sob a curva igual a 1;
39
Anotaes de Aula
curva t
curva normal
curva t
-3
-2
-1
40
Anotaes de Aula
0
g.l.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
0,50
1,000
0,816
0,765
0,741
0,727
0,718
0,711
0,706
0,703
0,700
0,697
0,695
0,694
0,692
0,691
0,690
0,689
0,688
0,688
0,687
0,686
0,686
0,685
0,685
0,684
0,684
0,684
0,683
0,683
0,674
0,80
3,078
1,886
1,638
1,533
1,476
1 ,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,282
Nvel de confiana c
0,90
0,95
6,314
12,706
2,920
4,303
2,353
3,182
2,132
2,776
2,015
2,571
1,943
2,447
1,895
2,365
1,860
2,306
2,262
1,833
1,812
2,228
1,796
2,201
1,782
2,179
1,771
2,160
1,761
2,145
1,753
2,131
1,746
2,120
1,740
2,110
1,734
2,101
1,729
2,093
1,725
2,086
1,721
2,080
1,717
2,074
1,714
2,069
1,711
2,064
1,708
2,060
1,706
2,056
1,703
2,052
1,701
2,048
1,699
2,045
1,645
1,960
0,98
31,821
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,479
2,473
2,467
2,462
2,326
0,99
63,657
9,925
5,841
4,604
4,032
3,707
3,499
3,355
3,250
3,169
3,106
3,055
3,012
2,977
2,947
2,921
2,898
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,576
Temos: n = 10
c = 95%
g.l. = n 1 = 10 1 = 9
c = 0,95
41
Anotaes de Aula
0,90
14
de confiana c
-------
nvel
0,50
g.l.
0,692
-------
1,761
Portanto, com 90% de confiana, podemos dizer que a mdia populacional est entre
5,24 e 5,96.
I) E = tc .
s
n
= 2,145 .
500
15
-------
14
0,50
g.l.
0,692
-------
2,145
= 277
Anotaes de Aula
A distribuio qui-quadrado uma estatstica concebida por Karl Pearson em 1899, que
relaciona a distribuio da varincia amostral com uma famlia de distribuies de
probabilidades.
a) Definio Se a varivel aleatria tiver uma distribuio normal, ento a distribuio
2 =
(n 1).s 2
2
1 c
1 e 2 valem, respectivamente: 1 =
2
e 2 =
1+ c
, sendo c o nvel (ou grau) de
2
confiana.
De posse dos valores encontrados por 1 e por 2 e, conforme o grau de liberdade,
determinamos os valores de 2 e 2 na tabela.
1
c (nvel de confiana)
5%
5%
90%
Ex.:
2
1
2
2
2
1
43
Anotaes de Aula
< 2 <
(n 1).s 2
2
< <
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
0,995
0,99
0,010
0,072
0,207
0,412
0,676
0,989
1,344
1,735
2,156
2,603
3,074
3,565
4,075
4,601
5,142
5,697
6,265
6,844
7,434
8,034
8,643
9,262
9,886
10,520
11,160
11,808
12,461
13,121
13,787
20,707
27,991
35,534
43,275
51,172
59,196
67,328
0,020
0,115
0,297
0,554
0,872
1,239
1,646
2,088
2,558
3,053
3,571
4,107
4,660
5,229
5,812
6,408
7,015
7,633
8,260
8,897
9,542
10,196
10,856
11,524
12,198
12,879
13,565
14,257
14,954
22,164
29,707
37,485
45,442
53,540
61,754
70,065
0,975
0,001
0,051
0,216
0,484
0,831
1,237
1,690
2,180
2,700
3,247
3,816
4,404
5,009
5,629
6,262
6,908
7,564
8,231
8,907
9,591
10,283
10,982
11,689
12,401
13,120
13,844
14,573
15,308
16,047
16,791
24,433
32,357
40,482
48,758
57,153
65,647
74,222
0,950
0,004
0,103
0,352
0,711
1,145
1,635
2,167
2,733
3,325
3,940
4,575
5,226
5,892
6,571
7,261
7,962
8,672
9,390
10,117
10,851
11,591
12,338
13,091
13,848
14,611
15,379
16,151
16,928
17,708
18,493
26,509
34,764
43,188
51,739
60,391
69,126
77,929
(n 1).s 2
2
2 .
0,90
0,10
0,05
0,016
2,706
3,841
0,211
4,605
5,991
0,584
6,251
7,815
1,064
7,779
9,488
1,610
9,236 11,071
2,204 10,645 12,592
2,833 12,017 14,067
3,490 13,362 15,507
4,168 14,684 16,919
4,865 15,987 18,307
5,578 17,275 19,675
6,304 18,549 21,026
7,042 19,812 22,362
7,790 21,064 23,685
8,547 22,307 24,996
9,312 23,542 26,296
10,085 24,769 27,587
10,865 25,989 28,869
11,651 27,204 30,144
12,443 28,412 31,410
13,240 29,615 32,671
14,042 30,813 33,924
14,848 32,007 35,172
15,659 33,196 36,415
16,473 34,382 37,652
17,292 35,563 38,885
18,114 36,741 40,113
18,939 37,916 41,337
19,768 39,087 42,557
20,599 40,256 43,773
29,051 51,805 55,758
37,689 63,167 67,505
46,459 74,397 79,082
55,329 85,527 90,531
64,278 96,578 101,879
73,291 107,565 113,145
82,358 118,498 124,342
0,025
5,024
7,378
9,348
11,143
12,833
14,449
16,013
17,535
19,023
20,483
21,920
23,337
24,736
26,119
27,488
28,845
30,191
31,526
32,852
34,170
35,479
36,781
38,076
39,364
40,646
41,923
43,194
44,461
45,722
46,979
59,342
71,420
83,298
95,023
106,629
118,136
129,561
0,01
6,635
9,210
11,345
13,277
15,086
16,812
18,475
20,090
21,666
23,209
24,725
26,217
27,688
29,141
30,578
32,000
33,409
34,805
36,191
37,566
38,932
40,289
41,638
42,980
44,314
45,642
46,963
48,278
49,588
50,892
63,691
76,154
88,379
100,425
112,329
124,116
135,807
0,005
7,879
10,597
12,838
14,860
16,750
18,548
20,278
21,955
23,589
25,188
26,757
28,299
29,819
31,139
32,801
34,267
35,718
37,156
38,582
39,997
41,401
42,796
44,181
45,559
46,928
48,290
49,645
50,993
52,336
53,672
66,766
79,490
91,952
104,215
116,321
128,299
140,169
44
Anotaes de Aula
1 c
1 0,90
=
= 0,05
Na tabela, com g.l. = 15 e = 0,05, obtemos:
2
2
2 = 24,996
1
1+ c
1+ 0,90
II) 2 =
=
= 0,95
Na tabela, com g.l. = 15 e = 0,95, obtemos:
2
2
2 = 7,261
2
I) 1 =
g.l.
0,995
0,99
0,975
0,001
0,950
0,004
0,90
0,016
0,10
2,706
0,05
3,841
0,025
5,024
0,01
6,635
0,005
7,879
---
---
---
---
---
---
---
---
---
---
---
14
4,075
4,660
5,629
6,571
7,790
21,064
23,685
26,119
29,141
31,139
2 = 26,119
1
e 2 = 5,629
2
< 2 <
(n 1).s 2
(15 1).7,05
(15 1).7,05
< 2 <
26,119
5,629
2
2
< <
(n 1).s 2
17,53
2
2
(15 1).7,05
< <
26,119
(15 1).7,05
5,629
Exerccios Resolvidos
45
Anotaes de Aula
I) E = zc .
s
n
= 2,575 .
3,50
40
E = 1,42
Portanto, com 99% de confiana, podemos dizer que a mdia populacional est entre
34,14 e 36,98.
2. Com os dados do exerccio anterior, determinar o tamanho requerido de uma amostra para
assegurar que, com confiana de 95%, a mdia amostral esteja dentro do intervalo de 1,0 da
mdia populacional.
Soluo: Temos: c = 95% = 0,95
zc = 1,96 (vide p. 36); E = 1,0; s = 3,5.
2
z .s
1,96 . 3,5
Ento: n = c =
= 47,05
1
n 48
5,0
5,1
5,3
5,5
5,6
5,9
6,0
6,3
Construir:
a) Um intervalo de confiana de 90% para a mdia populacional;
b) Um intervalo de confiana de 90% para a varincia populacional e para o desvio padro
populacional.
Soluo:
n=8
xi
5,0
5,1
5,3
5,5
5,6
5,9
6,0
6,3
44,7
xi x
0,59
0,49
0,29
0,09
0,01
0,31
0,41
0,71
(xi x )2
0,3481 = 0,35
0,2401 = 0,24
0,0841 = 0,08
0,0081 = 0,01
0,0001 = 0,00
0,0961 = 0,10
0,1681 = 0,17
0,5041 = 0,50
1,4488 = 1,45
Temos:
I) a mdia amostral : x =
xi
n
44,7
x =
= 5,59
8
( x i x )2
n 1
1,45
0,46
7
s = 0,46
a) sendo n = 8
g.l. = n 1 = 8 1
g.l. = 7
O uso de uma distribuio t, neste caso, apropriado porque a populao
considerada como normalmente distribuda, no conhecido, e a amostra
pequena (n < 30).
c = 90% = 0,90
tc = 1,895 (p. 41)
46
Anotaes de Aula
E = tc .
s
n
0,90
de confiana c
-------
nvel
0,50
g.l.
0,711
-------
1,895
= 1,895 .
0,46
8
x E<< x +E
E = 0,31
Portanto, com 90% de confiana, podemos dizer que a mdia populacional est entre
5,28 e 5,90.
b) Para a varincia e o desvio populacional, temos:
1 c
1 0,90
=
= 0,05
2
2
1+ c
1+ 0,90
2 =
=
= 0,95
2
2
2 = 14,067
1 =
2
2
(g.l. = n 1 = 7)
= 2,167
g.l.
0,995
0,99
0,975
0,001
0,950
0,004
0,90
0,016
0,10
2,706
0,05
3,841
0,025
5,024
0,01
6,635
0,005
7,879
---
---
---
---
---
---
---
---
---
---
---
0,989
1,239
1,690
2,167
2,833
12,017
14,067
16,013
18,475
20,278
Assim, temos:
I) O intervalo de confiana de 90% para a varincia populacional :
(n 1).s 2
2
1
< 2 <
(n 1).s 2
(8 1).0,46 2
(8 1).0,46 2
< 2 <
14,067
2,167
2
2
< <
0,68
(n 1).s 2
2
(8 1).0,46 2
< <
14,067
(8 1).0,46 2
2,167
1. Introduo
Hiptese uma afirmao sobre um determinado parmetro. A aceitao ou a rejeio
de uma hiptese, ou seja, a tomada de uma deciso denominada de teste de hiptese.
O teste de hiptese empregado para se tomar decises sobre o valor de um parmetro
de uma populao tal como, sua mdia ou uma proporo da populao. Por exemplo, podese ter uma situao onde um grupo de pessoas deseja saber se o volume informado pelo
fabricante no rtulo das embalagens de leite mesmo verdadeiro, ou se todos esto sendo
lesados e ele faz o envasamento com uma quantidade menor do que a especificada. Outro
exemplo poderia ser a do departamento de engenharia que quer comprovar se os
componentes adquiridos de um fornecedor realmente tm uma vida til de 1000 horas como a
especificada em projeto.
47
Anotaes de Aula
Anotaes de Aula
a) Ho: = 1,65 m
Ha: 1,65 m
b) Ho: = 1,65 m
Ha: > 1,65 m
c) Ho: = 1,65 m
Ha: < 1,65 m
Aps a definio das duas hipteses (nula e alternativa), devemos traar uma estratgia
que nos permita dizer qual das duas a verdadeira, precisamos estar aptos a dizer se
acatamos a hiptese nula ou se a rejeitamos em favor da hiptese alternativa.
De forma resumida, a estratgia a seguinte:
I) escolhemos uma amostra aleatria da populao;
II) fazemos uma comparao com a hiptese nula;
III) se os dados da amostra forem consistentes com esta, no rejeitamos a
hiptese nula;
IV) se os dados da amostra no forem consistentes com a hiptese nula,
rejeitamos a hiptese nula e assumimos que a hiptese alternativa
verdadeira.
2. Exemplo de aplicao do teste de hiptese
Uma empresa fabrica sabonetes de massa 90g. Para verificar se a mquina que os produz
est calibrada corretamente, uma amostra aleatria composta de 50 sabonetes foi retirada ao
longo de um dia. As massas dos sabonetes da amostra esto na tabela abaixo.
92
90
84
87
86
91
87
86
92
91
94
95
91
89
88
90
87
91
87
89
85
92
89
93
89
90
85
87
94
91
88
86
90
91
93
94
84
89
90
88
90
89
91
88
91
90
91
87
89
90
Os dados da amostra permitem concluir que a mquina que produz os sabonetes est
descalibrada? Use os seguintes passos para responder:
a)
b)
c)
d)
Soluo:
Seja a mdia de todos os sabonetes da empresa.
a) As duas hipteses podem ser escritas como:
Ho: = 90g
Ha: 90g
49
Anotaes de Aula
xi
n
4471
= 89,42g
50
x = 90 89,42 = 0,58g
0,9544
x 2 x
2
x + 2 x
2
x
z
Com base neste fato podemos dizer, por exemplo, que a probabilidade da mdia x
estar em um intervalo de dois desvios padres da mdia da populao de 0,9544,
ou ainda, que a probabilidade da mdia da amostra estar fora deste intervalo de
apenas 1 0,9544 = 0,0456, como mostrado na figura acima. Podemos usar este fato
como um critrio para decidir se devemos ou no rejeitar a hiptese nula.
Especificamente, se a mdia da amostra retirada da populao estiver dentro do
intervalo ento podemos atribuir a diferena encontrada a um erro de amostragem e,
assim, aceitar a hiptese nula. Por outro lado, se a mdia da amostra estiver distante
mais de dois (2) desvios padres da mdia da populao de 90g, ento podemos
concluir que a hiptese nula verdadeira e um evento extremamente improvvel
ocorreu durante a coleta da amostra ou que a hiptese nula falsa (o que muito mais
razovel) e que a hiptese alternativa verdadeira.
Grfico correspondente ao exerccio:
50
Anotaes de Aula
No rejeite Ho
Rejeite Ho
Rejeite Ho
0,9544
0,0228
90 2 x
90
0,0228
90 + 2 x
2
A probabilidade de rejeitar Ho apenas 0,0456, como pode ser visto na figura acima.
Esta probabilidade denominada nvel de significncia do teste de hiptese.
d) Finalmente, aplicando o critrio adotado aos dados coletados da amostra, podemos
colocar nossa concluso. Assumiremos que o desvio padro da populao seja
conhecido e igual a = 2,7 gramas (s =
( x i x)2
n 1
342,18
2,7g). Para aplicar o
49
x
90 89,42
=
= 1,52
2,7
n
50
Anotaes de Aula
z0,10
z0,05
z
Valores
1,28
1,645
crticos de z
0,025
z0,025
0,01
z0,01
0,005
z0,005
1,96
2,33
2,575
z/2
No rejeite Ho Rejeite
Ho
Rejeite No rejeite Ho
Ho
z/2
Bilateral
No rejeite Ho
Unilateral esquerda
Rejeite
Ho
Unilateral direita
x o
Anotaes de Aula
Exemplo 1 Uma empresa de coleta de informaes verificou que em 2003, o preo mdio
das refeies em restaurantes da cidade de So Paulo era de R$ 28,44. Neste ano realizouse uma pesquisa em 40 restaurantes, aleatoriamente escolhidos, e foram obtidos os valores
da tabela abaixo. Os dados fornecidos proporcionam evidncia suficiente para concluir que o
preo mdio deste ano dos restaurantes da cidade de So Paulo aumentou com relao
mdia de R$ 28,44 de 2003? Realize o teste apropriado com nvel de significncia de 1%.
37
33
25
25
28
33
48
28
35
32
26
27
31
32
36
50
20
36
41
22
32
24
32
36
34
30
33
26
45
26
30
31
41
27
21
Soluo:
Como a amostra considerada grande (n 30), podemos aplicar o procedimento descrito
acima.
Passo 1 Escreve as hipteses nula e alternativa.
O teste em questo ser do tipo unilateral direita.
Ho: = 28,44 (o preo mdio no aumentou)
Ha: > 28,44 (o preo mdio aumentou)
Passo 2 Defina o nvel de significncia .
O nvel de significncia pedido de 1%. Assim, = 0,01.
Passo 3 Determine o(s) valor(re) crtico(s).
Para = 0,01, o valor crtico ser z0,01. Da tabela, obtemos: z0,01 = 2,33
z
Valores
crticos de z
0,10
z0,10
0,05
z0,05
0,025
z0,025
0,01
z0,01
0,005
z0,005
1,28
1,645
1,96
2,33
2,575
Rejeite Ho
rea de 0,01
2,33
Unilateral direita
2,94
53
Anotaes de Aula
x o
s
n
xi
n
1270
= 31,75 e s =
40
( x i x)2
n 1
1979,48
7,12
39
x o
31,75 28,44
=
= 2,94
s
7,12
n
40
Esse valor de z est marcado na figura acima por um ponto prximo do valor z
tabelado 2,33.
Passo 5 Se o valor de estatstica de teste cair na regio de rejeio, ento rejeite Ho;
caso contrrio, no rejeite Ho.
x o
25,3 26
=
= 0,954
2,32
n
10
54
Rejeite
Ho
Anotaes de Aula
No rejeite Ho
0,05
95%
1,645
0
zcalc = 0,954
Exemplo 3 De uma populao normal com desvio padro 6, toma-se uma amostra casual
de tamanho 16, obtendo-se x = 43. Ao nvel de 10%, teste as hipteses:
Ho: = 45
Ha: 45
Soluo:
As hipteses j esto definidas. O nvel de significncia de 10%, ou seja, = 10% = 0,10.
A amostra de tamanho n = 16 , a estimativa da mdia j foi calculada, isto , x = 43 e = 6
Como o teste para mdia de populaes normais com desvio padro conhecido,
usaremos a varivel z como critrio.
Temos:
1) Como o teste em questo do tipo bilateral, ento o valor de se divide
igualmente nas caudas, ou seja:
= 0,10
/2 = 0,05
z0,05 = 1,645 (tabela p.52)
2) z calc =
x o
43 45
=
= 1,33
6
n
Rejeite
Ho
16
No rejeite Ho
Rejeite
Ho
= 0,05
0,05 =
1,645
1,645
zcalc = 1,33
55
Anotaes de Aula
Vimos no captulo anterior que se tomarmos uma amostra de tamanho n de uma populao
normalmente distribuda com mdia , a varivel aleatria tem uma distribuio t com (n -1)
graus de liberdade. Em outras palavras, as probabilidades para aquela varivel aleatria so
iguais s reas sob a curva t com g.l. = n 1. Conseqentemente, quando a populao
amostrada normalmente distribuda, ns podemos realizar um teste de hiptese com a
hiptese nula Ho: = o, empregando a varivel aleatria acima como nossa estatstica de
teste e usando a tabela da distribuio t para obter o valor crtico (ou valores crticos).
Procedimento para aplicao do Teste de hiptese par a mdia de uma populao
com amostras de tamanho n < 30:
t/2
No rejeite Ho Rejeite
Ho
Rejeite No rejeite Ho
Ho
t/2
Bilateral
No rejeite Ho
Unilateral esquerda
Rejeite
Ho
Unilateral direita
x o
s
n
Passo 5 Se o valor da estatstica de teste cair na regio de rejeio, ento rejeite Ho;
caso contrrio no rejeite Ho.
Passo 6 D sua concluso.
Exemplo 1 Assuma que a mdia de gasto com combustvel de todas as famlias de uma
certa regio seja de R$ 1123,00 em um determinado ano. Neste mesmo ano, coletando-se
uma amostra aleatria de 15 famlias de classe mdia alta obteve-se os valores mostrados na
tabela abaixo, arredondados para o inteiro mais prximo. Com um nvel de significncia de
5%, os dados indicam que famlias da classe mdia alta gastam, em mdia, em combustvel
mais do que a mdia da regio de R$ 1123,00? (Assuma que a distribuio de gasto com
combustvel das famlias da classe mdia alta seja normalmente distribuda).
56
Anotaes de Aula
1350
1521
1293
1227
908
1205
1154
1231
1351
1790
1369
1185
Soluo:
Uma vez que a populao em questo normalmente distribuda, podemos aplicar o
procedimento abaixo para realizar o teste de hipteses.
x o
s
n
x o
1344,27 1123
=
= 3,7098... 3,710
s
231
n
15
57
Anotaes de Aula
58
Anotaes de Aula
Quando temos duas populaes com amostras grandes e independentes, podemos fazer
inferncia estatstica sobre as mdias das populaes. Duas amostras so independentes se
a amostra retirada de uma populao no interfere na amostra retirada da outra populao.
O problema consiste em comparar as mdias de duas populaes para decidir se existe
alguma diferena entre elas. A lgica para se fazer esta comparao pode ser resumida como
mostrado na figura abaixo:
Populao 1
1
1
Populao 2
2
2
Amostra 1
Amostra 2
Calcule mdia 1
Calcule mdia 2
Compare a mdia 1
com a mdia 2.
Tome uma deciso.
Uma amostra grande (n 30) retirada aleatoriamente de cada populao. As mdias das
amostras so calculadas e comparadas, levando a uma concluso de que as mdias no so
iguais se houver uma diferena significativa entre elas.
O procedimento adotado para realizar um teste de hiptese para as mdias de duas
populaes similar ao adotado anteriormente para uma nica populao. Os principais
pontos do procedimento so:
1. Como temos duas populaes com mdias 1 e 2 e desejamos saber se existe
diferena entre elas. A hiptese nula :
Ho: 1 = 2 (as mdias coincidem)
2. Retiramos uma amostra de cada uma das populaes e calculamos as mdias.
A diferena observada x 1 x 2 , agora, a estatstica de teste (em vez de x da
seo anterior).
3. Se retirssemos todas as possveis amostras de tamanho n1 e n2 das duas
populaes, ns teramos uma distribuio das diferenas entre as mdias das
amostras. Se as amostras so grandes, o Teorema do Limite Central nos
permite assumir que a distribuio da amostragem aproximadamente normal.
59
Anotaes de Aula
/2
|
x a xb
1 2 = 0
12 22
+
n1 n 2
z=
( x1 x 2 ) 0
s
x1 x 2
Anotaes de Aula
z/2
No rejeite Ho Rejeite
Ho
Rejeite No rejeite Ho
Ho
z/2
No rejeite Ho
Unilateral esquerda
Bilateral
Rejeite
Ho
Unilateral direita
z=
s2 s2
( x1 x 2 )
, com s x1 x 2 = 1 + 2
n1 n 2
s
x1 x 2
s12 s 22
=
=
+
n1 n 2
zteste =
14700 2 16200 2
= 3834,23
+
30
35
( x1 x 2 )
46720 51910
=
= 1,35
s
3834,23
x1 x 2
61
Anotaes de Aula
Rejeite
Ho
No rejeite Ho
Rejeite
Ho
= 0,025
0,025 =
1,96
1,96
1,35
Passo 5 Na figura observamos que o valor zcalc = 1,35 no cai dentro da regio
de rejeio. Assim, ns no rejeitamos a hipteses nula Ho.
Passo 6 D sua concluso.
Baseado nos dados da amostra ns no temos evidncia suficiente para
concluir que existe uma diferena entre as mdias salariais dos engenheiros das regies Sul e
Sudeste.
EXERCCIOS RESOLVIDOS
01. Uma amostra de 80 elementos, extrada de uma populao aproximadamente normal
cujo desvio padro s = 2,8, forneceu mdia x = 45,8. Construir um intervalo de
confiana de 95% para a mdia dessa populao.
Resoluo: Temos: n = 80; s = 2,8; x = 45,8; c = 0,95
Tabela: zc = 1,96
E = zc .
s
n
= 1,96 .
x E<< x +E
2,8
80
= 0,6
45,2 < < 46,4
02. Em uma clnica de endocrinologia, uma amostra de 40 pacientes foi observada. Depois
de uma semana de dieta foram medidos os pesos que cada um dos pacientes perdeu,
obtendo-se a tabela.
Classes de
pesos
1,0 |--- 1,5
1,5 |--- 2,0
2,0 |--- 2,5
2,5 |--- 3,0
3,0 |--- 3,5
3,5 |--- 4,0
N de
pacientes (fi)
5
6
10
8
6
5
40
xi = PM
xi . fi
xi x
(xi x )2. fi
1,25
1,75
2,25
2,75
3,25
3,75
6,25
10,5
22,5
22
19,5
18,75
99,5
1,24
0,74
0,24
0,26
0,76
1,26
7,69
3,29
0,58
0,54
3,47
7,94
23,51
x i .fi
x=
n
99,5
x=
= 2,49;
40
s=
( x i x)2 .fi
n 1
23,51
=
40 1
23,51
= 0,77
39
62
Anotaes de Aula
c = 90% = 0,90
Tabela: zc = 1,645;
x E<< x +E
E = zc .
s
n
= 1,645 .
0,77
40
= 0,20
7,5
7,8
7,6
7,5
7,0
6,9
7,2
7,1
7,0
7,4
xi x
0,2
0,5
0,3
0,2
0,3
0,4
0,1
0,2
0,3
0,1
xi
7,5
7,8
7,6
7,5
7,0
6,9
7,2
7,1
7,0
7,4
= 73
x=
s=
xi
n
73
= 7,3
10
( x i x)2
n 1
0,82
=
10 1
0,82
= 0,30
9
nvel
0,50
--0,703
E = tc .
s
n
de confiana c
---------------
= 1,833 .
x E<< x +E
b) c = 99% = 0,99
E = tc .
s
n
Tabela: tc = 1,833
= 3,250 .
x E<< x +E
0,30
10
0,90
--1,833
0,95
--2,262
0,99
--3,250
= 0,17
Tabela: tc = 2,262
0,30
10
= 0,31
63
por
Anotaes de Aula
(n 1).s 2
(n 1).s 2
< <
, em que:
1 c
1 0,95
=
= 0,025
2
2
1+ c
1+ 0,95
II) 2 =
=
= 0,975
2
2
I) 1 =
g.l.
1
--9
0,995
0,99
--1,735
--2,088
0,975
0,001
--2,700
0,950
0,004
--3,325
2 = 19,023
1
Portanto:
(n 1).s 2
2
0,90
0,10
0,05 0,025 0,01 0,005
0,016 2,706 3,841 5,024 6,635 7,879
------------4,168 14,684 16,919 19,023 21,666 23,589
e 2 = 2,700
2
(n 1).s 2
<<
9.0,30 2
9.0,30 2
< <
19,023
2,7
04. As alturas dos alunos do sexo masculino de uma Universidade apresentam distribuio
normal. Para estimar a altura mdia dessa populao, foram observadas as alturas de
100 alunos, obtendo-se x = 170 cm e s = 20 cm. Determine um intervalo de confiana
de 95% para a mdia populacional.
Resoluo: Temos: n = 100 (n 30); x = 170 e s = 20
c = 95% = 0,90
zc = 1,96
E = zc .
s
n
= 1,96 .
x E<< x +E
20
100
= 3,92
05. Uma empresa diz que a vida mdia das lmpadas fabricadas por elas de 1800 horas.
Para que ela no corra o risco de sofrer punio do rgo fiscalizador, seu
departamento de controle de qualidade realiza testes freqentes com amostras
retiradas da linha de produo. Sabendo-se que a empresa s seria autuada caso as
lmpadas tivessem uma vida til inferior a 1800 horas, determine baseando na amostra
indicada abaixo, com um nvel de significncia igual a 5%:
a) A mdia e o desvio padro da amostra;
b) O valor da estatstica de teste;
c) A empresa corre os risco de ser autuada por no cumprir o nmero mdio de
horas divulgado?
64
Anotaes de Aula
1750
1820
1700
1720
1810
1790
1810
1620
1750
1800
1815
1690
1790
1800
1830
1850
1780
1780
1810
1760
1790
1600
1500
1820
1800
1740
1800
Resoluo:
Horas (xi)
1500
1600
1620
1690
1700
1710
1720
1740
1750
1760
1780
1790
1800
1810
1815
1820
1830
1850
xi . f i
1500
1600
1620
1690
5100
1710
1720
1740
3500
1760
3560
5370
7200
5430
1815
3640
1830
1850
52635
fi
1
1
1
1
3
1
1
1
2
1
2
3
4
3
1
2
1
1
30
xi x
-254,5
-154,5
-134,5
-64,5
-54,5
-44,5
-34,5
-14,5
-4,5
5,5
25,5
35,5
45,5
55,5
60,5
65,5
75,5
95,5
(xi x )2. fi
64770,25
23870,25
18090,25
4160,25
8910,75
1980,25
1190,25
210,25
40,50
30,25
1300,50
3780,75
8281
9240,75
3660,25
8580,50
5700,25
9120,25
172917,5
a) x =
x i . fi = 52635
n
30
x = 1754,5 horas
2
s =
fi .( x i x)2
n 1
s2 = 5962,67
172917,5
30 1
s=
5962,67
s = 77,22 h ou s = 77,2 h
b) z =
x 1754,5 1800
=
s
77,2
n
30
z = 3,22
No rejeite Ho
0,05
95%
1,645 0
zcalc = 3,22
65
Anotaes de Aula
06. A carga esttica suportada por cabos utilizados na prtica de alpinismo apresenta a
mdia de 1800 kg e o desvio padro de 100 kg. Com o desenvolvimento de uma nova
fibra o fabricante afirma ter aumentado a capacidade de carga dos cabos. Para testar a
veracidade da informao, ensaiou-se uma amostra de 50 cabos. A carga mdia
suportada pelos novos cabos foi de 1850 kg. Pergunta:
a) Qual o valor da estatstica de teste?;
b) Pode-se confirmar a declarao de que a nova fibra mais resistente?
Resp.: a) z = 3,54
b) Sim
Utilize um nvel de significncia de 1%.
Resoluo: Temos: = 1800 kg; = 100 kg; n = 50 (n 30) e x = 1850 kg.
a) z =
x 1850 1800
=
100
n
zcalc. = 3,54
50
Rejeite Ho
rea de 0,01
2,33
zcalc = 3,54
Anotaes de Aula
Rejeite
Ho
No rejeite Ho
0,01
2,718
x 190 196
=
= 1,732
s
12
n
12
t = 1,732
MDULO 7
TESTE DE QUI-QUADRADO E TESTE F
I. Teste de Qui-Quadrado.
Sejam:
Ho: hiptese nula (hiptese que ser testada)
Ha: hiptese alternativa (hiptese que substitui Ho caso a mesma seja rejeitada).
67
Anotaes de Aula
Resultado
esperado
(moeda honesta)
Cara: 25
Coroa: 25
Diferena entre o
resultado observado e
o resultado esperado.
28 25 = 3
22 25 = 3
Quadrado da
diferena
(3)2 = 9
(3)2 = 9
Quociente entre o
quadrado da diferena e o
resultado esperado.
9/25 = 0,36
9/25 = 0,36
g.l.
0,995
0,99
0,975
0,001
0,950
0,004
0,90
0,016
0,10
2,706
0,05
3,841
0,025
5,024
0,01
6,635
0,005
7,879
---
---
---
---
---
---
---
---
---
---
70,065
74,222
77,929
1
---
100 67,328
Temos: t2 = 3,841
68
Anotaes de Aula
Rendimento
timo
80.000
150.000
230.000
Rendimento
Regular
300.00
60.000
360.000
Rendimento
Pssimo
120.000
90.000
210.000
Totais
500.000
300.000
800.000
230.000
= 0,2875 = 28,75% dos alunos pesquisados
800.000
apresentam rendimento escolar timo. Caso essa proporo fosse mantida, seriam
esperados:
0,2875 x 500.000 = 143.750 com timo rendimento escolar no perodo matutino e
0,2875 x 300.000 = 86.250 com timo rendimento escolar no perodo vespertino.
Essa a lei terica extrada da tabela turno e rendimento escolar.
69
Anotaes de Aula
Proporo
(Lei da Tabela)
230.000
= 0,2875
800.000
360.000
= 0,4500
800.000
210.000
= 0,2625
800.000
230.000
= 0,2875
800.000
360.000
= 0,4500
800.000
210.000
= 0,2625
800.000
80.000
300.000
120.000
150.000
60.000
90.000
Resultado
Esperado
0,2875 x 500.000 = 143.750
Matutino
Vespertino
Resultado
esperado
Diferena entre o
resultado observado e o
resultado esperado.
Quadrado da
diferena
80.000
300.000
120.000
150.000
60.000
90.000
143.750
225.000
131.250
86.250
135.000
78.750
4.064.062.500
5.625.000.000
126.562.500
4.064.062.500
5.625.000.000
126.562.500
Quociente entre o
quadrado da diferena e
o resultado esperado.
28.271,7391
25.000
964,2857
47.119,5652
41.666,6667
1.607,1429
144.629,3996
A soma dos quocientes entre o quadrado das diferenas e os resultados esperados (soma
dos valores da ltima coluna da tabela) fornece o valor o2 = 144.629,3996
Para o teste de Independncia, calcula-se o nmero de graus de liberdade (g.l.)
efetuando-se o produto entre o nmero de linhas da tabela de dados subtrado de 1 e o
nmero de colunas da tabela de dados, subtrado de 1, ou seja, g.l. = (n de linhas -1) x (n de
colunas -1). Para o nosso exemplo, temos que o nmero de graus de liberdade :
g.l. = (2 1).(3 1) = 1 . 2 = 2
Na tabela de Qui-Quadrado (p. 44), localizamos o parmetro t2 correspondente a
= 5% (ou = 0,05) e o valor de g.l. calculado (g.l. = 2): t2 = 5,991
g.l.
0,995
0,99
0,010
--100 67,328
1
2
---
0,020
0,975
0,001
0,051
0,950
0,004
0,103
0,90
0,016
0,211
0,10
2,706
4,605
0,05
3,841
5,991
0,025
5,024
7,378
0,01
6,635
9,210
0,005
7,879
10,597
--70,065
--74,222
--77,929
70
Anotaes de Aula
Populao 2
22
Amostra 2: s22
Amostra 1 : s12
Calcule gl 2
Calcule gl 1
Fgl1, gl2 =
s1
s2
Para tanto, devem ser conhecidas as varincias amostrais normais s12 e s22 da duas
populaes em estudo. A varivel do teste, denominada varivel F, segue uma distribuio
amostral assimtrica, que assume apenas valores positivos. Este teste tambm conhecido
como teste da razo entre variveis, pois a varivel F do teste o quociente entre as duas
varincias amostrais. Para determinado grau de certeza, F dada por:
Fgl1, gl2 =
s1
s2
, onde:
71
Anotaes de Aula
10
12
14
16
18
20
25
30
35
4052,24
4999,3
5403,5
5624,3
5764,0
5859,0
5928,3
5981,0
6022,4
6055,9
6106,7
6143,0
6170,0
6191,4
6208,7
6239,9
6260,4
6275,3
98,50
99,00
99,16
99,25
99,30
99,33
99,36
99,38
99,39
99,40
99,42
99,43
99,44
99,44
99,45
99,46
99,47
99,47
34,12
30,82
29,46
28,71
28,24
27,91
27,67
27,49
27,34
27,23
27,05
26,92
26,83
26,75
26,69
26,58
26,50
26,45
21,20
18,00
16,69
15,98
15,52
15,21
14,98
14,80
14,66
14,55
14,37
14,25
14,15
14,08
14,02
13,91
13,84
13,79
16,26
13,27
12,06
11,39
10,97
10,67
10,46
10,29
10,16
10,05
9,89
9,77
9,68
9,61
9,55
9,45
9,38
9,33
13,75
10,92
9,78
9,15
8,75
8,47
8,26
8,10
7,98
7,87
7,72
7,60
7,52
7,45
7,40
7,30
7,23
7,18
12,25
9,56
8,45
7,85
7,46
7,19
6,99
6,84
6,72
6,62
6,47
6,36
6,28
6,21
6,16
6,06
5,99
5,94
11,26
8,56
7,59
7,01
6,63
6,37
6,18
6,03
5,91
5,81
5,67
5,56
5,48
5,41
5,36
5,26
5,20
5,15
10,56
8,02
6,99
6,42
6,06
5,80
5,61
5,47
5,35
5,26
5,11
5,01
4,92
4,86
4,81
4,71
4,65
4,60
10
10,04
7,56
6,55
5,99
5,64
5,39
5,20
5,06
4,94
4,85
4,71
4,60
4,52
4,46
4,41
4,31
4,25
4,20
11
9,65
7,21
6,22
5,67
6,32
5,07
4,89
4,74
4,63
4,54
4,40
4,29
4,21
4,15
4,10
4,01
3,94
3,89
12
9,33
6,93
5,95
5,41
5,06
4,82
4,64
4,50
4,39
4,30
4,16
4,05
3,97
3,91
3,86
3,76
3,70
3,65
13
9,07
6,70
5,74
5,21
4,86
4,62
4,44
4,30
4,19
4,10
3,96
3,86
3,78
3,72
3,66
3,57
3,51
3,46
14
8,85
6,51
5,56
5,04
4,69
4,46
4,28
4,14
4,03
3,94
3,80
3,70
3,62
3,56
3,51
3,41
3,35
3,30
15
8,68
6,36
5,42
4,89
4,56
4,32
4,14
4,00
3,89
3,80
3,67
3,56
3,49
3,42
3,37
3,28
3,21
3,17
16
8,53
6,23
5,29
4,77
4,44
4,20
4,03
3,89
3,78
3,69
3,55
3,45
3,37
3,31
3,26
3,16
3,10
3,05
17
8,40
6,11
5,19
4,67
4,34
4,10
3,93
3,79
3,68
3,59
3,46
3,35
3,27
3,21
3,16
3,07
3,00
2,96
18
8,29
6,01
5,09
4,58
4,25
4,01
3,84
3,71
3,60
3,51
3,37
3,27
3,19
3,13
3,08
2,98
2,92
2,87
19
8,18
5,93
5,01
4,50
4,17
3,94
3,77
3,63
3,52
3,43
3,30
3,19
3,12
3,05
3,00
2,91
2,84
2,80
20
8,10
5,85
4,94
4,43
4,10
3,87
3,70
3,56
3,46
3,37
3,23
3,13
3,05
2,99
2,94
2,84
2,78
2,73
21
8,02
5,78
4,87
4,37
4,04
3,81
3,64
3,51
3,40
3,31
3,17
3,07
2,99
2,93
2,88
2,79
2,72
2,67
22
7,95
5,72
4,82
4,31
3,99
3,76
3,59
3,45
3,35
3,26
3,12
3,02
2,94
2,88
2,83
2,73
2,67
2,62
23
7,88
5,66
4,76
4,26
3,94
3,71
3,54
3,41
3,30
3,21
3,07
2,97
2,89
2,83
2,78
2,69
2,62
2,57
24
7,82
5,61
4,72
4,22
3,90
3,67
3,50
3,36
3,26
3,17
3,03
2,93
2,85
2,79
2,74
2,64
2,58
2,53
25
7,77
5,57
4,68
4,18
3,85
3,63
3,46
3,32
3,22
3,13
2,99
2,89
2,81
2,75
2,70
2,60
2,54
2,49
26
7,72
5,53
4,64
4,14
3,82
3,59
3,42
3,29
3,18
3,09
2,96
2,86
2,78
2,72
2,66
2,57
2,50
2,45
27
7,68
5,49
4,60
4,11
3,78
3,56
3,39
3,26
3,15
3,06
2,93
2,82
2,75
2,68
2,63
2,54
2,47
2,42
28
7,64
5,45
4,57
4,07
3,75
3,53
3,36
3,23
3,12
3,03
2,90
2,79
2,72
2,65
2,60
2,51
2,44
2,39
29
7,60
5,42
4,54
4,04
3,73
3,50
3,33
3,20
3,09
3,00
2,87
2,77
2,69
2,63
2,57
2,48
2,41
2,36
30
7,56
5,39
4,51
4,02
3,70
3,47
3,30
3,17
3,07
2,98
2,84
2,74
2,66
2,60
2,55
2,45
2,39
2,34
35
7,42
5,27
4,40
3,91
3,59
3,37
3,20
3,07
2,96
2,88
2,74
2,64
2,56
2,50
2,44
2,35
2,28
2,23
Exemplo 1 Um engenheiro est elaborando um novo sistema que poderia reduzir a varincia do
tempo para a fabricao de peas. No sistema anterior, uma amostra aleatria de 10 peas,
apresentava varincia de 140. Com o novo sistema, uma amostra aleatria de 25 peas teria uma
varincia de 100. Sendo o grau de certeza de 99%, h evidncias suficientes que garantam que o
novo sistema melhor que o antigo?
Temos: Sistema 1 (antigo): s12 = 140 , n = 10
Sistema 2 (novo): s22 = 100 , n = 25
2
Fgl1, gl2 =
s1
s2
F9,24 =
g.l.1 = 10 1 = 9
g.l.2 = 25 1 = 24
140
= 1,40
100
Hipteses: Ho : 12 22
Ha : 12 > 22
Utilizando a tabela da distribuio F, para 99%, temos: F9, 24 = 3,26.
Concluso: Como F no est na regio de rejeio, no possvel rejeitar Ho.
Anotaes de Aula
OE
Resultado
esperado
(moeda
honesta)
Cara: 20
Coroa: 20
Diferena entre o
resultado observado
e o resultado
esperado.
10 20 = 10
30 20 = 10
(O E)2
(O E ) 2
E
Quadrado
da diferena
Quociente entre o
quadrado da diferena e
o resultado esperado.
(10)2 = 100
(10)2 = 100
100/20 = 5
100/20 = 5
(O E ) 2
E = 5 + 5 = 10 ou 2cal. = 10
Para o teste qui-quadrado de aderncia, o g.l. = (n de linhas da tabela) 1, ou seja, g.l. = 2 1 = 1
e t2 obtido na tabela p.44 com o nvel de significncia definido no problema, no caso,
= 5% = 0,05: 2t = 3,841
o2 =
g.l.
0,995
0,10
0,05 0,025 0,01 0,005
2,706 3,841 5,024 6,635 7,879
--------------118,49 124,34 129,56 135,80 140,16
100 67,328 70,065 74,222 77,929 82,358
8
2
1
7
9
1
---
0,99
0,975
0,001
---
0,950
0,004
---
0,90
0,016
---
2. Foi feita uma pesquisa para saber se a audincia de 2 emissoras A e B, independe de sua
programao, que so divididas em 3 tipos: Programas Musicais, Programas de Notcias e
Programas Esportivos. Em uma amostra com 100 ouvintes, obtiveram-se os dados da tabela
abaixo. Ao nvel de 5% de significncia podemos dizer que:
Emissoras
A
B
Programas
Musicais Notcias Esportivos
5
10
25
10
20
30
Soluo:
Neste caso, o teste de Qui-Quadrado Independncia
73
Anotaes de Aula
I) Da tabela temos:
Programas
Musicais Notcias Esportivos TOTAIS
A
5
10
25
40
B
10
20
30
60
TOTAIS
15
30
55
100
Emissoras
2 linhas
3 colunas
II) Tabela das propores e Etapas para calcular o2 :
(O E)2
= 0,15
0,15 x 40 = 6
5 6 = 1
0,167
= 0,30
0,30 x 40 = 12
10 12 =2
0,337
= 0,55
0,55 x 40 = 22
25 22 = 3
0,409
= 0,15
0,15 x 60 = 9
10 9 = 1
0,111
= 0,30
0,30 x 60 = 18
20 18 = 2
0,222
= 0,55
0,55 x 60 = 33
30 33 = 3
0,272
15
100
30
100
55
100
15
100
30
100
55
100
25
10
B
OE
Proporo
10
20
30
(O E ) 2
E
= 1,517
(O E ) 2
= 0,167 + 0,337 + 0,409 + 0,111 + 0,222 + 0,272 = 1,517 ou
E
diretamente na tabela, temos: o2 = 1,517
o2 =
g.l.
0,995
0,99
0,020
0,975
0,001
0,051
0,950
0,004
0,103
0,90
0,016
0,211
1
2
0,10
2,706
4,605
0,05
3,841
5,991
0,025
5,024
7,378
0,01
6,635
9,210
0,005
7,879
10,597
0,010
---
---
---
---
---
---
---
---
---
---
---
100 67,328 70,065 74,222 77,929 82,358 118,498 124,342 129,561 135,807 140,169
Concluso: Como o2 = 1,517 < 2t = 5,991, no podemos rejeitar Ho, ou seja, podemos dizer que
a audincia no depende da programao das duas emissoras.
74
Anotaes de Aula
ESTATSTICA INDUTIVA
(ANOTAES DE AULA)
ALUNO(A):______________________________ RA.:_________
PROF. MACHADO
2 SEMESTRE DE 2012
75